MiniMax M3: el modelo de IA barato para programar con un millón de tokens de contexto
Todo el mundo anda buscando suscripciones baratas de IA para generar código, y MiniMax M3 entró justo a llenar ese hueco. Es el modelo más avanzado de la plataforma MiniMax, y la última actualización lo dejó bastante interesante: ahora soporta un millón de tokens de contexto, puedes lanzar varios subagentes al mismo tiempo y, sobre todo, lo puedes integrar en casi cualquier herramienta a un precio muy bajo.
En este artículo te muestro paso a paso cómo usarlo desde Open Code, VS Code y herramientas de consola, además de algunas apps que generé para que veas de lo que es capaz.
Qué es MiniMax M3
MiniMax es un modelo de IA abierto y multimodal: genera imágenes, código, video y hasta audio. Hoy nos vamos a enfocar en lo que más nos interesa como desarrolladores, que es la generación de código.
Para usarlo, MiniMax ofrece dos formas de cobro:
- Pago por uso (API): te cobran a medida que vas llamando a la API.
- Token Plan (suscripción): pagas una suscripción fija y obtienes acceso inmediato al modelo desde cualquier herramienta mediante una API key.
La mayoría va a preferir el Token Plan, porque es lo más cómodo: pagas y empiezas a usarlo en tus herramientas sin preocuparte por el consumo a cada rato.
Para empezar, entras a la plataforma de MiniMax, te registras con Google o GitHub y eliges un plan. Una vez dentro de tu perfil, vas a encontrar tu API key, que es la que vas a pegar en cada herramienta. Si quieres revisar cómo funciona el modelo a nivel de API, también puedes consultar la documentación oficial.
Conectar MiniMax M3 con Open Code
Para usar el modelo necesitas un agente. Vamos a empezar con Open Code, aunque no es obligatorio: también funciona con otros agentes abiertos e incluso con cerrados como Claude Code o GPT Codex. En general, los agentes abiertos funcionan mejor con este tipo de modelos.
La instalación se hace con un comando en la terminal y funciona en Windows, Linux y Mac. Una vez instalado, ejecutas open code y dentro escribes:
/connect
Buscas MiniMax, eliges la opción de MiniMax Token Plan, pegas tu API key y das Enter. A partir de ahí te deja escoger entre variantes del modelo: el modo thinking, que hace un procesado extra, o el modo por defecto. Para empezar, el modo por defecto va bien.
Primera prueba: una app de finanzas personales con React
Para ver cómo responde, le pedí algo sencillo:
Crea una app de seguimiento de finanzas personales con React
Lo primero que llama la atención es la velocidad: arranca el modo thinking y arma una lista de tareas (todos) a modo de planificación: construir la aplicación, configurar el proyecto, el panel de control, las transacciones, etcétera. Vas viendo cómo avanza paso a paso, compila el proyecto y al final te entrega la app con los comandos para ejecutarla.
Cuando le dices que la ejecute, lanza la aplicación y, entrando a la dirección de la terminal, ya tienes el resultado. Para ser un primer prompt muy básico, no está nada mal: hay interactividad, varias páginas y todo funcional. Quedan detalles de diseño menores (algún botón sin estilizar del todo), pero la base está sólida. Agregué un movimiento de prueba y el dashboard lo registró sin problema.
Agregar un backend con Hono desde VS Code
Si quieres continuar el proyecto desde un editor como VS Code, basta arrastrar la carpeta. Desde ahí puedes abrir Open Code de nuevo y darle otra tarea. Le pedí:
Implementa un backend en Hono y reemplaza la lógica de local storage
Activando el modo plan (Shift+Tab), MiniMax ya no se pone a escribir código directamente, sino que primero arma una planificación que puedes revisar y modificar antes de que empiece. Durante ese plan te hace preguntas de configuración:
- Runtime: Node con Hono.
- Base de datos: SQLite (en memoria, sin necesidad de instalar nada).
- Estructura: monorepo o scripts separados.
- Autenticación: un solo usuario para simplificar.
Lo que pide son básicamente las decisiones de arquitectura que siempre tomas en un proyecto real, y las plantea bastante bien. Una vez apruebas el plan, cambias al modo build, le dices que continúe y, tras unos 5–7 minutos, ya tiene corriendo tanto el frontend como el backend (en una ruta nueva, por ejemplo el puerto 3001).
La diferencia clave: ahora las transacciones se guardan en una base de datos real, no en local storage. Otra cosa que noté es que no comete muchos fallos: lo primero que le pides suele ser lo primero que entrega.
Lanzar múltiples agentes con Open Code Desktop
Una de las grandes ventajas de MiniMax es que puedes lanzar varios agentes en paralelo. Para eso necesitas una app que lo permita, y aquí usamos Open Code Desktop (disponible para Windows, Linux y Mac).
Tras instalarlo, abres el proyecto, creas una nueva sesión, eliges MiniMax con tu suscripción y le das una tarea. Por ejemplo:
Implementa el dark theme en todo el proyecto
Mientras esa sesión trabaja en la parte izquierda, abres otra nueva en paralelo y le pides algo distinto:
Crea una carpeta docs en el root del proyecto y guarda el diseño y la arquitectura
Así tienes dos sesiones corriendo a la vez: una modificando código y otra generando documentación, todo bajo la misma suscripción. Lo interesante es que el consumo apenas se mueve incluso después de varias modificaciones.
Crear un RAG: chat con tus propios documentos
Lo bueno de estas interfaces es que no todo tiene que salir de un solo proyecto. Puedes cargar otra carpeta y trabajar en algo nuevo. Aquí creé un RAG, que para quien no lo conozca es básicamente un chat al que le cargas tus propios datos para poder conversar con ellos.
El prompt fue:
Crea una app de chat que permita conversar con documentos que se carguen, estilo RAG. Hazla en Next.js y usa MiniMax como API para la IA.
Lo importante de esto es que no solo usamos MiniMax para crear el proyecto, sino también como API de la propia aplicación: cuando subes documentos y la IA tiene que interpretarlos, usa la API de MiniMax. Eso abre la puerta a construir apps inteligentes para clientes con el mismo modelo.
En el modo plan te va preguntando los detalles:
- Modelo: MiniMax M3 vía API.
- Almacenamiento vectorial: SQLite (lo más simple de instalar).
- Formato de carga: Markdown (aunque admite varios).
- Usuario: uno solo, para evitar el tema de multiusuario.
- Streaming de datos: activado, para que el chat se autocomplete a medida que responde.
Tras aprobar el plan y pasar a build, en unos minutos tienes la app funcionando. Le pedí una mejora extra —arrastrar y soltar documentos en el sidebar— y la implementó sin problema.
Como la API de MiniMax tiene que convertir los archivos en embeddings, la app necesita tu API key (puedes reutilizar la misma de Open Code). Una vez configurada, cargué un par de documentos y el chat respondió con resúmenes citando las fuentes y referencias del propio texto. Cuando subes un archivo, el contenido no se procesa todo junto: se divide en fragmentos (embeddings), y son esos fragmentos los que alimentan las respuestas.
El renderizado tiene detalles por pulir (a veces aparece el texto del razonamiento extra del modelo), pero la base funciona y no hace falta iterar demasiado para llegar a una app usable.
Usar MiniMax M3 desde VS Code con extensiones
Si trabajas en VS Code y quieres aprovechar tu suscripción, lo normal es hacerlo mediante una extensión. Una que recomiendo, muy parecida al chat, es Kilo Code (también existen Cline, Continue y muchas otras).
Tras instalarla, aparece un nuevo icono en la barra lateral. Vas a Settings → Providers, seleccionas un proveedor nuevo, buscas MiniMax, eliges la opción Token Plan, la añades y la habilitas. Listo: ya tienes tu suscripción funcionando dentro del editor.
Generar imágenes y audio con MiniMax CLI
MiniMax también tiene un CLI que aprovecha su naturaleza multimodal. Desde la consola puedes generar audio a partir de texto o imágenes a partir de un prompt. Por ejemplo, pedirle una imagen de un astronauta en un auto rojo en la luna: el modelo la descarga y la genera directamente.
Lo más cómodo es que, al tener un agente como Open Code, puedes pedirle que llame al CLI por ti:
Crea un audio usando MMX CLI que diga: "Esta es una prueba con MiniMax M3"
Crea una imagen de dos perros jugando ajedrez usando MMX CLI
Open Code detecta el comando, lo ejecuta por ti y te entrega el archivo, sin que tengas que escribirlo manualmente. Esto es útil también al desarrollar, porque esos recursos generados los puedes integrar directamente en tu aplicación.
Ventajas técnicas que debes conocer
Más allá de la práctica, MiniMax M3 tiene algunas ventajas que vale la pena entender:
- Enfoque en código. Estos modelos están fuertemente orientados a la generación de código, así que para crear aplicaciones funcionan muy bien y a bajo costo.
- Sparse Attention. Usa una técnica que le permite procesar enormes cantidades de información con menos recursos. Eso es justo lo que habilita su ventana de contexto gigante.
- Contexto de hasta 1M de tokens (con un mínimo garantizado de 512.000). Ideal para proyectos con tareas muy largas en modo agente.
En cuanto a benchmarks, los gráficos oficiales dan una idea de su posición frente a otros modelos populares:
- SWE-Bench Pro (escritura de código): supera a Gemini 3.1 Pro y queda casi a la par de GPT-5.5.
- BrowseComp (tareas de navegador): supera incluso a Opus 4.7.
- Terminal-Bench (uso de herramientas de terminal): queda a la par de Opus.
Precios y planes
El acceso es por API (pago por uso) o por el Token Plan (suscripción), que es la opción más cómoda y la que la mayoría va a usar.
Los planes arrancan desde:
- $20/mes: 1,7 billones de tokens mensuales, acceso al modelo M3 (y a los anteriores como M2.7), generación de imagen, audio y música, hasta 4 agentes concurrentes, contexto de 1M e integración en cualquier herramienta compatible.
- $50 y $120/mes: más del doble de tokens que el plan inicial, para quien necesite más volumen.
Todos los modos (texto, imagen, voz, música) comparten el mismo pool de uso. Y para abaratarlo más, puedes usar este enlace con 12% de descuento al adquirir cualquiera de estos planes.
Conclusión
MiniMax M3 es un modelo muy fácil de integrar: casi todas las herramientas actuales ya tienen una forma de conectarlo, responde rápido y se comporta de manera muy parecida a modelos como Claude Opus. Lo que más me llamó la atención fue poder usar el CLI desde el propio agente para generar imágenes y audio, lo que lo convierte en una herramienta bastante versátil.
A partir de aquí, depende de ti qué quieras construir. La combinación de bajo precio, contexto de 1M y agentes concurrentes lo vuelve una alternativa muy seria a los modelos más populares del momento.
Enlaces útiles
- MiniMax Coding Plan (12% OFF): https://platform.minimax.io/subscribe/coding-plan?code=DkQWAP4cjQ&source=link
- Plataforma de MiniMax: https://platform.minimax.io/
- Documentación de la API: https://platform.minimax.io/docs/guides/text-generation