GPT-5.6 y Claude Fable: por qué los modelos más potentes de la IA están bajo llave
Hace un par de días apareció GPT-5.6 y, al igual que pasó con Fable 5 de Anthropic, terminó limitado por el gobierno de Estados Unidos. Hoy no hay acceso público a ninguno de los dos, a pesar de que son, prácticamente, los modelos más avanzados que cada empresa ha producido hasta la fecha.
Esto deja una pregunta de fondo sobre la mesa: ¿en realidad estos modelos son tan potentes como para que valga la pena bloquear su uso? Y más importante todavía, ¿qué pasará cuando los próximos modelos sean aún mejores? Si esta es la tónica, la gran mayoría de personas terminará usando versiones recortadas mientras la frontera real queda reservada para un grupo cerrado.
En este artículo reviso qué pasó esta semana, qué dicen los benchmarks (porque casi nadie ha probado los modelos todavía) y por qué el open source —incluyendo varios modelos chinos— está aprovechando este vacío.
Qué es GPT-5.6: tres modelos, no uno
OpenAI presentó GPT-5.6 el 26 de junio de 2026, y no es un modelo sino una familia de tres, cada uno con un nombre propio que marca su nivel.
Sol es el modelo frontier, el más grande y capaz. Si lo comparamos con la nomenclatura de Anthropic, sería el equivalente a un modelo de nivel Mythos. Terra es la opción equilibrada de uso diario, pensada para ser el caballo de batalla. Y Luna es el más rápido y barato, para volumen alto. La forma fácil de pensarlo: Sol es como Mythos, Terra es como un Opus, y Luna juega en la liga de un Sonnet.
En el nuevo esquema de nombres, el número (5.6) indica la generación, mientras que Sol, Terra y Luna identifican niveles de capacidad que pueden avanzar a su propio ritmo. Sol además trae dos novedades: un modo max reasoning que le da más tiempo para razonar a fondo, y un modo ultra que usa subagentes para acelerar tareas complejas más allá de lo que logra un solo agente.
El problema: casi nadie lo ha probado
Aquí viene lo incómodo. De momento nadie del público general ha probado GPT-5.6. Todo lo que tenemos son benchmarks. OpenAI indicó que lo hará disponible de forma más amplia en las semanas siguientes, pero por ahora el acceso está limitado a partners: empresas que ya habían tenido acceso a la API de modelos anteriores.
¿La razón? Otra vez, el gobierno de Estados Unidos. La Casa Blanca pidió a OpenAI escalonar el lanzamiento de GPT-5.6 y restringirlo a un grupo reducido de socios aprobados por el gobierno, debido a las capacidades avanzadas del modelo. Sam Altman llegó a escribir en X que el debut por fases era "malas noticias", ya que la empresa había planeado un lanzamiento mucho más abierto.
Lo que dicen los benchmarks (con pinzas)
El benchmark estrella es Terminal-Bench 2.1, una herramienta para medir agentes en tareas de línea de comandos que requieren planificación, iteración y coordinación de herramientas. Ahí GPT-5.6 Sol Ultra queda incluso por encima de Mythos. Pero esto siempre hay que tomarlo con pinzas: prácticamente todas las empresas, cuando lanzan un modelo nuevo, presentan benchmarks favorables.
Las cifras concretas, ordenadas de mayor a menor en Terminal-Bench 2.1:
- GPT-5.6 Sol Ultra: 91.9%
- GPT-5.6 Sol: 88.8%
- Claude Mythos 5: 88.0%
- GPT-5.6 Luna: 82.5%
- Claude Opus 4.8: 78.9%
Y aquí hay un detalle interesante para no perder de vista: Terra queda en 84.3% (empatado con Fable 5), pero Luna —que se supone es el nivel más bajo— lo supera en este test específico. La lección es que los niveles definen el balance de precio/velocidad, no necesariamente quién gana en cada benchmark puntual.
En el frente de eficiencia hay un dato que sí importa de verdad: en ExploitBench, OpenAI dice que Sol es competitivo con el Mythos Preview de Anthropic usando solo alrededor de un tercio de los tokens de salida. Para flujos agénticos que se cobran por token, eso es una compresión de costo real.
El precio no subió (esa es la buena noticia)
A pesar de ser mejor, GPT-5.6 cuesta lo mismo que GPT-5.5. Los precios por millón de tokens quedan así:
- Sol: $5 de entrada / $30 de salida (idéntico a GPT-5.5)
- Terra: $2.50 / $15 (la mitad de Sol, con rendimiento comparable a GPT-5.5)
- Luna: $1 / $6 (más de la mitad más barato que Terra)
En todos los niveles, la salida cuesta 6 veces más que la entrada, así que el verdadero ahorro está en controlar cuánto texto genera el modelo. Para poner esto en perspectiva: Sol a $5/$30 es aproximadamente la mitad de lo que cuesta Claude Fable 5, que se lista en $10/$50.
Un dato adicional que mencionó OpenAI: van a lanzar Sol sobre Cerebras a hasta 750 tokens por segundo en julio, lo cual es bastante veloz para los modelos actuales. Esto apunta directo a casos sensibles a la latencia, donde esperar al modelo es el cuello de botella.
Anthropic responde: pero ojo con lo que realmente pasó
Con este anuncio, Anthropic tampoco se quedó callada. Como su modelo equivalente —Fable 5— fue suspendido hace algunas semanas y desde entonces no se sabía cuándo volvería, la empresa publicó una actualización el 26 de junio.
Aquí conviene ser preciso, porque es fácil malinterpretarlo. El gobierno no restauró Fable 5. Lo que la Secretaría de Comercio autorizó, mediante una carta de Howard Lutnick, fue restaurar el acceso a Mythos 5 únicamente, y solo para un grupo cerrado de aproximadamente 100 organizaciones estadounidenses que operan y defienden infraestructura crítica (la llamada "Annex A"). Entre ellas hay agencias federales y empresas privadas como Cisco y bancos como JPMorgan Chase.
Fable 5 —el modelo abierto al público general, el que la mayoría de personas realmente esperaba— sigue suspendido. Anthropic dijo que continúa trabajando con el gobierno para expandir el acceso a Mythos 5 y volver a hacer Fable 5 disponible para uso general, pero a la fecha no hay fecha de regreso. Lutnick además se reservó explícitamente el derecho de revocar o ajustar la lista de organizaciones aprobadas en cualquier momento.
Vale la pena recordar el contexto: Fable 5 y Mythos 5 se lanzaron a inicios de junio, y apenas tres días después el gobierno ordenó apagarlos para todos los usuarios del mundo. La directiva original prohibía el acceso a cualquier extranjero —incluidos los propios empleados extranjeros de Anthropic— y, como no hay forma confiable de filtrar nacionalidades en tiempo real entre cientos de millones de usuarios, la única forma de cumplir fue apagar los modelos por completo.
El open source huele la oportunidad
Como estos modelos tan potentes están saliendo y prácticamente nadie puede usarlos, el ecosistema open source está tratando de aprovechar el vacío. Y aquí aparecen varios jugadores.
El primero es Fugu, de la empresa japonesa Sakana AI (importante no confundir: Sakana AI es la compañía, Fugu es el sistema). Lanzado el 22 de junio, Fugu llamó la atención porque no es un solo modelo, sino un sistema multiagente que se presenta como si fuera un único modelo a través de una sola API. Piénsenlo prácticamente como un proxy inteligente: tiene distintos modelos enfocados en distintas tareas y un coordinador que decide a cuál enrutar cada petición.
Conviene matizar el claim de Sakana, porque ha circulado exagerado: la empresa dice que su variante Fugu Ultra queda "hombro a hombro" con Fable 5 y Mythos Preview, y que supera claramente a los modelos públicamente accesibles (Opus 4.8, GPT-5.5 y Gemini 3.1 Pro). No afirma superar a Fable. Además, pruebas independientes —lideradas por Ethan Mollick— reportaron a las 24 horas del lanzamiento una brecha notable entre los benchmarks y el uso real: tareas de shaders y escenas interactivas tardaron 30 minutos y el resultado, aunque "decente", no igualaba a Fable en la práctica. La gracia del enfoque, eso sí, es que puede esquivar dinámicamente las restricciones: si un modelo específico queda bloqueado, simplemente lo reemplaza por otro.
Si este concepto les suena familiar, OpenRouter publicó hace semanas su Fusion API con la misma idea: combinar distintos modelos para distintos tipos de tareas y, según anunciaban, lograr resultados al nivel de Fable 5.
Y no fueron los únicos. También está GLM (de la empresa china Zhipu), que en estas semanas estuvo bastante popular. Es un modelo abierto que compite con Opus, y mucha gente lo ha estado usando precisamente porque puede llegar a ser más barato que Opus 4.8 alcanzando en la práctica un rendimiento similar. De hecho, hay reportes recientes de que Zhipu reclama paridad con Mythos en capacidades de seguridad —lo cual, si su modelo sigue el patrón histórico de ser open source, plantea una ironía interesante: la capacidad que el bloqueo pretendía contener estaría libremente disponible para cualquiera.
¿Por qué se está frenando todo esto?
De momento nadie tiene una idea cristalina de por qué se está evitando el lanzamiento de estos modelos. Hay dos especulaciones principales.
La primera: que son demasiado costosos y las empresas no quieren seguir perdiendo dinero. Aunque esta teoría pierde fuerza con GPT-5.6, que es explícitamente más barato.
La segunda, y más probable a la luz de las acciones del gobierno: que se quiere evitar que la competencia —principalmente los modelos chinos— destile o copie estas capacidades. Hay quien estima que la diferencia entre los modelos chinos y los americanos es de apenas unos 8 meses.
Pero hay algo que muchos no están tomando en cuenta. Aunque esto parezca lejano, lo que indica es un patrón: si a futuro salen modelos mucho mejores, no vamos a tener acceso a ellos —o al menos pasarán por un filtro muy grande— y la mayoría de personas terminará usando una versión limitada, tal como pasó con Fable 5. De hecho, este episodio es el primer uso conocido de controles de exportación de Estados Unidos para regular un modelo de IA frontera específico por motivos de seguridad nacional.
De ahí surge la esperanza de muchos: que los modelos chinos eventualmente mejoren lo suficiente para esquivar ese control. Porque cuando esos modelos abiertos lleguen al nivel de Fable o GPT-5.6, la pregunta inevitable será si también los limitarán. Y ahí está el detalle: es difícil restringir modelos abiertos porque, al final del día, nadie los controla. Quizás veamos otro tipo de regulación para ese tipo de modelos a medida que alcancen niveles que puedan considerarse peligrosos en uso general.
En resumen
Por ahora simplemente no tenemos información extra ni acceso real. Solo nos queda esperar a las próximas semanas, cuando supuestamente liberen estos modelos de forma más amplia, y comprobar si realmente obtenemos el Fable 5 y el GPT-5.6 de los que tanto se habla, o una versión recortada.
Lo que sí queda claro es que la frontera de la IA está empezando a cerrarse, y el factor decisivo ya no es solo técnico ni económico: es regulatorio. Mientras tanto, el open source —con varios modelos chinos a la cabeza— se posiciona como el plan B de quienes no entran en las listas de "partners aprobados".
Datos verificados al 28 de junio de 2026. Las cifras de benchmarks provienen de los anuncios oficiales de OpenAI, Anthropic y Sakana AI; recuerda que casi ningún tercero independiente ha podido validar GPT-5.6 todavía, ya que sigue en preview cerrado.