Hace un par de días OpenAI ha hecho publico la nueva version de su modelo GPT-3, llamada GPT-4 que si antes ya GPT-3 era bastante asombroso, porque podia procesar cualquier pregunta y responder inmediatamente, ahora en su nueva version tambien puede procesar imagenes.
Quizas para algunos no parezca mucho, pero veamos un ejemplo.
Aquí el presentador esta haciendo un dibujo del sitio web que quiere, simplemene le toma una foto, lo procesa con GPT-4 y le pide que le de el código de la imagen que ha hecho, recibiendo como respuesta todo el codigo listo, sin que necesesite modificacion, y ni siquiera le ha dado mucho contexto de que se trata la imagen.
Y a pensar de que el ejemplo es simple, ya con esto, estamos hablando de una muy mejora importante, porque si con GPT-3 ya era facil hacer preguntas en texto, ahora con GPT-4 puedes dibujarselo, pasarle screenshots, subir imagenes, fotos, etc. Lo que tecnicamente hace que GPT pase de ser un LLM (Large Language Model) a MLLM (Multimodal Large Language Model), es decir que ya esta siendo entrenado con más que solo texto, sino tambien con imagenes.
Es decir podrias por ejemplo generar un imagen de un sitio web espectacular con Midjorney y luego darselo a GPT-4 para que te el código, de lo que ve.
Y no solo esto, sino que esta nueva version es incluso más inteligente que la anterior, ahora pudiendo pasar tambien examenes de colegiacion

Y pasar con una puntacion de 5 (siendo la maxima puntuacion), en examenes AP(Advanced Placement), que sirven para poder obtener creditos universitarios.
Ademas el modelo ahora tambien soporta la entrada de más de 25000 palabras, comparada a las 3000 que soporta GPT-3. Lo que quiere decir que puedes proveer de más contexto para que la AI pueda mejorar en sus respuestas. De hecho usando esta caracteristica puedes pasarle articulos muy largos que no necesariamente esten internet, y pedirles resumenes de estos o ir pregunandole cosas, lo que si eres desarrollador sabes que podrias hacer esto con las documentaciones de muchos proyectos actuales.
De hecho Stripe, es un ejemplo de esto, ya que esta creando su documentacion basada en AI donde puedes tener un chat para preguntar como usar sus servicios y paquetes en lugar de tener que leer en una basta cantidad de archivos.
Así que ya estoy esperando que este nuevo modelo se integre en copilot, lo que solo hara mejor el autocompletado al usarlo en editores de código.
Ahora ¿esto significa el fin de los programadores?
¿Este es el fin de los Programadores?
Personalmente no creo que estemos hablando del fin de los programadores, aun, al menos no como tal.
Es decir GPT-4 es bueno escribiendo código pero no es tan bueno como lo hace un desarrollador, y no puede resolver todo tipo de problemas aun, de hecho Este es una metrica de cuanto por ejemplo pudo resolver GPT-4 en Leetcode, una plataforma para resolver problemas de algoritmos.
https://twitter.com/AlexReibman/status/1635697814452965381/photo/1
Donde puede resolver muchos que son faciles, pero solo 3 de los dificiles, aunque por supuesto ya de por si es impresionante que este intentado resolverlos.
Esto ambien quiere decir si el modelo sigue avanzando a este paso, y llega a implementarse una plataforma No Code, y que esta tenga una muy facil experiencia de usuario, yo creo que si estariamos hablando del fin de los desarrollos pequeños, es decir ya puedes ir a una web, y pedirle cosas basicas como que cree un panel de control, y te da la posibilidad de editar el sitio y hacer operaciones basicas CRUD, de pagos y encima ya esta desplegado desde el primer minuto, esto cambia mucho las cosas.
Es decir las paltaformas No Code ya existen, pero son muy basicas y dificles de extender, con las basadas en AI seria distinto porque el codigo es como si fuera creado por una persona dando la posiblidad de que puedas tener muchisimo más control, o desplegar tu proyecto en otro lugar o continuar, y eso si es una amenaza para el desarrollo de algunsa aplicaciones cotifianas, pero que no lo veo tan cercano aun, aunque si estoy muy seguro que envualmente veremos alguna plataforma muy producida, quizas por parte de Microsoft, que esta invirtiendo mucho dinero en esto.
Ahora recuerden que cuando hablamos de GPT-4 estamos hablando del modelo de Deep Learning, y no de su implementacion, asi que si ya con GPT-3.5 teniamos una enorme cantidad de servicios usandolo, ahora esto simplemente se va a incrementar.
Por ejemplo algunos servicios que ya estan usado GPT-4 son
- Bing Chat, el chat diponible en el buscador de Microsoft
- Duolingo, que ahora ha integrado un nuevo servicio llamado Max para permitir tener conversaciones y practicar con un bot
- Stripe, que esta creando una documentacion inteligente donde a traves de un chat puedes obtener respuestas de como usar sus servicios, lo que seria un buen ejemplo de que tipo de documentaciones podriamos ver a futuro potenciadas por AI
- Khan Academy, integrando un chatbot en su plataforma
Ahora si en tu caso quieres probar directamente GPT-4. Uno como usuario y otro como desarollador
Si quieres probarlo como usuario, este ya está disponible en Chat-GPT Plus, es decir la version pagada del chat, en donde de momento solo procesa texto, pero ya veremos como lo actualizan en las siguientes semanas, para que tambien procese imagenes.
Y si es como desarrollador es decir que estamos hablando de su API, de momento este no esta disponible publicamente, asi que se tiene que puedes pedir acceso temprano, a traves de registrarse en su lista de espera.
Conclusión
En Fin GPT-4 ya esta aqui y no parece que las plataformas basadas en AI vayan a dejar de ser populares pronto. Además que con los anuncios que casi cada semana hacen Google, Microsoft y OpenAI de sus nuevos servicios e integraciones AI, esto no parece que vaya acabar pronto.
- Por darles un ejemplo, un dia Google anuncia Bard, su alternativa a Chat-GPT, al otro Microsoft anuncia que bing se integra con Chat-gpt
- Un dia Google Anuncia que integrara su API, que es una alternativa a la API de OPenAI, al dia siguiente OpenAI anuncia GPT-4
Y así con cada noticia. asi que lo que nos espera es seguir escuchando de cientos de servicios basados en inteligencia artificial los siguientes meses.
Recursos
- GPT4 en ProductHunt
- https://openai.com/product/gpt-4
- https://openai.com/blog/openai-and-microsoft-extend-partnership
- https://news.microsoft.com/es-xl/microsoft-y-openai-amplian-su-asociacion/
- https://openai.com/product/gpt-4
- https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning
- GPT-4 Developer LiveStream
- https://workspace.google.com/blog/product-announcements/generative-ai