Hasta este punto en la guerra de las AI teniamos a los actores principales que eran Microsoft, OpenAI, y Google o mejor dicho Microsoft y Open AI contra Google. Compitiendo directamente por ser el motor de busqueda mas usado, y que a su vez esten potenciados por estos Modelos de Deep Learning como lo es GPT4.
Es por esto que hasta este momento OpenAI nos han presentado sus dos modelos GPT-3.5 y luego GPT-4, y en teoria tambien Google con su modelo PALM, que digo en teoria porque aun no esta disponible su acceso publico, pero cuando se anuncie este seria su rival directo del modelo GPT-4.
Pero como estas no son las unicas empresas que se dedican a esto de los buscadores, Baidu, el buscador más popular de china, tambien ha anunciado hace unas semana que tambien traera su propio Chat, llamado Ernie Bot, que hace en esencia lo mismo que chat-gpt y que por supuesto tambien tiene su propio modelo de lenguaje llamado Ernie, que seria equivalente a GPT-3.
Ahora Meta, o Facebook no se quiere quedar atras tampoco, asi que tambien quiere formar parte de esta competencia, y solo hace unas cuantas semanas atras habia dado a conocer su propio modelo llamado LLaMa, equivalente a GPT-3, y colocando otro competidor en esta guerra de las AI.
Esta competencia es buena, por que hace que estas empresas tengan que batallar para ofrecer un mejor servicio, al intentar de ganar más usuarios, volviendo más accesibles estas tecnologías y hasta incluso sin querer, digo esto porque solo una semana despues que el modelo LLaMa fue publicado, este fue robado de forma online, apareciendo un torrent que permite descargar este modelo, en muchas comunidades online como 4chan, y ahora muchos estan preocupados por si este modelo se usara para causar problemas, como para generar spam o phising, pero potenciao ahora po AI.
Lo gracioso aqui es que la intencion de meta para crear este modelo LLaMa, fue "democratizar aún más el acceso", es decir que todos pudieran tener acceder a estos modelos, y vaya que lo ha logrado rapido, porque ahora hasta los scammers de internet podran hacer uso de el. Excelente trabajo Facebook.
pero no solo esto sino que tambien el mundo Open Source, vieniendo de la universidad de Standfod ha surgido otro modelo llamado Alpaca, que ya se lo que estas pensando, ¿Porque estan nombrando estos modelos como animales?
Pero lo importante aqui es notar que ya esta empezando a escucharse de multiples competidores al modelo de OpenAI. esto nos deja el contexto de los Large Language model actualmente de esta forma, tenmos GPT de OpenAI, financiado por Microsoft, PaLM que viene por parte de Google, Ernie el modelo de Baidu el competidor chino de Google, LLama de Meta (Facebook), y Alpaca (de la universidad de standford).
Y a pesar que estsos nuevos modelos (Alpaca, Llama y Ernie) no se compara a las capacidades GPT-4, creo que si vale la pena saber de que se tratan prque estan trayendo algunas caracteristicas interesantes. Aunuqe como baidu no es usado en occidente, los que mas nos interesaria a nosotros seria Llama, y alpaca, asi que empecemos por LLaMa.
¿Qué es LLaMa?
LLaMa es un Large Language Model desarrollado por el equipo de investigacion de inteligencia artificial de Facebook (FAIR - Facebook AI Research), que al igual que GPT-3 se especailiza en la generacion de texto a partir de una secuencia de palabras.
Aunque el modelo no es un solo sistema sino que tiene 4 modelos de diferentes tamaños, los cuales que son 7B, 13B, 33B y 65B parámetros.
Esto se conoce, debido al Paper de LLaMA que publicaron, colocando a LLaMa al mismo nivel que GPT-3 e incluso PALM de google, aunque lo interesante de este modelo es que se estan enfocando en que sea mucho mas barato en comparacion a los modelos existentes.
Es es decir modelos como GPT-3 son muy potentes pero requieren de hardware muy caro para ejecutarlos, asi que llegados a un punto si seguimos con esa tendencia ya no se podran seguir escalando, o al menos no faiclmente, asi que lo que se investiga actualmente es hacer que estos modelos pueden hacer lo mismo pero requeriendo menos poder de computo, inspirandose en la idea en que nuestro propio cerebro necesita poca electricidad para funcionar, asi que porque no estos modelos que tratan de imitra a los humanos.
Estno nos lleva a que el modelo de LLAMA-13b segun su paper, super millones pueda superar a GPT-3(175B) y su modelo LLAMA-65B puede competir con modelos muy grandes como Chinchilla-70B y PALM-540B.
Y esto que significa para el usuaro comun? bueno que ahora puedas ejecutar estos modelos en tu propio computador, por darles una idea, como se filtro el modelo en internet, algunos han intentado incluso ejecutar LLaMa en su propio raspberry Pi de 4gb de ram tan solamene, y sorprendetemente funcionan, aunque lento.
De hecho esta semana se ha hecho muy conocido un paquete llamado Dalai, a modo de hacer el juego de palabras Dalai LLaMA, que es un paquete de npm de Nodejs, que te permite probar estos modelos en tu laptop, con un simple npm install:

Aunque ya debes considerar que los modelos pesan mucho, asi que si quieres probarlo preparate para descargar modelos desde 4gb hasta los 32GB.
- 7B => ~4 GB
- 13B => ~8 GB
- 30B => ~16 GB
- 65B => ~32 GB
Y es aqui donde creo que muchos ya pueden imaginar lo que nos espera en solo unos cuantos años, la posiblidad de con un npm intsall poder tener un modelo como GPT-3 en nuestras aplicaciones. Claro hasta este punto podiamos ya usar GPT-3 con su API, pero ahora estamos hablando de tener el modelo en nuestros propiso computadores y utilizarlo para practicamente lo que queramos sin limitaciones.
inclus algunos hasta estan creano interfaces similares a Chat-gpt pero ejecutando el modelo de llama o alpaca
AUnque por supuesto esto aun essta empezando asi que no esperes el mismo resultado que GPT.
Lo que me lleva ahora a Alpaca
Alpaca
Alpace es otro modelo de lenguaje grande que ha sido creado por investigadores de la universidad de standford,y que es un clon de LLaMA, aunque fue entrenado con un conjunto de datos mas pequeños que LlAMA, especificmante LLAMA 7B, pero que tiene en la practica la misma capacidad que el modelo de open AI text-davinci-003 (GPT-3.5), solo que este se puede ejecutare en una maquinas muy baratas en comparacion a la infraesturura 5mil millones de OpenAI, es dceir este modelo se puede ejcutar hasta en maquinas de menos 600$.
DE hecho algo interesante es que para entrenar este modelo han usad GPT-3 para generar instrucciones, es algo asi como usar a GPT-3 de maestro y alpaca es el estudiante, y ahora este en teoria lo ha superado.
Y para usarlo puedes usar el mismo paquete Dalai que te mencione.
Aunque aun este modelo sigue en desarrollo, asi que habra que esperar los meses siguiente para ver sus avances y como se comparan a los de OPenAI, y Microsoft.
Conclusion
En fin esta batalla de las AI esta avanzando muy rapido, y en mi opinion creo que con la filtracion de Llama, y el uso abierto de alpaca, esto parece estar saliendose de control, asi que quiza a futuro veamos un organismo que regule el uso de las AI, que en un inicio ese era el papel de OpenAI, y ahora ironicamente ha iniciado este mas bien todo lo que se pensaba que podria ocurrir.
Y por supuesto no queda aqui, porque OPenAI tambien ya esta haciendo investigaciones en que trabjaos seran afectados por estas AI, asi que ha publicad un paper en donde estan listado que trabajos seran reemplazaos muy probablemente por este tipo de avances. pero eso lo mencionare en el siguiente video.
- https://crfm.stanford.edu/2023/03/13/alpaca.html
- https://github.com/tatsu-lab/stanford_alpaca
- https://the-decoder.com/stanfords-alpaca-shows-that-openai-may-have-a-problem/#:~:text=Stanford%27s%20Alpaca%20is%20a%20seven-billion%20parameter%20variant%20of,produced%20more%20hallucinations.%20Training%20cost%20less%20than%20%24600.
- https://youtu.be/xslW5sQOkC8 https://twitter.com/daniel_eckler/status/1636362970581336064
- https://crfm.stanford.edu/2023/03/13/alpaca.html https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
- https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
- https://github.com/tatsu-lab/stanford_alpaca
- https://www.theverge.com/2023/3/8/23629362/meta-ai-language-model-llama-leak-online-misuse
- https://ai.facebook.com/blog/large-language-model-llama-meta-ai/