Meta no para de presumir de que la IA de Llama es Open Source. Eso no es del todo cierto

Meta no para de presumir de que la IA de Llama es Open Source. Eso no es del todo cierto
meta no para de presumir de que la ia de llama es open source. eso no es del todo cierto

Aunque Mark Zuckerberg ya habĂ­a adelantado el lanzamiento un mes antes, fue en de julio de 2023 cuando Meta anunciĂł el lanzamiento de Llama 2. Desde el principio nos lo vendieron como una especie de "ChatGPT Open Source", y la empresa no ha parado de presumir de ello, pero hay un problema.


Que Llama 2 no es Open Source.


Como destacaban en esa aclaraciĂłn, Llama 2 no cumple con la DefiniciĂłn Open Source (OSD) que entre otros requisitos impone que no haya restricciones contra personas, grupos o campos de actividad especĂ­ficos.


Sin embargo, la licencia utilizada en los modelos y el cĂłdigo de Llama impone restricciones en su uso comercial para ciertos usuarios: si tu producto estĂĄ basado en Llama y tienes mĂĄs de 700 millones de usuarios mensuales activos, necesitas pagarle una licencia a Meta.


Eso desde luego limita mucho los escenarios en los que se superarĂĄ ese requisito, pero aquĂ­ Meta se protege las espaldas si ese teĂłrico producto crece mucho. Imaginad que alguien crea una alternativa a ChatGPT basada en Llama. Inicialmente no tendrĂĄ que pagar nada a Meta, pero si el producto se vuelve viral y acaba teniendo una adopciĂłn masiva, eso obligarĂĄ a contratar una licencia y pagar por ella.


AdemĂĄs de ello, en Meta no comparten los datos usados para entrenarlos —la transparencia en este sentido es nula en la industria— ni el cĂłdigo utilizado para entrenarlo. En la OSI celebraron que Meta estuviese "reduciendo las barreras para acceder a potentes sistemas de IA", pero criticaban ese conflictivo uso del tĂ©rmino Open Source.


No hay modelos de IA totalmente Open Source


Lo cierto es que aun sin ser "completamente" Open Source, Llama 2 logrĂł convertirse en referente para desarrolladores. Algunos de ellos, no obstante, quisieron advertir de los peligros de basar su trabajo en modelos con limitaciones de uso.


El grupo de investigadores de la Universidad de Radboud en Nijmegen, Países Bajos, publicó una tabla fantåstica. En ella se califican 14 características de diversos modelos en base a su apertura, y gracias a ella es posible saber qué modelos cumplen mås (o menos) con la definición pura de Open Source. Llama 2 no lo hacía, pero es que en realidad ninguna cumple los requisitos de esta exigente tabla.


La tabla se ha ido actualizando con los nuevos modelos que se han publicado, y eso incluye al Ășltimo modelo de Meta, Llama 3. En esta Ășltima versiĂłn Meta ha tenido algo mĂĄs de cuidado a la hora de presumir de que el modelo es Open Source, aunque en su licencia se aplican los mismos tĂ©rminos que en la del modelo anterior.


En el sitio web oficial sĂ­ habla de que estĂĄ "abiertamente disponible", pero en el artĂ­culo adicional en su blog sĂ­ indicaron que era Open Source, pero como ocurre con Llama 2, lo es solo parcialmente.


Tanto a uno como a otro se los consideran modelos de "pesos abiertos" ("open weights") porque proporciona informaciĂłn sobre cĂłmo se realizan sus cĂĄlculos. En la tabla de los investigadores de PaĂ­ses Bajos, eso sĂ­, ambas estĂĄn situadas de las Ășltimas.


Peor aĂșn es lo de ChatGPT, que suspende en apertura de forma contundente, algo irĂłnico teniendo en cuenta que estĂĄ desarrollado por OpenAI. Elon Musk lleva tiempo tratando enfrentado a esta empresa, y no dudĂł en exigirles que cambiaran el nombre y luego gastĂł una broma en Twitter al respecto.


La realidad es que la transparencia en este ĂĄmbito es muy limitada, e incluso modelos que presumen de ser Open Source no lo son nunca del todo. Lo demuestran tanto Llama 2 como Llama 3, pero a pesar de ello, Meta ha logrado autoproclamarse defensor de la filosofĂ­a Open Source.


En este blog Yann LeCun, responsable de IA en Meta, lo tiene claro: los modelos como ChatGPT no lograrĂĄn igualar la inteligencia humana


No hay comentarios.:

Con tecnologĂ­a de Blogger.