El lanzamiento de los modelos Llama 3.1 por parte de Meta ha desatado un debate sobre lo que significa ser realmente «Open Source». Aunque Mark Zuckerberg lo promociona como un avance en «IA abierta», muchos expertos cuestionan el uso de este término. La controversia no es nueva: ya ocurrió con Llama 2 y se repite con Llama 3.1. ¿Es este modelo verdaderamente Open Source? Vamos a profundizar en este tema.
¿Qué es realmente ser Open Source?
En su definición clásica, «Open Source» implica un acceso completo al código fuente, con libertad para copiar, modificar y distribuir el software sin limitaciones significativas. Sin embargo, Meta usa el término de manera más amplia para referirse a los “pesos abiertos” (Open Weights), que no son lo mismo que compartir el código fuente.
Los pesos abiertos hacen referencia a la disponibilidad de los archivos de red neuronal ya entrenada. Es decir, los desarrolladores pueden descargar el modelo y usarlo como base, pero no tienen acceso total a su estructura y datos de entrenamiento. Meta permite a los desarrolladores trabajar con estos pesos, pero la licencia establece condiciones limitantes: cualquier modelo derivado de Llama 3.1 puede usarse gratuitamente solo hasta alcanzar los 700 millones de usuarios activos al mes. Más allá de este límite, se requiere pagar una licencia a Meta, algo que restringe la libertad y accesibilidad, pilares del verdadero Open Source.
Falta de transparencia en el entrenamiento
Mark Zuckerberg mencionó en una entrevista con Bloomberg que el modelo Llama 3.1 fue entrenado usando publicaciones de Facebook e Instagram y otros conjuntos de datos con licencias privadas. Sin embargo, Meta no especifica en detalle qué datos exactos utilizó ni cómo fueron recolectados. Esta falta de transparencia es común en la industria: tanto OpenAI con GPT-4 como Anthropic con Claude 3.5 han sido reservados en cuanto a los datos empleados.
Aunque Meta da acceso a los pesos, el modelo carece de claridad sobre los datos de entrenamiento, lo cual limita su apertura. A la vez, esta opacidad genera inquietud en los usuarios, quienes pueden ver cómo sus propios contenidos públicos en internet podrían estar siendo utilizados para entrenar modelos de IA sin su consentimiento explícito.
Diferencias clave entre “Open Source” y “Open Weights”
El término «Open Weights» se refiere a modelos en los que solo los pesos de la red neuronal están disponibles públicamente, mientras que «Open Source» implica acceso total y libertad de uso. Esta es una diferencia importante. OpenAI, por ejemplo, no comparte los pesos de ChatGPT y otros modelos, lo que los convierte en software totalmente propietario. Meta, al compartir los pesos de Llama 3.1, permite un grado de libertad, pero sigue restringiendo el acceso completo y exige licencias para modelos de gran alcance, desvirtuando el concepto de “abierto” que intentan promocionar.
Como señala la Open Source Initiative, Meta confunde «Open Source» con “recursos disponibles bajo condiciones específicas”, una diferencia sustancial en términos de accesibilidad y ética.
El impacto de esta confusión en la industria de la IA
La forma en que Meta utiliza el término “abierto” ha generado desconfianza. El equipo de investigación de la Universidad de Radboud, en los Países Bajos, desarrolló una evaluación de cuán abiertos son realmente ciertos modelos de IA. Llama 3.1 de Meta quedó clasificado como uno de los modelos menos abiertos, algo que resalta la ambigüedad de su postura.
Simon Willison, cofundador del entorno de desarrollo Django y experto en IA, comentó que aunque la declaración de Zuckerberg sobre IA “abierta” es interesante y llamativa, considera que se ha perdido la batalla en cuanto al uso adecuado del término “Open Source”. A medida que Meta y otros gigantes de la tecnología continúan usando «Open Source» en sus campañas de marketing, la definición tradicional del término se diluye, afectando a los desarrolladores y empresas que buscan verdaderos proyectos abiertos.
Conclusión: ¿Es realmente Llama 3.1 de Meta un modelo Open Source?
Llama 3.1 de Meta no cumple con los criterios de Open Source en el sentido estricto de la definición. Al llamar a sus modelos «abiertos», Meta sigue un enfoque ambiguo que puede ser confuso. Aunque proporciona acceso a los pesos, existen restricciones importantes, incluyendo la necesidad de pagar licencias en caso de éxito masivo, lo cual no se alinea con la filosofía Open Source de acceso libre y sin restricciones.
En resumen, el uso del término Open Source para describir a Llama 3.1 parece más una estrategia de marketing que una representación fiel de la accesibilidad y transparencia que define al Open Source real. La diferencia entre “Open Weights” y “Open Source” es una cuestión clave que Meta, y la industria en general, necesitan clarificar si realmente buscan generar confianza en el ámbito de la inteligencia artificial generativa.