Llama 3.1 AI: Meta lanza su nueva IA y compite con GPT4o
Hace apenas tres meses, presentaron Llama 3, una IA generativa multimodal en dos versiones: 8B y 70B, con 8 mil millones y 70 mil millones de parámetros respectivamente. El gigante tecnológico no quiere quedarse atrás en la carrera de la inteligencia artificial a pesar de elegir un camino diferente al de OpenAI y Google. Esta es Llama 3.1 AI, ¡sigue leyendo para saber más!
¿Qué es Llama 3.1 AI?
Llama 3.1 AI es el nombre del nuevo modelo de IA que lanzó Meta. Mientras que Llama 2 se entrenó con dos mil millones de tokens, Llama 3.1 AI usa 15 mil millones de tokens. Los tokens son unidades básicas de datos controladas por inteligencia artificial. Cuanto mayor sea este valor, más «inteligente» será la inteligencia artificial y menos probabilidades habrá de cometer errores.
Además de lanzar su modelo de idioma más grande hasta la fecha, la compañía también mejoró las versiones 8B y 70B agregando soporte para múltiples idiomas, incluido el español. Se trata de modelos multimodales que pueden trabajar con texto, audio e imágenes. Pero todavía no hay ningún vídeo de él haciendo GPT con Sora.
Viene con nuevas funciones como «Picture Me», donde subes una foto tuya y la IA te imagina en diferentes profesiones o con diferentes peinados, ropa, tatuajes y más. En su último lanzamiento, Meta muestra que el enfoque de circuito cerrado favorecido por la mayoría de las empresas de IA no es la única forma de desarrollar la IA.
Pero la empresa también está en el centro de un debate sobre los peligros de lanzar inteligencia artificial sin supervisión. Meta entrena a Llama para que el modelo no produzca resultados maliciosos de forma predeterminada, pero se puede modificar para eliminar estas protecciones.
Características de Llama 3.1 AI
Meta afirma que Llama 3.1 AI es tan inteligente y útil como los mejores productos comerciales de empresas como OpenAI, Google y Anthropic. Según varios parámetros que miden el progreso de la IA, Meta garantiza que el modelo es el más inteligente del planeta. Con Llama 3.1 AI, 405B Meta continúa centrándose en la IA de código abierto.
Una guía para comprender lo que es importante en tecnología, ciencia y cultura digital. Según Zuckerberg, el código abierto es esencial para un futuro positivo de la inteligencia artificial. El director de Meta señaló que la inteligencia artificial tiene un potencial excepcional para mejorar la productividad, la creatividad y la calidad de vida de las personas.
Mark Zuckerberg, director ejecutivo de Meta, con el logo de la empresa en la espalda. Zucks desafía a OpenAI, Google y otras empresas que desarrollan modelos de código cerrado. A diferencia de GPT-4o, Llama 3.1 405B no es un elemento central del modelo de negocio de Meta. Mark Zuckerberg añadió que abrir el código fuente de la inteligencia artificial no reduce los ingresos, la sostenibilidad ni la capacidad de invertir en investigación.
El directivo señaló que es por eso que las empresas critican los modelos de código abierto, pero la IA de código abierto será una mejor solución en el futuro. Meta cree que el lanzamiento del Llama 3.1 405B supondrá un punto de inflexión en la industria. La empresa se centra en construir un ecosistema más amplio para que más desarrolladores y empresas puedan beneficiarse de sus modelos de IA.
Llama al 3.1 y tu ordenador
Llama 3.1 AI es demasiado grande para ejecutarse en una computadora típica, pero Meta dice que muchos proveedores de nube como Databricks, Groq, AWS y Google Cloud ofrecerán opciones de alojamiento para que los desarrolladores puedan ejecutar un modelo de sesión de su propia versión. También puede acceder al modelo en Meta.ai.
Algunos desarrolladores creen que la nueva versión de Llama podría tener implicaciones de gran alcance para el desarrollo de la inteligencia artificial. Stella Biderman, directora ejecutiva de EleutherAI, un proyecto de inteligencia artificial de código abierto, también señaló que Llama 3 no es completamente de código abierto.
A diferencia de los últimos modelos de OpenAI y Google, Llama no es «multimodal», lo que significa que no está diseñado para procesar imágenes, audio y vídeo. Sin embargo, Meta señala que este modelo funciona mucho mejor cuando se combina con otro software, como navegadores web. Muchos investigadores y empresas creen que podrían aumentar la utilidad de la inteligencia artificial.
Después de que OpenAI lanzará Chat GPT a finales de 2022, algunos expertos en IA pidieron que se detuviera el desarrollo de la IA. Había muchas preocupaciones de que se pudiera abusar de la tecnología o resultar demasiado poderosa para controlarla. Desde entonces, las preocupaciones existentes han disminuido, pero muchos expertos aún temen que los piratas informáticos puedan utilizar modelos de inteligencia artificial sin restricciones con fines maliciosos.
La ciberseguridad está primero
El cibercrimen está en todas partes. Meta ha ayudado a aliviar algunas preocupaciones al lanzar versiones anteriores de Call with Warning. La compañía dijo que sometió a Lama a rigurosas pruebas de seguridad antes de lanzarlo. Dan Hendricks, científico informático y director del Centro para la seguridad de la IA, una organización sin fines de lucro que se centra en las amenazas de la inteligencia artificial, señaló que, en general, Meta ha hecho un buen trabajo al probar sus modelos antes de publicarlos.
El enfoque abierto de Llama 3.1 AI
La compañía, presidida por Mark Zuckerberg, lleva tiempo trabajando en modelos «open source», aunque no todo el mundo está de acuerdo con el uso del término. Algunas personas notan que su licencia tiene restricciones que no permiten clasificarla de esta manera. Llama 3.1 vuelve a ser de código abierto con nuevas funciones a nivel de licencia.
El último modelo de la empresa es de uso gratuito, incluso con fines comerciales, a menos que llegue a cientos de millones de usuarios. Básicamente, Zuckerberg publicó una carta señalando que «la IA de código abierto es el camino a seguir» y que los modelos de código abierto están mejorando y eventualmente superarán a los modelos cerrados en algún momento.
La nueva versión de Meta Llama
Poder subir un modelo con estas especificaciones y utilizarlo cómodamente no es fácil. La preparación del Llama 3.1 AI 405B requirió varios meses de capacitación utilizando 16.000 tarjetas gráficas NVIDIA GPU H100. Meta también ha proporcionado ponderaciones de modelos para que las empresas puedan capacitarlos con datos personalizados y adaptarlos a sus necesidades.
Aparte del hecho de que las variaciones de este modelo pueden ejecutarse localmente, vivimos en un mundo donde la computación en la nube es una realidad. Mover un bloque gigante de 405 mil millones de parámetros no es algo que se pueda hacer con ningún hardware. Aquí es donde los clientes empresariales pueden contratar diversos servicios como AWS, Google Cloud, Databricks o Microsoft Azure.