Claude 3.5 Sonnet: La nueva IA que derrota a GPT-4º
La inteligencia artificial generativa (GenAI) se está desarrollando rápidamente y Claude 3.5 Sonnet es la prueba de ello. Hace más de año y medio, OpenAI presentó por primera vez ChatGPT. El chatbot fue tan impresionante que la empresa dirigida por Sam Altman pronto se convirtió en líder de la industria. Sin embargo, la competencia está lejos de terminar y algunas de sus soluciones son realmente interesantes.
Se acaba de lanzar Claude 3.5 Sonnet y estamos hablando de un modelo de lenguaje de próxima generación que pretende igualar o mejorar GPT-4o en varios puntos de referencia. Si quieres saber todo sobre esta nueva IA, quédate para que te enteres de todo de primera mano.
¿Qué puede hacer Claude 3.5 Sonnet?
Como puede ver en la siguiente tabla, el Claude 3.5 Sonnet superó al GPT-4o en siete de nueve pruebas generales. Aunque la diferencia es pequeña, esta es una característica notable ya que compite con el mejor OpenAI. Esto se vuelve aún más notable si consideramos el Claude 3.5 Sonnet como un modelo de gama media. De cara al futuro, Anthropic debería actualizar su familia Opus más ambiciosa hasta el momento.
De hecho, el Claude 3.5 Sonnet obtuvo mejores resultados que el Claude 3 Opus en todas las pruebas. Quizás te preguntes qué significa todo esto. Según sus creadores, la respuesta es mejorar las capacidades de codificación y traducción. Esto último puede resultar muy útil para los clientes empresariales que acceden a modelos de IA a través de API para gestionar aplicaciones heredadas.
El modelo también cuenta con una mejor capacidad para comprender gráficos y tablas, así como para decodificar texto a partir de imágenes. Las mejoras no terminan ahí: en nuestras pruebas encontramos que el programa está programado para hacer las interacciones más humanas e incluso tiene ese «sentido del humor» con el que muchas personas pueden sentirse cómodas. Por si fuera poco, también incluye una función llamada Artefactos.
Lo que se espera de Claude 3.5 Sonnet
Recientemente, el progreso en IA se ha vuelto más incremental y se basa más en innovaciones en el desarrollo y entrenamiento de modelos que en el escalado de modelos y la computación en bruto, como fue el caso con GPT-4.
Michael Gerstenhaber, director de producto de Anthropic, señala que el nuevo Sonnet Claude 3.5 es más grande que su predecesor, pero gran parte de sus nuevas capacidades se deben a innovaciones en la formación. Por ejemplo, el modelo recibe información que mejora su capacidad de razonamiento lógico.
Anthropic afirma que Claude 3.5 Sonnet supera a los modelos líderes de OpenAI, Google y Facebook en pruebas populares de rendimiento de IA como GPQA, una prueba de posgrado en biología, física y química; MMLU, una prueba que cubre informática, historia y otros temas; y HumanEval, una medida de las habilidades de codificación. Sin embargo, la mejora es sólo cuestión de unos pocos puntos porcentuales.
Puede que estos últimos avances en inteligencia artificial no sean revolucionarios, pero son rápidos: hace apenas tres meses, Anthropic anunció la generación anterior de su modelo: «Si miras el ritmo de cambio de la inteligencia, te das cuenta de lo rápido que nos estamos moviendo». «. dijo Gerstenhaber. hablar.
¿Cómo empiezo a crear sitios web o gráficos con Claude 3.5 Sonnet?
Las posibilidades que ofrece la última versión de Anthropic son enormes, pero aquí veremos por dónde empezar. Cada usuario podrá entonces dar rienda suelta a su imaginación y crear su propia creación o adaptar la herramienta a sus necesidades. El primer paso es iniciar sesión en cloud.ai.
Después de registrarse, haga clic en el ícono de perfil en la esquina superior derecha e ingrese «Vista previa de funciones». En la vista previa de funciones encontraremos artefactos. Si queremos podemos activar esta herramienta de prueba girando el interruptor a la posición «On». A partir de ahora podremos utilizar las capacidades avanzadas de los chatbots.
Podríamos pedirle que cree un cangrejo en gráficos vectoriales que representará un edificio simplificado con ventanas que se iluminan cuando pasa el cursor sobre ellas. También podemos cargar imágenes de documentos de Excel a Claude Chat para analizar y crear gráficos interactivos.
Del mismo modo, podemos utilizar esta herramienta para crear un sitio web o un juego sencillo. Haremos todo en lenguaje natural y dividiremos la pantalla para obtener los resultados. Una vez que nuestro proyecto esté listo, podemos usar el botón «Descargar archivo» para guardarlo en nuestra computadora y continuar trabajando.
Claude es un gran paso de avance
Más de un año después de que GPT-4 provocara una avalancha de nuevas inversiones en IA, los próximos grandes avances en inteligencia artificial pueden ser más difíciles de lograr. A medida que GPT-4 y modelos similares se entrenan con grandes cantidades de texto, imágenes y videos en línea, encontrar nuevas fuentes de datos para algoritmos de aprendizaje automático se vuelve cada vez más difícil.
Se espera que ampliar significativamente los modelos para aumentar su capacidad de aprendizaje cueste miles de millones de dólares. Cuando OpenAI anunció su última actualización el mes pasado con el modelo GPT-4o, equipado con capacidades visuales y de voz, se centró más en una interfaz natural y humana que en capacidades de resolución de problemas mucho más inteligentes.
Evaluar el ritmo del progreso de la IA utilizando métricas tradicionales como las promocionadas por Anthropic puede resultar engañoso. Se anima a los desarrolladores de IA a diseñar sus creaciones para lograr un alto rendimiento en estas pruebas, y los datos utilizados en estas pruebas estandarizadas se pueden incluir en los datos de entrenamiento.
«Los puntos de referencia en la comunidad de investigación están contaminados con datos, evaluaciones e informes», dijo Summer Yue, directora de investigación de Scal AI, una compañía que ayuda a muchas empresas de investigación de IA a entrenar modelos consistentes, así como la experiencia no probada de los revisores.
Sonnet Claude 3.5 y Artifacts están disponibles de forma gratuita en Claude Chat pero con limitaciones. Podemos enviar un número determinado de mensajes. Una vez agotado tendremos que esperar unas horas hasta que el sistema nos permite volver a interactuar con él. Además, el modelo básico de IA será más lento que si tuviéramos una suscripción paga de 20 dólares al mes.
Claude 3.5 Sonnet ahora está disponible para todos los usuarios con acceso a Claude y se puede acceder a él en línea o mediante la aplicación iOS. Por supuesto, este no es el único producto nuevo presentado por Anthropic.
Claude no fue el único anuncio
La compañía de IA también anunció Artifacts, una función diseñada para mejorar la experiencia de usuario de Claude 3.5 Sonnet y otras versiones de este modelo. Según Anthropic, un artefacto es una vista previa del proceso de creación de lo que el usuario desea. Por ejemplo, si alguien le pide a Claude 3.5 Sonnet que cree un elemento usando SVG, el modelo mostrará el código en la vista lateral.
Esto crea un espacio de trabajo dinámico donde pueden ver, editar y desarrollar el trabajo de Claude en tiempo real, integrando perfectamente el contenido generado por IA en proyectos y flujos de trabajo de su negocio. Aunque la compañía no ha confirmado nada al respecto, todo apunta a que Claude 3.5 Sonnet, así como la función Artifacts, se podrá utilizar de forma gratuita. Por supuesto, debes activar los artefactos manualmente, a través de la configuración del chatbot.