Anthropic presenta su modelo de inteligencia artificial más avanzado: Claude 3.5 Sonnet

junio 25, 2024

By auroraoddi

Mientras el mundo de la inteligencia artificial generativa sigue evolucionando rápidamente, una de las empresas líderes en este campo, Anthropic, acaba de lanzar su último modelo insignia, Claude 3.5 Sonnet. Este nuevo modelo pretende superar a sus predecesores y desafiar a grandes competidores como OpenAI y su modelo GPT-4o. Pero, ¿es realmente un paso adelante tan significativo como afirma Anthropic? Echemos un vistazo más de cerca a las características e implicaciones de este nuevo modelo de IA.

Impresionante rendimiento en pruebas comparativas

Según Anthropic, el Claude 3.5 Sonnet ofrece un rendimiento en pruebas comparativas significativamente mejor que los modelos anteriores de la serie Claude. A través de una serie de pruebas sobre tareas de lectura, codificación, matemáticas y visión, el nuevo modelo demostró superar no sólo a su predecesor, el Claude 3 Sonnet, sino también al anterior modelo insignia de la empresa, el Claude 3 Opus. Aunque los puntos de referencia no son necesariamente la mejor vara de medir el progreso de la IA, estos resultados son, no obstante, dignos de mención e indican una mejora tangible en las capacidades del modelo.

Mejoras clave

Además de los resultados de los puntos de referencia, Claude 3.5 Sonnet presenta algunas mejoras clave con respecto a las versiones anteriores. En particular, el modelo tiene una mayor comprensión de las instrucciones más sutiles y complejas, así como de conceptos como el humor, algo que es notoriamente difícil de dominar para la IA. Además, el modelo es significativamente más rápido, aproximadamente el doble que Claude 3 Opus, lo que lo hace más adecuado para aplicaciones que requieren respuestas rápidas, como los chatbots para atención al cliente.

Mejoras en la visión artificial

Otra área de mejora significativa de Claude 3.5 Sonnet es la capacidad de análisis de imágenes. El nuevo modelo puede interpretar con mayor precisión gráficos y diagramas, así como transcribir texto de imágenes «imperfectas», como las que presentan distorsiones y artefactos visuales. Esto representa un gran avance con respecto a las capacidades de visión por ordenador del Claude 3 Opus.

Secretos sobre la formación de modelos

Aunque Anthropic no reveló en detalle los datos de entrenamiento utilizados para Claude 3.5 Sonnet, el jefe de producto Michael Gerstenhaber declaró que el modelo extrae gran parte de su fuerza de estos conjuntos de datos, que también incluyen datos generados por la propia IA. Esta elección podría estar motivada por razones competitivas, pero también para evitar posibles desafíos legales relacionados con el uso de datos protegidos por derechos de autor.

Alineación con las intenciones del usuario

Además de los datos de entrenamiento, Anthropic también trabajó para alinear el Soneto Claude 3.5 con las intenciones del usuario, con la esperanza de evitar la generación de textos tóxicos o problemáticos. Este esfuerzo de «alineación» es un aspecto importante del desarrollo de modelos de IA seguros y fiables.

Contexto y disponibilidad

El modelo de soneto Claude 3.5 mantiene el mismo contexto de 200.000 tokens (aproximadamente 150.000 palabras) que sus predecesores. Actualmente, el nuevo modelo está disponible de forma gratuita para los usuarios del cliente web Anthropic y de la aplicación Claude para iOS, mientras que los suscriptores de los planes de pago Claude Pro y Claude Team disponen de límites de velocidad más elevados. Claude 3.5 Sonnet también está disponible a través de la API de Anthropic y en plataformas gestionadas como Amazon Bedrock y Vertex AI de Google Cloud.

Artefactos: una nueva interfaz para interactuar con el modelo

Junto con el lanzamiento de Claude 3.5 Sonnet, Anthropic introdujo una nueva función llamada Artifacts. Esta interfaz dedicada permite a los usuarios editar y añadir contenidos generados por los modelos de Anthropic, como fragmentos de código, documentos de texto o diseños de páginas web. Artifacts ofrece a los desarrolladores una herramienta para iterar y refinar los contenidos generados por la IA.

Progreso incremental y no revolucionario

Aunque el Soneto Claude 3.5 representa una mejora con respecto a los modelos anteriores, Gerstenhaber reconoce que se trata de un progreso incremental y no de un avance revolucionario. Esto refleja la tendencia actual en el campo de la IA generativa, donde grandes actores como Google y OpenAI han lanzado actualizaciones marginales de sus modelos insignia en los últimos meses.

Retos en la arquitectura y el entrenamiento de modelos

Según Gerstenhaber, la falta de saltos de rendimiento comparables al de GPT-3 a GPT-4 se debe a la rigidez de las arquitecturas de modelos actuales y a la enorme cantidad de cálculo necesaria para entrenarlos. Estas limitaciones técnicas parecen estar frenando avances más radicales en la IA generativa.

Prioridad a la eficacia y la accesibilidad

En lugar de centrarse únicamente en modelos cada vez más potentes, Anthropic parece haber adoptado un enfoque más estratégico, invirtiendo en el desarrollo de productos como Claude 3.5 Sonnet para ofrecer un rendimiento ligeramente superior a precios asequibles. Esta elección refleja la importancia de proporcionar a desarrolladores y empresas herramientas de IA eficaces y asequibles, independientemente de las especificaciones técnicas.

Fuente del artículo aquí.