Google está cambiando el nombre de Bard a Gemini y planea lanzar una aplicación dedicada

febrero 21, 2024
¿Qué es Bard?
Bard es un proyecto interno de Google que busca desarrollar un asistente de voz más avanzado y sofisticado. El objetivo principal de Bard es permitir interacciones más naturales y conversacionales entre los usuarios y la tecnología. Este asistente de voz estaría equipado con capacidades mejoradas de comprensión del lenguaje natural y contextual, lo que le permitiría comprender mejor las preguntas complejas y brindar respuestas más precisas y útiles. En resumen, Bard representa un esfuerzo de Google por llevar la inteligencia artificial a un nivel superior en el campo de la interacción humano-máquina. Actualmente, Google está cambiando el nombre de Bard a Gemini. Veamos el por qué de este cambio y sus implicaciones.
Google está cambiando el nombre de Bard a Gemini
Un documento filtrado revela que Google tiene planes de realizar cambios significativos en su herramienta de IA, Bard, que podrían implementarse la próxima semana. Entre estos cambios se encuentra la modificación del nombre de Bard a Gemini, lo cual parece lógico considerando que Google ha lanzado recientemente su modelo de IA multimodal, también llamado Gemini. Además, se espera que el nivel de pago avanzado de Gemini esté disponible pronto, según un registro de cambios compartido por el desarrollador Dylan Roussel el 7 de febrero. También se menciona que una aplicación Gemini para Android será lanzada en un futuro cercano.
El documento indica que Gemini Advanced ofrecerá a los usuarios acceso al modelo Ultra 1.0 de Gemini, el cual es especialmente competente en tareas altamente complejas como la codificación, el razonamiento lógico, el seguimiento de instrucciones matizadas y la colaboración creativa. Esta versión estará disponible en más de 150 países y estará optimizada para el idioma inglés desde su lanzamiento inicial. Además, según el registro de cambios, Gemini se expandirá a Canadá con esta nueva versión.
Gemini 1.5 Pro
El jueves, Google lanzó Gemini 1.5 Pro, destacando un «rendimiento dramáticamente mejorado» en comparación con su predecesor. Esta evolución de la IA sigue a la presentación reciente de Gemini 1.0 Ultra, señalando la importancia creciente de la tecnología para el futuro de la empresa. El cambio de marca del chatbot Bard a Gemini refleja las capacidades más potentes del nuevo modelo.
Sundar Pichai y Demis Hassabis, en una publicación de blog, subrayaron el compromiso de Google con la seguridad ética en el desarrollo de la IA, mientras destacaban las mejoras en el rendimiento de sus modelos. Este enfoque busca abordar las preocupaciones de los escépticos y los reguladores, al tiempo que atrae a desarrolladores, clientes y inversores preocupados por la competitividad de Google en el mercado de la IA tras el éxito de OpenAI con ChatGPT.
Pichai y Hassabis afirman que Gemini 1.5 Pro ofrece resultados similares a Gemini 1.0 Ultra, pero con una eficiencia computacional mejorada, lo que significa que requiere menos recursos. Estas capacidades multimodales abarcan desde procesamiento de texto hasta imágenes, videos, audio y código. A medida que los modelos de IA continúen avanzando, se espera que ofrezcan una gama aún más amplia de habilidades dentro de un solo marco, como lo demostró recientemente OpenAI al integrar la generación de imágenes DALL-E 3 en ChatGPT.
Mejora de tokens
Gemini 1.5 Pro tiene la capacidad de manejar hasta un millón de tokens, que son las unidades de datos que los modelos de IA pueden procesar en una sola solicitud. Google afirma que puede procesar más de 700,000 palabras, una hora de video, 11 horas de audio y bases de código con más de 30,000 líneas. Incluso han probado una versión que admite hasta 10 millones de tokens. Este modelo mantiene una alta precisión en consultas con recuentos de tokens más grandes, impresionando en evaluaciones como Needle In a Haystack. Además, puede razonar sobre transcripciones de la misión lunar Apolo 11 y analizar películas mudas. Gemini 1.5 Pro se lanza con capacidades de 128,000 tokens, pero Google planea introducir nuevos niveles de precios que admitan consultas de hasta un millón de tokens.
Gemini 1.5 Pro es hábil en el aprendizaje contextual, absorbiendo información de indicaciones extensas sin necesidad de ajustes adicionales. En un caso de prueba llamado Traducción automática de un libro, el modelo dominó un manual de gramática para el kalamang, un idioma poco común sin entrenamiento previo, logrando resultados comparables a los de un humano. Para los desarrolladores, puede abordar problemas en bloques de código más extensos y proporcionar sugerencias y explicaciones detalladas. En términos de ética y seguridad, Google sigue un enfoque similar al de Gemini 1.0, con pruebas éticas y de seguridad rigurosas para garantizar su implementación responsable. Gemini 1.5 se lanza en acceso anticipado para desarrolladores y empresas, con planes de una disponibilidad más amplia en el futuro. Gemini 1.0 ya está disponible para consumidores, con una opción Pro por $20 al mes.