TECNOLOGÍA, INTERNET, JUEGOS

OpenAI: ChatGPT comprende tus preguntas de nuevas maneras

OpenAI: ChatGPT comprende tus preguntas de nuevas maneras

By ypaolavc

ChatGPT está evolucionando hacia mucho más que un motor de búsqueda basado en texto, ya que, OpenAI anunció que está agregando nueva inteligencia basada en voz e imagen a la mezcla. De esta forma, ChatGPT comprende tus preguntas de nuevas maneras, veamos de qué se trata.

OpenAI le da a ChatGPT voz para conversaciones verbales

El popular asistente de IA (Inteligencia Artificial) generativa ha sido una de las mayores historias de éxito tecnológico de los últimos tiempos desde su debut. Ya sabes, te permite generar ensayos, poemas y resúmenes a partir de simples indicaciones basadas en texto. Pero ahora, ChatGPT está a punto de volverse mucho más interactivo y podrás tener una conversación de voz con el chatbot.

Entonces, la mayoría de los cambios de OpenAI a ChatGPT involucran lo que el robot impulsado por IA puede hacer: preguntas que puede responder, información a la que puede acceder y modelos subyacentes mejorados. Pero esta vez, sin embargo, se trata de modificar la forma en que usas ChatGPT.

Así que, la compañía está lanzando una nueva versión del servicio que le permite avisar al robot de IA no solo escribiendo oraciones en un cuadro de texto, sino hablando en voz alta o simplemente cargando una imagen. Y, según OpenAI, las nuevas funciones se implementarán para quienes paguen por ChatGPT en las próximas dos semanas y todos los demás las obtendrán «poco después”.

Ahora, la parte del chat de voz es bastante familiar: tocas un botón y dices tu pregunta, ChatGPT la convierte en texto y la envía al modelo de lenguaje grande, obtiene una respuesta, la convierte nuevamente en voz y dice la respuesta en voz alta.

Más detalles…

Por su parte, el excelente modelo Whisper de OpenAI hace gran parte del trabajo de conversión de voz a texto. Incluso, la compañía está lanzando un nuevo modelo de conversión de texto a voz que, según afirma, puede generar “audio similar al humano a partir de solo texto y unos segundos de muestra de voz”. Sin olvidar que podrás elegir la voz de ChatGPT entre cinco opciones.

Por otro lado, OpenAI está trabajando con Spotify para traducir podcasts a otros idiomas, por ejemplo, conservando al mismo tiempo el sonido de la voz del podcaster. Como vez, hay muchos usos interesantes para las voces sintéticas y OpenAI podría ser una parte importante de esa industria.

Respecto a la búsqueda de imágenes, es un poco como Google Lens. Tomas una foto de lo que sea que te interese y ChatGPT intentará descubrir qué estás preguntando y responder en consecuencia. También puedes utilizar la herramienta de dibujo de la aplicación para aclarar tu consulta o hablar o escribir preguntas que acompañen a la imagen.

Finalmente, es de considerar que, a medida que más personas utilicen el control por voz y la búsqueda de imágenes; y que ChatGPT se acerque cada vez más a ser un asistente virtual útil y verdaderamente multimodal, será cada vez más difícil mantener las barreras.

¡Un punto importante a considerar!