ChatGPT inició un nuevo tipo de «carrera de IA»

marzo 30, 2023
ChatGPT
Es evidente que nadie predijo el éxito de ChatGPT, ni siquiera OpenAI. Cuando se lanzó en noviembre como una «vista previa de investigación», nadie esperaba que se convirtiera en una de las aplicaciones de consumo de más rápido crecimiento en la historia. Antes de que la frase «transformadores generativos preentrenados» se convirtiera en algo común, y antes de que muchas empresas compitieran por adoptar su modelo subyacente, ChatGPT fue presentado como un modelo hermano de InstructGPT, entrenado para seguir instrucciones y brindar respuestas detalladas. La publicación del blog que anunciaba ChatGPT ahora es un estudio de caso irónico sobre la subestimación del potencial de una tecnología. En lugar de resaltar su impacto en nuestras interacciones con la tecnología, la publicación simplemente anunciaba la vista previa de investigación y pedía comentarios de los usuarios sobre sus fortalezas y debilidades.
Pero ahora, apenas cuatro meses después, parece que ChatGPT realmente va a cambiar la forma en que pensamos sobre la tecnología. O, tal vez más exactamente, cambiarlo de nuevo. Porque por el camino que vamos, el futuro de la tecnología no son las interfaces whiz-bang o el metaverso. Es «escribir comandos en un cuadro de texto en su computadora». La línea de comandos está de vuelta, ahora es mucho más inteligente.
Dos caminos simultáneos
La IA generativa se dirige actualmente en dos direcciones simultáneas. El primero es mucho más infraestructural, agregando nuevas herramientas y capacidades a las cosas que ya usa. Los modelos de lenguaje grande como GPT-4 y LaMDA de Google lo ayudarán a escribir correos electrónicos y notas; van a arreglar automáticamente sus diapositivas y corregir cualquier error en sus hojas de cálculo; van a editar tus fotos mejor que tú; Te ayudarán a escribir código y, en muchos casos, simplemente lo harán por ti.
Durante años, la integración de la IA en productos corporativos ha sido una práctica común. Google ha implementado diversos modelos de IA en sus productos y empresas como Salesforce han desarrollado proyectos de investigación sólidos. Sin embargo, estos modelos son costosos de crear, entrenar y consultar, lo que potencialmente puede cambiar la forma en que se maneja la productividad en las empresas. Las mejoras en IA en productos existentes son un negocio rentable que seguirá creciendo en el futuro.
Por otro lado, el desarrollo de la IA para el consumo masivo fue un camino menos obvio. Ahora, la idea de hablar con un robot que sabe todo sobre películas, recetas y lugares turísticos es atractiva, y si se lo provoca lo suficiente, incluso podría tratar de besarte. Sin embargo, antes del surgimiento de ChatGPT y de que Bing y Bard intentaran construir sus propios productos de IA, nadie hubiera imaginado que escribir en una ventana de chat sería la próxima gran interfaz de usuario.
Una vuelta a una idea anterior
En cierta medida, esto representa un regreso a una idea antigua. Durante muchos años, la mayoría de los usuarios solo interactuaban con las computadoras escribiendo comandos en una pantalla en blanco: la línea de comandos era la forma en que se comunicaban con la máquina. (Sí, ChatGPT es una gran cantidad de máquinas y no están físicamente en su escritorio, pero la idea es la misma).
Sin embargo, luego ocurrió algo interesante: se mejoraron las interfaces. El problema con la línea de comandos era que necesitaba saber exactamente qué escribir y en qué orden para que la computadora hiciera lo que quería. Hacer clic en iconos grandes con un mouse era mucho más fácil, y la gente podía aprender más fácilmente lo que la computadora podía hacer a través de imágenes e iconos. La línea de comandos fue reemplazada por la interfaz gráfica de usuario (GUI), y la GUI sigue siendo la interfaz de usuario dominante.
A pesar de esto, los desarrolladores nunca dejaron de intentar hacer que la interfaz de chat funcionara. WhatsApp es un buen ejemplo: la empresa ha pasado años tratando de descubrir cómo los usuarios pueden usar el chat para interactuar con las empresas. Allo, una de las muchas aplicaciones de mensajería fallidas de Google, esperaba que pudieras interactuar con un asistente de IA dentro de los chats con tus amigos. En torno a 2016, muchos pensaban que las aplicaciones de mensajería eran el futuro de todo.
Hay algo atractivo en la interfaz de mensajería, la «IA conversacional». Comienza con el hecho de que todos sabemos cómo usarlo; Las aplicaciones de mensajería son la forma en que nos mantenemos en contacto con las personas que más nos importan, lo que significa que son un lugar donde gastamos mucho tiempo y energía. En un mercado donde las personas no quieren descargar aplicaciones y los sitios web móviles en su mayoría todavía son poco atractivos, la mensajería puede simplificar las experiencias en gran medida.
Además, aunque la mensajería no es la interfaz más avanzada, podría ser la más expandible. Tomemos Slack, por ejemplo: probablemente pienses en ella como una aplicación de chat, pero en esa interfaz de ida y vuelta, puedes incrustar enlaces, documentos editables, encuestas interactivas, bots informativos y mucho más. WeChat es famosa por ser una plataforma completa, básicamente una Internet completa, convertida en una aplicación de mensajería. Puedes comenzar con mensajes e ir a muchos lugares.
Muchas de estas herramientas cojean de la misma pata. Para realizar intercambios rápidos de información, como el horario comercial, el chat es perfecto: se hace un pregunta de este tipo, y la respuesta es concreta y directa. Cuando se trata de ChatGPT, Bard, Bing y el resto de estas tecnologías, tienden a complicarse muy rápido. Estos modelos son inteligentes y colaborativos, pero aún debe saber exactamente qué pedir, de qué manera y en qué orden obtener lo que desea. La idea de un «ingeniero rápido», la persona a la que le pagas para saber exactamente cómo obtener la imagen perfecta de Stable Diffusion o hacer que ChatGPT genere el Javascript correcto, parece ridícula, pero en realidad es una parte completamente necesaria de la ecuación. No es diferente a la era temprana de la computadora, cuando solo unas pocas personas sabían cómo decirle a la computadora qué hacer. Ya hay mercados en los que puedes comprar y vender indicaciones realmente geniales; hay gurús rápidos y libros sobre indicaciones; Supongo que Stanford ya está trabajando en una especialización en Ingeniería Rápida que todos tomarán pronto.