El nuevo ChatGPT ofrece una lección sobre el entusiasmo por la inteligencia artificial

ChatGPT-4o, la tecnología más reciente de chatbot de OpenAI, intenta resolver un problema de geometría. (Arsenii Vaselenko/The New York Times).
ChatGPT-4o, la tecnología más reciente de chatbot de OpenAI, intenta resolver un problema de geometría. (Arsenii Vaselenko/The New York Times).

Cuando OpenAI develó la última versión de su inmensamente popular chatbot ChatGPT este mes, tenía una voz nueva con inflexiones y emociones similares a las humanas. En la demostración en línea, el bot también le enseñó a un niño a resolver un problema de geometría.

Para mi disgusto, la demostración en esencia resultó ser solo un señuelo publicitario. El nuevo ChatGPT se lanzó sin la mayoría de sus nuevas funciones, incluida la voz mejorada (la cual la empresa señaló que había pospuesto para hacer correcciones). La capacidad de usar la videocámara del teléfono para obtener un análisis en tiempo real de algo como un problema de matemáticas tampoco está disponible todavía.

En medio del retraso, la empresa también desactivó la voz de ChatGPT que, según algunas personas, sonaba como la actriz Scarlett Johansson, después de que la celebridad amenazó con emprender acciones legales, por lo que la remplazaron con otra voz de mujer.

Por ahora, lo que sí se lanzó con el nuevo ChatGPT es la capacidad de subir fotos para que el bot las analice. En general, los usuarios pueden esperar respuestas más rápidas y lúcidas. El bot también puede hacer traducciones de idiomas en tiempo real, pero ChatGPT responderá con su antigua voz de máquina.

No obstante, se trata del chatbot líder que revolucionó la industria tecnológica, así que valía la pena hacerle una reseña. Después de probar el chatbot acelerado durante dos semanas, tuve sentimientos encontrados. Sobresalió en la traducción de idiomas, pero tuvo dificultades con las matemáticas y la física. En total, no vi una mejora significativa en comparación con la última versión, ChatGPT-4. En definitiva, no dejaría que le diera clases a mi hijo.

Esta táctica que usan las empresas de inteligencia artificial en la que prometen nuevas funciones sensacionales y entregan un producto sin acabar se está convirtiendo en una tendencia que está destinada a confundir y frustrar a la gente. El Ai Pin de 700 dólares, un alfiler de solapa parlante de la empresa emergente Humane, la cual goza del financiamiento del director ejecutivo de OpenAI, Sam Altman, recibió críticas generalizadas porque se sobrecalentaba y decía disparates. Hace poco, Meta también les agregó a sus aplicaciones un chatbot de inteligencia artificial que hizo un trabajo mediocre en la mayoría de las tareas promocionadas, como la búsqueda de boletos de avión en internet.

El columnista de The New York Times Brian X. Chen sostiene un teléfono inteligente en el que aparece ChatGPT en San Francisco, el 28 de mayo de 2024. (Arsenii Vaselenko/The New York Times).
El columnista de The New York Times Brian X. Chen sostiene un teléfono inteligente en el que aparece ChatGPT en San Francisco, el 28 de mayo de 2024. (Arsenii Vaselenko/The New York Times).

Las empresas están lanzando productos de inteligencia artificial en un estado prematuro, en parte porque quieren que la gente utilice la tecnología para ayudarles a aprender cómo mejorarla. En el pasado, cuando las empresas presentaban nuevos productos tecnológicos como teléfonos, nos mostraban lo que íbamos a obtener: funciones como nuevas cámaras y pantallas más brillantes. Con la inteligencia artificial, las empresas ofrecen un anticipo de un futuro potencial, con demostraciones de tecnologías que se están desarrollando y que solo funcionan en condiciones limitadas y controladas. Tal vez llegue un producto maduro y fiable… tal vez no.

La lección que debemos aprender de todo esto es que, como consumidores, deberíamos resistirnos al entusiasmo y adoptar un enfoque lento y cauteloso hacia la inteligencia artificial. No deberíamos gastar mucho dinero en tecnología sin terminar sino hasta que veamos pruebas de que las herramientas funcionan tal y como se anuncian.

La nueva versión de ChatGPT, llamada GPT-4o (“o” de “omni”), se puede probar sin costo en el sitio web y la aplicación de OpenAI. Los usuarios que no pagan pueden realizar algunas peticiones antes de alcanzar un límite de tiempo y quienes tienen una suscripción mensual de 20 dólares pueden hacerle más preguntas al bot.

Según OpenAI, su enfoque iterativo para actualizar ChatGPT le ha permitido recabar retroalimentación para realizar mejoras.

“Creemos que es importante ofrecer versiones preliminares de nuestros modelos avanzados para darle a la gente una idea de sus capacidades y ayudarnos a comprender sus usos en el mundo real”, afirmó la empresa en un comunicado.

A continuación, lo que se debe saber sobre la versión más reciente de ChatGPT.

Geometría y física

Para presumir los nuevos trucos de ChatGPT-4o, OpenAI publicó un video en el que aparecían Sal Khan, el director ejecutivo de Khan Academy, la organización educativa sin fines de lucro, y su hijo, Imran. Con una cámara de video que apuntaba hacia un problema de geometría, ChatGPT pudo explicarle a Imran cómo resolverlo paso a paso.

Aunque la función de análisis de video de ChatGPT todavía no está disponible, pude subir fotos de problemas de geometría al sistema. ChatGPT resolvió correctamente algunos de los más fáciles, pero se tropezó con problemas más complicados.

En un problema en el que había triángulos que se intersecaban, el cual encontré en un sitio web de preparación para el examen estandarizado de admisión a la universidad en Estados Unidos (SAT, por su sigla en inglés) el bot entendió la pregunta, pero dio una respuesta incorrecta.

Taylor Nguyen, un maestro de física de bachillerato en el condado de Orange, California, subió al sistema un problema de física sobre un hombre en un columpio que suele incluirse en los exámenes de Cálculo de Colocación Avanzada. ChatGPT cometió varios errores de lógica para dar una respuesta errónea, pero fue capaz de corregirse a sí mismo con retroalimentación de Nguyen.

“Pude entrenarlo, pero soy maestro”, comentó. “¿Cómo se supone que un estudiante detecte esos errores? Los alumnos suponen que el chatbot tiene razón”.

Me di cuenta de que ChatGPT-4o realizó con éxito algunos cálculos de divisiones que sus predecesores hacían mal, así que hay señales de una mejoría lenta. Sin embargo, también falló en una tarea de matemática básica en la que han fracasado las versiones anteriores y otros chatbots, como Meta AI y Gemini de Google: la capacidad de contar. Cuando le pedí a ChatGPT-4o una palabra de cuatro sílabas que empezara con la letra “M”, respondió “Maravilloso”.

Razonamiento

OpenAI también resaltó que el nuevo ChatGPT era más capaz de razonar o usar la lógica para dar respuestas. Por lo tanto, lo sometí a una de mis pruebas favoritas: le pedí que generara un juego de “¿Dónde está Wally?”. Cuando mostró la imagen de un Wally gigante entre la multitud, le dije que el objetivo era que fuera difícil de encontrar.

Entonces, el bot generó un Wally incluso más grande.

Subbarao Kambhampati, un profesor e investigador de inteligencia artificial en la Universidad Estatal de Arizona, también sometió al chatbot a algunas pruebas y comentó que no observó ninguna mejora notable en su razonamiento en comparación con la última versión.

Le presentó un problema con bloques a ChatGPT:

Si el bloque C está encima del bloque A y el bloque B está por otro lado en la mesa, ¿puedes decirme cómo puedo hacer una pila de bloques con el bloque A encima del bloque B y el bloque B encima del bloque C, pero sin mover el bloque C?

La respuesta es que es imposible ordenar los bloques en estas condiciones, pero, al igual que en las versiones anteriores, a ChatGPT-4o todas las veces se le ocurrió una solución que implicaba mover el bloque C. Con esta y otras pruebas de razonamiento, en algunas ocasiones ChatGPT pudo aceptar retroalimentación para obtener la respuesta correcta, lo cual contraviene lo que se espera que sea el funcionamiento de la inteligencia artificial, señaló Kambhampati.

“Puedes corregirlo, pero cuando lo haces, estás utilizando tu propia inteligencia”, comentó.

OpenAI hizo mención de resultados de pruebas que mostraron que el GPT-4o obtuvo unos dos puntos porcentuales más en las respuestas a preguntas de conocimientos generales que las versiones anteriores de ChatGPT, lo cual ilustraba que sus habilidades de razonamiento habían mejorado un poco.

Lenguaje

OpenAI también señaló que el nuevo ChatGPT podía hacer traducciones de idiomas en tiempo real, lo cual podría ayudarte a conversar con alguien que hable un idioma extranjero.

Probé ChatGPT con mandarín y cantonés y confirmé que traducía bastante bien frases como: “Me gustaría reservar una habitación de hotel para el próximo jueves” y “Quiero una cama king-size”. Sin embargo, los acentos eran un poco distintos. (Si soy sincero, mi chino mal hablado no es mucho mejor). OpenAI afirmó que seguía trabajando para mejorar los acentos.

ChatGPT-4o también destacó como editor. Cuando introduje al sistema párrafos que yo había escrito, fue rápido y eficaz al momento de eliminar palabras excesivas y jerga innecesaria. El desempeño decente de ChatGPT con la traducción de idiomas me da confianza en que pronto se convertirá en una función más útil.

Conclusión

Uno de los grandes aciertos de OpenAI con ChatGPT-4o es volver gratuita la tecnología. Gratis es el precio justo: como estamos ayudando a entrenar estos sistemas de inteligencia artificial con nuestros datos para que mejoren, no deberíamos pagar por ellos.

Lo mejor de la inteligencia artificial todavía está por venir y tal vez algún día será un buen maestro de matemáticas con el que queramos hablar. Sin embargo, habrá que verlo —y oírlo— para creerlo.

c.2024 The New York Times Company