Por qué ChatGPT dejará de usar la voz que se parece a la de Scarlett Johansson

Scarlett Johansson
Los usuarios de ChatGPT encontraron similitudes entre la voz del chatbot y la de Scarlett Johansson. [Reuters]

El parecido de la nueva voz del chatbot ChatGPT con la de la actriz Scarlett Johansson ha puesto en problemas a la compañía OpenAI.

Usuarios de la plataforma de inteligencia artificial (IA) detectaron que la opción de voz "Sky" del chatbot, que lee las respuestas en voz alta a los usuarios, sonaba muy similar a la de la actriz estadounidense.

Johansson difundió este lunes un comunicado de prensa en el que relató que un equipo legal la asesoró y que envió cartas al director ejecutivo de OpenAI, Sam Altman, y a la compañía para que clarificaran cómo habían creado la voz de "Sky".

Dijo que, como consecuencia de esa acción legal, Open AI "aceptó de mala gana retirar la voz de 'Sky'".

La actriz explicó que recibió en septiembre una oferta de Altman para prestar su voz al sistema de IA, y que la trató de convencer con el argumento de que su voz sería "reconfortante para la gente".

La artista dijo haber rechazado la oferta por motivos personales que no detalló.

"Nueve meses después, mis amigos, familia y el público en general notaron cuánto sonaba como yo el nuevo sistema llamado 'Sky'", afirmó.

Johansson añadió que dos días antes de que la versión 4.0 de ChatGPT saliera a la luz, Altman contactó a su representante y le pidió que reconsiderara la oferta, pero que no esperaron a su respuesta.

La nueva función de voz alta fue parte del lanzamiento de nuevas funciones de la última versión de ChatGPT. "Sky" no solo permite una conversación con el usuario, sino que también ha sido entrenada para sonar más natural e incluso “coquetear”.

Pero durante la presentación, los usuarios de la plataforma comenzaron a hacer comparaciones con la película Her ("Ella") en la que participó Johansson.

En el filme de 2013, ambientado en un futuro cercano, el protagonista Theodore Twombly -interpretado por Joaquin Phoenix- se enamora del sistema operativo de su teléfono, al que pone voz Johansson.

El director Spike Jonze declaró en su momento que la película "no trata de tecnología o software", sino de encontrar el amor y la intimidad.

OpenAI explicó que las voces disponibles en la nueva versión de ChatGPT fueron "cuidadosamente seleccionadas a través de un extenso proceso que duró cinco meses y en el que participaron actores de voz profesionales, agencias de talentos, directores de casting y asesores de la industria".

En una publicación de este lunes, aseguró que la voz "Sky" no pretende ser una "imitación" de la estrella de Hollywood.

"Creemos que las voces de la IA no deben imitar deliberadamente la voz distintiva de una celebridad", afirmó en un blog.

La empresa dijo en un post de X que está "trabajando para poner en pausa" la voz mientras responde a las preguntas sobre cómo se eligió.

Ya en noviembre, Johansson emprendió acciones legales contra una aplicación de inteligencia artificial que utilizó su imagen sin permiso en un anuncio.

Un cartel de la película Her
Her cuenta la historia de un hombre que se enamora de una asistente virtual. [Warner Bros]

Durante la demostración de sus capacidades conversacionales más parecidas a las humanas, el chatbot dio muestra de sus capacidades para sonar "natural".

"Vaya, buen traje el que llevas", le dijo a uno de los presentadores de OpenAI. Luego recibió un halago, y dijo: "Detente, me estás sonrojando".

Además de memes y comentarios, también hubo críticas a la voz.

"Esto da mucha sensación de un personaje femenino hecho por hombres", expresó una usuaria de X. "¿Por qué es tan aduladora y coqueta?", planteó.

En su blog, OpenAI explica que las cinco voces utilizadas por su chatbot proceden de actores de doblaje que ha contratado.

Pero desde que OpenAI mostró su nuevo modelo GPT-4o el 13 de mayo, su jefe, Sam Altman, hizo referencia a la película Her.

La directora de tecnología de OpenAI, Mira Murati
La directora de tecnología de OpenAI, Mira Murati, presentó la nueva versión de ChatGPT. [OPENAI]

Ser multilingüe y tener una voz "amistosa" o "carismática" que "parezca atemporal" fueron algunas de las características que se tuvieron en cuenta para crear las personalidades.

La empresa explicó que habló con cada uno de los actores preseleccionados sobre su visión de las interacciones humanas con la IA, así como sobre las capacidades, límites y riesgos de la tecnología, antes de decidir cuáles serían las voces definitivas.

Las funciones de voz avanzada que se presentaron en la actualización de esta primavera boreal aún no se han puesto a disposición de los usuarios de ChatGPT.

OpenAI afirma que en las próximas semanas las tendrán disponibles los abonados que paguen por respuestas más rápidas y acceso prioritario a las nuevas funciones.