No son concluyentes pruebas para detectar IA en audio que atribuyen a Batres

undefined
undefined

“Tenemos dos semanas para bajar a Omar (Harfuch) por el tema de género”, dice un audio atribuido a Martí Batres, jefe de Gobierno de la Ciudad de México. Aunque él negó ser autor de dichas frases y acusó el uso de Inteligencia Artificial (IA), hay algunos elementos que hacen dudar a especialistas que el audio fue creado con IA. 

En la grabación difundida por redes sociales y medios de comunicación, se dan instrucciones para “seguir creciendo a Clara (Brugada) o no soltar la campaña contra a Omar (Harfuch) en redes”, quienes se encuentran en la recta final del proceso interno que Morena realiza para definir a la persona que buscará la candidatura a la jefatura de gobierno de la capital. 

Los perfiles que irán a la encuesta para competir por la candidatura a la jefatura de Gobierno de la CDMX son: Clara Brugada, exalcaldesa de Iztapalapa, Omar García Harfuch, exsecretario de Seguridad de la CDMX; Hugo López-Gatell, subsecretario de Salud; y Mariana Boy, quien fue procuradora Ambiental y del Ordenamiento Territorial de la Ciudad de México y el diputado federal Miguel Torruco.

El Instituto Nacional Electoral (INE) aprobó el pasado 24 de octubre un acuerdo que obliga a los partidos a postular a mujeres en al menos cinco de las nueve entidades que tendrán elecciones para renovar gubernaturas en 2024, incluida la jefatura de gobierno de la Ciudad de México, lo que beneficiaría a Clara Brugada, quien en la mayoría de las mediciones sobre intención de voto aparece en segundo lugar, detrás de Omar García Harfuch.

 

También te puede interesar: “No tengo favorito”; Sheinbaum intenta zanjar polémica por candidatura en CDMX y pide evitar divisiones internas

 

Especialistas contradicen uso de IA

“Está circulando un audio en el que se pretende atribuirme expresiones relacionadas con el proceso interno de #Morena en la Ciudad de México. Aclaro que es totalmente falso. Nunca he hecho tales afirmaciones. Está producido con inteligencia artificial. No es real”, señaló.

captura de pantalla del tweet de Martí Batres sobre el audio.
Captura de pantalla via X

Ante dichas declaraciones usuarios de redes sociales y el mismo Eduardo Clark, titular de la Dirección General de la Agencia Digital de la CDMX, en la conferencia de prensa del gobierno capitalino, mostraron que es posible falsificar un audio con inteligencia artificial. Sin embargo, analistas destacaron la ausencia de características naturales de la voz, como la respiración.

El doctor Carlos Piña, análista de datos, explicó a El Sabueso que encontró que dicho audio tiene 95% de probabilidad de ser voz natural, de acuerdo con los resultados arrojados por  la herramienta AI Voice Detector. 

Piña destaca que la Inteligencia Artificial no es capaz de replicar ciertas características de la voz natural, como son tonos, expresiones, muletillas y respiraciones, características que están presentes en diferentes momentos del audio, por ejemplo, se escucha una aspiración al terminar de pronunciar la palabra “Clara”. También se escucha una respiración al final de la palabra “género”, y que se queda sin aire al final de la frase “nomás no pegó”. Además se escuchan muletillas como “eh”.

El Sabueso empleó dicha herramienta para revisar el audio de Batres, pero los resultados no fueron concluyentes. Para tener un mejor resultado, el software pide cortar en fragmentos de menos de 7 segundos el archivo; así lo hicimos, y analizamos 5 partes diferentes del audio viral. Sin embargo, el resultado de probabilidad de que el audio haya sido grabado con IA o con voz natural no coincide en ninguno de esos fragmentos. 

Captura de pantalla con el análisis de la herramienta AI Voice Detector
Análisis propio con la herramienta AI Voice Detector.

También consultamos a Rodolfo Cáliz Grijalva, ingeniero en producción musical digital, quién nos dijo que a simple vista se escucha como algo real por algunos detalles y expresiones que en IA no se pueden lograr. Detalles como el “eh, eh” que hace en el segundo 25, donde justamente antes se escucha la respiración que también se detecta en puntos de silencio. Algo que la inteligencia artificial todavía no logra desarrollar.

Cáliz Grijalva también destacó que en el audio se escucha un acento característico de los habitantes de la Ciudad de México, y si el audio fuera generado con IA sonaría monótono. 

¿De dónde salió el audio? 

El registro más antiguo que encontramos del audio fue compartido en Facebook y TikTok el martes 31 de octubre a las 17:40 horas por la cuenta Chilango Noticias Mx. 

El video que subieron a su cuenta de TikTok fue descargado y publicado en X, antes Twitter, por varios usuarios, sin embargo mantiene la marca de agua que indica que proviene de esa cuenta.

Chilango Noticias Mx también difundió un audio atribuido a Clara Brugada, en donde señala que la aspirante a la Jefatura de Gobierno de la Ciudad de México admite no ser la favorita del presidente o que traicionará a Morena. Pero también fue desmentido por ella y su equipo de comunicación. 

La página Chilango Noticias Mx fue creada en Facebook apenas el pasado 5 de octubre y cuenta con 67 seguidores. Pese a que su nombre indica que es un sitio de noticias, en su descripción señala que es un “Sitio web de entretenimiento”. Sin embargo, la página web enlazada a su perfil de Facebook solo tiene tres entradas, la primera dedicada a las personas que podrían aspirar a ocupar la jefatura de gobierno de CDMX; la segunda es sobre una imagen que compartió Claudia Sheinbaum en redes sociales; y la tercera una nota copiada del portal El Sol de México. 

El dominio del sitio web chilangonoticiasmx.com fue registrado en Querétaro precisamente el 5 de octubre de 2023 por Neubox Internet S.A. de C.V., según la herramienta Whois.

Claves para detectar IA

Aunque no es una ciencia exacta, y puede ser difícil distinguir si un audio fue generado por inteligencia artificial. Existen programas de análisis que puedes utilizar en línea, pero también hay detalles en los que puedes fijarte para cuestionar la veracidad del archivo.

Los medios Newtral y Colombia Check, que también pertenecen a la Red Internacional de Fact Checking como El Sabueso, sugieren revisar los siguientes aspectos al encontrarte con un archivo que podría ser desinformación:

  1. Calidad del Audio: si tiene mala calidad o no puedes escuchar claramente lo que la persona dice, esto podría ser una señal de que es falso o fue manipulado.

  2. Naturalidad de la voz: la IA tiene problemas generando detalles naturales como respiraciones en frases largas o entonaciones distintas entre palabras. Como señalaron los expertos previamente, es difícil que repliquen acentos o agreguen muletillas.

  3. Observa las características: puedes buscar una grabación pública de la misma persona, que tengas certeza que es real y comparar detalles como la duración de sus vocales o la fuerza con la que pronuncian las consonantes como la letra “D.”

Cuando dudes de la veracidad de un archivo, Colombia Check también recomienda que te plantees las siguientes preguntas:

  1. ¿Lo que la persona dice va acorde con lo que sabes de ella?

  2. ¿A quién le conviene este audio?

  3. ¿Por qué me llega este audio?

  4. ¿Esto lo tendrá algún medio? 

  5. ¿Lo habrá verificado alguien?