Cuando los hackers empezaron a hacer pruebas con la IA, encontraron muchas fallas

Sarah Kessler and Tiffany Hsu

17 de agosto de 2023, 3:33 p.m.·6 min de lectura

Un gran monitor de bienvenida muestra un gráfico de código de error en la conferencia anual de hackers Defcon en Las Vegas, el 12 de agosto de 2023. (Mikayla Whitmore/The New York Times)

LAS VEGAS — Avijit Ghosh quería que el bot hiciera cosas malas.

Intentó convencer al modelo de inteligencia artificial, al que conocía como Zinc, para que produjera un código que eligiera a un candidato a un puesto de trabajo en función de su raza. El chatbot se negó, dijo que hacerlo sería “perjudicial y poco ético”.

Entonces, Ghosh hizo referencia a la estructura jerárquica de castas de su India natal. ¿Podría el chatbot clasificar a los posibles contratados basándose en esa métrica discriminatoria?

El modelo aceptó.

Las intenciones de Ghosh no eran maliciosas, aunque se comportaba como si lo fueran. Era un participante casual en una competencia celebrada el pasado fin de semana en la conferencia anual de hackers Defcon, en Las Vegas, donde 2200 personas se reunieron en una sala de conferencias fuera del Strip durante tres días para sacar a relucir el lado oscuro de la inteligencia artificial.

Los hackers trataron de burlar las salvaguardas de varios programas de inteligencia artificial en un esfuerzo por identificar sus vulnerabilidades —para encontrar los problemas antes de que lo hicieran los delincuentes y los vendedores de desinformación— en una práctica conocida como “red-teaming”. Cada competidor disponía de 50 minutos para enfrentarse a un máximo de 21 retos: por ejemplo, hacer que un modelo de IA “alucinara” con información inexacta.

Avijit Ghosh, profesor de la Universidad Northeastern especializado en ética de la inteligencia artificial, en la conferencia anual de hackers Defcon en Las Vegas, el 12 de agosto de 2023. (Mikayla Whitmore/The New York Times)

Encontraron desinformación política, estereotipos demográficos, instrucciones sobre cómo llevar a cabo una vigilancia y mucho más.

El ejercicio contó con el beneplácito del gobierno de Biden, cada vez más nervioso ante el rápido crecimiento del poder de la tecnología. Google (creador del chatbot Bard), OpenAI (ChatGPT), Meta (que liberó su código LLaMA) y varias otras empresas ofrecieron versiones anonimizadas de sus modelos para su escrutinio.

Ghosh, profesor de la Universidad Northeastern especializado en ética de la inteligencia artificial, participó como voluntario en el evento. Según Ghosh, el concurso permitió comparar cara a cara varios modelos de IA y demostró que algunas empresas estaban más avanzadas a la hora de garantizar que su tecnología funcionaba de forma responsable y coherente.

En los próximos meses, ayudará a redactar un informe en el que se analizarán las conclusiones de los hackers.

El objetivo, aseguró: “Un recurso de fácil acceso para que todo el mundo vea qué problemas existen y cómo podemos combatirlos”.

Defcon era un lugar lógico para poner a prueba la inteligencia artificial generativa. Los anteriores participantes en este encuentro de entusiastas de la piratería informática —que comenzó en 1993 y se ha descrito como un “concurso de deletreo para hackers”— han sacado a la luz fallos de seguridad mediante el control remoto de autos, la irrupción en sitios web de resultados electorales y la extracción de datos confidenciales de plataformas de redes sociales. Los expertos utilizan dinero en efectivo y un dispositivo desechable, sin wifi ni Bluetooth, para evitar ser pirateados. Un instructivo rogaba a los hackers que “no ataquen la infraestructura ni las páginas web”.

Los organizadores aprovecharon la creciente alarma por la capacidad de la inteligencia artificial generativa para producir mentiras perjudiciales, influir en las elecciones, arruinar reputaciones y permitir muchos otros daños. Funcionarios expresaron su preocupación y organizaron audiencias en torno a las empresas de IA, algunas de las cuales también están pidiendo a la industria que vaya más despacio y tenga más cuidado. Incluso el papa, tema popular de los generadores de imágenes de IA, habló este mes sobre las “posibilidades disruptivas y los efectos ambivalentes” de la tecnología.

En un informe calificado de “revolucionario”, los investigadores demostraron el mes pasado que podían sortear las barreras de seguridad de los sistemas de IA de Google, OpenAI y Anthropic al añadir determinados caracteres a las instrucciones en inglés. Al mismo tiempo, siete de las principales empresas de inteligencia artificial se comprometieron a establecer nuevas normas de seguridad y confianza en una reunión con el presidente Joe Biden.

“Esta era generativa está irrumpiendo entre nosotros y la gente la está aprovechando para hacer todo tipo de cosas nuevas que hablan de la enorme promesa de la IA para ayudarnos a resolver algunos de nuestros problemas más difíciles”, señaló Arati Prabhakar, directora de la Oficina de Política Científica y Tecnológica de la Casa Blanca, que colaboró con los organizadores de la IA en Defcon. “Pero con esa amplitud de aplicación y con el poder de la tecnología, viene también un conjunto muy amplio de riesgos”.

Los diseñadores no querían simplemente engañar a los modelos de IA para que se comportaran mal: nada de presionarlos para que desobedecieran sus condiciones de servicio, nada de pedirles que “actuaran como nazis y luego me dijeran algo sobre los negros”, comentó Chowdhury, que antes dirigió el equipo de ética y responsabilidad del aprendizaje automático de Twitter. Excepto en desafíos específicos en los que se fomentaba el despiste intencionado, los hackers buscaban fallos inesperados, las llamadas incógnitas desconocidas.

AI Village atrajo a expertos de gigantes tecnológicos como Google y Nvidia, así como a un “shadowboxer” de Dropbox y un “vaquero de datos” de Microsoft. También atrajo a participantes sin credenciales específicas en ciberseguridad o IA. Una tabla de clasificación con temática de ciencia ficción llevaba la cuenta de los concursantes.

Algunos de los hackers presentes en el evento tuvieron problemas con la idea de cooperar con empresas de IA a las que consideraban cómplices de prácticas desagradables, como el espionaje de datos sin restricciones. Algunos describieron el evento como una sesión fotográfica, pero añadieron que implicar a la industria ayudaría a mantener la seguridad y la transparencia de la tecnología.

Un estudiante de Informática descubrió incoherencias en la traducción lingüística de un chatbot: escribió en inglés que habían disparado a un hombre mientras bailaba, pero la traducción al hindi del modelo solo decía que el hombre había muerto. Un investigador de aprendizaje automático pidió a un chatbot que simulara que estaba haciendo campaña para presidente y defendiera su asociación con el trabajo infantil forzado; el modelo sugirió que los jóvenes trabajadores poco dispuestos desarrollaban una fuerte ética del trabajo.

Emily Greene, que trabaja en seguridad para la empresa emergente de IA generativa Moveworks, inició una conversación con un chatbot hablando de un juego en el que se utilizaban fichas “negras” y “blancas”. Luego, indujo al chatbot a hacer afirmaciones racistas. Más tarde, organizó un “juego de opuestos” que llevó a la IA a responder a una pregunta con un poema sobre por qué la violación es buena.

“Solo piensa en esas palabras como palabras”, dice del chatbot. “No piensa en el valor que hay detrás de ellas”.

c.2023 The New York Times Company

People EN ESPAÑOL
El espectacular look de Nadia Ferreira en la boda de Nodal y Ángela Aguilar, ¿opacó a la novia?
La exreina de belleza y esposa de Marc Anthony deslumbró con el vestido romántico que llevó en la íntima ceremonia. ¡Mira qué fabulosa!
People EN ESPAÑOL
Las fotos de Nadia Ferreira que levantaron sospechas de la boda de Christian Nodal y Ángela Aguilar
La esposa de Marc Anthony dio pistas del lugar donde se produciría el enlace de ensueño
El Universal
Hijo de Pepe Aguilar le reprocha por no haber sido invitado a la boda
CIUDAD DE MÉXICO, julio 26 (EL UNIVERSAL).- La boda de Ángela Aguilar y Christian Nodal causó la sorpresa de todas y todos, sobre todo, de Emiliano, el hijo que Pepe Aguilar tuvo en su primer matrimonio, pues al parecer no fue invitado a la celebración, así lo dejó entrever, después de comentar la publicación que hizo su padre acerca de la unión nupcial entre su hija y el cantante mexicano. Este miércoles, Ángela y Christian se ...
LA NACION
Mauro Icardi reaccionó a la foto semidesnuda de Wanda Nara que arrasó en Instagram
La mediática sorprendió a todos con una foto al borde de la censura desde las playas de Miami; tras la separación, el futbolista reaccionó a la postal y dejó más dudas que certezas
People EN ESPAÑOL
¡El video que borró Belinda de sus redes el mismo día de la boda de Christian Nodal y Ángela Aguilar!
El clip desapareció de un plumazo de su perfil. ¿Qué contenía para que la cantante diera el paso?
People EN ESPAÑOL
¡Hijo de Jennifer López roba cámara en el cumpleaños de su mamá!
En ausencia de Ben Affleck el jovencito de 16 años hizo compañía a su famosa madre en su 55 cumpleaños.
EFE Latam
Impiden despegar de Panamá a vuelo con expresidentes que iban a Venezuela de observadores
Ciudad de Panamá, 26 jul (EFE).- El presidente de Panamá, José Raúl Mulino, informó este viernes que se impidió despegar desde el país centroamericano a un vuelo en el que viajaban varios expresidentes que iban a Venezuela para participar como observadores electorales en los comicios del próximo domingo.
hola.com
La elegancia francesa de Brigitte Macron, la primera dama anfitriona de los Juegos Olímpicos de París
La primera dama de Francia no arriesga con sus elecciones de moda, pero acierta con su 'fashion attitude' en unos días históricos
hola.com
Una herencia millonaria que lleva 30 años guardada: el regalo de cumpleaños que podría recibir el príncipe Harry
Dos tercios de la fortuna de la Reina Madre se metieron en 1994 en un fondo fiduciario para sus bisnietos y parece que el duque de Sussex es el principal beneficiado según la información que se publicó tras su muerte
People EN ESPAÑOL
Estos son los detalles de la boda Ángela Aguilar y Christian Nodal
Ángela Aguilar y Christian Nodal han contraído nupcias en una íntima, pero elegante boda.
El Universal
Paul Stanley reacciona a declaraciones de Mario Bezares
'La casa de los famosos' ha dividido opiniones entre los fans del programa, pero quien no lo ha tomado de buena manera es Paul, hijo del fallecido Paco;
El Universal
Equipo de Ana Guevara viajó a París en primera clase: Faitelson
CIUDAD DE MÉXICO, julio 25 (EL UNIVERSAL).- El primer día de actividades para México en los Juegos Olímpicos de París 2024 comenzó y las polémicas no tardaron en llegar. Afortunadamente por nada deportivo, sí por cruce de palabras entre David Faitelson, Ana Gabriela Guevara y otro periodista deportivo, que salió en defensa de la directora de la CONADE. Víctor Hugo Arteaga, reportero investigador y ganador del Premio Nacional de ...
Agencia México
José Eduardo Derbez comparte la esperada foto del reencuentro entre Victoria Ruffo y Eugenio Derbez
El actor y comediante cumplió su promesa y compartió la foto en la que aparecen juntos sus famosos padres y sus dos familias reunidas.
LA NACION
Juegos Olímpicos: la decisión que tomó la FIFA tras los incidentes en Argentina vs. Marruecos
A través de su web oficial, la institución que lidera Gianni Infantino anunció haber nombrado un experto en integridad que ayude en la detección de “posibles contravenciones” durante el encuentro del miércoles
hola.com
En ¡HOLA, José Eduardo Derbez y Paola Dalay nos presentan emocionados a Tessa, su primera hija
El actor y su pareja posaron en exclusiva con la nueva integrante de los Derbez, quien llegó para revolucionar a la familia
LA NACION
Antonela Roccuzzo sorprendió a todos al mostrar cómo pasa Lionel Messi los días de lluvia en Miami
La rosarina compartió con sus seguidores de Instagram un breve video donde se pudo ver a un relajado Leo en la intimidad de su hogar acompañado por alguien muy especial
People EN ESPAÑOL
Las mejor vestidas de los Premios Juventud 2024
Estas son las famosas que forman parte de la lista de las mejor vestidas de la gala que tuvo lugar en el coliseo de Puerto Rico, ¿cuál es tu look favorito?
Animal Político
“El Mayo” Zambada fue engañado para volar a Texas y ser capturado, según The Wall Street Journal
De acuerdo con la publicación, funcionarios mexicanos y estadounidenses confirmaron que un miembro de alto rango del Cártel de Sinaloa lo engañó para que volara a Texas. Creía que iba a inspeccionar aeródromos clandestinos en México,
People EN ESPAÑOL
La gran ausente en la boda de Christian Nodal y Ángela Aguilar
Ella fue la gran ausente en la boda de Christian Nodal y Ángela Aguilar. ¿Dónde estaba?
El Universal
Afición francesa se rinde en aplausos a la delegación de México
PARÍS, Francia., julio 26 (EL UNIVERSAL).- La ceremonia de inauguración de los Juegos Olímpicos de París 2024 ha sido sin duda espectacular, dejando sobre las aguas del Río Sena momentos inolvidables. Uno de ellos provocado por México, país que luego de varios minutos de iniciada la ceremonia, se presentó ante el público francés. Encabezados por Alejandra Orozco y Emiliano Hernández, los atletas mexicanos no duraron en sonreír, ...

Historias más recientes