IA2: la plataforma argentina que transparenta y hace anónimos los fallos judiciales

Clarisa Herrera
·4  min de lectura
IA2 puede analizar el texto de un fallo judicial para identificar en forma autónoma los datos que deberían ocultarse (nombres, direcciones postales, teléfonos, etc.) antes de que el fallo se haga público
IA2 puede analizar el texto de un fallo judicial para identificar en forma autónoma los datos que deberían ocultarse (nombres, direcciones postales, teléfonos, etc.) antes de que el fallo se haga público

Cuando tecnologías como inteligencia artificial, aprendizaje automático y machine learning salen de la esfera de lo privado hacia su aplicación en lo público, el resultado puede ser una transformación positiva en la calidad de vida institucional de la ciudadanía.

Tal es el caso del Poder Judicial y más el del Juzgado Penal Contravencional 10 de la ciudad de Buenos Aires, el cual, a finales de 2019, se propuso realizar una hackathon para dar soluciones tecnológicas que pudieran hacer anónimos los fallos: el objetivo era poder publicarlos para mostrar transparencia institucional, fundamentalmente dar marco y profundidad a los argumentos de sus decisiones. Sin embargo, el gran problema era la información privada y sensible de los involucrados, que quedaría al descubierto. Los datos personales implicados eran muchas veces tachados manualmente, una tarea artesanal y engorrosa.

Tu teléfono puede ser una estación meteorológica (y no lo sabías)

Así surgió la idea de usar tecnología pudiera reconocer la información sensible -desde nombres, a direcciones o teléfonos- y ocultarla, aún en su carácter dispersivo: no siempre estos datos se muestran ni de la misma forma, ni en los mismos lugares del fallo. Se requería algo que fuera más allá de buscar un simple patrón de palabras.

Tecnología al servicio de la transparencia

“La respuesta llegó con IA2, una plataforma de inteligencia artificial basada en software libre que logra anonimizar la información sensible de los fallos judiciales”, señala Nicolás Doallo, socio presidente de la Cooperativa Cambá y uno de los líderes del proyecto.

La iniciativa es llevada adelante por la Federación Argentina de Cooperativas de Trabajo, de Tecnología, Innovación y Conocimiento (FACTTIC), compuesta por la propia Cambá y otras cooperativas como Fiqus, Nayra, Alt, Eryx y El Maizal. La finalidad de la federación es agrupar y ayudar a crear empresas cooperativas de Tecnología, Innovación y Conocimiento, con el fin de desarrollar este sector de la economía social y consolidar un rol significativo en lo que denominan “soberanía tecnológica”.

“Consideramos a la federación como un actor fundamental para acompañar el desarrollo tecnológico y digital nacional, como alternativa al sector privado tradicional. FACTTIC mantiene y desarrolla vínculos con otras cooperativas y federaciones del mundo”, sostiene Daollo.

Desde FACTTIC explican que se necesita que las instituciones sean transparentes. “Y esto no significa que mediante algunos procedimientos engorrosos se pueda acceder a la información, sino trabajar en facilitar ese acceso, incentivar esa interacción. Mundialmente hay una tendencia a la transparencia y a la vinculación y participación de la ciudadanía para con las instituciones, plasmada en objetivos como los ODS (Objetivos de Desarrollo Sostenible) de la ONU, o el Plan de Acción para la Argentina de la Open Government Partnership (OGP)”.

El proceso de análisis de texto de IA2 para identificar datos sensibles en un fallo judicial
El proceso de análisis de texto de IA2 para identificar datos sensibles en un fallo judicial


El proceso de análisis de texto de IA2 para identificar datos sensibles en un fallo judicial

Cómo funciona la herramienta IA2

En los textos de los fallos, la herramienta reconoce las entidades buscadas, ya sea para anonimizarlas o para extraer datos estadísticos y visibilizarlos, mediante la aplicación de Inteligencia Artificial y otras técnicas. En particular utilizan el Procesamiento del Lenguaje Natural (NLP por sus siglas en inglés), Renonocimiento de Entidades Nombradas (NER por sus siglas en inglés) y Expresiones Regulares (ReGex por su contracción en inglés) para la detección en textos no estructurados.

La primera implementación se realizó junto al equipo del Juzgado 10, a cargo de Pablo Cruz Casas. “Si bien una de las características a destacar de este equipo es que impulsan la utilización de lenguaje claro en los fallos que acerque a la comprensión y acercamiento de la ciudadanía, no deja de ser un gran desafío para la detección el hecho de que no existen redacciones de fallos similares a otras. Varía por cada región, por cada juzgado, por cada persona que las escribe y hasta se utilizan distintas formas de describir la misma información dentro de un mismo fallo”, explica Daollo.

Por este motivo, el modelo fue entrenado con 500 ejemplos de fallos con información alterada (“dummy” data) que fueron etiquetados de manera manual. Luego del reconocimiento, la herramienta permite la verificación y edición humana, y la publicación en distintas plataformas del fallo, ahora anónimo. La información obtenida de la verificación y edición humana es almacenada para utilizar en los reentrenamientos del modelo de aprendizaje.

“Esta primera versión de la herramienta extrae cuatro variables de los textos: si hubo violencia, si hubo violencia de género, la zona geográfica del hecho y el rango etario de las personas involucradas. Esta información y otros datos estadísticos del funcionamiento de la herramienta se vuelcan en tableros de análisis y visualización de datos”, señala.

Neuralink: un implante en el cerebro permite que un macaco juegue al Pong

Otras aplicaciones y usos posibles de esta herramienta son muchas y diversas, para el análisis de fichas, legajos, registros, exámenes, fallos, denuncias, diagnósticos, y más. “Toda esta información ordenada y analizada es muy valiosa para la humanidad. En muchos casos no son analizadas en grandes cantidades, ni de forma estadística, ni publicadas porque contienen datos que deben ser protegidos. La implementación de esta herramienta permitiría hacerlo”, agrega.

Cada caso hay que explorarlo por sus particularidades, pero la plataforma apunta a poder reconocer entidades en textos de cualquier tipo, y a partir de ello poder anonimizar, extraer, reemplazar, proteger información sensible, publicar, alimentar herramientas de visualización y análisis de la información resultante, entre otras cosas.