El reto más reciente de la IA: las Olimpiadas de Matemáticas
El científico de la computación Trieu Trinh se quebró la cabeza durante cuatro años intentando resolver una especie de problema metamatemático: cómo construir un modelo de IA capaz de resolver problemas de geometría de la Olimpiada Internacional de Matemáticas (IMO, por su sigla en inglés), una competencia anual para los estudiantes de secundaria más diestros en matemáticas.
La semana pasada, Trinh defendió con éxito en la Universidad de Nueva York su tesis doctoral basada en este proyecto; esta semana, describió el resultado de su trabajo en la revista académica Nature. El sistema, llamado AlphaGeometry, resuelve problemas de geometría de la Olimpiada casi al mismo nivel que un medallista de oro humano.
Mientras desarrollaba el proyecto, Trinh les habló del mismo a dos científicos de investigación de Google, quienes le ofrecieron un puesto de residente entre 2021 y 2023. AlphaGeometry es uno más de los sistemas de IA de Google DeepMind, que han ganado fama por abordar grandes retos. Quizás el más famoso sea AlphaZero, algoritmo de aprendizaje profundo que conquistó el ajedrez en 2017. Las matemáticas presentan un problema más difícil, pues en algunos casos existe un número infinito de rutas para llegar a una solución; en cambio, el ajedrez siempre es finito.
“Me topaba con un callejón sin salida tras otro, tomaba las rutas equivocadas”, explicó Trinh, principal autor e impulsor del proyecto.
Los coautores del artículo son la supervisora de doctorado de Trinh, He He, de la Universidad de Nueva York; Yuhuai Wu, conocido como Tony, cofundador de xAI (antes trabajó en Google) que en 2019 comenzó a explorar de manera independiente una idea similar; Thang Luong, investigador principal, y Quoc Le, ambos de Google DeepMind.
La perseverancia de Trinh dio frutos. “No se trata de un avance gradual”, señaló. “Es un salto enorme, un gran descubrimiento por su resultado”.
“Pero no le den demasiado bombo publicitario”, dijo.
El gran salto
Trinh presentó el sistema AlphaGeometry con un conjunto de prueba de 30 problemas de geometría incluidos en las Olimpiadas de 2000 a 2022. El sistema resolvió 25; históricamente, en ese mismo periodo, el medallista de oro humano resolvió 25.9 en promedio. Trinh también le planteó los problemas a un sistema desarrollado en los años setenta y conocido como el mejor comprobador de teoremas de geometría: ese sistema resolvió 10.
Desde hace algunos años, Google DeepMind ha emprendido varios proyectos dedicados a investigar la aplicación de IA a las matemáticas. En un contexto más amplio en esta área de investigación, los problemas de la Olimpiada de matemáticas se han adoptado como referencia; OpenAI y Meta AI han logrado algunos resultados. Como motivación adicional, está el IMO Grand Challenge, así como un nuevo reto anunciado en noviembre, el Premio de la Olimpiada de Matemáticas a la Inteligencia Artificial, que le entregará 5 millones de dólares a la primera IA que gane el oro en la Olimpiada.
El artículo sobre AlphaGeometry inicia con la afirmación de que resolver teoremas de la Olimpiada “representa un hito notable en el razonamiento automatizado de nivel humano”. Michael Barany, historiador de matemáticas y ciencia en la Universidad de Edimburgo, comentó que no está seguro de que se trate de un hito matemático significativo. “Lo que pone a prueba la IMO es muy distinto a lo que son en realidad las matemáticas creativas para la gran mayoría de los matemáticos”, señaló.
Prueba de concepto
AlphaGeometry es un sistema “neurosimbólico”. Combina un modelo de lenguaje de red neural (eficiente en la intuición artificial, como ChatGPT, pero a menor escala) con un motor simbólico (con capacidad de razonamiento artificial, como una especie de calculadora lógica).
Además, se diseñó específicamente para la geometría. “La geometría euclidiana es una buena opción para probar el razonamiento automático, pues constituye un campo autónomo con reglas fijas”, aseguró Heather Macbeth, especialista en Geometría de la Universidad Fordham y experta en razonamiento verificado por computadora (en su adolescencia, Macbeth ganó dos medallas en la IMO). AlphaGeometry “parece lograr un buen avance”, afirmó.
El sistema tiene dos características de lo más novedosas. En primer lugar, la red neural solo se entrenó con datos de generación algorítmica (la impresionante cantidad de 100 millones de pruebas geométricas), sin ejemplos humanos. El uso exclusivo de datos cien por ciento sintéticos permitió superar un obstáculo en las pruebas automatizadas de teoremas: la ausencia de datos de prueba humana en el entrenamiento se tradujo en un lenguaje de computadora. “Para ser honestos, en un principio dudé que fuera a funcionar”, reconoció He.
La otra característica es que, en cuanto se dejó a AlphaGeometry trabajar en un problema, el motor simbólico empezó a resolver; cuando no podía continuar, la red neural le sugería opciones para ampliar el argumento de prueba. El ciclo continuaba hasta encontrar una solución o hasta que se agotara el tiempo (cuatro horas y media). En jerga matemática, este proceso de ampliación se designa “construcción auxiliar”. Añadir una línea, bisecar un ángulo o trazar un círculo, por ejemplo, son estrategias con las que juegan los matemáticos, estudiantes o grupos de élite para intentar superar un problema. En este sistema, la red neural no solo aprendió a realizar construcción auxiliar, sino a hacerlo como un ser humano. Trinh lo comparó con la acción de poner una liga alrededor de una tapa muy apretada, con lo que se logra que la mano tenga mejor sujeción para abrirla.
“Es una prueba de concepto muy interesante”, opinó Christian Szegedy, cofundador de xAI que trabajó antes en Google. Pero “deja muchas interrogantes sin responder”, aseveró, y no permite una “generalización fácil a otros campos y otras áreas de las matemáticas”.
Soluciones con corazón
A principios de diciembre, Luong visitó su vieja escuela en la ciudad de Ho Chi Minh, Vietnam, y le mostró el sistema AlphaGeometry a su antiguo maestro e instructor IMO, Le Ba Khanh Trinh. Le fue el mejor medallista de oro en las Olimpiadas de 1979 y ganó un premio especial por sus elegantes soluciones geométricas. Le analizó una de las pruebas de AlphaGeometry y, aunque le pareció sorprendente, no lo dejó satisfecho, según relató Luong: “Le pareció mecánica y dijo que le faltaba el corazón, la belleza, que busca en una solución”.
Trinh le había pedido antes a Evan Chen, estudiante de doctorado en matemáticas del Instituto Tecnológico de Massachusetts, quien también es instructor IMO y medallista de oro de la Olimpiada, revisar el trabajo de AlphaGeometry. Chen le dijo que las respuestas eran correctas y añadió que se preguntaba cómo había encontrado las soluciones el sistema.
“Me gustaría saber qué hace la máquina para llegar a esto”, dijo. “Pero, la verdad, ahora que lo pienso, también me gustaría saber cómo encuentran las soluciones los seres humanos”.
c.2024 The New York Times Company