Google presentó AlphaProof, un nuevo sistema basado en aprendizaje de refuerzo para el razonamiento matemático formal, y AlphaGeometry, una versión mejorada de su sistema de resolución de geometría.
AlphaProof es un sistema que se entrena a sí mismo para demostrar enunciados matemáticos en el lenguaje formal Lean. Combina un modelo de lenguaje entrenado previamente con el algoritmo de aprendizaje de refuerzo AlphaZero, que antes se enseñó a sí mismo para dominar los juegos de ajedrez, shogi y Go.
AlphaGeometry 2, una versión ‘significativamente mejorada’ de su antecesora, es un sistema híbrido neurosimbólico, cuyo modelo de lenguaje se basó en Gemini y se entrenó desde cero con una orden de magnitud de más datos sintéticos que AlphaGeometry.
La compañía tecnológica estadounidense calificó este lanzamiento como ‘un avance en la creación de sistemas de Inteligencia Artificial que ayudan a los matemáticos a descubrir nuevos conocimientos, algoritmos novedosos y respuestas a problemas abiertos’.
Ambos sistemas resolvieron cuatro de los seis problemas de la Olimpiada Internacional de Matemáticas (OIM) 2024, con lo que por primera vez llegaron al mismo nivel que un medallista de plata.
Recientemente, la competencia anual de la OIM se ha erigido como un desafío en el Aprendizaje Automático (ML) y un punto de referencia aspiracional para medir las capacidades de razonamiento matemático avanzado de un sistema de IA.
Resolviendo problemas en la Olimpiada matemática
Este año, Google aplicó su sistema de IA combinado a los problemas de la competencia que le fueron proporcionados por los organizadores. Como primer paso, los problemas se tradujeron manualmente a un lenguaje que entendieran los sistemas. La IA resolvió un problema en minutos y se tardó hasta tres días en resolver el resto, frente a las dos sesiones de 4.5 horas que ocupan los estudiantes.
AlphaProof resolvió dos problemas de álgebra y un problema de teoría de números, incluido el problema más difícil de la competencia, resuelto sólo por cinco participantes de la OIM. Alpha Geometry resolvió el problema de geometría y los dos problemas de combinatoria quedaron sin resolver.
Las soluciones fueron calificadas según las reglas de concesión de puntos de la OIM. El sistema de IA de Google obtuvo una puntuación final de 28 puntos, de un máximo total de 42, el equivalente al extremo superior de la categoría de medalla de plata.
