ARTDEPARTMENT
Las matemáticas avanzadas son un contorno complicado porque no sólo requieren cálculo o reglas, sino todavía pensamiento sensato preciso y creativo. Por otra parte, los problemas matemáticos suelen requerir de una comprensión profunda del contexto, poco que las IA actuales no logran dominar.
Por eso, los actuales modelos de IA (como GPT-4) son muy buenos generando código, textos e imágenes, pero cuando se negociación de chocar problemas matemáticos que vayan más allá de lo sustancial, por requerir de razonamiento innovador, la prometedora inteligencia industrial naufraga suficiente rápido.
Las soluciones matemáticas exigen pensar paso a paso, y un único error puede invalidar todo el trabajo
Sí, es cierto: ya existen pruebas como GSM/8K, en las que las IA logran puntuaciones superiores al 90%, pero muchas veces la secreto radica en que los resuelven meramente por tener practicado ayer con problemas similares (un solo caso de 'contaminación de datos').
Ahora, un nuevo e renovador punto de narración, FrontierMath, está exponiendo lo acullá que está la IA a la hora de estar en condiciones de suplir a los matemáticos.
Esta prueba fue diseñada por Epoch AI con el objetivo específico de exponer estas limitaciones. Los problemas no se parecen a ningún conjunto de datos de entrenamiento existente y requieren razonamiento profundo, no memorización.
Por otra parte, las respuestas suelen ser complejas y no pueden adivinarse. Esto evita que las IA utilicen atajos, como el agradecimiento de patrones superficiales, y obliga a demostrar una comprensión matemática genuina.
Por todo esto, incluso los modelos más avanzados, como GPT-4o y Gemini 1.5 Pro, tan sólo han sido capaces de resolver menos del 2% de los problemas usados para dar forma a FrontierMath.
Matemáticos de renombre, como Terence Tao y Timothy Gowers, han agradecido que los problemas son mucho más complicados que los de competencias internacionales como la Olimpíada Matemática. Matthew Barnett, un avezado en IA, definió así la importancia de FrontierMat:
"Lo primero que hay que entender sobre FrontierMath es que es verdaderamente muy difícil. Casi todo el mundo en la Tierra obtendría una puntuación de aproximadamente el 0%, incluso si se les diera un día completo para resolver cada problema. Afirmo que, una vez que FrontierMath esté completamente resuelto, los humanos compartiremos esta Tierra con mentes artificiales que serán tan inteligentes como nosotros".
Para que las IA mejoren en matemáticas, será necesario que desarrollen capacidades avanzadas de razonamiento sensato y percepción. Esto podría incluir:
Vía | VentureBeat
Imagen | Marcos Merino mediante IA
En Genbeta | “No son lo suficiente inteligentes”: un profesor de matemáticas comparte un truco infalible para pillar deberes hechos con IA
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!