
ARTDEPARTMENT

Google ha tomado una sorprendente iniciativa en el campo del 'benchmarking' de la IA: ha creado una arena digital en la que los modelos de IA más avanzados del mundo competirán entre sí en una serie de juegos de táctica. Esta nueva iniciativa, denominada Kaggle Game Arena, arranca esta semana con un emocionante torneo de ajedrez entre IAs, que se inicia hoy, que durará hasta el 7 de agosto y que será retransmitido en directo.
'Sgroogled.com': cuando MICROSOFT lanzaba anuncios ANTI-GOOGLE
Kaggle, la comunidad de ciencia de datos propiedad de Google, ha animado esta plataforma para crear un sistema de clasificación y benchmarking de modelos de habla (LLMs) basado en su desempeño en juegos complejos. El objetivo no es solo entretener, sino además calcular de forma rigurosa las capacidades cognitivas de estas IAs: razonamiento, planificación estratégica, memoria, adaptabilidad, etc.
La propuesta es clara: si quieres conocer cuán "inteligente" es verdaderamente una IA, haz que juegue.
La primera competición oficial de Kaggle Game Arena es un torneo de ajedrez en el que participan algunos de los modelos de habla más potentes del momento:
El torneo se desarrolla bajo un formato de eliminación directa con emparejamientos al mejor de cuatro partidas. Los cuartos de final se juegan el primer día, las semifinales el segundo y la gran final el tercero.
Cada partida será retransmitida por Kaggle.com, con estudio y comentarios en directo del gran experto Hikaru Nakamura (en su canal de Kick) y resúmenes diarios del popular youtuber Levy Rozman (GothamChess). La final contará con un suspensión astral presentado por el campeón mundial de ajedrez Magnus Carlsen, desde el canal de YouTube de Take Take Take.
El torneo no solo enfrenta a las IAs; además muestra cómo razonan. Los modelos reciben como entrada un texto que describe el estado coetáneo del tablero (en notación FEN), pero no tienen camino a motores de ajedrez como Stockfish ni a herramientas externas. Deben tomar decisiones basándose exclusivamente en su propia capacidad de razonamiento textual.
Adicionalmente:
Aunque el torneo es el evento conocido central, Kaggle está organizando además cientos de partidas "tras bambalinas" para construir un ranking permanente y más robusto de estos modelos. Cada IA jugará múltiples partidas contra otras en emparejamientos aleatorios. Estos resultados, próximo con los del torneo, servirán para construir una clasificación entero en tiempo vivo, accesible desde la página del Game Arena.
Según explica Meg Risdal, jefe de producto de Kaggle, este ranking será la verdadera métrica de narración sobre qué tan buenos son los modelos jugando ajedrez de forma autónoma.
Pero, ¿por qué usar juegos como ajedrez, Go o Werewolf para evaluar IAs? Google explica que los juegos ofrecen un entorno estructurado, dinámico y resistente a la saturación, es aseverar, no pueden resolverse fácilmente con reglas fijas. Adicionalmente, permiten disimular habilidades del mundo vivo:
Holger Mueller, analista de Constellation Research, reconoce que el torneo tiene más valencia como espectáculo que como aparejo para empresas: "superar en ajedrez no convencerá a los ejecutivos de adoptar una IA. Lo que buscan es automatización útil para el negocio". Aun así, considera que esta tendencia de "esports para LLMs" podría cambiar la forma en que se entrenan los modelos de IA en el futuro.
El Kaggle Game Arena no se detendrá en el ajedrez. Pronto incluirá otros juegos como Go, Werewolf y videojuegos multijugador complejos, así como simulaciones del mundo vivo. Cada conjunto tendrá su propia página con resultados, reglas, entornos de código libre y rankings en proceso.
Con esto, Google rebusca establecer un típico competitivo y transparente para evaluar la inteligencia actos de los modelos de IA, no solo en tareas lingüísticas, sino en situaciones que simulan la complejidad del mundo humano.
Vía | Silicon Angle
Imagen | Marcos Merino mediante IA
En Genbeta | Cualquiera ha convertido esta plataforma de ajedrez online en su Google Drive de balde particular de la forma más ingeniosa. Porque sí
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!