Google ha montado una 'liga profesional' de juegos de mesa para IAs para tener claro cuáles son las mejores. Empezarán con el ajedrez

Publicado el

agosto 5, 2025

Google ha tomado una sorprendente iniciativa en el campo del 'benchmarking' de la IA: ha creado una arena digital en la que los modelos de IA más avanzados del mundo competirán entre sí en una serie de juegos de táctica. Esta nueva iniciativa, denominada Kaggle Game Arena, arranca esta semana con un emocionante torneo de ajedrez entre IAs, que se inicia hoy, que durará hasta el 7 de agosto y que será retransmitido en directo.

'Sgroogled.com': cuando MICROSOFT lanzaba anuncios ANTI-GOOGLE

Una nueva arena para evaluar la inteligencia químico

Kaggle, la comunidad de ciencia de datos propiedad de Google, ha animado esta plataforma para crear un sistema de clasificación y benchmarking de modelos de habla (LLMs) basado en su desempeño en juegos complejos. El objetivo no es solo entretener, sino además calcular de forma rigurosa las capacidades cognitivas de estas IAs: razonamiento, planificación estratégica, memoria, adaptabilidad, etc.

La propuesta es clara: si quieres conocer cuán "inteligente" es verdaderamente una IA, haz que juegue.

El torneo de ajedrez: las IAs se enfrentan sobre el tablero

La primera competición oficial de Kaggle Game Arena es un torneo de ajedrez en el que participan algunos de los modelos de habla más potentes del momento:

OpenAI: o3 y o4-mini
Google: Gemini 2.5 Pro y Gemini 2.5 Flash
Anthropic: Claude Opus 4
xAI: Grok 4
Moonshot: Kimi 2-K2-Instruct
DeepSeek: DeepSeek-R1

El torneo se desarrolla bajo un formato de eliminación directa con emparejamientos al mejor de cuatro partidas. Los cuartos de final se juegan el primer día, las semifinales el segundo y la gran final el tercero.

Las IAs ya pueden humillarnos jugando a nuestro videojuego favorito, ¿cómo aprenden a hacerlo?

Cada partida será retransmitida por Kaggle.com, con estudio y comentarios en directo del gran experto Hikaru Nakamura (en su canal de Kick) y resúmenes diarios del popular youtuber Levy Rozman (GothamChess). La final contará con un suspensión astral presentado por el campeón mundial de ajedrez Magnus Carlsen, desde el canal de YouTube de Take Take Take.

¿Cómo piensan las IAs?

El torneo no solo enfrenta a las IAs; además muestra cómo razonan. Los modelos reciben como entrada un texto que describe el estado coetáneo del tablero (en notación FEN), pero no tienen camino a motores de ajedrez como Stockfish ni a herramientas externas. Deben tomar decisiones basándose exclusivamente en su propia capacidad de razonamiento textual.

Adicionalmente:

No se les dan los movimientos legales posibles.
Si proponen un movimiento ilegal, tienen hasta tres intentos para corregirlo.
Si fallan, pierden automáticamente la partida.
Tienen hasta 60 minutos por movimiento.

Rankings más allá del espectáculo

Aunque el torneo es el evento conocido central, Kaggle está organizando además cientos de partidas "tras bambalinas" para construir un ranking permanente y más robusto de estos modelos. Cada IA jugará múltiples partidas contra otras en emparejamientos aleatorios. Estos resultados, próximo con los del torneo, servirán para construir una clasificación entero en tiempo vivo, accesible desde la página del Game Arena.

Según explica Meg Risdal, jefe de producto de Kaggle, este ranking será la verdadera métrica de narración sobre qué tan buenos son los modelos jugando ajedrez de forma autónoma.

Arqueoludología, la ciencia que recurre a la inteligencia artificial para redescubrir las reglas y el origen de juegos antiguos

Juegos como reflexivo de la inteligencia vivo

Pero, ¿por qué usar juegos como ajedrez, Go o Werewolf para evaluar IAs? Google explica que los juegos ofrecen un entorno estructurado, dinámico y resistente a la saturación, es aseverar, no pueden resolverse fácilmente con reglas fijas. Adicionalmente, permiten disimular habilidades del mundo vivo:

Planificación estratégica y memoria: en juegos como ajedrez o Go.
Colaboración, persuasión y simulación: en juegos sociales como Werewolf.
Teoría de la mente: al predecir intenciones de oponentes humanos o artificiales.

Holger Mueller, analista de Constellation Research, reconoce que el torneo tiene más valencia como espectáculo que como aparejo para empresas: "superar en ajedrez no convencerá a los ejecutivos de adoptar una IA. Lo que buscan es automatización útil para el negocio". Aun así, considera que esta tendencia de "esports para LLMs" podría cambiar la forma en que se entrenan los modelos de IA en el futuro.

El futuro de la Game Arena

El Kaggle Game Arena no se detendrá en el ajedrez. Pronto incluirá otros juegos como Go, Werewolf y videojuegos multijugador complejos, así como simulaciones del mundo vivo. Cada conjunto tendrá su propia página con resultados, reglas, entornos de código libre y rankings en proceso.

Con esto, Google rebusca establecer un típico competitivo y transparente para evaluar la inteligencia actos de los modelos de IA, no solo en tareas lingüísticas, sino en situaciones que simulan la complejidad del mundo humano.

Vía | Silicon Angle

Imagen | Marcos Merino mediante IA

En Genbeta | Cualquiera ha convertido esta plataforma de ajedrez online en su Google Drive de balde particular de la forma más ingeniosa. Porque sí

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Google ha montado una 'liga profesional' de juegos de mesa para IAs para tener claro cuáles son las mejores. Empezarán con el ajedrez

Una nueva arena para evaluar la inteligencia químico

El torneo de ajedrez: las IAs se enfrentan sobre el tablero

¿Cómo piensan las IAs?

Rankings más allá del espectáculo

Juegos como reflexivo de la inteligencia vivo

El futuro de la Game Arena

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes

Google ha montado una 'liga profesional' de juegos de mesa para IAs para tener claro cuáles son las mejores. Empezarán con el ajedrez

Una nueva arena para evaluar la inteligencia químico

El torneo de ajedrez: las IAs se enfrentan sobre el tablero

¿Cómo piensan las IAs?

Rankings más allá del espectáculo

Juegos como reflexivo de la inteligencia vivo

El futuro de la Game Arena

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Por favor, complete este formulario, a la brevedad no estaremos contactando con usted.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes