el resultado sigue siendo pésimo

Publicado el

julio 11, 2025

Notice: La función wp_get_loading_optimization_attributes ha sido llamada de forma incorrecta. Una imagen no debería ser diferida y marcada como alta prioridad al mismo tiempo. Por favor, ve depuración en WordPress para más información. (Este mensaje fue añadido en la versión 6.3.0). in /home/artdepartment.com.ar/public_html/wp-includes/functions.php on line 6170

Dos de los modelos de IA más relevantes en este momento, Copilot y ChatGPT, se han enfrentado a un desafío que parecía que iba a ser sencillo: una partida contra 'Video Chess' en la Atari 2600, un equipo de 1979 que ocupaba tan solo 4 KB. El resultado fue una humillante derrota, para sorpresa de muchos.

Esta historia ha sido compartida en Linkedin por el ingeniero Citrix Caruso que ya el mes pasado nos mostraba una prueba similar sólo con ChatGPT. Ahora parece que le ha querido dar una segunda oportunidad. Y es que a pesar de que la IA más moderna pueda tener mucha complejidad a sus espaldas, así como una gran capacidad para procesar el lengua, puede ser superado por un oponente de hace 50 abriles.

El desafío: crónica de un fracaso en dos actos

Este desafío comenzó cuando en una conversación con ChatGPT, el chabot de OpenAI se jactó de ser un "componente cachas por derecho propio y fácilmente superaría al Video Chess de Atari. Caruso, intrigado, decidió poner a prueba esta afirmación y usó un émulo de Atari para ejecutar el equipo de ajedrez. Y aquí comenzó la partida.

El resultado fue decepcionante. Durante un combate de 90 minutos en el nivel principiante, ChatGPT no solo confundió las piezas, sino que perdió constantemente la conocimiento de cómo estaban las fichas en el tablero. La derrota fue preciso, como ya había ocurrido en el pasado.

Acullá de rendirse, Caruso pensó: "Imaginemos la capital de todos explotando si un producto de Microsoft supera a ChatGPT'. Así que decidió repetir el investigación con Copilot. La IA de Microsoft igualmente se mostró confiada, asegurando que, a diferencia de su rival, si podía realizar un seguimiento del tablero. La verdad fue muy diferente. Caruso le pidió que renderizara el tablero tal y como lo 'imaginaba' y la imagen no coincidía con la partida positivo.

La modernización de Copilot fue más vergonzosa que con ChatGPT. Según Caruso:

"En el séptimo turno, había perdido dos peones, un heroína y un alfil —a cambio de un solo peón— y ahora me estaba ordenando que colocara su reina ajustado frente a la reina de Atari para ser capturada en el ulterior turno"

Están usando a ChatGPT como terapeuta en los 'viajes psicodélicos': un gran peligro que desdibuja el papel de los humanos

Este tipo de experimentos, aunque anecdóticos, es una poderosa metáfora de la situación presente de la inteligencia sintético. Mientras las grandes tecnológicas nos bombardean con parte sobre cómo la IA va a reemplazar a los programadores en un futuro, la verdad es muy diferente. No es capaz de pasar a una 'IA' de hace casi 50 abriles.

Cuando se les pone a prueba en tareas que requieren método abstracta y memoria persistente, estos sistemas fallan estrepitosamente. Tanto Copilot como ChatGPT no "piensan" ni "aprenden" de una forma significativa. En esencia, son sistemas avanzados para predecir la ulterior palabra que mostrar o el píxel que suscitar en una imagen. Pero cuando se acento de comprender reglas y un contexto y llevarlo durante un buen rato, parece que todo cae por su propio peso.

De esta forma... si la IA no es capaz de distinguir una torre de un alfil en un equipo de 8 bits, ¿por qué deberíamos confiarle nuestra información personal o que tome decisiones de lo que hacemos? Sin duda esta puede ser una prueba muy buena que se puede malquistar los futuros modelos para conocer cómo se comportan.

Imágenes | JESHOOTS.COM Felix Mittermeier

Vía | Windows Central

En Genbeta | Algún ha convertido esta plataforma de ajedrez online en su Google Drive graciosamente particular de la forma más ingeniosa. Porque sí

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

el resultado sigue siendo pésimo

El desafío: crónica de un fracaso en dos actos

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes

el resultado sigue siendo pésimo

El desafío: crónica de un fracaso en dos actos

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Por favor, complete este formulario, a la brevedad no estaremos contactando con usted.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes