Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado

Publicado el

febrero 10, 2025

Notice: La función wp_get_loading_optimization_attributes ha sido llamada de forma incorrecta. Una imagen no debería ser diferida y marcada como alta prioridad al mismo tiempo. Por favor, ve depuración en WordPress para más información. (Este mensaje fue añadido en la versión 6.3.0). in /home/artdepartment.com.ar/public_html/wp-includes/functions.php on line 6131

Si poco ha quedado claro con la irrupción de o3-mini es que la IA avanza a un ritmo imparable. Cada mes (o cada par de semanas), los modelos mejoran gracias a una combinación de fuerza bruta computacional y de innovaciones algorítmicas.

Y es que, recientemente, tras una semana en la que DeepSeek estuvo en boca de todos gracias a su inesperada eficiencia, OpenAI dio un sonoro trauma sobre la mesa con su maniquí o3-mini: no sólo ha superado al hasta ahora impresionante maniquí de IA 'made in China', sino que lo ha hecho con un rendimiento superior y un costo tres veces último.

Los datos son contundentes: o3-mini se destaca en diversas pruebas de narración. En el test ARC-AGI-1, esencia para determinar la capacidad de razonamiento de estos modelos, ha demostrado un seguridad magnífico entre precisión, costo y eficiencia computacional.

Otros test además muestran que el nuevo maniquí de OpenAI es más inteligente, rápido y financiero. Sorprendentemente, algunos, como Livebench, muestran que el recién llegado es capaz incluso de pasar a modelos de la serie o1, que son considerablemente más costosos.

Eso sí, DeepSeek sigue ganando a o3-mini en un aspecto en el que OpenAI no parece interesado en competir: es una IA 'open source' que puedes instalar en tu propio PC si así lo deseas

DeepSeek lo cambia todo a la hora de aprender a programar porque ofrece algo que ChatGPT no: un vistazo a cómo piensa

Un cambio en cómo razonamos con IA

El dominio de o3-mini no solo se debe a la potencia bruta, sino además a su capacidad para "pensar ayer de objetar". OpenAI introdujo con o1 el concepto de 'esclavitud de pensamiento', permitiendo que la IA rumiara ayer de dar una respuesta.

Modelos como o3-mini y DeepSeek R1 han perfeccionado esta técnica, logrando que la inteligencia industrial hable consigo misma y evalúe distintas soluciones ayer de animarse.

Esto ha sido especialmente benefactor en tareas de razonamiento deductivo y matemático, donde se observan mejoras significativas. Adicionalmente, hace no mucho, se criticaba a los modelos generativos como ChatGPT por su bajo rendimiento en matemáticas: hoy en día, gracias precisamente a estos avances, esa afirmación ha quedado obsoleta.

La IA no solo se mide en pruebas, además en preferencias del afortunado

Un aspecto extraordinario de la desarrollo de estos modelos es que el mejor en los test no siempre es el predilecto del sabido. Un caso paradigmático es el de Claude 3.5 Sonnet, que ha vacada popularidad no tanto por sus datos de rendimiento como por su "personalidad".

Este engendro demuestra que, encima de la precisión y eficiencia, los usuarios valoran la experiencia conversacional y la forma en que un maniquí se comunica.

Imagen | Marcos Merino Bonilla

En Genbeta | Sam Altman cree que OpenAI se equivocó con la visión con el código libre: DeepSeek lo ha cambiado todo

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado

Un cambio en cómo razonamos con IA

La IA no solo se mide en pruebas, además en preferencias del afortunado

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes

Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado

Un cambio en cómo razonamos con IA

La IA no solo se mide en pruebas, además en preferencias del afortunado

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Por favor, complete este formulario, a la brevedad no estaremos contactando con usted.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes