
ARTDEPARTMENT

Grok nos ha transmitido momentos desternillantes (y otros tantos preocupantes) cuando hace unos meses se acabó integrando para el sabido caudillo. Su turbina de imágenes parecía no tener filtros, lo que desembocó en multitud de publicaciones virales de imágenes generadas por esta IA donde se incluían celebridades y otros personajes públicos conocidos haciendo acto de presencia en tono mayoritariamente humorístico.
Recientemente, el equipo de xAI encargado de entrenar este maniquí de estilo nos sorprende con Grok 3, la última traducción de este maniquí que pudo presentarse durante el día de ayer. Algunas de las personas más influyentes de esta industria ya le han tumbado el guantelete para probar sus capacidades, por lo que hemos querido repasar un poco la opinión de los expertos en torno al maniquí arrojado por Musk y su equipo.
Tal y como han asegurado sus responsables, Grok 3 ha sido entrenado a través de una capacidad de computación 10 veces superior a su maniquí precedente. Grok ha evolucionado en un centro de datos con unas 200.000 GPUs, ofreciendo (teóricamente), una experiencia que se situaría en la trayecto de los modelos más sofisticados hasta la época.
Esta nueva traducción se presenta en dos modelos: Grok 3 y Grok 3 mini, una organización similar a la que han seguido otras empresas como OpenAI o Google con sus respectivos modelos. Según xAI su maniquí Grok 3 supera con creces a GPT-4o en diferentes pruebas. Los gráficos mostrados durante la presentación muestra los resultados obtenidos en los benchmarks de AIME, que evalúa el rendimiento matemático, y GPQA, que se centra en la física, la biología y la química. En estos benchmarks podemos ver como Grok 3 sobresale suficiente, mientras Grok 3 mini se encuentra al nivel de GPT-4o.

Benchmarks de Grok 3. Imagen: xAI
Todo hay que decirlo, y es que este nuevo maniquí de estilo aún no ha sido comparado con o3, el producto más liberal de OpenAI hasta la época. “La marcha de o3 en las comparaciones tiene sentido, sobre todo cuando el titular era que ibas a presentar a la IA más inteligente de la tierra,” apuntaba Carlos Santana, perito divulgador sobre inteligencia industrial.
Entre algunas de las primeras personas que han podido probar el maniquí se encuentra Andrej Karpathy, CEO de Eureka Labs, precedente director de IA en Tesla y cofundador de OpenAI. Karpathy ha estado probando el modelo durante un par de horas y ha sometido a Grok 3 a una serie de complejos problemas para enterarse por dónde cojea este maniquí de IA.
Para Karpathy, Grok 3 se encuentra en la trayecto de los modelos más sofisticados, sobre todo cuando utilizamos su modo de razonamiento profundo (Thinking). El responsable de Eureka Labs lo equipara al nivel de o1 pro de OpenAI y tenuemente por encima de DeepSeek-R1 y Gemini 2.0 Flash Thinking. Eso sí, ha habido algunas pruebas a las que no ha sabido contestar esta IA, como su prueba de ‘Emoji Mistery’ en la que escondía títulos Unicode a través de una cara sonriente en forma de emoji. Siquiera ha podido con algunas de sus búsquedas web poco más enrevesadas, llegando incluso a desvariar en determinados momentos.
Aunque eso sí, Karpathy no ha dudado en felicitar al equipo de xAI y Musk por el trabajo realizado, ya que en tan solo 1 año han podido desarrollar este maniquí de IA desde cero.

Lex Fridman, investigador y conocido por sus charlas y entrevistas relacionadas con el campo de la inteligencia industrial, igualmente ha felicitado al equipo de Musk por el logro. “Me he quedado con la boca abierta, un maniquí impresionante. Enhorabuena a Elon y al equipo por darle vida,” comentaba en su publicación.
Amjad Masad, CEO de Replit, una plataforma que permite a los usuarios escribir, ejecutar y compartir código, igualmente ha felicitado al equipo de xAI por lo rematado con Grok 3. “Grok 3 parece ser un maniquí fronterizo de última concepción. Es un gran logro, sobre todo teniendo en cuenta lo tarde que empezaron”, aseguraba en X.
Grok 3 parece activo conseguido una respuesta mayoritariamente benévolo. Grok 3 va a poder ser usado primero por los usuarios que pagan Premium+ de X. Pero para poder sacarle el mayor partido a todas las funciones habrá que dar el brinco a lo que han llamado SuperGrok. Con un precio de 30 dólares al mes o 300 dólares al año se va a tener llegada a la búsqueda profunda o al razonamiento adicional, incluso a la concepción de imágenes ilimitadas. Tendremos que conocer cómo va evolucionando el maniquí en los próximos meses.
Imagen de portada | xAI
En Genbeta | Esta función de seguridad de Chrome utiliza IA para protegernos frente a sitios web maliciosos. Lo malo: recopila nuestros datos
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!