
ARTDEPARTMENT

La tinieblas de este miércoles, la compañía de inteligencia sintético dirigida por Elon Musk, xAI, presentó su postrero maniquí de IA: Grok 4. El anuncio se hizo en directo y estuvo empachado de promesas y afirmaciones ambiciosas sobre la gran desarrollo que promete esta inteligencia sintético, integrada actualmente en X (ayer Twitter) y utilizada, en muchos casos, como utensilio de comprobación de noticiario… aunque con no pocos errores.
Grok es la respuesta de xAI —y de Musk— al auge de modelos como los de OpenAI y Google, capaces de analizar imágenes, contestar preguntas complejas y ayudar conversaciones contextuales. Sin retención, esta nueva traducción llega en un contexto complicado: Grok recientemente ha protagonizado titulares por emitir mensajes antisemitas o incluso por una “crisis de identidad” en la que se creía que era Elon Musk.
Las expectativas generadas por xAI son muy altas. Este nuevo maniquí rebusca competir directamente con el esperado GPT-5 de OpenAI, previsto para ser emprendedor a finales de este verano. Elon Musk no dudó en editar afirmaciones que lo mangnificaba:
Con respecto a las preguntas académicas, Grok 4 es mejor que el nivel de doctorado en todas las materias, sin excepciones. [...] Es la IA más inteligente del mundo [...] A veces, puede que le falte sentido global y que aún no haya inventado nuevas tecnologías ni descubierto nueva física, pero eso es sólo cuestión de tiempo


Al igual que sus competidores, xAI asimismo ha emprendedor dos versiones de su IA: Grok 4 y Grok 4 Heavy. Esta última es una variable "multiagente" diseñada para obtener un rendimiento superior. Según explicó Musk, este maniquí genera varios agentes que trabajan en paralelo sobre un mismo problema y luego comparan sus resultados para elegir la mejor alternativa.
Y si hablamos de los benchmarks según los datos proporcionados por xAI, Grok 4 ha obtenido un 25,4% en el benchmark Humanity's Last Exam (una prueba con miles de preguntas de ciencias, humanidades y matemáticas). Este resultado supera los 21,6% de Gemini 2.5 Pro de Google y el 21% del maniquí o-3 de OpenAI.
No obstante, como ocurre asiduamente, estas cifras deben tomarse con cautela hasta que sean validadas por pruebas independientes. Poco que ya han hecho desde Artificial Analysis, que ha considerado que Grok 4 pasa a ser el maniquí de IA número uno (siempre teniendo en cuenta que es el de la API). En los test GPQA Diamond consiguió una puntuación máxima de 88%, y sus resultados en el Humanity's Last Exam asimismo confirman lo dicho por xAI. De esta modo, todas las expectativas generadas por Musk sobre su gran rendimiento parecen confirmarse de modo independiente.




Sobre el papel, Grok 4 promete ofrecer respuestas más profundas, elaboradas y fiables. Pero todavía está por ver cómo se comporta en el uso frecuente, fuera de la API.
Contiguo con el emanación de Grok 4, xAI ha estrenado un nuevo plan de suscripción llamado SuperGrok Heavy, con un precio de 300 dólares al mes. Esta suscripción da acercamiento anticipado a Grok 4 Heavy y otras funcionalidades exclusivas, en una táctica que recuerda a los planes premium de OpenAI, Google o Anthropic.
Adicionalmente, xAI ha confirmado que Grok 4 estará arreglado vía API para que los desarrolladores puedan integrarlo en sus propias aplicaciones. Pero por otra parte, se va a poder usar a través de 'Super Grok'.
En Genbeta | Por qué llamarle ingeniería del prompt cuando ingeniería del contexto es mejor para conseguir los mejores resultados con la IA
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!