
ARTDEPARTMENT

Coloca un vaso transparente delante de un dibujo (por ejemplo, una flecha) y observar cómo la imagen se distorsiona o incluso se invierte. Este huella ocurre porque la luz cambia de dirección al atravesar distintos medios (gracia, vidrio y agua): se proxenetismo del aberración conocido como 'refracción'.
Aunque para nosotros es un hecho diario, reproducirlo correctamente constituye un desafío considerable para una inteligencia industrial generativa de vídeo. No hilván con difundir un vaso estéticamente realista: el maniquí debe fingir la interacción precisa entre luz, materiales transparentes y objetos de fondo, manteniendo coherencia en cada fotograma.
Por eso, desde hace unos meses se somete a las nuevas IAs de coexistentes de vídeo al 'glass refraction test'. La nueva es que Sora 2, el maniquí de coexistentes de vídeo que OpenAI lanzó ayer, ha conseguido pasar esta prueba con resultados sorprendentes:
Esto ha generado entusiasmo entre investigadores y aficionados a la IA: no por el simple truco visual, sino por ser un indicador de que los modelos empiezan a capturar fenómenos físicos complejos del mundo actual (lo que ya prometía, y claramente incumplió, la primera interpretación de Sora).
A diferencia de un motor boceto de videojuegos, que incorpora tecnologías como ray tracing y simulaciones físicas explícitas, un maniquí generativo como Sora debe memorizar a partir de millones de videos y fotos. Lo que produce no se base en reglas físicas programadas, sino en meros patrones estadísticos.
Eso significa que:
Exceder este test implica que el maniquí no solo es capaz de difundir imágenes convincentes, sino que internaliza ciertas regularidades físicas del mundo actual.
CÓMO DESCARGAR VÍDEOS de Instagram, Facebook, Twitter o TikTok en tu MÓVIL

El 'glass refraction test' es casi un mini-benchmark casero. Se ha usado como "prueba del algodón" para evaluar hasta qué punto una IA es capaz de manejar situaciones donde la física se hace visible a simple paisaje. Y es que, si el agua no se curva correctamente en el interior del cristal, poco 'chirría' en el vídeo.
En ese sentido, este indagación se ha convertido en un símbolo de realismo físico en IA generativa. Que Sora 2 lo supere no significa que “entienda la óptica” en el sentido humano, pero sí que logra imitarla con un categoría de fidelidad muy suspensión.
Esto abre varias posibilidades, tanto en el campo de la producción audiovisual (mercancía visuales más realistas sin requisito de motores gráficos complejos) como de, por ejemplo, el entrenamiento de robots (vídeos sintéticos más fieles a la verdad podrían servir para entrenar agentes que interactúan con el mundo).
El vaso de agua no es el único duelo que se usa como medida de progreso. Existen varias categorías de pruebas que ponen contra las cuerdas a las inteligencias artificiales generativas:
Estos retos se parecen a los benchmarks académicos de física intuitiva, como PIQA, IntPhys o PHYRE, que evalúan la capacidad de un sistema para razonar sobre el mundo actual.
Imagen | Marcos Merino mediante IA
En Genbeta | Pensábamos que la IA era muy buena en matemáticas: este nuevo test acaba de demostrar que no es así. Nosotros siquiera lo somos
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!