La mejor noticia de la llegada de Sora no es Sora, es ver que las IAs alternativas, gratis y open source, están a su altura

Publicado el

diciembre 11, 2024

OpenAI lanzó el pasado lunes Sora, su alternador de vídeo mediante IA, que ya está habitable para cualquier adjudicatario de suscripción... que no resida en la Unión Europea.

Sin confiscación, aunque la interés rodea este producto desde que fue anunciado hace varios meses, quizá a nivel tecnológico sea aún más relevante la mensaje de que no han dejado de emerger alternativas gratuitas y de código franco que están demostrando no sólo ser capaces de 'hablarle de tú a tú' a Sora, sino, incluso, de adelantarle en muchos aspectos.

Así, Modelos como Hunyuan Video de Tencent y Mochi 1 de Genmo AI están desafiando la hegemonía de las herramientas comerciales en este campo y con ello:

Democratizan la tecnología: Ofrecen herramientas de suscripción calidad sin coste o con tarifas mínimas.
Fomentan la innovación: Al ser de código franco, permiten a los desarrolladores verificar y mejorar los modelos.
Reducción de costes para pequeñas empresas y estudiantes: Sectores tradicionalmente excluidos por las altas tarifas de las soluciones comerciales ahora tienen comunicación a herramientas competitivas.

¿Qué es Sora y por qué era una IA tan esperada?

Sora es la envite de OpenAI para convertir texto en vídeos de suscripción calidad, capa de ofrecer escenas casi fotorrealistas de hasta 20 segundos. A pesar de sus características prometedoras, su maniquí de suscripción —que puede alcanzar los $200 mensuales si buscas vídeos de suscripción resolución y sin marca de agua— limita su accesibilidad a un sabido corto, principalmente empresas y creadores con altos presupuestos.

Sora aún no está disponible, y Meta ya presume de haberlo superado: Movie Gen facilitará la edición y creación de vídeo con IA

Sin confiscación, Sora se enfrenta además a problemas técnicos: según numerosos ejemplos visionables en redes, su capacidad para disimular de forma realista movimientos físicos y sustentar la coherencia en escenas complejas es aún rudimentaria.

Sin ir más allá, Carlos Santana, divulgador gachupin de IA, hizo uso de un 'prompt' recurrente en sus pruebas ("Un pangolín surfeando una ola"), con el objetivo de testear tanto Sora como Hunyuan. Este fue el resultado de la prueba con Sora, que él mismo define como 'raruno' (una evaluación misericordiosa, cerca de señalar):

Y éste es el resultado de probar su alternativa 'open source', Hunyuan:

[Aquí tienes más comparaciones paralelas entre ambos modelos]

Para habérnosla vendido en su momento como un "simulador de mundos", lo cierto es que los vídeos generados por Sora a menudo presentan errores evidentes. Eso no significa que Sora no tenga un enorme potencial: seguramente OpenIA seguirá refinando el maniquí en los próximos abriles... pero, por ahora, su elevado coste y sus limitaciones técnicas plantean dudas sobre este maniquí de IA.

La revolución silenciosa de las alternativas open source

Mientras OpenAI se esfuerza por perfeccionar Sora, alternativas como Hunyuan Video y Mochi-1 están emergiendo como opciones viables, accesibles y, en algunos casos, superiores en ciertos aspectos. Estas herramientas gratuitas no solo ofrecen resultados competitivos, sino que su naturaleza de código franco permite a los desarrolladores personalizarlas y adaptarlas a sus deposición.

Hunyuan Video

Hunyuan Video, agresivo por Tencent, representa un hito en el ámbito de los modelos generativos de vídeo por IA. Este maniquí de código franco, entrenado con 13.000 millones de parámetros, ha sido descrito como una útil revolucionaria no solo por su calidad, sino por la accesibilidad que ofrece a desarrolladores, estudiantes y pequeñas empresas que buscan explorar la tecnología de reproducción de vídeo sin las barreras económicas que suelen imponer las herramientas comerciales. Entre sus características técnicas más destacadas se incluyen:

Adición al prompt: El maniquí está diseñado para mejorar y enriquecer las instrucciones textuales de los usuarios, generando vídeos más detallados y realistas.
Movimiento natural: Uno de los puntos fuertes de Hunyuan es su capacidad para disimular movimientos fluidos y respetar las leyes de la física, un dominio donde Sora está demostrando no rendir demasiado adecuadamente.
Flexibilidad creativa: Gracias a su naturaleza de código franco, los usuarios pueden personalizar el maniquí según sus deposición, ajustando parámetros o entrenándolo con datos específicos para aplicaciones concretas.

Opciones de uso y accesibilidad

Una de las mayores fortalezas de Hunyuan Video es su accesibilidad. Tencent ha puesto a disposición de la comunidad el código fuente completo y los pesos preentrenados del maniquí en plataformas como GitHub y Hugging Face. Esto permite a cualquier adjudicatario con el hardware adecuado descargar y ejecutar el maniquí localmente, sin coste alguno.

Sin confiscación, el hardware necesario para ejecutar Hunyuan Video localmente puede ser un desafío. Se requiere una GPU con al menos 60GB de memoria, como las tarjetas Nvidia H800 o H20. Para quienes no cuentan con este tipo de equipos, diversas plataformas en la cirro, como FAL.ai, Runpod o Vast.ai, ofrecen comunicación al maniquí por tarifas asequibles.

Por ejemplo, en FAL.ai es posible producir vídeos por tan solo 0,5 dólares cada uno, mientras que otros servicios como el servidor oficial de Hunyuan ofrecen paquetes de créditos con precios competitivos.

El open source, un elemento clave en la explosión de inteligencia artificial que está ocurriendo ante nuestros ojos

Mochi 1

Mochi 1, de código franco bajo atrevimiento Apache 2.0 y desarrollado por Genmo AI, se ha posicionado como una de las alternativas más sólidas adentro del panorama de generadores de vídeo por IA. Este maniquí está poco por detrás de Hunyuan en potencia: su construcción 'sólo' utiliza poco más de 10 mil millones de parámetros, lo que le sigue permitiendo destacar en los mismos campos que el maniquí de Tencent cuando se les compara con el de OpenAI: realismo de la simulación de movimiento, coherencia de los rasgos faciales, y enlace al prompt.

Opciones de uso y accesibilidad

Mochi 1 se destaca por su flexibilidad en cuanto a opciones de uso. Los usuarios pueden nominar entre diferentes modalidades según sus deposición y capacidades técnicas:

Lectura gratuita: Permite producir hasta 4 vídeos cada 6 horas, con un margen mensual de 30 vídeos. Si adecuadamente estos vídeos llevan una marca de agua de Genmo y están limitados a usos personales, ofrecen una oportunidad inmejorable para explorar el maniquí sin coste alguno.
Inmoralidad Lite ($8/mes): Aumenta el margen a 8 vídeos cada 6 horas y elimina la marca de agua, adicionalmente de permitir el uso comercial con monetización de derechos.
Inmoralidad Standard ($24/mes): Ofrece hasta 32 vídeos cada 6 horas, viejo privacidad en el uso (modo oculto) y derechos exclusivos sobre los vídeos generados, lo que la convierte en una opción atractiva para creadores profesionales.
Coche-alojamiento: Al ser de código franco, Mochi 1 además se puede descargar y ejecutar localmente. Aunque esto requiere un hardware potente —similar al necesario para Hunyuan Video—, es una opción excelente para desarrolladores que buscan personalizar el maniquí y verificar sin las restricciones de un servidor forastero.

Imagen | OpenAI

En Genbeta | Así de increíble ha sido la crecimiento de la IA para producir vídeos en solo un año: Sora vuelve a repetir lo que hizo ChatGPT

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

La mejor noticia de la llegada de Sora no es Sora, es ver que las IAs alternativas, gratis y open source, están a su altura

¿Qué es Sora y por qué era una IA tan esperada?

La revolución silenciosa de las alternativas open source

Hunyuan Video

Opciones de uso y accesibilidad

Mochi 1

Opciones de uso y accesibilidad

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes

La mejor noticia de la llegada de Sora no es Sora, es ver que las IAs alternativas, gratis y open source, están a su altura

¿Qué es Sora y por qué era una IA tan esperada?

La revolución silenciosa de las alternativas open source

Hunyuan Video

Opciones de uso y accesibilidad

Mochi 1

Opciones de uso y accesibilidad

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

Por favor, complete este formulario, a la brevedad no estaremos contactando con usted.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

Nuestras Redes