
ARTDEPARTMENT

La tecnología de inteligencia fabricado (IA) sigue avanzando a pasos agigantados, y Meta, la empresa matriz de Facebook, ha cubo un paso importante con destino a la creación de un dispositivo de traducción universal que hace poco tiempo habríamos calificado de 'ciencia ficción'.
Un artículo nuevo publicado en Nature por su equipo FAIR (Foundational AI Research) aborda este problema al presentar un maniquí de traducción cibernética que combina modalidades de texto y palabra 101 idiomas. Para algunos, este avance (falsificado como SEAMLESSM4T, un sucesor del NLLB-200) abre la puerta a un futuro donde las barreras lingüísticas sean cosa del pasado.
Hasta ahora, los sistemas de traducción de palabra a palabra (S2ST, por sus siglas en inglés) habían funcionado a través de un enfoque en cascada: primero, examen inevitable del palabra (ASR); luego, traducción de texto a texto (T2TT); y, finalmente, conversión de texto a palabra (TTS). Aunque efectivos, estos sistemas tienen limitaciones:
SEAMLESSM4T aborda estas limitaciones con un enfoque unificado, que permite la traducción directa de palabra a palabra (S2ST), de palabra a texto (S2TT), de texto a texto (T2TT) y de texto a palabra (T2ST) en 96 de los idiomas compatibles con el maniquí, lo que lo convierte en uno de los sistemas más versátiles hasta la vencimiento.
La secreto del éxito de SeamlessM4T radica en su entrenamiento. Meta utilizó 4 millones de horas de audio multilingüe y decenas de miles de millones de frases obtenidas de repositorios públicos online. Asimismo, hizo uso de 443.000 horas de audio con textos coincidentes, como subtítulos de vídeos en internet, para mejorar aún más su capacidad de traducción.
Encima de su precisión, SeamlessM4T destaca por su resiliencia. Es aproximadamente un 50% más robusto en presencia de ruido de fondo y variaciones en el palabra, lo que lo hace especialmente útil en contextos de conversaciones del día a día. Incluso puede manejar expresiones que mezclan varios idiomas, una tacto valiosa en contextos multilingües.
Por otro costado, Meta además ha trabajado para acortar los riesgos de 'toxicidad' en las traducciones. Durante el entrenamiento, se implementaron estrategias para evitar añadir habla ofensivo no presente en la muestra diferente, lo que disminuyó hasta un 20% la presencia de contenido problemático en comparación con otros modelos.
Meta ya está utilizando SeamlessM4T en varios proyectos prácticos. Por ejemplo, permite el doblaje inevitable de vídeos en Instagram y Facebook, y facilita la traducción en tiempo vivo a través de altavoces integrados en antiparras inteligentes Ray-Ban. Asimismo, el sistema se ha puesto a disposición de investigadores y desarrolladores en formato de código franco, lo que podría acelerar los avances en el campo.

Ni Google Translate ni DeepL: este nuevo traductor arbitrario es el mejor que he probado
No obstante, el camino con destino a un traductor verdaderamente universal todavía es dadivoso: aunque SeamlessM4T soporta 101 idiomas, existen más de 6.500 lenguas en el mundo. Ampliar esta capacidad requerirá avances adicionales y mayores volúmenes de datos de entrenamiento, especialmente para idiomas menos hablados.
En la famosa novelística de ciencia ficción humorística "La Guía del Autoestopista Galáctico", de Douglas Adams, aparecía una criatura ficticia conocida como el 'pez de Caos', un pequeño animal amarillo que se introduce en el pabellón de una persona y permite la comprensión instantánea de cualquier idioma, ya sea hablado o escrito, al convertirlo en un habla que el portador pueda entender.
Aunque SeamlessM4T aún no es instantáneo, por desgracia, representa un avance significativo con destino a el ideal de traducción en tiempo vivo descrito en la obra de Douglas Adams. Futuras mejoras del maniquí podrían llevarlo a convertirse en nuestro equivalente del 'pez de Caos'.
Imagen | Marcos Merino mediante IA
En Genbeta | La IA Zero-Shot de Google traduce idiomas sin ocurrir trillado un ejemplo antiguamente. Gracias a ello ya hay 24 lenguas nuevas en Translate
(function() {
window._JS_MODULES = window._JS_MODULES || {};
var headElement = document.getElementsByTagName('head')[0];
if (_JS_MODULES.instagram) {
var instagramScript = document.createElement('script');
instagramScript.src="https://platform.instagram.com/en_US/embeds.js";
instagramScript.async = true;
instagramScript.defer = true;
headElement.appendChild(instagramScript);
}
})();
-
La notificación
Meta acaba de presentar una IA que nos acerca al 'traductor universal': su funcionamiento interno es lo que marca la diferencia
fue publicada originalmente en
Genbeta
por
Marcos Merino
.
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!