ARTDEPARTMENT

Solicitar una consulta

Meta acaba de presentar una IA que nos acerca al 'traductor universal': su funcionamiento interno es lo que marca la diferencia

Publicado el 
enero 16, 2025

Meta acaba de presentar una IA que nos acerca al 'traductor universal': su funcionamiento interno es lo que marca la diferencia

La tecnología de inteligencia fabricado (IA) sigue avanzando a pasos agigantados, y Meta, la empresa matriz de Facebook, ha cubo un paso importante con destino a la creación de un dispositivo de traducción universal que hace poco tiempo habríamos calificado de 'ciencia ficción'.

Un artículo nuevo publicado en Nature por su equipo FAIR (Foundational AI Research) aborda este problema al presentar un maniquí de traducción cibernética que combina modalidades de texto y palabra 101 idiomas. Para algunos, este avance (falsificado como SEAMLESSM4T, un sucesor del NLLB-200) abre la puerta a un futuro donde las barreras lingüísticas sean cosa del pasado.

Según los investigadores, la útil es un 23% más precisa que otros modelos de última reproducción en tareas de palabra a palabra

Un brinco más allá de los sistemas convencionales

Hasta ahora, los sistemas de traducción de palabra a palabra (S2ST, por sus siglas en inglés) habían funcionado a través de un enfoque en cascada: primero, examen inevitable del palabra (ASR); luego, traducción de texto a texto (T2TT); y, finalmente, conversión de texto a palabra (TTS). Aunque efectivos, estos sistemas tienen limitaciones:

  1. Enfoque en idiomas de altos posibles: Los modelos tienden a ser precisos solo en idiomas con abundantes datos disponibles, dejando a espaldas a muchas lenguas menos comunes.
  2. Término direccional: Frecuentemente, se especializan en traducir al inglés... pero no desde inglés con destino a otros idiomas.
  3. Complejidad del sistema: La naturaleza modular de los sistemas en cascada incrementa las posibilidades de errores acumulativos.

SEAMLESSM4T aborda estas limitaciones con un enfoque unificado, que permite la traducción directa de palabra a palabra (S2ST), de palabra a texto (S2TT), de texto a texto (T2TT) y de texto a palabra (T2ST) en 96 de los idiomas compatibles con el maniquí, lo que lo convierte en uno de los sistemas más versátiles hasta la vencimiento.

La secreto del éxito de SeamlessM4T radica en su entrenamiento. Meta utilizó 4 millones de horas de audio multilingüe y decenas de miles de millones de frases obtenidas de repositorios públicos online. Asimismo, hizo uso de 443.000 horas de audio con textos coincidentes, como subtítulos de vídeos en internet, para mejorar aún más su capacidad de traducción.

Más allá de la traducción: precisión en entornos ruidosos y reducción de toxicidad

Encima de su precisión, SeamlessM4T destaca por su resiliencia. Es aproximadamente un 50% más robusto en presencia de ruido de fondo y variaciones en el palabra, lo que lo hace especialmente útil en contextos de conversaciones del día a día. Incluso puede manejar expresiones que mezclan varios idiomas, una tacto valiosa en contextos multilingües.

Por otro costado, Meta además ha trabajado para acortar los riesgos de 'toxicidad' en las traducciones. Durante el entrenamiento, se implementaron estrategias para evitar añadir habla ofensivo no presente en la muestra diferente, lo que disminuyó hasta un 20% la presencia de contenido problemático en comparación con otros modelos.

Usos actuales y futuros

Meta ya está utilizando SeamlessM4T en varios proyectos prácticos. Por ejemplo, permite el doblaje inevitable de vídeos en Instagram y Facebook, y facilita la traducción en tiempo vivo a través de altavoces integrados en antiparras inteligentes Ray-Ban. Asimismo, el sistema se ha puesto a disposición de investigadores y desarrolladores en formato de código franco, lo que podría acelerar los avances en el campo.

Ni Google Translate ni DeepL: este nuevo traductor gratis es el mejor que he probado

En Genbeta

Ni Google Translate ni DeepL: este nuevo traductor arbitrario es el mejor que he probado

No obstante, el camino con destino a un traductor verdaderamente universal todavía es dadivoso: aunque SeamlessM4T soporta 101 idiomas, existen más de 6.500 lenguas en el mundo. Ampliar esta capacidad requerirá avances adicionales y mayores volúmenes de datos de entrenamiento, especialmente para idiomas menos hablados.

Toda IA lo suficientemente vanguardia es indistinguible ¿de un pez alien?

En la famosa novelística de ciencia ficción humorística "La Guía del Autoestopista Galáctico", de Douglas Adams, aparecía una criatura ficticia conocida como el 'pez de Caos', un pequeño animal amarillo que se introduce en el pabellón de una persona y permite la comprensión instantánea de cualquier idioma, ya sea hablado o escrito, al convertirlo en un habla que el portador pueda entender.

Aunque SeamlessM4T aún no es instantáneo, por desgracia, representa un avance significativo con destino a el ideal de traducción en tiempo vivo descrito en la obra de Douglas Adams. Futuras mejoras del maniquí podrían llevarlo a convertirse en nuestro equivalente del 'pez de Caos'.

Imagen | Marcos Merino mediante IA

En Genbeta | La IA Zero-Shot de Google traduce idiomas sin ocurrir trillado un ejemplo antiguamente. Gracias a ello ya hay 24 lenguas nuevas en Translate

(function() {
window._JS_MODULES = window._JS_MODULES || {};
var headElement = document.getElementsByTagName('head')[0];
if (_JS_MODULES.instagram) {
var instagramScript = document.createElement('script');
instagramScript.src="https://platform.instagram.com/en_US/embeds.js";
instagramScript.async = true;
instagramScript.defer = true;
headElement.appendChild(instagramScript);
}
})();

-
La notificación

Meta acaba de presentar una IA que nos acerca al 'traductor universal': su funcionamiento interno es lo que marca la diferencia

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o 
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

Diseño WEB

Hosting

Google Ads

WordPress

Posicionamiento SEO

cloud-syncearthbullhorn linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram