Meta lanza el conjunto de modelos de IA Seamless para favorecer traducciones más auténticas y expresivas

La compañía presentó SeamlessM4T a finales de agosto, cuando comentó que esta herramienta era capaz de realizar traducciones y transcripciones de casi cien idiomas para texto.

22 de diciembre 2023, 04:27hs

Meta lanza el conjunto de modelos de IA Seamless para favorecer traducciones más auténticas y expresivas

Meta anunció un conjunto de modelos de inteligencia artificial (IA) que se agrupan en el modelo Seamless, que admite reconocimiento de voz automático y hacer traducciones más precisas.

Estas últimas, con el nuevo avance, podrán conservar las matices y la autenticidad de los distintos idiomas que soporta.

La compañía presentó SeamlessM4T a finales de agosto, cuando comentó que esta herramienta era capaz de realizar traducciones y transcripciones de casi cien idiomas para texto.

Además, habían informado que podía también transcripciones de 36 a voz como parte de sus trabajos para el desarrollo de un traductor universal.

En concreto, sigue un enfoque de sistema único para reducir los errores y los retrasos en los procesos de traducción.

Así, aprovecha avances alcanzados con otros modelos de la marca, como No Language Left Behind, el traductor universal de voz y los modelos de voz multilingüe masivos.

NUEVAS HERRAMIENTAS DE IA

La compañía anunció nuevas herramientas de IA, que se integran en el conjunto de modelos Seamless Comunication.

Este está compuesto por el mencionado SeamlessM4T y los modelos SealmessExpressive, SeamlessStreaming y Seamless

La actualización de SeamlessM4T a una segunda versión (v2), demuestra mejoras en el rendimiento para las capacidades de reconocimiento automático de voz a voz, voz a texto y texto a voz.

A su vez, dio a conocer SeamlessExpression, que “aborda ciertos aspectos poco explorados de la prosodia”.

INVESTIGACIONES EN EL HABLA

En esta línea, detalló que investiga cuestiones “como la velocidad del habla y las pausas para el ritmo, preservando la emoción y el estilo”, según ha matizado en una nota de prensa.

Por el momento, este modelo de IA generativa respeta dichos aspectos del habla en la traducción de voz a voz en distintos idiomas: inglés, español, alemán, francés, italiano y chino.

El modelo SeamlessStreaming traduce conversaciones en tiempo real, con una latencia de dos segundos.

Esto es a diferencia de los sistemas convencionales, que traducen la oración una vez el usuario ha terminado de hablar.

Meta confirmó que Seamless Streaming admite el reconocimiento automático de voz y la traducción de voz a texto para casi cien idiomas de entrada y salida.

También indicaron que permite la traducción de voz a voz para casi cien idiomas de entrada y 36 de salida.

Finalmente, Seamless se presenta como un modelo que funciona las capacidades de SeamlessExpressed, SeamlessStreaming y SeamlessM4T v2, según ha matizado en su página web.

Fuente: EP.