Meta presenta modelo para la transcripción de voz a texto en más de 1500 idiomas

Esta semana la compañía Meta presentó un modelo que puede hacer transcripción de voz a texto en más de 1000 idiomas, gracias a sus capacidades de reconocimiento automático del habla.

Al respecto, el sistema puede transcribir más de 1600 idiomas, incluyendo los menos representados. En este punto, se incluyen 500 idiomas que nunca antes habían sido transcritos por la inteligencia artificial (IA).

De acuerdo con lo señalado por la compañía, esto se considera “un avance significativo hacia un sistema de transcripción verdaderamente universal”. Así pues, Meta busca reducir la brecha que existe con la tecnología de reconocimiento automático del habla.

Meta lleva a más de 1500 idiomas la transcripción de voz a texto

Para lograr este tipo de transcripción en miles de idiomas, Meta desarrolló y perfeccionó los sistemas de reconocimiento automático de voz. Estos sistemas requieren de grandes volúmenes de datos de un idioma para poder transcribir el audio de manera precisa.

Aunque esto no es un problema para los idiomas más conocidos en el mundo, no ocurre lo mismo con las lenguas menos habladas. Ante esto, Meta consiguió una solución: crear un enfoque basado en el aprendizaje contextual.

Esta nueva técnica permite que los sistemas puedan hacer transcripciones de “calidad aceptable” a partir de una pequeña cantidad de ejemplos de audio y texto de dicho idioma. De modo que el reconocimiento de voz se hace más accesible, incluso cuando no hay mucha información.

Si bien el rendimiento sin ejemplos de aprendizaje aún no alcanza el de los sistemas completamente entrenados, ofrece una vía mucho más escalable para incorporar nuevos idiomas al ámbito digital”, señaló la compañía en su blog de IA.

De esta manera, la compañía quiere hacer más accesible la tecnología de reconocimiento automático del habla (ASR, por sus siglas en inglés). Es bien sabido que los sistemas de conversión de voz a texto de alta calidad suelen estar limitados a los idiomas más comunes.

Esto se debe a que son los idiomas que cuentan con más recursos de datos para entrenar a los modelos de inteligencia artificial. Sin embargo, esto se traduce en que la transcripción avanzada no llega de igual forma a los idiomas poco conocidos.

Herramienta de reconocimiento automático del habla

Entre las herramientas de reconocimiento automático del habla desarrolladas por Meta está Omnilingual ASR. Se trata de un conjunto de modelos que puede hacer transcripciones en más de 1600 idiomas, incluyendo 500 pocos conocidos.

Según datos de la compañía, Omnilingual ASR “alcanza un rendimiento de vanguardia en más de 1600 idiomas, con tasas de error de caracteres inferiores al 10% en el 78% de ellos”. 

Por otra parte, la tasa de error de caracteres es inferior al 10 % en el 36 % de los casos respecto a los idiomas con pocos recursos y menos de 10 horas de entrenamiento. Esto se traduce en que las comunidades lingüísticas más pequeñas tendrán acceso a esta tecnología.

Así pues, con este modelo de reconocimiento automático del habla, Meta amplía la transcripción de voz a texto a personas hablantes de 1600 idiomas, llevando la tecnología a más lugares.

Información de La Vanguardia / redacción Tecnoflash

No dejes de leer: Traductor de Google podría estrenar nuevas funciones: Conoce los modos de uso


Usa la tecnología con inteligencia, únete a nuestras redes sociales hoy

Instagram

Telegram

X (Twitter)

TikTok

YouTube

Más del Autor

Artículos Relacionados

Últimas publicaiones

PlayStation 6: ¿Por qué llegará más tarde de lo previsto?

El ciclo de vida de las consolas suele ser un terreno de especulaciones constantes, y la PlayStation 6 (PS6) no es la excepción. Aunque...

Magia y tecnología: Así es la nueva tablet Xiaomi inspirada en Harry Potter

Xiaomi presentó oficialmente su nueva tablet Redmi Pad 2 Pro, una edición especial con temática de Harry Potter, cuyo diseño estético está inspirado en...

OpenAI prepara su primer dispositivo de hardware: todo apunta a unos auriculares

La compañía OpenAI está trabajando para anunciar su primer dispositivo de hardware en el segundo semestre de este año de 2026 y, aunque la...

Semana clave de estrenos de videojuegos en PC, PlayStation, Xbox y Switch

La tercera semana de enero de 2026 ha puesto después de las fiestas una ración de estrenos de videojuegos bien cargada para todas las...

Google estrena “inteligencia personal” de Gemini para respuestas más personalizadas

Esta semana Google anunció el lanzamiento de la “inteligencia personal” de Gemini, su asistente de inteligencia artificial (IA). Con esta innovación, la IA podrá...