Meta presenta modelo para la transcripción de voz a texto en más de 1500 idiomas

Esta semana la compañía Meta presentó un modelo que puede hacer transcripción de voz a texto en más de 1000 idiomas, gracias a sus capacidades de reconocimiento automático del habla.

Al respecto, el sistema puede transcribir más de 1600 idiomas, incluyendo los menos representados. En este punto, se incluyen 500 idiomas que nunca antes habían sido transcritos por la inteligencia artificial (IA).

De acuerdo con lo señalado por la compañía, esto se considera “un avance significativo hacia un sistema de transcripción verdaderamente universal”. Así pues, Meta busca reducir la brecha que existe con la tecnología de reconocimiento automático del habla.

Meta lleva a más de 1500 idiomas la transcripción de voz a texto

Para lograr este tipo de transcripción en miles de idiomas, Meta desarrolló y perfeccionó los sistemas de reconocimiento automático de voz. Estos sistemas requieren de grandes volúmenes de datos de un idioma para poder transcribir el audio de manera precisa.

Aunque esto no es un problema para los idiomas más conocidos en el mundo, no ocurre lo mismo con las lenguas menos habladas. Ante esto, Meta consiguió una solución: crear un enfoque basado en el aprendizaje contextual.

Esta nueva técnica permite que los sistemas puedan hacer transcripciones de “calidad aceptable” a partir de una pequeña cantidad de ejemplos de audio y texto de dicho idioma. De modo que el reconocimiento de voz se hace más accesible, incluso cuando no hay mucha información.

Si bien el rendimiento sin ejemplos de aprendizaje aún no alcanza el de los sistemas completamente entrenados, ofrece una vía mucho más escalable para incorporar nuevos idiomas al ámbito digital”, señaló la compañía en su blog de IA.

De esta manera, la compañía quiere hacer más accesible la tecnología de reconocimiento automático del habla (ASR, por sus siglas en inglés). Es bien sabido que los sistemas de conversión de voz a texto de alta calidad suelen estar limitados a los idiomas más comunes.

Esto se debe a que son los idiomas que cuentan con más recursos de datos para entrenar a los modelos de inteligencia artificial. Sin embargo, esto se traduce en que la transcripción avanzada no llega de igual forma a los idiomas poco conocidos.

Herramienta de reconocimiento automático del habla

Entre las herramientas de reconocimiento automático del habla desarrolladas por Meta está Omnilingual ASR. Se trata de un conjunto de modelos que puede hacer transcripciones en más de 1600 idiomas, incluyendo 500 pocos conocidos.

Según datos de la compañía, Omnilingual ASR “alcanza un rendimiento de vanguardia en más de 1600 idiomas, con tasas de error de caracteres inferiores al 10% en el 78% de ellos”. 

Por otra parte, la tasa de error de caracteres es inferior al 10 % en el 36 % de los casos respecto a los idiomas con pocos recursos y menos de 10 horas de entrenamiento. Esto se traduce en que las comunidades lingüísticas más pequeñas tendrán acceso a esta tecnología.

Así pues, con este modelo de reconocimiento automático del habla, Meta amplía la transcripción de voz a texto a personas hablantes de 1600 idiomas, llevando la tecnología a más lugares.

Información de La Vanguardia / redacción Tecnoflash

No dejes de leer: Traductor de Google podría estrenar nuevas funciones: Conoce los modos de uso


Usa la tecnología con inteligencia, únete a nuestras redes sociales hoy

Instagram

Telegram

X (Twitter)

TikTok

YouTube

Más del Autor

Artículos Relacionados

Últimas publicaiones

Meta impulsa su nuevo centro de datos sostenible con madera laminada

La compañía tecnológica Meta está construyendo un centro de datos sostenible en Carolina del Sur, Estados Unidos, sustituyendo los materiales del carbono y el...

Gemini llega a Mac: Google lanza su app oficial para potenciar el flujo de trabajo

El miércoles 15 de abril Google lanzó oficialmente la aplicación de Gemini para computadoras Mac, por lo que usuarios de Apple podrán acceder de...

Filtran nuevos juegos para PlayStation Plus Extra y Premium: conoce cuáles son

Según filtraciones de billbil-kun y el portal Dealabs, Sony se prepara para actualizar el catálogo de PlayStation Plus Extra y Premium este 21 de...

Roblox lanzará cuentas Kids y Select para reforzar la seguridad de los menores

Roblox anunció esta semana que está trabajando en el lanzamiento de sus nuevas cuentas Kids y Select, diseñadas para reforzar la protección de los...

iPhone 18 Pro promete cautivar con un nuevo color

Aunque el iPhone 18 Pro aún se vislumbra en el horizonte, las filtraciones actuales sugieren un escenario inusual: un año marcado por el continuismo...