Durante años, el Traductor de Google ha ayudado a derribar las barreras lingüísticas y a conectar a las comunidades de todo el mundo. Y en Google quieren hacer esto posible para aún más personas, especialmente aquellas cuyos idiomas no están representados en la mayoría de la tecnología. Así que recientemente han agregado 24 nuevos idiomas al Traductor, que ahora tiene soporte para un total de 133 idiomas utilizados alrededor del mundo.
Más de 300 millones de personas hablan estos idiomas recién agregados, como mizo, utilizado por alrededor de 800.000 personas en el extremo noreste de la India, y lingala, usado por más de 45 millones de personas en África Central. Como parte de esta actualización, las lenguas indígenas de América (quechua, guaraní y aimara) y un dialecto del inglés (krio de Sierra Leona) también se han agregado al Traductor por primera vez.
Aquí tienes una lista completa de los nuevos idiomas disponibles en el Traductor de Google:
- Assamese, utilizado por cerca de 25 millones de personas en el noreste de la India.
- Aimara, utilizado por cerca de dos millones de personas en Argentina, Bolivia, Chile y Perú.
- Bambara, utilizado por unos 14 millones de personas en Malí.
- Bhojpuri, utilizado por unos 50 millones de personas en el norte de la India, Nepal y Fiji.
- Dhivehi, utilizado por cerca de 300.000 personas en las Maldivas.
- Dogri, utilizado por cerca de tres millones de personas en el norte de la India.
- Ewe, utilizado por alrededor de siete millones de personas en Ghana y Togo.
- Guaraní, utilizado por cerca de siete millones de personas en Paraguay y Bolivia, Argentina y Brasil.
- Ilocano, utilizado por unos 10 millones de personas en el norte de Filipinas.
- Konkani, utilizado por cerca de dos millones de personas en la India central.
- Krio, utilizado por alrededor de cuatro millones de personas en Sierra Leona.
- Kurdo (sorani), utilizado por cerca de ocho millones de personas, principalmente en Irak.
- Lingala, utilizado por unos 45 millones de personas en la República Democrática del Congo, la República del Congo, la República Centroafricana, Angola y la República de Sudán del Sur.
- Luganda, utilizado por alrededor de 20 millones de personas en Uganda y Ruanda.
- Maithili, utilizado por cerca de 34 millones de personas en el norte de la India.
- Meiteilon (manipuri), utilizado por alrededor de dos millones de personas en el noreste de la India.
- Mizo, utilizado por cerca de 830.000 personas en el noreste de la India.
- Oromo, utilizado por unos 37 millones de personas en Etiopía y Kenia.
- Quechua, utilizado por alrededor de 10 millones de personas en Argentina, Perú, Bolivia, Ecuador y países circundantes.
- Sánscrito, utilizado por unas 20.000 personas en la India.
- Sepedi, utilizado por cerca de 14 millones de personas en Sudáfrica.
- Tigrinya, utilizado por alrededor de ocho millones de personas en Eritrea y Etiopía.
- Tsonga, utilizado por unos siete millones de personas en Suazilandia, Mozambique, Sudáfrica y Zimbabwe.
- Twi, utilizado por alrededor de 11 millones de personas en Ghana.
Este es también un hito técnico para el Traductor de Google. Estos son los primeros idiomas que han agregado utilizando la traducción automática Zero-Shot, donde un modelo de aprendizaje automático sólo ve texto monolingüe, es decir, aprende a traducir a otro idioma sin haber visto nunca antes un ejemplo. Si bien esta tecnología es impresionante, no es perfecta. Y seguirán mejorando estos modelos para ofrecerle al usuario la misma experiencia a la que está acostumbrado para una traducción al español o al alemán, por ejemplo.
Por parte del equipo de Google, estań muy agradecidos con los muchos hablantes nativos, profesores y lingüistas que trabajaron con ellos en esta última actualización y les mantuvieron inspirados con su pasión y entusiasmo.
No hay comentarios.:
Publicar un comentario