Google Translate apprend 24 nouvelles langues à l’aide d’une nouvelle technique d’apprentissage automatique

Au fil du temps et de la mise en place de nouvelles fonctionnalités, Google Translate se rapproche de plus en plus du Star Trek Universal Translator. En parlant de cela, 24 nouvelles langues ont été annoncées sur la scène Google I/O. En soi, vous pourriez penser qu’il n’y a rien d’extraordinaire. En fait, ce qui est particulièrement curieux, c’est la manière dont ces langues ont été insérées dans Google Translate. Ce sont les premières formes de langage ajoutées grâce à l’utilisation de la traduction automatique dite Zero-Shot, c’est-à-dire un modèle d’apprentissage automatique qui apprend à traduire dans une autre langue sans avoir d’exemples. écrits concrets.

Pour arriver à affiner cette technique particulière d’apprentissage automatique, nous avons d’abord travaillé sur des langues connues, comme l’espagnol et l’allemand. Évidemment les résultats obtenus ne seront pas parfaits à 100%, mais c’est une avancée significative qui rendra Google Translate de plus en plus puissant. Il existe également une liste de ces 24 nouvelles langues, parlées par quelque 300 millions de personnes dans le monde. Vous n’avez probablement jamais entendu parler de certains d’entre eux !

Assamais, utilisé par environ 25 millions de personnes dans le nord-est de l’Inde
Aymara, utilisé par environ 2 millions de personnes en Bolivie, au Chili et au Pérou
Bambara, utilisé par environ 14 millions de personnes au Mali
Bhojpuri, utilisé par environ 50 millions de personnes dans le nord de l’Inde, au Népal et aux Fidji
Dhivehi, utilisé par environ 300 000 personnes aux Maldives
Dogri, utilisé par environ 3 millions de personnes dans le nord de l’Inde
Ewe, utilisé par environ 7 millions de personnes au Ghana et au Togo
Guarani, utilisé par environ 7 millions de personnes au Paraguay, en Bolivie, en Argentine et au Brésil
Ilocano , utilisé par environ 10 millions de personnes dans le nord des Philippines
Konkani, utilisé par environ 2 millions de personnes dans le centre de l’Inde
Krio, utilisé par environ 3 millions de personnes en Sierra Leone
Kurde (Sorani), utilisé par environ 8 millions de personnes, principalement en Irak
Lingala, utilisé par environ 45 millions de personnes en République démocratique du Congo, en Angola, au Soudan du Sud
Luganda, utilisé par environ 20 millions de personnes en Ouganda et au Rwanda
Maithili, utilisé par environ 34 millions de personnes dans le nord de l’Inde
Meiteilon (Manipuri), utilisé par environ 2 millions de personnes dans le nord-est de l’Inde
Mizo, utilisé par environ 830 000 personnes dans le nord-est de l’Inde
Oromo, utilisé par environ 37 millions de personnes en Éthiopie et au Kenya
Quechua, utilisé par environ 10 millions de personnes au Pérou, en Bolivie, en Équateur et dans d’autres pays voisins
Sanskrit, utilisé par environ 20 000 personnes en Inde
Sepedi, utilisé par environ 14 millions de personnes en Afrique du Sud
Tigrinya, utilisé par environ 8 millions de personnes en Érythrée et en Éthiopie
Tsonga, utilisé par environ 7 millions de personnes à Eswatini, au Mozambique, en Afrique du Sud et au Zimbabwe
Twi, utilisé par environ 11 millions de personnes au Ghana

Laisser un commentaire