Aujourd'hui l'entreprise américaine Alphabet a annoncé sur le blog de Google ajouter 110 nouvelles langues aux 133 déjà disponibles pour Google Traduction dont le breton, l'occitan, le manxois, le tahitien, le créole des Seychelles et celui de l'ile Maurice, le berbère (le Tamazight), le tatare de Crimée et un grand nombre de langues africaines. Ce sont principalement des langues minoritaires. Google a d'ailleurs déclaré avoir entendu les demandes des militants et des linguistes concernés par le futur de ces langues souvent menacées.
Abkhaz, Acehnese, Acholi, Afar, Alur, Avar, Awadhi, Balinese, Baluchi, Baoulé, Bashkir, Batak Karo, Batak Simalungun, Batak Toba, Bemba, Betawi, Bikol, Breton, Buryat, Cantonese, Chamorro, Chechen, Chuukese, Chuvash, Crimean Tatar, Dari, Dinka, Dombe, Dyula, Dzongkha, Faroese, Fijian, Fon, Friulian, Fulani, Ga, Hakha Chin, Hiligaynon, Hunsrik, Iban, Jamaican Patois, Jingpo, Kalaallisut, Kanuri, Kapampangan, Khasi, Kiga, Kikongo, Kituba, Kokborok, Komi, Latgalian, Ligurian, Limburgish, Lombard, Luo, Madurese, Makassar, Malay (Jawi), Mam, Manx, Marshallese, Marwadi, Mauritian Creole, Meadow Mari, Minang, Nahuatl (Eastern Huasteca), Ndau, Ndebele (South), Nepalbhasa (Newari), NKo, Nuer, Occitan, Ossetian, Pangasinan, Papiamento, Portuguese (Portugal), Punjabi (Shahmukhi), Q'eqchi', Romani, Rundi, Sami (North), Sango, Santali, Seychellois Creole, Shan, Sicilian, Silesian, Susu, Swati, Tahitian, Tamazight, Tamazight (Tifinagh), Tetum, Tibetan, Tiv, Tok Pisin, Tongan, Tswana, Tulu, Tumbuka, Tuvan, Udmurt, Venda, Venetian, Waray, Wolof, Yakut, Yucatec Maya, Zapotec.
Google utilise son nouveau modèle basé sur l'IA, appelé Pathways Language Large Model 2. Ce modèle réduit la nécessité de construire de vastes corpus de milliers de phrases traduites (les corpus dits alignés). Un problème pour les petites langues comme le breton. L'intelligence artificielle permet une approche dynamique influencée à la fois par l'usage et le contexte au sein des phrases. Chaque mot est représenté par un vecteur principal correspondant à son sens principal, mais il peut également posséder plusieurs autres vecteurs pondérés pour ses sens alternatifs, y compris des nuances dialectales. La force de ces vecteurs varie en fonction du contexte et des autres mots de la phrase. Le vecteur avec l'amplitude la plus forte donne la traduction du mot dans une phrase donnée.
Pathways Language Model 2 repose sur une architecture qui optimise l'apprentissage et le traitement des données en dirigeant dynamiquement les tâches à travers des sous-réseaux spécialisés pour l'oral, l'écrit et les images. Cette approche améliore significativement l'efficacité et les performances du modèle dans diverses tâches de traitement du langage naturel. Cette approche multi-vectorielle et contextuelle va , on l'espère, catapulter le breton au même niveau que toute autre langue.
Le traducteur accepte un collage d'un texte jusqu'à 5000 caractères à la fois ( à comparer avec le traducteur de Ofis Publik ar brezhoneg qui ne prend que 400 caractères) . ABP a traduit l'article écrit en breton ( voir notre article ) et voici le résultat étonnant donné par Google traduction :
L'appropriation culturelle dit que tout signifie la même chose. La neutralité dit qu’il n’y a plus rien qui ait un sens. Le déconstructionnisme dit que le passé ne veut rien dire. Voici trois vents effrayants qui rendent nos terres stériles ; des vents violents qui frappent les murs de nos maisons. Faut-il partir en vacances ? C’est l’une des questions que vous trouverez dans mon livre « Faiblesses » récemment publié.
Je me concentre sur des sujets contemporains : le blasphème, les fêtes islamiques, les foules, les frontières, la violence politique, l'intrusion extraterrestre, le robot et l'homme, l'homme et les animaux, le drame, la realpolitik, la liberté d'expression, les femmes et les hommes, la culture en déclin, l'autonomisation, les voyages interstellaires. , la nécessité d'affirmer le « moi masculin » , le « moi masculin » étant ici tout ce que nous héritons de nos parents et de notre éducation.
En conclusion, l'ouvrage se termine par cette proposition : trouver un accord global pour la Bretagne, à la fois culturel, politique et anthropologique. --fin de la traduction en français
Une traduction assez remarquable !
Comme Google prévoit 1000 langues on peut même espérer de voir un jour le gallo.
Les contributeurs d'ABP peuvent dès maintenant créer une version en français de leur article en breton et vice-versa, à condition de faire une relecture.
Comme l'entreprise Alphabet est aussi propriétaire de Youtube, il va de soi que le sous-titrage automatique en français des vidéos en breton et vice-versa va arriver très bientôt. En attendant, vous pouvez dorénavant traduire les fichiers chronométrés de sous-titres, fichiers SBV ou SRT, avec Google traduction et les envoyer sur Youtube avec votre vidéo.
12 | 0 | Tweet |
|