La Bretagne vue par l'intelligence artificielle
Chronique de JPLM

Publié le 24/12/22 10:06 -- mis à jour le 24/12/22 10:39

Nous autres Bretons, nous ne pourrons pas nous tenir à l’écart de la déferlante de l’intelligence artificielle. Certes, on peut critiquer le mot choisi pour désigner cet ensemble d’algorithmes et de données. Mais n’empêche, il est intéressant de voir comment la Bretagne et les Bretons sont vus et analysés par ces "intelligences".

Toutes nos newsletters et tous nos agrégateurs sont gratuits ! Abonnez-vous !

La plus connue des intelligences artificielles est le moteur de recherche Google. Les moteurs de recherche sont d’une intelligence à la fois limitée et influençable. Ainsi quand je tape "Bretagne", le trio de tête est la page Wikipedia, le site de la région administrative et le site "Tourisme Bretagne" de la même région administrative, avec d’ailleurs, en bas de la page d’accueil, une curieuse carte de Bretagne de 4 départements et demi. Quand je tape "nationalisme breton", les trois premiers sites sont la page Wikipedia sur le nationalisme breton, l’étude universitaire d’un chercheur inconnu et le site antinationaliste breton GRIB.

L’intelligence artificielle peut faire bien d’autres choses que des listes de sites internet. Voyons, dans ce court article, comment la Bretagne et le nationalisme breton sont vus par deux sites utilisant une véritable intelligence artificielle.

S’amuser avec l’intelligence artificielle

Le premier, le plus drôle, est le site degaucheoudedroite ? Les réponses sont générées par une intelligence artificielle, mais il est possible de dire qu’on n’est pas d’accord, ce qui influence les résultats ultérieurs.

Voici ce que j’ai trouvé. Le mot "Bretagne" est de gauche. "Union Démocratique Bretonne" est de gauche. "Parti Breton" est de droite. "Nationalisme breton" est de droite. "Autonomisme" est de droite et de gauche, mais "autonomisme breton" est de gauche. J’apprends aussi que "Jean Pierre Le Mat" est de gauche. Je serais curieux de savoir par quels algorithmes et quelles données piochées sur internet ils en sont arrivés à cette conclusion.

Notons que la dualité droite-gauche, qui semblait universelle après-guerre, ne l’est plus depuis la chute de l’empire soviétique, la fin des décolonisations, ainsi que la fin des Printemps arabes. Elle n’a gardé de l’importance que dans les pays de tradition catholique, en Europe et en Amérique du Sud. Ce site d’intelligence artificielle n’est donc pas multiculturel.

Éclaircir ses idées avec l’intelligence artificielle

Le second site est un site d’openAI, c’est-à-dire d’intelligence artificielle indépendante. Le concept est intéressant et nous ouvre des voies d’avenir. Il existe des systèmes d’exploitation (Linux) et des suites bureautiques (OpenOffice) qui ont été développés de manière communautaire et souvent bénévole. Ces outils sont indépendants des grandes entreprises américaines. La création d’intelligences artificielles "libres" est plutôt une bonne nouvelle.

J’utilise le site OpenAI (https://beta.openai.com/playground). Il faut s’inscrire au préalable. Il répond à des questions posées en anglais, en français ou en breton. Je n’ai pas essayé d’autres langues, mais je pense que tout est possible.

À la question "Qu’est-ce que le nationalisme breton ?", la réponse est : "Le nationalisme breton est un mouvement politique qui cherche à promouvoir l'identité culturelle et linguistique bretonne et à préserver l'autonomie et l'indépendance politique de la Bretagne. Il s'est développé à partir des années 1960 et a été un moteur de l'émancipation de la Bretagne. Il se définit par une volonté de défendre la culture bretonne, sa langue et ses traditions et de s'opposer à l'uniformisation culturelle et linguistique imposée par le gouvernement français."

Je trouve cette réponse tout à fait sensée, même si elle ne concerne que le nationalisme breton d’après-guerre.

Deuxième question : "Quelle différence entre autonomie et indépendance ?".

Réponse : "L'autonomie et l'indépendance sont des concepts similaires qui peuvent être facilement confondus. L'autonomie est le pouvoir de prendre des décisions et de fonctionner sans l'aide ou l'influence d'autres personnes. L'indépendance, en revanche, se réfère à la capacité d'une personne ou d'une organisation à fonctionner sans l'aide ou l'influence d'un autre groupe ou pays. En d'autres termes, l'autonomie se réfère à l'indépendance à l'intérieur d'un groupe ou d'un pays, tandis que l'indépendance se réfère à l'autonomie à l'échelle internationale."

Cette réponse est sans doute insuffisante, mais elle permet d’aborder la question hors des préjugés et des passions partisanes.

Questions en breton

Troisième question "Piv e oa Nominoë ?", la réponse est en français. "Nominoë est le premier roi de Bretagne. Il est né vers 790 et a régné de 845 à 851. Il a été le premier à unifier la Bretagne et à établir la dynastie bretonne des Ducs de Bretagne. Il a également été à l'origine de la création des ordres religieux et des premiers Monastères en Bretagne. Il est considéré comme le fondateur de l'État Breton et est célébré chaque année à l'occasion de la fête de la Saint Nominoë le 8 août."

On peut ne pas être d’accord sur certains points, mais c’est bien résumé. J'aurais sans doute dû écrire "Nevenoe" au lieu de "Nominoë".

Quatrième question : "Petra eo ar Brezhoneg ?".

La réponse est en breton. "Petra eo ar Brezhoneg? Eo ur yezh rannyezhel eus Bro-C'hall, skrivet ivez evel Brezhoneg. Emañ ar yezh e broioù an Norzh ha Norzh-Kreiz Breizh. Ar brezhoneg a vez implijet gant miliadoù a dud er vro-se, a vez komzet ivez er c'hornaouegoù a-bezh e Breizh. Ar brezhoneg a zo unan eus ar yezhoù rannvroel ofisiel e Bro-C'hall."

On peut se moquer du brezhoneg chimik, mais la réponse donne à réfléchir.

L’avenir de l’éducation ?

Les réponses sont certes contestables, mais elles ne sont ni subjectives ni passionnelles. L’intelligence artificielle ne les formule pas au hasard. Elle analyse des millions d’écrits et de statistiques récupérées sur l’internet, et pas seulement sur Wikipedia. Les erreurs sont inscrites quelque part sur l’internet et l’intelligence artificielle ne fait que les collecter.

Là où j’en arrive, c’est que la "culture" des nouvelles générations bretonnes va évoluer. En plus du milieu familial, les anciennes générations bretonnes puisaient leurs convictions dans les livres, dans l’exemple et le témoignage des militants, et aussi chez nos poètes, nos artistes, nos créateurs, nos entrepreneurs. Aujourd’hui, nous avons, en plus, accès à des milliers de sites internet, ainsi qu’à des discussions superficielles et souvent inutiles sur les réseaux sociaux.

Les sites d’intelligence artificielle sont de nouvelles sources d’informations, pour l’instant peu connues. Leur particularité est de donner des réponses synthétiques. On peut bien sûr les contester, je l’ai déjà dit. Mais la clarté et la concision des réponses tranche avec la subjectivité et les développements inutiles des sources traditionnelles. On ne perd pas de temps.

Que des Bretons travaillent sur ces technologies serait une bonne chose pour éclairer l’avenir de la Bretagne.

Voir aussi :

5  0  
mailbox
imprimer
Jean-Pierre Le Mat est chef d'entreprise et auteur. Il a en particulier réédité et complété l'Histoire de Bretagne de Henri Poisson; Patrick Pearse et l'insurrection irlandaise de 1916; les cent vies de l'hermine; Histoire de Bretagne, le point de vue breton; Enquêtes sur les prophéties de Merlin ; Carnet d'un Bonnet rouge ; Ils ont fait la France. Il anime le site contreculture.org.
Vos 19 commentaires
  Jack Leguen
  le Samedi 24 décembre 2022 10:41
D'après le premier site que vous citez, ABP serait de gauche !
(0) 
  Jean Pierre LE MAT
  le Samedi 24 décembre 2022 11:53
C'est vrai. Selon le site, Ouest-France est aussi de gauche. En revanche, le Télégramme et Breizh Info sont de droite...
(0) 
  June
  le Samedi 24 décembre 2022 12:22
Gaël Fleurent c'est de gauche et de de droite
Frank Darcel c'est de gauche
Gaël Briand c'est de gauche
Mathieu Guihard c'est de droite
Rigolo
(0) 
  Jean Pierre LE MAT
  le Samedi 24 décembre 2022 13:40
Je viens de poser à OpenAI une question qui a été d'actualité, du fait d'une exposition rennaise foireuse.
les Bretons sont-ils des Celtes?
Réponse : "Oui, les Bretons sont des Celtes. La Bretagne est l'une des régions celtiques les plus anciennes et, à ce titre, les Bretons se considèrent comme des Celtes, avec leurs propres coutumes, langue et culture. Les origines de la culture celtique en Bretagne remontent à l'âge du bronze, mais leur culture a été influencée par les Celtes des îles Britanniques, les Saxons et les Normands."
(4) 
  Jean Pierre LE MAT
  le Samedi 24 décembre 2022 14:03
Il ne faut pas oublier que l'intelligence artificielle analyse et synthétise un nombre de documents énorme, sans commune mesure avec ce que peut faire une équipe de chercheurs, même s'ils sont tous surdiplômés.
(2) 
  KLG
  le Samedi 24 décembre 2022 16:01
Pays de la Loire, c'est de droite
Nantes, c'est de gauche
Angers c'est de droite
Rennes c'est de gauche
Vannes c'est de droite
France c'est de gauche et de droite
Macron, c'est de droite
Alsace c'est de droite
Sans blague...
(4) 
  Thomas
  le Dimanche 25 décembre 2022 05:12
Oui mais non.
De la même manière que google donne un score à chaque page, "degaucheoudedroite" va donner un score à chaque mot.
L'exemple de "Autonomisme" démontre bien ceci avec 0.5 à gauche 0.5 à droite mais si on y ajoute breton alors le résultat tend vers 0.6 à gauche et 0.4 à droite car breton a un score de 0.7 à gauche et 0.3 à droite ((0.5+0.7)/2=0.6 et (0.5+0.3)/2=0.4), etc
Ainsi on peut facilement truquer le score en modifiant les données entrées. Ceci est d'ailleurs une pratique très courante sur google car l'algorythme qualifie par la quantification.
De plus, comme vous le soulignez, "Les erreurs sont inscrites quelque part sur l’internet et l’intelligence artificielle ne fait que les collecter."
Pour contrer ce problème d'erreur, il lui suffit juste de comparer les sources ce qui mettra en avant les différences et, celles-ci, seront qualifiées de la même manière (par quantification).
Les avancées grâce à ces systèmes de quantification sont bien sûr énormes par exemple, dans le domaine de la santé, et spécifiquement du diagnostic, l'ordinateur possédant une base de données sans limites pour comparer différents clichés même les plus incongrus.
De la même manière, on pourrait analyser l'ensemble des phonèmes des enregistrements d'anciens parlant bretons pour en déterminer les sonorités et ainsi se rapprocher du breton parlé avant la césure de l'après guerre.
Donc oui mais ce n'est pas de l'intelligence artificielle qui est la capacité pour l'ordinateur à résoudre de nouveaux problèmes, à extrapoler les données collectées.
Et, pour le moment, l'ia en est encore à un stade expérimental, très loin de toutes applications concrêtes.
Il y a beaucoup plus à faire dans l'optimisation des flux interhumains. Par exemple, waytome.
(2) 
De V. Velluire à Thomas
 le Lundi 26 décembre 2022 18:19
"L'exemple de "Autonomisme" démontre bien ceci avec 0.5 à gauche 0.5 à droite mais si on y ajoute breton alors le résultat tend vers 0.6 à gauche et 0.4 à droite car breton a un score de 0.7 à gauche et 0.3 à droite ((0.5+0.7)/2=0.6 et (0.5+0.3)/2=0.4), etc" Je n'ai absolument pas compris où vous vouliez en venir. Vous confirmez plutôt la pertinence de l'algorithme là en fait...c'est tout à fait normal et cohérent que pour "autonomisme" et à "autonomisme breton" le résultat ne soit pas calculé de la même façon.
(0) 
De Thomas à Thomas
 le Mardi 27 décembre 2022 10:56
@V. Velluire Le but était d'expliquer que le calcul est le même pour "autonomisme" et "breton et que l'ensemble est additionné pour trouver la valeur de "autonomisme breton". Le site utilise GPT3 et les premières "réponses" ont été initiées par l'auteur (plus de détails ici : https://theo.delemazure.fr/blog/degaucheoudedroite/histoire.html) En citant l'auteur du site, pour aussi répondre à l'auteur de l'article sur pourquoi son nom est de gauche, "90% des nouvelles requêtes étaient les prénoms et les noms des utilisateurs du site[...]l'IA ne faisaient sûrement pas mieux que de l'aléatoire pour ce genre de proposition". Et autre exemple pour démontrer l'absence de pertinence de cet algo "si deux tiers des utilisateurs ne sont pas d'accord avec le résultat d'une recherche donnée, alors le résultat est modifié" Il n'y a donc pas d'intelligence derrière ce bot, juste un peu de maths et l'avis des humains. Pour compléter, les vidéos plutôt anciennes de Samuel Arzt vous démontreront à quel point l'IA est laborieuse sur des choses basiques et qu'il est à l'heure actuelle plus simple de coder directement des instructions que laisser faire la machine. Ou autre exemple, rechercher GPT3 et patient.
(1) 
  Al Coin
  le Mardi 27 décembre 2022 09:25
À mon humble avis.
L'intelligence humaine/biologique, souvent bien artificielle a ses "raisons", que l"I A robotique (intelligence relative) n'a pas!
L'I.A humaine a beau jeu de traiter la seconde avec un certain mépris, mais au moins celle-ci ne juge, ne truque, mais rationalise sur les quelques seuls postulats logiques établis "
et qui lui sont/seraient transmis pour être cogités"! Cogito, ergo sum? L'Homme qui ne fait que répèter ce que d'autres pensent, ou répètent eux-mêmes pensent-ils réellement? Et sont-ils donc réellement des "je suis" libres?
Si seulement la "
bio" transmet à la "méca" des arguments ou autres qui présenteraient des cohérences et réalités rationnelles, ,des comparaisons ayant logique imparable avec celle qui lui apparaitrait logiques avec des faits historiques similaires existants ou ayant existé, et présentant bien des caractéristiques identiques dans les applications sociales, culturelles et politiques, l'I.A "méca" ne peut que déduire des analyses logiques (qui toutes comme de bien entendu ne plairont pas aux braves humains, qui ont pour cela toujours de "bonnes raisons"!
De la connaissance de ces applications politiques et de gouvernances aux sociétés sur la planète, et dans diverses sociétés humaines, par l'Homme qui les aurait honnêtement dénombrées et soumises à la rigueur robotique, si cette connaissance lui est apportée pour analyse,elle ne peut qu'en retirer des conclusion logiques, sinon ne pas faire mieux que Dupont T ou D accoudé au zinc répétant les infos de la bande des quatre reines de l'info en France.
(0) 
  Jean Carfantan
  le Jeudi 29 décembre 2022 10:00
J'utilise l'application de openAI whisper pour transcrire du français ou de l'anglais, de l'oral à l'écrit. C'est pratique pour transposer des conférences ou des notes dictées. À quand pourra-t-on ajouter le breton?
(voir le site)
(0) 
De Thomas à Jean Carfantan
 le Jeudi 29 décembre 2022 13:55
Le breton est présent dans tokenizer.py mais la documentation ne l'inclue que dans la partie traduction, pas dans la partie reconnaissance (avec 269 heures?). Avez vous essayez "--language br" ? A titre d'autre exemple, le package de Common voice de mozilla en est quand à lui à 42% avec 26k heures enregistrées dont 16k validées. Vous pouvez aussi créer votre propre transcripteur avec, par exemple, DeepSpeech.
(1) 
De Gweltaz DG à Jean Carfantan
 le Dimanche 8 janvier 2023 11:21
Bonjour, L'adaptation de ces technologies pour le breton est déjà en cours. L'office public de la langue bretonne fait développer des modèles de synthèse vocale, reconnaissance vocale et traduction automatique (dans les deux sens) qui dépassent largement les résultats obtenus par les technologies précédentes. De mon côté je travaille également (bénévolement) sur un modèle pour la reconnaissance vocale en breton. Vous pouvez déjà le tester le prototype ici (https://github.com/gweltou/Vosk-bzg) Il n'est pas encore assez efficace pour être utilisé sur des vraies tâches mais ça peut donner une idée. Le problème est le manque de données alignés (audio/texte) pour la langue bretonne. On peut contourner le problème en utilisant des modèles pré-entraînés sur un tas de langues différentes, puis l'adapter au breton avec peu de données (c'est le cas du modèle Wav2vec 2.0 de Facebook, par ex). Je n'ai pas bien compris le message de Thomas ni à quoi correspondent les nombres d'heures et les pourcentages qu'il donne mais je peux affirmer que créer son propre transcripteur n'est, pour le moment, pas une tâche à la portée de tout le monde ! :D
(0) 
  Naon-e-dad
  le Jeudi 29 décembre 2022 12:52
Peut-être est-ce l’occasion de réfléchir un peu.
.
Basiquement, un ordinateur sait faire trois choses :
. comparer deux quantités
. copier (et donc déplacer) du contenu
. additionner (en binaire), et de-là soustraire (par une astuce technique), multiplier, diviser, porter une puissance n , etc…
.
Apparemment, nous sommes dans le domaine de la simple arithmétique. Pourtant, si l’on attribue par convention un caractère alphabétique ou spécial à une valeur binaire (code EBCDIC en IBM, codes ASCII ou ASCII étendu dans l’univers PC) on peut manipuler des chaines de caractères, autrement dit du texte (correspondant à une langue naturelle : english, français, brezhoneg, etc…). La machine est-elle pour autant rentrée sur le territoire de l’intelligence ? Evidemment non. Un mot est considéré de l’extérieur comme un objet. Il est possible de comparer deux mots (sont-ils identiques ou non ?), et donc faire du classement, des recherches, des rapprochements textuels, etc… Rentrer dans la sémantique ou la compréhension est tout autre chose.
.
Ces actions sur des contenus « mémoire » ou données sont mises-en-oeuvre par des « instructions », qui peuvent être très simples ou plus complexes… Un « langage » n’est rien d’autre qu’un catalogue d’instructions, un répertoire dans lequel le programmeur-concepteur puisera pour rédiger un programme (un algorithme).
.
Les langages sont classés selon une typologie qui va du plus proche de la machine au plus proche de l’humain :
. langage binaire (suite de 0 et d e1, strictement illisible, qui s’exécute sur le processeur)
. langage de type assembleur (Assembleur 370 IBM, assembleur 86 sur processeur Microsoft,..). Le spécialiste peut déjà intervenir.
. langage « évolué » (Cobol en gestion, C,…). Accessible à l’informaticien développeur, généraliste.
Jusqu’ici, le cheminement des actions (l’algorithmique) est conçue et maitrisée par l’humain, auteur du programme informatique. Nous sommes dans le domaine de l’informatique « procédurale », classique.
.
La machine est-elle intelligente, au sens où l’on parle d’intelligence humaine ? Evidemment non. Par contre, elle est plus performante que l’humain. C’est même tout son intérêt que de « traiter » rapidement des séries de données. Pour une opération unitaire, quelle qu’elle soit, autant tout faire soi-même à la main. L’informatique ne se justifie que si une certaine volumétrie est en jeu.
.
. plus récemment se sont généralisés les langages « à objets », utilisés dans la programmation internet
.
L’on franchit encore un degré dans la généralité. Le cheminement (de programme en programme, ou de macro-instruction à macro-instruction) et la transformation du jeu de données initiales, dépend lui -même des transformations ou résultats intermédiaires. Cependant, il est important de garder en vue que derrière l’apparente complexité, in fine c’est toujours la simplicité qui règne.
.
Y-a-t-il une once d’intelligence dans la machine ? Comprend-elle quoi que ce soit à ce qu’elle fait ? Toujours pas. Et ce n’est pas demain la veille ni l’avant-veille.
.
Tout cela est utile et suscite l’admiration, et nous amène vers des possibles insoupçonnés jusqu’alors. Fabuleux ou tristes jusqu’à l’insondable, c’est selon ce que nous déciderons d’en faire. Comme pour l’atome. Le meilleur ou le pire. Voilà notre responsabilité. Et voilà pourquoi il vaut mieux réfléchir, un peu, avant.
.
Pour en revenir aux résultats proposés dans l’article. Le résultat est assez impressionnant. Cependant, les phrases fournies en réponse (même si elles proviennent d’assemblages divers) ont été rédigées à un moment ou à un autre par une intelligence humaine (bizarrerie ou maladresse syntaxique comprise : « Eo ur yezh rannyezhel »).
.
A propos, où en est l’ambitieux projet d’un traducteur français-breton ? Je crains le pire, ou plutôt je crains que l’on aboutisse à du breton qui structurellement ne serait que du français déguisé, à peine colorié (comme on le voit parfois dans de médiocres traductions réalisées par des gens qui peinent à changer de schéma d’expression et restent mentalement dans le français, plus familier sans doute). Mais traduire, c’est prendre le risque de se déplacer vers un autre territoire. C’est gambader vers une autre expression de soi-même, ce n’est pas mimer le voisin. La part d’originalité doit être défendue, utilisée, vivifiée. Gant ma chomo bev ha dispar, evit gwir, hon brezhoneg.
.
Setu. Bravig eo ar stlenneg. Galloudus eo an urzhiater. Padal…chom a ra den an den. Chom a ra mekanik ar mekanik.
.
(2) 
De Jack Leguen à Naon-e-dad
 le Jeudi 29 décembre 2022 16:14
Dans votre analyse de l'IA je suis surpris que vous ignorez complètement le deep learning...
(0)