France World

Sur Facebook, le fiasco de la modération en langue arabe

Par Martin Untersinger

Publié hier à 13h00, mis à jour hier à 16h27

Réservé à nos abonnés

EnquêteFacebook Files | Les documents internes de l’entreprise montrent son inertie face aux dysfonctionnements occasionnés par son défaut de maîtrise de la troisième langue du réseau social.

Pourquoi y a-t-il eu davantage de contenus identifiés comme violents et terroristes sur Facebook, Instagram et Messenger durant le ramadan en 2019 et en 2020 ? Des salariés de Facebook qui ont repéré ce phénomène statistique dans six pays à majorité musulmane, dont trois arabophones, sont intrigués. Sur leur forum interne, ils évoquent une hypothèse, sans pouvoir totalement la confirmer : les messages issus du Coran postés pendant cette période contiennent des mots, comme « martyr » ou « combat », qui ont été automatiquement associés par les algorithmes de Facebook à des propos violents ou terroristes.

Lire aussi Article réservé à nos abonnés Facebook Files : hors des Etats-Unis, les failles de la modération dans des dizaines de langues

Sollicité, Facebook affirme « ne pas avoir de preuve de modération indue liée au ramadan ». Cette anecdote d’un système mal calibré prenant des décisions erronées est pourtant relatée dans l’un des nombreux documents internes à Facebook, récupérés par Frances Haugen, une ancienne employée, et transmis par une source parlementaire américaine à plusieurs médias, dont Le Monde. Elle illustre de manière criante les carences du réseau social en matière de modération des contenus arabophones et son inertie pour y mettre fin.

La question des dialectes

Les pays arabophones d’Afrique du Nord et du Moyen-Orient sont un marché majeur pour Facebook, avec 220 millions d’utilisateurs actifs fin 2020 – soit une bonne moitié de la population de la zone –, faisant de l’arabe la troisième langue sur le réseau social. Il s’agit même, à l’été 2020, de la zone du monde où les utilisateurs sont les plus actifs.

« Avec la taille de notre base d’utilisateurs en langue arabe et la gravité potentielle des dégâts hors ligne dans quasiment tous les pays arabes – tous, excepté le Sahara occidental, figurent dans la liste des pays à risque et font face à des problèmes graves, comme le terrorisme et le trafic sexuel –, mettre davantage de ressources pour améliorer les systèmes [de modération] en langue arabe est de la plus haute importance », peut-on lire dans un document rédigé, fin 2020, par un salarié, dans une note sur les limites du recours à l’intelligence artificielle pour la modération.

Extrait de l’un des document anonymisés transmis au Congrès américain dans lequel l’auteur pointe l’importance d’améliorer la modération en langue arabe.

L’état des lieux dressé par ces documents est sans appel et se résume en une phrase : Facebook n’est pas en capacité de faire examiner les commentaires en langue arabe potentiellement illicites par des modérateurs compétents – lorsque ces derniers existent. Les causes de ce problème sont multiples. Humaines, d’abord : aussi surprenant que cela puisse paraître pour une multinationale présente dans les pays arabes depuis des années, Facebook ne disposait pas, à la fin de l’année 2020, de suffisamment de modérateurs capables de comprendre tous les principaux dialectes arabes ni les contextes culturels et nationaux, forcément différents dans cette vaste zone allant du Maroc à l’Irak.

Il vous reste 72.4% de cet article à lire. La suite est réservée aux abonnés.

Source

L’article Sur Facebook, le fiasco de la modération en langue arabe est apparu en premier sur zimo news.