Elle lui envoie souvent des messages vocaux en fon, une langue béninoise, alors qu’il est parti étudier en Russie. Il ne comprend cependant pas certaines des phrases qu’elle utilise.

“Ma mère ne sait pas écrire le fon et je ne parle pas très bien cette langue, mais je parle couramment le français”, a déclaré M. Dossou à la BBC.

“Je demande souvent à ma sœur de m’aider à comprendre certaines des phrases que ma mère utilise”, a-t-il dit.

Il n’est pas question d’améliorer son fon par l’étude car, comme des centaines d’autres langues africaines, il est surtout parlé et rarement documenté, de sorte qu’il existe peu, voire pas, de livres pour enseigner la grammaire et la syntaxe.

Poussés par la curiosité et alimentés par des données collectées sur le fon grâce à une bible des Témoins de Jéhovah, M. Dossou et Chris Emezue, un ami nigérian, ont développé un modèle de traduction de langue par intelligence artificielle (IA), similaire à Google Translate, qu’ils ont nommé FFR.

Ils travaillent encore à améliorer leur invention.

Les deux étudiants font partie de plusieurs chercheurs en IA qui utilisent les langues africaines dans le traitement du langage naturel (NLP), une branche de l’IA utilisée pour enseigner et aider les ordinateurs à comprendre les langues humaines.

Si le monde ne s’était pas arrêté à la suite de la pandémie de Covid-19, MM. Dossou et Emezue auraient présenté leur création à des centaines de participants lors de l’une des plus grandes conférences sur l’IA au monde, l’ICLR, qui s’est tenue cette semaine à Addis-Abeba, la capitale éthiopienne.

C’était la première fois que l’événement se tenait en Afrique.

Au lieu d’annuler l’événement, les organisateurs ont décidé de le tenir virtuellement.

Les innovations en matière d’IA ont été désignées comme le moteur de la “quatrième révolution industrielle” qui apportera des changements radicaux dans presque tous les aspects de notre vie, y compris dans notre façon de travailler.

Certains analystes ont qualifié de nouveau pétrole les big data qui alimentent les systèmes d’IA.

Pour l’instant, l’Afrique est considérée comme perdante dans le rôle qu’elle joue dans la construction de l’avenir de l’IA, car la majorité des 2 000 langues du continent, selon les estimations, sont classées comme “à faibles ressources”, ce qui signifie qu’il y a un manque de données à leur sujet et/ou que ce qui est disponible n’a pas été indexé et stocké dans des formats qui peuvent être utiles.

Combler le fossé linguistique

Les langues africaines ne sont pas prises en compte lors de la création d’applications de PNA comme les assistants vocaux, les logiciels de reconnaissance d’images, les systèmes d’alerte de trafic et autres.

Mais les chercheurs africains s’efforcent d’éliminer ce handicap.

“Nous nous efforçons de placer l’Afrique sur la carte de la recherche en PNL et en IA”, a déclaré à la BBC le Dr Ignatius Ezeani, de l’Université de Lancaster.

“Si vous ne mettez pas vos ressources linguistiques à la disposition du public, gratuitement et ouvertement, les chercheurs n’auront pas les données nécessaires pour trouver des solutions créatives. Nous devrons toujours dépendre de, disons, Google pour déterminer l’orientation de la recherche”, a déclaré le Dr Ezeani.

La conférence en Éthiopie devait être un événement important pour les chercheurs africains qui, entre autres difficultés, se sont vus refuser des visas pour assister à des conférences de l’ICLR tenues aux États-Unis et au Canada, ce qui les a tenus à l’écart des conversations mondiales sur l’IA.