AWA — Quand l’Intelligence Artificielle Parle Wolof et Soigne en Teranga
Dans un centre de santé de banlieue dakaroise, une femme âgée décrit ses symptômes — non pas en français, la langue officielle du Sénégal, mais en wolof, la langue de son cœur, celle qu’elle maîtrise vraiment. Face à elle, pas de médecin débordé, mais un assistant vocal intelligent nommé AWA. Et AWA lui répond. En wolof. Pas une traduction mécanique du français ou de l’anglais — un wolof natif, fluide, ancré dans les tournures et les nuances que comprennent les 40% de Sénégalais qui parlent cette langue comme première ou seconde langue. AWA pose des questions de diagnostic, oriente vers le bon service, explique les symptômes en termes accessibles. Pour cette patiente, l’IA n’est pas une barrière technologique de plus — c’est un pont vers le soin.
AWA est le fruit d’Andakia, une initiative sénégalaise qui vient de franchir un seuil historique: créer le premier système d’intelligence artificielle parlant wolof nativement, conçu spécifiquement pour révolutionner l’accès aux soins de santé. Pas une IA importée et traduite. Pas un système pensé ailleurs et adapté après coup. Une IA construite depuis le début pour servir une communauté dans sa propre langue, selon ses propres besoins. Dans un continent où 2000 langues sont parlées mais où moins de 100 disposent de ressources numériques significatives, AWA représente bien plus qu’une prouesse technique. C’est un acte de souveraineté linguistique. Et peut-être, un modèle de ce que pourrait signifier une intelligence artificielle vraiment africaine.
Le Sénégal n’avance pas seul. Le pays s’inscrit dans la phase opérationnelle de sa Stratégie Nationale de Développement de l’Intelligence Artificielle (SNDIA), un cadre ambitieux qui place l’éthique et la souveraineté au cœur de sa vision technologique. La SNDIA ne vise pas simplement à rattraper les géants de l’IA — elle cherche à définir un modèle alternatif, ancré dans les réalités et les valeurs sénégalaises. AWA incarne cette vision. Elle s’insère dans un mouvement continental plus large: l’Union Africaine a adopté en août 2024 sa Stratégie Continentale sur l’IA, priorisant la souveraineté numérique et le stockage des données sur des serveurs locaux ou nationaux. Le Maroc investit 18 milliards de dirhams dans son programme Digital Morocco 2030, visant 100 000 diplômés du numérique par an d’ici 2030. La Côte d’Ivoire déploie sa Stratégie Nationale d’Intelligence Artificielle (SNIA) avec un budget de 900 milliards de francs CFA sur cinq ans et 100 projets ciblés.
Mais AWA pose une question que ces stratégies nationales n’ont pas toutes osé affronter frontalement: à quoi sert une IA souveraine si elle ne parle pas les langues du peuple qu’elle est censée servir? Le français est la langue officielle du Sénégal, mais seulement 26% de la population le parle couramment. Le wolof, lui, est compris par environ 80% des Sénégalais. Dans les zones rurales, dans les quartiers populaires, auprès des personnes âgées ou peu scolarisées, le wolof est la langue de l’intimité, du quotidien, de la confiance. C’est la langue dans laquelle on explique où ça fait mal. C’est la langue dans laquelle on comprend vraiment ce que le soignant dit. Une IA de santé qui ne parle que français n’est pas seulement inefficace — elle reproduit une exclusion coloniale que l’indépendance n’a jamais résolue. Elle dit implicitement: pour accéder au soin technologique, vous devez d’abord parler la langue du colonisateur.
AWA dit le contraire. Elle dit: la technologie peut venir à vous, dans votre langue, sur votre terrain. Ce renversement a des implications pratiques immédiates. Dans un pays où environ 61% de la population est connectée à Internet mais où les infrastructures de santé sont sous pression chronique — médecins débordés, cliniques rurales sous-équipées, temps d’attente interminables —, un assistant IA capable de faire du pré-diagnostic en wolof change radicalement l’équation. La connectivité n’est plus le goulot d’étranglement — c’est la langue qui l’est. Il oriente les patients vers le bon service. Il réduit les consultations inutiles. Il explique les traitements dans une langue que les gens comprennent vraiment, ce qui améliore l’observance thérapeutique. Il permet aux agents de santé communautaires, souvent eux-mêmes wolofphones, de s’appuyer sur un outil technologique sans barrière linguistique. Et surtout, il rend la santé numérique accessible à ceux qui en ont le plus besoin: les populations rurales, les personnes âgées, les femmes moins scolarisées, tous ceux pour qui le français est une langue étrangère même dans leur propre pays.
Ce n’est pas un cas isolé. AWA s’inscrit dans un mouvement panafricain de reconquête linguistique numérique. Masakhane, réseau de plus de 2000 chercheurs africains, travaille depuis des années à construire des modèles de traitement du langage naturel (NLP) pour les langues africaines. NTeALan poursuit des objectifs similaires. Ces initiatives savent qu’elles luttent contre une forme de colonialisme algorithmique: les grands modèles de langage (LLM) comme GPT, Claude ou Gemini ont été entraînés massivement sur des corpus anglophones et, dans une moindre mesure, francophones ou sinophones. Les langues africaines — wolof, bambara, swahili, lingala, amharique, zulu — sont absentes ou marginales dans ces ensembles de données. Résultat: ces IA “universelles” ne comprennent pas les langues africaines, ne peuvent pas servir les communautés africaines dans leurs propres termes, et reproduisent un biais culturel aussi profond qu’invisible. Quand une IA “parle” wolof via traduction automatique depuis l’anglais ou le français, elle produit souvent un charabia incompréhensible, truffé d’erreurs grammaticales et culturelles. Ce n’est pas du wolof — c’est du colonialisme linguistique déguisé en innovation.
AWA et ses consœurs refusent ce compromis. Elles partent du principe que les langues africaines méritent des IA natives, construites depuis le début avec des corpus wolof, bambara, swahili — collectés, annotés, validés par des locuteurs natifs, ancrés dans les réalités culturelles et les structures grammaticales propres à ces langues. C’est un travail titanesque. Le wolof est une langue à tons, avec des structures grammaticales distinctes du français. Ses expressions idiomatiques, ses métaphores, ses registres de politesse ne se traduisent pas — ils doivent être compris de l’intérieur. Construire une IA wolof native exige des linguistes wolof, des ingénieurs sénégalais, des corpus de voix et de textes wolof, des tests avec des utilisateurs wolofphones. C’est lent, coûteux, techniquement complexe. Mais c’est la seule voie vers une IA qui serve vraiment la communauté plutôt que de lui imposer une fois de plus les catégories du Nord global.
Ici, Ubuntu rencontre la technologie de manière viscérale. Umuntu ngumuntu ngabantu — je suis parce que nous sommes. Une IA qui ne parle pas la langue de la communauté n’est pas “avec” la communauté — elle est au-dessus, à côté, imposée de l’extérieur. Elle ne crée pas de lien, elle creuse une distance. AWA, en parlant wolof nativement, incarne une forme d’hospitalité technologique — ce que les Sénégalais appellent Teranga. La Teranga, c’est accueillir l’étranger, faire de la place, offrir ce qu’on a de meilleur. Mais c’est aussi exiger que l’invité respecte la maison. Une IA conçue à San Francisco ou Shenzhen arrive en Afrique comme une invitée. Si elle impose sa langue, ses catégories, ses biais, elle viole la Teranga — elle prend sans donner, elle extrait sans enrichir. Une IA qui apprend le wolof, qui s’ancre dans les réalités sénégalaises, qui sert les besoins locaux avant de servir les profits lointains — celle-là honore la Teranga. Elle devient, potentiellement, membre de la communauté. Pas un outil extractif, mais un partenaire de soin.
Sankofa nous rappelle qu’il n’est jamais trop tard pour revenir chercher ce qu’on a oublié. Les langues africaines ne sont pas des archaïsmes à préserver dans des musées — ce sont des systèmes vivants de pensée, de relation, de transmission. Elles portent des savoirs médicaux, des classifications botaniques, des concepts philosophiques que le français ou l’anglais ne peuvent pas traduire sans perte. Quand une IA de santé parle wolof, elle peut intégrer des concepts médicaux wolof traditionnels, dialoguer avec les guérisseurs et les matrones qui utilisent ces termes, construire des ponts entre médecine moderne et savoirs ancestraux plutôt que de les opposer. Sankofa nous dit: retournez chercher le wolof, le bambara, le swahili. Ramenez-les dans le futur numérique. Ne les laissez pas derrière comme prix du “progrès”. L’avenir appartient à ceux qui savent tisser ancestralité et innovation — pas à ceux qui choisissent l’une contre l’autre.
Pourtant, des questions demeurent. AWA est une victoire, mais elle est aussi un point de départ vertigineux. Le Sénégal compte plusieurs langues nationales au-delà du wolof: le pulaar, le sérère, le diola, le mandingue, le soninké. Chacune mérite sa propre IA native — ou du moins, une IA multilingue capable de les servir dignement. À l’échelle de l’Afrique francophone, les défis se multiplient: le bambara au Mali, le lingala en RDC, le mooré au Burkina Faso, le kabyle en Algérie. Plus de 2000 langues africaines au total. Construire des IA natives pour chacune est-il réaliste? Ou faut-il accepter des compromis — des IA multilingues africaines, capables de servir plusieurs langues à la fois, même si elles ne maîtrisent aucune aussi parfaitement qu’AWA maîtrise le wolof?
Et qui finance ce travail? Andakia, Masakhane, NTeALan fonctionnent avec des ressources limitées, face à des géants technologiques disposant de milliards de dollars et de milliers d’ingénieurs. Les stratégies nationales — SNDIA au Sénégal, SNIA en Côte d’Ivoire, Digital Morocco 2030 — allouent des fonds, mais suffisent-ils? La Côte d’Ivoire investit 900 milliards de francs CFA sur cinq ans — environ 1,3 milliard d’euros. C’est ambitieux pour un pays africain. C’est une fraction infime de ce qu’investit la Chine ou les États-Unis dans l’IA en un trimestre. La souveraineté linguistique coûte cher. Elle exige des infrastructures (serveurs locaux pour stocker les données, réseaux pour les distribuer), des talents (linguistes, ingénieurs, spécialistes NLP), du temps (des années pour construire des corpus de qualité). Sans financement panafricain coordonné — peut-être via l’Union Africaine, peut-être via des partenariats Sud-Sud avec l’Inde ou le Brésil qui font face à des défis similaires —, les initiatives comme AWA risquent de rester des vitrines brillantes dans un océan de dépendance linguistique.
Il y a aussi la question de la gouvernance des données. AWA apprend à partir de conversations en wolof avec des patients sénégalais. Ces données de santé sont sensibles, intimes. Qui les possède? Qui y a accès? La SNDIA insiste sur le stockage local et la souveraineté des données, conformément à l’éthique Ubuntu qui refuse l’extraction sans consentement. Mais dans un écosystème technologique mondialisé, où les cloud providers dominants sont américains (AWS, Google, Microsoft) ou chinois (Alibaba, Tencent), maintenir une véritable souveraineté des données exige des infrastructures coûteuses et une vigilance constante. Le Sénégal peut-il vraiment garantir que les données wolof de santé d’AWA ne seront jamais aspirées par un géant technologique étranger, même indirectement? Ou faudra-t-il accepter des partenariats avec des garanties contractuelles, tout en sachant que les rapports de force sont asymétriques?
Et enfin, une question plus philosophique: qu’arrive-t-il à une langue quand elle devient “langue d’IA”? L’IA fige, standardise, normalise. Le wolof d’AWA sera-t-il le wolof de Dakar, urbain, jeune, mêlé de français? Ou le wolof rural du Sine-Saloum, plus conservateur, plus pur? Qui décide quelle variante du wolof devient “le” wolof algorithmique? Les langues vivantes évoluent, se métissent, se réinventent. Les IA de langage, elles, apprennent des corpus figés dans le temps. Elles peuvent figer une langue, la momifier, la transformer en musée numérique. Comment AWA peut-elle continuer à apprendre, à évoluer avec le wolof vivant, à intégrer les nouveaux mots, les nouvelles tournures, les créolisations constantes qui font qu’une langue respire? Peut-être faudra-t-il penser des IA linguistiques non pas comme des produits finis, mais comme des processus vivants, réentraînés régulièrement avec des corpus actualisés, co-construits avec des communautés de locuteurs qui gardent le contrôle sur leur propre langue.
AWA n’est pas une fin. C’est un commencement. Elle prouve qu’une IA africaine, parlant une langue africaine, servant un besoin africain — la santé accessible — est possible. Elle prouve que la souveraineté technologique ne se limite pas à héberger des serveurs sur le sol africain. Elle passe aussi par la souveraineté linguistique, culturelle, épistémique. Une IA qui ne parle que les langues du Nord global n’est jamais vraiment africaine, quel que soit le drapeau sur le data center. AWA parle wolof. Elle incarne Teranga. Elle met Ubuntu en algorithme. Elle dit: l’avenir de l’IA en Afrique francophone ne sera pas une simple importation de modèles occidentaux traduits à la hâte. Il sera co-construit, multilingue, ancré dans les langues et les valeurs qui font battre le cœur de ce continent.
La question qui demeure, celle que tous les acteurs de l’écosystème technologique francophone africain doivent affronter, est celle-ci: AWA restera-t-elle une exception admirable, une vitrine de ce qui est techniquement possible mais économiquement difficile à répliquer? Ou deviendra-t-elle le premier maillon d’une chaîne d’IA linguistiquement souveraines, un modèle que d’autres pays, d’autres langues, d’autres communautés pourront adapter, financer, déployer? Entre l’Afrique qui parle les langues des autres et l’Afrique qui fait parler les siennes aux machines qu’elle construit, laquelle choisirons-nous?
Leave a Reply