Google en een consortium van Afrikaanse onderzoeksinstellingen hebben de WAXAL-dataset gelanceerd, een belangrijke nieuwe inspanning om… Het bericht Google traint AI in 21 Afrikaanse talenGoogle en een consortium van Afrikaanse onderzoeksinstellingen hebben de WAXAL-dataset gelanceerd, een belangrijke nieuwe inspanning om… Het bericht Google traint AI in 21 Afrikaanse talen

Google gaat AI trainen in 21 Afrikaanse talen, waaronder Yoruba, Hausa en Igbo

2026/02/02 22:00

Google en een consortium van Afrikaanse onderzoeksinstellingen hebben de WAXAL-dataset gelanceerd, een grote nieuwe inspanning om een van de belangrijkste uitdagingen van kunstmatige intelligentie (AI) op het continent aan te pakken: het onvermogen om de meeste Afrikaanse talen te interpreteren en te begrijpen.

Het project levert een grote, open spraakdataset die 21 Sub-Saharaanse Afrikaanse talen omvat en brengt spraaktechnologie naar meer dan 100 miljoen mensen die van de AI-economie zijn uitgesloten.

De WAXAL-dataset is het resultaat van een driejarige samenwerking, gefinancierd door Google en geleid door lokale universiteiten en gemeenschapsgroepen.

Het omvat 1.250 uur getranscribeerde, natuurlijke spraak en meer dan 20 uur studio-kwaliteit opnames gericht op het bouwen van hoogwaardige synthetische stemmen. Het richt zich op talen zoals Hausa, Yoruba, Luganda, Igbo en Acholi, waarvan velen door tientallen miljoenen worden gesproken maar grotendeels onzichtbaar blijven voor commerciële spraaksystemen.

Google en Afrikaanse universiteiten lanceren de WAXAL-dataset om AI te trainen in 21 Afrikaanse talen, waaronder Yoruba, Hausa en Igbo

Ondanks alle praatjes over wereldwijde AI, leunen spraaktechnologieën nog steeds zwaar op Engels en een beperkt aantal Europese en Aziatische talen. Afrika, de thuisbasis van meer dan 2.000 talen, is aan de zijlijn blijven staan.

Die kloof is niet academisch; het bepaalt wie digitale diensten kan gebruiken, wie toegang heeft tot onderwijs- en gezondheidszorginstrumenten, en wie bedrijven kan bouwen bovenop moderne AI-platforms. Google presenteerde het werk als een stap naar het verkleinen van een langdurige datakloof die veel Afrikaanse talen buiten spraakassistenten en andere tools heeft gehouden.

Waarom de WAXAL-dataset belangrijk is voor Afrika's AI-architectuur

Naast het direct aanpakken van deze onbalans, is het project net zo belangrijk als de data zelf.

In tegenstelling tot eerdere initiatieven waarbij Afrikaanse spraakdata werd geëxtraheerd en elders eigendom was, werd WAXAL ter plaatse geleid door Afrikaanse instellingen. Makerere University in Oeganda, de Universiteit van Ghana en Digital Umuganda in Rwanda hielden toezicht op dataverzameling, gemeenschapsbetrokkenheid en taalbeheer, met technische ondersteuning van Google Research Africa.

Cruciaal is dat deze instellingen het eigendom van de data behouden. Dat is een opmerkelijke verschuiving in een vakgebied dat vaak wordt bekritiseerd voor het reproduceren van extractieve dynamieken onder de vlag van openheid.

Volgens Aisha Walcott-Bryant, hoofd van Google Research Africa, "De ultieme impact van WAXAL is de empowerment van mensen in Afrika. Deze dataset biedt de kritieke basis voor studenten, onderzoekers en ondernemers om technologie te bouwen op hun eigen voorwaarden, in hun eigen talen, en bereikt uiteindelijk meer dan 100 miljoen mensen."

"We kijken ernaar uit om Afrikaanse innovators deze data te zien gebruiken om alles te creëren, van nieuwe educatieve tools tot spraakgestuurde diensten die tastbare economische kansen creëren over het hele continent", voegde ze toe. 

Google en Afrikaanse universiteiten lanceren de WAXAL-dataset om AI te trainen in 21 Afrikaanse talen, waaronder Yoruba, Hausa en IgboAisha Walcott-Bryant, hoofd van Google Research Africa

Die framing wordt weerspiegeld door de betrokken universiteiten. Joyce Nakatumba-Nabende, een senior docent aan Makerere University, zei:

"Om een echte impact te hebben in Afrika, moet AI onze talen spreken en onze contexten begrijpen. De WAXAL-dataset geeft onze onderzoekers de hoogwaardige data die ze nodig hebben om spraaktechnologieën te bouwen die onze unieke gemeenschappen weerspiegelen. In Oeganda heeft het al onze lokale onderzoekscapaciteit versterkt en nieuwe door studenten en docenten geleide projecten ondersteund."

Bij de Universiteit van Ghana wees universitair hoofddocent Isaac Wiafe op de omvang van publieke betrokkenheid: 

"Voor ons aan de Universiteit van Ghana gaat de impact van WAXAL verder dan de data zelf. Het heeft ons in staat gesteld om onze eigen taalbronnen te bouwen en een nieuwe generatie AI-onderzoekers op te leiden. Meer dan 7.000 vrijwilligers sloten zich bij ons aan omdat ze wilden dat hun stemmen en talen deel uitmaken van de digitale toekomst. Vandaag heeft die collectieve inspanning een ecosysteem van innovatie aangewakkerd op gebieden als gezondheid, onderwijs en landbouw. Dit bewijst dat wanneer de data bestaat, de mogelijkheden overal toenemen."

Er is reden voor voorzichtig optimisme. Open spraakdatasets kunnen barrières verlagen voor lokale startups en onderzoekers die de middelen missen om data op schaal te verzamelen. Ze kunnen ook de afhankelijkheid van buitenlandse API's verminderen die zelden Afrikaanse talen goed ondersteunen, als ze dat al doen.

Google en Afrikaanse universiteiten lanceren de WAXAL-dataset om AI te trainen in 21 Afrikaanse talen, waaronder Yoruba, Hausa en IgboDe WAXAL-dataset

Toch garanderen datasets geen resultaten; het bouwen van betrouwbare spraaksystemen vereist aanhoudende investering, lokale implementatie en commerciële wegen die waarde in het land houden. Google's rol als financier en bijeenroeper zal tot onderzoek leiden, met name rond hoe WAXAL-data in de toekomst door mondiale bedrijven wordt gebruikt.

Voor nu markeert de release van de WAXAL-dataset een concrete stap naar een taalkundig inclusiever AI-ecosysteem. Het lost Afrika's AI-uitdagingen niet op, maar het pakt een fundamentele uitdaging aan. Spraak is vaak de meest natuurlijke interface met technologie. Ervoor zorgen dat AI Afrika kan horen spreken, in al zijn diversiteit, is lang geleden te laat.

De post Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo verscheen eerst op Technext.

Disclaimer: De artikelen die op deze site worden geplaatst, zijn afkomstig van openbare platforms en worden uitsluitend ter informatie verstrekt. Ze weerspiegelen niet noodzakelijkerwijs de standpunten van MEXC. Alle rechten blijven bij de oorspronkelijke auteurs. Als je van mening bent dat bepaalde inhoud inbreuk maakt op de rechten van derden, neem dan contact op met [email protected] om de content te laten verwijderen. MEXC geeft geen garanties met betrekking tot de nauwkeurigheid, volledigheid of tijdigheid van de inhoud en is niet aansprakelijk voor eventuele acties die worden ondernomen op basis van de verstrekte informatie. De inhoud vormt geen financieel, juridisch of ander professioneel advies en mag niet worden beschouwd als een aanbeveling of goedkeuring door MEXC.