Google e un consorzio di istituzioni di ricerca africane hanno lanciato il dataset WAXAL, un importante nuovo sforzo per correggere una delle principali sfide dell'intelligenza artificiale (IA) nel continente: l'incapacità di interpretare e comprendere la maggior parte delle lingue africane.
Il progetto fornisce un ampio dataset vocale aperto che copre 21 lingue dell'Africa subsahariana e porta la tecnologia vocale a oltre 100 milioni di persone escluse dall'economia dell'IA.
Il dataset WAXAL è il prodotto di una collaborazione triennale finanziata da Google e guidata da università locali e gruppi comunitari.
Include 1.250 ore di parlato naturale trascritto e oltre 20 ore di registrazioni di qualità da studio mirate a costruire voci sintetiche ad alta fedeltà. Si rivolge a lingue come Hausa, Yoruba, Luganda, Igbo e Acholi, molte delle quali sono parlate da decine di milioni di persone ma rimangono in gran parte invisibili ai sistemi vocali commerciali.
Nonostante si parli molto di IA globale, le tecnologie vocali si orientano ancora fortemente verso l'inglese e una ristretta manciata di lingue europee e asiatiche. L'Africa, che ospita oltre 2.000 lingue, è stata lasciata ai margini.
Questa lacuna non è accademica; determina chi può utilizzare i servizi digitali, chi può accedere agli strumenti educativi e sanitari e chi può costruire aziende sulle piattaforme IA moderne. Google ha inquadrato il lavoro come un passo verso la riduzione di un divario di dati di lunga data che ha tenuto molte lingue africane lontane dagli assistenti vocali e da altri strumenti.
Oltre ad affrontare direttamente questo squilibrio, il progetto è importante tanto quanto i dati stessi.
A differenza delle iniziative precedenti in cui i dati vocali africani venivano estratti e posseduti altrove, WAXAL è stato guidato sul campo da istituzioni africane. La Makerere University in Uganda, l'Università del Ghana e Digital Umuganda in Ruanda hanno supervisionato la raccolta dei dati, il coinvolgimento della comunità e la gestione linguistica, con il supporto tecnico di Google Research Africa.
Fondamentalmente, queste istituzioni mantengono la proprietà dei dati. Si tratta di un cambiamento notevole in un settore spesso criticato per riprodurre dinamiche estrattive sotto la bandiera dell'apertura.
Secondo Aisha Walcott-Bryant, Head of Google Research Africa: "L'impatto finale di WAXAL è l'empowerment delle persone in Africa. Questo dataset fornisce le basi critiche per studenti, ricercatori e imprenditori per costruire tecnologia alle proprie condizioni, nelle proprie lingue, raggiungendo finalmente oltre 100 milioni di persone."
"Non vediamo l'ora di vedere gli innovatori africani utilizzare questi dati per creare di tutto, dai nuovi strumenti educativi ai servizi abilitati alla voce che creano opportunità economiche tangibili in tutto il continente", ha aggiunto.
Aisha Walcott-Bryant, Head of Google Research Africa
Questa visione è condivisa dalle università coinvolte. Joyce Nakatumba-Nabende, docente senior presso la Makerere University, ha dichiarato:
"Perché l'IA abbia un impatto reale in Africa, deve parlare le nostre lingue e comprendere i nostri contesti. Il dataset WAXAL fornisce ai nostri ricercatori i dati di alta qualità di cui hanno bisogno per costruire tecnologie vocali che riflettano le nostre comunità uniche. In Uganda, ha già rafforzato la nostra capacità di ricerca locale e supportato nuovi progetti guidati da studenti e docenti."
Presso l'Università del Ghana, il Professore Associato Isaac Wiafe ha evidenziato la portata del coinvolgimento pubblico:
"Per noi all'Università del Ghana, l'impatto di WAXAL va oltre i dati stessi. Ci ha permesso di costruire le nostre risorse linguistiche e formare una nuova generazione di ricercatori IA. Oltre 7.000 volontari si sono uniti a noi perché volevano che le loro voci e lingue appartenessero al futuro digitale. Oggi, quello sforzo collettivo ha innescato un ecosistema di innovazione in campi come salute, istruzione e agricoltura. Questo dimostra che quando i dati esistono, le possibilità si espandono ovunque."
C'è motivo per un cauto ottimismo. I dataset vocali aperti possono abbassare le barriere per le startup locali e i ricercatori che non hanno le risorse per raccogliere dati su larga scala. Possono anche ridurre la dipendenza da API stranieri che raramente supportano bene le lingue africane, se mai lo fanno.
Il dataset WAXAL
Tuttavia, i dataset non garantiscono risultati; costruire sistemi vocali affidabili richiede investimenti sostenuti, distribuzione locale e percorsi commerciali che mantengano il valore nel paese. Il ruolo di Google come finanziatore e promotore sarà oggetto di esame, in particolare su come i dati WAXAL verranno utilizzati dalle aziende globali in futuro.
Per ora, il rilascio del dataset WAXAL segna un passo concreto verso un ecosistema IA più inclusivo dal punto di vista linguistico. Non risolve le sfide dell'IA in Africa, ma affronta una sfida fondamentale. La voce è spesso l'interfaccia più naturale con la tecnologia. Assicurarsi che l'IA possa sentire l'Africa parlare, in tutta la sua diversità, è atteso da tempo.
Il post Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo è apparso per la prima volta su Technext.


