Projeto africano disponibiliza maior conjunto de dados de vozes para ensinar IA a 18 línguas

Um consórcio de linguistas e cientistas informáticos concluiu o Africa Next Voices, considerado o maior repositório público de dados de voz em línguas africanas. O material, produzido em dois anos, visa reduzir a exclusão de milhões de pessoas dos sistemas de inteligência artificial, habitualmente treinados sobretudo em inglês e noutras línguas globais.

Conjunto de dados reúne 9 000 horas de gravações

A equipa recolheu 9 000 horas de áudio no Quénia, Nigéria e África do Sul, registando situações quotidianas nos sectores da agricultura, saúde e educação. As sessões incluíram falantes de várias idades, regiões e contextos sociais, de forma a representar a diversidade de cada idioma.

Ao todo, foram documentadas 18 línguas, entre as quais Kikuyu e Dholuo (Quénia), Hausa e Yoruba (Nigéria) e isiZulu, Tshivenda e Setswana (África do Sul). Algumas contam com milhões de falantes, mas careciam de bibliotecas digitais suficientemente robustas para treinar modelos de IA em tarefas de transcrição, tradução ou assistência por voz.

O projecto recebeu um financiamento de 2,2 milhões de dólares da Fundação Gates. Todo o conteúdo é disponibilizado em acesso aberto, permitindo que universidades, empresas e programadores desenvolvam soluções sem custos de licenciamento.

Acesso aberto pretende impulsionar inovação

Segundo o professor Vukosi Marivate, da Universidade de Pretória, a ausência de dados em línguas autóctones limita o acesso de grande parte da população às vantagens da revolução digital. «Pensamos, sonhamos e interpretamos o mundo nos nossos idiomas. Se a tecnologia não reflectir isso, cria-se uma barreira que deixa muitos para trás», defende o investigador sul-africano.

Para a linguista computacional Lilian Wanzare, que coordenou os trabalhos no Quénia, o método de recolha tentou reproduzir a forma real como as pessoas se expressam. «Gravámos vozes de diferentes regiões, idades e origens para obter um retrato o mais inclusivo possível. As grandes tecnológicas nem sempre captam essas nuances», sublinha.

Com o repositório, os promotores esperam que surjam ferramentas capazes de traduzir documentos oficiais, responder a consultas de saúde ou facilitar transacções bancárias sem exigir conhecimento de inglês. Empresas como a startup sul-africana Lelapa AI já recorrem a conjuntos semelhantes para criar chatbots e sistemas de reconhecimento de fala destinados a bancos e operadoras de telecomunicações.

Aplicações práticas já chegam ao campo

O potencial das línguas locais em IA é ilustrado na exploração agrícola de Kelebogile Mosime, em Rustenburgo, no coração da região sul-africana do platina. A produtora de 45 anos utiliza a aplicação AI-Farmer, que responde em Setswana, isiZulu e Afrikaans, para resolver problemas diários no cultivo de feijão, espinafre, couve-flor e tomate.

«Pergunto como controlar pragas ou diagnosticar plantas doentes e obtenho indicações em Setswana, a minha língua materna», relata a agricultora, que iniciou actividade há apenas três anos. Para Mosime, a possibilidade de interagir em idioma próprio torna a tecnologia mais acessível a quem vive em zonas rurais com pouca familiaridade digital.

Próximos passos e desafios

O Africa Next Voices cobre apenas uma pequena parte das mais de duas mil línguas faladas no continente, mas os responsáveis planeiam expandir o número de idiomas e de cenários registados. A expectativa é que investigadores e comunidades adicionem novas gravações, alimentando um ciclo de melhoria contínua.

Marivate alerta, contudo, que sem iniciativas semelhantes haverá risco de perda cultural. «A linguagem é acesso à imaginação; não são só palavras, é história, cultura e conhecimento. Se não incluirmos as línguas indígenas, perdemos formas distintas de ver o mundo», conclui.

Posts Similares

Deixe uma resposta

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.