Siga-nos

Facebook libera novo modelo de fala multilíngue

Facebook

Inteligência Artificial

Facebook libera novo modelo de fala multilíngue

Nova ferramenta reúne mais de 50 mil horas de áudio em oito idiomas de audiobooks

O Facebook AI liberou o Multilingual LibriSpeech (MLS), uma ferramenta de treinamento com dados de código aberto de grande escala, para melhorar o reconhecimento automático de fala (ASR). 

De acordo com a empresa, o MLS reúne mais de 50 mil horas de áudio em oito idiomas de audiobooks. Essa ferramenta extrai dados do projeto LibriVox, que usa o ASR do LibriSpeech para incluir, além do inglês, novos idiomas: alemão, holandês, francês, espanhol, italiano, português e polonês. 

Aliás, o conjunto de dados do MLS é cerca de 47 vezes maior que o do LibriSpeech, que traz mil horas de leitura em inglês. Segundo os pesquisadores do Facebook, o modelo que eles desenvolveram do MLS traz uma melhoria de 20% na taxa do LibriSpeech. De acordo com eles, foi decidido usar a base de dados do LibriSpeech por ser aberto de domínio público.

https://twitter.com/facebookai/status/1353810560937295872

“Acreditamos que, ao fornecer um grande conjunto de dados multilíngues com uma licença não restritiva e estabelecer uma referência comum, a MLS promoverá a pesquisa aberta e colaborativa em ASR multilíngue e melhora os sistemas de reconhecimento de voz em mais idiomas em todo o mundo”, disseram os pesquisadores no blog

Em outubro do ano passado, o Facebook desenvolveu um novo formato de Inteligência Artificial (IA) chamado M2M-100. Ele é capaz de traduzir 100 idiomas, sem a interferência do inglês. Da mesma maneira que o MLS, o M2M-100 é capaz de compreender 51 idiomas, baseado em mais de 16 mil horas de gravações de voz. 

Fonte: Voicebot

Clique para comentar

Deixe suas impressões

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Mais notícias de Inteligência Artificial

Topo