O Facebook AI liberou o Multilingual LibriSpeech (MLS), uma ferramenta de treinamento com dados de código aberto de grande escala, para melhorar o reconhecimento automático de fala (ASR).
De acordo com a empresa, o MLS reúne mais de 50 mil horas de áudio em oito idiomas de audiobooks. Essa ferramenta extrai dados do projeto LibriVox, que usa o ASR do LibriSpeech para incluir, além do inglês, novos idiomas: alemão, holandês, francês, espanhol, italiano, português e polonês.
Aliás, o conjunto de dados do MLS é cerca de 47 vezes maior que o do LibriSpeech, que traz mil horas de leitura em inglês. Segundo os pesquisadores do Facebook, o modelo que eles desenvolveram do MLS traz uma melhoria de 20% na taxa do LibriSpeech. De acordo com eles, foi decidido usar a base de dados do LibriSpeech por ser aberto de domínio público.
“Acreditamos que, ao fornecer um grande conjunto de dados multilíngues com uma licença não restritiva e estabelecer uma referência comum, a MLS promoverá a pesquisa aberta e colaborativa em ASR multilíngue e melhora os sistemas de reconhecimento de voz em mais idiomas em todo o mundo”, disseram os pesquisadores no blog.
Em outubro do ano passado, o Facebook desenvolveu um novo formato de Inteligência Artificial (IA) chamado M2M-100. Ele é capaz de traduzir 100 idiomas, sem a interferência do inglês. Da mesma maneira que o MLS, o M2M-100 é capaz de compreender 51 idiomas, baseado em mais de 16 mil horas de gravações de voz.
Fonte: Voicebot