Siga-nos

Facebook cria modelo de reconhecimento de fala para 51 idiomas

Facebook cria modelo de reconhecimento de fala para 51 idiomas

Cases

Facebook cria modelo de reconhecimento de fala para 51 idiomas

Modelo melhora desempenho do sistema em até 28,8% em uma referência comparada às linhas de base, segundo pesquisadores

Pesquisadores do Facebook desenvolveram o que afirmam ser o maior modelo de reconhecimento automático de fala (ASR) do gênero – um modelo que aprendeu a entender palavras em 51 idiomas depois de treinar mais de 16.000 horas de gravações de voz.

Em um artigo publicado no servidor de pré-impressão Arxiv.org, os coautores afirmam que o sistema, que contém cerca de um bilhão de parâmetros, melhora o desempenho do reconhecimento de fala em até 28,8% em uma referência comparada às linhas de base.

Projetar um modelo único para reconhecer a fala em vários idiomas é desejável por vários motivos. Ele simplifica o pipeline de produção de back-end, por um lado, e estudos mostraram que o treinamento de modelos multilíngues em idiomas semelhantes pode diminuir a taxa geral de erros de palavras (WER).

O modelo do Facebook – o chamado modelo de sequência em sequência conjunta (Seq2Seq) – foi treinado ao compartilhar os parâmetros de um codificador, decodificador e token definido em todos os idiomas. O codificador mapeia sequências de áudio de entrada para representações intermediárias, enquanto o decodificador mapeia as representações para produzir texto, e o conjunto de tokens simplifica o processo de trabalho com muitos idiomas, apresentando sentenças em diferentes frequências.

Os pesquisadores dividiram os 51 idiomas em grupos distintos com um decodificador diferente para cada um e, em seguida, selecionaram 10.000 unidades de “subpalavras” como o token definido para cada grupo de idiomas individual.

Em seguida, eles combinaram manualmente alguns dos grupos de idiomas menores até chegarem a seis no total, o que impediu que os tamanhos dos grupos se tornassem excessivamente distorcidos pelo número de idiomas que eles continham.

Fonte: Venturebeat

Clique para comentar

Deixe suas impressões

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Mais notícias de Cases

Topo