Os pesquisadores do Google desenvolveram uma nova versão do modelo de tradução automática chamado Translatotron AI. Segundo a empresa, a tecnologia foi projetada para ouvir alguém falando em um idioma e traduzi-lo para uma segunda língua.
O Translatotron realiza esse processo de codificação da fala de origem ao escolher os fonemas principais para sintetizar o resultado em qualquer língua. O Google afirma que a segunda versão da tecnologia realiza uma tradução mais natural do que uma por voz artificial, pois processa a fala mais rápido e com menos erros.
“Os resultados experimentais sugerem que o Translatotron 2 supera o modelo original por uma grande margem em termos de qualidade de tradução e naturalidade da fala prevista, e melhora drasticamente durante longas pausas”, escreveram os pesquisadores.
Diferentemente da versão original do Translatotron, o novo modelo não gera uma nova voz do usuário. Segundo os pesquisadores, agora é utilizado um método de retreinamento de voz que não depende dos IDs para identificar quem está falando. Eles dizem que isso foi criado para evitar possíveis usos indevidos da tecnologia, como vozes falsificadas ou deepfakes.
Essa preocupação dos pesquisadores se comprova uma pesquisa realizada pela startup Deeptrace, em que o número de deepfakes cresceu 330% de outubro de 2019 a junho de 2020.
Confira a baixo o falante em espanhol:
Agora a versão traduzida pelo Translatotron 2:
Modo intérprete
Além do Translatotron, o Google investe em outras tecnologias voltadas para a tradução, como o modo intérprete do Google Assistente. Disponível para os sistemas Android e iOS, a solução é capaz de traduzir até 44 idiomas de forma automática.
Para ativá-lo, basta dizer “Ok Google, interpretar de português para inglês” ou “Ok Google, ativar modo de intérprete”. Depois disso é só começar a falar que o assistente de voz saberá exatamente qual idioma está sendo reproduzido.
Fonte: Venture Beat