A plataforma de ensino Duolingo desenvolveu uma ferramenta que transforma texto em fala (TTS) para trazer vozes personalizadas aos personagens que acompanham os alunos durante as aulas. Segundo o blog do Duolingo, cada um terá uma voz sintética para mostrar o uso do idioma em pessoas com personalidades diferentes.
A empresa diz que as vozes sintéticas dos personagens foram criadas a partir da tecnologia de machine learning. Assim, eles são capazes de dizer qualquer frase de forma natural, mesmo aquelas que não foram previamente programadas.
Segundo o Duolingo, a criação das vozes contou com combinações de sons de fala, palavras isoladas e frases com exclamações e interrogações. Além disso, por ser uma plataforma de idiomas, também foi levado em consideração a entonação, ritmo e pausa das falas, tornando mais realista o aprendizado.
“Para as gravações, os dubladores tiveram que inventar cenários para tornar as falas significativas – e às vezes aquele ‘sabor’ acústico extra, como imaginar o personagem zangado, representava um desafio para a tecnologia, que é treinada em um discurso mais neutro”, disseram os os autores do post.
Segundo o blog, foram necessários vários meses para trazer as vozes ideais aos nove personagens da plataforma. Já que o inglês foi o primeiro idioma para a criação da dublagem, o Duolingo procurou vozes parecidas para falar em espanhol, francês, alemão e japonês.
A empresa diz que como cada língua tem contextos culturais e emocionais muito diferentes foram necessárias várias adaptações de um idioma para o outro.
“Com nossa equipe de especialistas em idiomas, fonéticos e consultores criativos, trabalhamos com cada voz para ter certeza de que capturava a personalidade dos personagens de uma forma culturalmente adequada”, destacou o Duolingo.