Microsoft libera serviço de voz sintética para mais empresas

A Microsoft anunciou que o seu serviço de Voz Neural Personalizada começará a aceitar mais clientes interessados em criar uma voz sintética com a tecnologia text-to-speech (TTS). 

Usado por marcas como a Progressive e a Warner Bros, a Voz Neural Personalizada usa os serviços cognitivos da Azure para construir dubladores artificiais. Disponível agora para um número maior de empresas, a tecnologia ainda tem um acesso limitado. Assim, os interessados devem se inscrever previamente e ser aprovados pela Microsoft. 

O serviço utiliza a tecnologia Machine Learning para tornar mais natural o som e a duração de cada palavra dita pela voz artificial. De acordo com a Microsoft, a Voz Neural funciona da seguinte forma: um conjunto de modelos converte um script em uma sequência acústica. Em seguida, outro conjunto de modelos converte essa sequência em fala. Esse recurso pode ser usado para aumentar a produtividade dos atores, reduzindo a  quantidade de gravações que lidam com erros ou alterações no roteiro.   

Confira uma amostra de áudio:

Já para prevenir que o serviço seja usado de forma indevida, a Microsoft exige que os clientes concordem com termos de serviço antes de usarem a tecnologia. 

“Exigimos que os clientes deixem bem claro que é uma voz sintética (…) Quando não é imediatamente óbvio no contexto, os clientes devem divulgar explicitamente que é sintético para que seja perceptível pelos usuários”, disse Sarah Bird, responsável por Serviços Cognitivos da Azure

Além disso, a Microsoft também pensa em usar marca d’água digital na voz sintética. Dessa forma, indicará que o conteúdo foi criado com a sua tecnologia, a fim de evitar problemas de uso.

Entre os principais casos de uso do serviço da Microsoft estão a AT&T, que criou uma voz parecida com a do Pernalonga, com cerca de duas mil frases. E o Duolingo, que usou a tecnologia para criar personagens multilíngues para o seu aplicativo de idiomas. 

Fonte: Venture Beat