Siga-nos

Microsoft libera serviço de voz sintética para mais empresas

Prêmio Alexa de Acessibilidade

Inteligência Artificial

Microsoft libera serviço de voz sintética para mais empresas

Tecnologia utiliza técnicas de machine learning para construir atores com voz artificial

A Microsoft anunciou que o seu serviço de Voz Neural Personalizada começará a aceitar mais clientes interessados em criar uma voz sintética com a tecnologia text-to-speech (TTS). 

Usado por marcas como a Progressive e a Warner Bros, a Voz Neural Personalizada usa os serviços cognitivos da Azure para construir dubladores artificiais. Disponível agora para um número maior de empresas, a tecnologia ainda tem um acesso limitado. Assim, os interessados devem se inscrever previamente e ser aprovados pela Microsoft. 

O serviço utiliza a tecnologia Machine Learning para tornar mais natural o som e a duração de cada palavra dita pela voz artificial. De acordo com a Microsoft, a Voz Neural funciona da seguinte forma: um conjunto de modelos converte um script em uma sequência acústica. Em seguida, outro conjunto de modelos converte essa sequência em fala. Esse recurso pode ser usado para aumentar a produtividade dos atores, reduzindo a  quantidade de gravações que lidam com erros ou alterações no roteiro.   

Confira uma amostra de áudio:

Já para prevenir que o serviço seja usado de forma indevida, a Microsoft exige que os clientes concordem com termos de serviço antes de usarem a tecnologia. 

“Exigimos que os clientes deixem bem claro que é uma voz sintética (…) Quando não é imediatamente óbvio no contexto, os clientes devem divulgar explicitamente que é sintético para que seja perceptível pelos usuários”, disse Sarah Bird, responsável por Serviços Cognitivos da Azure

Além disso, a Microsoft também pensa em usar marca d’água digital na voz sintética. Dessa forma, indicará que o conteúdo foi criado com a sua tecnologia, a fim de evitar problemas de uso.

Entre os principais casos de uso do serviço da Microsoft estão a AT&T, que criou uma voz parecida com a do Pernalonga, com cerca de duas mil frases. E o Duolingo, que usou a tecnologia para criar personagens multilíngues para o seu aplicativo de idiomas. 

Fonte: Venture Beat

Clique para comentar

Deixe suas impressões

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Mais notícias de Inteligência Artificial

Topo