A Nvidia revelou durante o GPU Technology Conference o Riva Custom Voice, um novo kit que permitirá aos clientes da empresa criar vozes “humanas” personalizadas.
Segundo a Nvidia, a ferramenta é capaz de criar um assistente virtual inteiro a partir de 30 minutos de uma única voz. Assim, a sintetização reduz a necessidade de gravações adicionais, aumentando a produtividade dos atores.
“Agora, essas empresas podem usar a IA [inteligência artificial] de fala para ouvir e responder aos clientes com uma voz expressiva que é única para sua marca e que impulsiona interações mais envolventes e agradáveis”, disse Kari Briski, vice-presidente de gerenciamento de produtos de IA da Nvidia
A Nvidia diz que o Riva Custom Voice usa um aprendizado semi-supervisionado para criar vozes sintéticas sob medida. Com isso, os algoritmos de aprendizado de máquina usam uma pequena quantidade de dados para treinar o sistema com o tipo de voz que se deseja criar. Já aqueles que buscam uma implantação em larga escala, será lançado no início do próximo ano o Riva Enterprise.
Além da Nvidia, outras empresas também estão investindo neste setor. É o caso do Google, que em 2019 lançou novos modelos de voz sintetizada por IA para o WaveNet em seu serviço Cloud Texto-to-Speech.
Outra gigante que também está interessada nesse mercado é a Amazon, lançando o serviço Brand Voice para gerar vozes com estilos e emoções personalizadas.
O uso da inteligência artificial para criar diálogos completos com apenas trechos de gravação já está sendo usado por grandes empresas que querem melhorar a sua comunicação com os usuários finais. É o caso do Duolingo, que está usando a IA para dar voz aos personagens do aplicativo, e o KFC, que criou uma voz com sotaque do sul dos Estados Unidos para o Coronel Sanders.
Fonte: Venture Beat