Os desenvolvedores tem, agora, caminho livre para criar skills com uma experiência de voz mais natural e intuitiva. A Amazon incorporou dois novos recursos que permitem à Alexa responder com emoções às consultas dos usuários e também com um estilo de fala mais adequado para um determinado conteúdo. A empresa não informou se as novas funcionalidades da assistente de voz já estão disponíveis para desenvolvedores de todos os países.
De acordo com post publicado no site de desenvolvedores, o recurso de “emoções” Alexa usa a Neural TTS (NTTS), a tecnologia de conversão de texto em fala da Amazon que permite um discurso com um tom mais natural. Neste caso, a assistente de voz pode responder com um tom feliz; animado ou desapontado; ou empático. O post diz que as respostas emocionais são particularmente relevantes para as skills nas categorias de jogos e esportes.
Segundo o texto do blog dos desenvolvedores, o feedback inicial do cliente indica que a satisfação geral com a experiência de voz aumentou em 30% quando a Alexa respondeu com emoções.
“É possível fazer com que a assistente de voz responda em tom alegre; animado quando um cliente responde a uma pergunta trivial corretamente ou ganha um jogo. Da mesma forma, você pode fazer com que a Alexa responda de maneira desapontada; empática quando um cliente pede a pontuação dos esportes e seu time favorito perde”, destaca o post.
Estilos de fala
O recurso “estilos de fala” são vozes de conversão de texto em fala para criar uma experiência do cliente mais agradável para um conteúdo específico. “O estilo de fala em notícias faz com que a voz da Alexa seja semelhante ao que você ouve dos apresentadores de notícias de TV e de rádio”, exemplifica.
Nos testes de “escuta cega”, o estilo de notícias foi percebido como 31% mais natural do que a voz padrão da Alexa e o estilo de música foi 84% mais natural.
A Amazon explica que os novos estilos de fala da Alexa também usam a tecnologia NTTS. Segundo a empresa, a partir de agora, é possível ativar dois estilos de fala diferentes nos EUA: notícias e música. Na Austrália, pode-se ativar um estilo de narração de notícias específico do país.
“Os estilos de reprodução de notícias e música adaptam a voz da Alexa ao respectivo conteúdo entregue, alterando aspectos da fala, como entonação, quais palavras são enfatizadas e o tempo das pausas”, conta o post.