Usar os recursos da tela do smart display para facilitar a interação, trazer instruções para o primeiro contato dos usuários com a action e, no caso de um voice game, ter um tutorial curto com os comandos básicos do jogo.
Esses são alguns dos pontos cruciais na hora de criar boas experiências de voz, segundo Wally Brill, chefe de Design Conversacional do Google, que participou, na semana passada, da última edição do Voice Talks, programa de palestras online promovido pelo Google Assistente. Na live, o executivo falou sobre como é possível criar experiências inteligentes usando a tecnologia de voz.
As ideias apresentadas por Brill tiveram como principal foco os smart displays, aliando as possibilidades da interface de voz com a interface de toque. Assim, ele aponta que é importante encontrar um equilíbrio entre as interações de touch e voz.
Como melhorar a interação por voz
Para Brill, apesar de ser comum acreditar que os assistentes devam priorizar a fala, grande parte das pessoas ainda não está acostumada com a tecnologia de voz. Por isso, é importante que smart displays usem os recursos da tela para que o usuário possa interagir quando está em dúvida de como prosseguir.
Além de usar todos os recursos disponíveis para manter as pessoas na interação com o assistente, é importante engajar o usuário desde o começo.
Para que isso ocorra, o primeiro contato com a action deve trazer instruções de como usá-la, mostrando o que poderá ser feito durante a interação por voz. Por exemplo, em um voice game é importante criar um tutorial curto que ensine os comandos básicos do jogo. Veja outras ideias apresentadas por Wally Brill são:
- Mantenha o TTS breve
O TTS (text-to-speech) é o processo que torna um texto em uma fala artificial. Segundo Brill, muitos usuários não têm paciência para ouvir longas falas de uma voz artificial.
Por conta disso, durante o desenvolvimento é importante que a voz diga apenas a parte mais importante do texto ou que seja criado um botão para pular as interações.
- Considere usuários novos e recorrentes
Pessoas que voltam em uma mesma action mais de uma vez não gostam de ouvir a mesma mensagem longa. Para isso, é necessário otimizar o texto para o tipo de usuário que está interagindo.
Por exemplo, se um jogador estiver entrando pela primeira vez em um voice game é importante trazer o contexto completo do jogo, mas caso ele esteja voltando uma terceira vez é preciso encurtar a fala de abertura, trazendo mensagens como “bem-vindo de volta”.
- Abra o microfone apropriadamente
Para uma melhor interação com os usuários, o microfone deverá sempre ser ativado com qualquer pergunta feita diretamente ao assistente.
Assim, em um jogo de Quiz, por exemplo, o microfone deve ser aberto tão logo o assistente termine a pergunta, evitando que o jogador tenha que ouvir cada opção mesmo já sabendo a resposta de imediato.
- Enfatizar as perguntas
O texto escrito tem que trazer todos os detalhes de uma resposta do assistente de voz, mas a linguagem falada precisa ser simples para que seja compreendida rapidamente pelo usuário.
- Prepare-se para “Erros sem Correspondência”
Nos casos em que a fala do usuário não é reconhecida, Brill sugere que a interação do assistente seja reformulada até que o comando seja compreendido.
No entanto, caso a fala continue apresentando problemas de correspondência após duas tentativas, ele recomenda que a inteligência artificial adote uma resposta própria para manter o usuário dentro da action.
- Forneça comandos padrões
É importante que todos aplicativos de voz tenham opções para comandos comuns feitos pelos usuários, como “Sair/Fechar”, “Repetir/Diga novamente”, “Jogar de novo” ou “Me ajuda”.
- Garanta uma boa leitura e legibilidade
Em monitores inteligentes, Brill sugere que as fontes sejam fáceis de ler a qualquer distância e que sejam complementares, o que significa trazer uma harmonia visual para a tela.
- Forneça um feedback visual
Comum em ações voltadas para a compra e fornecimento de dados, é necessário que os aplicativos de voz digam uma fala de confirmação após um comando importante. Isso porque os usuários podem ter dito um comando errado ou, no caso do touch screen, ter clicado acidentalmente.
- Reduza a carga cognitiva
Em smart displays, é possível facilitar o entendimento com blocos de textos compactos na tela. Assim, para melhorar a compreensão do usuário, é preciso haver uma hierarquização das informações, em que a parte mais importante fique no topo e as sugestões de resposta na base.
Lições de mercado da Skilled Creative
Na live, o CEO da Skilled Creative, Brandon Kaplan, e a estrategista de produtos e contas criativas da empresa, Heather Peterson, conversaram sobre algumas experiências com o marketing para tecnologias de voz. Um ponto que eles destacaram é o fato de trabalharem a voz como um programa e não como um projeto.
Essa ideia, segundo eles, busca garantir que a tecnologia de voz esteja presente em todo o ecossistema de uma marca, não sendo apenas uma experiência isolada que seja esquecida pelo usuário. Para isso, eles pensam em todos os possíveis caminhos feitos pelo usuário durante a interação e em como vão encontrar o aplicativo de voz.
Durante a conversa, um dos ponto-chave para criar experiências de voz de sucesso é realizar constantemente levantamentos sobre o consumo dos usuários.
Como exemplo, eles trouxeram o case da HBO Max. Para criar uma experiência de voz, a Skilled Creative observou as redes sociais, como Twitter, Facebook e Reddit, para saber o que as pessoas esperavam e queriam fazer por meio da voz.
Além disso, a empresa fez uma pesquisa de consumo, sugerindo aos usuários entrevistados diferentes cenários com interações específicas para entender de forma mais precisa o que eles buscam.
Eles concluíram dizendo que no desenvolvimento de qualquer trabalho no mercado da voz é preciso estar atento às métricas encontradas, pensando o porquê das pessoas saírem da interação em um determinado ponto ou quais caminhos tiveram menos perdas de usuários.