O reconhecimento de voz é um dos grandes desafios para a evolução dos assistentes de voz. A avaliação é de Rodrigo Rubini, Head de Tecnologia da Benext, convidado da próxima live do NewVoice Talks, o canal do NewVoice no YouTube, na próxima terça-feira, dia 9 de junho. A live acontecerá das 19 às 20 horas. Para ele, a tecnologia de reconhecimento de voz avançou muito nos últimos anos, estando, hoje, em uma segunda fase, a de aprimoramento.
“A solução já maturou muito, mas o conjunto da obra entre a capacidade de reconhecimento de voz do próprio assistente e o trabalho de quem faz a parte de criação do design conversacional sempre será um desafio”, comenta Rubini, que em sua live vai explorar os caminhos para o desenvolvimento de actions e skills.
NewVoice Summit – Como você avalia o atual estágio dos assistentes de voz que existem no mercado?
Rodrigo Rubini – Do ponto de vista técnico, a gente tem alguns desafios no próprio reconhecimento de voz. Essa tecnologia já maturou muito ao longo dos últimos anos, mas o conjunto da obra entre a capacidade de reconhecimento de voz do próprio assistente e o trabalho de quem faz a parte de criação do design conversacional sempre será um desafio. Nos últimos anos, tivemos o avanço do algoritimo de reconhecimento de voz, mas ainda existe um caminho longo pela frente. Já temos aí uma segunda fase iniciada, que é a de aprimoramento.
NewVoice Summit – Quais as principais diferenças entre criar um assistente de voz com o Google Assistente e com a Alexa, as duas principais plataformas?
Rodrigo Rubini – Existem as particularidades de uma e de outra ferramenta de desenvolvimento de assistentes de voz, que não são difíceis de você se ambientar. Com uma lida na documentação, um help ou uma conversa com a comunidade, é possível entender rapidamente as diferenças. O Google Assistente, por exemplo, tem uma grande base de aparelhos com telas (celulares, sobretudo) e a Alexa com dispositivos sem tela.
NewVoice Summit – E o que isso significa, na hora de colocar a mão na massa?
Rodrigo Rubini – Então, aquilo que você vai sugerir muda. Tem o desafio de criação e o de tecnologia para poder passar para o desenvolvimento os perfis de uso. Vejo que a diferença está mais no conceito do que na dificuldade técnica, pois você usa o SDK da Alexa ou o do Google.