Dispositivos integrados com assistentes de voz podem ser difíceis de usar quando se está em um local barulhento. Por conta disso, os pesquisadores do Google desenvolveram um sistema de reconhecimento de voz capaz de identificar e isolar a voz do usuário quando o ambiente apresenta muitos ruídos.
De acordo com os pesquisadores, o novo modelo VoiceFilter-Lite acelera o processo de reconhecimento de fala, enquanto reduz a quantidade de esforço computacional necessário.
O modelo original do VoiceFilter foi lançado em 2018, permitindo ao Google Assistente gravar e lembrar da voz de uma pessoa de forma personalizada. Porém, exigia uma quantidade muito alta de energia do dispositivo móvel para ser usado.
Já o VoiceFilter-Lite resolve justamente esse problema, pois ele filtra os sons não emitidos pelo usuário antes de processar o áudio. Assim, além de diminuir o custo de energia, melhora a compreensão por parte da inteligência artificial. Segundo os pesquisadores do Google, a nova versão fornece uma melhoria de 25,1% na taxa de erro de palavra na fala sobreposta.
“É importante ressaltar que este modelo pode ser facilmente integrado aos aplicativos de reconhecimento de voz existentes no dispositivo, permitindo que o usuário acesse recursos de assistência de voz em situações de barulho, mesmo se a conexão com a internet não estiver disponível”, disseram os pesquisadores.
Além de beneficiar os assistentes de voz, os avanços nesse tipo de tecnologia também ajudam as plataformas de teleconferência. Por exemplo, a Amazon criou o recurso Voice Focus para o serviço Chime, que detecta e anula os sons irrelevantes durante uma reunião.
O Google também investe nessa área com o recurso De-Noiser para o Google Meet, que ensina a inteligência artificial a distinguir vozes das entradas de áudio.
Fonte: Voicebot