A divisão de inteligência artificial do Google informou, na semana passada, que vem desenvolvendo um novo software especificamente voltado para pessoas com dificuldades na fala. Apelidada de Parrotron, a tecnologia é executada em uma rede neural profunda treinada para converter padrões de fala atípicos em fala sintetizada fluente.
O que chama a atenção no Parrotron é que, ao contrário dos programas criados até então com esse objetivo, ele não depende de pistas visuais como o movimento dos lábios. Isso porque a rede neural do software foi alimentada com quase 30 mil horas de pares de declarações anônimas.
De acordo com os testes já aplicados, a tecnologia reduz a taxa de erro de palavra para um falante surdo de 89% para 25%. Como o desenvolvimento ainda não chegou ao seu final, o Google espera que os resultados sejam melhorados.
A segunda fase de aperfeiçoamento do programa envolverá, entre outras coisas, um conjunto separado de dados de pares de elocução, adaptando a rede a padrões únicos acústicos/fonéticos, fonotácticos e de linguagem, incluindo coisas como o modo como um falante altera, substitui ou remove certas vogais ou consoantes.
Neste ano, o Google já tornou públicos três esforços diferentes de acessibilidade: o Projeto Euphonia, que visa ajudar pessoas com deficiências da fala; o Live Relay, projetado para ajudar usuários surdos; e o Project Diva, que dá às pessoas alguma independência e autonomia pelo Google Assistente.
Segundo a Organização Mundial de Saúde, mais de 1 bilhão de pessoas, ou 15% da população mundial, vivem com algum tipo de deficiência.