escuro
Google Cloud

Google Cloud atualiza modelos de reconhecimento de fala

Plataforma melhora precisão para 23 idiomas de 61 localidades diferentes

O Google Cloud anunciou que está trazendo novos modelos de reconhecimento de fala para texto (STT). Segundo o blog da plataforma, esses modelos melhoram a precisão de 23 idiomas de 61 localidades diferentes. Além disso, a atualização traz suporte para assistentes de voz de terceiros, como o Spotify Car Thing e reconhecimento em ambientes com ruído e em condições acústicas. 

De acordo com o Google Cloud, essas melhorias permitem “resultados mais precisos em mais contextos”, levando essa tecnologia de voz para mais casos de uso. Por exemplo, existem os modelos chamados “Latest long”, projetado para falas mais longas ou demoradas, e o “Latest short”, criado para enunciados mais curtos. 

“Nos últimos anos, as técnicas de reconhecimento automatizado de fala (ASR) foram baseadas em modelos separados de acústica, pronúncia e linguagem. Historicamente, cada um desses três componentes individuais foi treinado separadamente e depois montado para fazer o reconhecimento de fala”, revela o blog da plataforma.

Imagem: Reprodução/Google Cloud

O Google Cloud está testando esses novos modelos, que ainda não foram lançados oficialmente, em alguns clientes, entre os quais o Spotify. No caso, o serviço de streaming foi um dos primeiros a adotar essas melhorias na interface “Hey Spotify”, encontrada no aplicativo para celular e no Car Thing

Segundo Daniel Bromand, chefe de hardware do Spotify, essa colaboração melhora a inteligência artificial do assistente de voz, aumentando a qualidade de reconhecimento dos ruídos e linguagem natural.

Total
0
Shares
Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts Relacionados
Total
0
Share