Pesquisa identifica palavras que ativam Echo Dot acidentalmente

Pesquisadores da Universidade Estadual da Carolina do Norte e da Universidade de Paris criaram o LeakyPick, uma plataforma que periodicamente examina dispositivos equipados com microfone e monitora o tráfego de rede subsequente em busca de padrões que indiquem transmissão de áudio. Eles disseram que identificaram “dezenas” de palavras que ativam acidentalmente os smart speakers Amazon Echo.

O objetivo do LeakyPick é identificar gravações e transmissões de áudio de voz ocultas, além de detectar dispositivos potencialmente comprometidos. O protótipo dos pesquisadores, que foi construído em um Raspberry Pi por menos de US$ 40, opera periodicamente gerando ruídos audíveis quando um usuário não está em casa e monitorando o tráfego usando uma abordagem estatística aplicável a uma variedade de dispositivos habilitados para voz.

Segundo os pesquisadores, a plataforma tem 94% de precisão na detecção do tráfego de fala – funciona tanto para os dispositivos que usam uma palavra-chave quanto para os que não usam, como câmeras de segurança e alarmes de fumaça.

Para identificar palavras que podem acionar por engano uma gravação de voz, o LeakyPick usa todas as palavras em um dicionário de fonemas com a mesma contagem ou número de fonemas semelhante em comparação com as palavras-chave reais. A plataforma também verbaliza palavras aleatórias de um lista de termos em inglês simples.

Os pesquisadores testaram o LeakyPick com um Echo Dot, um Google Home, um HomePod, um Netatmo Welcome e Presence, um Nest Protect e um Hive Hub 360, usando um Hive View para avaliar seu desempenho. Após criar conjuntos de dados de rajada de linha de base e sondagem estatística, eles monitoraram o tráfego ao vivo dos oito dispositivos e selecionaram aleatoriamente um conjunto de 50 das 1.000 palavras mais usadas no idioma inglês, combinadas com uma lista de palavras-chave conhecidas de dispositivos ativados por voz.

Em seguida, eles tiveram usuários em três residências interagindo com os três alto-falantes inteligentes – Echo Dot, HomePod e Google Home – durante um período de 52 dias.

A equipe mediu a precisão do LeakyPick gravando registros de data e hora de quando os dispositivos começaram a ouvir comandos, aproveitando indicadores como o LED tocando ao redor do Echo Dot. Um sensor de luz permitiu ao LeakyPick marcar cada vez que os dispositivos eram ativados, enquanto um alto-falante de 3 watts era conectado ao Pi por meio de um som gerado por amplificador e um dongle Wi-Fi USB capturava o tráfego de rede.

Em um experimento destinado a testar a capacidade do LeakyPick de identificar palavras-chave desconhecidas, os pesquisadores configuraram o Echo Dot para usar a palavra-padrão “Alexa” e fizeram o LeakyPick tocar entradas de áudio diferentes, aguardando dois segundos para garantir que o alto-falante inteligente “ouvisse” a entrada. Segundo os pesquisadores, o Echo Dot “confiavelmente” reagiu a 89 palavras em várias rodadas de testes, algumas das quais eram foneticamente muito diferentes de “Alexa”, como “alachah”, “lechner” e “electrotelegraphic”.

Todas as 89 palavras transmitiram gravações de áudio para a Amazon – descobertas que não são surpreendentes à luz de outro estudo que identificou 1.000 frases que acionam incorretamente dispositivos equipados com Alexa, Siri- e Google Assistente, de pesquisadores de duas entidades da Alemanha. Os coautores desse artigo, que ainda não foi publicado, disseram à Ars Technica que os dispositivos, em alguns casos, enviam o áudio para servidores remotos, onde mecanismos de verificação “mais robustos” também confundem as palavras com palavras-chave.

“À medida que os dispositivos de IoT domésticos inteligentes adotam cada vez mais microfones, há uma crescente necessidade de defesas práticas de privacidade”, escreveram os criadores do LeakyPick. “O LeakyPick representa uma abordagem promissora para mitigar uma ameaça real à privacidade da casa inteligente”, acrescentaram.

Fonte: Venturebeat