foto: divulgação
Cientistas do Google desenvolveram uma ferramenta de aprendizado de máquina que pode ajudar a detectar e monitorar condições de saúde avaliando apenas ruídos como tosse e respiração, de acordo com um artigo publicado no site da revista Nature. A expectativa é que o sistema de inteligência artificial (IA) possa ser utilizado por médicos para diagnosticar doenças como Covid-19 e tuberculose, e para avaliar o bom funcionamento dos pulmões de uma pessoa.
Esta não é a primeira vez que um grupo de pesquisa explora o uso do som como biomarcador de doenças. O conceito ganhou força durante a pandemia quando cientistas descobriram que era possível detectar a doença respiratória através da tosse de uma pessoa. Esse tipo de ferramenta também já se mostrou promissora na detecção do diabetes, por exemplo, de acordo com estudo publicado na revista científica Mayo Clinic Proceedings: Digital Health no ano passado.
A maioria das ferramentas de IA desenvolvidas com essa finalidade são treinadas em gravações de áudio combinadas com informações de saúde sobre a pessoa que emitiu os sons. Por exemplo, os áudios podem ser rotulados para indicar que a pessoa tinha bronquite no momento da gravação. A ferramenta então passa a associar características dos sons ao rótulo dos dados, em um processo de treinamento denominado aprendizagem supervisionada.
Já a ferramenta do Google, chamada Health Acoustic Representations (HeAR), se baseia em dados não rotulados. Os cientistas extraíram mais de 300 milhões de clipes sonoros curtos de tosse, respiração, pigarro e outros sons humanos de vídeos do YouTube disponíveis publicamente.
Cada clipe foi convertido em uma representação visual do som chamada espectrograma. Em seguida, os pesquisadores bloquearam segmentos dos espectrogramas para ajudar o modelo a aprender a prever as partes que faltavam. A tecnologia é semelhante à que foi usada no treinamento da ferramenta ChatGPT.
Esse método poder ser adaptado para muitas tarefas. No caso do HeAR, a equipe do Google o adaptou para detectar Covid-19, tuberculose e se uma pessoa é fumante ou não. Como o modelo foi treinado numa gama tão ampla de sons humanos, os investigadores só tiveram de alimentá-lo com conjuntos de dados muito limitados, rotulados com estas doenças e características.
Os resultados mostraram que o modelo foi capaz de prever essas doenças com precisão acima dos modelos existentes treinados em dados de fala ou áudio geral. Além disso, o fato de os dados de treinamento originais serem tão diversos – com qualidade de som e fontes humanas variadas – significa que os resultados são generalizáveis. Os dados foram divulgados em um preprint que ainda não foi revisto por pares.
O campo da acústica da saúde, ou “audiômica”, é promissor, segundo Yael Bensoussan, laringologista da Universidade do Sul da Flórida, em Tampa, nos EUA, que co-lidera um consórcio de pesquisa focado em explorar a voz como um biomarcador para monitorar a saúde, à Nature. “A ciência acústica existe há décadas. A diferença é que agora, com IA e aprendizado de máquina, temos meios para coletar e analisar muitos dados ao mesmo tempo.”
Ainda é cedo para dizer se o HeAR se tornará um produto comercial. Mas, de acordo com Bensoussan, esse tipo de tecnologia representa um imenso potencial não só para diagnóstico, mas também para rastreio de doenças.
Por enquanto, o plano do Google é dar acesso ao modelo para que pesquisadores interessados possam utilizá-lo em suas próprias investigações. “Nosso objetivo como parte do Google Research é estimular a inovação neste campo nascente”, diz Sujay Kakarmath, gerente de produto do Google em Nova York que trabalhou no projeto.
O Globo