Google Flu: Megadados da internet não são tão confiáveis

Os cientistas e pesquisadores têm-se mostrado entusiasmados com o que eles chamam de "Big Data", ou megadados, o gigantesco volume de dados que a informática e a internet estão permitindo juntar.

Uma das possibilidades é usar os comentários dos internautas em seus emails e redes sociais para rastrear doenças ou monitorar comportamentos.

Mas uma primeira análise de uma das ferramentas mais famosas dessa Era dos Megadados mostrou resultados desanimadores.

Pesquisadores examinaram os resultados oferecidos por uma ferramenta de agregação de dados do Google, o Google Flu Trends (Tendências da Gripe, do Google, em tradução livre), que foi projetada para monitorar em tempo real os casos de gripe com base em pesquisas feitas na ferramenta de busca que combinem com os termos para atividades relacionadas com a gripe.

O que eles descobriram é que, sem contextualizar os dados, o resultado fornecido pode ser apenas mais um número na coleção dos Megadados - ou pior, um número enganoso.

"O Google Flu Trends é uma peça de engenharia espetacular e uma ferramenta muito útil, mas ela também ilustra onde a análise dos 'big data' pode dar errada," disse Ryan Kennedy, da Universidade de Houston (EUA).

Mesmo com as modificações e melhorias que a ferramenta recebeu ao longo dos anos, o Tendências da Gripe superestimou os casos de gripe nos EUA ao longo dos últimos dois anos.

Como a ferramenta tem a intenção de ajudar nas medidas de prevenção à gripe, isto pode levar a medidas desproporcionais e desperdício de recursos.

Falhas do Big Data

Os pesquisadores acreditam ter descoberto as causas da falha do Google Flu Trends, que podem afetar outras análises puramente estatísticas dos megadados.

"Muitas fontes de 'big data' vêm de empresas privadas que, assim como o Google, estão mudando constantemente seus serviços de acordo com o seu modelo de negócios," disse Kennedy.

"Nós precisamos de um melhor entendimento de como isso afeta os dados que elas produzem; caso contrário, corremos o risco de tirar conclusões incorretas e adotar políticas inadequadas," complementou ele.

A equipe também questiona a captura de dados de plataformas como Twitter e Facebook - como tendências de voto e popularidade de mercado, por exemplo.

Segundo eles, campanhas de marketing e ações das empresas podem "manipular" essas plataformas para garantir que seus produtos "apareçam como tendências".

Ainda assim, o artigo defende que há espaço para os dados da internet, desde que eles sejam combinados com metodologias mais tradicionais, a fim de desenvolver uma compreensão mais profunda e mais precisa do comportamento humano - e viral.


Ver mais notícias sobre os temas:

Softwares

Epidemias

Infecções

Ver todos os temas >>   


  

A informação disponível neste site é estritamente jornalística, não substituindo o parecer médico profissional. Sempre consulte o seu médico sobre qualquer assunto relativo à sua saúde e aos seus tratamentos e medicamentos.
Copyright 2006-2016 www.diariodasaude.com.br. Conteúdo publicado sob licença de www.sciencetolife.com. Todos os direitos reservados para os respectivos detentores das marcas. Reprodução proibida.