domingo, 23 de março de 2014

Goggle serviço gripe constatação diagnosticado com 'arrogância dados grande'


Transformando o seu negócio com armazenamento flash


Um artigo na Science afirma que o Google Flu Trends, revelado em 2008 para se tornar um garoto-propaganda de Big Data, tem um pequenino, minúsculo, falha fatal: é quase sempre errado.


O documento - resumo aqui - considera que não só Flu Trends perder completamente a gripe suína de 2009, mas por 100 dos 108 semanas desde 2011, as previsões do Google de surtos de gripe são simplesmente errado, ea razão é simples: quase todo mundo acha a menor fungada significa que eles têm influenza.







Isso é completamente em desacordo com a forma como o Google descreveu o projeto quando ele primeiro apresentou o projeto. Como pelo professor Johns Hopkins Steven Salzberg aqui , Fábrica de Chocolate originalmente afirmou que "podemos estimar com precisão o atual nível de atividade da influenza semanal em cada região dos Estados Unidos, com um atraso de cerca de um dia de relatórios".


Como Salzberg observa, para a semana mais recente em que o Centro de Controle de Doenças (CDC) publicou os dados, apenas 8,8 por cento das amostras enviadas para teste retornou um positivo para influenza.


Conversando com o podcast Ciência, aqui , o pesquisador David Lazer da Northeastern University, em Boston (e autor principal do artigo) sugere um problema é que as pessoas - incluindo altamente treinados Oompa Loompas - teste padrão do amor de correspondência, e que o Google "overfit" os dados .


"Eles ... overfit os dados. Eles tinham cinqüenta milhões de termos de busca, e encontraram alguns que aconteceu para se ajustar a freqüência de "gripe" ao longo da década anterior ou assim, mas na verdade eles estavam recebendo termos idiossincráticos que foram com pico no inverno, no momento dos picos "gripe" ... mas não foi motivada pelo fato de que as pessoas estavam realmente doentes com a gripe ", diz o podcast.


Tendo notado que isso causou erros, o Google publicou uma correção para Flu Trends, mas desde 2011, o sistema foi superestimar o número de casos de "gripe".


Chamar esse "grande arrogância de dados", Lazar diz que havia "certos pressupostos assados ​​na análise que condenou-o a longo prazo". Por exemplo, diz ele, o Google Flu Trends assumiu uma relação estável entre termos de pesquisa e a incidência de gripe, o que não foi o caso.


Próprios algoritmos de busca do Google, que via alguém a partir de uma pesquisa "gripe" de um produto adequado, também desempenham um papel, diz Lazar. Busca Google cria uma espécie de ciclo de feedback que o Google Flu Trends erroneamente interpreta como um surto. ®







via Alimentação (Feed)

Nenhum comentário:

Postar um comentário