quarta-feira, 28 de maio de 2014

O que pode Os Simpsons nos ensinar sobre estatísticas algoritmos? Bem, já que você perguntou ...


Oito passos para a construção de um HP BladeSystem


Big Big Data 5 Quando sua classe é convidado a dar um exemplo de um paradoxo em Os Simpsons, Bart oferece: "Você está condenado se você é do fazer, e você está condenado se você é do não."


O dicionário define um paradoxo como uma declaração absurda ou aparentemente absurdo ou contraditório que pode vir a ser verdade e quando se trata de dados de uma situação aparentemente contraditória podem surgir quando você está coletando e comparação de dados.







É um problema bastante sutil, algo que pode muito facilmente pegá-lo para fora, e é chamado de Paradoxo de Simpson *.


Imagine que você trabalha em uma agência de publicidade e estão intimamente envolvidos em uma campanha publicitária para o cliente A. Você mede o valor gasto na campanha em áreas específicas e também o efeito que tem (aumento das vendas de produto Z, previsivelmente).


No final da campanha que a publicidade enredo gastar contra as vendas e produzir um gráfico com uma linha linda mostrando uma correlação positiva: quanto mais o cliente gasta com você, maior será o efeito da publicidade. Vamos tomá-lo como li que não só existe uma correlação (como um número aumenta, o mesmo acontece com o outro), mas que a causalidade é também no trabalho. Ou seja, você também provar que o ato de gastar mais em publicidade realmente está causando diretamente o produto para vender melhor.



Você passar a trabalhar para o cliente B, uma com bolsos mais profundos, e executar outra campanha publicitária. Mais uma vez você medir gastos e efeito e, novamente, você produz uma trama genuinamente precisão indicando uma correlação positiva; e, novamente, você pode provar o nexo de causalidade.



Agora você está lançando para o cliente C e quer mostrar que gastar mais dá melhores resultados, de modo que melhor ilustração do que para combinar os resultados das campanhas anteriores (anónimos, é claro) em um show-stopping gráfico na sua apresentação? Você conecta os números, criar o gráfico e - aargh! De repente você tem uma correlação negativa, mostrando que gastar mais dinheiro em publicidade tem um efeito negativo sobre as vendas.



Como pode ser isso? Dois aspectos positivos não podem combinar em um negativo, não é? E isso é o Paradoxo de Simpson em poucas palavras.


Para resolver o paradoxo que ajuda se primeiro colorir os pontos de dados de cada conjunto de dados, para que possamos ver o que está acontecendo.



O primeiro conjunto de dados teve um gasto relativamente baixo e um alto retorno, o segundo um gasto muito maior e, em média, um retorno muito menor. Para ilustrar por que isso faz com que a correlação negativa quando eles são combinados, podemos calcular um ponto de "médio" para cada conjunto de dados. (Eu não estou recomendando isso como um teste estatístico, apenas uma forma de ilustrar o que está acontecendo).



Agora você pode ver que ao longo dos dois conjuntos de dados, como gasto médio aumenta, o retorno médio realmente cai. Isso ocorre porque o gasto médio do segundo set, é maior do que o primeiro, enquanto o seu retorno médio é realmente mais baixos. Isto é, independentemente do fato de que já sabemos, que dentro de cada set, o retorno médio aumenta.


A próxima pergunta poderia ser "Bem, por que estas médias tão diferentes?"


A resposta é que, embora os dois têm algumas semelhanças (sabemos que o investimento publicitário e podemos medir o efeito), na realidade, um grande número de fatores pode ser muito diferente.


* O homônimo Simpson aqui é realmente Brit estatístico Edward Simpson - mais sobre ele na página dois







via Alimentação (Feed)

Nenhum comentário:

Postar um comentário