In de hieronder besproken ’publicatie’ wordt een statistisch significante correlatie aangetoond tussen de verkoop van biologisch voedsel en het aantal autismediagnoses. Het blijkt – achteraf – bedoeld te zijn als een voorbeeld van hoe een pseudowetenschapper een leugen kan verspreiden indien bij gevonden correlatie eventuele causaliteit niet nader onderzocht wordt. In de tekst bij de grafiek verklapt de moderator van de citerende site BoingBoing meteen al de doelstelling van de auteur: hoe kun je eenvoudig een leugen poneren en dat ook nog statistisch onderbouwen. En passant noemt hij een soortgelijk geval: de relatie tussen preventieve inenting van kinderen en autisme.

Via een tweet kwam ik terecht bij deze Reddit-post (zie plaatje hieronder) van de hand van Redditor Jasonp55. Hij toont een significant verband aan tussen 2 variabelen: de in de USA toegenomen verkoop van biologisch voedsel (linker Y-as) en het aantal autismediagnoses (rechter Y-as) in de jaren 1997 t/m 2009 (X-as).

E.e.a. wordt in de grafiek gepresenteerd als twee trends in de genoemde jaren en een correlatiecoëfficiënt van nagenoeg 1,0 tussen (dat nemen we aan) “Organic Food Sales” en “individuals diagnosed”. Overigens een ongebruikelijke manier van presenteren: je zou toch een correlatiediagram en evt. een regressielijn verwachten met als onafhankelijk variabele de sales op de x-as en de afhankelijk variabele individuals diagnosed op de y-as.

1WZ6h

Het vraagteken achter de titel van de grafiek, de begeleidende tekst eindigend met puntje puntje puntje bij het bericht geven inzicht in de bedoeling van het artikel: “I was practicing GraphPad and I think I may have discovered the ‘real’ cause of autism… “

Dat het inderdaad een grap betreft blijkt uit een antwoord van dezelfde Jasonp55 op een gerelateerde post:

“It does imply association, but only if there’s a reasonable underlying hypothesis. For example, if I find a strong correlation between the dose of a drug and the effect of a drug, that makes sense. In my case, my chart is bunk because I don’t have any reasonable hypothesis to explain my results. All I did was data mine until I found an interesting pattern. My chart is extremely misleading, but that’s the point: pseudo-scientists do this all the time.”

Steun Kloptdatwel

Data mining: ter leering ende vermaeck 1Waardeer je dit artikel? Je kunt onze site steunen met een financiële bijdrage. Dat waarderen wij dan weer! Een donatie kun je doen via dit betaalverzoek (of klik op de afbeelding hiernaast).

NB de rekening staat op naam van Maarten Koller, formeel eigenaar van deze site.