Dit bericht is geplaatst op zaterdag 27 november 2010 om 10:35 in categorieën Column. Je kunt de reacties volgen via een RSS 2.0 feed. Je kunt een reactie plaatsen, of een trackback van je eigen site plaatsen.
Wiskundemeisjes
Ionica & Jeanine
Correlatie en causaliteit
In Column, door Jeanine
Deze column verschijnt vandaag in de Volkskrant.
Ik heb een kleine obsessie voor bepaalde koppen in het wetenschapsnieuws in de krant en (vooral!) op internet. Denk aan koppen als “Drink More Diet Soda, Gain More Weightâ€, waarin een bepaald verband tussen twee fenomenen wordt genoemd, maar tegelijkertijd de suggestie gewekt wordt dat er een oorzakelijk verband bestaat tussen het een en het ander.

De kop lijkt te zeggen dat het drinken van light-frisdranken ervoor zorgt dat je zwaarder wordt, wat natuurlijk onzin is. Er bestaat wel een correlatie tussen aankomen en light-frisdrank drinken, maar de oorzaak-gevolg-relatie ligt precies andersom: mensen die zwaarder worden, zullen eerder de neiging hebben light-frisdrank te nemen.
Denkfouten als deze liggen op de loer als je het verschil tussen correlatie en causaliteit niet genoeg in acht neemt. Als twee fenomenen vaak samen optreden (correlatie), betekent dat niet per se dat het één het ander veroorzaakt (causaliteit). Deze drogreden heeft een mooie naam: cum hoc ergo propter hoc (Latijn voor: met dit, dus vanwege dit).
Er zijn verschillende andere mogelijkheden: misschien veroorzaakt het ander juist wel het één, zoals in het voorbeeld hierboven. Soms is een correlatie gewoon toeval. En soms zijn er een heleboel onoverzichtelijke andere factoren die invloed hebben, zoals bij correlaties in de complexe wereldeconomie.
Of misschien, en dat vind ik de leukste optie: misschien is er een duidelijke derde factor die de beide fenomenen veroorzaakt. Een klassiek voorbeeld is de correlatie tussen het aantal ingezette brandweerlieden en de schade die een brand veroorzaakt. Veroorzaken veel brandweermannen de grotere schade? Nee, natuurlijk niet. Er worden meer brandweermannen ingezet omdat het een grote brand is, en een grote brand levert meer schade op. Maar in veel gevallen ligt het wat subtieler en zie je niet meteen wat er niet klopt.

Een mooi voorbeeld hoorde ik een tijd geleden in een lezing van voedingswetenschapper Martijn Katan. Hij vertelde over een onderzoek dat uitwijst dat er een correlatie bestaat tussen het risico op dementie en weinig sporten, met als bijbehorende kop: “Sporten doet risico op dementie verminderenâ€. Maar het zou ook kunnen dat beginnende dementie ervoor zorgt dat je weinig sport. Of er zou een derde factor kunnen zijn, bijvoorbeeld ongezond leven (roken, veel alcohol drinken, vet eten), die vaak samengaat met weinig sporten en bovendien een risicofactor is voor dementie.
Als ik zo’n kop lees, vind ik het leuk er zelf mogelijke derde factoren bij te verzinnen. Gewoon als gedachte-experiment, om eens te kijken hoe waarschijnlijk zo’n verband nou eigenlijk is als je alleen je gezonde verstand gebruikt. Met als bijeffect dat je het artikel kritischer gaat lezen. En vaak blijkt dan tijdens het lezen dat het verband wat subtieler ligt dan de kop suggereert. Soms zal er natuurlijk wèl een oorzakelijk verband zijn, maar daar heb je meer argumenten voor nodig dan het optreden van een correlatie alleen.
Ik denk overigens wel dat er een causaal verband bestaat tussen mijn wiskundige achtergrond en mijn obsessie met deze denkfout. Of zou ook daar een derde factor in het spel zijn? Hmmm.
zaterdag 27 november 2010 om 13:47
Ook een mooie: in gebieden waar veel ooievaars zijn, worden ook veel kinderen geboren. Derhalve: de ooievaar brengt baby's!
In de spoiler de gemeenschappelijke oorzaak.
Mensen die kinderen willen, gaan vaak buiten de de stad wonen, in groenere gebieden. Laten daar nu ook net meer ooievaars voorkomen.
zaterdag 27 november 2010 om 13:59
[...] Dit blogartikel was vermeld op Twitter door zweefvrij, Kai Bakker. Kai Bakker heeft gezegd: @testtestest Correlatie en causaliteit http://dlvr.it/9GNlg [...]
zaterdag 27 november 2010 om 16:05
'Drink more diet soda, gain more weight' klinkt voor mij (als Britse) als een imperatief. Als je meer 'diet soda' drinkt dan voorheen, zul je zwaarder worden. Ik geef toe, je moet er wel veel meer van drinken, met 1 calorie per blikje zal het lang duren voor je zwaarder wordt, maar zwaarder zul je desalniettemin worden.
zaterdag 27 november 2010 om 17:30
Als er meer ijsjes worden gegeten, verdrinken er meer mensen...
zaterdag 27 november 2010 om 17:47
Lightfrisdrank "misleidt" het lichaam dat je suiker binnenkrijgt waardoor insuline wordt aangemaakt, waarna de bloedsuikerspiegel in je bloed daalt. Daardoor krijg je daadwerkelijk behoefte om calorieën in te nemen. (Tenminste, dat heb ik zo begrepen)
zondag 28 november 2010 om 15:24
En natuurlijk kunnen we
http://xkcd.com/552/
niet vergeten.
zondag 28 november 2010 om 17:58
Twee webbronnen die bij dit artikel niet onvermeld mogen blijven:
- In Wired magazine schreef Chris Anderson dat we in de moderne tijd, met enorme databases gevuld met informatie, geen causaliteit meer nodig hebben in onze modellen, puur vanwege de teleologische visie dat correlatie vaak goed genoeg werkt: http://www.wired.com/science/discoveries/magazine/16-07/pb_theory. Overigens ben ik het niet met hem eens, maar ik heb vast een te 'klassiek wetenschappelijke' geest.
- XKCD tekende hierover al eens op: http://xkcd.com/552/
maandag 29 november 2010 om 13:25
"Van tofu krijg je geheugenverlies"
Heeft iemand dat boekje al ontvangen???
dinsdag 30 november 2010 om 13:59
[...] zaterdag stond er weer een uitstekende column van de wiskundemeisjes in de volkskrant. In deze column werd commentaar gegeven op berichten in de [...]
woensdag 8 december 2010 om 16:56
Vanaf dit weekend is "Van Tofu Krijg Je Geheugenverlies" te krijgen in de boekhandels en bol.com. Het gaat over gestuntel en gekonkel met statistiek in media, politiek en reclame. Volgende week ook een interview op Radio 1.
Supporters van mijn boek krijgen het dus zeer binnenkort (gratis) opgestuurd.
Groeten,
Coen
woensdag 8 december 2010 om 20:33
Als aanvulling op de prima reactie van Harm :
Je lichaam reageert op zoetstoffen alsof het suiker is en de insuline spiegel gaat omhoog. Vetstoffen worden dan opgeslagen ipv verbrand en de lichaamstemperatuur gaat omlaag. Hier kom je aan. Nu gaat het er niet om dat het verhaal van Wiskundemeisjes niet klop. Inderdaad wordt er te veel aangenomen. Het gaat er ook niet om of de insuline reactie perse waar is. Meer gaat het erom dat je denk dat je de waarheid in pacht hebt en daar bepaalde conclusies uit trekt. En dat zorgt dat de derde factor, zoals genoemd in de column, de aanname die je maakt is vaak de derde factor en die zorgt voor een schijncorrelatieinzicht. Ook bij wiskundemeisjes !!
zaterdag 11 december 2010 om 11:55
In reactie op mezelf en op Coen:
Gisteren kreeg ik het boekje binnen. Ik ga het eens goed lezen!
woensdag 19 januari 2011 om 16:23
[...] staan enkele voorbeelden waarin dit ook gebeurt die duidelijk maken wat ik hier bedoel: Wiskundemeisjes » Blog Archive » Correlatie en causaliteit Een klassiek voorbeeld is de correlatie tussen het aantal ingezette brandweerlieden en de schade [...]
zondag 12 augustus 2012 om 14:59
Gelijk heb je (in je "obsessie")!!
Hoe de journalisten het durven weergeven... Ze houden hun lezers of luisteraars voor de gek.
Een jammerlijke gevolg is dat de werkelijke uitkomst van wetenschappelijk onderzoek door het publiek niet meer ernstig genomen wordt, omdat vaak absurde oorzaken worden geponeerd.
Laten we bedoelde denkfout zoveel mogelijk bekendmaken!
Vr gr
donderdag 13 december 2012 om 15:14
[...] Plaatje zegt voldoende. Of toch niet? Lees nogmaals over correlatie versus causaliteit. [...]
woensdag 5 juni 2013 om 12:01
[...] De dataficatie van de wereld. Nog nooit eerder konden we uit zoveel statistische informatie putten. Maar cijfers en feiten alleen geven geen inzicht. Dat weten we al lang en toch gebruiken we cijfers nog vaak verkeerd. [...]