Wiskundemeisjes

Ionica & Jeanine
 
Slik Internetbureau Rotterdam Internetbureau Rotterdam



Categorieën

Archief

Correlatie en causaliteit


In Column, door Jeanine

Deze column verschijnt vandaag in de Volkskrant.

Ik heb een kleine obsessie voor bepaalde koppen in het wetenschapsnieuws in de krant en (vooral!) op internet. Denk aan koppen als “Drink More Diet Soda, Gain More Weight”, waarin een bepaald verband tussen twee fenomenen wordt genoemd, maar tegelijkertijd de suggestie gewekt wordt dat er een oorzakelijk verband bestaat tussen het een en het ander.

santa-coke

De kop lijkt te zeggen dat het drinken van light-frisdranken ervoor zorgt dat je zwaarder wordt, wat natuurlijk onzin is. Er bestaat wel een correlatie tussen aankomen en light-frisdrank drinken, maar de oorzaak-gevolg-relatie ligt precies andersom: mensen die zwaarder worden, zullen eerder de neiging hebben light-frisdrank te nemen.

Denkfouten als deze liggen op de loer als je het verschil tussen correlatie en causaliteit niet genoeg in acht neemt. Als twee fenomenen vaak samen optreden (correlatie), betekent dat niet per se dat het één het ander veroorzaakt (causaliteit). Deze drogreden heeft een mooie naam: cum hoc ergo propter hoc (Latijn voor: met dit, dus vanwege dit).

Er zijn verschillende andere mogelijkheden: misschien veroorzaakt het ander juist wel het één, zoals in het voorbeeld hierboven. Soms is een correlatie gewoon toeval. En soms zijn er een heleboel onoverzichtelijke andere factoren die invloed hebben, zoals bij correlaties in de complexe wereldeconomie.

Of misschien, en dat vind ik de leukste optie: misschien is er een duidelijke derde factor die de beide fenomenen veroorzaakt. Een klassiek voorbeeld is de correlatie tussen het aantal ingezette brandweerlieden en de schade die een brand veroorzaakt. Veroorzaken veel brandweermannen de grotere schade? Nee, natuurlijk niet. Er worden meer brandweermannen ingezet omdat het een grote brand is, en een grote brand levert meer schade op. Maar in veel gevallen ligt het wat subtieler en zie je niet meteen wat er niet klopt.

brandweermannen

Een mooi voorbeeld hoorde ik een tijd geleden in een lezing van voedingswetenschapper Martijn Katan. Hij vertelde over een onderzoek dat uitwijst dat er een correlatie bestaat tussen het risico op dementie en weinig sporten, met als bijbehorende kop: “Sporten doet risico op dementie verminderen”. Maar het zou ook kunnen dat beginnende dementie ervoor zorgt dat je weinig sport. Of er zou een derde factor kunnen zijn, bijvoorbeeld ongezond leven (roken, veel alcohol drinken, vet eten), die vaak samengaat met weinig sporten en bovendien een risicofactor is voor dementie.

Als ik zo’n kop lees, vind ik het leuk er zelf mogelijke derde factoren bij te verzinnen. Gewoon als gedachte-experiment, om eens te kijken hoe waarschijnlijk zo’n verband nou eigenlijk is als je alleen je gezonde verstand gebruikt. Met als bijeffect dat je het artikel kritischer gaat lezen. En vaak blijkt dan tijdens het lezen dat het verband wat subtieler ligt dan de kop suggereert. Soms zal er natuurlijk wèl een oorzakelijk verband zijn, maar daar heb je meer argumenten voor nodig dan het optreden van een correlatie alleen.

Ik denk overigens wel dat er een causaal verband bestaat tussen mijn wiskundige achtergrond en mijn obsessie met deze denkfout. Of zou ook daar een derde factor in het spel zijn? Hmmm.

16 reacties op “Correlatie en causaliteit”

  1. Eline:

    Ook een mooie: in gebieden waar veel ooievaars zijn, worden ook veel kinderen geboren. Derhalve: de ooievaar brengt baby's!

    In de spoiler de gemeenschappelijke oorzaak.

    Mensen die kinderen willen, gaan vaak buiten de de stad wonen, in groenere gebieden. Laten daar nu ook net meer ooievaars voorkomen.

  2. Tweets die vermelden Wiskundemeisjes » Blog Archive » Correlatie en causaliteit -- Topsy.com:

    [...] Dit blogartikel was vermeld op Twitter door zweefvrij, Kai Bakker. Kai Bakker heeft gezegd: @testtestest Correlatie en causaliteit http://dlvr.it/9GNlg [...]

  3. Chris:

    'Drink more diet soda, gain more weight' klinkt voor mij (als Britse) als een imperatief. Als je meer 'diet soda' drinkt dan voorheen, zul je zwaarder worden. Ik geef toe, je moet er wel veel meer van drinken, met 1 calorie per blikje zal het lang duren voor je zwaarder wordt, maar zwaarder zul je desalniettemin worden.

  4. Dennis:

    Als er meer ijsjes worden gegeten, verdrinken er meer mensen...

  5. Harm:

    Lightfrisdrank "misleidt" het lichaam dat je suiker binnenkrijgt waardoor insuline wordt aangemaakt, waarna de bloedsuikerspiegel in je bloed daalt. Daardoor krijg je daadwerkelijk behoefte om calorieën in te nemen. (Tenminste, dat heb ik zo begrepen)

  6. Martijn:

    En natuurlijk kunnen we

    http://xkcd.com/552/

    niet vergeten.

  7. Pieter:

    Twee webbronnen die bij dit artikel niet onvermeld mogen blijven:

    - In Wired magazine schreef Chris Anderson dat we in de moderne tijd, met enorme databases gevuld met informatie, geen causaliteit meer nodig hebben in onze modellen, puur vanwege de teleologische visie dat correlatie vaak goed genoeg werkt: http://www.wired.com/science/discoveries/magazine/16-07/pb_theory. Overigens ben ik het niet met hem eens, maar ik heb vast een te 'klassiek wetenschappelijke' geest.
    - XKCD tekende hierover al eens op: http://xkcd.com/552/

  8. Ruud Vermeij:

    "Van tofu krijg je geheugenverlies"
    Heeft iemand dat boekje al ontvangen???

  9. Word je nou echt dikker van cola light? | Susan over voeding, gezondheid, biologie en milieu:

    [...] zaterdag stond er weer een uitstekende column van de wiskundemeisjes in de volkskrant. In deze column werd commentaar gegeven op berichten in de [...]

  10. Coen de Bruijn:

    Vanaf dit weekend is "Van Tofu Krijg Je Geheugenverlies" te krijgen in de boekhandels en bol.com. Het gaat over gestuntel en gekonkel met statistiek in media, politiek en reclame. Volgende week ook een interview op Radio 1.

    Supporters van mijn boek krijgen het dus zeer binnenkort (gratis) opgestuurd.

    Groeten,
    Coen

  11. Marcel:

    Als aanvulling op de prima reactie van Harm :
    Je lichaam reageert op zoetstoffen alsof het suiker is en de insuline spiegel gaat omhoog. Vetstoffen worden dan opgeslagen ipv verbrand en de lichaamstemperatuur gaat omlaag. Hier kom je aan. Nu gaat het er niet om dat het verhaal van Wiskundemeisjes niet klop. Inderdaad wordt er te veel aangenomen. Het gaat er ook niet om of de insuline reactie perse waar is. Meer gaat het erom dat je denk dat je de waarheid in pacht hebt en daar bepaalde conclusies uit trekt. En dat zorgt dat de derde factor, zoals genoemd in de column, de aanname die je maakt is vaak de derde factor en die zorgt voor een schijncorrelatieinzicht. Ook bij wiskundemeisjes !!

  12. Ruud Vermeij:

    In reactie op mezelf en op Coen:
    Gisteren kreeg ik het boekje binnen. Ik ga het eens goed lezen!

  13. C L O S E R » Blog Archive » Causaliteit en correlatie – Etnische komaf en schoolprestaties:

    [...] staan enkele voorbeelden waarin dit ook gebeurt die duidelijk maken wat ik hier bedoel: Wiskundemeisjes » Blog Archive » Correlatie en causaliteit Een klassiek voorbeeld is de correlatie tussen het aantal ingezette brandweerlieden en de schade [...]

  14. Rik Wouters:

    Gelijk heb je (in je "obsessie")!!
    Hoe de journalisten het durven weergeven... Ze houden hun lezers of luisteraars voor de gek.
    Een jammerlijke gevolg is dat de werkelijke uitkomst van wetenschappelijk onderzoek door het publiek niet meer ernstig genomen wordt, omdat vaak absurde oorzaken worden geponeerd.
    Laten we bedoelde denkfout zoveel mogelijk bekendmaken!
    Vr gr

  15. #Autisme en biologische spruitjes, de harde cijfers |:

    [...] Plaatje zegt voldoende. Of toch niet? Lees nogmaals over correlatie versus causaliteit. [...]

  16. 42bis »Big Data and the rest of us… » Door: Jeroen Pronk »:

    [...] De dataficatie van de wereld. Nog nooit eerder konden we uit zoveel statistische informatie putten. Maar cijfers en feiten alleen geven geen inzicht. Dat weten we al lang en toch gebruiken we cijfers nog vaak verkeerd. [...]

Plaats een reactie


Je kunt LaTeX gebruiken in je reactie.
Gelieve antwoorden op puzzels tussen [SPOILER] en [/SPOILER] te plaatsen.