Wiskundemeisjes

Ionica & Jeanine
 
Slik Internetbureau Rotterdam Internetbureau Rotterdam



Categorieën

Archief

Paradox-feesten


In Column, door Ionica

Deze column verscheen in De Volkskrant van 28 maart 2009.

Paradox-feesten

Stephen Fry kan het niet meer aanzien

Stephen Fry kan het niet meer aanzien

Stephen Fry mopperde in een interview dat de jeugd niet meer weet hoe ze een feest moet geven. Vroeger, toen de mannen nog hoeden droegen, organiseerden excentrieke intellectuelen paradox-feesten. De enige manier om binnen te komen was om aan de deur een mooie paradox te vertellen. Als iemand mij uit zou nodigen voor zo’n feestje, dan zou ik komen met de paradox van Simpson. Deze paradox is heel bekend onder statistici en (nog mooier) komt heel vaak voor in de praktijk. Hij is het beste uit te leggen met een voorbeeld.

In 1973 werd de universiteit Berkeley in Californië aangeklaagd wegens discriminatie. Van de mannen die zich aanmeldden werd 56% afgewezen en van de vrouwen maar liefst 65%. Het was niet zo dat er veel meer aanmeldingen van vrouwen kwamen: in totaal ging het over 8442 mannen en 4321 vrouwen (om maar eens precies te zijn). Het verschil in de toelatingspercentages was zo groot dat toeval uitgesloten leek: vrouwen moesten op een of andere manier tegengewerkt worden.

Er werd eens beter naar de cijfers gekeken en de aanmeldingen bleken per faculteit afgehandeld te worden. Van de zes faculteiten lieten vier juist een hoger percentage vrouwen dan mannen toe. De andere twee faculteiten lieten iets meer mannen dan vrouwen toe, maar het verschil was niet zo groot. Het leek er juist op dat vrouwen in de meeste gevallen bevoordeeld werden. Je zou dus denken dat in totaal vrouwen meer kans hadden om aangenomen te worden.

De verklaring was dat mannen en vrouwen zich niet voor dezelfde studies inschreven. Vrouwen meldden zich massaal aan voor studies waar relatief weinig mensen werden toegelaten. Bij Engels kwamen bijvoorbeeld twee op de drie aanmeldingen van vrouwen, bij werktuigbouwkunde slechts twee op de honderd. Terwijl Engels veel aanvragen afwees en werktuigbouwkunde juist heel weinig.

Dit is Simpsons paradox: als je gegevens van twee groepen op een onhandige manier combineert, dan lijken de resultaten van de groepen om te draaien. Het verschijnsel komt ook voor in de sport: een honkballer kan bijvoorbeeld zowel in 2007 als 2008 een beter slaggemiddelde hebben dan een concurrent, terwijl de concurrent over die twee jaren samen ineens een hoger gemiddelde heeft. Veel gevaarlijker is dat het effect ook kan optreden in medicijntesten – vooral als de testgroepen van grootte verschillen. Ook een onderliggende gezamenlijke oorzaak kan een vertekend effect veroorzaken. Baby’s met een laag geboortegewicht van rokende moeders hebben een lager gemiddeld sterftecijfer dan baby’s met een laag geboortewicht van niet-rokende moeders. Dat komt natuurlijk niet doordat roken goed is voor de baby, rokende moeders krijgen gemiddeld sowieso meer kinderen met een laag geboortewicht.

Een typisch paradox-feestje

Een typisch paradox-feestje

Kortom: het zou goed zijn als meer mensen weten dat de paradox van Simpson bestaat en beseffen dat ze niet zomaar gegevens bij elkaar op mogen tellen. Ik hoop dus dat ik eens word uitgenodigd voor een paradox-feest. Excentrieke intellectuelen mogen me altijd mailen.

10 reacties op “Paradox-feesten”

  1. Jan Paul:

    Deze uit de serie Blackadder is dan vast door Fry zelf bedacht:

    I wouldn't know a subtle hint if it stood on my desk in a purple dress dancing and singing, "Subtle hints are here again!"

  2. Martijn:

    you wouldn't recognize a cunning plan if it painted it self purple, danced naked on top of a harpsichord, singing cunning plans are here again!

    En de mooiste paradox: "Je moet nooit generaliseren!"

  3. maria:

    Had meneer W. Bush niet juist door dit fenomeen zijn tweede ambtstermijn als president behaald?

  4. suzan:

    Goede column! Mijn complimenten.

  5. Hans Kuiper:

    Is er ook een getallenvoorbeeld beschikbaar om het verhaal over het slaggemiddelde van de honkballers aan te tonen?

  6. HJ:

    Is het ook goed om niet naar het slaggemiddelde maar naar aantallen operaties in ziekenhuizen te kijken? Een ziekenhuis dat beter presteert op zowel 'zware' als 'lichte' operaties (slaggemiddelden zeg maar) en toch als slechter uit de bus komt over het geheel genomen. http://nl.wikipedia.org/wiki/Simpsons_paradox

  7. Jeroen van den Brink:

    [quote]
    een honkballer kan bijvoorbeeld zowel in 2007 als 2008 een beter slaggemiddelde hebben dan een concurrent, terwijl de concurrent over die twee jaren samen ineens een hoger gemiddelde heeft.
    [/quote]

    Goh. Echt waar? Voorbeeldje graag.

    Dus eeh... Hoewel Jeroen van der Veer in 2008 en 2007 meer verdiende dan ik, kunnen we niet geheel uitsluiten dat ik in die twee jaren samen toch meer verdiende dan Jeroen van der Veer? Gemiddeld per maand zullen we zeggen?

  8. Jeroen van den Brink:

    Excuus,

    Had de voorgaande post niet gelezen.

    Ik geloof dat ik het snap.

    gr.

  9. Reijer:

    Leuk. Valt mooi in de categorie dat kloppende getallen iets heel anders zijn dan een kloppende interpretatie.

    Om de laatste beetjes verwarring over de honkballers uit de wereld te helpen:

    Jaar1: speler 1 slaat 6/10 (0,6) en speler 2 slaat 50/100 (0,5)
    Jaar2: speler 1 slaat 40/100 (0,4) en speler 2 slaat 3/10 (0,3)
    Speler 1 heeft een hoger gemiddelde in elk jaar, maar speler 2 doet het beter over de twee jaren samen, want speler 1 slaat 46/110 en speler 2 slaat 53/110

    Dat werkt dus alleen voor relatieve getallen (aantal rake klappen op het aantal pogingen, aantal successen op het aantal operaties, etc), en niet voor absolute getallen zoals het twee-posts-boven-genoemde salaris.

  10. De Onderwijsdagen 2015: onderwijs op maat | I&M / I&O 2.0:

    […] De middag werd afgesloten met de keynote van Ionica Smeets (wiskundemeisje, maar ook hoogleraar science communication aan de Universiteit Leiden). Op humoristische wijze liet zij zien  hoe je data kunt manipuleren of misleiden aan de hand van voorbeelden zoals Simpsons paradox. […]

Plaats een reactie


Je kunt LaTeX gebruiken in je reactie.
Gelieve antwoorden op puzzels tussen [SPOILER] en [/SPOILER] te plaatsen.