Statistiek door een vergrootglas

Deze ken je vast. En zo niet: probeer ‘m ergens te pakken te krijgen en door te kijken. Het is een dun boekje over statistiek, met een van de mooiste titels ooit: How to lie with statistics.

Het is geen leerboek in de zin dat het je alle finesses leert van de statistiek. Het is een veel belangrijker onderwerp: hoe gebrúik je statistiek. In ons najagen van “meten is weten” en alles meetbaar maken – quantified self bijvoorbeeld – is dat uiterst belangrijk. Want wat word je voorgespiegeld door die getallen?

Statistiek is een taal.

Dat klinkt idioot. Toch is het waar. Met statistiek wordt, net als met taal, een boodschap overgebracht. Dat moet je wel zorgvuldig doen. In de taal laten we al steeds meer slordigheid toe. Voor een deel omdat we het gewoonweg niet belangrijk vinden. Voor een deel omdat we het soms ook wel vermakelijk vinden. Voor een deel omdat we de fouten niet meer zien. Met als resultaat dat we elkaar steeds minder goed (zullen gaan) begrijpen.

Op de Leidse markt prees een koopman zijn waar aan met een reclamebord: Echte Biologische Noten (oid). We snappen vast wat-i bedoeld: echt biologisch. Maar door de e achter echte staat er dus óók dat er ónechte noten bestaan. Die foute e kom je vaak tegen. En meestal corrigeren we vanzelf wel naar de juiste boodschap. Op de achterkant van Onze Taal staat iedere maand weer een aantal mooie voorbeelden hoe vreemd of verwarrend dat kan uitpakken: Ruggespraak.

20130502-184439.jpg

Communicatie tussen mensen is een dynamisch fenomeen. Betekenissen veranderen en conventies ook. Dat hoort. En dat is lastig.

Met taal kun je spelen. Als schrijver. Taal kun je zien als dagelijks werktuig. Als gewoon gebruiker. Met taal kun je vastleggen. Als jurist. Het maakt nogal uit hoe juist je dan formuleert en vastlegt, wat je schrijft. Die ene e maakt dan wel degelijk uit. Of, een wellicht nog mooier voorbeeld: de komma.

Enig idee wat het verschil is tussen “mijn vader, die” en “mijn vader die”? Die tweede is een beperkende bijzin. Daarmee kun je aardig in de problemen komen, met die komma: “ik werd gefeliciteerd door mijn vader die een stropdas droeg”. Geen probleem? Hier staat dat de ik-figuur meerdere vaders heeft. Wél een probleem.

Die dingen speelden door m’n hoofd toen ik een artikeltje las over het gebruiken van y-assen.

Het gaat feitelijk over hetzelfde. Grafieken die, bijvoorbeeld vanwege ruimtegebrek, worden ‘vereenvoudigd’. Het is zeker de moeite waard het artikel door te lezen. De waarschuwing is duidelijk: als je de y-as níet op nul laat beginnen, zorg je voor vertekening. Het lijkt alsof je door een vergrootglas kijkt. Da’s handig om de details waar te nemen, maar je moet je wel heel erg goed realiseren dat de verhoudingen niet meer kloppen.

When data gets mapped to visual variables for visualization, we tend to make the same assumptions. A bar that is twice as long represents a value that’s twice as big. But that is only true if that bar starts from zero. If it was cut off, that is no longer true.

The following image shows the monthly sales of a fictitious coffee chain over a few months. The left bar chart starts at zero, the right one at $29K. Notice the difference?

20130502-182948.jpg

In the right-hand chart, the bar for February appears to be roughly twice as high as the one for January. Twice the bar size means twice the value, right? But looking at the chart on the left, it’s obvious that the change is rather small.

The first thing to do when looking at a chart, therefore, is to make sure you understand the vertical axis. If it starts at 0, it is much easier to read the chart without being misled.

Kijk, da’s nou lying with statistics. Ik ga er vooralsnog maar van uit dat het geen kwade opzet is. Maar toch… wees alert. Want in deze wereld draait steeds meer om ‘bewijs’ en dat is heel vaak een getal. Of iets met infographics: ook bloedlink.

Maar wat zégt ‘t? Klopt ‘t?

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s