Statistiek

Een week voor de Tweede Kamerverkiezingen kwam een collega naar me toe:
‘Guido, ik wil dat de hypotheekrenteaftrek blijft. Waar moet ik op stemmen?’
‘Je kan VVD stemmen, maar die gaan ook overstag.’
‘Dan stem ik daar op.’
‘Maar de hypotheekrenteaftrek is onhoudbaar, dus dan laat je je voorliegen.’

Het doet niet ter zake voor de rest van dit blog, maar het geeft wel aan dat ik altijd gelijk krijg. Dat is meestal niet leuk, alhoewel ik wel even in m’n eentje de polonaise heb gelopen toen het nieuws bekend werd dat de hypotheekrenteaftrek, ook wel bekend als de rijkeluissubsidie, op de lange termijn wordt afgeschaft.

Statistiek is niet voor bange mensen. De afgelopen week heb ik een wel heel grote passie ontwikkeld voor het New York Times blog FiveThirtyEight van statisticus Nate Silver. Silver heeft zich jarenlang enkel bezig gehouden met de statistiek rond baseball, een grote markt in de Verenigde Staten, omdat de sport een landelijke obsessie is. Maar sinds een aantal jaren houdt Silver zich ook bezig met de statistiek van Amerikaanse verkiezingen. Vier jaar geleden had ik zijn blog al ontdekt en nadat hij bij de presidentsverkiezingen van 2008 van de vijftig staten van 49 de uitslag correct voorspelde werd Silver opgepikt door de New York Times.

Silver heeft een model ontwikkeld waar ik met mijn vijfje voor wiskunde a, op het atheneum weliswaar maar toch, een vijfje, redelijk wat van kan volgen. Overigens, met dank aan Silvers heldere uitleg. Het komt er op neer dat hij per staat het gemiddelde neemt van de opiniepeilingen. Tot zover niets vreemds, dat kan ik met mijn basiskennis statistiek ook nog wel. Maar daar houdt het niet bij op. Hij kijkt ook of het peilbureau van dienst een goede reputatie heeft: zaten ze er bij de vorige verkiezingen ver naast, of juist heel dicht bij? Op welke manier hebben ze gepeild, via internet, telefonisch of per post? Hoeveel mensen hebben ze gevraagd? En van welke bevolkingsgroep, wit, zwart of hispanic? Welke leeftijd? Heeft een bepaald peilbureau een ‘voorkeur’ voor republikeinen of democraten? Ik kan zo nog wel even doorgaan, maar Silver krijgt op zijn blog geregeld de vraag tegengeworpen of die en die situatie ook is meegenomen in de voorspelling en steevast is het (geruststellende) antwoord ‘the model accounts for this.’

Het belangrijkste is dat Silver dit doet per staat, omdat in het Amerikaanse kiessysteem de president wordt gekozen door middel van kiesmannen. Een staat met weinig inwoners als Montana heeft drie kiesmannen, maar Californië heeft er 55 (wat overigens nog steeds een kromme verhouding is, maar toch). Wat ook aangeeft dat al die landelijke peilingen waar in de (Nederlandse) media zo vaak aan wordt gerefereerd complete onzin zijn. Een dieptepunt hierin was Leon de Winter die vorige week bij Pauw & Witteman mocht beweren dat Romney landelijk vijf procent op Obama voor stond, iets dat was gepeild door Rasmussen Reports, volgens De Winter ‘de meest betrouwbare pollster.’ De presentatoren slikten die quatsch voor zoete koek, maar Rasmussen peilt voor Fox News en is notoir onbetrouwbaar (lees er hier, hier en hier meer over).

Maar afgezien daarvan, het gaat om peilingen per staat, niet om het landelijk gemiddelde. Pak de uitslag van 2000 er maar bij: Al Gore kreeg een half miljoen meer stemmen, maar George W. Bush verzamelde de meeste kiesmannen.

De meeste staten zijn overtuigd democratisch of republikeins. Texas: republikeins. Californië: democratisch. Oklahoma: republikeins. Massachusetts: democratisch. Die zijn ook niet van belang; geen presidentskandidaat die in deze tijd van de verkiezingen campagne gaat voeren in Los Angeles of Dallas. Waar het om gaat zijn de swing states, een rijtje staten dat ik, als verslaafde, inmiddels kan dromen: Iowa, New Hampshire, Nevada, Colorado, Wisconsin, Virginia, North Carolina, Florida en Ohio. Vooral Ohio, omdat die staat achttien kiesmannen oplevert. Goed, Florida telt er 29, maar ik geloof niet dat een democratische kandidaat sinds de schandalen van de presidentsverkiezingen van 2000 ooit nog op Florida durft te vertrouwen.

Als je Silvers model erbij pakt, is het duidelijk dat Barack Obama de beste papieren heeft om de verkiezingen te winnen: hij is zeker van 231 kiesmannen, Romney van 191, waar een kandidaat 270 kiesmannen nodig heeft om gekozen te worden. En Obama staat voor in zes van de negen swing states, in twee andere is het een tossup en North Carolina lijkt naar Mitt Romney te gaan. En dat terwijl Romney vrijwel al die staten moet winnen om een kans te maken om president te worden. Het brengt Silver erop om de kans dat Obama de verkiezingen komende dinsdag wint te stellen op ruim 85 procent. Op dit moment dan, want gisteren was het nog 83,7 procent en morgen is het ongetwijfeld weer anders. Een collega van Nate Silver, Sam Wang van het Princeton Election Consortium die een soortgelijke methode als Silver hanteert gaat zelfs nog verder en stelt dat de kans dat Obama dinsdag wint 98,8 procent is.

Dat vinden conservatieve bloggers en journalisten niet zo’n leuk nieuws. En dus was Silver de afgelopen weken het doelwit van allerlei aanvallen. Hij zou bevooroordeeld zijn. De polls zouden consequent niet kloppen. Silver blogt namens de New York Times, een nogal liberale (lees: linkse) krant, dus hij zou er belang bij hebben als Obama wint. Hij maakt zich verdacht door de geheime code van z’n model niet openbaar te maken. En, de meest bizarre, er werd getwijfeld aan Silvers mannelijkheid, omdat hij nogal zacht zou praten en een hoge stem heeft. Shoot the messenger. Silver bleef er rustig onder en legde eerder deze week nog eens uit dat als je naar de cijfers kijkt je geen andere conclusie kán trekken dan dat Obama de grote favoriet is. Dan kunnen nog zoveel boze conservatieve bloggers hem zwart proberen te maken, maar dat het overgrote deel van de peilingen aangeeft dat Obama favoriet is, daar kan Silver niets aan doen (bovendien lezen die bloggers niet goed, want toen Romney begin oktober in een paar weken tijd op Obama in liep, was Silver er heel open in dat dit goede cijfers voor de republikeinse kandidaat waren).

Wang maakte eerder deze week nog gehakt van een CNN verslaggever die bij een peiling waarin Obama op vijftig procent en Romney op 46 procent stonde stelde dat dit gelijkspel was:

‘A few days ago, Wolf Blitzer at CNN cited a single Ohio poll, done by his own organization, showing Obama up by 4%. He then proceeded to call this a “tie,” revealing an amazing inability to interpret a simple number. Compounding this is the fact that dozens of polls have been conducted in Ohio. The odds of an Obama lead are extremely high. So why do Cillizza and Blitzer persist?’

Wang geeft even later ook antwoord op die vraag: omdat media iets nodig hebben om over te schrijven. Elke wijziging in de peilingen, hoe klein ook, wordt geïnterpreteerd als groot nieuws, hoewel het grootste deel van die veranderingen kan worden toegeschreven aan statistical noise. De peilingen geven hooguit een trend aan en de trend is dat er al maandenlang nauwelijks iets gebeurt in de swing states. Het is zelfs oersaai. Ja, het verschil tussen Obama en Romney is klein en de afgelopen maand iets kleiner geworden, maar voor de rest is er niets gebeurd. Sterker nog, nadat Romney na het eerste verkiezingsdebat eerst een week lang op Obama in was gelopen, zijn de peilingen al vier weken exact hetzelfde. En het lijkt erop dat Sandy, excuse the pun, Obama de wind in de rug heeft gegeven.

Maar de media heeft er belang bij de strijd neer te zetten als een nek-aan-nekrace. Want niets is saaier dan een verkiezing waarvan de uitslag eigenlijk al bekend is. En zowel de democraten als de republikeinen doen er alles aan om het vuurtje nog verder op te stoken: voor je het weet gaat je achterban helemaal niet meer naar de stembus ‘want het maakt toch niets meer uit.’

Wat de critici vergeten is dat niemand zoveel op het spel heeft staan als Silver zelf. Komen zijn voorspellingen niet uit, dan heeft het model volledig gefaald en loopt zijn reputatie ernstige schade op. Om zijn betoog kracht bij te zetten, plaatste Silver eerder deze week een uiterst accuraat overzicht. Hij neemt daarin de gemiddeldes van peilingen in swing states van diverse presidentsverkiezingen die vlak voor de verkiezingsdag werden gehouden en vergeleek die met de uiteindelijke uitslag. Afgezien van Texas in 1992, een staat die volgens de peilingen met 3,5 procent naar Bill Clinton zou gaan maar door George Bush Sr. werd gewonnen waren die enkele gevallen waarbij de peilingen ernaast zaten díe situaties waarbij het verschil 1,3 procent of minder was. En dan nog ging het in de helft van de gevallen goed.

In een blog dat Silver dit weekend plaatste houdt hij nog een kleine slag om de arm. Ja, het kan zijn dat de peilingen biased zijn voor de ene of de andere kandidaat maar, ook nu weer, the model accounts for this. Een geruststellende gedachte als ik dinsdagnacht mijn televisie op CNN heb afgestemd maar intussen op mijn laptop de berichtgeving op FiveThirtyEight, het Princeton Election Consortium en The Huffington Post bij hou. Het hoeft niet heel laat te worden. Gaat Virginia naar Obama, dan kan je rustig gaan slapen in de wetenschap dat hij ook de komende vier jaar president is. Maar vallen alle swing states in het straatje van Romney, dan kan het nog een latertje worden. De kans hierop is volgens Silver uiterst klein en hij is dé statistiekgoeroe. Nee, het gaat echt niet spannend worden.

This entry was posted in Media, Politiek and tagged , , . Bookmark the permalink.