Les: StemWijzer vs KiesKompas

Hulp bij het maken van een belangrijke keuze: StemWijzer vs KiesKompas


Samenvatting van deze les

Programmas op het internet kunnen mensen helpen bij
het maken van belangrijke keuzes in hun leven: het vinden van een huis,
partner, studie, op welke partij je moet stemmen, enzovoort. We zien
wat er komt kijken bij het maken van zo’n programma en behandelen het
voorbeeld van stemwijzers (hulp bij verkiezinigen). We laten zien hoe
moderne zoektechnologie nu al een rol speelt bij dit soort programmas.
We geven ook aan wat voor soort vragen we hopen dat een Google van de
toekomst voor ons kan beantwoorden.
Let op. Deze les is gebaseerd op de StemWijzer en KiesKompas voor de verkiezingen van November 2006. Ondertussen kan hun werkwijze zijn veranderd. Trek dus geen conclusies over de huidige StemWijzer of KiesKompas op basis van wat je hier hebt geleerd.

Het probleem.

Je staat voor een belangrijke keuze in je leven met vergaande
gevolgen. Verschillende spelers dingen naar je gunsten, en proberen je
te verleiden met hun in zee te gaan. Ze bedelven je onder informatie.
Ze lijken allemaal zo veel op elkaar. Ze zeggen allemaal eigenlijk maar
1 ding: kies mij! Hoe ga je hier mee om?

Voor verschillende van dit soort keuzes zijn speciale
hulpdiensten ontstaan. Mensen betalen die om hen te helpen bij het
maken van een goede keuze. Voorbeelden hiervan zijn:

Keuze Hulp
Kopen van een huis Makelaar en
  hypotheekadviseur
Vinden van een partner Dating sites en
  bemiddelingsbureaus en
  huwelijksmakelaars (koppelaars)
Kopen van een duur artikel Consumentenbond

Dating sites zijn een prachtig voorbeeld van het
gebruik van internet om het probleem (vind een partner) makkelijker te
maken. In deze les kijken we naar een ander voorbeeld: hulp bij het
bepalen van je stem tijdens verkiezingen.

Doe nu eerst opdracht 1.

Stemwijzers: Waarom zo leuk? Waarom zo handig?

Gratis schoolboeken op middelbare scholen was een heet onderwerp bij
de parlementsverkiezingen op 22 November 2006. Stel dat je mag stemmen
en dat je alleen op een partij wilt stemmen die schoolboeken gratis
wilt maken: hoe vind je die? En wat voor antwoord zou je willen hebben
van een computerprogramma dat je helpt met het maken van je stemkeuze?
Hier zijn wat mogelijke antwoorden die zo’n programma zou kunnen geven:

  • een partij die het hiermee (dus “alle schoolboeken moeten gratis”) eens is;
  • alle partijen die het hiermee eens zijn;
  • al die partijen plus hun preciese standpunten op dit onderwerp;
  • of misschien de standpunten van alle partijen op het onderwerp middelbare school.

In Nederland zijn er twee grote stemadvies sites:
Stemwijzer en Kieskompas. We geven hier de sites voor de Tweede
Kamerverkiezingen van 22 November 2006:

Beide sites werken ongeveer hetzelfde:

  • je geeft je mening op een aantal stellingen;
  • die wordt vergeleken met de standpunten van de partijen op diezelfde stellingen;
  • je krijgt een advies welke partij goed bij je past.

Waarop lijken deze stemwijzers?

Stemwijzer lijkt op een persoonlijkheidstest in
damesbladen als Libelle en Margriet. Je beantwoordt een aantal vragen,
je scoort punten met elk antwoord, telt die op en op basis daarvan
krijg je een advies. Bij stemwijzer krijg je als advies een lijstje
partijen met de best passende bovenaan.

Kieskompas werkt vergelijkbaar maar
het advies is subtieler. Je krijgt geen 1-dimensionale lijst maar een
2D plaatje van het politieke spectrum, waarin je zelf staat (aangegeven
door een rood potlood) en ook de partijen. In dit plaatje, , zie je geen rood potlood maar het torentje op het binnenhof. Dit plaatje geeft aan waar de huidige regering staat op het politieke spectrum.

De stellingen van kieskompas en stemwijzer.

Laten we eens naar twee voorbeelden kijken. Eerst een stemwijzer stelling:

Stelling 2
De kinderbijslag moet omhoog.
Eens Oneens Weet Niet

En de vergelijkbare stelling in het kieskompas:

familie en kinderopvang 1 2 3   	 
Hoe meer mensen verdienen, hoe minder kinderbijslag ze moeten ontvangen.
helemaal mee eens mee eens neutraal/geen mening niet mee eens helemaal niet mee eens

Doe nu eerst opdracht 2.

Hoe komt het advies van een stemwijzer tot stand?

Hoe bepalen de stemadviessites nou hun advies? Grof gezegd meten ze
op dezelfde wijze de politieke voorkeur van jou en van alle partijen op
en vergelijken die met elkaar. Hun advies bestaat uit een lijstje van
partijen die het meest op jou lijken.

Dit klinkt een stuk magischer dan het is, en daarom
gaan we er wat dieper op in. Stel je doet de stemwijzer: dus je scoort
30 stellingen en op elke stelling geef je 1 van de drie antwoorden.
Jouw antwoordgedrag wordt dan opgeslagen als een vector. Die vector is niets meer dan een rijtje met al je antwoorden op al je vragen. Dat ziet er bijvoorbeeld zo uit:

Maarten: 1, weet niet;2, mee eens;3 weet niet; .... ;30, mee oneens.

Met 30 stellingen en 3 antwoordmogelijkheden zijn er best veel
verschillende vectoren mogelijk.

Hoeveel? Nou 3 * 3 * …. * 3, dat 30
keer, dus 3 tot de macht 30.

(Ter vergelijking, een Ipod met 1 Gigabyte
geheugen heeft 2 tot de macht 30 Bytes geheugen. Een
byte is een vector van lengte 8 waar alleen de
“letters” 0 en 1 in mogen voorkomen. (Je kan dus 2*2*…*2, acht keer = 2 tot de macht 8 = 256 verschillende byte “woorden” schrijven. Een voorbeeld is 0000 1011.))

Goed, nadat je je vragen hebt ingevuld hebben ze jouw
vector. Ook hebben ze voor elke partij een vector (de score van de
partijen op de stellingen). Hoe ze daaraan komen zien we zo. Dan kijkt
de stemadviessite welke van de partij-vectoren het meest lijken op jouw
vector. Dit kan op een flink aantal verschillende manieren. De
simpelste is het aantal overeenkomsten tellen. Dan wegen dus alle
stellingen even zwaar en alleen het juiste antwoord telt (of goed of
helemaal fout). Zowel stemwijzer als kieskompas gebruiken meer
ingewikkelde methodes.

Doe nu eerst opdracht 2vector.

Hoe verkrijgt men de scores van de partijen op de stellingen?

Zowel stemwijzer als kieskompas maken eerst een grote hoeveelheid
stellingen op basis van de partijprogrammas, de verkiezingsthemas in
het nieuws en hun eigen politieke gevoel. Vervolgens moet men
natuurlijk weten wat de standpunten van de partijen zijn op die
stellingen. Hierin verschilt de aanpak:

  • stemwijzer stuurt de stellingen naar de partijen op, en vraagt om een score en een korte uitleg.
  • kieskompas
    laat een aantal eigen politieke experts de scores bepalen voor elke
    partij. Dit gebeurt op basis van de verkiezingsprogrammas en hun
    websites met standpunten. De experts geven naast de score ook een
    stukje tekst waaruit het standpunt van de partij (en dus ook de score)
    op een stelling blijkt.

Doe nu eerst opdracht 3.

Bepaal het standpunt van een politieke partij op een stelling.

Dit is helemaal geen makkelijke opgave. Politici zijn zeer bedreven
in het verhullen van informatie, en zeker in Nederland vinden ze het
niet prettig om het achterste van hun tong te laten zien. Men moet
namelijk altijd rekening houden met het feit dat je comprommissen moet
sluiten in een te vormen coalitie.

Voor mensen is het dus al een moeilijke taak, voor
computers dan natuurlijk helemaal. Toch vind er onderzoek aan
universiteiten en onderzoeksbureaus plaats, waarin getracht wordt dit
mogelijk te maken.

Om eerst maar eens te zien hoe moeilijk deze taak is,

Doe nu eerst opdracht 4.

Zoekmachine naar partijprogrammas

In opdracht 4 werd gebruik gemaakt van www.verkiezingskijker.nl,
een zoekmachine naar partijprogrammas. Het bijzondere (en het grote
verschil met Google) aan deze zoekmachine is dat hij op een zoekvraag
als kinderbijslag niet alleen alle partijprogrammas
teruggeeft waarin dit woord voorkomt (dat zijn ze natuurlijk bijna
allemaal), maar precies die paragrafen uit de partijprogrammas die over
dat onderwerp gaan. Hier zijn twee voorbeeld queries:

Deze zoekmachine vergemakkelijkt het werk van de codeurs van
Kieskompas enorm. Voor de nationale verkiezingen moesten ze 36
(stellingen) maal 11 (politieke partijen) = 396 stellingen scoren
(bron: http://nl.wikipedia.org/wiki/Kieskompas). Naast de score moest men natuurlijk ook een bewijs voor die score vinden: een stukje tekst over het onderwerp van de stelling waaruit de score blijkt.

Dit was misschien nog wel te doen met de hand, maar
op 10 Maart 2007 waren de provinciale verkiezingen in Nederland.
Opnieuw werd er een kieskompas gemaakt, maar nu voor elke provincie.
Gemiddeld deden er zo’n 10 partijen per provincie mee: we hebben het nu
dus over 36 (stellingen) maal 10 (partijen) maal 12 (provincies) =
4.320 scores en stukjes tekst. Een vrijwel onmogelijke taak zonder
goede zoekhulp, zeker als je bedenkt dat het in slechts 2 weken moest
worden uitgevoerd (want de verkiezingsprogrammas komen pas op het
laatste moment uit.)

Kieskompas was dan ook erg blij met de zoekmachine
ontwikkeld voor de provinciale staten verkiezingen,
en heeft er dankbaar gebruik van gemaakt. Dit is een mooi voorbeeld hoe
moderne informatietechnologie kan helpen om een vrijwel onmogelijke
taak toch uit te voeren. Maar ook de zoekmachine kon verbeterd worden
door het gebruik van de Kieskompas mensen. Hoe? Dat lees je in de
volgende sectie.

Verbeter het aantal zoekresultaten: voeg zoektermen toe.

Het grote probleem voor de zoekmachine achter verkiezingskijker is
dat er maar hele korte stukjes tekst worden teruggegeven: namelijk
losse alineas uit programmas. Een zoekmachine als Google heeft het
makkelijker want die geeft hele webpaginas terug, en die zijn over het
algemeen veel langer.

Het probleem is simpel: stel je zoekt alineas over het onderwerp vliegveld.
Maar heeft de schrijver ook dat woord gebruikt? De kans is groot dat er
alineas in de programmas staan die inderdaad gaan over het onderwerp vliegveld, maar waarin het woord vliegveld niet voorkomt. In plaats daarvan staat er dan bijvoorbeeld iets als

  • vliegtuig
  • luchthaven
  • Schiphol
  • geluidsoverlast

Hoe groter de stukken tekst die een zoekmachine teruggeeft, hoe
groter de kans dat een zoekwoord erin voorkomt. Dus een zoekmachine die
alineas wil teruggeven maakt het moeilijk voor zichzelf. Gewoon omdat
de kans dat de zoekwoorden erin voorkomen kleiner is.

Vergelijk nou eens de resultaten op de volgende twee
paren zoekvragen. Kijk ook eens bij het zoeken op een thema naar de
extra relevante termen in blauw, en zie hoe die opgelicht worden in de
resultaten.

Hoe kan een alinea-zoekmachine nou omgaan met het
probleem van kleine stukjes tekst? En dus met de kleine kans dat een
zoekwoord daarin voorkomt? Er zijn op het eerste gezicht twee
strategieen:

  1. voeg extra woorden toe aan de zoekvraag van de gebruiker. Dus bij de vraag vliegveld zoekt de machine eigenlijk op de vraag vliegveld OF vliegtuig OF luchthaven OF Schiphol OF geluidsoverlast.
  2. voeg
    extra woorden toe aan de alineas. Die woorden beschrijven dan als het
    ware waar de alinea over gaat. De gebruiker zal ze niet zien, maar de
    zoekmachine wel.

Dat is mooi gezegd, maar niet zo makkelijk gedaan. Want

  • Hoe kom je aan die extra woorden?
  • Hoe zorg je dat je niet van het onderwerp van de gebruiker afdwaalt? Geluidsoverlast zou best wel eens alineas over tieners op houseparties kunnen opleveren….

De eerste vraag beantwoorden we in de opdracht: dit kan met de
techniek die gebruikt wordt om de stemming van het internet te
verklaren (zie www.moodviews.com), de loglikelyhood methode om opvallende woorden te ontdekken. In de opdracht zal je ook het gevaar genoemd in de tweede vraag tegenkomen.

Doe nu eerst opdracht 5.

Toekomst: niet alleen feiten zoeken, maar ook standpunten en meningen

Aan de Universiteit van Amsterdam wordt onderzoek gedaan naar het
automatisch opsporen en opslaan van politieke informatie, en die
vervolgens op allerlei manieren aanbieden aan gebruikers. De politiek
informatie wordt abstract in het volgende formaat opgeslagen:

Stakeholder X says Y about topic Z in source S at time T

Hier is een voorbeeld van een zin uit een Reuters
nieuwsbericht. In de zin is aangegeven welke delen horen bij welke
soort variabele. Dus de bron S is Reuters, het onderwerp (topic) Z is Darfur, enzovoorts.

GENEVA (Reuters)S – (A U.N. human rights mission)X (accused Sudan’s government)Y on (Monday)T (of orchestrating and taking part in gross violations)Y in (Darfur)Z

Heel makkelijk gericht zoeken.

Als we informatie uit het nieuws, websites van partijen, weblogs van
politici, de verslagen van vergaderingen in de regering en Tweede
Kamer, misschien wel alle blogs en discussiefora in Nederland in dit
XYZST formaat beschikbaar hadden, hebben we heel makkelijk een schat
van informatie beschikbaar. Een vraag als

Wie heeft er afgelopen week iets gezegd over gratis schoolboeken?

vertaalt direct naar

geef alle X uit rijtjes XYZST waarbij
Z = gratis schoolboeken, en
T = today() OR today()-1 OR …. OR today()-6.

Computers kunnen dit soort vragen heel erg goed en snel beantwoorden.

Mogelijke toepassingen.

Inlichtingendiensten als de CIA zijn zeer geinterreseerd in dit soort technologie. Ga maar na, men denkt dat ze al
het email-, SMS- en mobiele telefoon-verkeer afluisteren en opslaan.
Dat is natuurlijk veel te veel om met de hand na te pluizen. En ook al
zou het kunnen, dan is het te langzaam. De CIA zou natuurlijk dolgraag automatisch dit soort XYZST rijtjes uit al die informatie halen.

Er zijn gelukkig ook leukere toepassingen voor gewone mensen. Een mooi voorbeeld is de blog-zoekmachine opinmind.com.
Ze vinden niet alleen blogposts voor je, maar verdelen ze meteen in de
positieve en de negatieve over jouw gezochte onderwerp. Als je wilt
weten wat men vindt van de president van de VS, dan vraag je http://opinmind.com/search.jsp?q=George+W+bush. De site is ook handig als je wilt weten wat men van een film of een CD vindt.

In de laatste opdracht vragen we om jouw hulp. Kan jij een killer-applicatie verzinnen voor een blog zoekmachine?

Doe nu opdracht 6.


Meer weten?


Opdrachten

Opdracht 1

Stel, je wilt een studie gaan doen na je middelbare school. Maar
welke, waar, aan wat voor instelling, ….? Dit is een goed voorbeeld
van een keuze met vergaande gevolgen.

(A) Geef drie verschillende bronnen die je zou raadplegen bij het maken van die keuze. Vermeld bij elke in 1-2 regels waarom.
(B) Stel dat je al weet wat
je wilt gaan studeren. Dan nog zijn er vast een hoop plekken waar dat
kan. Allemaal willen ze je graag hebben en bedelven je onder
informatie.

  1. Hoe ga je met die berg informatie om?
  2. Bedenk
    een soort computer/internet programma wat je hierbij zou kunnen helpen.
    Dit kan een (aanpassing van een) bestaand programma zijn of je kan zelf
    iets bedenken. Beschrijf nu wat jij doet met dat programma en hoe het
    programma je dan helpt. (Voorbeeld: beschrijving van http://www.ns.nl/
    is iets als: je wilt weten wanneer er treinen gaan van A naar B; je
    vult beide stations in, en een datum, en het programma geeft een
    overzicht van de treinen en tijden die gaan tussen A en B).

Inleveren Voor (A) de drie bronnen plus je motivatie. Voor (B) een korte beschrijving van je programma (volg het voorbeeld).

Opdracht 2

Zoek de twee gegeven stellingen over kinderbijslag op in http://www.stemwijzer.nl/2k2006/ en http://tweedekamer.kieskompas.nl/.
De stellingen gaan over hetzelfde onderwerp. Toch zijn er een hoop
verschillen, zowel in de bewoording van de stelling als in de
presentatie. Beschrijf kort de verschillen op de volgende punten:

  1. de “naam” van de stelling.
  2. de hoeveelheid antwoordmogelijkheden
  3. de verwoording van de neutrale antwoordcategorie. Er wordt gevraagd naar een mening. Wat is er raar aan de bewoording van de neutrale categorie van de stemwijzer?
  4. de
    stelling zelf: stel dat ook kieskompas maar 3 antwoordmogelijkheden
    had: welke stelling zou de partijen beter scheiden, denk je, en waarom?

Inleveren De verschillen op de 4 punten.

Opdracht 2Vector

 In de tekst zagen we de meest simpele manier van het
vergelijken van twee scores. Dit leidde tot een score tussen de 0 en 1.
Voor de kieskompas antwoordmogelijkheden lijkt dit niet echt eerlijk.
Als jij helemaal mee eens hebt gekozen en een partij mee eens dan lijk je er meer op dan wanneer die partij mee oneens had gekozen. We kunnen de vergelijkingsmethode hierop aanpassen door elk antwoord ook een score te geven. Bijvoorbeeld zo:

helemaal mee eens mee eens neutraal mee oneens helemaal mee oneens
2 1 0 -1 -2

Voor elke stelling kunnen we nu ook een afstand bepalen door de
absolute waarde van het verschil te nemen. We hebben dan 5 mogelijke
scores: 0,1,2,3,4.  Die kunnen we dan voor elke stelling berekenen
en bij elkaar optellen en zo de overeenkomst bepalen.

Het vervelende nu is dat we geen duidelijke score meer hebben. Met
30 stellingen lopen de waardes uiteen van 0 (helemaal hetzelfde) tot
120 (= 30 maal 4) (helemaal verschillend).

Geef een manier om hier toch weer mooi scores tussen 0 (helemaal hetzelfde) en 1 (helemaal verschillend) uit te krijgen.

Inleveren Jouw manier, en laat je score zien op een voorbeeld met 3 stellingen.

 

Opdracht 3

Beoordeel de twee werkwijzes van stemwijzer en kieskompas. Beantwoord de volgende vragen:

  1. Wat is het gevaar van de stemwijzer aanpak?
  2. Wat is het voordeel van de stemwijzer aanpak?
  3. Welke aanpak geeft het eerlijkst advies, denk je?
  4. Kieskompas scoort zelf de partijen, maar stuurt de scores daarna op
    naar de partijen die een gemotiveerd tegenwoord kunnen geven. Over het
    algemeen willen de partijen altijd hetzelfde. Wat zou dat zijn? Waarom
    zouden ze dat willen? Denk nogmaals aan de manier waarop de partij
    die het dichtst bij jou staat wordt bepaald. Wat voor
    soort antwoorden van een partij zijn voor die partij het
    voordeligst?

  5. Het gevaar van de
    stemwijzer aanpak lijkt op 1 van de grootste problemen waar Google en
    andere zoekmachines mee te kampen hebben. Dit wordt wel webspamming of spamdexing genoemd.

    1. Wat is de bedoeling van webspamming?
    2. Hoe werkt het? Geef een of twee voorbeelden van webspam trucs.
    3. Wat is nou de overeenkomst met het stemwijzer gevaar?
    4. Heeft
      kieskompas dat gevaar nou echt voor altijd opgelost? Of kunnen partijen
      ook daar weer wat slims op verzinnen? Zo ja, vertel het ons!

Inleveren Vragen 1-5.

Opdracht 4

In deze opdracht ga je op zoek naar de standpunten van de regering
Balkenende IV zoals verwoord in hun regeerakkoord. Dit is een document
waarin de regeringspartijen CDA, ChristenUnie en PvdA hun afspraken hebben vastgelegd.

Over kinderbijslag bijvoorbeeld zeiden ze

Er komt met ingang van 2008 een inkomensafhankelijk
kindgebonden budget, waarin de huidige kindertoeslag opgaat en waaraan
gefaseerd additioneel budget zal worden toegevoegd.
  1. Zoek dit stukje tekst in het regeerakkoord op in je internet
    browser. Het regeerakkoord vond je op http://www.kabinetsformatie20062007.nl/actueel/coalitieakkoord.jsp, maar die link is nu dood. Gelukkig hebben wij het bewaard op http://ilps.science.uva.nl/verkiezingsvergelijker/data/CoalitieakkoordCDA-PvdA-CU.pdf. Hoe doe je dat het handigst?
  2. Gebruik de zoekmachine naar de verkiezingsprogrammas op http://verkiezingskijker.nl/2006/search.php?v=2006 om te kijken welke partijen de kinderbijslag inkomensafhankelijk en welke het juist inkomensonafhankelijk wilden maken.
  3. Een van de heetste verkiezingsthemas in 2006 was zo eng dat men het had over het H-woord, hypotheekrenteaftrek. Zoek met http://verkiezingskijker.nl/2006/search.php?v=2006 op wat de coalitiepartijen CDA, ChristenUnie en PvdA hierover in hun verkiezingsprogrammas zeiden. (Tip: vink alleen die drie partijen aan.) Wie wil alles bij het oude laten en wie wil wat veranderen?
  4. Zoek
    nou in het regeerakkoord op wat de drie over het H-woord hebben
    afgeproken. Ja, dat H-woord vermijden ze natuurlijk. Toch staat er over
    het onderwerp precies in of ze iets gaan veranderen of juist niet. Wees
    slim en creatief en vind het. Wie van de coalitiepartijen CDA, ChristenUnie en PvdA heeft gewonnen op dit punt, en wie heeft verloren?

Inleveren (1): welk formaat heb je gekozen en hoe zocht je daarin? (2) Geef voor de partijen PvdA, CDA, D66, SP, Christenunie, VVD, en PVV/Wilders aan wat ze vinden: af- of onafhankelijk. (3) Geef het voor die drie partijnen. (4) Idem.

Opdracht 5

De opdracht staat beschreven op deze pagina. 

Inleveren zoals beschreven in de opdracht.

(*) Opdracht 6

Help het onderzoek naar zoekmachines. Stel je hebt alle
Nederlandstalige blogs op je computer staan. En elke minuut krijg je de
laatst toegevoegde blogs binnen. Wat zou je daar mee willen doen? Wat
zou je willen weten? Moeilijk gezegd: wat voor informatiebehoeftes kan
je hierbij verzinnen?

Verzin een informatiebehoefte. Denk hierbij aan een vraag waarover je een werkstuk zou kunnen maken. Bijvoorbeeld:

Wat denken Nederlandse middelbare scholieren over Geert Wilders?

Probeer een vraag te verzinnen die je ook kan vertalen naar een meer
abstract niveau, net als bij het XYZST formaat. In dit geval heb je als
meer abstracte vragen:

  • Vind blogs geschreven door middelbare scholieren.
  • Herken personen in blogs en verbindt die aan namen.
  • Vind meningen over personen in blogs.

Geef, zo goed en zo kwaad als dat gaat, naast je informatiebehoefte
ook die abstracte vragen weer. Wie weet vinden wij die behoefte
interresant/spannend/uitdagend genoeg om hem te proberen te bevredigen.
Wie weet is de zoekmachine van de toekomst dus wel gebaseerd op een
idee van jou.

Inleveren Deze vraag is facultatief, maar we zijn natuurlijk wel heel benieuwd naar je antwoord!

Laatst aangepast op 17-04-2008 door Maarten Marx Geen reacties »

Notice: Theme without sidebar.php is deprecated since version 3.0 with no alternative available. Please include a sidebar.php template in your theme. in /var/www/html/PoliticalMashup/wp-includes/functions.php on line 3679