Verkiezingskijker door Google

Geplaatst op 28-05-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Google heeft een entry point retrieval zoekmachine ontwikkeld voor de verkiezingsprogrammas van 2010. De Volkskrant berichtte erover.

De functionaliteit is vergelijkbaar met de zoekmachine ontwikkeld door de Universiteit van Amsterdam samen met het Instituut voor Publiek en Politiek in 2006 voor de vorige verkiezingen: verkiezingskijker.nl.

Voor de Europese verkiezingen van 2009 heeft de UvA met steun van het Europafonds ook zo’n zoekmachine ontwikkeld: ikkieswijzer.nl. Zie ook het eerdere blogbericht daarover.

Twitter en de verkiezingen

Geplaatst op 27-05-2010 door Bart de Goede | Political Mashup, trivia | tags: , , , | comment image Geen reacties »

PoliticalMashup verzamelt onder meer tweets die over de politiek gaan. In navolging van de Volkskrant heeft ook PoliticalMashup geteld hoe vaak er getweet is op de dag van  de debatten van 23 en 26 mei. De cijfers:

Cijfers 23 mei 26 mei
Aantal tweets over de hele dag 36.571 50.997
Tweets gedurende het debat 4.812 8.857
Unieke gebruikers 10.142 16.362
RTLdebat/Carredebat genoemd 12.375 14.762

Het gaat hierbij om de aantallen tweets over de politiek (tweets waarin partijnamen of lijsttrekkernamen voorkomen). Het kan dus zijn dat het aantal keer dat ‘rtldebat’ genoemd is, lager uitvalt, omdat mensen wel over het debat getweet hebben, maar zonder  een partij of lijsttrekker te noemen.

De grafiek geeft weer hoeveel tweets met een bepaald trefwoord zijn gedaan op een bepaalde datum. Interessant om op te merken is dat bij de tweede piek (die het Carrédebat weergeeft) veel meer partijen en personen ‘meegetrokken worden’, waarschijnlijk omdat aan dat debat meer lijsttrekkers hebben meegedaan dan aan het lijsttrekkersdebat van 23 mei.

Aantal tweets per trefwoord, door de tijd heen.

In tegenstelling tot bijvoorbeeld Stemr.nl, wordt gekeken of de tweet in kwestie de naam van een partij of lijsttrekker bevat. Stemr heeft ervoor gekozen om enkel op hashtags van de afkortingen van politieke partijen (bijvoorbeeld #pvda) te filteren. Door niet uit te gaan van een hashtag (en meer trefwoorden te gebruiken), zijn we in staat veel meer data te verzamelen (enkele duizenden tweets per dag, tegenover een paar honderd). Vooralsnog gaan we echter alleen maar uit van aantallen, en beoordelen we niet op sentiment, zoals Stemr wel doet.

Protected: Troonrede timeline

Geplaatst op 26-05-2010 door Maarten Marx | idea | tags: | comment image Enter your password to view comments.

This content is password protected. To view it please enter your password below:

Belangrijke debatten machtsverdeeld

Geplaatst op 06-05-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

PoliticalMashup maakt een Google achtige zoekmachine voor de verslagen van de debatten in de Tweede Kamer. Gegeven een zoekterm geven we een geordende lijst van debatten terug die over die zoekterm gaan. Daarbinnen geven we de meest relevante delen van het (vaak lange) debat voor de specifieke zoekterm.

Het belangrijkste aspect van een zoekmachine is de ordening op relavantie. Bovenaan moeten de meest relevante debatten voor een vraag staan.
Net als Google berekenen wij relevantie niet alleen door te tellen hoe vaak een zoekterm voorkomt. We kijken ook naar andere eigenschappen van debatten.

Een voor de hand liggende eigenschap is de importantie van het debatsonderwerp. Het idee is dat als in twee debatten een zoekterm ongeveer even veel gebruikt wordt, het meest belangrijke debat hoger in de zoeklijst komt.

Maar hoe meet je de importantie van een debat op? Dit onderzoekt Maarten Jongmans voor zijn master scriptie. Hij heeft hier 5 verschillende modellen voor ontwikkeld en die getest op 800 debatten van het afgelopen jaar. De uitkomsten van de verschillende modellen lijken aardig op elkaar. Alle modellen voorspellen dat eigenlijk maar zo’n 10-15% van de debatten belangrijk zijn. We zien een typische machtsverdeling (macht van machtsverheffen) zoals voor het eerst bescherevn door Pareto.