Geplaatst op 28-05-2010 door Maarten Marx |
Uncategorized | |
1 reactie »
Google heeft een entry point retrieval zoekmachine ontwikkeld voor de verkiezingsprogrammas van 2010. De Volkskrant berichtte erover.
De functionaliteit is vergelijkbaar met de zoekmachine ontwikkeld door de Universiteit van Amsterdam samen met het Instituut voor Publiek en Politiek in 2006 voor de vorige verkiezingen: verkiezingskijker.nl.
Voor de Europese verkiezingen van 2009 heeft de UvA met steun van het Europafonds ook zo’n zoekmachine ontwikkeld: ikkieswijzer.nl. Zie ook het eerdere blogbericht daarover.
PoliticalMashup verzamelt onder meer tweets die over de politiek gaan. In navolging van de Volkskrant heeft ook PoliticalMashup geteld hoe vaak er getweet is op de dag van de debatten van 23 en 26 mei. De cijfers:
| Cijfers |
23 mei |
26 mei |
| Aantal tweets over de hele dag |
36.571 |
50.997 |
| Tweets gedurende het debat |
4.812 |
8.857 |
| Unieke gebruikers |
10.142 |
16.362 |
| RTLdebat/Carredebat genoemd |
12.375 |
14.762 |
Het gaat hierbij om de aantallen tweets over de politiek (tweets waarin partijnamen of lijsttrekkernamen voorkomen). Het kan dus zijn dat het aantal keer dat ‘rtldebat’ genoemd is, lager uitvalt, omdat mensen wel over het debat getweet hebben, maar zonder een partij of lijsttrekker te noemen.
De grafiek geeft weer hoeveel tweets met een bepaald trefwoord zijn gedaan op een bepaalde datum. Interessant om op te merken is dat bij de tweede piek (die het Carrédebat weergeeft) veel meer partijen en personen ‘meegetrokken worden’, waarschijnlijk omdat aan dat debat meer lijsttrekkers hebben meegedaan dan aan het lijsttrekkersdebat van 23 mei.
.
In tegenstelling tot bijvoorbeeld Stemr.nl, wordt gekeken of de tweet in kwestie de naam van een partij of lijsttrekker bevat. Stemr heeft ervoor gekozen om enkel op hashtags van de afkortingen van politieke partijen (bijvoorbeeld #pvda) te filteren. Door niet uit te gaan van een hashtag (en meer trefwoorden te gebruiken), zijn we in staat veel meer data te verzamelen (enkele duizenden tweets per dag, tegenover een paar honderd). Vooralsnog gaan we echter alleen maar uit van aantallen, en beoordelen we niet op sentiment, zoals Stemr wel doet.
Geplaatst op 26-05-2010 door Maarten Marx |
idea | tags:
troonrede |

Enter your password to view comments
Geplaatst op 06-05-2010 door Maarten Marx |
Uncategorized | |
Geen reacties »
PoliticalMashup maakt een Google achtige zoekmachine voor de verslagen van de debatten in de Tweede Kamer. Gegeven een zoekterm geven we een geordende lijst van debatten terug die over die zoekterm gaan. Daarbinnen geven we de meest relevante delen van het (vaak lange) debat voor de specifieke zoekterm.
Het belangrijkste aspect van een zoekmachine is de ordening op relavantie. Bovenaan moeten de meest relevante debatten voor een vraag staan.
Net als Google berekenen wij relevantie niet alleen door te tellen hoe vaak een zoekterm voorkomt. We kijken ook naar andere eigenschappen van debatten.
Een voor de hand liggende eigenschap is de importantie van het debatsonderwerp. Het idee is dat als in twee debatten een zoekterm ongeveer even veel gebruikt wordt, het meest belangrijke debat hoger in de zoeklijst komt.
Maar hoe meet je de importantie van een debat op? Dit onderzoekt Maarten Jongmans voor zijn master scriptie. Hij heeft hier 5 verschillende modellen voor ontwikkeld en die getest op 800 debatten van het afgelopen jaar. De uitkomsten van de verschillende modellen lijken aardig op elkaar. Alle modellen voorspellen dat eigenlijk maar zo’n 10-15% van de debatten belangrijk zijn. We zien een typische machtsverdeling (macht van machtsverheffen) zoals voor het eerst bescherevn door Pareto.