De verkiezingsthemas van 1998

Geplaatst op 12-06-2012 door Maarten Marx | data, Political Mashup, xquery | tags: , | comment image Geen reacties »

In een eerdere post berichten we over de digitalisering van het Lipschits corpus van verkiezingsprogrammas. In deze post laten we een toepassing ervan zien.
Lipschits heeft elke alinea in elk programma voorzien van “tags”, verkiezingsthemas waar die alinea over gaat. In ’98 voegde hij gemiddeld 5 tags per alinea toe.
We kunnen dus gaan kijken wat de meest voorkomende themas zijn, in het algemeen, maar ook per partij. Ook kunnen we hieruit afleiden welke themas door de verschillende partijen met elkaar in verband worden gebracht.

Als we per partij kijken zien we duidelijk op welke themas de verschillende partijen de nadruk leggen.

In dit Google spreadsheet staan de co-occurance matrices van de themas. Eerst voor alle partijen samen, en dan voor elke partij afzonderlijk. Om de file behandelbaar te houden hebben we per partij alleen de top 50 meest gebruikte themas opgevoerd.

De gehele tabel is als csv bestand beschikbaar (met ‘;’ als scheider).

Hier zijn de twee files die gebruikt zijn om deze matrix te maken: de XQuery en de verkiezingsprogrammas van 1998 in XML. Als je de XQuery op de XML data draait, krijg je de verkorte matrix als uitkomst.

Reageer

Je moet ingelogd zijn om te kunnen reageren.