Politieke n-gram viewer

Geplaatst op 11-09-2012 door Maarten Marx | data, Political Mashup | tags: , | comment image Geen reacties »

PoliticalMashup heeft een eerste versie van z’n politieke n-gram viewer af. De applicatie is gebouwd door Bart de Goede en Justin van Wees.
De politieke n-gram viewer toont voor elke frase van hooguit 7 woorden die ooit in het Nederlandse parlement gezegd is een tijdslijn met de frequentie van die frase, optioneel uitgesplitst per partij en per spreker.

Google’s n-gram viewer (Science 2011) maakt het mogelijk om snelle historische analyses te doen op een van de mooiste datasets die er zijn: het Google Books Project (met zo’n 4% van alle boeken die ooit gedrukt zijn). Niet voor niets haalde deze applicatie de front-cover van Science. De software achter de applicatie is een technologisch hoogstandje, maar belangrijker is dat de applicatie de Google Books dataset zo prachtig zichtbaar maakt voor iedereen.

Binnen het PoliticalMashup project verzamelen we politieke data. Een recent door ons in DANS-EASY gedeponeerde dataset is die van alle Handelingen der Staten Generaal van 1814 tot mei 2012 in een rijk geannoteerd XML formaat. Voor elk uitgesproken woord in de Eerste en Tweede Kamer weten we wanneer het gezegd is, maar ook wie het zei, van welke partij de spreker was, en in welke rol de spreker sprak.
Hiermee hebben we een politieke n-gram viewer gemaakt waarin we niet alleen de tijdslijn van een frase kunnen aangeven maar de frase ook kunnen toekennen aan partijen en politici.

Reageer

Je moet ingelogd zijn om te kunnen reageren.