XPadje: allitererende volksvertegenvoordigers

Geplaatst op 28-12-2010 door Maarten Marx | trivia, XPath | tags: | comment image Geen reacties »

Vele vreemde volksvertegenwoordigers proberen te allitereren. In de wandelgangen schijnen geruchten te gaan dat volksvertegenwoordigers meer allitereren dan gewone stervelingen. NRC Next vroeg ons dit uit te zoeken, en een “Heerlijk Helder Heineken” query te schrijven.

In eerste instantie hebben we gezocht naar stukjes tekst met minstens drie woorden beginnend met dezelfde letter, maar dat leverde te veel hits op. In de resultaten hieronder zijn dus alleen de alliteraties van minstens 4 woorden meegenomen.
Hier zijn een aantal van de langste (6):

documenteren dan degenen die denken dat
dat de doelstellingen die door de
de draden die door dit debat
dat degenen die daar de directie
wij willen wel weten waarop we
van voorwaartse verrekening van verliezen van
dat deel daarvan dat door de

| lees verder…

XPadje: op=op-jes

Geplaatst op 25-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Het blad Onze Taal van December 2010 had een leuk artikel over tautologieën van de vorm “op is op”, “genoeg is genoeg”, enzovoort. Wij waren benieuwd of we die ook in de Handelingen der Staten Generaal konden vinden.

Natuurlijk, en de resultaten staan hieronder. De meeste zijn “het is het” en “dat is dat”. Maar er zitten ook hele leuke bij. In totaal hebben we 79 unieke “op=op-jes” gevonden in meer dan 20.000 debatten uit de periode 1995-eind 2010.

De PvdA gebruikt ze het meest, ze worden twee en half keer zo vaak van achter het spreekgestoelte of de regeringstafel, dan vanachter de interruptiemicrofoon uitgesproken (misschien een aanwijzing dat het gebruik ervan dan voorbereid is?).
Er springt niet echt een liefhebber of veelpleger uit de data. Hieronder de top vijf.

Jorritsma-Lebbink 5
 Van Gijzel 5
 Vendrik 5
 Reitsma 4
 Nicolaï 4

Alle uitkomsten samen met hun XQueries en XPad expressies zijn beschikbaar.
| lees verder…

Gedreven door Data

Geplaatst op 23-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

In December 2009 organiseerde DANS het symposium Door Data Gedreven. Nu is er een mooie bundel uitgekomen met bijdragen van de sprekers. De bijdrage van PoliticalMashup begint op bladzijde 41 en gaat over computational humanities.

Belangrijke debatten

Geplaatst op 22-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Maarten Jongmans heeft onderzoek gedaan naar de belangrijkheid van politieke debatten. Hij wilde dit op een volkomen automatische manier bepalen, zonder naar de inhoud van het debat te kijken. Een leuke uitdaging!
Maarten zit zelf in de lokale politiek, en had dus flink wat ideëen over indicatoren die zouden kunnen aangeven of een debat belangrijk is. Een teken van importantie vondt hij bijvoorbeeld als het debat tot na middernacht doorgaat, of als er flink geïnterrumpeerd wordt.
Hij heeft zijn modellen uitgebreid getest, onder andere door een flink aantal politieke experts om hun top 10 meest belangrijke debatten van het afgelopen jaar te vragen.
Lees het hele verhaal in Maarten’s Master scriptie.

DebatGemist

Geplaatst op 21-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Eindelijk zijn dan ook de videos van de debatten in de Tweede Kamer beschikbaar gesteld.
Openkamer.tv deed dit al in Maart van dit jaar, en had het debat over de Regeringsverklaring er na een dag opstaan.

Een fijn begin. Het zou mooi zijn als de videos ook aan de Handelingen zouden worden gekoppeld.

Woordenwolken van maidenspeeches in NRC

Geplaatst op 21-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

De NRC Next van 13 December 2010 besteedde ruim aandacht aan maidenspeeches en liet de verschillen tussen de speeches van de partijen zien met behulp van de parsimonious wordclouds van Kaptein, Kamps en Hiemstra.
Zie ook de Blogpost van Thalia Verkade over de moeilijke toegankelijkheid van de Nederlandse Handelingen.

XPadje: Halsema’s speeches van Twitter lengte

Geplaatst op 21-12-2010 door Maarten Marx | onderwijs, XPath | tags: , | comment image Geen reacties »

PoliticalMashup heeft al verschillende blogs geschreven waarin wordt getoond hoe handig XPath en XQuery zijn voor het maken van politieke analyses op politieke data in XML. We gaan daar een serie van maken. We noemen de afleveringen daarvan Xpadjes.
Elke aflevering bestaat uit

  • Een onderzoeksvraag
  • De benodigde ingrediënten
  • De uitwerking in XPath en XQuery
  • Links naar de uitkomsten van de queries

De aflevering van vandaag gaat over Femke Halsema en haar Twitter gedrag.

Wordle: HalsemaTwitterLengteSpeeches

| lees verder…

Kerstgedachte in de Handelingen

Geplaatst op 20-12-2010 door Maarten Marx | parliament, trivia | | comment image Geen reacties »

Met Kerst denkt men aan …, nou ja, eh, liefde, en kerstbomen en wild natuurlijk.
Wij waren benieuwd wat voor associaties nou bij die begrippen opkomen als politici het daar in de Tweede Kamer over hebben. Om dit te bepalen hebben we wat simpele taaltechnologie toegepast.
We hebben eerst alle voorkomens van de begrippen in de Handelingen opgezocht met onze Handelingen zoekmachine. Daarna hebben we de 4-5 woorden links en rechts van het zoekwoord uit de Handelingen gevist en die allemaal achter elkaar geplakt. Tenslotte is dat in Wordle gestopt.

Een van de meest opvallende woorden is wel tikkeltje.
Hieronder de resultaten. Klikken op de wolk brengt je naar een grotere versie.

Zalig Kerstmis.

Wordle: liefde30metliefde Wordle: wild30

Scriptie Gilles de Hollander

Geplaatst op 20-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Gilles de Hollander heeft een mooie scriptie geschreven over het gebruik van woordenwolken om notulen van vergaderingen mee samen te vatten. Hij heeft zijn techniek toegepast op notulen van de Facultaire Studentenraad van de FNWI aan de UvA en die van het Europees Parlement.
Zijn techniek bouwt voort op de “parsimonious wordclouds” van Kaptein, Kamps en Hiemstra.
De resultaten zijn zeer veelbelovend.

Femke Halsema: 12 jaar debat

Geplaatst op 17-12-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Naar aanleiding van het vertrek van Femke Halsema als partijleider hebben we eens gekeken naar haar debatten in de Tweede Kamer. Trouw heeft ons bericht overgenomen.
| lees verder…

« eerdere stukken