Peak explanation in parliamentary proceedings

Geplaatst op 27-09-2012 door Maarten Marx | research | tags: | comment image Geen reacties »

The political n-gram viewer created for 200 years of Dutch parliamentary proceedings can reveal fascinating patterns. Here are two example queries:

We ask for the occurances of leading Dutch opinion weeklies and daily newspapers, respectively.

Clicking on the search terms in the box on the right brings more clarity in the spagetti pictures. What it reveals is that every news-source has its own peaks. For instance, “haagse post” has 268 hits in 1974, while the maximum number of hits in a year for all 5 newspapers was 48.

What happened?

A nice addition to the n-gram viewer would be a feature which explains such peaks.
A search on Google on the terms “haagse post”+1974 reveals one possible explanation: a link to a news article from 1974 in the archive of the Reformatorisch Dagblad, stating that the Dutch government wants to financially support the magazine “Haagse Post”.

Is this the explanation?

It would be nice to have a high precision full-automatic peak explanation mechanism, possibly using a historical newspaper corpus like the one of Reformatorisch Dagblad.

Using the KB newspaper archive to find explanations

The query NSB gives three clear peaks: in 1979, 1986 and 1988. A search on the terms nsb kamer in http://kranten.kb.nl/search seems to give a very clear indication about the possible explanation of the peak, even though the corpus of that period is limited to the communist daily and some other small newspapers.
One could try to create an explanation from the newspaper titels using Named Entity recognition and counts of frequencies, and comparisons of dates (when is it discussed in Parliament and when are those corresponding newspaper articles in that year peaking?).

XML Holland 2012

Geplaatst op 14-09-2012 door Maarten Marx | onderwijs, XML, xquery | | comment image Geen reacties »

Het XML Holland 2012 congres vindt plaats op 19 September 2012 in Amsterdam. De dag daarvoor organiseert het congres samen met de UvA een MarkLogic tutorial op het Science Park 904 in Amsterdam (18 September 10.00-15.00).
Sprekers op de tutorial zijn Geert Josten (Dayon) en Jim Fuller (MarkLogic).
Aanmelding kan via Maarten Marx of Geert Josten (geert.josten@dayon.nl)

Politieke n-gram viewer

Geplaatst op 11-09-2012 door Maarten Marx | data, Political Mashup | tags: , | comment image Geen reacties »

PoliticalMashup heeft een eerste versie van z’n politieke n-gram viewer af. De applicatie is gebouwd door Bart de Goede en Justin van Wees.
De politieke n-gram viewer toont voor elke frase van hooguit 7 woorden die ooit in het Nederlandse parlement gezegd is een tijdslijn met de frequentie van die frase, optioneel uitgesplitst per partij en per spreker.

| lees verder…

PoliticalMashup genomineerd voor DANS dataprijs

Geplaatst op 10-09-2012 door Maarten Marx | data | tags: | comment image Geen reacties »

PoliticalMashup is samen met twee andere data-initiatieven genomineerd voor Nederlandse dataprijs 2012 van DANS. De twee andere inititieven zijn Geoplaza en Interviewproject Nederlandse Veteranen.
Op donderdag 18 oktober wordt de winnaar bekendgemaakt.
| lees verder…

Verbeelding van de Politiek

Geplaatst op 07-09-2012 door Maarten Marx | parliament | tags: | comment image Geen reacties »

Maarten Marx spreekt zondag 9 September 2012 in een programma over 50 jaar Zendtijd voor Politieke Partijen over manieren waarop ICT politieke data beter inzichtelijk kan maken.
Hieronder staan links naar materiaal wat hij in de lezing gebruikt.


| lees verder…