Namescape van start

Geplaatst op 22-03-2012 door Maarten Marx | research | tags: | comment image Geen reacties »

Het NameScape project is van start gegaan. Alles daarover staan in de slides die Karina van Dalen liet zien op de Clarin 3 kickoff meeting.

| lees verder…

Twitterend Den Haag

Geplaatst op 20-03-2012 door Maarten Marx | parliament | tags: | comment image Geen reacties »
Met hulp van PoliticalMashup’s Twitter wizzards Bart de Goede en Justin van Wees (o.a. van pentapolitica.nl) hebben drie eerstejaars Informatiekunde studenten aan de Universiteit van Amsterdam in samenwerking met Sargasso.nl een analyse gemaakt van het getwitter van de Haagse intimi. Hun verslag en eindproduct stond al een tijdje op haagsetweet.nl en is nu ook door het ANP opgepikt en als persbericht verspreid.
Onder andere te lezen op nu.nl, rtl.nl, en sargasso.nl.

Het onderzoek is uitgevoerd door Hayo Bart, Frank Houweling en Liset Meijerman onder begeleiding van Maarten Marx en Dimitri Tokmetzis.
| lees verder…

Hoe vaak stemmen de VVD en SGP hetzelfde?

Geplaatst op 15-03-2012 door Maarten Marx | parliament | tags: | comment image Geen reacties »

Deze vraag vroeg NRC Next aan PoliticalMashup voor hun rubriek next checkt. Op 15 Maart

bekeek die rubriek of Rutte’s uitspraak

Eigenlijk zitten VVD en SGP heel dicht bij elkaar

waar is.
NRC Next heeft de verkiezingsprogrammas naast elkaar gelegd en PoliticalMashup heeft alle stemmingen uit 2011 uit de Handelingen gehaald en geturfd hoe vaak de twee partijen hetzelfde stemden. Dat bleek in driekwart van de gevallen zo te zijn. Kijk je meer gericht naar het soort stemming, dan is de gelijkenis nog sterker. Op de 99 stemmingen over wetsvoorstellen stemden VVD en SGP maar 4 keer verschillend.

Link naar blogpost behorend bij het artikel
Link naar scan van het artikel.

De juiste stemming

Geplaatst op 13-03-2012 door Maarten Marx | Uncategorized | | comment image Geen reacties »

PoliticalMashup probeert de uitslag en de stemverdeling van de stemmingen over moties, amendementen en wetsontwerpen uit de Handelingen te halen. Dit wordt weer gebruikt door de Tweede Kamer, sites als politix.nl en politicologen.
Dit gaat aardig goed omdat de voorzitter de uitslag van de stemmingen met behulp van een aantal vaste formules aangeeft.
Maar soms wordt er tijdens de vergadering gezegd dat de voorzitter een foutje heeft gemaakt. De stemming wordt dan echter niet in de Handeling verbeterd. Zowel voor mensen als voor computers is het op deze manier erg moeilijk om gegarandeerd de juiste stemming uit de tekst op te maken.
| lees verder…

Making WordClouds in XPath/XQuery

Geplaatst op 12-03-2012 door Maarten Marx | onderwijs, XPath | tags: , | comment image Geen reacties »

We describe step by step how to make a basic wordcloud in XPath/XQuery.
In the tutorial we use two files:
input XML file en wordcloud XQuery file.

| lees verder…

Weer veel missende Handelingen

Geplaatst op 07-03-2012 door Maarten Marx | data, parliament, resultaten | | comment image Geen reacties »

Update Het hieronder beschreven onderzoek is verricht op 14 Februari naar aanleiding van een blogpost op 2 Februari over de missende Algemene Beschouwing van 2011. Toen waren alle stukken die hieronder genoemd zijn er niet. Ondertussen (2012-03-07) zijn ze er allemaal gelukkig wel.

Ook dit parlementaire jaar is het weer moeilijk om een volledig overzicht van alle verslagen uit de Tweede Kamer (de zogenaamde Handelingen) te verkrijgen.
Die worden normaal gesproken ongeveer drie weken na het debat gepubliceerd op de internet site van de overheid: overheid.nl. Deze site noemt zichtzelf

De betrouwbare bron voor informatie en dienstverlening van de overheid.

Onderstaande tabel laat zien dat er sinds de laatste Prinsjesdag 8 dagen ontbreken. Hieronder zitten belangrijke debatten als het antwoord van Premier Rutte tijdens de Algemene Beschouwingen.
| lees verder…

Computational Humanities: een voorbeeld

Geplaatst op 07-03-2012 door Maarten Marx | parliament, research, XML | tags: | comment image Geen reacties »

Door het beschikbaar komen van enorme digitale databestanden bestaande uit (meestal ingescande) teksten is er grote vraag bij Geesteswetenschappers ontstaan naar hulp bij het ontsluiten van die data.
In de projecten die ILPS doet met Geesteswetenschappers komen de volgende twee verzoeken steeds naar voren:

  1. uitgebreide “advanced search” zoekmogelijkheid, net zo goed als Google, maar dan op mijn specifieke collectie, met specifieke extra zoekmogelijkheden;
  2. het doen van data analyse op grote hoeveelheden tekst. Dit om hypotheses kwantitatief te kunnen toetsen.

Handelingen der Staten Generaal
Binnen het PoliticalMashup project wordt samengewerkt met geesteswetenschappers van DNPP, NIOD, ING-Huygens, Meertens, INL, ASCoR, en verschillende universiteiten en maatschappelijke instellingen.
Zij hebben grote interesse in een prachtig databestand: de complete Handelingen der Staten Generaal van 1814 tot vandaag. Die zijn digitaal beschikbaar bij de KB.

We demonstreren de kracht van informatie extractie samen met gestructureerde zoektechnologie in XML aan de hand van twee voorbeelden:

  • de drie van Breda
  • NWO

In deze demonstratie beperken we ons tot het uitgebreid zoeken.
| lees verder…

Bestand met Nederlandse Kamervragen

Geplaatst op 07-03-2012 door Maarten Marx | data, parliament | tags: | comment image Geen reacties »

Vier destijds eerstejaars Informatiekunde studenten aan de Universiteit van Amsterdam hebben een project gedaan over de Nederlandse Kamervragen. Het idee was om een overzicht te bieden van alle Kamervragen gesteld sinds 1975. Het project verwaterde door verschillende redenen en is toen door ze stopgezet.

Er is blijkbaar toch nog vraag naar de data, en Bart de Goede heeft een bestand beschikbaar gemaakt. Het gaat om de Kamervragen sinds 1995, het deel wat beschikbaar was op destijds Parlando, en nu op https://zoek.officielebekendmakingen.nl
. Dit archief kampt met volledigheidsproblemen, en ook was het in de tijd van Parlando zeer moeilijk om een kopie van de data bij Parlando te maken. Er kunnen dus Kamervragen missen.
| lees verder…