Making connections at Surf

Geplaatst op 11-03-2013 door Maarten Marx | data, Political Mashup | tags: | comment image Geen reacties »

Maarten Marx spoke at the ‘Making Connections/Semantic Web’ session at the SURF Research and Innovation Event 2013 on 28 February 2013 at the Haagse Hogeschool – The Hague.

His message was that sharing and honesty is the way yo increase the value of your published data.
| lees verder…

Wat zijn de belangrijkste themas in een verkiezingsprogramma?

Geplaatst op 06-03-2013 door Maarten Marx | idea, lecture, parliament, Political Mashup, research, XML | tags: | comment image Geen reacties »

Die vraag beantwoorden we in deze post met behulp van een zogenaamd dispersie plot. In zo’n plot delen we een verkiezingsprogramma op de x-as op in alineas.

Op de y-as staan verkiezingsthemas. Elke paragraaf is “getagged” met 1 of meerdere van deze themas. Als dat zo is wordt dat in het plot aangegeven met een horizontaal streepje. Elk thema heeft dus de vorm van een barcode die aangeeft hoe verspreid dat thema over het hele programma behandeld wordt.

De dispersie waarde van een thema geeft de mate van spreiding weer: hoe hoger de waarde, hoe vaker en goed gespreid het thema voorkomt.

Deze dispersie waarde lijkt een prima indicator voor de belangrijkheid (saliency) van een thema voor een partij.

| lees verder…

Linguistische annotatie van de krant

Geplaatst op 07-02-2013 door Maarten Marx | data, Political Mashup, XPath | tags: | comment image Geen reacties »

Binnen het PoliticalMashup project koppelen we verschillende soorten politieke data met elkaar. Een belangrijke koppeling is op politieke actor: welke politieke spelers komen er in een document voor.

Om meer grip te krijgen op de informatie die in krantenartikelen staat, voegen we allerlei linguistische annotatie toe, gebruik makend van de Frog software uit Tilburg/Nijmegen, een Named Entity recognizer aan de UvA ontwikkeld door Lars Buitinck, en software die entities koppelt aan Wikipedia ontwikkeld door Edgar Meij aan de UvA. Het eindresultaat is een UTF-8 geëncodeerd XML bestand dat valideert met een variant op het Folia schema.
| lees verder…

Automatische classificatie van documenten

Geplaatst op 05-10-2012 door Maarten Marx | data, parliament, Political Mashup, research | tags: | comment image Geen reacties »

Het toekennen van trefwoorden uit een vaste lijst aan documenten (“taggen”) is een tijdrovende en dus kostbare taak. Vandaar dat veel onderzoek gedaan wordt naar automatiseren van die taak.
Die taak kan je op twee manieren automatiseren:

  1. Traditioneel De computer kent een beperkt aantal (3-6) trefwoorden aan een document toe, zonder ordening op die woorden.
  2. Anders De computer kent een flinke lijst (50-100) trefwoorden toe, allemaal met een “waarschijnlijkheids score”, die bijvoorbeeld zichtbaar gemaakt kan worden in een woordenwolk

Voor de traditionele manier maakt een computer nog te veel fouten om dit zonder menselijk ingrijpen uit te voeren. Het meest zinvolle is het maken van een term aanbevelings systeem.
Zo’n systeem geeft voor elk te taggen document een geordende lijst van de trefwoorden, en de menselijke tagger kan daar dan de juiste uitkiezen.
Dit lijkt wel wat op Google zoeken. Ook bij zo’n systeem is het van groot belang dat de juiste trefwoorden hoog in de lijst voorkomen. Dan leidt het gebruik van het aanbevelings-systeem tot tijdswinst.

Hoe werkt dat nou?

Lerend uit heel veel voorbeelden (documenten voorzien van trefwoorden) maken we een model op van elk trefwoord. Dat model bestaat simpelweg uit een lijst woorden voorzien van een gewicht. Die woorden kan je zien als een indicator dat een document over dat trefwoord gaat. De gewichten geven aan hoe belangrijk die indicator is.
Om een beeld te geven hebben we hier de 100 meest belangrijke indicatoren gezet die ons systeem geleerd heeft voor het trefwoord militaire vliegtuigen. In plaats van de gewichten laten we de woorden zien in een woordenwolk. Het is duidelijk dat de meeste woorden prima bij dat begrip passen.

Verdere beschrijving en uitleg

| lees verder…

Politieke n-gram viewer

Geplaatst op 11-09-2012 door Maarten Marx | data, Political Mashup | tags: , | comment image Geen reacties »

PoliticalMashup heeft een eerste versie van z’n politieke n-gram viewer af. De applicatie is gebouwd door Bart de Goede en Justin van Wees.
De politieke n-gram viewer toont voor elke frase van hooguit 7 woorden die ooit in het Nederlandse parlement gezegd is een tijdslijn met de frequentie van die frase, optioneel uitgesplitst per partij en per spreker.

| lees verder…

De verkiezingsthemas van 1998

Geplaatst op 12-06-2012 door Maarten Marx | data, Political Mashup, xquery | tags: , | comment image Geen reacties »

In een eerdere post berichten we over de digitalisering van het Lipschits corpus van verkiezingsprogrammas. In deze post laten we een toepassing ervan zien.
Lipschits heeft elke alinea in elk programma voorzien van “tags”, verkiezingsthemas waar die alinea over gaat. In ’98 voegde hij gemiddeld 5 tags per alinea toe.
We kunnen dus gaan kijken wat de meest voorkomende themas zijn, in het algemeen, maar ook per partij. Ook kunnen we hieruit afleiden welke themas door de verschillende partijen met elkaar in verband worden gebracht.
| lees verder…

Politicologenetmaal

Geplaatst op 11-06-2012 door Maarten Marx | parliament, Political Mashup, research | tags: | comment image Geen reacties »

Johan van Doornik presenteerde werk over de rol van vrouwen in het Nederlandse parlement in de periode 1918-2011 tijdens het politicologenetmaal van 2012 in Amsterdam.
Een korte beschrijving van het werk staat in het abstract: Women in Parliament: what they did?
| lees verder…

Verkiezingsprogrammas van Lipschits Digitaal

Geplaatst op 08-05-2012 door Maarten Marx | data, parliament, Political Mashup, resultaten | tags: | comment image Geen reacties »

PoliticalMashup heeft samen met het DNPP de bundels verkiezingsprogrammas gemaakt door Isaac Lipschits gedigitaliseerd. Het DNPP heeft de boeken ingescand en geOCRed. Suzan Verberne heeft de teksten vervolgens omgezet naar een uitgebreid XML formaat.
In deze blogpost laten we zien wat je daar dan mee kan. Om te beginnen een verkiezingsthemawolk van de VVD uit 1998. Hierin staan alle onderwerpen die volgens Lipschits minstens 2 maal in het programma van de VVD aan bod kwamen. De top tien bestaat inderdaad uit typische VVD onderwerpen.

werkgelegenheid:16
 Europese_samenwerking:12
 milieubeleid:11
 belastingen_algemeen:11
 onderwijs:11
 economische_groei:9
 gezondheidszorg:9
 criminaliteits_bestrijding:9
 loon-_en_inkomensbeleid:8
 gemeentelijk_bestuur_en_beleid:8


| lees verder…

Onderzoekschool Politieke Geschiedenis

Geplaatst op 14-11-2011 door Maarten Marx | onderwijs, Political Mashup | | comment image Geen reacties »

Maarten Marx geeft een lezing over het gebruik van digitale middelen in de geschiedswetenschap tijdens de onderzoekschool Politieke Geschiedenis.

  • Waar: Huygens INL, Den Haag
  • Wanneer: 2011-11-14 16.00

De slides staan in deze blogpost.

Politiekinzicht.com wint 3de prijs in Open Data Challenge.

Geplaatst op 29-06-2011 door Maarten Marx | parliament, Political Mashup | tags: | comment image Geen reacties »

Drie eerstejaars UvA Informatiekunde studenten hebben met hun site politiekinzicht.com de 3de prijs in de visualisatie track van de Open Data Challenge gewonnen. Zij maakten een applicatie die zeer snel inzichtelijk maakt waar elke politicus in de Tweede Kamer over spreekt.

De prijs werd uitgereikt door Neelie Smit Kroes. In de jury zaten onder meer Sir Tim Berners Lee (W3C), Tom Lee (Sunlight Foundation) and Rufus Pollock (Open Knowledge Foundation).

De applicatie is gebaseerd op de Handelingen der Staten Generaal, die als Open Data beschikbaar zijn gemaakt in het PoliticalMashup project van het Informatica Instituut van de UvA. Verdere Informatie.

Over de prijs.

The Open Data Challenge was Europe’s biggest open data competition to date. There were 20,000 euros in prizes to win, and a total of 430 entries from 24 EU Member States. It was open for 60 days – from early April to early June 2011.

The winners were selected by an all star cast of open data gurus, and announced by Vice President of the European Commission Neelie Kroes at the Digital Agenda Assembly in Brussels.

Uit het jury rapport

We need better ways to understand our politicians, ways that go beyond catching a single quote to illuminate all of their commitments, interests and actions. That is why I really like this app.

David Eaves, Advisor to the Mayor of Vancouver

My favorite data visualisation was the dutch entry called “Politiek Inzicht”, which shows what members of parliament talk about, by visualising tag clouds for all individual speeches, reports and so on given by members of parliament. This is not only done in way which is very fun – it also provides valuable insight into the real political focus of each politician, allows for comparison between individuals within parties or across parties. When I explored this app, I immediately thought – “Thats what we need in Germany too!”.

Anke Domscheit-Berg, Government 2.0 Netzwerk Deutschland

« eerdere stukken latere stukken »