De kenmerkende woorden voor elke bewindslid

Geplaatst op 25-09-2013 door Maarten Marx | data, ODE, parliament | tags: | comment image Geen reacties »

In samenwerking met Vrij Nederland heeft PoliticalMashup voor elk lid uit het Kabinet Rutte II de meest kenmerkende woorden bepaald. We hebben gekeken naar werkwoorden, zelfstandige en bijvoegelijke naamwoorden.
Als voorbeeld hieronder die van Staatssecretaris Teeven. Klik op het plaatje om naar een grotere versie te gaan.
Wordle: teeven-nouns Wordle: teeven-werkwoorden Wordle: teeven-adjectief
| lees verder…

Vrij Nederland: kabinetsleden tijdens eerste jaar Rutte II

Geplaatst op 23-09-2013 door Maarten Marx | data, ODE, parliament | | comment image Geen reacties »

PoliticalMashup heeft samen met Vrij Nederland een analyse gemaakt van de debatten door de kabinetsleden tijdens het eerste jaar van Rutte II. Ter vergelijking is een zelfde analyse gemaakt van het eerste jaar van het laatste “vergelijkbare” kabinet, Balkenende IV.
Interrupties
We hebben voor elk kabinetslid, voor elk debat waar dat lid aan meedeed in de Handelingen van de Tweede Kamer geturfd hoeveel interrupties er waren, door wie, of er ook fractievoorzitters aanwezig waren, en hoeveel moties er werden ingediend.
Op basis daarvan heeft VN per bewindspersoon een score bepaald.

De gegevens zijn vrij beschikbaar als twee Google Fusion tables: Rutte II en Balkenende IV.
Deze spreadsheets bevatten naast de tellingen ook links naar alle debatten die in de analyse zijn gebruikt.

Hieronder een voorbeeld van wat je met deze gegevens kan doen: een taartdiagram dat per kabinetslid aangeeft hoeveel moties dat lid in het eerste jaar van Rutte II ontvangen heeft, zowel absoluut als relatief ten opzichte van het hele kabinet.

| lees verder…

E-Politieke Geschiedenis

Geplaatst op 30-08-2013 door Maarten Marx | lecture, parliament, Political Mashup | tags: | comment image Geen reacties »

Maarten Marx geeft een lezing over het inzetten van computers in geschiedenis onderzoek op de Expertmeeting Politieke Geschiedenis, 13 September op de RU te Nijmegen.
Hij zal laten zien hoe je slimmer kunt zoeken in gestructureerde teksten, en hoe computers kunnen helpen in het ontdekken van verbanden.
De voorbeelden staan in het teken van het onderzoek in Nijmegen naar fascisme. Hieronder een netwerk dat sprekers en debatsonderwerpen verbindt. Een spreker en een onderwerp is verbonden als de spreker tijdens dat onderwerp over fascisme gesproken heeft.


| lees verder…

De Tweede Kamer in 2012-2013

Geplaatst op 17-06-2013 door Maarten Marx | data, parliament | tags: | comment image Geen reacties »

We geven een overzicht van het afgelopen politieke jaar op basis van de Handelingen van de Tweede Kamer. We richten ons daarbij op 2 dingen: hoe succesvol zijn afzonderlijke politici in het maken of veranderen van beleid (via moties en amendementen), en hoeveel aandacht geven en ontvangen ze in de Tweede Kamer?

Alle gegevens die we gebruiken zijn automatisch door computers uit de Handelingen gehaald met behulp van text mining. Hieronder geven we die gegevens in spreadsheet formaat.

Deze gegevens zijn gebruikt voor het overzichtsartikel over het afgelopen politieke jaar in de Vrij Nederland van 20 Juni, geschreven door Jaco Alberts en Thijs Broer.

De analyses zijn gedaan op 6 en 7 Juni 2013. Op dat moment waren via overheid.nl de Handelingen tot en met zitting 68 (28 Maart 2013) beschikbaar.

Voorbeeld: aantal interrupties

Onderstaande grafiek laat het totaal aantal interrupties per persoon zien. De blauwe lijn geeft het aantal gepleegde interrupties, de rode het aantal ontvangen interrupties. Hier tonen we de 20 politici die het meest interrumpeerden. We zien dat Pechtold het meeste aandacht geeft. Hij ontvangt zelf echter relatief weinig aandacht. Het geven en ontvangen van aandacht is het meest in evenwicht in deze top 20 bij Kees Verhoeven.
De omgekeerde tabel, met de mensen met de langste rode lijn, wordt aangevoerd door Rutte.
Al dit soort grafieken zijn zelf te maken. Links naar de data staan hieronder.

Downloads

De meeste spreadsheets staan op Google Fusiontables. Alleen het overzicht van de stemmingen is hier als gzipped csv bestand aangehangen.

| lees verder…

NWO Creatieve Industrie project ExPoSe

Geplaatst op 27-04-2013 door Maarten Marx | ExPoSe, parliament | | comment image Geen reacties »

Het ExPoSe (Exploratory Political Search) project van Jaap Kamps en Maarten Marx is in de Creatieve Industrie 2013 ronde van NWO toegekend.
In het project worden twee aio’s en één wetenschappelijke programmeur aangesteld.
Het project loopt 5 jaar en wordt door het volgende consortium uitgevoerd: Dispectu BV, Koninklijke Bibliotheek, Meertens Instituut, Nationaal Archief, Spinque BV, Tweede Kamer, Universiteit van Amsterdam.
| lees verder…

Wat zijn de belangrijkste themas in een verkiezingsprogramma?

Geplaatst op 06-03-2013 door Maarten Marx | idea, lecture, parliament, Political Mashup, research, XML | tags: | comment image Geen reacties »

Die vraag beantwoorden we in deze post met behulp van een zogenaamd dispersie plot. In zo’n plot delen we een verkiezingsprogramma op de x-as op in alineas.

Op de y-as staan verkiezingsthemas. Elke paragraaf is “getagged” met 1 of meerdere van deze themas. Als dat zo is wordt dat in het plot aangegeven met een horizontaal streepje. Elk thema heeft dus de vorm van een barcode die aangeeft hoe verspreid dat thema over het hele programma behandeld wordt.

De dispersie waarde van een thema geeft de mate van spreiding weer: hoe hoger de waarde, hoe vaker en goed gespreid het thema voorkomt.

Deze dispersie waarde lijkt een prima indicator voor de belangrijkheid (saliency) van een thema voor een partij.

| lees verder…

PoliticalMashup wint NederLandse Dataprijs 2012

Geplaatst op 19-10-2012 door Maarten Marx | data, parliament | tags: | comment image Geen reacties »

PoliticalMashup heeft de NederLandse Dataprijs 2012 gewonnen met de gemaakte XML versie van de Handelingen der Staten Generaal van 1814-2012.

De onvindbare logaritmes die tijdens de prijsuitrijking ter sprake kwamen zijn ondertussen alsnog gevonden. Jos Engelen had bijna helemaal gelijk, Minister Pronk zei alleen logaritmisch (Eerste Kamer, 2001-01-16), en niet logaritme. Te vinden met de query logarit*.


| lees verder…

Heel veel woorden uit het Parlement

Geplaatst op 11-10-2012 door Maarten Marx | parliament, trivia | tags: | comment image Geen reacties »

Politici zijn erg creatief in hun taalgebruik. Een leuke vraag is dus

Hoeveel verschillende woorden zijn er uitgesproken in de Tweede Kamer sinds 1814?

Het jaar 1814 is gekozen omdat er vanaf dat moment zogenaamde Handelingen der Staten Generaal beschikbaar zijn.
Het antwoord is een gigantisch aantal: 2.773.826. Echter dit wordt nogal vertekend omdat de teksten zijn ingescand en de letters automatisch zijn herkend (OCR). Dit levert nogal wat fouten op. Maar kijken we naar het aantal woorden dat minstens 2 keer voorkomt, dan hebben we er nog steeds heel erg veel: 992.291, bijna 1 miljoen.
Deze woorden zijn allemaal te vinden met de politieke ngram viewer die PoliticalMashup en Dispectu BV samen hebben ontwikkeld.
| lees verder…

Automatische classificatie van documenten

Geplaatst op 05-10-2012 door Maarten Marx | data, parliament, Political Mashup, research | tags: | comment image Geen reacties »

Het toekennen van trefwoorden uit een vaste lijst aan documenten (“taggen”) is een tijdrovende en dus kostbare taak. Vandaar dat veel onderzoek gedaan wordt naar automatiseren van die taak.
Die taak kan je op twee manieren automatiseren:

  1. Traditioneel De computer kent een beperkt aantal (3-6) trefwoorden aan een document toe, zonder ordening op die woorden.
  2. Anders De computer kent een flinke lijst (50-100) trefwoorden toe, allemaal met een “waarschijnlijkheids score”, die bijvoorbeeld zichtbaar gemaakt kan worden in een woordenwolk

Voor de traditionele manier maakt een computer nog te veel fouten om dit zonder menselijk ingrijpen uit te voeren. Het meest zinvolle is het maken van een term aanbevelings systeem.
Zo’n systeem geeft voor elk te taggen document een geordende lijst van de trefwoorden, en de menselijke tagger kan daar dan de juiste uitkiezen.
Dit lijkt wel wat op Google zoeken. Ook bij zo’n systeem is het van groot belang dat de juiste trefwoorden hoog in de lijst voorkomen. Dan leidt het gebruik van het aanbevelings-systeem tot tijdswinst.

Hoe werkt dat nou?

Lerend uit heel veel voorbeelden (documenten voorzien van trefwoorden) maken we een model op van elk trefwoord. Dat model bestaat simpelweg uit een lijst woorden voorzien van een gewicht. Die woorden kan je zien als een indicator dat een document over dat trefwoord gaat. De gewichten geven aan hoe belangrijk die indicator is.
Om een beeld te geven hebben we hier de 100 meest belangrijke indicatoren gezet die ons systeem geleerd heeft voor het trefwoord militaire vliegtuigen. In plaats van de gewichten laten we de woorden zien in een woordenwolk. Het is duidelijk dat de meeste woorden prima bij dat begrip passen.

Verdere beschrijving en uitleg

| lees verder…

Verbeelding van de Politiek

Geplaatst op 07-09-2012 door Maarten Marx | parliament | tags: | comment image Geen reacties »

Maarten Marx spreekt zondag 9 September 2012 in een programma over 50 jaar Zendtijd voor Politieke Partijen over manieren waarop ICT politieke data beter inzichtelijk kan maken.
Hieronder staan links naar materiaal wat hij in de lezing gebruikt.


| lees verder…

« eerdere stukken latere stukken »