CCCT seminar 18 Maart 16.00

Geplaatst op 13-03-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Speakers
- dr. Jonneke Bekkenkamp (Religious Studies): Groenlinks We-speak: In favour of the individual, but not of individualism.
- prof. dr. Maarten de Rijke (Informatics Institute): Semantic Search

Moderator
- dr. Rens Vliegenthart (Commmunication Sciences)

Location
Oudemanhuispoort, zaal 110C C0.17
Oudemanhuispoort 4-6
1012 CN Amsterdam

Time
Friday, 18 March, 16.00-17.00 hrs (followed by drinks).
| lees verder…

PoliticalMashup in Groningen

Geplaatst op 10-03-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Vrijdag 11 Maart 2011, geeft Maarten Marx een lezing bij Informatiekunde, Faculteit der Letteren, Rijksuniversiteit Groningen, getiteld

Connecting promises and actions of politicians and how the society reacts on them

De slides zijn beschikbaar in print- en scherm-formaat.

Example applications:

| lees verder…

Duizenden Kamerstukken verdwenen uit overheidsportaal

Geplaatst op 02-03-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Mede op basis van informatie van PoliticalMashup heeft Trouw.nl een artikel geplaatst dat het probleem van de vele documenten die missen op https://zoek.officielebekendmakingen.nl/.

Oorlog in de Kamer

Geplaatst op 01-03-2011 door Maarten Marx | Uncategorized | | Geen reacties »

PoliticalMashup heeft samen met het NIOD en DANS een Clarin subsidie gekregen om onderzoek te doen naar het gebruik van de oorlog als argument in het politieke debat sinds 1945.
Het project gaat tussen April en Mei van start en zal een jaar duren.
Het NRC besteedde er vrijdag 25 Februari al aandacht aan in het artikel Waarom politici graag over de oorlog praten.

Als voorproefje hebben we hier een csv file beschikbaar gemaakt (dit is in te lezen in bijvoorbeeld Excel) met daarin alle paragrafen uit de Handelingen van de Tweede Kamer tussen 1996 en eind 2010 waarin een van de volgende woorden voorkomt:

hitler, NSB, joden, landverrader, collaboratie

Dit leverde 204 hits op.
De eerste hit komt uit een betoog van de Heer Middel (PvdA) tijdens een debat over Particuliere beveiligingsorganisaties. Hij begint als volgt:

Voorzitter! Het heeft heel lang geduurd, maar het is er toch van gekomen: er ligt nu een wetsvoorstel. Wij hebben het tientallen jaren moeten doen, tot 1991, met een wet van voor de oorlog die ooit bedoeld was om de geüniformeerde NSB van de straat te houden….

Deze data laten zien dat een zo ruwe aanpak erg veel valse hits oplevert. Binnen het project worden met behulp van machine-leren meer fijnmazige classifiers ontwikkeld.

Links en materiaal

Johan van Doornik new Postdoc at PoliticalMashup

Geplaatst op 28-02-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Dr. Ir. Johan van Doornik starts March 1, 2011 as a postdoc on the NWO-sponsored PoliticalMashup project. Johan has a master in Electrical Engineering from Twente, obtained his PhD in Aalborg where he was an assistant professor for two years. Then he moved to Stanford were he was a postdoc for 4 years.

He has a strong background in modeling and making simulations of human diseases, in particular muscle related problems with children.

Within the PoliticalMashup project he will work on Data Deduplication, linking newspaper articles to parliamentary activities, and analysis of networks of politicians.

PoliticalMashup Vacature

Geplaatst op 10-02-2011 door Maarten Marx | Uncategorized, onderwijs | | Geen reacties »

Binnen de PoliticalMashup groep aan de UvA is er een vacature voor een postdoc binnen het project ‘Oorlog in de Kamer’.

Dit project wordt in samenwerking met het Nederlands Instituut voor Oorlogsdocumentatie (NIOD) uitgevoerd, en is gefinancierd door Clarin II. Het doel is om het gebruik van de Tweede Wereld Oorlog als argument in het debat in het Nederlandse Parlement systematisch in kaart te brengen. Het project werkt met de Handelingen der Staten Generaal van 1930 tot heden. Die zijn allemaal in een rijk XML formaat beschikbaar.

Binnen het project zal de postdoc zich voornamelijk bezig houden met annoteren van de tekstuele data met behulp van zelfgetrainde classifiers en NLP-tools speciaal voor Nederlandstalige data, onder andere Named-Entity Recognizers en Timex taggers. Het beoogde eindproduct is een zoeksysteem voor de Handelingen gericht op professionele gebruikers met een historische achtergrond. Het systeem biedt advanced search mogelijkheden voor zoekvragen m.b.t. de oorlog.

Profiel ervaring in taal technologie, werken met heel veel tekstuele data en XML technologie.
Goede wetenschappelijke programmeurs kunnen ook solliciteren
Dienstverband 1 jaar fulltime.

Link naar de volledige advertentietekst.

Release of CORPS: a corpus of political speeches tagged with audience reactions

Geplaatst op 02-02-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Marco Guerini released CORPS, a corpus of political speeches tagged with specific audience reactions, such as APPLAUSE or LAUGHTER.
| lees verder…

Networks in Shakespeare’s plays

Geplaatst op 25-01-2011 door Maarten Marx | Uncategorized | | 1 reactie »

The schema of the XML versions of the parliamentary proceedings PoliticalMashup creates was largely based on that of the XML versions of Shakespeare’s plays.
Thus after having created so many good looking debate and interruption graphs, PoliticalMashup decided to create graphs of the plays as well.
| lees verder…

Actie tegen Bezuinigingen op Hoger Onderwijs

Geplaatst op 21-01-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Vandaag is de actie tegen de bezuinigingen tegen het hoger onderwijs. PoliticalMashup heeft een debatsgraaf gemaakt van het debat in de Tweede Kamer daarover van 19 Januari.

De sprekers staan geordend naar het aantal interrupties die ze verkregen hebben. Zoals meestal valt de groep sprekers in twee delen uiteen:

  1. Leden van de regering en leden van de regeringspartijen;
  2. de oppositie.

Ook in dit debat blijkt dat de oppossiteleden de PVV gewoon tot als regeringspartij zien, net als bij het debat over de regeringsverklaring. Toen werd de Wilders (PVV) zelfs nog vaker geinterrumpeerd dan van Haersma Buma van het CDA.

Marco Visser (Trouw) had de volgende observaties over dit debat:
| lees verder…

Weer 102 maidenspeeches erbij

Geplaatst op 11-01-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Eerder berichten we over een corpus van 280 maidenspeeches uit de Eerste en Tweede Kamer die we verzameld hadden. We hebben een nieuwe crawl gemaakt van overheid.nl, omdat we merkten dat er veel data niet beschikbaar was, en later werd toegevoegd. Dat blijkt! We hebben onze verzameling maidenspeeches met 102 stuks kunnen uitbreiden tot 382. Zoals eerder, met View Page Source krijg je de ruwe XML te zien , met nog veel meer informatie, waaronder de hele tekst van de speech en de aankondiging van de voorzitter.

Update Zomer 2011

De verzameling maidenspeeches is door een vakantiewerker verder uitgebreid tot 518. Hij heeft vooral allerlei ongewone speeches gevonden. Bijvoorbeeld een niet-aangekondigde door een PVV-er en een debat met 4 maidenspeeches tegelijk. De nieuwe verzameling staat op dezelfde plek als eerder.

Update 5 April 2011

De lijst met maidenspeeches is niet volledig. Een overzicht van de Tweede Kamer parlementsleden die in de periode 1995-2010 wel eens wat gezegd hebben, maar van wie we geen maidenspeech hebben staat in
missingmaidens.html. We hebben hier geen politici opgenomen die ook ooit als bewindslied gesproken hebben.

Het gaat om 236 personen. Een groot deel (123) daarvan heeft hoogstwaarschijnlijk de maidenspeech gehouden voor 1996. En daarvan hebben we nog geen data.
Sommige van de speeches in de lijst zijn wel degelijk maidenspeeches, bijvoorbeeld die van de heer Monash, en mevrouw Azough. Deze zijn dan gemist door onze maidenspeech detector. In deze twee gevallen omdat de voorzitter ze niet als zodanig had aangekondigd.

Het meest interresant zijn de politici zonder betoog in de lijst. Dit zijn veelal leden van de PVV die sinds juni 2010 in de kamer zitten.

« eerdere stukken latere stukken »