Verslag van PoliticalMashup Kick-Off meeting
Op woensdag 19 maart vond in De Burcht in Amsterdam de kick-off meeting plaats voor de Political Mashup. Een gevarieerd gezelschap van onderzoekers en geïnteresseerden uit uiteenlopende disciplines was aanwezig (een volledige deelnemerslijst staat in de folder).
Kort verslag van de dag
Maarten Marx heeft als eerste spreker de inleiding verzorgd en de plannen toegelicht. Dat leverde enthousiaste reacties en kritische kanttekeningen van het publiek op over de mogelijkheden die het aan elkaar koppelen van data biedt, maar ook over de beperkingen die sommige bronnen opleveren. Een greep uit de opmerkingen:
Het koppelen van reacties die mensen achterlaten op artikelen op de websites van krantenberichten is interessant. De vraag is wat je precies met die reacties wilt gaan doen. Zijn ze representatief voor de Nederlandse bevolking? En, gezien het feit dat de meeste webredacties de reacties modereren, is het niet beter om de ongecensureerde reacties te plaatsen?
De mening van het publiek is wellicht beter gerepresenteerd door een koppeling te maken met NIPO-onderzoeken en andere opiniepeilingen.
Hoe zit het met bronverwijzingen? Digitale bronnen verhuizen en verdwijnen en er rust auteursrecht op stukken.
Wordt het mogelijk om aan de hand van een kamervraag de gehele discussie over het betreffende onderwerp op te vragen? Daarvoor is het wel nodig te weten welke discussie mensen achter bepaalde vragen ‘lezen’.
André Krouwel sprak vervolgens zijn steun uit voor de Political Mashup en lichtte toe hoe hij momenteel te werk gaat bij het opstellen van het Kieskompas. Om standpunten van de verschillende partijen over onderwerpen te vinden wordt gebruik gemaakt van een hiërarchie in relevante documenten. Het zou volgens hem nuttig zijn om standpunten van diverse actoren niet alleen te kunnen classificeren op basis van wat politicologen bedacht hebben, maar ook op grond van wat uit een grote hoeveelheid documenten blijkt.
Onderzoek naar de positie van belangengroeperingen als vakbonden, de positie van de media en partijcohesie (bestaan er verschillen in partijstandpunten afhankelijk van het bestuurlijke niveau? Spreken alle partijleden zich consistent uit over alle zaken?) kan misschien makkelijker worden uitgevoerd met de Political Mashup. Het is wel belangrijk vergelijkingen te blijven maken met handgecodeerde onderzoeken.
Data
De Koninklijke Bibliotheek was present bij monde van Huibert Crijns en Tineke Koster. ZIj legden uit wat het project Staten Generaal Digitaal inhoudt: kamerhandelingen vanaf 1815 zullen gedigitaliseerd worden. Momenteel is alles van tussen 1990 en 1995 al digitaal beschikbaar. Vanaf 1995 worden de documenten beheerd door Parlando.De handelingenin Staten Generiaal Digitaal zijn als grafisch bestand en als pdf opgeslagen, wat betekent dat de XML-code beperkt is tot beschijvende en structurele metadata. De data zijn zonder restricties toegankelijk.
Het Documentatiecentrum Nederlandse Politieke Partijen beheert een grote collectie data van en over politieke partijen. Informatie van het internet is daarin steeds belangrijker, omdat materiaal dat vroeger veelal per post aan alle leden werd verzonden inmiddels vaak nog slechts voor geïnteresseerden van websites is te halen. Gerrit Voerman liet zien hoe het DNPP in staat is het relatief kleine segment aan partijwebsites te archiveren in het project Archipol. De websites bevinden zich echter niet in het open domein, omdat de politieke partijen vrezen voor eventuele verwarring als oudere versies van hun sites blijven circuleren.
Data verwerken
Jan Kleinnijenhuis werkt aan ontologieën waarmee het mogelijk wordt de relaties tussen actoren en hun standpunten op verschillende issues weer te geven. Daarmee kan op systematische wijze de relatie tussen actoren en issues in kaart worden gebracht, grafisch worden weergegeven en onderworpen aan statistische analyse.
Het doorzoeken van data werd verder toegelicht door Maarten de Rijke. Hij liet aan de hand van expert-search zien dat computers tot op zekere hoogte begrip van teksten kunnen hebben. Ook demonstreerde hij de manier waarop de impact van gebeurtenissen kan worden gemeten. Dat kan door het koppelen van stemmingen die mensen op hun persoonlijke webpagina’s laten zien aan nieuws, cultuurevenementen of politieke ontwikkelingen geeft een bijna realtime beeld van hun invloed. Het kan ook door te kijken naar reacties. Op peilend.nl worden bijvoorbeeld online commentaren op nieuws bijgehouden en geanalyseerd.
Antal van den Bosch gaf een aantal voorbeelden van normalisatie van tekst, die het mogelijk maakt om teksten te ontdoen van spel- of typfouten. Ook houdt zijn ILK-groep zich bezig met het herkennen van entiteiten en expert-search. Een voorbeeld van een door hen gemaakte toepassing is het aanraden van andere nieuwsberichten bij een artikel in de krant.
Slides
De slides van de presentaties zijn hier beschikbaar:
- Maarten Marx, UvA Informatica print-versie | screen-versie.
- André Krouwel, VU Politicologie
- Huibert Crijns en Tineke Koster, Koninklijke Biblioteek
- Maarten de Rijke, UvA Informatica
- Jan Kleinnijenhuis, VU Communicatiewetenschap
- Antal van den Bosch, UvT Computerlinguistiek
Het programma van de dag en een overzicht van de deelnemers en hun contactgegevens staan in de folder.
Reageer