Nelleke Aders speaks at SIKS Masterclass
Nelleke Aders speaks at the SIKS Masterclass organized around the PhD defense of Michiel Hildebrand. She speaks on Linked Data at the Dutch House of Representatives.
Nelleke Aders speaks at the SIKS Masterclass organized around the PhD defense of Michiel Hildebrand. She speaks on Linked Data at the Dutch House of Representatives.
People keep on asking us what the use is of all that parliamentary data in XML. Easy! There are so many applications. Consider the following: one can learn how to write good speeches.
Everyone wants to receive applause, so we created a query which collects all paragraphs after which the audience starts to applaud. These must contain important words!
As we did not want too much data, we choose a speaker who gets lots of applause: Mr Barosso. 46% of his speeches in the European Parliament receive applause.
The query we sent to our database is easy:
(: all paragraphs of speeches by Barroso immediately preceding
applause concatenated into a string : )
string-join(
collection('/db/euparliament/data/EN')
//speech[contains(@speaker,"Barroso")] (: only speeches by Barroso : )
//p[contains(.,"(Applause)")] (: find paragraphs containing Applause : )
/preceding-sibling::p[1], (: get the preceding paragraph : )
' '
)
The result, when summarized using Wordle, is rather dissapointing….just a bunch of modal verbs and words referring to his audience…..
Or maybe that is the secret of getting applause?
Een heel oud artikel van Maarten Marx en Carlos Areces is gebruikt in een kunstwerk dat op dit moment ten toon wordt gesteld in New York.

| lees verder…
1 reactie »
Heden
De Partij voor de Vrijheid (PVV) krijgt veel media-aandacht. Er worden door leden van de partij nogal eens uitspraken gedaan die door veel mensen als provocerend ervaren worden. Denk hierbij bijvoorbeeld aan de uitspraken rondom boerka’s en hoofddoeken, met als toppunt misschien wel de ‘kopvoddentaks’.
Een Almeerse moslima heeft aangifte gedaan tegen de PVV, zij zegt dat een hoofddoekjesverbod haar identiteit zou aantasten.
Nu de verkiezingen naderen kunnen we enkel fantaseren over de voorstellen waarmee de partij van Geert Wilders nog meer zal komen. Zal hij met nog meer voorstellen komen om immigranten een meer Nederlandse identiteit te geven? Straks stelt hij nog voor om de moeilijk uitspreekbare namen van immigranten te veranderen zodat ze door Nederlanders beter uitgesproken kunnen worden.
Als hij dit doet… is hij niet de eerste.
Based on the Bachelor thesis of Arjan Nusselder, an article on politician search was written and accepted at the 2010 Open Knowledge Conference in London.
Post conference material (slides, proceedings, photo’s, etc)
Paper: What you say is who you are. How open government data facilitates profiling politicians.
Bibtex:
@InProceedings{marx:what10,
author = {M. Marx and A. Nusselder},
title = {What you say is who you are. How open government data facilitates profiling politicians.},
booktitle = {Proceedings Open Knowledge Conference, London 2010},
series= {CEUR Workshop Proceedings},
Volume ={575},
year = 2010,
note ={\url{http://ceur-ws.org/Vol-575/paper4.pdf}}
}
UNIVERSITEIT VAN AMSTERDAM, INFORMATICA, ILPS groep
1 * Wetenschappelijke Programmeur Voltijds, 2 jaar
1 * Postdoc Voltijds, 17 maanden
De vacatures zijn binnen het PoliticalMashup waarin de UvA samenwerkt met de groep van Antal van den Bosch in Tilburg en die van Gerrit Voerman in Groningen.
Het PoliticalMashup project heeft als doel het eenvoudig digitaal doorzoekbaar maken van grote hoeveelheden politieke data. Te denken valt aan partijprogramma’s, kamerhandelingen, krantenberichten en berichten op weblogs van politici of politiek- geïnteresseerden, en andere sociale media. Voor meer informatie, zie http://politicalmashup.nl/2010/03/politicalmashup-voorstel-goedgekeurd/
Binnen de programmeurspositie is veel ruimte voor eigen inbreng, en de plek kan zodoende een mooi begin zijn van een promotie.
De advertenties staan op
http://www.science.uva.nl/werkenbijdefnwi/vacatures.cfm/9ADC6AC1-9AA5-42E9-81D14639E02E316D
en
http://www.science.uva.nl/werkenbijdefnwi/vacatures.cfm/7B808A15-187F-41AE-B7CDA162B00FE209
Meer informatie bij Maarten Marx.
Based on the Bachelor thesis of Steven Grijzenhout an article on opinion mining in the Dutch Hansards was written and accepted at the workshop From Text to Political Positions,
From Sentiments and Opinions in Texts to Party Positions .
Paper: Opinion Mining in Dutch Hansards
Bibtex:
@InProceedings{grij:opin10,
author = {S. Grijzenhout and V. Jijkoun and M. Marx},
title = {Opinion Mining in {Dutch Hansards}},
booktitle = {Proceedings Workshop From Text to Political Positions (t2pp 2010)},
year = 2010
}
An article about digital sustainability based on the experience of PoliticalMashup with preserving parliamentary proceedings is accepted at the 11th International Digital Government Research Conference (dg.o 2010) on May 17-20, 2010 in Puebla, Mexico.
Article: Digital Sustainable Publication of Legacy Parliamentary Proceedings
Abstract at ACM
Bibtex:
@inproceedings{1809895,
author = {Marx, M. and Aders, N. and Schuth, A.},
title = {Digital sustainable publication of legacy parliamentary proceedings},
booktitle = {dg.o ‘10: Proceedings of the 11th Annual International Digital Government Research Conference on Public Administration Online: Challenges and Opportunities},
year = {2010},
isbn = {978-1-4503-0070-4},
pages = {99–104},
location = {Puebla, Mexico},
publisher = {Digital Government Society of North America},
note={\url{http://portal.acm.org/citation.cfm?id=1809874.1809895}}
}
Elsevier started a new service: every time an article in an Elsevier journal written by you is cited you receive an email. How nice, so you can see your own in-degree growing.
One effective way to boost your in-degree is to cite yourself. Elsevier thought about that, so they write
Please note:
Self-citations are not included.
But to discover when a citation is a self-citation is not so easy, as shown by my very first alert.

Statengeneraaldigitaal.nl heeft onlangs de Handelingen uit de periode 1900 tot en met 1917 op hun site gepubliceerd. Het gaat om 38.024 documenten met 1.2 GigaByte aan tekst.
Als je alle woorden uit de stukken van deze periode achter elkaar plakt, en ervan uitgaat dat er 3 letters per centimeter staan, dan kom je op een totale lengte van meer dan 3000 kilometer.
PoliticalMashup heeft al deze documenten opgehaald en verwerkt. Het ophalen koste iets meer dan 24 uur. Hieronder geven we wat gegevens over de grootte van het corpus. Hierbij maken we onderscheid tussen drie soorten documenten:
Er zijn 2.241 Proceedings documenten, en 654 met Kamervragen. De rest zijn dus kamerstukken.
Een tabel met meer gedetailleerde informatie is beschikbaar.
sgd19001917