Geen reacties »Drie aankomende masterstudenten informatiekunde aan de Universiteit van Amsterdam hebben een veel-talige zoekmachine gemaakt voor parlementaire documenten.
Met één zoekvraag kan je in parlementaire stukken uit vier landen en in vier verschillende talen zoeken.
De website is nog ietwat prematuur maar geeft toch al wel een leuk beeld van de mogelijkheden. Hij is te bezoeken door op onderstaand logo te klikken.

De site is gemaakt door Ellen van Beijsterveldt, Remy Gorissen en Kasper Reijnders.
Tim Gielissen en Maarten Marx wrote a paper Exemelification of Parliamentary Debates (PDF) on the many opportunities offered by parliamentary data for information retrieval researchers.
The paper appeared in the proceedings of the 9th Dutch-Belgian Information Retrieval Workshop (DIR 2009).
| lees verder…
The first week of December PoliticalMashup will host a workshop on markup which is too complicated to fit straightforward in XML. The workshop is organized by Claus Huitfeldt and will be attended by a small number of XML experts.
Binnen PoliticalMashup werken we met allerlei soorten files, maar proberen alles om te zetten naar XML. Uit de XML files halen we dan de data. Dit leidt vaak tot erg lange wachttijden of je moet een speciale custom oplossing bedenken. We illustreren dit aan de hand van een voorbeeld.
We hebben een dikke 27.000 moties in XML, alle tussen de 3 en 4K, met elk zo’n 81 regels. Een simpele vraag is om voor elke motie haar kamerstuknummer uit te printen. Dat kan met de XPath expressie //hiddenkamerstuknr. De wachttijden voor deze simpele vraag lopen erg uiteen
Eerste tests met MonetDB/XQuery geven zeer positieve resultaten. Zie hieronder.
| lees verder…