Protected: Comparing XML schema languages

Geplaatst op 17-06-2010 door Maarten Marx | research, XML | tags: | comment image Enter your password to view comments.

This content is password protected. To view it please enter your password below:

EuroPsearch

Geplaatst op 15-02-2010 door Maarten Marx | Political Mashup | tags: , | comment image Geen reacties »

Drie aankomende masterstudenten informatiekunde aan de Universiteit van Amsterdam hebben een veel-talige zoekmachine gemaakt voor parlementaire documenten.
Met één zoekvraag kan je in parlementaire stukken uit vier landen en in vier verschillende talen zoeken.

De website is nog ietwat prematuur maar geeft toch al wel een leuk beeld van de mogelijkheden. Hij is te bezoeken door op onderstaand logo te klikken.


De site is gemaakt door Ellen van Beijsterveldt, Remy Gorissen en Kasper Reijnders.

Paper on parliamentary debates

Geplaatst op 12-02-2009 door Maarten Marx | resultaten | tags: , | comment image Geen reacties »

Tim Gielissen en Maarten Marx wrote a paper Exemelification of Parliamentary Debates (PDF) on the many opportunities offered by parliamentary data for information retrieval researchers.

The paper appeared in the proceedings of the 9th Dutch-Belgian Information Retrieval Workshop (DIR 2009).
| lees verder…

Workshop on multi dimensional markup (Goddag Workshop)

Geplaatst op 26-11-2008 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

The first week of December PoliticalMashup will host a workshop on markup which is too complicated to fit straightforward in XML. The workshop is organized by Claus Huitfeldt and will be attended by a small number of XML experts.

  • Preliminary program
  • The hotel Kap
  • Travel directions to Science Park The workshop will be in the NIKHEF/UvA building in Room F013. This is on Kruislaan 403. Take the main entrance at the NIKHEF building, tell the lady your name, and you get a pass which lets you in.
  • Evening and social program (all within 10 minutes walking from the hotel)
    • Monday Dinner at Flo at 18.00 Directions
    • Tuesday Chamber music concert in Amstelkerk at 20.00 Directions
    • Wednesday Dinner at Cucina del Sole at 17.30 Take Tram 2 to Hoofddorpplein (at 17.00 from Leidseplein)
    • Thursday Afternoon free Dinner at Sluizer
    • Friday Farewell lunch
  • For logistic questions contact Maarten Marx +31(0)6 40016120 maartenmarx@uva.nl

Werken met heel veel XML files

Geplaatst op 08-07-2008 door Maarten Marx | data | tags: | comment image Geen reacties »

Binnen PoliticalMashup werken we met allerlei soorten files, maar proberen alles om te zetten naar XML. Uit de XML files halen we dan de data. Dit leidt vaak tot erg lange wachttijden of je moet een speciale custom oplossing bedenken. We illustreren dit aan de hand van een voorbeeld.

We hebben een dikke 27.000 moties in XML, alle tussen de 3 en 4K, met elk zo’n 81 regels. Een simpele vraag is om voor elke motie haar kamerstuknummer uit te printen. Dat kan met de XPath expressie //hiddenkamerstuknr. De wachttijden voor deze simpele vraag lopen erg uiteen

Update: MonetDB-XQuery

Eerste tests met MonetDB/XQuery geven zeer positieve resultaten. Zie hieronder.
| lees verder…