Opinion Mining in Parliamentary Proceedings

Geplaatst op 22-03-2010 door Maarten Marx | resultaten | tags: | comment image Geen reacties »

Based on the Bachelor thesis of Steven Grijzenhout an article on opinion mining in the Dutch Hansards was written and accepted at the workshop From Text to Political Positions,
From Sentiments and Opinions in Texts to Party Positions
.

The updated version of the paper will appear in the formal conference proceedings.
Paper (updated version): Sentiment Analysis in Parliamentary Proceedings

Bibtex:

@InProceedings{grij:opin10,
author = {S. Grijzenhout and V. Jijkoun and M. Marx},
title = {Opinion Mining in {Dutch Hansards}},
booktitle = {Proceedings Workshop From Text to Political Positions (t2pp 2010)},
year = 2010
}

Digital sustainable parliamentary proceedings

Geplaatst op 22-03-2010 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

An article about digital sustainability based on the experience of PoliticalMashup with preserving parliamentary proceedings is accepted at the 11th International Digital Government Research Conference (dg.o 2010) on May 17-20, 2010 in Puebla, Mexico.

Article: Digital Sustainable Publication of Legacy Parliamentary Proceedings
Abstract at ACM
Bibtex:

@inproceedings{1809895,
author = {Marx, M. and Aders, N. and Schuth, A.},
title = {Digital sustainable publication of legacy parliamentary proceedings},
booktitle = {dg.o ’10: Proceedings of the 11th Annual International Digital Government Research Conference on Public Administration Online: Challenges and Opportunities},
year = {2010},
isbn = {978-1-4503-0070-4},
pages = {99–104},
location = {Puebla, Mexico},
publisher = {Digital Government Society of North America},
note={url{http://portal.acm.org/citation.cfm?id=1809874.1809895}}
}

Elsevier’s problems with names

Geplaatst op 19-03-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Elsevier started a new service: every time an article in an Elsevier journal written by you is cited you receive an email. How nice, so you can see your own in-degree growing.

One effective way to boost your in-degree is to cite yourself. Elsevier thought about that, so they write
Please note:
Self-citations are not included.

But to discover when a citation is a self-citation is not so easy, as shown by my very first alert.

Handelingen beschikbaar vanaf 1900

Geplaatst op 12-03-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Statengeneraaldigitaal.nl heeft onlangs de Handelingen uit de periode 1900 tot en met 1917 op hun site gepubliceerd. Het gaat om 38.024 documenten met 1.2 GigaByte aan tekst.
Als je alle woorden uit de stukken van deze periode achter elkaar plakt, en ervan uitgaat dat er 3 letters per centimeter staan, dan kom je op een totale lengte van meer dan 3000 kilometer.

PoliticalMashup heeft al deze documenten opgehaald en verwerkt. Het ophalen koste iets meer dan 24 uur. Hieronder geven we wat gegevens over de grootte van het corpus. Hierbij maken we onderscheid tussen drie soorten documenten:

  • Proceedings, dit zijn de verslagen van vergaderingen van de eerste en tweede kamer
  • qa, dit zijn de schriftelijk gestelde Kamervragen
  • other, dit zijn de kamerstukken. Dat is een mengelmoes van moties, amendementen, brieven, en nog veel meer.

Er zijn 2.241 Proceedings documenten, en 654 met Kamervragen. De rest zijn dus kamerstukken.

Een tabel met meer gedetailleerde informatie is beschikbaar.

sgd19001917

pentapolitica.nl

Geplaatst op 12-03-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

pentapolitica.nl is een website die de user generated content zoals blogs en tweets geproduceerd door Nederlandse politici en partijen opslaat, in kaart brengt en doorzoekbaar maakt.

PoliticalMashup gaat samenwerken met PentaPolitica en er zo samen voor zorgen dat hun beide databronnen gekoppeld kunnen worden.

XPath artikel gepubliceerd

Geplaatst op 11-03-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Het artikel Complete axiomatizations for XPath fragments is gepubliceerd in het Journal of Applied Logic.

| lees verder…

OpenKamer.tv

Geplaatst op 10-03-2010 door Maarten Marx | data, Political Mashup | tags: , | comment image Geen reacties »

Openkamer.tv is een website waarin gezocht kan worden in de video opnamen van de debatten gehouden in de Tweede Kamer. Het zoeksysteem probeert de gebruikers meteen naar de juiste plek in een debat te brengen.

Dat gaat als volgt: na het intoetsen van een zoekvraag, geeft het systeem een lijst van onderwerpen waarover gedebateerd is, geordend op relevantie voor de zoekvraag.
Voor elk van de onderwerpen, geeft het systeem dan vervolgens weer een lijst met uitspraken die relevant zijn voor de zoekvraag. Klikt men op zo’n uitspraak, dan start de video precies bij die uitspraak in het debat.
Zeker bij onderwerpen waarover erg lang gesproken wordt kan je zo snel de juiste relevante plek in een video terugvinden. Zoek bijvoorbeeld op Afganistan.

Elke uitspraak in de video is voorzien van een eigen unieke URL. Hiermee kan men dus heel makkelijk refereren naar wat iemand gezegd heeft in de kamer, met een directe link naar de opname. In deze uitspraak tijdens de politieke beschouwingen in 2009 zegt Balkenende iets over Afganistan, maar wat het nou precies betekent…..

| lees verder…

CATCH Meeting HiTiME: Capturing History & Time

Geplaatst op 03-03-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Maarten Marx geeft een lezing over PoliticalMashup op de CATCH Meeting HiTiME – Capturing History & Time. Alle gegevens staan hieronder.
Programme catch-hitime


Friday 26 March, 2010, 12:00 am – 18:00 pm
IISG – International Institute of Social History,
Cruquiusweg 31, Amsterdam
Entrance: FREE – Registration required
Register: catch@nwo.nl
Info: www.nwo.nl/catch

PoliticalMashup voorstel goedgekeurd

Geplaatst op 01-03-2010 door Maarten Marx | Uncategorized | | comment image Geen reacties »

NWO Geesteswetenschappen heeft een middelgrote investeringssubsidie (.5M Euro) toegekend aan het PoliticalMashup project. Het project is een samenwerking tussen de Universiteiten van Amsterdam, Groningen en Tilburg en het Documentatiecentrum Nederlandse Politieke Partijen (DNPP).
Het project wordt geleid door Maarten Marx van de UvA. Het steering committee bestaat uit Antal van den Bosch (UvT), Maarten de Rijke (UvA) en Gerrit Voerman (RUG, DNPP).

Een Engelse samenvatting van het project is hieronder beschikbaar.
| lees verder…