Informatics Institute colloquium

Geplaatst op 12-05-2011 door Maarten Marx | lecture, parliament, research | | Geen reacties »

May 24 at 16.00, Maarten Marx will give a talk at the Informatics Institute colloquium.

Location: Science Park 904, Room D1.113, Amsterdam
Title: Parliamentary Information Systems
Abstract:
The proceedings of national parliaments are fascinating material for information scientists.
For the Netherlands, they consist of 197 years of digitally available data. Apart from some modern gaps (see http://politicalmashup.nl/2011/03/uva-informatica-onderzoek-leidt-tot-kamervragen/), this datset is complete. We have similar complete datasets for the UK, Spain and the Flemish parliament (though for shorter periods).

Anachronistically we can describe the data as a multimedia, hyperlinked database consisting mostly of rich semi-structured text documents.
Within the PoliticalMashup project, UvA turns this anachronism into reality. This opens a wealth of new research possibilities situated in the emerging field of computational humanities.

In the talk we will both show the techniques used for the transformation and applications within the computational humanities.

Justin van Wees looked at the existing communities within the Informatics Institute by analyzing k-clique communities within the IvI co-author graph. In the attached diagrams we show the largest 3-clique community (66 nodes ) and the two largest 4-clique communities contained in it (24 en 18 nodes). Next we show the second and third largest 3-clique communities (7 en 4 nodes). There is one more 4-clique community but that was contained in the large component, so we did not show it:
ivi_network_3_en_4.pdf and ivi_network_3_en_4.svg (the small 4 node component drifted out of the picture here)

Talk Mattia Tomasoni May 10

Geplaatst op 02-05-2011 door Maarten Marx | Uncategorized | | Geen reacties »

Mattia Tomasoni visits ILPS on May 10 and 11. He might come to work with us as a PhD student. Mattia gives a talk on the topic of his 2010 ACL paper in an improvised ILPS seminar.
If you want to meet up with him, mail him at tomasonimattia@googlemail.com. He is with us the full two days.

Time and place: May 10, 10.30-11.15 Room A1.08.

Title: “Summarization in Yahoo! Answers”

Abstract:
“The objective of my MSc thesis was to automatically summarize information crawled from the Yahoo! Answers website with the purpose of generating trustful, complete, relevant and succinct summaries in response to users’ questions.

Unfortunately, information found online is often redundant, noisy and untrustworthy; interestingly, though, content generated by actual individuals (rather than published by an editor) contains metadata that can be exploited (i.e. machine learned) to overcome those very same difficulties!

To this end, my former supervisor and I devised four “metadata-aware measures for answer summarization”: Quality, Coverage, Relevance and Novelty. How they are defined, calculated, combined and finally evaluated will be the topic of my talk.”

Link to paper http://portal.acm.org/citation.cfm?id=1858759 (paper at ACL 2010)

Protected: Wie spreken in de Tweede Kamer? Per partij, en per zittingsperiode.

Geplaatst op 19-04-2011 door Maarten Marx | parliament, resultaten | | Enter your password to view comments

This post is password protected. To view it please enter your password below:


Protected: Elsevier en de Tweede Kamer

Geplaatst op 08-04-2011 door Maarten Marx | Political Mashup, research | | Enter your password to view comments

This post is password protected. To view it please enter your password below:


PhD position in Logic/XML/Trees

Geplaatst op 07-04-2011 door Maarten Marx | XML, research | tags: | 1 reactie »

The university of Amsterdam has a fully funded 4-year PhD position available. The research topic is on the interplay of logic, finite model theory, and the theory of (XML)-trees and motivated by a concrete problem in database research:

Data Exchange for Document Centric XML.

| lees verder…

XML Prague 2011

Geplaatst op 01-04-2011 door Anne | XML, eXist, research, xquery | | Geen reacties »

PoliticalMashup was represented in Prague at the XML Prague conference. The day before, at the pre-conference, Anne presented his work on Fast Faceted Search in XML.

The captured livestream of that presentation is shown below. The slides are here.

Wie zit waar en zegt wat en wanneer in het parlement?

Geplaatst op 01-04-2011 door Maarten Marx | parliament | | 1 reactie »

Drie eerstejaars studenten Informatiekunde aan de UvA hebben een applicatie, http://politiekinzicht.com, gebouwd waarin ze het werk van de politici in de Tweede Kamer mooi samenvatten.
Daarbij zie je meteen waar ze in de kamer zitten en naast wie. Hun site is geïnspireerd op congressspeaks.com, maar is vooral veel beter in de woorden die in de wolken terecht komen.

Om het verschil te kunnen proeven tussen de ‘normale woordenwolken’ die je op het web ziet (zoals bijvoorbeeld ook Wordle die maakt) en de wolken gebaseerd op de techniek van Kaptein, Kamps en Hiemstra is er het knopje absoluut/relatief.
Wilders is een mooi voorbeeld omdat hij van die fijne stokpaardjes heeft. zoals Henk, Ingrid en de Koran. In zijn absolute woordenwolk zie je die niet terug. De wolk wordt gedomineerd door weinig zeggende woorden als kabinet, voorzitter, fractie. Kies je daarentegen voor de relatieve wolk en beperk je de tijd tot de laatste twee jaar. dan zie je veel beter wat hem bezig houdt.

De site is gemaakt door Reinier van der Plank, Jurriaan Tromp en Thomas Moeskops. Ze hebben ook een uitgebreid verslag gemaakt.

In de media

Workshop Diachroon Corpus

Geplaatst op 29-03-2011 door Maarten Marx | data, lecture | | Geen reacties »

30 Maart 2011 is er een workshop Diachroon Corpus op het Huygens ING Instituut in Den Haag. Maarten Marx spreekt daar over het StatenGeneraal Digitaal project.
Hier zijn de bestanden genoemd in zijn lezing beschikbaar.

  • Alle hits binnen de verslagen van de Eerste en Tweede Kamer 1814-1995 op ‘wijf’ en ‘huisvrouw’
  • wijf huisvrouw (Deze files zijn te importeren in Excel. De scheider is TAB.)

Alle debatten per persoon op een rijtje

Geplaatst op 25-03-2011 door Maarten Marx | data, parliament | tags: | 1 reactie »

PoliticalMashup heeft voor alle personen die sinds het parlementaire jaar 1975-1976 hebben deelgenomen aan debatten in de Eerste of Tweede Kamer een overzicht gemaakt van zijn of haar debatsgeschiedenis.
Het gaat om 1267 personen. De gegevens zijn gebaseerd op de Handelingen vanaf Prinsjesdag 1975 tot half December 2010.
De gegevens zijn beschikbaar in XML and tsv formaat op http://data.politicalmashup.nl/politici/nl/.
| lees verder…

Wie zegt wat en wanneer in het Nederlandse Parlement?

Geplaatst op 25-03-2011 door Maarten Marx | data, parliament | tags: | 2 reacties »

PoliticalMashup heeft een database beschikbaar gemaakt met daarin alle woorden gezegd door elke politicus in het Nederlandse parlement in de periode 1814-2010. Per politicus zijn per dag al zijn of haar uitgesproken teksten beschikbaar.
Het gaat om mensen die of in het Nederlandse Parlement of in de regering hebben gezeten. Dit zijn allemaal mensen die voorkomen op parlement.com.
De gegevens zijn gehaald uit de Handelingen in XML formaat zoals die gemaakt zijn door PoliticalMashup.
De data is beschikbaar op http://data.politicalmashup.nl/politici/nl_words/.
| lees verder…

« eerdere stukken latere stukken »