Politicologie Universiteit Leiden 11 April 2012

Geplaatst op 10-04-2012 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Hier staat het materiaal dat hoort bij de lezing van Maarten Marx op 11 April 2012 voor de derdejaars Politicologie aan de Universiteit Leiden.
| lees verder…

De juiste stemming

Geplaatst op 13-03-2012 door Maarten Marx | Uncategorized | | comment image Geen reacties »

PoliticalMashup probeert de uitslag en de stemverdeling van de stemmingen over moties, amendementen en wetsontwerpen uit de Handelingen te halen. Dit wordt weer gebruikt door de Tweede Kamer, sites als politix.nl en politicologen.
Dit gaat aardig goed omdat de voorzitter de uitslag van de stemmingen met behulp van een aantal vaste formules aangeeft.
Maar soms wordt er tijdens de vergadering gezegd dat de voorzitter een foutje heeft gemaakt. De stemming wordt dan echter niet in de Handeling verbeterd. Zowel voor mensen als voor computers is het op deze manier erg moeilijk om gegarandeerd de juiste stemming uit de tekst op te maken.
| lees verder…

PoliticalMashup and Politix

Geplaatst op 06-02-2012 door Maarten Marx | Uncategorized | | comment image Geen reacties »

De volgende bijdrage is geschreven door de mensen achter politix.nl.

Waar stemmen ze nou op?

Ook benieuwd naar wat de partijen van de Tweede Kamer doen met hun verkiezingsprogramma’s? Of ze zich houden aan de voornemens en beloften? Blijven de partijen trouw aan hun idealen, sluiten ze compromissen of verliezen ze hun ideeën helemaal uit het oog? Blijven de linkse partijen links, of vertonen ze gaandeweg wat liberale trekjes? En zijn de rechtse partijen in de afgelopen kabinetsperiode sociale geworden, of juist niet? Al deze zaken worden duidelijk in het stemgedrag van de partijen. Nieuwsgierige personen kunnen op de sites van officiëlebekendmakingen.nl en tweedekamer.nl wel zien wanneer er waarover gestemd is, maar een overzicht van al deze stemmingen ontbreekt. Om hier meer duidelijkheid over te krijgen, brengt Politix het stemgedrag van onze volksvertegenwoordigers op partijniveau in kaart.
| lees verder…

Job Opening: Postdoc or senior scientific programmer

Geplaatst op 30-01-2012 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

The ILPS group at the Informatics Institute of the University of Amsterdam (UvA) has an opening for a postdoc or senior scientific programmer in the ‘Namescape’ project.

We are looking for someone with a background in computational liguistics or AI, with an affinity for literature and the Dutch language.
The project is a collaboration with the Hygens institute for Dutch History and the Institute for Dutch Lexicology (INL) and financed by Clarin-NL. The research concerns the use of named entities within Dutch literature. The aim is to extend a manual pilot project on 20 novels to a fully automatic analysis of a corpus of almost 9000 digitized modern Dutch novels. The project involves named entity recognition, special classification (real vs fictional entities), entity deduplication and modelling co-occurrence of entities.

The project runs for 1 year. For more information, see the research proposal.

Profile: Background in computational linguistics or AI. Experience with Linux, NLP and XML technology.
Level Postdoc or scientific programmer. Salary (depending on education and work experience) between €2.379 and €3.195 a month (before taxes).
Duration 1 year
Start March, April 2012
Information Maarten Marx (maartenmarx@uva.nl)
How to apply?

Vacature Wetenschappelijk Programmeur

Geplaatst op 24-01-2012 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

Binnen de PoliticalMashup groep aan de UvA is er een vacature voor een wetenschappelijk programmeur binnen het project ‘Namescape’.

Dit project wordt in samenwerking met het Huygens Instituut en het Instituut voor Nederlandse Lexicologie (INL-Leiden) uitgevoerd en is gefinancierd door Clarin III. Het onderzoek binnen het project gaat over het gebruik van namen (named entities) in Nederlandstalige literatuur. Dit onderzoek is gestart door Karina van Dalen van het Huygens. Zij heeft een voorbereidende handmatige pilotstudie gedaan dat in dit project groot en zoveel mogelijk automatisch wordt voortgezet.
Het INL heeft een corpus van meer dan 500 Nederlandstalige romans en gaat daarin de named entities herkennen en classificeren. De UvA zal zich bezig houden met een extra verfijning van de categorisering naar fictieve en echte entiteiten, deduplicatie van gevonden entiteiten, het verbinden van de gevonden entiteiten met Wikipedia en met het opzetten van een analyse en visualisatie omgeving. De visualisaties maken gebruik van de barcode browser techniek ontwikkeld aan de UvA en een combinatie van netwerk visualisaties met woordenwolken. De analyse omgeving zal bestaan uit een XML database systeem (eXist) met XQuery support.
Met deze analyse omgeving zal het Huygens het gebruik van namen in de 500 geannoteerde romans gaan onderzoeken.
Het project levert het volgende op:

  • een verrijkte publicatie over het naamgebruik in Nederlandstalige literatuur (Huygens,INL,UvA);
  • een webapplicatie waarin men een Nederlandstalige roman in PDF formaat kan inladen waarin dan vervolgens de named entities worden herkend en verbonden met Wikipedia (INL);
  • een webgebaseerde analyse omgeving waarin men het naamgebruik in de 500 romans kan onderzoeken (UvA);
  • per roman, een visualisatie van het colocatie netwerk van de genoemde entiteiten (Huygens, UvA).

De looptijd van het project bedraagt 1 jaar. Voor verdere informatie over het project zie het onderzoeksvoorstel (samenvatting).

Profiel: Achtergrond in computationele linguistiek, kunstmatige intelligentie of informatica. Affiniteit met de Nederlandse taal. Ervaring met Linux, XML (XQuery en/of XSLT) en werken met tekstuele data.
Niveau Wetenschappelijk programmeur of Postdoc. Het salaris bedraagt, afhankelijk van opleiding en werkervaring, minimaal €2.379 en maximaal €3.195 bruto per maand (maximaal salarisschaal 10.7 van de CAO Nederlandse Universiteiten) bij volledige werktijd.
Dienstverband: 1 jaar .75 fte (kan in overleg ook anders ingevuld).
Aanvang dienstverband: 1ste kwartaal 2012
Inlichtingen Maarten Marx (maartenmarx@uva.nl)
Hoe te solliciteren?

3 Clarin projects at ILPS

Geplaatst op 16-12-2011 door Maarten Marx | Uncategorized | | comment image Geen reacties »

The ILPS group at the UvA participates in 3 awarded Clarin grants. Each project is a cooperation between researchers from the humanities and computer science. The ILPS group received funding for 26.5 person months in total.

  • BILAND Towards a flexible and stable CLARIN-supported web-application for bilingual historical analysis of discourses in news media. Utrecht-University, ILPS-UvA, and others.
  • Namescape Mapping the Landscape of Names in Modern Dutch Literature.
    Huygens/ING, INL/Leiden, ILPS-UvA.
  • Verrijkt Koninkrijk Creating a digital version of Loe de Jong’s Het Koninkrijk der Nederlanden in de Tweede Wereldoorlog. NIOD, ILPS-UvA, VU, Meertens.

Alessandro Facchini wins the 2011 Paul Bernays Award

Geplaatst op 24-11-2011 door Maarten Marx | Uncategorized | | comment image Geen reacties »

The 2011 Paul Bernays Award is awarded by the Swiss Society for Logic and Philosophy of Science and sponsored by the Swiss Academy of Sciences. It awards a young researcher for an outstanding contribution in the area of logic and philosophy of science. Alessandro won the price with his dissertation: “A study on the expressive power of some fragments of the modal mu-calculus”. More information can be found at http://www.sslps.unibe.ch/Bernays.html.

Alessandro Facchini recently joined the UvA as a postdoc on the Foundations of XML project. He is currently working with Evgeny Sherkonov, Yoichi Hirai and Maarten Marx on extensions of Tree patterns with second order operators like the Kleene star.

Linguistic Inquiry and Word Count (LIWC) and PoliticalMashup

Geplaatst op 24-11-2011 door Maarten Marx | Uncategorized | | comment image Geen reacties »

The NRC of 2011-10-29 contained an
interview with James Pennebaker about his Linguistic Inquiry and Word Count (LIWC) text analysis program. In contrast to other text analytics does LIWC focus on the use of common function words like pronouns.
LIWC has been used to analyse a range of data, including political speeches (of American presidents).
An interesting aspect is that LIWC is translated into 10 languages, among them Dutch.
This makes a diachronic comparative study with LIWC of the parliamentary proceedings within the PoliticalMashup corpus possible. A nice start would be to work on the two largest parallel corpora: UK and NL from 1935 to 1995.

Links

PhD position Data integration

Geplaatst op 07-11-2011 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

The ILPS group of the Informatics Institute at the University of Amsterdam has a fully funded PhD position (4 years) on the topic of Data integration and exchange, knowledge base integration and schema mappings.
The PhD position is funded through the EU FP7 ENVRI project, which aims to facilitate sharing and reuse of data among environmental research institutions.
More information

| lees verder…

Succinct summaries of narrative events using social networks

Geplaatst op 29-09-2011 door Maarten Marx | Uncategorized | | comment image Geen reacties »

Paper published at the ACM Hypertext 2011 conference.

Abstract
This paper addresses the following research aim: provide a useful but succinct summary of long narrative events involving the interaction of several speakers. The summary should enable users to navigate to specific parts of the event using hyperlinks.

Our solution is based on a representation of the main actors of the event and their interactions as a social network. The solution is applicable to events in which these interactions are more or less formally structured and detectable. This includes theatre and radio plays, recordings of a scientific workshop, proceedings of parliament and meetings notes in general.

Reference
Bart de Goede, Maarten Marx, Arjan Nusselder, and Justin van Wees. 2011. Succinct summaries of narrative events using social networks. In Proceedings of the 22nd ACM conference on Hypertext and hypermedia (HT ’11). ACM, New York, NY, USA, 299-304. DOI=10.1145/1995966.1996005 http://doi.acm.org/10.1145/1995966.1996005

« eerdere stukken latere stukken »