Job Opening: Postdoc or senior scientific programmer

Geplaatst op 30-01-2012 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

The ILPS group at the Informatics Institute of the University of Amsterdam (UvA) has an opening for a postdoc or senior scientific programmer in the ‘Namescape’ project.

We are looking for someone with a background in computational liguistics or AI, with an affinity for literature and the Dutch language.
The project is a collaboration with the Hygens institute for Dutch History and the Institute for Dutch Lexicology (INL) and financed by Clarin-NL. The research concerns the use of named entities within Dutch literature. The aim is to extend a manual pilot project on 20 novels to a fully automatic analysis of a corpus of almost 9000 digitized modern Dutch novels. The project involves named entity recognition, special classification (real vs fictional entities), entity deduplication and modelling co-occurrence of entities.

The project runs for 1 year. For more information, see the research proposal.

Profile: Background in computational linguistics or AI. Experience with Linux, NLP and XML technology.
Level Postdoc or scientific programmer. Salary (depending on education and work experience) between €2.379 and €3.195 a month (before taxes).
Duration 1 year
Start March, April 2012
Information Maarten Marx (maartenmarx@uva.nl)
How to apply?

Vacature Wetenschappelijk Programmeur

Geplaatst op 24-01-2012 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

Binnen de PoliticalMashup groep aan de UvA is er een vacature voor een wetenschappelijk programmeur binnen het project ‘Namescape’.

Dit project wordt in samenwerking met het Huygens Instituut en het Instituut voor Nederlandse Lexicologie (INL-Leiden) uitgevoerd en is gefinancierd door Clarin III. Het onderzoek binnen het project gaat over het gebruik van namen (named entities) in Nederlandstalige literatuur. Dit onderzoek is gestart door Karina van Dalen van het Huygens. Zij heeft een voorbereidende handmatige pilotstudie gedaan dat in dit project groot en zoveel mogelijk automatisch wordt voortgezet.
Het INL heeft een corpus van meer dan 500 Nederlandstalige romans en gaat daarin de named entities herkennen en classificeren. De UvA zal zich bezig houden met een extra verfijning van de categorisering naar fictieve en echte entiteiten, deduplicatie van gevonden entiteiten, het verbinden van de gevonden entiteiten met Wikipedia en met het opzetten van een analyse en visualisatie omgeving. De visualisaties maken gebruik van de barcode browser techniek ontwikkeld aan de UvA en een combinatie van netwerk visualisaties met woordenwolken. De analyse omgeving zal bestaan uit een XML database systeem (eXist) met XQuery support.
Met deze analyse omgeving zal het Huygens het gebruik van namen in de 500 geannoteerde romans gaan onderzoeken.
Het project levert het volgende op:

  • een verrijkte publicatie over het naamgebruik in Nederlandstalige literatuur (Huygens,INL,UvA);
  • een webapplicatie waarin men een Nederlandstalige roman in PDF formaat kan inladen waarin dan vervolgens de named entities worden herkend en verbonden met Wikipedia (INL);
  • een webgebaseerde analyse omgeving waarin men het naamgebruik in de 500 romans kan onderzoeken (UvA);
  • per roman, een visualisatie van het colocatie netwerk van de genoemde entiteiten (Huygens, UvA).

De looptijd van het project bedraagt 1 jaar. Voor verdere informatie over het project zie het onderzoeksvoorstel (samenvatting).

Profiel: Achtergrond in computationele linguistiek, kunstmatige intelligentie of informatica. Affiniteit met de Nederlandse taal. Ervaring met Linux, XML (XQuery en/of XSLT) en werken met tekstuele data.
Niveau Wetenschappelijk programmeur of Postdoc. Het salaris bedraagt, afhankelijk van opleiding en werkervaring, minimaal €2.379 en maximaal €3.195 bruto per maand (maximaal salarisschaal 10.7 van de CAO Nederlandse Universiteiten) bij volledige werktijd.
Dienstverband: 1 jaar .75 fte (kan in overleg ook anders ingevuld).
Aanvang dienstverband: 1ste kwartaal 2012
Inlichtingen Maarten Marx (maartenmarx@uva.nl)
Hoe te solliciteren?

Interruptiedata geanalyseerd door Sargasso

Geplaatst op 05-01-2012 door Maarten Marx | data, resultaten | tags: | comment image Geen reacties »

Dimitri Tokmetzis van Sargasso heeft de interruptiedata van het eerste jaar Rutte I genanalyseerd en er twee mooie verhalen over geschreven. Alper Çugun van het datavisualisatiebureau Monster Swell heeft er een fraaie interactieve visualisatie van gemaakt. Zie