Vacature Wetenschappelijk Programmeur

Geplaatst op 24-01-2012 door Maarten Marx | Uncategorized | tags: | comment image Geen reacties »

Binnen de PoliticalMashup groep aan de UvA is er een vacature voor een wetenschappelijk programmeur binnen het project ‘Namescape’.

Dit project wordt in samenwerking met het Huygens Instituut en het Instituut voor Nederlandse Lexicologie (INL-Leiden) uitgevoerd en is gefinancierd door Clarin III. Het onderzoek binnen het project gaat over het gebruik van namen (named entities) in Nederlandstalige literatuur. Dit onderzoek is gestart door Karina van Dalen van het Huygens. Zij heeft een voorbereidende handmatige pilotstudie gedaan dat in dit project groot en zoveel mogelijk automatisch wordt voortgezet.
Het INL heeft een corpus van meer dan 500 Nederlandstalige romans en gaat daarin de named entities herkennen en classificeren. De UvA zal zich bezig houden met een extra verfijning van de categorisering naar fictieve en echte entiteiten, deduplicatie van gevonden entiteiten, het verbinden van de gevonden entiteiten met Wikipedia en met het opzetten van een analyse en visualisatie omgeving. De visualisaties maken gebruik van de barcode browser techniek ontwikkeld aan de UvA en een combinatie van netwerk visualisaties met woordenwolken. De analyse omgeving zal bestaan uit een XML database systeem (eXist) met XQuery support.
Met deze analyse omgeving zal het Huygens het gebruik van namen in de 500 geannoteerde romans gaan onderzoeken.
Het project levert het volgende op:

  • een verrijkte publicatie over het naamgebruik in Nederlandstalige literatuur (Huygens,INL,UvA);
  • een webapplicatie waarin men een Nederlandstalige roman in PDF formaat kan inladen waarin dan vervolgens de named entities worden herkend en verbonden met Wikipedia (INL);
  • een webgebaseerde analyse omgeving waarin men het naamgebruik in de 500 romans kan onderzoeken (UvA);
  • per roman, een visualisatie van het colocatie netwerk van de genoemde entiteiten (Huygens, UvA).

De looptijd van het project bedraagt 1 jaar. Voor verdere informatie over het project zie het onderzoeksvoorstel (samenvatting).

Profiel: Achtergrond in computationele linguistiek, kunstmatige intelligentie of informatica. Affiniteit met de Nederlandse taal. Ervaring met Linux, XML (XQuery en/of XSLT) en werken met tekstuele data.
Niveau Wetenschappelijk programmeur of Postdoc. Het salaris bedraagt, afhankelijk van opleiding en werkervaring, minimaal €2.379 en maximaal €3.195 bruto per maand (maximaal salarisschaal 10.7 van de CAO Nederlandse Universiteiten) bij volledige werktijd.
Dienstverband: 1 jaar .75 fte (kan in overleg ook anders ingevuld).
Aanvang dienstverband: 1ste kwartaal 2012
Inlichtingen Maarten Marx (maartenmarx@uva.nl)
Hoe te solliciteren?

Reageer

Je moet ingelogd zijn om te kunnen reageren.