Geplaatst op 28-05-2013 door Maarten Marx |
Uncategorized | |
Geen reacties »
Met de komende fusie tussen de twee beta faculteiten is het aardig om na te gaan hoeveel samenwerking er al is tussen wetenschappers aan beide kanten van de stad.
Een mooie maat voor samenwerking is het co-auteursschap: samen een artikel of een boek schrijven. We bekijken dit hier voor informatica, gebruik makend van de DBLP database, en een lijst met stafleden beschikbaar gesteld door Maarten van Steen.
De data is beschikbaar op Google Fusion Tables.
Onderstaand netwerk plaatje is wat Google Fusion Tables ervan maakt waarbij de relatie gewogen wordt door het “co-auteursgewicht”. Dit is voor 2 auteurs de som voor al hun gedeelde werken van 2 gedeeld door het aantal co-auteurs van dat werk.
We hebben een hele simpele analyse gedraaid: wat zijn de componenten in het coauteursnetwerk waarbij een lijn pas meetelt als die waarde 1 of meer heeft (dus de 2 auteurs moeten minimaal 1 artikel met z’n tweeen hebben geschreven, of 2 artikelen met 3 of 4 auteurs, of…)?
We vinden er dan 7. Hier komen ze, aflopend gerangschikt naar hun grootte.
15 ['Cees Snoek', 'Patricia Lago', 'Frank Nack', 'Pieter De Leenheer', 'Marcel Worring', 'Jaap Gordijn', 'Hans van Vliet', 'Rein van den Boomgaard', 'Guus Schreiber', 'Theo Gevers', 'Lora Aroyo', 'Hans Akkermans', 'Lynda Hardman', 'Dennis Koelma', 'Leo Dorst']
12 ['Andrew S. Tanenbaum', 'Rutger F. H. Hofman', 'A. E. Eiben', 'Herbert Bos', 'Thilo Kielmann', 'Evert Haasdijk', 'Maarten van Steen', 'Arno Bakker', 'Paul Klint', 'Chris Verhoef', 'Spyros Voulgaris', 'Wan Fokkink']
11 ['Stefan Schlobach', 'Mark Hoogendoorn', 'Annette ten Teije', 'Lourens van der Meij', 'Maarten de Rijke', 'Frank van Harmelen', 'Shimon Whiteson', 'Christof Monz', 'Maarten Marx', 'Jan Treur', 'Tibor Bosse']
11 ['Cees de Laat', 'Drona Kandhai', 'Paola Grosso', 'Jaap A. Kaandorp', 'Peter M. A. Sloot', 'Adam Belloum', 'Robert J. Meijer', 'Robert G. Belleman', 'Hamideh Afsarmanesh', 'Marian Bubak', 'Alfons G. Hoekstra']
3 ['Piet Rodenburg', 'Alban Ponse', 'Inge Bethke']
2 ['Peter A. Boncz', 'Martin L. Kersten']
2 ['Jaap Heringa', 'Gunnar W. Klau']
Geplaatst op 02-05-2013 door Maarten Marx |
Uncategorized | |
Geen reacties »
Het demonstratie artikel over de Politieke Ngram Viewer geschreven door Bart de Goede, Justin van Wees en Maarten Marx heeft de best demonstration award op DIR 2013 gewonnen.
Bart de Goede, Justin van Wees, Maarten Marx (2013). PoliticalMashup Ngramviewer. Proc. Dutch Belgium Information Retrieval (DIR 2013).
| lees verder…
Geplaatst op 29-04-2013 door Maarten Marx |
Uncategorized | |
Geen reacties »
Victor de Boer heeft als hoofdauteur een artikel geschreven over het Loe de Jong Digitaalproject, dat NIOD, UvA en VU gezamelijk hebben uitgevoerd in het kader van Clarin 3. Victor presenteert het op de KCAP 2013 (International Conference on Knowledge Capture) conferentie, deze zomer in Banff, Canada.
Geplaatst op 28-06-2012 door Maarten Marx |
Uncategorized | |
Geen reacties »
PoliticalMashup heeft haar rijk geannoteerde versie van de Handelingen der Staten Generaal als dataset gedeponeerd in DANS EASY. De dataset bestaat uit 3 onderdelen:
- Alle verslagen van de vergaderingen in de Eerste en Tweede Kamer van 1814 tot April 2012.
Ga naar de zoekmachine.
- Biografie data voor elk persoon die ooit in de Staten Generaal gesproken heeft. Voorbeeld: van Thiel
- Biografie data van elke partij die ooit in de Staten Generaal vertegenwoordigd is geweest. Voorbeeld: KVP
| lees verder…
Geplaatst op 13-04-2012 door Maarten Marx |
Uncategorized | |
Geen reacties »
Donderdag 12 April heeft een groep burgers 5 aanbevelingen voor een Open Tweede Kamer aan Gerdi Verbeet overhandigd. PoliticalMashup heeft mee geschreven aan deze aanbevelingen en Arjan Nusselder was erbij.
Geplaatst op 10-04-2012 door Maarten Marx |
Uncategorized | |
Geen reacties »
Hier staat het materiaal dat hoort bij de lezing van Maarten Marx op 11 April 2012 voor de derdejaars Politicologie aan de Universiteit Leiden.
| lees verder…
Geplaatst op 13-03-2012 door Maarten Marx |
Uncategorized | |
Geen reacties »
PoliticalMashup probeert de uitslag en de stemverdeling van de stemmingen over moties, amendementen en wetsontwerpen uit de Handelingen te halen. Dit wordt weer gebruikt door de Tweede Kamer, sites als politix.nl en politicologen.
Dit gaat aardig goed omdat de voorzitter de uitslag van de stemmingen met behulp van een aantal vaste formules aangeeft.
Maar soms wordt er tijdens de vergadering gezegd dat de voorzitter een foutje heeft gemaakt. De stemming wordt dan echter niet in de Handeling verbeterd. Zowel voor mensen als voor computers is het op deze manier erg moeilijk om gegarandeerd de juiste stemming uit de tekst op te maken.
| lees verder…
Geplaatst op 06-02-2012 door Maarten Marx |
Uncategorized | |
1 reactie »
De volgende bijdrage is geschreven door de mensen achter politix.nl.
Waar stemmen ze nou op?
Ook benieuwd naar wat de partijen van de Tweede Kamer doen met hun verkiezingsprogramma’s? Of ze zich houden aan de voornemens en beloften? Blijven de partijen trouw aan hun idealen, sluiten ze compromissen of verliezen ze hun ideeën helemaal uit het oog? Blijven de linkse partijen links, of vertonen ze gaandeweg wat liberale trekjes? En zijn de rechtse partijen in de afgelopen kabinetsperiode sociale geworden, of juist niet? Al deze zaken worden duidelijk in het stemgedrag van de partijen. Nieuwsgierige personen kunnen op de sites van officiëlebekendmakingen.nl en tweedekamer.nl wel zien wanneer er waarover gestemd is, maar een overzicht van al deze stemmingen ontbreekt. Om hier meer duidelijkheid over te krijgen, brengt Politix het stemgedrag van onze volksvertegenwoordigers op partijniveau in kaart.
| lees verder…
Geplaatst op 30-01-2012 door Maarten Marx |
Uncategorized | tags:
job opening |
Geen reacties »
The ILPS group at the Informatics Institute of the University of Amsterdam (UvA) has an opening for a postdoc or senior scientific programmer in the ‘Namescape’ project.
We are looking for someone with a background in computational liguistics or AI, with an affinity for literature and the Dutch language.
The project is a collaboration with the Hygens institute for Dutch History and the Institute for Dutch Lexicology (INL) and financed by Clarin-NL. The research concerns the use of named entities within Dutch literature. The aim is to extend a manual pilot project on 20 novels to a fully automatic analysis of a corpus of almost 9000 digitized modern Dutch novels. The project involves named entity recognition, special classification (real vs fictional entities), entity deduplication and modelling co-occurrence of entities.
The project runs for 1 year. For more information, see the research proposal.
Profile: Background in computational linguistics or AI. Experience with Linux, NLP and XML technology.
Level Postdoc or scientific programmer. Salary (depending on education and work experience) between €2.379 and €3.195 a month (before taxes).
Duration 1 year
Start March, April 2012
Information Maarten Marx (maartenmarx@uva.nl)
How to apply?
Geplaatst op 24-01-2012 door Maarten Marx |
Uncategorized | tags:
vacature |
Geen reacties »
Binnen de PoliticalMashup groep aan de UvA is er een vacature voor een wetenschappelijk programmeur binnen het project ‘Namescape’.
Dit project wordt in samenwerking met het Huygens Instituut en het Instituut voor Nederlandse Lexicologie (INL-Leiden) uitgevoerd en is gefinancierd door Clarin III. Het onderzoek binnen het project gaat over het gebruik van namen (named entities) in Nederlandstalige literatuur. Dit onderzoek is gestart door Karina van Dalen van het Huygens. Zij heeft een voorbereidende handmatige pilotstudie gedaan dat in dit project groot en zoveel mogelijk automatisch wordt voortgezet.
Het INL heeft een corpus van meer dan 500 Nederlandstalige romans en gaat daarin de named entities herkennen en classificeren. De UvA zal zich bezig houden met een extra verfijning van de categorisering naar fictieve en echte entiteiten, deduplicatie van gevonden entiteiten, het verbinden van de gevonden entiteiten met Wikipedia en met het opzetten van een analyse en visualisatie omgeving. De visualisaties maken gebruik van de barcode browser techniek ontwikkeld aan de UvA en een combinatie van netwerk visualisaties met woordenwolken. De analyse omgeving zal bestaan uit een XML database systeem (eXist) met XQuery support.
Met deze analyse omgeving zal het Huygens het gebruik van namen in de 500 geannoteerde romans gaan onderzoeken.
Het project levert het volgende op:
- een verrijkte publicatie over het naamgebruik in Nederlandstalige literatuur (Huygens,INL,UvA);
- een webapplicatie waarin men een Nederlandstalige roman in PDF formaat kan inladen waarin dan vervolgens de named entities worden herkend en verbonden met Wikipedia (INL);
- een webgebaseerde analyse omgeving waarin men het naamgebruik in de 500 romans kan onderzoeken (UvA);
- per roman, een visualisatie van het colocatie netwerk van de genoemde entiteiten (Huygens, UvA).
De looptijd van het project bedraagt 1 jaar. Voor verdere informatie over het project zie het onderzoeksvoorstel (samenvatting).
Profiel: Achtergrond in computationele linguistiek, kunstmatige intelligentie of informatica. Affiniteit met de Nederlandse taal. Ervaring met Linux, XML (XQuery en/of XSLT) en werken met tekstuele data.
Niveau Wetenschappelijk programmeur of Postdoc. Het salaris bedraagt, afhankelijk van opleiding en werkervaring, minimaal €2.379 en maximaal €3.195 bruto per maand (maximaal salarisschaal 10.7 van de CAO Nederlandse Universiteiten) bij volledige werktijd.
Dienstverband: 1 jaar .75 fte (kan in overleg ook anders ingevuld).
Aanvang dienstverband: 1ste kwartaal 2012
Inlichtingen Maarten Marx (maartenmarx@uva.nl)
Hoe te solliciteren?