KB kranten bij PoliticalMashup

Geplaatst op 12-08-2014 door Maarten Marx | data, Political Mashup | tags: , | Geen reacties »

Het KB kranten archief is een belangrijk corpus dat gebruikt wordt binnen het PoliticalMashup project.
In dat project zijn twee “zoekmachines” gemaakt waarmee dat archief bevraagd kan worden:

  1. Zoeken met reguliere expressies.
    Hier kan je zoeken in een gestratificeerde steekproef (rond de 8000 artikelen).
  2. KB ngram viewer

We hebben de krantenartikelen in een eigen XML formaat gegoten waarin de metadata en de tekst data van elk artikel overzichtelijk bij elkaar staan. De steekproef is hier op te halen. De XML valideert met betrekking tot het schema op http://schema.politicalmashup.nl/kbpaper/kbpaper-schema.rnc. Dit schema is ook beschikbaar in een meer leesbare HTML versie.

Code van KB ngram viewer

Neem contact op met Maarten Marx of Dispectu.com.

Dutch parliamentary data in RDF format

Geplaatst op 12-08-2014 door Maarten Marx | data, DiLiPaD, ExPoSe, Political Mashup | tags: , | Geen reacties »

The Dutch parliamentary data created by PoliticalMashup is now also available in RDF format, and can be queried from a SPARQL endpoint.
The dataset is enriched with recognized named entities which are linked to DBpedia and Wikipedia.
More information can be found in the ParlBench paper and this description of a benchmark experiment.

Note

The sparql endpoint only contains 1% of all data. If you want to query the data using sparql you must download it and load it in your own endpoint. Below is a short description how to do that.

Links

| lees verder…

Advances in Modal Logic

Geplaatst op 12-08-2014 door Maarten Marx | Uncategorized | | Geen reacties »

Maarten Marx presents a joint paper at Advances in Modal Logic (AiML) 2014.

Cooperation

DiLiPaD’s Dutch principal investigators Jaap Kamps and Maarten Marx collaborate with the Information Office of the Dutch House of Commons, the Dutch Royal Library, the Dutch National Archive, the Dutch Documentation Centre for Political Parties, and scientists from the Humanities, Social and Computer Sciences.

Linking Hansards to related newsarticles

Geplaatst op 15-04-2014 door Maarten Marx | DiLiPaD, ExPoSe, ODE, parliament | tags: | Geen reacties »

We describe a simple technique with which to link news articles to debates in Parliament.
The technique uses the news search engine EMM Newsexplorer.
As search strings we use

  • the date of the debate
  • the speakers
  • the first ten words from a unigram parsimonious language model created from the debate

Results on oral questions are promising. In this post we explain how we find the relevant news articles, evaluate the results. Code is provided.
| lees verder…

War in Parliament: What a Digital Approach Can Add to the Study of Parliamentary History

Geplaatst op 15-04-2014 door Maarten Marx | resultaten | tags: , | Geen reacties »

Het artikel War in Parliament: What a Digital Approach Can Add to the Study of Parliamentary History van Hinke Piersma, Ismee Tames (beide NIOD), Lars Buitinck, Johan van Doornik en Maarten Marx (alle Informatics Institute, UvA) is verschenen in Digital Humanities Quarterly.
| lees verder…

Leren classificeren van verkiezingsprogrammas

Geplaatst op 15-04-2014 door Maarten Marx | DiLiPaD, Political Mashup, resultaten | tags: | Geen reacties »

Het artikel Automatic thematic classification of election manifestos van Suzan Verbernea, Eva D’hondt, Antal van den Bosch en Maarten Marx is verschenen in Information Processing & Management (Volume 50, Issue 4, July 2014, Pages 554–567).
| lees verder…

« eerdere stukken