War in Parliament: What a Digital Approach Can Add to the Study of Parliamentary History

Geplaatst op 15-04-2014 door Maarten Marx | resultaten | tags: , | comment image Geen reacties »

Het artikel War in Parliament: What a Digital Approach Can Add to the Study of Parliamentary History van Hinke Piersma, Ismee Tames (beide NIOD), Lars Buitinck, Johan van Doornik en Maarten Marx (alle Informatics Institute, UvA) is verschenen in Digital Humanities Quarterly.
| lees verder…

Leren classificeren van verkiezingsprogrammas

Geplaatst op 15-04-2014 door Maarten Marx | DiLiPaD, Political Mashup, resultaten | tags: | comment image Geen reacties »

Het artikel Automatic thematic classification of election manifestos van Suzan Verbernea, Eva D’hondt, Antal van den Bosch en Maarten Marx is verschenen in Information Processing & Management (Volume 50, Issue 4, July 2014, Pages 554–567).
| lees verder…

Kranten door de tijd

Geplaatst op 25-10-2013 door Maarten Marx | Political Mashup, resultaten | tags: , | comment image Geen reacties »

PoliticalMashup heeft een applicatie ontwikkeld waarmee de relatieve frequentie van woorden of frases per jaar in de kranten collectie van de Koninklijke Bibliotheek eenvoudig zichtbaar wordt gemaakt.

KB historische kranten ngram viewer.

Spellingshervormingen zijn mooi terug te zien, bijvoorbeeld met de twee zoekvragen ‘regering’ en ‘regeering’.

Zoeken met de gebruikte zoektermen in de kranten van een bepaald jaar kan door te klikken op het bolletje in de grafiek boven dat jaar.

Suzan Verberne op eHumanities workshop

Geplaatst op 11-06-2013 door Maarten Marx | Political Mashup, resultaten | tags: | comment image Geen reacties »

Suzan Verberne presenteert haar werk over het leren classificeren van verkiezingsprogrammas op de Soeterbeeck eHumanities workshop op 13 en 14 Juni, 2013.

Links

| lees verder…

Zoeken naar 2 clubs

Geplaatst op 09-08-2012 door Maarten Marx | research, resultaten | tags: | comment image Geen reacties »

Netwerken bevatten behalve individuen ook groepjes die interresant kunnen zijn. Zo heb je klieks, deelgroepjes waarin iedereen met iedereen verbonden is. Echter die komen niet zo veel voor. Naast klieks bestaan er ook clubs en clans, begrippen geintroduceerd door Rob Mokken, een van Nederderlands nestors op het gebied van het analyseren van netwerken.

Een 2-club binnen een netwerk is een maximaal deel van dat netwerk waarin iedereen of direct met elkaar verbonden is (als in een kliek), of minstens 1 gemeenschappelijke “vriend” heeft.

Het vinden van de grootste 2-club binnen een netwerk is een NP-volledig probleem. Dit zijn problemen die we met de huidige kennis in het algemeen niet snel kunnen oplossen.
Het gebied van de kunstmatige intelligentie (AI) houdt zich precies bezig met het toch proberen op te lossen van dit soort hele moeilijke problemen. Steven Laan, een derde jaars student AI heeft zijn Bacehelor scriptie over dit onderwerp geschereven.

De scriptie is hieronder beschikbaar, samen met een aantal data sets en de 2-clubs die daar inzitten.

Verkiezingsprogrammas van Lipschits Digitaal

Geplaatst op 08-05-2012 door Maarten Marx | data, parliament, Political Mashup, resultaten | tags: | comment image Geen reacties »

PoliticalMashup heeft samen met het DNPP de bundels verkiezingsprogrammas gemaakt door Isaac Lipschits gedigitaliseerd. Het DNPP heeft de boeken ingescand en geOCRed. Suzan Verberne heeft de teksten vervolgens omgezet naar een uitgebreid XML formaat.
In deze blogpost laten we zien wat je daar dan mee kan. Om te beginnen een verkiezingsthemawolk van de VVD uit 1998. Hierin staan alle onderwerpen die volgens Lipschits minstens 2 maal in het programma van de VVD aan bod kwamen. De top tien bestaat inderdaad uit typische VVD onderwerpen.

werkgelegenheid:16
 Europese_samenwerking:12
 milieubeleid:11
 belastingen_algemeen:11
 onderwijs:11
 economische_groei:9
 gezondheidszorg:9
 criminaliteits_bestrijding:9
 loon-_en_inkomensbeleid:8
 gemeentelijk_bestuur_en_beleid:8


| lees verder…

Weer veel missende Handelingen

Geplaatst op 07-03-2012 door Maarten Marx | data, parliament, resultaten | | comment image Geen reacties »

Update Het hieronder beschreven onderzoek is verricht op 14 Februari naar aanleiding van een blogpost op 2 Februari over de missende Algemene Beschouwing van 2011. Toen waren alle stukken die hieronder genoemd zijn er niet. Ondertussen (2012-03-07) zijn ze er allemaal gelukkig wel.

Ook dit parlementaire jaar is het weer moeilijk om een volledig overzicht van alle verslagen uit de Tweede Kamer (de zogenaamde Handelingen) te verkrijgen.
Die worden normaal gesproken ongeveer drie weken na het debat gepubliceerd op de internet site van de overheid: overheid.nl. Deze site noemt zichtzelf

De betrouwbare bron voor informatie en dienstverlening van de overheid.

Onderstaande tabel laat zien dat er sinds de laatste Prinsjesdag 8 dagen ontbreken. Hieronder zitten belangrijke debatten als het antwoord van Premier Rutte tijdens de Algemene Beschouwingen.
| lees verder…

Interruptiedata geanalyseerd door Sargasso

Geplaatst op 05-01-2012 door Maarten Marx | data, resultaten | tags: | comment image Geen reacties »

Dimitri Tokmetzis van Sargasso heeft de interruptiedata van het eerste jaar Rutte I genanalyseerd en er twee mooie verhalen over geschreven. Alper Çugun van het datavisualisatiebureau Monster Swell heeft er een fraaie interactieve visualisatie van gemaakt. Zie

Dataontsluiting met XML, XQuery en XSLT

Geplaatst op 18-11-2011 door Maarten Marx | eXist, resultaten, XML, XPath, xquery, xslt | | comment image Geen reacties »

Anne Schuth en Maarten Marx hebben een artikel geschreven voor de <!ELEMENT, het blad van de XML Holland user-groep. Het artikel laat zien hoe je met gebruikmaking van alleen maar XML technologie een volledige applicatie kan bouwen. In het artikel wordt het voorbeeld van een video zoekmachine helemaal uitgewerkt.

  • Link naar het artikel
  • Anne Schuth and Maarten Marx, Dataontsluiting met XML, XQuery en XSLT. <!ELEMENT Vol 17, Nr 2, p. 21-25, 2011.

Quality of the XML web

Geplaatst op 04-08-2011 door Maarten Marx | research, resultaten, XML | | comment image Geen reacties »

A paper on the quality of the XML files found on the web will be published in the proceedings of the 2011 ACM Conference on Information and Knowledge Management (CIKM).

Abstract

We collect evidence to answer the following question: Is the quality of the XML documents found on the web sufficient to apply XML technology like XQuery, XPath and XSLT? XML collections from the web have been previously studied statistically, but no detailed information about the quality of the XML documents on the web is available to date. We address this shortcoming in this study. We gathered 180K XML documents from the web. Their quality is surprisingly good; 85.4% is well-formed and 99.5% of all specified encodings is correct. Validity needs serious attention. Only 25% of all files contain a reference to a DTD or XSD, of which just one third is actually valid. Errors are studied in detail. Automatic error repair seems promising. Our study is well documented and easily repeatable. This paves the way for a periodic quality assessment of the XML web.
The full paper and all data are publicly available at the url http://data.politicalmashup.nl/xmlweb.

« eerdere stukken