<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>

<channel>
	<title>Political Mashup</title>
	<atom:link href="http://politicalmashup.nl/feed/" rel="self" type="application/rss+xml" />
	<link>http://politicalmashup.nl</link>
	<description></description>
	<pubDate>Tue, 18 Jun 2013 10:32:38 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6.1</generator>
	<language>en</language>
			<item>
		<title>De Tweede Kamer in 2012-2013</title>
		<link>http://politicalmashup.nl/2013/06/de-tweede-kamer-in-2012-2013/</link>
		<comments>http://politicalmashup.nl/2013/06/de-tweede-kamer-in-2012-2013/#comments</comments>
		<pubDate>Mon, 17 Jun 2013 11:50:54 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[data]]></category>

		<category><![CDATA[parliament]]></category>

		<category><![CDATA[Tweede Kamer]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2053</guid>
		<description><![CDATA[We geven een overzicht van het afgelopen politieke jaar op basis van de Handelingen van de Tweede Kamer. We richten ons daarbij  op 2 dingen: hoe succesvol zijn afzonderlijke politici in het maken of veranderen van beleid (via moties en amendementen), en hoeveel aandacht geven en ontvangen ze in de Tweede Kamer?
Alle gegevens die [...]]]></description>
			<content:encoded><![CDATA[<p>We geven een overzicht van het afgelopen politieke jaar op basis van de Handelingen van de Tweede Kamer. We richten ons daarbij  op 2 dingen: hoe succesvol zijn afzonderlijke politici in het maken of veranderen van beleid (via moties en amendementen), en hoeveel aandacht geven en ontvangen ze in de Tweede Kamer?</p>
<p>Alle gegevens die we gebruiken zijn automatisch door computers  uit de Handelingen gehaald met behulp van <em>text mining</em>. Hieronder geven we die gegevens in  spreadsheet formaat. </p>
<p>Deze gegevens zijn gebruikt voor het overzichtsartikel over het afgelopen politieke jaar in de Vrij Nederland van 20 Juni, geschreven door Jaco Alberts en Thijs Broer.</p>
<p>De analyses zijn gedaan op 6 en 7 Juni 2013. Op dat moment waren via overheid.nl de Handelingen tot en met   zitting 68 (28 Maart 2013) beschikbaar.</p>
<h3>Voorbeeld: aantal interrupties</h3>
<p>Onderstaande grafiek laat het totaal aantal interrupties per persoon zien. De blauwe lijn geeft het aantal gepleegde interrupties, de rode het aantal ontvangen interrupties. Hier tonen we de 20 politici die het meest interrumpeerden. We zien dat Pechtold het meeste aandacht geeft. Hij ontvangt zelf echter relatief weinig aandacht. Het geven en ontvangen van aandacht is het meest in evenwicht in deze top 20 bij <a href='http://www.tweedekamer.nl/kamerleden/alle_kamerleden/verhoeven_kees/index.jsp'>Kees Verhoeven</a>.<br />
De omgekeerde tabel, met de mensen met de langste rode lijn, wordt aangevoerd door Rutte.<br />
Al dit soort grafieken zijn zelf te maken. Links naar de data staan hieronder.<br />
<iframe width="500" height="300" scrolling="no" frameborder="no" src="https://www.google.com/fusiontables/embedviz?containerId=gviz_canvas&amp;q=select+col1%2C+col4%2C+col7+from+1ZC28OMdu81rMch1hR3AUrV3pspkVIu82msIEy8Y+order+by+col4+desc+limit+20&amp;viz=GVIZ&amp;t=BAR&amp;uiversion=2&amp;gco_forceIFrame=true&amp;gco_hasLabelsColumn=true&amp;width=500&amp;height=300"></iframe></p>
<h3>Downloads</h3>
<p>De meeste spreadsheets staan op Google Fusiontables. Alleen het overzicht van de stemmingen is hier als gzipped csv bestand aangehangen.</p>
<ul>
<li><a href='https://www.google.com/fusiontables/data?docid=1MKbOkKyASChV8eR3d7VjGcAz0NnbM_s1gszqxgE#rows:id=1'>Amendementen per persoon</a></li>
<li><a href='https://www.google.com/fusiontables/DataSource?docid=1cD9POIW9EnsKB82vIhJlxIratcomCG4gRELNJs4#rows:id=1'>Moties per persoon</a></li>
<li><a href='https://www.google.com/fusiontables/DataSource?docid=1ZC28OMdu81rMch1hR3AUrV3pspkVIu82msIEy8Y#rows:id=1'>Interrupties per persoon, 2012-2013</a></li>
<li><a href='https://www.google.com/fusiontables/DataSource?docid=1x0NDmgWPxyUeD_vlatWHT6GGE7_sVPDnYq48Bu0#rows:id=1'>Interrupties per persoon, 2011-2012</a></li>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/06/votescsv.gz'>votes.csv.gz</a></li>
</ul>
<p><span id="more-2053"></span></p>
<h3>Uitleg bij de interruptie spreadsheets</h3>
<p><strong>Uitleg met een voorbeeld</strong> Bekijk Wilders in de twee vergaderjaren. <br/><br />
            Wilders had in 2011-12  19 scenes (in Den Haag &#8220;blokken&#8221; genoemd: hij spreekt dan vanaf het spreekgestoelte). In 15 daarvan werd hij onderbroken, door in totaal 15 verschillende personen. In die 19 scenes is hij in totaal 174 keer onderbroken. Dus hij kreeg gemiddeld per keer dat hij op de spreekstoel stond 9 keer aandacht.<br />
Vergelijk je dat met 2012-2013, dan zie je dat hij 14 scenes heeft, waarvan er in maar 3 is geinterrumpeerd, alleen door Pechtold, en dat in totaal 12 keer. Dus minder dan 1 keer aandacht per spreekbeurt.<br />
Bij Samson zie je het tegenovergestelde gebeuren.</p>
<p> <strong> Uitleg per veld:</strong></p>
<p>  interruptions-total X: MEMBER heeft X speeches in een scene van iemand anders</p>
<p>  interruptions-unique X: MEMBER heeft in X verschillende scenes van iemand anders een speech</p>
<p>  interruptions-unique-persons X: MEMBER heeft speeches in scenes van X unieke personen</p>
<p>  interrupted-total X: er zijn X speeches van anderen in scenes van MEMBER</p>
<p>  interrupted-unique X: het aantal unieke andere personen met een speech, per scene van MEMBER, gesommeerd</p>
<p>  interrupted-unique-persons X: X unieke personen hebben ten minste een speech in een scene van MEMBER</p>
<p>  interrupted-scenes X: in X scenes van MEMBER hebben anderen een speech</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/06/de-tweede-kamer-in-2012-2013/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Suzan Verberne op eHumanities workshop</title>
		<link>http://politicalmashup.nl/2013/06/suzan-verberne-op-ehumanities-workshop/</link>
		<comments>http://politicalmashup.nl/2013/06/suzan-verberne-op-ehumanities-workshop/#comments</comments>
		<pubDate>Tue, 11 Jun 2013 07:51:05 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Political Mashup]]></category>

		<category><![CDATA[resultaten]]></category>

		<category><![CDATA[Lipschits]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2058</guid>
		<description><![CDATA[Suzan Verberne presenteert haar werk over het leren classificeren van verkiezingsprogrammas op de Soeterbeeck eHumanities workshop op 13 en 14 Juni, 2013.
Links

 Poster (1 pagina PDF)
Samenvatting (4 paginas PDF)


Samenvatting
Isaac Lipschits (1930–2008) was a Dutch historian and political scientist. One of his works is an annotated collection of election manifestos (party programmes) for the Dutch elections [...]]]></description>
			<content:encoded><![CDATA[<p>Suzan Verberne presenteert haar werk over het leren classificeren van verkiezingsprogrammas op de <a href="http://data.politicalmashup.nl/ngrams/Indexes/">Soeterbeeck eHumanities workshop</a> op 13 en 14 Juni, 2013.</p>
<h3>Links</h3>
<ul>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/06/2013-06-13_lipschits_poster-2.pdf'> Poster (1 pagina PDF)</a></li>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/06/lipschits_abstract.pdf'>Samenvatting (4 paginas PDF)</a></li>
</ul>
<p><span id="more-2058"></span></p>
<h3>Samenvatting</h3>
<p>Isaac Lipschits (1930–2008) was a Dutch historian and political scientist. One of his works is an annotated collection of election manifestos (party programmes) for the Dutch elections between 1977-1998 (Lipschits, 1977). For each election year he compiled a book with the manifestos published by all parties that partic- ipated in that year’s elections. Lipschits manually labelled the manifestos with themes: he segmented the manifestos into coherent text fragments, numbered them, and added an index of themes in the back of the book referring to these text numbers.<br />
In the Political Mashup project (Marx, 2009), Dutch political data from 1814 onwards is being digitized and indexed. The data are not only digitized and integrated but also disclosed to the public. The aims of the work presented in the current paper are: (1) to digitize the 1977–1998 Lipschits collections and (2) to build an automatic classifier for more recent, unclassified election manifestos. The starting points for our work are the Lipschits books, scanned as PDF files.<br />
We took the following approach: We first converted the scanned PDFs to XML data in which each text fragment has been annotated with the Lipschits themes. We then used these data to build a classifier that is suited for classifying election manifestos from 2002 onwards using the data from the 1980s and 1990s. We evaluated the results by having a domain expert manually judge a sample of the classified data.</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/06/suzan-verberne-op-ehumanities-workshop/feed/</wfw:commentRss>
		</item>
		<item>
		<title>KB kranten bigrammen</title>
		<link>http://politicalmashup.nl/2013/06/kb-kranten-bigrammen/</link>
		<comments>http://politicalmashup.nl/2013/06/kb-kranten-bigrammen/#comments</comments>
		<pubDate>Thu, 06 Jun 2013 13:05:57 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[data]]></category>

		<category><![CDATA[KB kranten]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2049</guid>
		<description><![CDATA[Na de succesvolle PolticalMashup Ngramviewer voor de Handelingen werken we nu aan een combinatie van die viewer met een viewer over het kranten corpus van de KB. 
Dit is echt van een andere grootte!
Uit de periode 1840-1995 hebben we alleen bigrammen (frases bestaande uit 2 &#8220;woorden&#8221;) genomen die per jaar minstens 10 keer voorkwamen. We [...]]]></description>
			<content:encoded><![CDATA[<p>Na de succesvolle PolticalMashup Ngramviewer voor de Handelingen werken we nu aan een combinatie van die viewer met een viewer over het <a href="http://kranten.kb.nl/">kranten corpus van de KB</a>. </p>
<p>Dit is echt van een andere grootte!<br />
Uit de periode 1840-1995 hebben we alleen bigrammen (frases bestaande uit 2 &#8220;woorden&#8221;) genomen die per jaar minstens 10 keer voorkwamen. We komen dan uit op 35 miljoen unieke bigrammen, die samen meer dan 22 <strong>miljard</strong> keer voorkomen.<br />
<span id="more-2049"></span><br />
We hebben een lijst gemaakt van al die bigrammen, met daarachter hoe vaak ze voorkomen, en in hoeveel jaar. Die lijst is onderaan op deze pagina te downloaden.</p>
<p>Als voorbeeld hebben we gekeken naar frases beginnend met <em>lieve</em> en met <em>ondeugende</em>. Hier komen voor beide de twintig frases die het vaakst voorkwamen.<br />
We laten het tweede woord zien, gevolgd door het totaal aantal keer dat het woord voorkomt, gevolgd door het aantal jaar waarin het woord voorkomt.</p>
<p>Het valt op dat de ondeugende frases in veel minder jaren voorkomen dan de lieve frases.  </p>
<h3>Lieve</h3>
<pre>
man     341174  120
moeder  280279  151
vrouw   238254  154
vader   152666  128
zuster  95422   118
zorgzame        74949   79
ouders  67308   112
en      46594   148
broer   44316   82
zoon    40266   112
dochter 33657   129
meisjes 26710   116
tante   25854   122
schoonzuster    23543   93
hemel   23276   144
vriendin        22057   119
kind    21531   151
vrouwe  21341   149
heer    20914   132
echtgenoot      18135   99
</pre>
<h3>Ondeugende</h3>
<pre>
meisjes 4805    13
vrouwen 1967    3
huisvrouwtjes   1868    2
hete    1588    4
babbelaars      1405    3
meid    1352    12
jongen  1242    50
meiden  1068    4
kinderen        1023    49
streken 984     36
vrouwtjes       714     4
pascale 702     2
vrouw   658     4
jongens 624     36
wendy   470     2
spelletjes      453     5
vrouwtje        393     5
kim     363     1
oogen   362     20
tieners 357     3
</pre>
<h3>Downloads</h3>
<ul>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/06/ondeugendebigrams.csv'>ondeugendebigrams.csv</a></li>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/06/lievebigrams.csv'>lievebigrams.csv</a></li>
<li><a href="http://staff.science.uva.nl/~marx/pub/KBallbigramsMin10PerYear1840-1995.csv.gz">KBallbigramsMin10PerYear1840-1995.csv.gz</a> (Formaat: Bigram TAB aantal jaren met hits TAB totaal aantal hits)</li>
</ul>
<h2 id='stud'>Verschil tussen studenten en studentes</h2>
<p>Er is een groot verschil in bigrammen eindigend op &#8217;student&#8217; en eindigend op &#8217;studente&#8217;.<br />
We hebben dat hier inzichtelijk gemaakt met twee woordenwolken.  De input files voor de Wordle woordenwolken staan in <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/06/studentenwordles.zip'>studentenwordles.zip</a>. Er zijn twee versies: met de ruwe tellingen (het totaal aantal keer dat het bigram voorkomt in het KB kranten corpus), en de logaritme daarvan. Voor de wolken zijn de logaritmes gebruikt.
</p>
<p><a href="http://www.wordle.net/show/wrdl/6835690/Studentes_Bigrammen_KB_%28log%29" title="Wordle: Studentes Bigrammen KB (log)"><img src="http://www.wordle.net/thumb/wrdl/6835690/Studentes_Bigrammen_KB_%28log%29" alt="Wordle: Studentes Bigrammen KB (log)" style="padding:4px;border:1px solid #ddd"></a></p>
<p>  <a href="http://www.wordle.net/show/wrdl/6835702/Student_Bigrammen_KB_%28log%29" title="Wordle: Student Bigrammen KB (log)"><img src="http://www.wordle.net/thumb/wrdl/6835702/Student_Bigrammen_KB_%28log%29" alt="Wordle: Student Bigrammen KB (log)" style="padding:4px;border:1px solid #ddd"></a></p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/06/kb-kranten-bigrammen/feed/</wfw:commentRss>
		</item>
		<item>
		<title>UvA VU Informatica Coauteurs Netwerk</title>
		<link>http://politicalmashup.nl/2013/05/uva-vu-informatica-coauteurs-netwerk/</link>
		<comments>http://politicalmashup.nl/2013/05/uva-vu-informatica-coauteurs-netwerk/#comments</comments>
		<pubDate>Tue, 28 May 2013 15:44:29 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2045</guid>
		<description><![CDATA[Met de komende fusie tussen de twee beta faculteiten is het aardig om na te gaan hoeveel samenwerking er al is tussen wetenschappers aan beide kanten van de stad.
Een mooie maat voor samenwerking is het co-auteursschap: samen een artikel of een boek schrijven. We bekijken  dit hier voor informatica, gebruik makend van de DBLP [...]]]></description>
			<content:encoded><![CDATA[<p>Met de komende fusie tussen de twee beta faculteiten is het aardig om na te gaan hoeveel samenwerking er al is tussen wetenschappers aan beide kanten van de stad.<br />
Een mooie maat voor samenwerking is het co-auteursschap: samen een artikel of een boek schrijven. We bekijken  dit hier voor informatica, gebruik makend van de DBLP database, en een lijst met stafleden beschikbaar gesteld door Maarten van Steen. </p>
<p>De data is beschikbaar op <a href="https://www.google.com/fusiontables/DataSource?docid=1g2dBGyGYeigxbRqTd5q2m9iLWAAQr_2eha5Kcxo">Google Fusion Tables</a>.<br />
Onderstaand netwerk plaatje is wat Google Fusion Tables ervan maakt waarbij de relatie gewogen wordt door het &#8220;co-auteursgewicht&#8221;. Dit is voor 2 auteurs de som voor al hun gedeelde werken van 2 gedeeld door het aantal co-auteurs van dat werk.</p>
<p><iframe width="500" height="300" scrolling="no" frameborder="no" src="https://www.google.com/fusiontables/embedviz?containerId=gviz_canvas&amp;viz=GVIZ&amp;t=GRAPH&amp;gc=false&amp;gd=false&amp;sdb=1&amp;rmax=100000&amp;q=select+col0%2C+col1%2C+col3+from+1g2dBGyGYeigxbRqTd5q2m9iLWAAQr_2eha5Kcxo&amp;qrs=+where+col0+%3E%3D+&amp;qre=+and+col0+%3C%3D+&amp;qe=&amp;state=%7B%22ps%22%3A%221_18_4o_o_1h_4w_-g_5_-5d_-1g_1i_5q_c_2_-34_1d_t_23_g_6_-59_n_10_1b_-1d_z_-n_-s_x_-7_1k_s_2d_16_c_-4p_-1x_1d_-v_1z_d_-3w_1q_1e_5_2k_9_-5s_16_4_-4v_-v_1g_p_2y_y_-10_-8_3_-56_-9_14_1y_-1p_13_-23_1e_w_7_g_e_-1n_-u_u_2e_-k_1m_-2x_r_16_-2_-1z_1n_-2d_-30_1b_3i_-3_k_-2m_27_1o_-2x_-35_j_-5b_30_15_b_-1l_1k_1h_-21_q_-3w_10_l_-5y_30_b_-68_-1j_r_-2j_2t_h_-2h_k_m_-5p_-29_f_-4g_-1d_17_f_-a_7_-63_h_g_-3g_l_1j_-y_-1m_0_-33_3_p_-3i_2f_11_-1b_-1p_1_-2y_-n_i_-4c_2v_1f_-q_2v_1a_-1x_1z_8_-3i_-k_o_-1x_-1z_1l_11_-2c_a_-3l_-1s_12_-6t_19_19_-1r_36_n_-4a_-37_1c_-1o_-c_v_2p_2u_%22%2C%22cx%22%3A0%2C%22cy%22%3A0%2C%22sw%22%3A946.2301330530639%2C%22sh%22%3A337.8742823509978%2C%22z%22%3A0%7D&amp;uiversion=2&amp;gco_forceIFrame=true&amp;gco_hasLabelsColumn=true&amp;width=500&amp;height=300"></iframe><br />
We hebben een hele simpele analyse gedraaid: wat zijn de componenten in het coauteursnetwerk waarbij een lijn pas meetelt als die waarde 1 of meer heeft (dus de 2 auteurs moeten minimaal 1 artikel met z&#8217;n tweeen hebben geschreven, of 2 artikelen met 3 of 4 auteurs, of&#8230;)?<br />
We vinden er dan 7. Hier komen ze, aflopend gerangschikt naar hun grootte.<br />
<verbatim><br />
15 ['Cees Snoek', 'Patricia Lago', 'Frank Nack', 'Pieter De Leenheer', 'Marcel Worring', 'Jaap Gordijn', 'Hans van Vliet', 'Rein van den Boomgaard', 'Guus Schreiber', 'Theo Gevers', 'Lora Aroyo', 'Hans Akkermans', 'Lynda Hardman', 'Dennis Koelma', 'Leo Dorst']<br />
12 ['Andrew S. Tanenbaum', 'Rutger F. H. Hofman', 'A. E. Eiben', 'Herbert Bos', 'Thilo Kielmann', 'Evert Haasdijk', 'Maarten van Steen', 'Arno Bakker', 'Paul Klint', 'Chris Verhoef', 'Spyros Voulgaris', 'Wan Fokkink']<br />
11 ['Stefan Schlobach', 'Mark Hoogendoorn', 'Annette ten Teije', 'Lourens van der Meij', 'Maarten de Rijke', 'Frank van Harmelen', 'Shimon Whiteson', 'Christof Monz', 'Maarten Marx', 'Jan Treur', 'Tibor Bosse']<br />
11 ['Cees de Laat', 'Drona Kandhai', 'Paola Grosso', 'Jaap A. Kaandorp', 'Peter M. A. Sloot', 'Adam Belloum', 'Robert J. Meijer', 'Robert G. Belleman', 'Hamideh Afsarmanesh', 'Marian Bubak', 'Alfons G. Hoekstra']<br />
3 ['Piet Rodenburg', 'Alban Ponse', 'Inge Bethke']<br />
2 ['Peter A. Boncz', 'Martin L. Kersten']<br />
2 ['Jaap Heringa', 'Gunnar W. Klau']<br />
</verbatim></p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/05/uva-vu-informatica-coauteurs-netwerk/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Political Ngram Viewer wint DIR 2013 best demo award</title>
		<link>http://politicalmashup.nl/2013/05/political-ngram-viewer-wint-dir-2013-best-demo-award/</link>
		<comments>http://politicalmashup.nl/2013/05/political-ngram-viewer-wint-dir-2013-best-demo-award/#comments</comments>
		<pubDate>Thu, 02 May 2013 07:15:53 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2035</guid>
		<description><![CDATA[Het demonstratie artikel over de Politieke Ngram Viewer geschreven door Bart de Goede, Justin van Wees en Maarten Marx heeft de best demonstration award op DIR 2013 gewonnen. 

poster
paper

Bart de Goede, Justin van Wees, Maarten Marx (2013). PoliticalMashup Ngramviewer. Proc. Dutch Belgium Information Retrieval (DIR 2013).


@InProceedings{goed:poli13,
  author = 	 {B. {de Goede} and J. [...]]]></description>
			<content:encoded><![CDATA[<p>Het demonstratie artikel over de <a href="http://ngram.politicalmashup.nl/?terms=talent|top">Politieke Ngram Viewer</a> geschreven door Bart de Goede, Justin van Wees en Maarten Marx heeft de <em>best demonstration award</em> op <a href="http://www.dir2013.org">DIR 2013</a> gewonnen. </p>
<ul>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/05/ngramviewer_poster_dir2013.pdf'>poster</a></li>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/05/ngramviewer.pdf'>paper</a></li>
</ul>
<p>Bart de Goede, Justin van Wees, Maarten Marx (2013). PoliticalMashup Ngramviewer. <em>Proc. Dutch Belgium Information Retrieval (DIR 2013)</em>.<br />
<span id="more-2035"></span></p>
<pre>
@InProceedings{goed:poli13,
  author = 	 {B. {de Goede} and J. {van Wees} and M. Marx},
  title = 	 {{PoliticalMashup Ngramviewer}},
  booktitle = 	 {Proceedings DIR 2013},
  year =	 2013,
  note =	 {Best Demonstration Award}
}
</pre>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/05/political-ngram-viewer-wint-dir-2013-best-demo-award/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Loe de Jong Digitaal</title>
		<link>http://politicalmashup.nl/2013/04/loe-de-jong-digitaal/</link>
		<comments>http://politicalmashup.nl/2013/04/loe-de-jong-digitaal/#comments</comments>
		<pubDate>Mon, 29 Apr 2013 19:11:23 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2032</guid>
		<description><![CDATA[Victor de Boer heeft als hoofdauteur  een artikel geschreven over het Loe de Jong Digitaalproject, dat NIOD, UvA en VU gezamelijk hebben uitgevoerd in het kader van Clarin 3. Victor presenteert het op de KCAP 2013  (International Conference on Knowledge Capture)  conferentie, deze zomer in Banff, Canada.

Link naar artikel

]]></description>
			<content:encoded><![CDATA[<p>Victor de Boer heeft als hoofdauteur  een artikel geschreven over het <a href="http://www.loedejongdigitaal.nl/search/">Loe de Jong Digitaal</a>project, dat NIOD, UvA en VU gezamelijk hebben uitgevoerd in het kader van Clarin 3. Victor presenteert het op de <a href="http://events.kmi.open.ac.uk/kcap2013/tag/kcap-2013/">KCAP 2013</a>  (International Conference on Knowledge Capture)  conferentie, deze zomer in Banff, Canada.</p>
<ul>
<li><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/04/deboer13kcap-3.pdf'>Link naar artikel</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/04/loe-de-jong-digitaal/feed/</wfw:commentRss>
		</item>
		<item>
		<title>NWO Creatieve Industrie project ExPoSe</title>
		<link>http://politicalmashup.nl/2013/04/nwo-creatieve-industrie-project-expose/</link>
		<comments>http://politicalmashup.nl/2013/04/nwo-creatieve-industrie-project-expose/#comments</comments>
		<pubDate>Sat, 27 Apr 2013 14:08:44 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[parliament]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2030</guid>
		<description><![CDATA[Het ExPoSe (Exploratory Political Search) project van Jaap Kamps en Maarten Marx is in de  Creatieve Industrie 2013 ronde van NWO toegekend.
In  het project worden  twee aio&#8217;s en &#233;&#233;n wetenschappelijke programmeur aangesteld.
Het project loopt 5 jaar en wordt door het volgende consortium uitgevoerd:  Dispectu BV, Koninklijke Bibliotheek, Meertens Instituut, Nationaal Archief, [...]]]></description>
			<content:encoded><![CDATA[<p>Het ExPoSe (Exploratory Political Search) project van Jaap Kamps en Maarten Marx is in de  <a href="http://www.nwo.nl/actueel/nieuws/2013/gw/impuls-van-77-miljoen-voor-onderzoek-binnen-topsector-creatieve-industrie.html">Creatieve Industrie 2013 ronde van NWO</a> toegekend.<br />
In  het project worden  twee aio&#8217;s en &eacute;&eacute;n wetenschappelijke programmeur aangesteld.<br />
Het project loopt 5 jaar en wordt door het volgende consortium uitgevoerd:  Dispectu BV, Koninklijke Bibliotheek, Meertens Instituut, Nationaal Archief, Spinque BV, Tweede Kamer, Universiteit van Amsterdam.<br />
<span id="more-2030"></span></p>
<h3>Verkennend zoeken binnen onze parlementaire geschiedenis</h3>
<p><em>Dr. ir. J. (Jaap) Kamps, dr. M.J. (Maarten) Marx, Universiteit van Amsterdam</em><br />
In dit project maken we de gedigitaliseerde Nederlandse parlementaire geschiedenis gereed voor een nieuwe manier van (onder)zoeken: verkennend zoeken. Dit kan door allerlei bronnen aan elkaar te koppelen op basis van de ankerpunten in een tekst (tijd, plaats, de spelers, de onderwerpen). De ontstane zoekomgeving verbindt onze parlementaire geschiedenis met het heden, en is dus bruikbaar voor zowel historisch als journalistiek onderzoek.<br />
Consortiumpartners: Dispectu BV, Koninklijke Bibliotheek, Meertens Instituut, Nationaal Archief, Spinque BV, Tweede Kamer, Universiteit van Amsterdam.</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/04/nwo-creatieve-industrie-project-expose/feed/</wfw:commentRss>
		</item>
		<item>
		<title>De omvang van het KB kranten archief</title>
		<link>http://politicalmashup.nl/2013/03/de-omvang-van-het-kb-kranten-archief/</link>
		<comments>http://politicalmashup.nl/2013/03/de-omvang-van-het-kb-kranten-archief/#comments</comments>
		<pubDate>Wed, 13 Mar 2013 09:42:58 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[data]]></category>

		<category><![CDATA[KB kranten]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2007</guid>
		<description><![CDATA[We hebben de omvang van het kranten archief van de KB per jaar bepaald, in aantal artikelen, aantal GigaByte en aantal woorden.  In totaal hebben we 84 miljoen unieke artikelen uit het KB archief kunnen ophalen. Meer precies: 84,423,498 artikelen die   in totaal 20,091,362,573 woorden bevatten. Samen is dat  184 GigaByte [...]]]></description>
			<content:encoded><![CDATA[<p>We hebben de omvang van het <a href="http://kranten.kb.nl/">kranten archief van de KB </a>per jaar bepaald, in aantal artikelen, aantal GigaByte en aantal woorden.  In totaal hebben we 84 miljoen unieke artikelen uit het KB archief kunnen ophalen. Meer precies: 84,423,498 artikelen die   in totaal 20,091,362,573 woorden bevatten. Samen is dat  184 GigaByte in XML formaat.  De data is beschikbaar als <a href='https://www.google.com/fusiontables/DataSource?docid=1nBEIUrBf3jDV5xGm19qBcdz-6lUmJhMCHkSJOcw'>spreadsheet</a>.<br />
De drie tellingen geven dezelfde trend weer: tot de oorlog neemt het corpus gestaag toe tot meer dan 300 miljoen woorden per jaar, dan stort het in elkaar, en neemt na de jaren 50 weer langzaam toe, maar tot nooit meer dan 150 miljoen woorden per jaar.<br />
<span id="more-2007"></span></p>
<h3>Aantal artikelen per jaar</h3>
<p> <iframe width="500" height="300" scrolling="no" frameborder="no" src="https://www.google.com/fusiontables/embedviz?containerId=gviz_canvas&amp;q=select+col0%2C+col1+from+1nBEIUrBf3jDV5xGm19qBcdz-6lUmJhMCHkSJOcw+order+by+col0+asc&amp;viz=GVIZ&amp;t=SCATTER&amp;rmax=250&amp;uiversion=2&amp;gco_forceIFrame=true&amp;gco_hasLabelsColumn=true&amp;gco_useFirstColumnAsDomain=true&amp;gco_lineWidth=0&amp;gco_booleanRole=certainty&amp;gco_pointSize=7&amp;gco_hAxis=%7B%22useFormatFromData%22%3Afalse%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%2C+%22logScale%22%3Afalse%2C+%22formatOptions%22%3A%7B%22source%22%3A%22inline%22%7D%2C+%22format%22%3A%220.%23%23%22%7D&amp;gco_vAxes=%5B%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D%2C%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D%5D&amp;gco_legend=right&amp;gco_title=Aantal+artikelen+per+jaar&amp;gco_series=%7B%220%22%3A%7B%22pointSize%22%3A2%2C+%22color%22%3A%22%23cc0000%22%7D%7D&amp;att=true&amp;width=500&amp;height=285"></iframe></p>
<h3>Aantal woorden per jaar</h3>
<p><iframe width="500" height="300" scrolling="no" frameborder="no" src="https://www.google.com/fusiontables/embedviz?containerId=gviz_canvas&amp;q=select+col0%2C+col3+from+1nBEIUrBf3jDV5xGm19qBcdz-6lUmJhMCHkSJOcw+order+by+col0+asc&amp;viz=GVIZ&amp;t=SCATTER&amp;rmax=250&amp;uiversion=2&amp;gco_forceIFrame=true&amp;gco_hasLabelsColumn=true&amp;gco_useFirstColumnAsDomain=true&amp;gco_lineWidth=0&amp;gco_booleanRole=certainty&amp;gco_pointSize=7&amp;gco_hAxis=%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D&amp;gco_vAxes=%5B%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D%2C%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D%5D&amp;gco_legend=right&amp;gco_series=%7B%220%22%3A%7B%22pointSize%22%3A2%2C+%22color%22%3A%22%230000ff%22%7D%7D&amp;gco_title=Aantal+woorden+per+jaar&amp;width=500&amp;height=300"></iframe></p>
<h3>Grootte per jaar in GigaByte</h3>
<p><iframe width="500" height="300" scrolling="no" frameborder="no" src="https://www.google.com/fusiontables/embedviz?containerId=gviz_canvas&amp;q=select+col0%2C+col2+from+1nBEIUrBf3jDV5xGm19qBcdz-6lUmJhMCHkSJOcw+order+by+col0+asc&amp;viz=GVIZ&amp;t=SCATTER&amp;rmax=250&amp;uiversion=2&amp;gco_forceIFrame=true&amp;gco_hasLabelsColumn=true&amp;gco_useFirstColumnAsDomain=true&amp;gco_lineWidth=0&amp;gco_booleanRole=certainty&amp;gco_pointSize=7&amp;gco_hAxis=%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D&amp;gco_vAxes=%5B%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%2C+%22title%22%3A%22Gb%22%7D%2C%7B%22useFormatFromData%22%3Atrue%2C+%22viewWindow%22%3A%7B%22max%22%3Anull%2C+%22min%22%3Anull%7D%2C+%22minValue%22%3Anull%2C+%22maxValue%22%3Anull%7D%5D&amp;gco_legend=right&amp;gco_title=Grootte+van+files+(gzipped)+in+GigaByte+&amp;width=500&amp;height=300"></iframe></p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/03/de-omvang-van-het-kb-kranten-archief/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Making connections at Surf</title>
		<link>http://politicalmashup.nl/2013/03/making-connections-at-surf/</link>
		<comments>http://politicalmashup.nl/2013/03/making-connections-at-surf/#comments</comments>
		<pubDate>Mon, 11 Mar 2013 10:59:40 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Political Mashup]]></category>

		<category><![CDATA[data]]></category>

		<category><![CDATA[SURF]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=2004</guid>
		<description><![CDATA[Maarten Marx spoke at the &#8216;Making Connections/Semantic Web&#8217; session at the SURF Research and Innovation Event 2013 on  28 February 2013 at the Haagse Hogeschool - The Hague.
His message was that sharing and honesty  is the way yo increase the value of your published data.

Video Impression

Slides

View more presentations from maartenmarx.

]]></description>
			<content:encoded><![CDATA[<p>Maarten Marx spoke at the &#8216;Making Connections/Semantic Web&#8217; session at the <a href="http://www.surfsites.nl/srie13/">SURF Research and Innovation Event 2013</a> on  28 February 2013 at the Haagse Hogeschool - The Hague.</p>
<p>His message was that sharing and honesty  is the way yo increase the value of your published data.<br />
<span id="more-2004"></span></p>
<h3>Video Impression</h3>
<p><iframe width="560" height="315" src="http://www.youtube.com/embed/J9lXpPkfiZY" frameborder="0" allowfullscreen></iframe></p>
<h3>Slides</h3>
<div style="width:425px" id="__ss_13072739"><object id="__sse13072739" width="425" height="355"><param name="movie" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=screeneeopmarx-120525050021-phpapp01&#038;stripped_title=keynote-exploring-and-exploiting-official-publications&#038;userName=maartenmarx" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><param name="wmode" value="transparent"/><embed name="__sse13072739" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=screeneeopmarx-120525050021-phpapp01&#038;stripped_title=keynote-exploring-and-exploiting-official-publications&#038;userName=maartenmarx" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" wmode="transparent" width="425" height="355"></embed></object>
<div style="padding:5px 0 12px">View more <a href="http://www.slideshare.net/">presentations</a> from <a href="http://www.slideshare.net/maartenmarx">maartenmarx</a>.</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/03/making-connections-at-surf/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Vlees(ch)? in de Nederlandse krant</title>
		<link>http://politicalmashup.nl/2013/03/vleesch-in-de-nederlandse-krant/</link>
		<comments>http://politicalmashup.nl/2013/03/vleesch-in-de-nederlandse-krant/#comments</comments>
		<pubDate>Mon, 11 Mar 2013 10:10:04 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[data]]></category>

		<category><![CDATA[KB kranten]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1993</guid>
		<description><![CDATA[Na alle ophef over paardenvlees de laatste tijd waren we benieuwd wat voor soorten vlees er besproken werden in de Nederlandse kranten. Het KB kranten archief is hier natuurlijk de uitgelezen plek voor. We haalden uit alle 88 miljoen artikelen in het KB archief alle 236.950 artikelen waarin de tekst de reguliere expressie \b\w+vlees(ch)?\b bevatte. [...]]]></description>
			<content:encoded><![CDATA[<p>Na alle ophef over paardenvlees de laatste tijd waren we benieuwd wat voor soorten vlees er besproken werden in de Nederlandse kranten. Het KB kranten archief is hier natuurlijk de uitgelezen plek voor. We haalden uit alle 88 miljoen artikelen in het KB archief alle 236.950 artikelen waarin de tekst de reguliere expressie <tt>\b\w+vlees(ch)?\b</tt> bevatte. Dit is dus een woord eindigend op &#8216;vlees&#8217; of &#8216;vleesch&#8217;, met<br />
            minstens 1 letter ervoor. </p>
<p><span id="more-1993"></span></p>
<p>Deze 236.950 hits  zijn  verdeeld over de volgende categorieen:</p>
<pre>
119449 advertentie
116783 artikel
498 familiebericht
219 illustratie met onderschrift
</pre>
<p>Per hit hebben we de volgende informatie, hier een voorbeeld over <em>menschenvleesch</em>:</p>
<ul>
<li>De context: 	<em>den in Europa groote hoeveelheden zwart menschenvleesch verslonden.&#8221; „Rijken en machthebbenden!</em></li>
<li>De datum: 	1872-02-23</li>
<li>Het type bericht: 	artikel</li>
<li><a href="http://kranten.kb.nl/view/text/id/ddd:010297243:mpeg21:p002:a0004">de link naar het artikel bij de KB</a></li>
</ul>
<h2>Wat voor soorten vlees?</h2>
<p>We hebben voor alle vleessoorten geteld in hoeveel artikelen ze voorkwamen. Omdat we met veel verschillende spellingen te maken hebben hebben we de woorden wat genormaliseerd: alle hoofdletters werden klein, we haalden de &#8220;n&#8221; in paarde<strong>n</strong>- en ander vlees weg en vervingen &#8216;vleesch&#8217; overal door &#8216;vlees&#8217;.</p>
<p>Het resultaat kan je tonen als een histogram, maar ook als een woordenwolk:</p>
<pre>
46424 rundvlees
35458 varkensvlees
17869 tandvlees
17389 kalfsvlees
16316 rookvlees
8537 paardevlees
7189 schapevlees
5711 lamsvlees
5089 zoutvlees
4941 pekelvlees
3610 soepvlees
3297 ossevlees
3258 vruchtvlees
1989 vrijbankvlees
1846 schaapvlees
1743 kippevlees
1726 menschevlees
1646 nagelhoutvlees
1405 kanonnevlees
1062 braadvlees
1024 blikvlees
</pre>
<p>De woordenwolken zien er een stuk leuker uit. De eerste is gebaseerd op de absolute tellingen, de tweede op het logaritme daarvan.<br />
<a href="http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/vleesrecht.png"><img src="http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/vleesrecht.png" alt="" title="vleesrecht" width="615" height="309" class="alignnone size-medium wp-image-1995" /></a><br />
<br/><br />
<a href="http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/vlees.png"><img src="http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/vlees.png" alt="" title="vlees" width="585" height="350" class="alignnone size-medium wp-image-1994" /></a></p>
<h2>De populariteit van het vlees door de tijd</h2>
<p>Vervolgens hebben we van 5 vleessoorten geteld hoevaak die soorten per decennium genoemd werden, en dat als percentage uitgedrukt. De data staan op <a href='https://docs.google.com/spreadsheet/ccc?key=0Auc0YuQrK5gOdElqelJURjdjSml1UjRxZnkwQlkxNGc#gid=0'>Google Drive</a>.<br />
Hier is het plaatje:<br />
<br/><br />
<a href="http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/paardrundvarkenkalfschaapgenormaliseerd.png"><img src="http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/paardrundvarkenkalfschaapgenormaliseerd.png" alt="" title="paardrundvarkenkalfschaapgenormaliseerd" width="566" height="350" class="alignnone size-medium wp-image-1996" /></a></p>
<h3>Wat valt op?</h3>
<p>We zien een gestage opkomst van het varken. Tijdens en na de Tweede Wereld oorlog zien we een mooie verschuiving van rund naar paard en schaap. Het zou interresant zijn om de oorlogsjaren met wat meer granulariteit (per jaar, of zelfs kwartaal) te bekijken, en zien wat daar nu speelde.</p>
<h2>Zelf een analyse maken?</h2>
<p>We hebben de eerste 20.000 hits beschikbaar gemaakt als een gzipped tab separated bestand: <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2013/03/vlees20ktsv.gz'>vlees20k.tsv.gz</a>.</p>
<p>Voor het maken van andere analyses kan je altijd contact opnemen met maartenmarx@uva.nl</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2013/03/vleesch-in-de-nederlandse-krant/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>
