<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>

<channel>
	<title>Political Mashup</title>
	<atom:link href="http://politicalmashup.nl/feed/" rel="self" type="application/rss+xml" />
	<link>http://politicalmashup.nl</link>
	<description></description>
	<pubDate>Tue, 08 May 2012 14:01:37 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6.1</generator>
	<language>en</language>
			<item>
		<title>Verkiezingsprogrammas van Lipschits Digitaal</title>
		<link>http://politicalmashup.nl/2012/05/verkiezingsprogrammas-van-lipschits-digitaal/</link>
		<comments>http://politicalmashup.nl/2012/05/verkiezingsprogrammas-van-lipschits-digitaal/#comments</comments>
		<pubDate>Tue, 08 May 2012 13:10:51 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Political Mashup]]></category>

		<category><![CDATA[data]]></category>

		<category><![CDATA[parliament]]></category>

		<category><![CDATA[resultaten]]></category>

		<category><![CDATA[Lipschits]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1788</guid>
		<description><![CDATA[PoliticalMashup heeft samen met het DNPP de bundels verkiezingsprogrammas gemaakt door Isaac Lipschits gedigitaliseerd. Het DNPP heeft de boeken ingescand en geOCRed. Suzan Verberne heeft de teksten vervolgens omgezet naar een uitgebreid XML formaat.
In deze blogpost laten we zien wat je daar dan mee kan. Om te beginnen een verkiezingsthemawolk van de VVD uit 1998. [...]]]></description>
			<content:encoded><![CDATA[<p>PoliticalMashup heeft samen met het DNPP de bundels verkiezingsprogrammas gemaakt door Isaac Lipschits gedigitaliseerd. Het DNPP heeft de boeken ingescand en geOCRed. Suzan Verberne heeft de teksten vervolgens omgezet naar een uitgebreid XML formaat.<br />
In deze blogpost laten we zien wat je daar dan mee kan. Om te beginnen een verkiezingsthemawolk van de VVD uit 1998. Hierin staan alle onderwerpen die volgens Lipschits minstens 2 maal in het programma van de VVD aan bod kwamen. De top tien bestaat inderdaad uit typische VVD onderwerpen.</p>
<pre>
werkgelegenheid:16
 Europese_samenwerking:12
 milieubeleid:11
 belastingen_algemeen:11
 onderwijs:11
 economische_groei:9
 gezondheidszorg:9
 criminaliteits_bestrijding:9
 loon-_en_inkomensbeleid:8
 gemeentelijk_bestuur_en_beleid:8
</pre>
<p><a href="http://www.wordle.net/show/wrdl/5259982/VVD-Manisfesto-1998"<br />
        ><img src="http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/05/vvdwordle.png" alt="" title="vvdwordle" width="523" height="350" class="alignnone size-medium wp-image-1800" /></a><br />
<span id="more-1788"></span><br />
Lipschits gebruikte een zeer modern systeem om de verkiezingsprogrammas te voorzien van trefwoorden: elk programma werd onderverdeeld in stukjes voorzien van een unieke naam die over een  of meer  onderwerpen gingen. Vanuit een uitgebreide index achterin het boek kan je dan voor elke partij heel snel alle standpunten van die partij over een bepaald onderwerp terugvinden. Het vergelijken van de standpunten van partijen werd dus erg gemakkelijk.</p>
<p>In het XML formaat dat wij gebruiken, zijn alle verwijzende trefwoorden direct gekoppeld aan de stukjes tekst, zoals in het volgende voorbeeld (stukje 13 uit het programma van de SGP uit 1998):</p>
<pre>
 &lt;p id='nl.p.sgp.13'>
        &lt;themes>
            &lt;theme id='discriminatie' score=''/>
            &lt;theme id='Europese_samenwerking' score=''/>
            &lt;theme id='minderheden__etnische_en_culturele' score=''/>
            &lt;theme id='normen_en_waarden' score=''/>
            &lt;theme id='religie' score=''/>
            &lt;theme id='remigratiebeleid' score=''/>
            &lt;theme id='vluchtelingenbeleid' score=''/>
            &lt;theme id='werkgelegenheid' score=''/>
            &lt;theme id='zondagsarbeid_zondagsrust' score=''/>
        &lt;/themes>
 13 Nederland is dichtbevolkt, maar Nederland is niet vol. Daarom is er plaats voor allen die
daadwerkelijk aan vervolging bloot staan. De procedure tot toelating moet snel en zorgvuldig zijn.
 De SGP streeft naar het volgende. a. Vreemdelingen die illegaal in Nederland ver blijven, worden
metterdaad Nederland uitgezet. Indien dit niet direct mogelijk is, wordt hun aanwezigheid in
Nederland gecontroleerd. b. Er dienen, zoveel mogelijk in Europees ver band, sancties te worden
getroffen tegen landen die weigeren uitgewezen onderdanen terug te nemen.  

[...]

 Er mag geen misverstand over bestaan: voor de wet is iedere inwoner van Nederland gelijk. Maar
wanneer het gaat om de inhoud van de wet dan is niet dat wat de Koran, Boeddha, Marx of Kant zegt
richtinggevend, maar wat de Bijbel zegt. 

[...]
    &lt;/p>
</pre>
<p>Dit biedt allerlei geweldige mogelijkheden voor snelle analyses. Om dat te demonstreren hebben we wat tellingen gedaan op <a href="http://opc4.kb.nl/DB=1/LNG=NE/LRSET=1/SET=1/SID=9bddfc02-1/TTL=1/SHW?FRST=7">de programmas uit 1998</a>. We kijken naar de populariteit van de onderwerpen in die verkiezingen. </p>
<p>Er zijn 218 onderwerpen die verwijzen naar minimaal 1 stukje in 1 programma. De top 10 meest gebruikte zijn hieronder genoemd, met daarachter het percentage stukjes wat onder dat onderwerp valt en het absolute aantal tussen haakjes. Let op, 1 stukje kan gekoppeld worden aan meerdere onderwerpen. Percentages tellen dus niet op tot 100. </p>
<pre>
 milieubeleid	0.3 (246)
 werkgelegenheid	0.25 (206)
 Europese_samenwerking	0.18 (152)
 sociale_voorzieningen	0.17
 gezondheidszorg	0.16
 criminaliteits_bestrijding	0.16
 gemeentelijk_bestuur_en_beleid	0.16
 ouderenbeleid	0.15
 onderwijs	0.13
 loon-_en_inkomensbeleid	0.12
</pre>
<p>We kunnen dezelfde percentages ook per partij uitrekenen. Die staan in deze <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/05/1998aantalparagrafenpertopicenallepartijen.xls'>Excel sheet</a>. De absolute waardes staan in <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/05/1998aantalparagrafenpertopicenallepartijenabsoluut.csv'>dit tab separated csv bestand</a>.</p>
<p>Een aardige manier om snel te zien welke partij de aandacht legt op welk onderwerp is om het percentage stukjes van die partij te delen door het percentage van alle stukjes. Als een partij dus net zoveel aandacht aan een onderwerp besteed als gemiddeld krijgt het score 1 voor dat onderwerp. Besteed het relatief veel aandacht aan een onderwerp dan komt de score boven de 1.<br />
Zo verwachten we dat GroenLinks zal winnen bij milieubeleid, de AOV (Ouderenpartij) bij ouderen, en de VVD bij criminaliteitsbestrijding.<br />
De werkelijkheid was in 1998 echter flink anders&#8230; de VVD wint bij onderwijs, en is pas derde bij criminaliteitsbestrijding, na de RPF en het CDA. Deze relatieve resultaten staan in <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/05/1998aantalparagrafenpertopicenallepartijendividedbymean.xls'>dit Excel bestand.</a></p>
<p>De namen van de partijen spreken meestal voor zich. Meer informatie erover is te vinden via <a href="http://resolver.politicalmashup.nl/nl.p.aov">http://resolver.politicalmashup.nl/nl.p.aov </a>, waarbij het deel nl.p.aov veranderd kan worden in een andere partijnaam.</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/05/verkiezingsprogrammas-van-lipschits-digitaal/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Named Entity Recognition op NLDB</title>
		<link>http://politicalmashup.nl/2012/05/named-entity-recognition-op-nldb/</link>
		<comments>http://politicalmashup.nl/2012/05/named-entity-recognition-op-nldb/#comments</comments>
		<pubDate>Fri, 04 May 2012 10:20:19 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[research]]></category>

		<category><![CDATA[ner]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1782</guid>
		<description><![CDATA[Binnen het Clarin project War In Parliament spelen named entities een belangrijke rol. In de Handelingen der Staten Generaal bepalen we voor elke woord wie het gesproken heeft. Met behulp van Named Entity Recognition technieken bepalen we in de uitgesproken tekst over welke entiteiten er dan  gesproken wordt. 
Nadat we de entiteiten herkend hebben [...]]]></description>
			<content:encoded><![CDATA[<p>Binnen het <a href="http://www.clarin.nl/">Clarin</a> project War In Parliament spelen <em>named entities</em> een belangrijke rol. In de Handelingen der Staten Generaal bepalen we voor elke woord <em>wie</em> het gesproken heeft. Met behulp van <em>Named Entity Recognition</em> technieken bepalen we in de uitgesproken tekst over welke entiteiten er dan  gesproken wordt. </p>
<p>Nadat we de entiteiten herkend hebben proberen we ze te normaliseren door ze te verbinden met Wikipedia paginas.<br />
We kunnen dan vragen beantwoorden als</p>
<ul>
<li>Wie spreekt over wie?</li>
<li>Wie heeft het het meest  over locatie X?</li>
<li>Welke organisaties worden het meest in de Kamer besproken. Splits dat uit per partij.</li>
<li>Welke Kamerlid spreekt het meest over zijn woonplaats of geboorteplaats?</li>
<li>&#8230;</li>
</ul>
<p>Lars Buitinck heeft een vernieuwende manier gevonden om een named entity recognizer te trainen op basis van  geannoteerde data. De voordelen van zijn methode zijn simpelheid,  inzichtelijkheid en snelheid. Lars presenteert de methode op de <em><a href="http://nldb.org/">17th International conference on Applications of Natural Language Processing to Information Systems</a></em> (26-28/6/2012, Groningen). </p>
<p><a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/05/paper-1.pdf'>Link naar het artikel: <em>Two-stage named-entity recognition using averaged perceptrons</em><br />
Lars Buitinck and Maarten Marx</a></p>
<pre>
@inproceedings{
 title = {Two-stage named-entity recognition using averaged perceptrons},
 author = {L. Buitinck and M. Marx},
 booktitle = {Proc. 17th International Conference on
              Applications of Natural Language Processing
              to Information Systems},
 editor = {G. Bouma and A. Ittoo and E. M\'{e}tais
           and H. Wortmann},
 publisher = {Springer},
 address = {Groningen, Netherlands},
 year = 2012
}
</pre>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/05/named-entity-recognition-op-nldb/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Aanbevelingen voor een Open Tweede Kamer</title>
		<link>http://politicalmashup.nl/2012/04/aanbevelingen-voor-een-open-tweede-kamer/</link>
		<comments>http://politicalmashup.nl/2012/04/aanbevelingen-voor-een-open-tweede-kamer/#comments</comments>
		<pubDate>Fri, 13 Apr 2012 06:30:48 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1779</guid>
		<description><![CDATA[Donderdag 12 April heeft een groep burgers 5 aanbevelingen voor een Open Tweede Kamer aan Gerdi Verbeet overhandigd. PoliticalMashup heeft mee geschreven aan deze aanbevelingen en Arjan Nusselder was erbij.
]]></description>
			<content:encoded><![CDATA[<p>Donderdag 12 April heeft een groep burgers 5 <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/04/tweede-kamer-aanbieding-vdef.pdf'>aanbevelingen voor een Open Tweede Kamer</a> aan Gerdi Verbeet overhandigd. PoliticalMashup heeft mee geschreven aan deze aanbevelingen en Arjan Nusselder was erbij.</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/04/aanbevelingen-voor-een-open-tweede-kamer/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Exploring and Exploiting Official Publications</title>
		<link>http://politicalmashup.nl/2012/04/exploring-and-exploiting-official-publications/</link>
		<comments>http://politicalmashup.nl/2012/04/exploring-and-exploiting-official-publications/#comments</comments>
		<pubDate>Tue, 10 Apr 2012 13:44:55 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[lecture]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1775</guid>
		<description><![CDATA[Maarten Marx will give an invited talk at the LREC workshop Exploring and Exploiting Official Publications on April 27 2012 in Istanbul.
]]></description>
			<content:encoded><![CDATA[<p>Maarten Marx will give an invited talk at the LREC workshop <a href="http://www-sk.let.uu.nl/eeop2012/">Exploring and Exploiting Official Publications</a> on April 27 2012 in Istanbul.</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/04/exploring-and-exploiting-official-publications/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Politicologie Universiteit Leiden 11 April 2012</title>
		<link>http://politicalmashup.nl/2012/04/politicologie-universiteit-leiden-11-april-2012/</link>
		<comments>http://politicalmashup.nl/2012/04/politicologie-universiteit-leiden-11-april-2012/#comments</comments>
		<pubDate>Tue, 10 Apr 2012 13:22:56 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1770</guid>
		<description><![CDATA[Hier staat het materiaal dat hoort bij de lezing van Maarten Marx op 11 April 2012 voor de derdejaars Politicologie aan de Universiteit Leiden.


Slides
Leuke dataset voor scriptie: Maidenspeeches

Applicaties gebaseerd op inhoud en structuur van de Handelingen

Beide: Zoeken in de Handelingen:

Alleen op basis van woorden: http://statengeneraaldigitaal.nl/
Op basis van inhoud en structuur: PoliticalMashup

Structuur: Analyzing and Visualizing Social [...]]]></description>
			<content:encoded><![CDATA[<p>Hier staat het materiaal dat hoort bij de lezing van Maarten Marx op 11 April 2012 voor de derdejaars Politicologie aan de Universiteit Leiden.<br />
<span id="more-1770"></span></p>
<ul>
<li><a href="http://ilps.science.uva.nl/PoliticalMashup/uploads/2010/08/screen_catchmeetingiisg.pdf">Slides</a></li>
<li>Leuke dataset voor scriptie: <a href="http://politicalmashup.nl/2011/01/weer-102-maidenspeeches-erbij/">Maidenspeeches</a></li>
</ul>
<h3>Applicaties gebaseerd op inhoud en structuur van de Handelingen</h3>
<ul>
<li>Beide: Zoeken in de Handelingen:
<ol>
<li>Alleen op basis van woorden: <a href="http://statengeneraaldigitaal.nl/uitgebreidzoeken/zoekresultaten?vergaderjaar[van]=1814+-+1815&#038;vergaderjaar[tot]=1994+-+1995&#038;zoekwoorden=Universiteit+leiden&#038;kamer[0]=Eerste+Kamer&#038;kamer[1]=Tweede+Kamer&#038;kamer[2]=Verenigde+Vergadering&#038;kamer[3]=UCV%2FOCV&#038;documentType=Alle+document+types&#038;sortering=relevantie&#038;zoekwoorden=%22Universiteit+Leiden%22">http://statengeneraaldigitaal.nl/</a></li>
<li>Op basis van inhoud en structuur: <a href="http://wip.politicalmashup.nl/search/?q=%22Universiteit+Leiden%22&#038;speakers=&#038;role=&#038;party=&#038;party-members=&#038;house=&#038;startdate=&#038;enddate=&#038;order=">PoliticalMashup</a>
</ol>
<li>Structuur: <a href="http://data.politicalmashup.nl/PoliticalMashup/SocialNetworks/">Analyzing and Visualizing Social Networks of Members of Parliament</a></li>
<li>Beide: <a href='http://politicalmashup.nl/2011/09/algemene-beschouwingen-2011/'>Politiekinzicht.com</a></li>
<li>Inhoud: Zoeken naar politici: <a href="http://ikkieswijzer.nl/">http://ikkieswijzer.nl/</a></li>
<li>Beide:<a href="http://data.politicalmashup.nl/nrc/2/"> karakteriseringen van politici: dynamische biopaginas<br />
</a></li>
<li>Beide: Vinden van coherente clubs van kamerleden <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/04/bachelorscriptie_-_eindpresentatie.pdf'>(scriptie Justin van Wees) slides eindpresentatie</a></li>
<li>Vrouwen in het Parlement (M. Leijenaar): wijken ze af van mannen?
<ol>
<li>
<a href="https://docs.google.com/spreadsheet/ccc?key=0Auc0YuQrK5gOdHdpeHE2eEFTbDJSNkoxYURZVVhqclE">in hun aktiviteiten en gedrag? </a>(Structuur)</li>
<li>In hun onderwerpen? (Inhoud)</li>
</ol>
<li><em>Leuk onderwerp</em> Allochtonen in Parlement. (Net als bij de vrouwen).</li>
</li>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/04/politicologie-universiteit-leiden-11-april-2012/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Namescape van start</title>
		<link>http://politicalmashup.nl/2012/03/namescape-van-start/</link>
		<comments>http://politicalmashup.nl/2012/03/namescape-van-start/#comments</comments>
		<pubDate>Thu, 22 Mar 2012 12:24:48 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[research]]></category>

		<category><![CDATA[namescape]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1766</guid>
		<description><![CDATA[Het NameScape project is van start gegaan. Alles daarover staan in de slides die Karina van Dalen liet zien op de Clarin 3 kickoff meeting.

 Namescape 2012 03 06 
 View more PowerPoint from maartenmarx 

]]></description>
			<content:encoded><![CDATA[<p>Het NameScape project is van start gegaan. Alles daarover staan in de slides die Karina van Dalen liet zien op de Clarin 3 kickoff meeting.</p>
<p><span id="more-1766"></span></p>
<div style="width:425px" id="__ss_12112612"> <strong style="display:block;margin:12px 0 4px"><a href="http://www.slideshare.net/maartenmarx/namescape-2012-03-06" title="Namescape 2012 03 06" target="_blank">Namescape 2012 03 06</a></strong> <iframe src="http://www.slideshare.net/slideshow/embed_code/12112612" width="425" height="355" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"></iframe>
<div style="padding:5px 0 12px"> View more <a href="http://www.slideshare.net/thecroaker/death-by-powerpoint" target="_blank">PowerPoint</a> from <a href="http://www.slideshare.net/maartenmarx" target="_blank">maartenmarx</a> </div>
</p></div>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/03/namescape-van-start/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Twitterend Den Haag</title>
		<link>http://politicalmashup.nl/2012/03/twitterend-den-haag/</link>
		<comments>http://politicalmashup.nl/2012/03/twitterend-den-haag/#comments</comments>
		<pubDate>Tue, 20 Mar 2012 21:00:12 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[parliament]]></category>

		<category><![CDATA[twitter]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1758</guid>
		<description><![CDATA[

Met hulp van PoliticalMashup&#8217;s Twitter wizzards Bart de Goede en Justin van Wees (o.a. van pentapolitica.nl)   hebben drie eerstejaars Informatiekunde studenten aan de Universiteit van Amsterdam in samenwerking met Sargasso.nl een analyse gemaakt van het getwitter van de Haagse intimi. Hun verslag en eindproduct stond al een tijdje op  haagsetweet.nl en is [...]]]></description>
			<content:encoded><![CDATA[<table>
<tr>
<td>Met hulp van PoliticalMashup&#8217;s Twitter wizzards Bart de Goede en Justin van Wees (o.a. van <a href="http://pentapolitica.nl">pentapolitica.nl</a>)   hebben drie eerstejaars Informatiekunde studenten aan de Universiteit van Amsterdam in samenwerking met Sargasso.nl een analyse gemaakt van het getwitter van de Haagse intimi. Hun verslag en eindproduct stond al een tijdje op <a href="http://haagsetweet.nl/"> haagsetweet.nl</a> en is nu ook door het ANP opgepikt en als persbericht verspreid.<br />
Onder andere te lezen op <a href="http://www.nu.nl/internet/2766943/haagse-tweets-redacteur-pauw--witteman-invloedrijk.html">nu.nl</a>,<a href="http://www.rtl.nl/%28/actueel/rtlnieuws/binnenland/%29/components/actueel/rtlnieuws/2012/03_maart/19/binnenland/jaap-janssen-invloedrijkste-twitteraar-op-binnenhof.xml"> rtl.nl</a>, en <a href="http://sargasso.nl/archief/2012/03/19/de-twitterkoning-van-het-binnenhof-is-jaap-jansen/">sargasso.nl</a>.
</td>
<td valign='top'><a href="http://haagsetweet.nl"><img alt="" src="http://alleplanten.net/twitter/site/client/img/logo.jpg" title="Haagse stolp" class="alignright" width="188" height="96" /></a>
</td>
</tr>
</table>
<p>Het onderzoek is uitgevoerd door Hayo Bart, Frank Houweling en Liset Meijerman onder begeleiding van Maarten Marx en Dimitri Tokmetzis.<br />
<span id="more-1758"></span></p>
<h3>Links naar stukken die het onderzoek vermelden.</h3>
<p>http://www.dejaap.nl/2012/03/19/zzzooom-invloedrijke-twitteraars-in-de-haagse-stolp/comment-page-1/</p>
<p>http://www.nujij.nl/internet/haagse-tweets-redacteur-pauw-witteman-invloedrijk.16199540.lynkx#axzz1pa7Ry6OL</p>
<p>http://twittermania.nl/2012/03/wilders-en-wester-invloedrijkste-twitteraars-op-binnenhof/</p>
<p>http://www.pc-active.nl/internet/207664-geert-wilders-toch-geen-twitter-koning.html</p>
<p>http://www.rtl.nl/(/actueel/rtlnieuws/binnenland/)/components/actueel/rtlnieuws/2012/03_maart/19/binnenland/jaap-janssen-invloedrijkste-twitteraar-op-binnenhof.xml</p>
<p>http://www.depers.nl/binnenland/638000/Rutger-telt-niet-mee.html</p>
<p>http://sargasso.nl/archief/2012/03/19/de-twitterkoning-van-het-binnenhof-is-jaap-jansen/</p>
<p>http://www.nu.nl/internet/2766943/haagse-tweets-redacteur-pauw&#8211;witteman-invloedrijk.html</p>
<p>https://twitter.com/#!/Pritt/status/181751761638391808</p>
<p>https://twitter.com/#!/JaapJansen/status/181852760399032320</p>
<p>https://twitter.com/#!/Le_Thier/status/181861725618978816</p>
<p>https://twitter.com/#!/JaapJansen/status/181880041586688001</p>
<p>https://twitter.com/#!/JaapJansen/status/181886844118646784</p>
<p>https://twitter.com/#!/estauthamer/status/181975649882341376</p>
<p>https://twitter.com/#!/seven__/status/181752757773017088</p>
<p>https://twitter.com/#!/seven__/status/181793914087415810</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/03/twitterend-den-haag/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Hoe vaak stemmen de VVD en SGP hetzelfde?</title>
		<link>http://politicalmashup.nl/2012/03/hoe-vaak-stemmen-de-vvd-en-sgp-hetzelfde/</link>
		<comments>http://politicalmashup.nl/2012/03/hoe-vaak-stemmen-de-vvd-en-sgp-hetzelfde/#comments</comments>
		<pubDate>Thu, 15 Mar 2012 10:29:46 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[parliament]]></category>

		<category><![CDATA[nrc]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1746</guid>
		<description><![CDATA[Deze vraag vroeg NRC Next aan PoliticalMashup voor hun rubriek next checkt. Op 15 Maart



 bekeek  die rubriek of Rutte&#8217;s uitspraak

Eigenlijk zitten VVD en SGP heel dicht bij elkaar
waar is.
NRC Next heeft de verkiezingsprogrammas naast elkaar gelegd en PoliticalMashup heeft alle stemmingen uit 2011 uit de Handelingen gehaald en geturfd hoe vaak de twee [...]]]></description>
			<content:encoded><![CDATA[<p>Deze vraag vroeg NRC Next aan PoliticalMashup voor hun rubriek <em>next checkt</em>. Op 15 Maart</p>
<table>
<tr>
<td VALIGN="top">
 bekeek  die rubriek of Rutte&#8217;s uitspraak</p>
<blockquote><p>
Eigenlijk zitten VVD en SGP heel dicht bij elkaar</p></blockquote>
<p>waar is.<br />
NRC Next heeft de verkiezingsprogrammas naast elkaar gelegd en PoliticalMashup heeft alle stemmingen uit 2011 uit de Handelingen gehaald en geturfd hoe vaak de twee partijen hetzelfde stemden. Dat bleek in driekwart van de gevallen zo te zijn. Kijk je meer gericht naar het soort stemming, dan is de gelijkenis nog sterker. Op de 99 stemmingen over wetsvoorstellen stemden VVD en SGP maar 4 keer verschillend.</p>
<p><a href='http://www.nrcnext.nl/blog/2012/03/15/next-checkt-%E2%80%98eigenlijk-zitten-vvd-en-sgp-heel-dicht-bij-elkaar/'>Link naar blogpost behorend bij het artikel</a><br />
<a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/03/sp00545212031512090.pdf'>Link naar scan van het artikel.</a>
</td>
<td>
<img alt="" src="http://www.nrcnext.nl/files/2012/03/VVD_SGPb224.jpg" title="Stemmingen" class="alignnone" width="224" height="522" />
</td>
</tr>
</table>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/03/hoe-vaak-stemmen-de-vvd-en-sgp-hetzelfde/feed/</wfw:commentRss>
		</item>
		<item>
		<title>De juiste stemming</title>
		<link>http://politicalmashup.nl/2012/03/de-juiste-stemming/</link>
		<comments>http://politicalmashup.nl/2012/03/de-juiste-stemming/#comments</comments>
		<pubDate>Tue, 13 Mar 2012 14:09:24 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1742</guid>
		<description><![CDATA[PoliticalMashup probeert de uitslag en de stemverdeling van de stemmingen over moties, amendementen en wetsontwerpen uit de Handelingen te halen. Dit wordt weer gebruikt door de Tweede Kamer, sites als politix.nl en politicologen.
Dit gaat aardig goed omdat de voorzitter de uitslag van de stemmingen met behulp van een aantal vaste formules aangeeft.
Maar soms wordt er [...]]]></description>
			<content:encoded><![CDATA[<p>PoliticalMashup probeert de uitslag en de stemverdeling van de stemmingen over moties, amendementen en wetsontwerpen uit de Handelingen te halen. Dit wordt weer gebruikt door de Tweede Kamer, sites als politix.nl en politicologen.<br />
Dit gaat aardig goed omdat de voorzitter de uitslag van de stemmingen met behulp van een aantal vaste formules aangeeft.<br />
Maar soms wordt er tijdens de vergadering gezegd dat de voorzitter een foutje heeft gemaakt. De stemming  wordt dan echter niet in de Handeling verbeterd. Zowel voor mensen als voor computers is het op deze manier erg moeilijk om gegarandeerd de juiste stemming uit de tekst op te maken.<br />
<span id="more-1742"></span><br />
Blijkbaar zijn de Handelingen tegenwoordig vooral een verslag van <em>wat er gezegd is</em>, en niet van <em>wat er gebeurd is</em>.</p>
<p>Hier volgt een mooi voorbeeld: <a href='https://zoek.officielebekendmakingen.nl/h-tk-20112012-17-11.html'>de bron</a> en <a href='http://resolver.politicalmashup.nl/nl.proc.ob.d.h-tk-20112012-17-11.1.6.1'>de stemming op het amendement Irrgang</a> volgens PoliticalMashup.<br />
Dit klopt prima met de lopende tekst.<br />
Pas na een volgende stemming wordt aangegeven dat de stemverdeling op de stemming op dat amendement niet correct is weergegeven: de <a href='http://resolver.politicalmashup.nl/nl.proc.ob.d.h-tk-20112012-17-11?view=html#nl.proc.ob.d.h-tk-20112012-17-11.1.11.1'>Christenunie niet tegen, maar voor heeft gestemd</a>. Zie ook de laatste paragraaf in <a href='https://zoek.officielebekendmakingen.nl/h-tk-20112012-17-11.html'>de bron</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/03/de-juiste-stemming/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Making WordClouds in XPath/XQuery</title>
		<link>http://politicalmashup.nl/2012/03/making-wordclouds-in-xpathxquery/</link>
		<comments>http://politicalmashup.nl/2012/03/making-wordclouds-in-xpathxquery/#comments</comments>
		<pubDate>Mon, 12 Mar 2012 12:26:23 +0000</pubDate>
		<dc:creator>Maarten Marx</dc:creator>
		
		<category><![CDATA[XPath]]></category>

		<category><![CDATA[onderwijs]]></category>

		<category><![CDATA[Add new tag]]></category>

		<category><![CDATA[XPadje]]></category>

		<guid isPermaLink="false">http://politicalmashup.nl/?p=1731</guid>
		<description><![CDATA[We describe step by step how to make a basic wordcloud in XPath/XQuery.
In the tutorial we use two files:
input XML file en wordcloud XQuery file.

step 1
Collect data.
Pitfall HTML data from the web is not wellformed XML. Thus you cannot process it with XPath.
SolutionClean it up using tidy.
bash-3.2$ curl http://politicalmashup.nl/2012/02/politicalmashup-and-politix/&#124; tidy -asxml - > file.xml
step 2
Explore [...]]]></description>
			<content:encoded><![CDATA[<p>We describe step by step how to make a basic wordcloud in XPath/XQuery.<br />
In the tutorial we use two files:<br />
<a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/03/file1.xml'>input XML file</a> en <a href='http://ilps.science.uva.nl/PoliticalMashup/uploads/2012/03/wordcloud.xq'>wordcloud XQuery file</a>.</p>
<p><span id="more-1731"></span><br />
<strong>step 1</strong><br />
Collect data.<br />
<em>Pitfall</em> HTML data from the web is not wellformed XML. Thus you cannot process it with XPath.<br />
<em>Solution</em>Clean it up using tidy.<br />
<code>bash-3.2$ curl http://politicalmashup.nl/2012/02/politicalmashup-and-politix/| tidy -asxml - > file.xml</code><br />
<strong>step 2</strong><br />
Explore the contents using XPath. This can nicely be done in oXygen.<br />
<em>Pitfall</em> Processor cannot collect the DTD. No results due to namespace.<br />
<em>Solution</em> Just remove those.<br />
<code><br />
&lt;!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"<br />
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><br />
&lt;html xmlns="http://www.w3.org/1999/xhtml"><br />
</code><br />
simply becomes<br />
<code> &lt;html></code><br />
Some useful expressions:<br />
<code>//p all paragraphs<br />
//a all anchor text<br />
//h1 | //h2 | //h3 |//h4 all headings</code><br />
<strong>step 3</strong><br />
Only take what you want.<br />
Suppose we want only the text in paragraphs. And only the main text of the page.<br />
We could do that by restricting to paragraphs which have a certain length:<br />
<code><br />
count(//p[string-length(.) gt 100])</code><br />
only return paragraphs whose length is larger than 100 characters.<br />
<strong>step 4</strong><br />
Extract the words:<br />
<code>tokenize(string-join(//p[string-length(.) gt 100],&#8217; &#8216;),&#8217;\W+&#8217;) </code><br />
Gives a runtime error:<br />
<code><br />
XPath failed due to: A sequence of more than one item is not allowed as the first argument of tokenize() ("Ook benieuwd naar wat de parti...", "De grondige analyse van de dat...") </code><br />
<em>problem</em> The tokenize() function takes a single string as input. We have provide a sequence of strings&#8230;<br />
<em>Solution</em> Glue them together:<br />
<code>string-join(//p,' ')<br />
</code><br />
<strong>Step 5</strong><br />
What have we got? Count types and tokens<br />
<code><br />
count(tokenize(string-join(//p[string-length(.) gt 100],&#8217; &#8216;),&#8217;\W+&#8217;) )<br />
count(distinct-values(tokenize(string-join(//p[string-length(.) gt 100],&#8217; &#8216;),&#8217;\W+&#8217;) ))</code><br />
This gets hard to read&#8230;. Luckily this is also allowed:<br />
<code><br />
count(<br />
  distinct-values(<br />
   tokenize(<br />
     string-join(//p[string-length(.) gt 100],<br />
                     &#8216; &#8216;),<br />
     &#8216;\W+&#8217;)<br />
  )<br />
)<br />
<strong>step 6</strong><br />
Code refactoring.<br />
We switch to creating an XQuery file because of the following:</p>
<ol>
<li>code can be made more readable using let&#8217;s</li>
<li> we want to order words on their cardinality</li>
</ol>
<p>However, this creates trouble in oXygen with the namespace&#8230;<br />
Here is the solution: declare the namespace (use the same url as in the XML file), and use it whenever you refer to an element.<br />
<code></p>
<pre>
declare namespace h = 'http://ww.w3.org/1999/xhtml';
let $tokens := tokenize(string-join(//h:p[string-length(.) gt 100],' '),'\W+')
let $words := distinct-values($tokens)
return
for $w in $words return
    concat($w,': ',count($tokens[. eq $w]),'&#10;')
</pre>
<p></code><br />
<strong>step 7</strong><br />
Finish everything. You can now  output HTML with style instructions to create a real good-looking word cloud.<br />
<code></p>
<pre>
declare namespace h = 'http://ww.w3.org/1999/xhtml';
let $tokens := tokenize(string-join(//h:p[string-length(.) gt 100],' '),'\W+')
let $words := distinct-values($tokens)
return
<center>
{  (: note the curly braces: leave them out and you just output the XQuery, not the answer <img src='http://politicalmashup.nl/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />
for $w in $words
    let $wc := count($tokens[. eq $w])
    order by $wc descending
    return
    &lt;span style='{concat("font-size: ",$wc,"pt;")}'>{$w}&lt;/span> (: again curly braces: now also inside the values of attributes <img src='http://politicalmashup.nl/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />
}
</center>
</pre>
<p></code><br />
<strong>step 8</strong><br />
Create better values for the font sizes. I leave this up to you. Note that algorithms which give good results use a logarithmic function, which XPath does not have&#8230;.<br />
<strong>oXygen tips</strong></p>
<ol>
<li>Open both your input file and your xquery file in oXygen</li>
<li>Use the XPath &#8220;search box&#8221; on your input file to test small XPath expressions. Note that you do not worry about the namespace.</li>
<li>Put code together in your XQuery file.</li>
<li>TYou can run an XQuery file in two ways in oXygen:
<ol>
<li>Pressing the &#8220;play button&#8221;. Choose &#8220;XQuery transformation with Saxon&#8221; as your scenario. This requires that you must specify the input file for the transformation inside the XQuery, and use it in your XPath expressions which refer to that file. This can be done as follows:<br />
<code><br />
declare namespace h = 'http://ww.w3.org/1999/xhtml';</p>
<p>let $input := doc('file.xml')<br />
let $tokens := tokenize(string-join($input//h:p[string-length(.) gt 100],&#8217; &#8216;),&#8217;\W+&#8217;)<br />
</code></li>
<li>Use the XQuery transformation button (on the far right on top in oXygen). Press it and choose your input and your XQuery file and press play. The earlier given XQuery now just works.</li>
</ol>
</li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://politicalmashup.nl/2012/03/making-wordclouds-in-xpathxquery/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>

