PoliticalMashup heeft samen met het DNPP de bundels verkiezingsprogrammas gemaakt door Isaac Lipschits gedigitaliseerd. Het DNPP heeft de boeken ingescand en geOCRed. Suzan Verberne heeft de teksten vervolgens omgezet naar een uitgebreid XML formaat.
In deze blogpost laten we zien wat je daar dan mee kan. Om te beginnen een verkiezingsthemawolk van de VVD uit 1998. Hierin staan alle onderwerpen die volgens Lipschits minstens 2 maal in het programma van de VVD aan bod kwamen. De top tien bestaat inderdaad uit typische VVD onderwerpen.
werkgelegenheid:16
Europese_samenwerking:12
milieubeleid:11
belastingen_algemeen:11
onderwijs:11
economische_groei:9
gezondheidszorg:9
criminaliteits_bestrijding:9
loon-_en_inkomensbeleid:8
gemeentelijk_bestuur_en_beleid:8
>
| lees verder…
Geplaatst op 07-03-2012 door Maarten Marx |
data,
parliament,
resultaten | |
Geen reacties »
Update Het hieronder beschreven onderzoek is verricht op 14 Februari naar aanleiding van een blogpost op 2 Februari over de missende Algemene Beschouwing van 2011. Toen waren alle stukken die hieronder genoemd zijn er niet. Ondertussen (2012-03-07) zijn ze er allemaal gelukkig wel.
Ook dit parlementaire jaar is het weer moeilijk om een volledig overzicht van alle verslagen uit de Tweede Kamer (de zogenaamde Handelingen) te verkrijgen.
Die worden normaal gesproken ongeveer drie weken na het debat gepubliceerd op de internet site van de overheid: overheid.nl. Deze site noemt zichtzelf
De betrouwbare bron voor informatie en dienstverlening van de overheid.
Onderstaande tabel laat zien dat er sinds de laatste Prinsjesdag 8 dagen ontbreken. Hieronder zitten belangrijke debatten als het antwoord van Premier Rutte tijdens de Algemene Beschouwingen.
| lees verder…
Geplaatst op 07-03-2012 door Maarten Marx |
data,
parliament | tags:
Kamervragen |
Geen reacties »
Vier destijds eerstejaars Informatiekunde studenten aan de Universiteit van Amsterdam hebben een project gedaan over de Nederlandse Kamervragen. Het idee was om een overzicht te bieden van alle Kamervragen gesteld sinds 1975. Het project verwaterde door verschillende redenen en is toen door ze stopgezet.
Er is blijkbaar toch nog vraag naar de data, en Bart de Goede heeft een bestand beschikbaar gemaakt. Het gaat om de Kamervragen sinds 1995, het deel wat beschikbaar was op destijds Parlando, en nu op https://zoek.officielebekendmakingen.nl
. Dit archief kampt met volledigheidsproblemen, en ook was het in de tijd van Parlando zeer moeilijk om een kopie van de data bij Parlando te maken. Er kunnen dus Kamervragen missen.
| lees verder…
Geplaatst op 27-02-2012 door Maarten Marx |
data | tags:
DBLP |
Geen reacties »
With the current protest against Elsevier, PoliticalMashup decided to try to find out how important Elsevier is in Computer Science.
Our research shows that Elsevier is very important in CS. It is the third largest publisher, publishing 13.5% of all CS publications.
| lees verder…
Geplaatst op 05-01-2012 door Maarten Marx |
data,
resultaten | tags:
sargasso |
Geen reacties »
Dimitri Tokmetzis van Sargasso heeft de interruptiedata van het eerste jaar Rutte I genanalyseerd en er twee mooie verhalen over geschreven. Alper Çugun van het datavisualisatiebureau Monster Swell heeft er een fraaie interactieve visualisatie van gemaakt. Zie
Geplaatst op 07-06-2011 door Maarten Marx |
XML,
data | |
Geen reacties »
Steven Grijzenhout made a collection of XML files crawled from the web available for research purposes.
The collection is available at http://data.politicalmashup.nl/sgrijzen/xmlweb/. A description of the data and an analysis of it is in the paper The Quality of the XML Web .
Geplaatst op 29-03-2011 door Maarten Marx |
data,
lecture | |
Geen reacties »
30 Maart 2011 is er een workshop Diachroon Corpus op het Huygens ING Instituut in Den Haag. Maarten Marx spreekt daar over het StatenGeneraal Digitaal project.
Hier zijn de bestanden genoemd in zijn lezing beschikbaar.
- Alle hits binnen de verslagen van de Eerste en Tweede Kamer 1814-1995 op ‘wijf’ en ‘huisvrouw’
- wijf huisvrouw (Deze files zijn te importeren in Excel. De scheider is TAB.)
Geplaatst op 25-03-2011 door Maarten Marx |
data,
parliament | tags:
network |
1 reactie »
PoliticalMashup heeft voor alle personen die sinds het parlementaire jaar 1975-1976 hebben deelgenomen aan debatten in de Eerste of Tweede Kamer een overzicht gemaakt van zijn of haar debatsgeschiedenis.
Het gaat om 1267 personen. De gegevens zijn gebaseerd op de Handelingen vanaf Prinsjesdag 1975 tot half December 2010.
De gegevens zijn beschikbaar in XML and tsv formaat op http://data.politicalmashup.nl/politici/nl/.
| lees verder…
Geplaatst op 25-03-2011 door Maarten Marx |
data,
parliament | tags:
Corpora |
2 reacties »
PoliticalMashup heeft een database beschikbaar gemaakt met daarin alle woorden gezegd door elke politicus in het Nederlandse parlement in de periode 1814-2010. Per politicus zijn per dag al zijn of haar uitgesproken teksten beschikbaar.
Het gaat om mensen die of in het Nederlandse Parlement of in de regering hebben gezeten. Dit zijn allemaal mensen die voorkomen op parlement.com.
De gegevens zijn gehaald uit de Handelingen in XML formaat zoals die gemaakt zijn door PoliticalMashup.
De data is beschikbaar op http://data.politicalmashup.nl/politici/nl_words/.
| lees verder…
Geplaatst op 01-03-2011 door Maarten Marx |
data | tags:
twitter |
Geen reacties »
De computationeel taalkundigen in Groningen proberen de uitslag van de Statenverkiezingen te voorspellen aan de hand van aantallen Twitterberichten. Ze hebben een mooie applicatie gebouwd waarin je per dag het aantal voorspelde zetels kunt zien. Ook kan je steeds het Twitter volume van de laatste 24 uur van 2 partijen tegen elkaar afzetten.
PentaPolitica en Valentin Jijkoun hebben vorig jaar ook iets vergelijkbaars gemaakt, en wonder boven wonder, het draait nog steeds. Zie onze vorige blogpost en de enorme verzameling grafiekjes van Jijkoun.