Kranten door de tijd

Geplaatst op 25-10-2013 door Maarten Marx | Political Mashup, resultaten | tags: , | comment image Geen reacties »

PoliticalMashup heeft een applicatie ontwikkeld waarmee de relatieve frequentie van woorden of frases per jaar in de kranten collectie van de Koninklijke Bibliotheek eenvoudig zichtbaar wordt gemaakt.

KB historische kranten ngram viewer.

Spellingshervormingen zijn mooi terug te zien, bijvoorbeeld met de twee zoekvragen ‘regering’ en ‘regeering’.

Zoeken met de gebruikte zoektermen in de kranten van een bepaald jaar kan door te klikken op het bolletje in de grafiek boven dat jaar.

Heel veel woorden uit het Parlement

Geplaatst op 11-10-2012 door Maarten Marx | parliament, trivia | tags: | comment image Geen reacties »

Politici zijn erg creatief in hun taalgebruik. Een leuke vraag is dus

Hoeveel verschillende woorden zijn er uitgesproken in de Tweede Kamer sinds 1814?

Het jaar 1814 is gekozen omdat er vanaf dat moment zogenaamde Handelingen der Staten Generaal beschikbaar zijn.
Het antwoord is een gigantisch aantal: 2.773.826. Echter dit wordt nogal vertekend omdat de teksten zijn ingescand en de letters automatisch zijn herkend (OCR). Dit levert nogal wat fouten op. Maar kijken we naar het aantal woorden dat minstens 2 keer voorkomt, dan hebben we er nog steeds heel erg veel: 992.291, bijna 1 miljoen.
Deze woorden zijn allemaal te vinden met de politieke ngram viewer die PoliticalMashup en Dispectu BV samen hebben ontwikkeld.
| lees verder…