De omvang van het KB kranten archief

Geplaatst op 13-03-2013 door Maarten Marx | data | tags: | Geen reacties »

We hebben de omvang van het kranten archief van de KB per jaar bepaald, in aantal artikelen, aantal GigaByte en aantal woorden. In totaal hebben we 84 miljoen unieke artikelen uit het KB archief kunnen ophalen. Meer precies: 84,423,498 artikelen die in totaal 20,091,362,573 woorden bevatten. Samen is dat 184 GigaByte in XML formaat. De data is beschikbaar als spreadsheet.
De drie tellingen geven dezelfde trend weer: tot de oorlog neemt het corpus gestaag toe tot meer dan 300 miljoen woorden per jaar, dan stort het in elkaar, en neemt na de jaren 50 weer langzaam toe, maar tot nooit meer dan 150 miljoen woorden per jaar.

Aantal artikelen per jaar

Aantal woorden per jaar

Grootte per jaar in GigaByte

Reageer

Je moet ingelogd zijn om te kunnen reageren.