Conferentie

VVOJ2012 verslag: working with data Part I (2)

Titel: Working with data PART 1: Finding what’s available (Dutch / Flemish databases).
Sprekers: Arlen Poort (NRC Handelsblad) en Maarten Lambrechts (MO*).
Datum: 16 november 2012
Tijd: 14:00-15:15 uur

Verslag: Michaël Aussems en Isabelle Gheldolf

Maarten Lambrechts en Arlen Poort beantwoordden in hun workshop heel wat vragen over de praktische kant van datajournalistiek in België en Nederland. Aan tips en tricks geen gebrek, zowel een nieuwkomer in als ervaren rotten konden er wat van opsteken. Wij selecteerden de drie belangrijkste tips voor wie een succesvol datajournalist wil worden.

Tip 1: gebruik bestaande databases voor nieuwe doeleinden
De overheid stelt een heleboel databases ter beschikking via het web maar ook via commerciële instanties. De kans dat iemand een gegevensbestand bijhoudt die een exact antwoord geeft op jouw vraag is echter klein. Een database wordt opgesteld met een bepaald doel, maar dat kan ook voor andere doeleinden gebruikt worden. Bijvoorbeeld supermarkten als Albert Heijn en Delhaize hebben al hun producten online staan. Door deze pagina’s te scrapen kan je de supermarktoorlog volgen.

Tip 2: Webscrapen!
Webscrapen is een techniek om op een geautomatiseerde wijze informatie van het web te halen. Stel dat je de prijsevolutie in de huizenmarkt wil nagaan: de website funda.nl verstrekt actuele gegevens over de prijs van huizen, maar je kan slechts zoeken op provincie en er verschijnen maximaal vijftien resultaten per pagina. Onbegonnen werk om zo wekelijks voor alle provincies de honderden webpagina’s te doorlopen. Een webscraper biedt de oplossing. Zo’n zelfgeschreven programmaatje verzamelt de gegevens die je wil volledig automatisch. Helaas zit er een addertje onder het gras: wie een webscraper wil maken moet een beetje kunnen programmeren. “Helemaal niet zo moeilijk”, aldus Poort, “en meer dan de moeite waard.” Geïnteresseerden kunnen alvast kennis vergaren via scraperwiki.com

Tip 3: Combineer gegevensbestanden
Eén database is goed, twee is beter. Een reeks gegevens van het KMI kan interessant zijn om bijvoorbeeld te onderzoeken of bepaalde maanden droger waren dan anderen. Een ander gegevensbestand kan informatie bevatten over het aantal verkeersdoden per dag, inclusief de betrokken voortuigen. Leg die twee databases naast elkaar en er gaat een hele nieuwe wereld open. Wat is het verband tussen slecht weer en ongevallen? Sterven er meer motorrijders op de eerste dag mooi weer na een koude winter?

Tip 4: Invalshoeken
Via twee invalshoeken kan je aan datajournalistiek doen. Enerzijds kan je bezig zijn met een concreet onderzoek en daar relevante gegevens over zoeken. Anderzijds kan je vertrekken van beschikbare databases. Die bestanden onderzoek je om tot een verhaal te komen.

Gerelateerde artikelen

conferentie-1x

De onderzoeksjournalistiek bloeit, dat bleek wel tijdens de wederom uitverkochte VVOJ Conferentie 2024. Maar liefst 500 deelnemers waren vrijdag 15 en zaterdag 16 november bijeen in de prachtige locatie De Doelen in Rotterdam. Bijna twee keer zoveel als een paar jaar geleden.

Sluit je aan bij de vereniging van onderzoeksjournalisten

En vergroot je kennis én netwerk