Titel: Working with data PART 1: Finding what’s available (Dutch / Flemish databases).
Sprekers: Arlen Poort (NRC Handelsblad) en Maarten Lambrechts (MO*).
Datum: 16 november 2012
Tijd: 14:00-15:15 uur
Verslag: Michaël Aussems en Isabelle Gheldolf
Maarten Lambrechts en Arlen Poort beantwoordden in hun workshop heel wat vragen over de praktische kant van datajournalistiek in België en Nederland. Aan tips en tricks geen gebrek, zowel een nieuwkomer in als ervaren rotten konden er wat van opsteken. Wij selecteerden de drie belangrijkste tips voor wie een succesvol datajournalist wil worden.
Tip 1: gebruik bestaande databases voor nieuwe doeleinden
De overheid stelt een heleboel databases ter beschikking via het web maar ook via commerciële instanties. De kans dat iemand een gegevensbestand bijhoudt die een exact antwoord geeft op jouw vraag is echter klein. Een database wordt opgesteld met een bepaald doel, maar dat kan ook voor andere doeleinden gebruikt worden. Bijvoorbeeld supermarkten als Albert Heijn en Delhaize hebben al hun producten online staan. Door deze pagina’s te scrapen kan je de supermarktoorlog volgen.
Tip 2: Webscrapen!
Webscrapen is een techniek om op een geautomatiseerde wijze informatie van het web te halen. Stel dat je de prijsevolutie in de huizenmarkt wil nagaan: de website funda.nl verstrekt actuele gegevens over de prijs van huizen, maar je kan slechts zoeken op provincie en er verschijnen maximaal vijftien resultaten per pagina. Onbegonnen werk om zo wekelijks voor alle provincies de honderden webpagina’s te doorlopen. Een webscraper biedt de oplossing. Zo’n zelfgeschreven programmaatje verzamelt de gegevens die je wil volledig automatisch. Helaas zit er een addertje onder het gras: wie een webscraper wil maken moet een beetje kunnen programmeren. “Helemaal niet zo moeilijk”, aldus Poort, “en meer dan de moeite waard.” Geïnteresseerden kunnen alvast kennis vergaren via scraperwiki.com
Tip 3: Combineer gegevensbestanden
Eén database is goed, twee is beter. Een reeks gegevens van het KMI kan interessant zijn om bijvoorbeeld te onderzoeken of bepaalde maanden droger waren dan anderen. Een ander gegevensbestand kan informatie bevatten over het aantal verkeersdoden per dag, inclusief de betrokken voortuigen. Leg die twee databases naast elkaar en er gaat een hele nieuwe wereld open. Wat is het verband tussen slecht weer en ongevallen? Sterven er meer motorrijders op de eerste dag mooi weer na een koude winter?
Tip 4: Invalshoeken
Via twee invalshoeken kan je aan datajournalistiek doen. Enerzijds kan je bezig zijn met een concreet onderzoek en daar relevante gegevens over zoeken. Anderzijds kan je vertrekken van beschikbare databases. Die bestanden onderzoek je om tot een verhaal te komen.