Raccogliere e contestualizzare dati per scrivere un reportage non rappresenta certo una novità assoluta nel giornalismo. L’analisi seria e approfondita di numeri, cifre e percentuali è da sempre la base della gran parte della buona informazione che si basa sui fatti e non sulle chiacchiere. La continua evoluzione degli strumenti digitali moltiplica, di giorno in giorno, le possibilità e le potenzialità dell’elaborazione delle informazioni a disposizione di una redazione. La cultura dell’open-data, i media sociali e la possibilità di condivisione di informazioni stanno ulteriormente accelerando, in questi ultimi anni, l’evoluzione del data journalism, il giornalismo investigativo che utilizza l’enorme quantità di dati reperibili in rete. Nasce però una questione: come organizzare, selezionare e verificare questa quantità di dati a nostra disposizione? E soprattutto: quali strategie deve adottare il giornalista per “restituire” ai lettori i dati raccolti, rendendoli leggibili, interessanti e coinvolgenti? Paul Bradshaw esperto di giornalismo online che ha fatto del data journalism il tratto distintivo del proprio lavoro, si dedica da tempo nel divulgare la cultura digitale nella pratica giornalistica. Nel suo blog di approfondimenti sul data journalism se ne trovano parecchi, sempre molto interessanti. Recentemente Paul è tornato proprio sull’argomento con due post che aggiornano e fanno nuovamente il punto sui processi alla base del giornalismo data-driven. Anche stavolta una lettura ricca di spunti. Giocando sul fatto che la principale attività del giornalista nell’elaborare i dati sia quello della “sottrazione” – partiamo da un’ampia quantità di informazioni per focalizzarci con sempre maggiore attenzione nella sintesi di quello che realmente ha valore comunicare – Bradshaw ha realizzato questo grafico che ha chiamato la piramide rovesciata del data journalism.
Il percorso che ci propone il giornalista e blogger inglese è molto dettagliato e ricco di approfondimenti e indicazioni sui tool da utilizzare (consiglio: non fate i pigri cliccate sui link e scoprite gli strumenti e gli esempi proposti). Ho fatto una sintesi dei due lunghi post:
Compilare, che si abbia una domanda che ha bisogno di essere sviluppata attraverso dei dati o invece, un insieme di dati che hanno bisogno di domande per essere letti, la raccolta e l’organizzazione del materiale grezzo (proveniente da database, documenti eccetera) è il processo che determinerà la qualità di tutte le altre fasi di lavoro. Teniamolo sempre presente. Pulire, ovvero armiamoci di pazienza, correggiamo gli errori dal materiale che abbiamo raccolto, eliminando le ripetizioni e mettendolo in un unico formato coerente (Excel et similia, ad esempio), …insomma buon vecchio editing applicato non solo alle parole ma anche alle cifre e ai dati. Contestualizzare, è giunto il momento di verificare le fonti, analizzare la provenienza dei diversi dati raccolti, farsi domande su come e perché la fonte li ha comunicati; è molto probabile che lavorandoci possano emergere delle ulteriori aggregazioni di dati, continuiamo a confrontarli e a contestualizzarli (percentuale dei reati in un’area urbana con la popolazione di quella città, con quella di città vicine, con la medesima percentuale di cinque anni prima e così via)… e siamo già nella fase successiva, Combinare, utilizziamo il mash-up tra dati e mappe (vogliamo essere digital journalist o no?), ma anche con informazioni provenienti dai social media (è un argomento particolarmente presente nel dibattito su Twitter o più in generale sulla rete?), magari troviamo altre domande da porci, il lavoro si complica, ma può valerne la pena.
Alla fine del lavoro avremmo una serie di dati e informazioni coerenti e verificate. Bene. Ora comincia la parte divertente: comunicarli al lettore. Bradshaw propone sei modalità per comunicare il giornalismo dei numeri: Visiva, va bene usiamo le infografiche sono uno strumento molto efficace ma non ne abusiamo, non è una moda da proporre con superficialità, ma un lavoro serio che ha le sue regole e un processo non semplice da realizzare. Narrativa, il tradizionale articolo non è ancora da mandare in soffitta, anzi, è il mezzo per comunicare concetti in modo accessibile e comprensibili a tutti i diversi lettori; scrivere di numeri non è semplice, sparare cifre nell’incipit può suscitare attenzione ma ha poco senso se non si danno termini di paragone (raffrontiamo a qualcosa di simile, è più o meno del solito?…), cerchiamo sempre di dare quantità e importi in modo facilmente comprensibile (una spesa pro capite, una produzione giornaliera ad esempio). Sociale, il Guardian fa scuola, ha costruito una comunità attorno ai propri progetti e utilizza le vie del crowdsourcing proponendo ai lettori di implementare i dati, ma l’utilizzo delle vie dei mezzi sociali per comunicare e utilizzare le informazioni è solo all’inizio; c’è ancora molto da esplorare. Umanizzata, le storie, le testimonianze delle persone sono ancora un ottimo modo per comunicare, dopo essersi immersi in dati astratti ricordiamoci di uscire e registrare un’intervista con una persona che è stata coinvolta da quei dati (deve essere una testimonianza rilevante, però…) Personalizzata, utilizzare l’interattività del web e ancora di più dei social media; ProPublica ha recentemente coinvolto i lettori per un’indagine comparativa e qualitativa delle scuole pubbliche utilizzando i media sociali (Facebook in particolare), un esempio da seguire e sviluppare. Utililizzabile, (è la parte che mi è sembrata un po’ meno chiara ed efficace degli articoli di Bradshaw) il modo più difficile e complesso di comunicare i risultati nel data journalism è farlo con strumenti basati sui dati, disponibili sia per i giornalisti che per i lettori. Creare delle utility partendo dai dati è oggi abastanza costoso, ma la sempre maggior standardizzazione dei programmi per immagazzinare i dati da parte delle News org, potrebbe portare in futuro a una sensibile diminuzione dei costi.