130 likes | 244 Views
Open Data – Data Journalism. Trasparenza e informazione al servizio delle società nell’era digitale. Cenni storici da un passato molto prossimo (1/2). Il D.J. eredita la parte migliore del tradizionale giornalismo d’inchiesta: i fatti. Dalla crisi del giornalismo molti giornalismi possibili.
E N D
Open Data – Data Journalism Trasparenza e informazione al servizio delle società nell’era digitale
Cenni storici da un passato molto prossimo (1/2) Il D.J. eredita la parte migliore del tradizionale giornalismo d’inchiesta: i fatti Dalla crisi del giornalismo molti giornalismi possibili La differenza è nelle dimensioni. Differenze di scala estreme = differenze di genere I CABLI DI WIKILEAKS LE FOTO DEI CITIZEN JOURNALIST PLICO/ WATERGATE
Cenni storici da un passato molto prossimo (2/2) • IL RUOLO DEL D.J. PER IL LETTORE PER IL GIORNALISTA • “Certezza” del dato = bussola • Distinguere i fatti dalle opinioni • senza equilibrismi da “un colpo al cerchio e uno alla botte” PROPAGANDA PAR CONDICIO DATI FLUSSI DI INFORMAZIONE CONTRADDITTORIO
Le possibilità tecniche Digitalizzazione dei fatti del mondo Enorme mole di materiale da ricercare, processare e pubblicare = • Le redazioni sono dotate delle professionalità necessarie? • “Una nuova razza • a metà strada tra i tecnici e i giornalisti” • (Irfan Essa)
Le ragioni giornalistiche RACCONTARE STORIE ALTRIMENTI NON RACCONTABILI Deep Web Data Mining Big Data Semantic Web/Data INCHIESTE “Il D.J. incarna l’espressione più avanzata del principio di libertà e accesso all’informazione”. (Simon Roger – ex Data Blog editor,The Guardian) TRASPARENZA Open Parlamento/Voi siete qui Crime mapping (il Giro della Nera) RU486 SERVIZIO AL CITTADINO
La spinta civica TRASPARENZA PARTECIPAZIONE CONSAPEVOLEZZA SPINTA CIVICA ALLA CONOSCENZA I poteri forti lasciano che il vero messaggio passi sopra la testa del cittadino, mentre la realtà sfila sotto al suo naso. Ma oggi è sempre più difficile rivolgersi ad uditori accondiscendenti che assumono l’informazione come un farmaco sotto prescrizione, eccitante o sedativo a seconda della sintomatologia.
Applicazioni del Data Journalism Portata del D.J. e vastità di applicazioni. La tecnologia lo rende enorme, potenzialmente infinito. GEOGRAFIA TRASPORTI SICUREZZA Ambiente Urbanistica Turismo Traffico Viabilità Qualità della vita Crime mapping Disposizione forze dell’ordine Servizi di quartiere
La cassetta degli attrezzi del Data Journalist (1/2) GIORNALISMO Il D.J. non è un media a se, bensì una sovrapposizione di competenze appartenenti a diversi campi GRAFICA INFORMATICA MATEMATICA STATISTICA
I dati che abbiamo sono attendibili? Se uno scienziato dei dati produce i risultati sbagliati, accorgersene potrebbe non essere una cosa banale. • la semplice trasparenza non porta al cambiamento (vedi evidenze cambiamenti climatici e politiche ambientali) • non ci piacciono i numeri fornitici? basta etichettarli come corrotti • se l’infografica è il nuovo discorso elettorale, mettere in dubbio i dati ne è la naturale confutazione. • la trasparenza dei dati è una corsa alle armi • nel mondo della divulgazione, alterare i dati è come alterare i bilanci • quanti degli attuali scienziati dei dati diventeranno i periti contabili di domani, impegnati in una guerra alla frode e all’ignoranza? AlistairCroll
La cassetta degli attrezzi del Data Journalist IMPORTARE Scraperwiki,Yahoo! Pipes, OutWitHub, Google Spreadsheets. ManyEyes, Tableau Public. VISUALIZZARE CREARE MAPPE OpenHeatMap Public Data Explorer, ecc. CONDIVIDERE Google Fusion
La cassetta degli attrezzi del Data JournalistFOCUS: Le 10 regole di Troy Thibodeaux (1/3) 1. I FOGLI DI CALCOLO (SPREADSHEET) • Importare su un foglio elettronico (es. Excell) i dati grezzi in formato universale - senza formattazione, come un insieme di valori separati da virgole • Applicare filtri, formule e funzioni (if..then; vertical look-up, ecc.) • Scrivere le proprie formule (esprimere le proprie idee tramite codici). 2. SQL (Interrogazione di DB) • Il foglio di calcolo ha dei limiti • Per sondare il Big Data: SQL (Structured Query Language); ACCESS; SQLite; MySQL; PostgreSQL • SQL: permette di gestire insiemi e sottoinsiemi di dati correlati 3. PULIRE I DATI • Google RefineeData Wrangler: come i fogli di calcolo, ma studiati per nomi standardizzati (Andrea Marco Fama, Fama Andrea Marco, Andrea M. Fama, ecc.) • Google RefineExpressionLanguage: come sopra, ma per insiemi di dati e codici più sfofisticati • CSVKIT: studiato dai giornalisti, converte il proprio lavoro in un formato comune
La cassetta degli attrezzi del Data JournalistFOCUS: Le 10 regole di Troy Thibodeaux (2/3) 4. VISUALIZZAZIONE • Non è una decorazione, ma una funzione essenziale per comprendere meglio i dati e individuare tendenze altrimenti invisibili • Google FusionTableseTableau Public: semplici ed efficaci • R: per gli esperti, è un pacchetto di statistica open source che combina analisi e visualizzazione attraverso un linguaggio di programmazione sofisticato 5. SOFTWARE PER LA MAPPATURA • Data mapping: corrispondenza/match tra fonte ed obiettivo (due DB con gli stessi dati ma sotto nomi differenti) • Strumenti: Google Fusion, Tableau Public , Qgis , Arcview • PostgiseSpatiallite (specifici per dati di natura geografica) 6. LINGUAGGI DI PROGRAMMAZIONE • Il governo non rilascia i dati che stanno dietro un sito web? Basta scavare per averli (Data Mining / Screen-scraper) • Non si hanno i dati nel formato corretto utilizzando gli strumenti a disposizione? Basta costruirne uno proprio • I linguaggi di programmazione più comuni tra i giornalisti: Python, Ruby, Perl o Php
La cassetta degli attrezzi del Data JournalistFOCUS: Le 10 regole di Troy Thibodeaux (3/3) 7. WEB FRAMEWORK • Cos’è un web framework? Una struttura di supporto su cui organizzare e progettare un software. • A cosa serve? Ad evitare la riscrittura di un codice già steso in precedenza per compiti simili • Strumenti: django per python; rails per ruby; symfony per il php; catalyst per perl. 8. EDITOR • Strumenti: Textmateer Mac ; Notepad++ (Gratuito); VimeEmacs (Open Source) 9. CONTROLLO E REVISIONE • Salvare i backup • Estrarre elementi da versioni temporanee di file • Condividere il lavoro • Strumenti: github; git o subversion 10. ANALISI DEI DOCS • Documentcloud: ricerca , estrazione e condivisione (molto usato dai giornalisti) • Altri strumenti: Jigsaw; Python’s NaturalLanguageTool KiteStandfordCorenlp.