1 / 27

Open data in una scienza sempre più data-intensive

Paola Gargiulo CINECA, Roma p.gargiulo@cineca.it. Torino, Aula Magna dell’Università, 24 ottobre 2012. Open data in una scienza sempre più data-intensive. Agenda. Open Research Data: ovvero… Due storie Open Research Data: chi Open Research Data: perché

ingo
Download Presentation

Open data in una scienza sempre più data-intensive

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Paola Gargiulo CINECA, Roma p.gargiulo@cineca.it Torino, Aula Magna dell’Università, 24 ottobre 2012 Open datain una scienza sempre più data-intensive

  2. Agenda • Open Research Data: ovvero… • Due storie • Open Research Data: chi • Open Research Data: perché • Open Research Data: progetti in corso

  3. Open Research Data, ovvero… • …dati di base della ricerca finanziata con i fondi pubblici • …dati grezzi (raw data) • …idati di cui già si parla nell’articolo scientifico pubblicato su rivista sulla carta potevamo pubblicare solo un riassunto della ricerca, sotto forma di “articolo” su rivista  sul web possiamo integrare con l’intero set di dati, offrendo un quadro più completo dell’intera ricerca, con i vantaggi che vedremo

  4. Open Research Data, ovvero... • dati di qualsiasi entità • dati eterogenei tra loro (mappe, genomi, formule matematiche, scientifiche, bioscienza, biodiversità,etc) • dati utilizzati per creare modelli • climatici, • aerodinamici, • molecolari, • bioinformatica; • video e immagini di archivio • descrizione di opere archeologiche, antropologiche • dati quantitativi e qualitativi utilizzati nelle scienze sociali • dati elettronici e indici per campioni di fossili o di tessuti

  5. Open Research Data - Tipologie • Datistrutturati • Matrici di dati • Datitransazionali • Grafi • Web e Social network • Stutturemolecolari • DatiOrdinati • Datispaziali • Seriestoriche • Sequenze • Sequenzegenetiche • Dati non strutturati • Documentitestuali • Immagini • Audio e Video

  6. Open Research Data, ovvero… • NON i dati della ricerca applicata • NON i dati correlati ai brevetti • NON dati personali • NON dati confidenziali • NONsegreti industriali • NON dati di produzione … solo i dati di base della ricerca… … che sono alla base dei prodotti innovativi…

  7. Open Research Data: workflowdelle attività Collaborazione e visualizzazione Disseminazione e condivisione Acquisizione ed elaborazione Analisi e data mining Archiviazione e conservazione

  8. È un’idea nuova? • molti ricercatori già scambiano i dati (VirtualObservatory, CERN…) • alcune discipline (Genomics) funzionanosolo in virtù della condivisione dei dati • alcune riviste (Nature Genetics) già richiedono la pubblicazione dei dati insieme all’articolo; molte riviste Open Access lo consigliano • ci sono già databases aperti in tutte le discipline

  9. È un’idea nuova? http://www.openphacts.org/ http://www.elixir-europe.org/ http://www.dans.knaw.nl/en/content/data-archive http://echo.mpiwg-berlin.mpg.de/home

  10. Due storie / 1 • nel 1989 Tim Berners Lee, al CERN, propone il protocollo HTTP per la trasmissione di dati/ipertesti nellacomunità dei fisici • nasce così il World Wide Web (WWW) … cosa sarebbe successo se allora Tim Berners Lee o il CERN avessero deciso di tenere CHIUSO il protocollo e i dati per il suo sviluppo?

  11. Due storie / 2 Nel 2006 Ilaria Capuasequenzia per prima il virus dell’influenza aviaria (N5H1) • l’OMS chiede di depositarlo nel suo database (chiuso) • Ilaria Capua decide di depositare la sequenza inun database aperto, GenBank, sfidando il sistema corrente, convinta che solo la condivisione dei dati e un approccio trans-disciplinare può favorire la ricerca • lancia su Nature l’iniziativa GISAID (Global Initiative on Sharing All Influenza Data) cui rispondono 70 ricercatorifra cui 7 Premi Nobel • daallora, l’OMS ha adottatoilsuoapproccio trans-disciplinare per le strategie pre-epidemiche, cheriguarda la salute dituttinoi… … tuttodallavisioneapertadiunaricercatrice…

  12. Open Research Data: chi / 1 NeelieKroes vice presidente Commissione Europea e Commissaria per la Digital Agenda • «Taxpayers, all of us, deserve the widest possible social and economic benefits from publicly funded research» • «Data are the new oil» • «You can give away your data now – and generate revenue and jobs, and even save money from the better information and decisions that will flow» • «Big data means big opportunities» • «This is a return to the origins of modern science; where the philosophy was all about open access and achieving progress» NeelieKroes blog, http://blogs.ec.europa.eu/neelie-kroes/

  13. Open Research Data: chi / 2 Tim Berners Lee • 2009: raw data now!«Put your data on the Web! Let’s unlock our data and reframe the way we use it together» http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html • 2010: the yearopen data wentworldwide«Data combinationgivesmuchbetteranswersthan data itself» http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html • Progetto Linked data oltre 330 databases aperti,connessi fra loro http://linkeddata.org/ • «The data work only open and connected…»

  14. Open Research Data: perché / 1 • per una scienzapiù solida: meglio basarsi sui DATI che sull’INTERPRETAZIONE degli stessi contenuta negli articoli… • per confrontare/dibattere con i propri dati • per creare nuova conoscenza aggiungendo i propri dati • per favorire un approccio inter-disciplinare o trans-disciplinare, per dare risposta ai grandi quesiti della nostra epoca (es. cambiamento climatico)

  15. Open Research Data: perché / 2 • per una scienza più efficiente/efficace: • i dati già raccolti possono essere riusati senza ulteriori spese, da differenti prospettive/differenti approcci • se i dati circolano rapidamente e globalmente, la creazione di conoscenza accelera • presupposto: che i dati siano archiviati, catalogati, ricercabili e accessibili • infrastruttura adeguata • interoperabilità/standard Due rapporti europei suquesti aspetti: Riding the wave. HowEurope can gainfrom the risingtideofscientific data, 2010 Preparing for data driven infrastructure, 2012

  16. Open Research Data: perché / 3 • per una scienza più trasparente • i dati possono essere riusati per scoprire frodi/falsificazioni/interpretazioni errate o parziali RetractionWatch blog che lista i casi di articoli ritrattati non è mai a corto di post… http://retractionwatch.wordpress.com/

  17. Open Research Data: perché / 4 • per una società più competitiva: • le piccole-medie imprese non hanno accesso ai dati della ricerca, chiusa in riviste con abbonamenti esosi • se avessero accesso ai dati,immetterebbero sulmercato i loro prodottiDUE ANNI prima Access to Research and Technical Information in Denmark, Report, May 2011

  18. Open Research Data: perché / 5 • per una società più efficiente: • con nuove tecniche di data-mining si possono creare nuovi dati, con valore aggiunto per l’intera società • McKinsey stima che nel solosettore della Sanità in USAutilizzando il data-mining suidatasets aperti si creerebbeun valore di 300 miliardi $, e un risparmio dell’8% nelle spese sanitarie Big data: The next frontier for innovation, competition, and productivity, 2011

  19. Open Research Data: perché / 6 • per una società della conoscenza: • cittadini più informati • decisori politici possono prendere decisioni migliori basandosi sui dati disponibili • per una società più partecipativa: • scienza aperta significacitizen cyberscience:i cittadini comunipartecipano allaraccolta di dati http://citizencyberscience.net/

  20. Open Research Data: perché / 7 • per la società del futuro • i dati vanno conservati per il lungo periodo • devono essere accessibili in forma strutturata e integra per le prossime generazioni • per una società che cresce • la cura, la gestione e la conservazione dei data sets richiede nuove professionalità • si aprono prospettive di lavoro/formazione

  21. Open Research Data: progetti in corso OpenAIRE e OpenAIRE plus • un portale per l’accesso ai risultatie ai dati dellaricerca finanziatanel 7° ProgrammaQuadro • questionari/follow up http://www.openaire.eu/it

  22. Open Research Data: progetti in corso EUDAT: progetto collaborativo europeo per un’infrastruttura comune per i dati • evitare un nuovodigital divide:l’Europa deveprocedere allostesso passo http://www.eudat.eu/

  23. Open Research Data: progetti in corso in Italia produzione, l'archiviazione e la fruizione dei dati, un servizio di analisi avanzata sui dati prodotti dagli utenti che ne favorisce il riuso anche da parte di altre comunità scientifiche smartData: progetto finanziato dal CINECA per gestire le nuove problematiche “BigData” ed HPC fornendo, accanto all'infrastruttura per la

  24. Open Research Data: progetti in corsoin Italia http://mappaproject.arch.unipi.it/ • MAPPA - Metodologia Applicate alla Predittività del Potenziale Archeologico • Il primo open digitalarchaeologicalarchive italiano, che rende accessibili tutti i dati pubblici delle indagini archeologiche • Uso di sistemi e procedure standardizzate per la redazione e la gestione dei dati archeologici

  25. Open Research Data: progetti in corso DATACite, progettocollaborativo per ladescrizione standarddei datasets e la lorocitabilità via DOI • per l’Italia: CRUI • altri riferimenti tecnici CODATA, http://www.codata.org/ Open Data Commons,http://opendatacommons.org/ http://www.datacite.org/

  26. Indagine sulla gestionedei dati della ricerca in Italia http://survey.caspur.it/index.php?sid=54849&lang=it Indagine attualmente in corso stato dell’arte della produzione, gestione e conservazione dei dati della ricerca in Italia

  27. Grazie per l’attenzione http://www.openaire.eu/it http://www.medoanet.eu/ p.gargiulo@cineca.it

More Related