280 likes | 289 Views
IDRC u2013 Open research data initiative [109059-013] supported this study.<br>Su00e9rie integrante do curso sobre datasets<br>Material traduzido por Jose Dutra O Neto, Ildeberto A Rodello<br>Apoio: IDRC u2013 Open research data initiative [109059-013]
E N D
TutoriaisnaGestãode Dados Científicos Módulo 2: Compartilhamento de dados científicos Compartilhamento de dados no contexto do ciclo de vida dos dados, o valor do compartilhamento de dados, preocupações sobre o compartilhamento de dados e métodos e melhores práticas para o compartilhamento de dados. Photo by Michelle Chang. All Rights Reserved José Dutra de Oliveira Neto Ildeberto A. Rodello USP
Tópicosabordadosnesta aula CC image by Kevin Byron on Flickr • Compartilhamento de dados no ciclo de vida dos dados • Valor do compartilhamento de dados • Preocupações com o compartilhamento de dados • Métodos para tornar os dados compartilháveis
Objetivos de Aprendizado CC image by PictureYouth on Flickr • Após concluir esta aula, o participante será capaz de: • discutir considerações sobre compartilhamento de dados no ciclo de vida dos dados • reconhecer os benefícios do compartilhamento de dados científicos • abordar preocupações sobre o compartilhamento de dados • Elaborar um método para tornar os dados compartilháveis • identificar mecanismos para compartilhar dados
Ciclo de Vida • Descrever o conteúdo, especificidades e processo dos dados • Descrever O ciclo de vida dos dados • Armazenarem um local ondepodem ser acessados • Depositar • Selecionarformato e tipos de mídias que podem ser preservado no longoprazo • Preservar • Publicarinformaçõessobreos dados para que outros possamencontrá-los • Publicar Vários estágios requerem atenção para garantir o compartilhamento eficaz de dados
Valor Por que compartilhar dados? CC image by Jessica Lucia on Flickr O compartilhamentorequeresforço, recursos e confiançanos outros. Por que compartilhar? Para beneficiar: • O públicoemgeral • O patrocinador da pesquisa • A comunidade de pesquisa • O própriopesquisador
Valor Valor do compartilhamento de dados para o público em geral CC image by falonyates on Flickr Um público mais bem informado gera confiança na pesquisa científica e pode gerar melhores decisões com relação a: • Planejamento ambiental e econômico • Políticas federais, estaduais e municipais • Escolhas sociais, como a melhor aplicar dos recursos oriundo de impostos e opções de investimentos na educação • Estilo de vida e saúde, como alimentação e lazer
Valor Valor do compartilhamento de dados para o patrocinador do pesquisador • As organizações que patrocinam as pesquisas devem maximizar o valor dos investimentos e assim investir cada vez mais • O compartilhamento de dados aumenta o valor dos investimentos em pesquisa, permitindo: • Mensurar os resultados da pesquisa • Incentivo as novas pesquisas e o aumento do retorno do investimento • Avanço da ciência • Evita recursos alocados desnecessariamente em dados duplicados • Melhorar e ampliar a disseminação ciência
Valor Valor do compartilhamento de dados para a comunidade científica CC image by Lawrence Berkeley National Laboratory on Flickr O acesso aos dados permite que os membros da comunidade: • Possam dar continuidade nos trabalhos de outros pesquisadores para contribuir com sua evolução e não apenas repetir4 • Integrar pesquisas interdisciplinares • Realizar meta-análises5 • Compartilhar recursos e perspectivas para que a compreensão dos dados seja ampliada e aprimorada5 • Aumentar a transparência, reprodutibilidade e comparabilidade dos resultados5 • Permitir a avaliação, recomendações e melhorias da metodologia6
Valor Valor do compartilhamento de dados para o pesquisador CC image by SLU Madrid Campus on Flickr Os pesquisadores que compartilham dados são beneficiados: • Reconhecimento do patrocinador de sua pesquisa como uma fonte relevante e como um bom investimento • Melhoria da qualidade dos dados devido ao tratamento, checagem e feedback • Maior oportunidade para intercâmbio de dados • Novas conexões com redes científicas de colaboração
Preocupações com compartilhamento Preocupações com o compartilhamento de dados CC image by CyberHades on Flickr Mesmo que o valor do compartilhamento de dados seja reconhecido, permanecem as preocupações quanto aos impactos do aumento da exposição de dados e suas consequências.
Preocupações com compartilhamento Preocupações com o compartilhamento de dados
Preocupações com compartilhamento Preocupações com o compartilhamento de dados
Preocupações com compartilhamento Preocupações com o compartilhamento de dados
Preocupações com compartilhamento Preocupações com o compartilhamento de dados
Preocupações com compartilhamento Preocupações com o compartilhamento de dados
Preocupações com compartilhamento Preocupações com o compartilhamento de dados metadata metadata metadata metadata
Preocupações com compartilhamento Preocupações com o compartilhamento de dados
Tornando os dados compartilháveis Step One: Create robust metadata that is discoverable • metadata should be complete, correct, document methodology for reproducibility and provide provenance • specify geography and time periods • use discipline specific theme, place and temporal keywords, thesauri, and ontologies • describe attributes • include links to associated data catalogues, data downloads, project websites, etc.
Tornando os dados compartilháveis Step Two: Include archival and reference information. For example: • properly formatted data citations for the data and all sources • Universally Unique Identifiers (UUID) that uniquely identify your data and help to link the data with the metadataSee the DataONE unique identifier guidance at: http://mule1.dataone.org/ArchitectureDocs-current/design/PIDs.html Data Citation format:https://www.datacite.org/services/cite-your-data.html Data Citation Example: Sidlauskas, B. 2007. Data from: Testing for unequal rates of morphological diversification in the absence of a detailed phylogeny: a case study from characiform fishes. Dryad Digital Repository. doi:10.5061/dryad.20
Tornando os dados compartilháveis Step Three: Have data contributors review your metadata to ensure validity and organizational ‘correctness’? • are the methods / techniques described accurately? • are all contributions adequately identified? • has the appropriate management reviewed the product and documentation? • is the funding organization properly recognized?
Tornando os dados compartilháveis Step Four: Publish your metadata and/or data via: e.g. Federal Data Catalogs • data.gov e.g. Data Repositories • Knowledge Network for Biodiversity (KNB) Data Portal • Long Term Ecological Research (LTER) Network Data Portal • Institutional data repositories e.g. Other Online Resources • Project and/or Program websites • Web-accessible folders (WAF) • Community or Public Cloud Searchable directory of repositories for publishing your data • http://service.re3data.org/search
Melhorespráticas • Monitor publications and websites for data use and address misapplications • Documentar e publicar dados usando padrões universais • Promover o uso de dados por meio de apresentações • Solicitar feedback dos usuários de dados e resolver os problemas identificados • Monitorar publicações e sites para uso de dados e corrigir erros de aplicação
Resumo • Data sharing adds value to the data • It is the responsibility of the researcher to share their data • Metadata supports data accountability, liability, and usability • Sponsors expect, some require, data to be shared • Data sharing is essential to the advancement of science
Referências • Inter-university Consortium for Political and Social Research (ICPSR), ICPSR Guide to Data Preparation and Archiving: Best Practice Throughout the Data Life Cycle (ICPSR, 2009; http://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdf). [4th Edition] • Australian Bureau of Statistics - National Statistical Service (ABS-NSS), A good practice guide to sharing your data with others (ABS-NSS, 2009; http://www.nss.gov.au/nss/home.nsf/NSS/E6C05AE57C80D737CA25761D002FD676?opendocument). [Vers. 1] • H.A. Piwowar, A new task for NSF reviewers: Recognizing the value of data reuse. ResearchRemixvers. May 28, 2011 (http://researchremix.wordpress.com/2011/05/28/dear-nsf-reviewers/). [blog posting of draft] • H.A. Piwowar, M.J. Becich, H. Bilofsky, R.S. Crowley, Towards a Data Sharing Culture: Recommendations for Leadership from Academic Health Centers. PLoS Med. 5(9), e183 (2008), doi:10.1371/journal.pmed.0050183. [on behalf of the caBIG Data Sharing and Intellectual Capital Workspace]
References • J.L. Teeters, K.D. Harris, K.J. Millman, B.A. Olshausen, F.T. Sommer, Data Sharing for Computational Neuroscience. Neuroinform (2008), DOI 10.1007s12021-008-9009-y. [http://redwood.berkeley.edu/fsommer/papers/teetersetal08.pdf] • National Institute of Health (NIH) “NIH Data Sharing Policy and Implementation Guidelines” (NIH, Washington D.C., 2003, http://grants.nih.gov/grants/policy/data_sharing/data_sharing_guidance.htm). • R. Geambasu, S.D. Gribble, H. M. Levy, "CloudViews: Communal Data Sharing in Public Clouds" In Proceedings of the First USENIX Workshop on Hot Topics in Cloud Computing (HotCloud), San Diego, USA, June 2009. [Paper: PDF; Presentation: PPT, PDF] • J. Niu, “Reward and Punishment Mechanisms for Research Data Sharing”. IASSIST Quarterly, Winter (2006).
References • C.L. Borgman, “Research Data: Who will share what, with whom, when, and why?”in Proceedings of the China-North American Library Conference, Beijing , September 2010 (http://works.bepress.com/borgman/238/).
The full slide deck may be downloaded from: http://www.dataone.org/education-modules Suggested citation: DataONE Education Module: Data Sharing. DataONE. Retrieved Nov12, 2012. From http://www.dataone.org/sites/all/documents/L02_DataSharing.pptx Copyright license information: No rights reserved; you may enhance and reuse for your own purposes. We do ask that you provide appropriate citation and attribution to DataONE.