Data wat is het en hoe kun je het vinden ?

Marina Noordegraaf & Wouter Gerritsma. onderzoeksdata. Line-up Data, wat is het? definitie, research life cycle , data life cycle , data formats, open data, jullie data Waarom is het ineens zo'n HOT issue?

Data wat is het en hoe kun je het vinden ?

  1. Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma

  2. onderzoeksdata • Line-up • Data, wat is het?definitie, research life cycle, data life cycle, data formats, open data, jullie data • Waarom is het ineens zo’n HOT issue? • How to search 4 data repositories (waar vind ik ze?) • Oefening: zoek een data repository op jouw vakgebied en vind een dataset • Metadata en data citatie (linking research together) • How to search IN data repositories/data portals (hoe vind ik data)? • Oefening: zoek datasets in Narcis (data portal), DANS EASY, 3TU.Datacentrum, DANS Data Portal • Wrap-up (waarom vond ik wat ik vond?) • Staying up to data

  3. Research data is defined as the recorded factual material, commonly accepted in the scientific community as necessary to validate research findings “ “ http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1186&context=lib_research

  4. Alles wat van belang is voor het begrip/traceren van de publicatie. Niet alleen onderzoeksdata zelf, maar ook manier waarop data verzameld: Context, Metadata, SupplementaryMaterial

  5. DATA bijNATUURWETENSCHAPPEN • Observaties, nummers, meetpunten, coördinaten, frequenties, opgeslagen in b.v. spreadsheets en databases • Discipline-specifiek, b.v. • Life-Sciences: genexpressies, DNA-to-RNA translations, proteinsequences, eiwitstucturen, NMR data van biomoleculen • Sterrenkunde: foto’s, mapping the universe • …….

  6. DATA bijSOCIALE WETENSCHAPPEN • Survey-onderzoek • Interviews • Vragenlijstonderzoek • Data uit experimenten (je brengt mensen in voorbeeldsituaties en noteert wat ze doen) • Filmpjes/stimulusmateriaal bij deze experimenten • Programmatuur, simulaties (gefingeerde data) • Transcripts van rechtszaken, … • ..


  8. DATA FORMATS “ Een data formaat of bestandsformaat is de vorm waarin informatie gecodeerd is. De informatie is op zo'n manier gecodeerd dat een programma of toepassing (application) de data kan herkennen, lezen en gebruiken • “ http://dataintelligence.3tu.nl/ii-data-management/data-formaten/

  9. OPEN FORMATS • “ The safest option to guarantee long-term data access and usable data is to convert data to standard formats that most software are capable of interpreting, and that are suitable for data interchange and transformation http://www.data-archive.ac.uk/create-manage/format/formats • “

  10. OPEN FORMATS • “ This typically means using open or standard formats - such as OpenDocument Format (ODF), ASCII, tab-delimited format, comma-separated values, XML - as opposed to proprietary ones. Some proprietary formats, such as MS Rich Text Format, MS Excel, SPSS, are widely used and likely to be accessible for a reasonable, but not unlimited, time http://www.data-archive.ac.uk/create-manage/format/formats • “

  11. HOW (re)USABLE?

  12. DATA bijJULLIE ? • Welke data worden in jullie instelling geproduceerd ? • Van welke ruwe data maken jullie(onderzoekers) gebruik(of zouden ze gebruik vanWILLEN maken) ?

  13. Waarom is het ineens zo’n HOT issue?

  14. In almosteverylaboratory, “born digital” data proliferate in files, spreadsheets, or data-bases stored on hard drives, digital notebooks, Web sites, blogs, and wikis. The management, curation, and archiving of these digital data are becoming increasingly burdensomefor research scientists. “ “ http://www.cloudinnovation.com.au/Bell_Hey%20_Szalay_Science_March_2009.pdf

  15. http://blogs.ch.cam.ac.uk/pmr/2011/08/01/why-you-need-a-data-management-plan/http://blogs.ch.cam.ac.uk/pmr/2011/08/01/why-you-need-a-data-management-plan/

  16. 2011 “ Research misconduct includes fabrication, falsification, suppression, or inappropriate manipulation of data; inappropriate image manipulation; plagiarism; misleading reporting; redundant publication; authorship malpractice such as guest or ghost authorship; failure to disclose funding sources or competing interests; misreporting of funder involvement; and unethical Research http://publicationethics.org/files/A_consensus_statement_on_research_misconduct_in_the_UK.pdf “

  17. 2011

  18. 2012 • http://robbertdijkgraaf.com/pdf/Publicaties%20columns%20NRC/NRC_12_04_28_De_academische_lente.pdf

  19. http://www.freesoftwaremagazine.com/articles/can_open_source_software_drive_fourth_paradigmhttp://www.freesoftwaremagazine.com/articles/can_open_source_software_drive_fourth_paradigm

  20. Journals Data Availability Policy

  21. Journals Data Availability Policy

  22. Journals Data Availability Policy http://oad.simmons.edu/oadwiki/Journal_open-data_policies

  23. In the 21st century, information literacy is a key attribute for everyone, irrespective of age or experience. Information literacy is evidenced through understanding the ways in which information and data is created and handled, developing skills in its management and use and modifying attitudes, habits and behaviours to appreciate the role of information literacy in learning and research http://www.vitae.ac.uk/CMS/files/upload/Vitae_Information_Literacy_Lens_on_the_RDF_Apr_2012.pdf Information Literacy has gone data



  26. HOW 2 SEARCH 4 DATA directory of data repositories Zoeken naar data repository research data data paper data repository(institutional,domain specific (communitysupported)) data portal (regional, national, …) zoeken naar data in meerdere data repositories

  27. How to search 4 data repositories directory of data repositories Zoeken naar data repository research data data paper data repository(institutional,domain specific (communitysupported)) data portal (regional, national, …) zoeken naar data in meerdere data repositories

  28. Directory of Research Data Repositories • http://databib.org/ • http://datacite.org/repolist • http://oad.simmons.edu/oadwiki/Data_repositories • Discipline – Specifiek, b.v. http://biosharing.org/biodbcore • Perspectief: http://datacatalogs.org/ (m.n. Overheidsinfo)

  29. Directory of Research Data Repositories

  30. Directory of Research Data Repositories

  31. Research Data Repositories - discipline http://biosharing.org/biodbcore

  32. DATA bijJULLIE ? • Welke data worden in jullie instelling geproduceerd ? • Van welke ruwe data maken jullie(onderzoekers) gebruik(of zouden ze gebruik vanWILLEN maken) ?

  33. Oefening 1 • Zoek (b.v. via http://databib.org) een data repository op het vakgebied dat jij ondersteunt (of op één van de vakgebieden van jouw instelling) • Kies er één uit en ga zoeken naar een dataset • Hoe heb je de dataset gevonden?

  34. METADATA http://dataintelligence.3tu.nl/ii-data-management/metadata/

  35. METADATA Scientific metadata provide the information necessary for investigators separated by time, space, institution or disciplinary norm to establish common ground “ “ DataCite. (2011). DataCiteMetaDataScheme for the Publication and Citation of Research Data. http://schema.datacite.org


  37. METADATA The gray line separatesmedatafrom data


  39. DATA CITATION “ The practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to articles “ http://ands.org.au/guides/data-citation-awareness.html

  40. DATA CITATION “ Getting credit through formal citation, obtaining copies of articles that use the data, and learning of products or publications that use the data are just some of the conditions that will help encourage data sharing “ http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101

  41. PERSISTENT Identifiers Een Persistent Identifier identificeert het object zélf onafhankelijk van de plaats waar deze staat

  42. URN urn:nbn:nl:ui:13-7yu-x43 = http://www.persistent-identifier.nl/?identifier=urn:nbn:nl:ui:13-7yu-x43

  43. Handle

  44. DOI • DOI stands for "Digital Object Identifier (http://datacite.org/whatisdoi) • Gebaseerd op Handle, maar een handle maakt het niet uit WAT er geidentificeerd wordt terwijl een DOI gebaseerd is op een datamodel die uitgaat van relaties tussen objecten • Resolvea DOI http://dx.doi.org/ • Meer over persistent identifiers? • http://wiki.esipfed.org/index.php/Interagency_Data_Stewardship/Identifiers/Table • http://wiki.surf.nl/display/PersistentIdentifier/NL • http://www.doi.org/factsheets/DOIHandle.html


  46. http://www.icpsr.umich.edu/icpsrweb/ICPSR/curation/citations.jsphttp://www.icpsr.umich.edu/icpsrweb/ICPSR/curation/citations.jsp

