1.02k likes | 1.3k Views
GBIF 發布生物多樣性資料 Darwin Core Archive 格式與 IPT2 資料發布平台介紹. 賴昆祺 中央研究院生物多樣性研究中心. 2013/11/21. 大綱. 四個 資料分享流程 六個 非用 Darwin core 的理由 十分鐘 教你看懂 Darwin core 八個 使用 Darwin core archive 要注意的事情 一個 好工具分享 --IPT 介紹 一個 用 DwC -A 經典範例 --Data paper 投稿範例. 先別說這個了 , 你 聽 過 Darwin core 嗎 ?. 是. 否.
E N D
GBIF 發布生物多樣性資料 Darwin Core Archive 格式與 IPT2 資料發布平台介紹 賴昆祺 中央研究院生物多樣性研究中心 2013/11/21
大綱 • 四個資料分享流程 • 六個非用Darwin core 的理由 • 十分鐘教你看懂Darwin core • 八個使用Darwin core archive要注意的事情 • 一個好工具分享--IPT 介紹 • 一個用DwC-A經典範例--Data paper投稿範例
先別說這個了, 你聽過Darwin core嗎? 是 否
您認為這麼辛苦整理資料, 是為了? 給其他有需要的人看,方便閱讀 給機器看,加速資料分享 計畫要求
學名檢查工具 http://taibif.tw/BDTools
地理座標檢核 • 上傳EXCEL檔案,檔案中包含三個欄位資訊,分別為loc(地點文字說明)、x(經度)、y(緯度)
資料發佈流程 Darwin core Archive 資料分享工具 52 country participants, 38 international organizations; 417,529,910 indexed records, 10,004 datasets, 464 publishers
利用IPT上傳研究成果中名錄資料/出現記錄 從Word/ Excel 檔整理
利用IPT上傳研究成果中名錄資料/出現記錄 參考Darwin core 定義與說明 • 利用EXCEL • 建檔
利用IPT上傳研究成果中名錄資料/出現記錄 • 工具的檢查
利用IPT上傳研究成果中名錄資料/出現記錄 • IPT • 資料發佈
Darwin core Archive 的重要性 • 1.生物多樣性資料分享的國際標準 • ABCD • > 1200 詞彙(欄位) • Shared via BioCase • Darwin core (v 1.2) • 48 詞彙(欄位) • Shared via by DiGIR • Darwin Core (v. 1.4) • 46 詞彙(欄位) • Shared via Tapir • Darwin Core (TDWG Standard, since 2009) • 172詞彙(欄位) BY Kyle Braak
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 By GBIF Annual Report 2012
有哪些組織在用Darwin core • 美國生物多樣性典藏數位化計畫(Advancing Digitization of Biodiversity Collections) • 澳洲生物地圖集(Atlas of Living Australia, ALA) • 台灣數位典藏國家型計畫
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 台灣石珊瑚誌
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 台灣真菌誌
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 台灣蝽象誌
學名 圖檔名稱 描述 分布 棲地 文獻 註解 學名 圖檔名稱 中文名 文獻 描述 分布 棲地 學名 中文名 科名 同物異名 標本採集號 描述 分布 文獻
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 • 3. 回傳一致的搜尋結果
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 • 3. 回傳一致的搜尋結果 • 4. 學術出版
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 • 3. 回傳一致的搜尋結果 • 4. 學術出版 • 5. 資料備份 • 生物多樣性面臨的危機 • 環境破壞、物種滅絕 • 累積的資料知識失落
Darwin core Archive 的重要性 • 1. 生物多樣性資料分享的國際標準 • 2. 結構化資料 • 3. 回傳一致的搜尋結果 • 4. 學術出版 • 5. 資料備份 6.資料可再利用與分析,Ecological Niche Model Analysis / Applications
Darwin core archive Darwin Core
物種出現紀錄(Primary Biodiversity Data) • 物種出現紀錄包含博物館動物標本、植物標本、生態調查與物種觀察等資料。
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm dcterms:modified:最後修正日期 資料中的任何欄位修正完成時的日期及時間。使用ISO-8601格式,如:1994-11-05
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm dcterms:rights:資料授權的方式 如:創用CC 姓名標示、姓名標示─非商業性
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm • basisOfRecord:資料基底,如: • PreservedSpecimen- 標本收藏 • FossilSpecimen- 化石標本 • LivingSpecimen- 活體標本 • HumanObservation- 人為觀測 • MachineObservation- 機器觀測 • StillImage- 靜態影像 • SoundRecording- 錄製聲音 • OtherSpecimen- 其它標本
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm recordedBy:資料記錄者 為主要的採集者或觀測者
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm samplingProtocol:採集方法 如採集時使用方法或步驟的名稱、參考或簡短描述。例如:紫外光陷阱、霧網、底拖網
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm eventDate:資料發生日期 如採集日期,1997-12-02
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm locality:位置、採集地,如里龍山 decimalLatitude:十進位緯度,採集或觀測事件發生地點中心位置的緯度,以十進位表示 decimalLongitude:十進位經度,採集或觀測事件發生地點中心位置的經度,以十進位表示
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm scientificName:學名, 該分類群最低階層的完整名稱,應採用最近被接受的分類方式,盡可能地精確,包含作者、發表年代、看法引證來源、不確定性的指示。 例如: "Coleoptera" (目), "Vespertilionidae" (科), "Manis" (屬), "Ctenomyssociabilis" (屬 + 種小名), "Ambystomatigrinumdiaboli" (屬 + 種小名 + 亞種小名), "Quercusagrifolia var. oxyadenia (Torr.) J.T. Howell" (屬 + 種小名 + 種下階層 + 種下名 + 學名作者
Darwin core is divided into classes and terms • http://rs.tdwg.org/dwc/terms/index.htm taxonRank:分類等級 該分類群最低階層的等級,如"subspecies", "varietas", "forma", "species", "genus“, “family”
Darwin core extension • http://rs.tdwg.org/dwc/terms/index.htm paleontology - 古生物學常用詞彙已經被整合到GeologicalContext
Darwin core 的近期發展 • Darwin core 與基因多樣性的標準
Darwin core 的更改記錄 • http://rs.tdwg.org/dwc/terms/history/index.htm
8 個運用Darwin core要注意的事情(1) • 對於分享的每一筆記錄,需要產生一個獨特唯一的”核心 ID(core ID)” • 流水編號 • lsid
8 個運用Darwin core要注意的事情(2) • 盡可能使用Darwin core 欄位
8 個運用Darwin core要注意的事情(3) • 不要使用類別名稱,如Occurrence, Event, MaterialSample, Location, Taxon
8 個運用Darwin core要注意的事情(4) • 使用Darwin core已經定義的說明
8 個運用Darwin core要注意的事情(5) • 盡可能的填上所調查資料屬性
8 個運用Darwin core要注意的事情(6) • 格式需要符合定義的規範
8 個運用Darwin core要注意的事情(7) • 若有些資料被想公開,可以用informationWithheld來加以說明 • 如:此物種為瀕危物種,因此座標隱藏(location information not given for endangered species)