450 likes | 611 Views
電子檔案長期保存策略. 檔案管理局 檔案資訊組. 大 綱. 電子檔案長期保存需求及議題 電子檔案長期保存方法 電子檔案國際重要計畫 電子檔案長期保存策略. 2014/10/5. 2. 電子檔案長期保存需求及相關議題. 數位化的目的與風險. 2014/10/5. 成本. 便利. 安全. 效益. 風險 電子檔案儲存媒體 ! 電子檔案格式 ! 系統與軟體 ! 硬體設施 ! 人員維修能力 ! 保存方法 ! 安全 !. 數位化目的 歷史記憶資產保存 ? 學術研究 ? 民眾應用 ?. 數位化只會加重成本 , 不會減少支出.
E N D
電子檔案長期保存策略 檔案管理局 檔案資訊組
大 綱 電子檔案長期保存需求及議題 電子檔案長期保存方法 電子檔案國際重要計畫 電子檔案長期保存策略 2014/10/5 2
數位化的目的與風險 2014/10/5 成本 便利 安全 效益 • 風險 • 電子檔案儲存媒體! • 電子檔案格式! • 系統與軟體! • 硬體設施! • 人員維修能力! • 保存方法! • 安全! • 數位化目的 • 歷史記憶資產保存? • 學術研究? • 民眾應用? 數位化只會加重成本,不會減少支出 不要為了數位化而數位化 數位記憶會消失 4
wav 、mp3、 midi、wma、ra 聲音檔案 文字檔案 xml、pdf、odf 、 txt、rtf、doc、 ppt、 圖片、影像檔案 tiff 、png、jpeg、wdl、 Pdf、iges、dxf、step、 jpg、bmp、gif 影音、視訊檔案 mpeg-2、avi、mpeg-4、 wmv、rm、mov 電子檔案格式
電子檔案國際上重要計畫 芬蘭 2010年國家檔案館策略 英國 數位化專案、PRONOM計畫 荷蘭 E-DePot Dioscur計畫 歐盟 MoReq 加拿大 InterPARES計畫 美國 ERA計畫 我國 國家檔案數位服務計畫 澳洲 維多利亞省VERS策略 團體計畫 8
加拿大 InterPARES計畫The International Research on Permanent Authentic Records in Electronic Systems • 第一階段,時程為1999至2001年,主要研究在電子資訊系統或電子文件紀錄中,電子檔案擇選的方法及保存作業,共分為電子檔案真實性(Authenticity)、電子檔案評鑑(Appraisal)、電子檔案保存(Preservation) 及電子檔案發展策略(Strategy)等四大領域。 • 第二階段,時程為2002至2006年。目標著重在藝術、科學及電子化政府等不同領域之電子檔案,確保這些電子檔案的真實性、可信賴性的概念、原則、條件、標準及方法論。
美國ERA計畫Electronic Records Archives • 美國國家檔案及文件署 (National Archives and Records Administration,NARA)與聯邦政府合作,發展電子檔案管理的政策與規範。 • 發展及維持讀取、保存、描述、使用與清理政府電子檔案的能力。 • 發展一套全國一致且持久的電子檔案管理系統。 • 確保任何人在任何時間、地點,都能找到方法使用所保存的電子檔案。 • 在電子檔案的蒐集、保管、清理等不同生命週期,都可隨時使用該檔案。
澳 洲團體計畫(Corporate Plan) • 澳洲國家檔案局在2006年至2009年團體計畫,提出國家檔案兩大目標與策略: • 提供各機關檔案管理之軟體產品與服務,並且確保電子檔案具完整、真實與可靠性。 • 確保澳洲人民均可存取由國家檔案局保存之寶貴資料,讓民眾更進一步瞭解國家之歷史背景與民主制度。
澳洲維多利亞省 VERS Victorian Electronic Records Strategy • 訂定一套具體的電子檔案標準格式 • 可與現行檔案管理系統相容。 • 確保各種系統所產生之檔案,未來皆可被讀取與閱覽。 • 提供自動蒐集檔案的具體方法,使各種來源之檔案均可妥善保管。 • 提出封裝電子檔案的具體方法,使電子檔案之相關資料,在未來仍可完整與清楚的呈現。 • 規劃確保檔案安全之方法,可偵測檔案是否遭到竄改。
歐盟Planets計畫Preservation and Long-term Access through Networked Services • 此計畫的參與單位包括16 個來自歐盟體系的圖書館、檔案管理局、大學、廠商,並由英國國家圖書館負責相關協調工作。 • 為確保數位資料的長期保存與讀取,於2006開始為期四年、約1,400萬歐元的Planets計畫。
歐盟 MoReq規範Model Requirements for the Management of Electronic Records • 於1996年12月成立的歐洲委員會論壇 (DLM Forum) ,集合許多專家共同討論資訊化社會中,重要文化的保存問題,認為電子檔案管理必須有一個標準的需求規格(Model Requirements)。 • 在2001年由Cornwell管理顧問公司提出電子檔案管理功能需求規範MoReq,此規範主要是幫助組織確認電子檔案管理系統與程序符合檔案管理原則的要求,目前為全歐洲電子檔案管理的主要規範。
歐盟 MoReq2規範 • 2006年,歐盟擴大MoReq需求規範成MoReq2 主要功能需求: • 分類表和檔案組織(Classification Scheme and file organization) • 控制與安全(Controls and Security) • 保管與清理 (Retention and Disposition) • 取得(Capturing Records) • 引用參考(Referencing) • 查詢檢索與呈現(Searching, Retrieval and Presentation) • 管理功能(Administrative Functions) • 選用模組(Optional Moduls)
英國 數位化專案Digitization Programme) • 英國國家檔案局於2005年至2011年間推行數位化專案。 • 確立數位化檔案的優先順序(如:優先數位化目前最受民眾歡迎的檔案)、時程(如:開放大眾使用網路檢索閱覽的時間表)。
特性描述 (Characterization) 技術知識庫服務 (Technical Registry Services) 長期保存作為 (Preservation Action) 長期保存規劃 (Preservation Planning) 英國 PRONOM計畫 • 任何在辦公室電腦所產生的文書處理軟體、電子郵件、電子試算表、簡報資料、圖形、影像與網頁資料文件等都列入作業涵蓋範圍。 • 發展線上資訊系統,提供需要者以文件閱覽軟體(Viewer)閱覽電子檔案,並研訂長期保存策略。 • 消極性長期保存策略,如提供安全的儲存環境及存取控制機制。 • 積極性長期保存策略,如提供技術知識庫服務。
荷蘭 e-Depot計畫 • 荷蘭國家圖書館於2003年提出的e-Depot計畫,其中一部分就是在進行長期保存研究案,目的是要發展一套電子文件長期保存策略,確保長期保存數位出版品的有效性。 • 荷蘭國家圖書館、荷蘭國家檔案局及Tessella Support Service公司在2005年1月至2007年7月共同合作推動Dioscuri計畫,主要是發展模組化的模擬器。 • 2008年11月公布0.4.0版模擬器,免費提供下載。 • 2009年持續進行實驗及開發模組函式庫(Module Library),並將整合至e-Depot(電子資料庫Electronic Repository)作業流程中,預計2010開始提供模擬服務。
荷蘭Dioscuri計畫架構 資料庫 文件 函式庫 中央處理器 資料庫管理系統 應用軟體 瀏覽器 原始系統軟體(作業系統) 記憶體 模擬器的 規格文件 模擬器模組 硬碟 光碟 圖形 啟動虛擬機器 及模擬器 聲音 載入 虛擬機器 控制器 介面 未來作業系統 未來硬體
芬 蘭 2010年國家檔案館策略 • e化服務是客戶服務的重點。 • 發展及健全電子檔案存取和長期保存的檔案管理系統。 • 落實電子檔案長期保存和安全,確保資訊的完整性與可用性。 • 制訂處理電子檔案生命週期之管理規範。 • 培訓發展電子檔案管理專業知識。
綜合各國計畫重點 • 電子檔案有效性的確保 • 真實性、完整性、可及性 • 電子檔案長期保存方法的發展 • 檔案格式、儲存媒體、保存技術 • 電子檔案的呈現與應用 • 內容呈現、原貌重現、網路應用 • 電子檔案管理專業知識的訓練 • 概念、實作 • 電子檔案生命週期管理規範的制訂 • 產生、蒐集、保管、清理、檢調、應用、稽核、安全
常見保存方法-系統保存與複製 • 系統保存:將電腦軟硬體完整保留下來,類似建立電腦博物館。 優點:可以完整呈現檔案原貌。 缺點:過期軟、硬體無人能懂,系統異常無人能救,硬體故障無人能修,零件損壞沒有備料可供更換。 • 複製(Replication):為降低軟硬體故障的風險,在一個或多個系統上重複製作一份或多份相同的資料,同時可辦理異地存放。 優點:簡單方便。 缺點:無法解決電子檔案格式與硬體過時的問題。
常見保存方法-更新 • 更新(Refreshing):為防止儲存媒體過時或失效,將電子檔案內容從一儲存媒體複製至新的儲存媒體。如察覺3.5吋磁片即將被淘汰,在軟碟機還存在時,提前將磁片內的檔案複製抄寫到光碟片或隨身碟等媒體。 優點:簡單方便。 缺點:無法解決電子檔案格式過時的問題。
常見保存方法-轉置 • 轉置(Migration):根據Commission on Preservation and Access(CPA)及Research Libraries Group(RLG)的研究報告-轉置是指定期將數位資源從舊有的軟體或硬體上轉移到新的,或是從舊有的電腦科技轉移到新的電腦上。其定義涵蓋了「更新refresh」媒體以及「轉移migration」系統兩種概念。 • 機關電子檔案管理作業要點-轉置係指電子檔案之軟硬體過時或失效,需進行軟硬體格式轉換,以便日後可讀取之作業程序。
常見保存方法-轉置 • 特點: • 改變原始電子檔案格式的結構。 • 因應資訊科技環境的變化,仍能有效讀取檔案內容。 • 目前在國際間最常被使用的方法。 例:WDLTIFF或、DOC TIFF或PDF。 Unix Linux、C語言Java語言 • 缺點: • 轉置過程易有錯漏。 • 轉置過程產生的錯漏資料,會被無限繁衍。 • 需輔以人工檢核,當進行大量檔案轉置作業時,造成檢核的困難。
電子檔案保存格式 類型 格式 說明 文字檔 XML 一、開放性標準。 二、電子公文傳遞交換格式。 PDF 一、業界認定可攜性文件格式。 二、文書及檔案管理電腦化作業規範所訂文字檔格式。 圖片檔 JPEG 一、如檔案係以影像掃描製作,一律採全彩,壓縮品 質為75%以上 ,解析度300 DPI以上。 二、開放性標準。 聲音檔 MP3 開放性標準。 WAV 一、開放性標準。 二、文書及檔案管理電腦化作業規範所訂聲音檔格式。 視訊檔 MPEG-2 一、開放性標準。 二、文書及檔案管理電腦化作業規範所訂動態影像 檔格式。 AVI 專屬軟體。 27 摘自機關檔案管理資訊化作業要點附件九
類型 格式 說明 工程圖檔 IGES 美國國家標準(ANSI Y14.26M)。 DXF 開放性標準。 STEP 國際標準(ISO/IEC10303)。 文字影像檔 JPEG 一、彩色影像:採全彩,壓縮品質為75%以上,解析度200 DPI以上。 二、開放性標準。 TIFF 灰階影像:採解析度200 DPI以上。 TIFF 一、黑白影像:採CCITT G4標準,解析度300 DPI以上。 二、業界認定開放性標準。 PDF 業界認定可攜性文件格式。 WDL 國內開發之可攜性文件格式。 PNG 一、索引色影像:採256色ZIP非破壞性壓縮,解析度300DPI以上。 二、線上簽核使用追蹤修訂功能時,採用本格式產生簽核頁面。 數位墨水 ISF 一、手寫簽核資料採用本格式以筆跡方式存檔。 二、筆跡檔案業界認定開放性標準。 28
常見保存方法-模擬 • 模擬(Emulation):於現有的技術環境下,將數位資料回復其原始作業環境,藉以呈現原有資料。 • 模擬的方式可分為硬體模擬硬體、軟體模擬硬體及軟體模擬軟體。 特點: • 保留原始作業系統、應用軟體及環境,確保原始環境的真實性。 • 運行在虛擬機器的軟體,就被侷限在虛擬機器提供的資源中,亦即它不能超出虛擬世界。 缺點: • 模擬器的設計與建置不易,技術門檻高,成本亦高。 • 因應長期保存,模擬器仍需面臨再設計與轉置的問題。 • 實務上尚無真實應用案例,英國的JPC計畫、荷蘭的e-Depot計畫仍屬計畫實驗階段。
原始數位文件 原始應用軟體 原始數位文件 原始作業系統 原始應用軟體 模擬器 原始作業系統 未來作業系統 原始硬體 未來硬體 模擬架構圖 常見保存方法-模擬
2005年原始環境 2005年原始環境 2010年 原始環境 2015年環境 Time 2005年 2010年 2015年 堆疊式模擬(Stacked emulation) 應用軟體 模擬器 作業系統 硬體平台 From:Modular emulation as a long-term preservation strategy for digital objects, (摘自:數位物件長期保存策略之模擬器模組) http://www.iwaw.net/05/papers/iwaw05-hoeven.pdf
2005年原始環境 2005年原始環境 Time 2010年 2015年 轉移式模擬(Migrated emulation) 產生 編譯器 模擬器 作業系統 硬體平台 • From:Modular emulation as a long-term preservation strategy for digital objects, • (摘自:數位物件長期保存策略之模擬器模組) • http://www.iwaw.net/05/papers/iwaw05-hoeven.pdf
常見保存方法-封裝 • 封裝(Encapsulation):將電子檔案及銓釋資料,以包裹方式儲存之。 特點:保留原始環境的資訊,亦即將電子檔案的內容、架構與關聯性訊息都打包封存,目的在於保存電子檔案的完整性,做為後續長久保存策略的應用,確保使用者可以在持續改變的新科技中繼續檢索與使用。 缺點:檔案大小只會長大不會變小,檔案愈大,效率愈差。
常見保存方法-封裝 封裝物件 詮釋資料 檔案層 詮釋資料 文件層 詮釋資料 編碼層 詮釋資料 文件一 編碼一 內文資料 封裝物件 文件二 編碼二 文件三 編碼三 識別區塊 編碼 文件 封裝 檔案
常見保存方法-標準化與其他 • 標準化(Standardization):將電子檔案格式朝向簡單化、開放式、標準化訂定,建立國際標準,提供大家共同依循使用。 • 列印成紙張(Converting to Paper),惟影音檔案則無法以紙本呈現。 • 其他瀏覽媒體(Analog Media)如微縮處理 • 綜觀各類保存方法,各有特色,可解決的問題亦有差別,現階段言,單一方法實難解決電子檔案的複雜環境,惟有因應不同的狀況,各種方法相互搭配運用,方能產生一套具體完整的長期保存策略。
國家檔案數位服務計畫 電 子 檔 案 教 育 訓 練 國 際 合 作 交 流 電 子 檔 案 法 規 研 修 檔案資訊系 統驗證作業 專家顧問 團隊 電子檔案技術服務中心 電子檔案轉置模擬 暨 過時必備軟硬體典藏實驗室 監督 協調 導入 規定 軟體 設計 建置 應用 發展電子檔案,傳承歷史紀錄 長期保存 長期安全 保存格式 電子檔案長期保存架構平台 人力 經費 國家檔案數位服務計畫(97至100年)
封裝(Encapsulation)+系統保存 (system Preservation)+複製作業 (Replication) 價值及技 術鑑定 & 保存年 限檢視 檔案 保存年限 ≦10年 封裝+格式轉置(Format Migration) 例:文字檔、圖片檔、聲音檔、視訊檔、 工程圖檔、文字影像檔、數位墨水檔 等靜態格式 符合 電子檔案 保存格式 封裝+模擬(Emulation) 例: DB、Web、AP 、E-Mail等動態格式 檔案 電子檔案長期保存架構 是 否 是 電子檔案生成時,即進行metadata 著錄,並進行封裝;各類保存方式 互相搭配運作,產生完整策略。 否
預覽檔案 應用檔案 符合 電子檔案 保存格式 使 用 者 保存檔案 格式解析 轉換NAA 標準格式 NAA 閱覽軟體 格式庫 電子檔案長期保存架構
電子檔案長期保存與相關管理技術規劃架構 國 際 合 作 教 育 訓 練 成果應用 技術服務中心、 電子檔案線上百科系統 核心技術 電子檔案長期保存技術平台 基礎建置 電子檔案定義/格式/管理 法規修訂 諮詢服務、專家黃頁、查詢系統 數位課程、實體課程、研討會、焦點座談會 主辦國際研討會、參加國外研討會、參訪國外檔管機構 轉置、模擬、技術保存(含軟、硬體)、標準化格式 檔案電子儲存管理辦法 機關電子檔案管理作業要點 機關檔案管理資訊化作業要點
執行程序 • 一、籌劃階段 • 邀請專家學者,成立檔案資訊諮詢委員會,提供諮詢及監督電子檔案長期保存架構平台建置案之執行。 • 調查各機關數位化的檔案數量、格式及種類,擇定部分機關進行實地訪談,俾瞭解電子檔案狀況及機關需求。 • 探討國際間電子檔案發展趨勢、管理機制及相關技術。 • 研析電子檔案生命週期及剖析電子檔案國際標準(ISO15489),承接國際電子檔案長期保存研究成果。 • 參訪、見習、參加國際相關研討會,吸取經驗及成果。 • 成立電子檔案長期保存技術服務專案,加入民間專家顧問及導入學界技術,協助建置作業。
執行程序 • 二、建置階段 • 技轉多媒體資籵長久保存技術、老舊影像及影片數位化檔案內容的修護技術,強化檔案內容的清淅辨識。 • 針對各機關已無法開啟之檔案格式、數量、儲存媒體及作業方式,研究規劃過時必備軟硬體、知識地圖及專家黃頁,整合電子檔案百科系統,建立機關間共通交流平台。 • 研究電子檔案儲存媒體、檔案格式、資訊安全及我國與國際間電子檔案的差異性與需求,設計實作轉置機制。 • 擇選機關進行電子檔案清理、銷毀、移轉(交)作業,評估檢討改進。 • 建置電子檔案長期保存實驗室,研發電子檔案保存及應用機制。 • 建立電子檔案技術服務中心,提供諮詢及技術服務。
執行程序 • 三、營運階段 • 規劃辦理宣導營運作業,技術服務中心正式對外服務。 • 規劃辦理國內外電子檔案研討會及成果發表。 • 辦理電子檔案教育訓練,強化機關檔案管理工作知能。 • 研修電子檔案相關法規,評估移轉年限,強化技術鑑定作為,訂定各類型檔案長期保存格式、環境及衍生之長期安全議題。 • 增加國際經驗交流、研討及合作機會,隨時引入國外先進技術、法規及經驗。 • 訂定追蹤評估機制,建立追蹤紀錄、定期稽核、評估改進及調整作業方式。