590 likes | 772 Views
多媒體製作設計與評估 -- 多媒體資料製作及典藏管理概論. Jian-hua Yeh ( 葉建華 ) au4290@email.au.edu.tw. Outline. Internet evolution Digital repository(DR) issues Digitization Naming Service structure Conclusion. Evolution of the Net (Schatz, NCSA). Phase I: Access Document fetching only Phase II: Organization
E N D
多媒體製作設計與評估--多媒體資料製作及典藏管理概論多媒體製作設計與評估--多媒體資料製作及典藏管理概論 Jian-hua Yeh (葉建華) au4290@email.au.edu.tw
Outline • Internet evolution • Digital repository(DR) issues • Digitization • Naming • Service structure • Conclusion
Evolution of the Net (Schatz, NCSA) • Phase I: Access • Document fetching only • Phase II: Organization • Repository searching • Phase III: Analysis • Information correlation • Goal: • from data transmission to information manipulation
Management Issues • Major issue in digital repository management • Contents management
Contents Management Issues • Digitization issues • Preparation of digital contents for DRs • Organization of digital contents in DRs • Design issues • Workflow for DRs • Services of DRs
Preparation of Digital Contents • Conceptual data types is different from physical data types • Conceptual: human’s recognition • Music, opera, dancing, art, literature, movie, construction, etc. • Physical: computer’s recognition • Text, image, audio, video, etc.
Digital Formats for DRs • Digitization principles: • For both preservation and service needs. • Multiple resolution for different goals. • Preservation: for long-term needs and reproduction • Service: for online needs and demonstration
Digital Formats for DRs (2) • Pictorial Materials (images) • Textual Materials (text) • as searchable text • as images • Sound Recordings (audio) • Moving-image Materials (video)
Work Flow in DR System: Processing Stages • Preparation Stage • Digitization Stage • Integration & Service Stage
Stage I : Preparation Work • Target objects identification • Metadata, raw image, raw text • Digitization specification • Metadata creation spec • Image creation spec • Text creation spec • Information accessing methods definition • Data repository and retrieval
Digitization Specification (1) • Metadata spec • Domain experts • Library science experts • Computer science experts • Image spec • 3rd party • Computer science expert
Digitization Specification (2) • Text spec • 3rd party • Computer science expert • Other media • Sound recordings, moving-image materials,etc.
Metadata Specification • Properties to describe • Property identification • Property hierarchy • Structural data representation • Property sectioning • Property clustering • Suitable for international standards such as Dublin Core, etc.
Image Specification • 3 level images to make • Image properties • Image resolution • Color depth • File format(compression standard) • Image file naming • Consistent with metadata
Preview, Thumbnail Image • Tonal depth: 8 bits/pixel • Format: GIF • Compression: Native to GIF • Spatial resolution: 150x100 ~ 200x200, 72dpi
Service, Reference Image • Tonal depth: Grayscale - 8 bits/pixel; color - 24bits/pixel • Format: JFIF(JPEG File Interchange Format) • Compression: JPEG(10:1 for grayscale, 20:1 for color) • Spatial resolution: 500x400 ~ 1000x700, 150dpi, 300dpi or higher
Archival Image • Tonal depth: Grayscale - 8 bits/pixel; color - 24bits/pixel • Format: TIFF(Tagged Image File Format) • Compression: Uncompressed • Spatial resolution: 300dpi, 600dpi or higher
JPEG • Lossy, high compression rate
檔案目的 說明 建議檔案規格 資料永久保存格式 將資料數位化典藏,保持原有風貌。提供使用者作為重製、壓縮處理或其他圖像處理交換之用 檔案格式:TIFF 色調深度:灰階-每像素8-bits;彩色-每像素32-bits 壓縮:不壓縮 色彩濃度值4.0D以上(color),3.2D(B&W) 解析度: 300~600或更高 dpi(依原始資料品質及重要性選擇適當解析度,一般印刷品可採300dpi,美術品供複製畫使用建議採600dpi,供印刷出版使用採350dpi) 資料服務/參考格式 提供使用者網路上觀看及列印用 檔案格式: JFIF(JPEG交換格式) 色調深度:灰階-每像素8-bits;彩色-每像素24-bits 壓縮: JPEG(灰階壓縮比約10:1,彩色壓縮比約20:1) 解析度: 150dpi~300 dpi或影像大小:從500x400至1000x700 pixels 縮圖影像 提供使用者預覽及選擇欄位用 檔案格式:GIF 色調深度:每像素8-bits 壓縮: 原生影像至GIF 解析度或影像大小: 72dpi 或影像大小從150x100到200 x 200 pixels
Text Specification • Textual materials as searchable text • Searchable text with markup: ASCII text, with TEI-conformant SGML markup • Document Type Definition (DTD): American Memory DTD (ammen.dtd) • Textual materials reproduced as images • Archival or master images • Images for convenient access
Searchable Text Specification • Tagged or non-tagged • XML or pure text • Tag set? (DTDs?) • Text properties • Text orientation • Formatting(Line space, etc) • Other notes
Archival or Master Images (1) • Bitonal document image: 1 bit/pixel • Format: TIFF • Compression: ITU Group IV • Spatial resolution: 300 dpi
Archival or Master Images (2) • Uncompressed tonal archival image: Grayscale - 8bit/pixel; color - 24bit/pixel • Format: TIFF • Compression: uncompressed • Spatial resolution: 300 dpi
Archival or Master Images (3) • Compressed tonal archival image: Grayscale - 8bit/pixel; color - 24bit/pixel • Format: JPEG/JFIF • Compression: 5:1 compression • Spatial resolution: 300 dpi
Images for Convenient Access (1) • Inline paging image: Grayscale - 4bit/pixel; color: 8 bit/pixel • Format: GIF • Compression: Native to GIF • Spatial resolution: 400-500 pixels horizontal
Images for Convenient Access (2) • Printing service image: Bitonal (1bit/pixel) • Format: TIFF • Compression: ITU Group IV • Spatial resolution: 300 dpi
檔案目的 說明 建議檔案規格 資料永久保存格式 將資料數位化典藏,保持原有風貌。提供使用者作為重製、壓縮處理或其他圖像處理交換之用 檔案格式: TIFF 色調深度:黑白;灰階-每像素8-bits;彩色-每像素24-bits 壓縮:不壓縮 解析度: 300~600或更高 dpi(依原始資料品質及重要性選擇適當解析度,一般印刷品可採300dpi) 網路下載格式 提供使用者網路上觀看及列印用 檔案格式:JBIG or JBIG2 色調深度:黑白;灰階-每像素8-bits;彩色-每像素24-bits 壓縮: JPEG(灰階壓縮比約10:1,彩色壓縮比約10:1) 解析度: 150dpi~300 dpi或影像大小:從500x400至1000x700 pixels 預覽影像 提供使用者預覽及選擇欄位用 檔案格式:GIF 色調深度:每像素8-bits 壓縮: 原生影像至GIF 解析度或影像大小: 72dpi 或影像大小從150x100到200 x 200 pixels
Sound Recordings & Moving-image Materials • Audio & video data types are quite different from text and image data types • File size is very large • File can’t be downloaded completely since it takes too much time • Solution: streaming model
檔案目的 說明 建議檔案規格 資料永久保存格式 將資料數位化典藏,保持原有風貌。提供使用者作為重製、壓縮處理或其他圖像處理交換之用 檔案格式:WAVE (Microsoft格式) 取樣率:44.1 kHz 16~ 24 bit/sample 聲道:立體音 串流(streaming) 寬頻格式 提供以寬頻方式上網之使用者線上聽取 檔案格式:MP3 取樣率:44.1KHZ 聲道:立體音 頻寬:128kbps 檔案格式:RA格式 編碼種類:雙頻ISDN立體音 取樣率:16KHZ 頻寬:100Kbps 串流(streaming) 窄頻格式 提供以窄頻方式上網之使用者線上聽取 檔案格式:MP3 取樣率:22.05KHZ 聲道:立體音 頻寬:56kbps 檔案格式:RA格式 編碼種類:ISDN立體音 取樣率:8KHZ 頻寬:50Kbps
Moving-image Materials (1) • Moving-image file types: • Moderate resolution files: • Image size: 320x240 • Frame rate: 30 fps • Data rate: ca. 1.2 Mbit/sec (ca. 150 Kbit/sec) • Compression: MPEG-1 • Format: mpg
Moving-image Materials (2) • Moving-image file types: • Low resolution files: • Image size: 160x120 • Color depth: 24 bits/pixel • Data rate: ca. 100 Kbit/sec • Format: QuickTime (Apple Computer format) • File extension: mov
檔案目的 說明 建議檔案規格 資料永久保存格式(1) 將資料數位化典藏,保持原有風貌,此為VCD的品質 檔案格式:mpg 壓縮方式:MPEG-1 圖片大小:352x240 像素 視訊解碼畫面變化率:29個畫面/秒以上 音效解碼為立體雙聲道CD音質 資料傳輸率(Data rate):約 1.2 megabits/秒 (約 150 kilobytes/秒) Jitter標準畫面時間:9 mSec或更優 平均同步位移:1 mSec或更優 標準裝置同步位移:15 mSec或更優 音效資料串流(nChannels):2或更優 音效資料串流(nSamplesPerSec):44100或更優 資料永久保存格式(2) 將資料數位化典藏,保持原有風貌,此為DVD的品質,檔案大小為格式(1)的3~100倍,適合需高解析保存物件 檔案格式:mpg2 壓縮方式:MPEG-2 圖片大小:720x480 像素 視訊解碼畫面變化率:29個畫面/秒以上 音效解碼為立體雙聲道AC3 資料傳輸率(Data rate):約6~8 Megabits/秒 (約150 kilobytes/秒) Jitter標準畫面時間:9 mSec或更優 平均同步位移:1 mSec或更優 標準裝置同步位移:15 mSec或更優 音效資料串流(nChannels):2或更優 音效資料串流(nSamplesPerSec) :44100或更優
串流(streaming) 寬頻格式 提供以寬頻方式上網之使用者線上觀看 檔案格式:mpg4 壓縮方式:MPEG-4 音效解碼為MP3 Bit-rate(位元傳輸率):250Kbps 檔案格式:RM Bit-rate(位元傳輸率):250Kbps Audio Format:22 kHz, stereo 檔案格式:ASF Bit-rate(位元傳輸率) :250Kbps Audio Format:22 kHz, stereo 串流(streaming) 窄頻格式 提供以窄頻方式上網之使用者線上觀看 檔案格式:mpg4 壓縮方式:MPEG-4 音效解碼為MP3 Bit-rate(位元傳輸率):56Kbps 檔案格式:RM Bit-rate(位元傳輸率) :56Kbps Audio Format:11 kHz,mono 檔案格式:ASF Bit-rate(位元傳輸率):56Kbps Audio Format:11 kHz, mono
System Structure Specification • Definition of client/agent/server • Task of each tier • Repository design • Data model • Database • Communication protocol design • Access and retrieval • Scalability and availability consideration
Stage II: Digitization Work • Metadata creation • Image creation • Raw text creation • Resource naming
Stage III : Integration Work • Postprocessing of digitized data • Hyper-text creation • Metadata reorganization • Raw image resampling • Repository creation • Integration of digital data • Information accessing services implementation
Resource Naming Issues • Goals • Digitization process and metadata creation and be done separately • Resource naming contains semantics • Naming schema can be extended to be compatible with open standards
Resource Naming Principles • Source unit identification • Multiple data type support • Uniqueness • Work with metadata • Compatibility with internet resource naming: • Use ASCII codes only • Not case-sensitive • Characters not allowed: %, /, ?, #, *, -
單元 說明 範例 單位代碼 單位代碼ccadxxxxx)cca表示文建會 ,當d=1時為公家機構,d=2時為私人機構;XXXXX為附屬單位代碼。附屬單位代碼由文建會造清冊管制。 國美館 cca l10001 北美館 cca110002 高美館 cca110003 物件類別 依文化資料庫主要主題類別給予代碼,如:音樂(MUsic)、戲劇(DRama)、舞蹈(DAncing)、美術(Fine Arts)、文學(LIterature)、電影(MOvie)、建築(ARchitecture),各給一個二位元表示 如美術類以FA代表 物件代碼 各單位自行編列管制,只要在單位內不重複即可。 多部份之序號 如一書有多頁的掃描檔或一物件有多個照片,共四碼,由0001-9999 如書本第五頁為0005 使用目的 使用目的為1碼[x],目前分為三類: 1.預覽 2.下載 3.永久存檔 如t表示影像檔供預覽用, i表示影像檔供下載用, b表示視訊、音訊檔供寬頻下載用 n 表示視訊、音訊檔供窄頻下載用 u表示永久存檔版 附屬檔名 可表現資料之檔案格式,系統會自動產生 如xml, pdf, jpg, gif, tif, mpg
Naming Example • 範例:國美館(單位代碼:cca110001)有一美術類(FA)的圖片(物件代碼:ak747)要掃描作縮圖用,其檔名為cca110001-FA-ak747-0001-t.gif。