460 likes | 643 Views
最新計算機概論. 第 3 章 資料表示法. 目錄. 3-1 文字表示法 3-2 圖形表示法 3-3 聲音表示法 3-4 視訊表示法 3-5 資料壓縮 3-6 誤差與錯誤檢查. 多媒體的組成要素. 文字媒體 音訊媒體 影像媒體 視訊媒體 動畫媒體. 3-1 文字表示法. ASCII (American Standard Code for Information Interchange) ASCII-8 EBCDIC (Extended Binary Coded Decimal Interchange Code) 繁體中文編碼系統
E N D
最新計算機概論 第3章 資料表示法
目錄 • 3-1 文字表示法 • 3-2 圖形表示法 • 3-3 聲音表示法 • 3-4 視訊表示法 • 3-5 資料壓縮 • 3-6 誤差與錯誤檢查
多媒體的組成要素 • 文字媒體 • 音訊媒體 • 影像媒體 • 視訊媒體 • 動畫媒體
3-1 文字表示法 • ASCII (American Standard Code for Information Interchange) • ASCII-8 • EBCDIC (Extended Binary Coded Decimal Interchange Code) • 繁體中文編碼系統 • Unicode 回首頁上一頁下一頁
ASCII與ASCII-8 • 使用7位元(27)表示128個字元,以基本大小寫英文字母、阿拉伯數字、鍵盤上之特殊字元等等為主。 • 為方便起見,ASCII字元存放在一個位元組裡(28),其中最高字元為0。 • ASCII-8為ASCII之擴充應用。前面128字元與ASCII相同(最高字元為0),剩下128字元用來表示其他控制字元或圖像(最高字元為1) 。
EBCDIC • IBM於1963年推出的編碼系統,使用8位元表示字元。 • 原本只有58個字元,但根據不同版本與地區的需求,最多可表示256個字元。
中文編碼系統 • ASCII、ASCII-8或EBCDIC均無法顯示中文。 • 資策會設計之大五碼(BIG5)為最普遍的繁體中文編碼系統。 • 以16位元表示一個繁體中文字。 • 簡體中文編碼系統則是以國標碼GB或漢字碼HZ為主。
中文編碼系統 • BIG-5 碼的內容有常用字 5,401 個、次常用國字 7,693 個及符號 471 個,共計約 13600 字。 • 台灣的內碼是 BIG5,日本的內碼是 Shift-JIS,但在 Windows 2000/XP 下,藉由核心的 Unicode 作為橋樑,在一般的情況下,應該資料可以互相共享才對。
BIG5 ASCII
Unicode • 目的是為了涵蓋電腦所使用的文字與各種語系,例如英文、中文、日文、拉丁文等等。 • 以16位元表示216個字元,前128個字元與ASCII相同。
常見的文字檔格式 • TXT (純文字檔) • DOC/DOCX (MS WORD檔案) • PDF (Adobe Acrobat文件檔) 回首頁上一頁下一頁
3-2 圖形表示法 • 為多媒體中常見與常用的資料類型。 • 可分為點陣圖與向量圖兩大類。
3-2-1 點陣圖 • 水平解析度V.S.垂直解析度 • 圖形尺寸V.S.列印尺寸 • 色彩深度 • 黑白 (1bit) • 灰階 (8bit) • 16色 (4bit) • 256色 (8bit) • 高彩: (R:5bit, G:6bit, B:5bit) • 全彩: (R:8bit, G:8bit, B:8bit) 回首頁上一頁下一頁
單色 (Mono) • 黑色模式每一個像素佔用1位元,在影像中的每一個像素非黑即白。 • 半色調處理(half toning) : 將一個具有較高位元數的影像換為1位元的黑白影像處理過程。藉由黑白像素的排列的疏密,來模擬原始影像的明暗變化。 • 空間解析度對於半色調處理,具有相當重要的意義,空間解析度愈高,就能夠以愈多的黑白像素來進行疏密排列。
256 灰階 • 由黑白兩色構成,但是依明暗度分成 256 個層次,因此稱為 256 灰階 • 一個像素要能表示 256 種不同的黑白明暗度需要 8 個位元 (28=256) • 灰階模式(Grayscale) : 屬於8 bits的無彩色模式,即影像是以黑色、灰色或白色的像素所組成。 • 灰階模式時,只能對其進行明度的調整,因為無彩色並不具有色相和彩度 • 若將灰階影像加入有彩色,必須先將其轉為彩色模式
16色模式 • 最簡單的彩色模式 • 表示 16 種顏色的狀況需要 4 個位元 (24=16) • 調色盤
256 色 • 是一般彩色影像最常採用的模式 • 要表示 256 種不同顏色,和 256 灰階一樣,一個像素需要 8 個位元
65536 種顏色(Hi-Color) • 這個模式中的每一個像素可以表現出 65536 種顏色 • 本模式下一個像素以 16 個位元來表示其色彩的資訊,其中紅色佔 5 個位元、藍色佔 5 個位元、綠色佔 6 個位元,所以紅色、藍色、綠色各有 32、32、64 種明暗度的變化總共可以組合出 65536 種顏色
全彩模式(True Color) • 紅色、藍色、綠色各佔 8 個位元,因此每種原色各有 256 種明暗度的變化,可以表現出的顏色共有 224=16777216 (16.7M,也就是一千六百多萬) 種顏色 • 類似電視所用的『紅、藍、綠 (RGB)』三槍投影映像管的原理,可以真實的表現出一個點的顏色出來
色彩深度 • 比較不同品質的影像 黑白 灰階 黑白 全彩 16色 256色
常見的點陣圖檔格式 • BMP • JPEG • GIF • PNG • TIFF(黃, 洋紅, 青, 黑, 四色印刷) • PSD 回首頁上一頁下一頁
3-2-2 向量圖 • 常見的向量圖檔格式 • EPS (PostScript頁面描述語言) • DXF、DWG(AutoCad圖檔) • WMF (MS Windows 圖檔) 回首頁上一頁下一頁
記錄影像的座標及圖形種類與相關參數 • 以一個空心方塊為例: • 以 {圖形種類, 起點座標, 長度, 寬度} 表示,結果為: {方形, (1, 1), 6, 6} 向量圖 點陣圖
3-3 聲音表示法 回首頁上一頁下一頁
類比-數位轉換 • 取樣(sampling) • 計量(quantization) • 編碼(encoding)
常見的聲音檔格式 • WAV • MP3 (1:12) • MIDI • Real Audio • WMA • CD-AUDIO • Dolby Digital (1:12) • DTS (1:3) 回首頁上一頁下一頁
3-4 視訊表示法 • 主要的電視系統視訊標準: • NTSC (national television standards committee) • PAL (phase alteration line) • SECAM (sequential color and memory) • HDTV (high definition TV) 回首頁上一頁下一頁
常見的視訊檔格式 • AVI • MPEG • Quick Time • Real Video • WMV 回首頁上一頁下一頁
3-5 資料壓縮 • 非失真壓縮: • 所壓縮的資料在經過解壓縮後會和原始資料相同,不會遺失任何資料。 • 例如變動長度編碼 (run length encoding)、霍夫曼碼 (Huffman coding)、Lempel-Ziv編碼等。 • 失真壓縮 : • 壓縮後會和遠使資料有些微差異,對於圖形、聲音、視訊等資料可以使用此方法。 • 例如JPEG可以用來壓縮圖形、照片,MPEG可以用來壓縮影片,MP3可以用來壓縮聲音。 回首頁上一頁下一頁
3-5-1 變動長度編碼 原理是記錄符號出現的次數,例如: 回首頁上一頁下一頁
3-5-2 霍夫曼碼 • 編碼步驟如下: • 找出所有符號的出現頻率。 • 將頻率最低的兩者相加得出另一個頻率。 • 重覆步驟2不斷將頻率最低的兩者相加,直到只剩下一個頻率為止。 • 根據合併的關係分別配置0和1,而形成一個編碼樹 。 回首頁上一頁下一頁
假設編碼系統中有A、B、C、D、E、F等符號,其出現頻率依序為0.2、0.15、0.3、0.18、0.05、0.12,請據此畫出編碼樹並設計一套霍夫曼碼。 回首頁上一頁下一頁
3-5-3LZ編碼 回首頁上一頁下一頁
3-6 誤差與錯誤檢查 資料傳輸過程中,會因人為或非人為疏失導致資料出現誤差,而常見的誤差有以下幾種: • 固有誤差 (inherent error) • 捨棄誤差 (round-off error) 回首頁上一頁下一頁
錯誤檢查方式 • 同位元檢查 • CRC碼 (Cyclic Redundancy Code) • 錯誤更正碼 (ECC: Error Checking and Correcting ) • 漢明碼
3-6-1 同位位元檢查 • 又分成奇同位檢查和偶同位檢查 回首頁上一頁下一頁
3-6-2 循環冗餘碼 (CRC) 讓發訊端與收訊端事先協調一個生成多項式,然後發訊端在將資料位元傳送出去之前,先將資料位元除以生成多項式,再將得到的餘數 (即CRC碼) 放在資料位元的後面一起傳送出去。 回首頁上一頁下一頁
假設資料位元為110010101110,生成多項式為X3 + 1 (1001),試求取CRC碼及加上CRC碼後的完整訊息: • 由於生成多項式X3 + 1 (1001) 的羃次為3,故先在資料位元110010101110的後面加上三個0,得到被除數為110010101110000。 回首頁上一頁下一頁
以長除法求取110010101110000除以生成多項式X3 + 1 (1001) 的餘數: • CRC碼為餘數11,故完整訊息為11001010111011。 回首頁上一頁下一頁
3-6-3 錯誤更正碼 (ECC) 當錯誤更正碼的漢明距離大於等於D時,只要發生錯誤的位元不超過D - 1個,系統都能夠偵測出來,而只要發生錯誤的位元不超過 (D - 1) / 2個,系統都能夠加以更正。 回首頁上一頁下一頁
3-6-4 漢明碼檢查 以訊息0100001101為例,說明漢明碼檢查的運作方式: • 在訊息中2的羃次位置 (1、2、4、8…) 插入漢明碼,如下所示。 回首頁上一頁下一頁
第四個欄位所有位元做XOR運算的結果必須為0,故H1的值為0;同理,H2的值為0;H3的值為1;H4的值為1;加入漢明碼後的完整訊息為00011001001101。 回首頁上一頁下一頁