550 likes | 837 Views
第三章 数字图像基础. 内容. 颜色模型 图像与图形 数字图像的表示 常见数字图像格式. 一、颜色模型. 光的本质. 电磁波 3.84×10 14 ~ 7.89×10 14 Hz 780nm ~ 380nm. 颜色的感知. 人眼的视觉功能. 感知颜色的 3 个要素:. 光的存在(光源色). 物体的表面特性(物体色). 颜色错觉. 颜色三要素. 色调 :表示光的颜色,决定于光的波长 饱和度 :也称为纯度或彩度,指彩色的深浅或鲜艳程度,通常指彩色中白光含量的多少 亮度 :表示某种颜色在人眼视觉上引起的明暗程度, 与光的强度有关.
E N D
内容 • 颜色模型 • 图像与图形 • 数字图像的表示 • 常见数字图像格式
光的本质 • 电磁波 • 3.84×1014~7.89×1014Hz • 780nm~380nm
颜色的感知 人眼的视觉功能 • 感知颜色的3个要素: 光的存在(光源色) 物体的表面特性(物体色)
颜色三要素 • 色调:表示光的颜色,决定于光的波长 • 饱和度:也称为纯度或彩度,指彩色的深浅或鲜艳程度,通常指彩色中白光含量的多少 • 亮度:表示某种颜色在人眼视觉上引起的明暗程度, 与光的强度有关
颜色模型(color model) 颜色模型是用数值方法制定颜色的一套规则和定义,可使人们方便地描述任何一种颜色 • RGB模型 • CMY模型 • CMYK模型 • HSL模型 • YUV模型
RGB模型 RGB颜色表
RGB加色模型 CMY减色模型 CMY与CMYK模型
抖动(dithering) • 用于解决在颜色个数有限的情况下的颜色输出问题的一种策略。 • 基本思想是以空间换灰度
γ纠正 问题在于显示器的亮度与Rγ成正比 纠正通常先将R变为R1/γ
图像(Image) 取样图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。 点位图的优点是:(1)显示速度快。(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。 点位图的缺点是: (1)存储和传输时数据量比较大。(2)缩放、旋转时算法复杂且容易失真。
图形(Graphics) 矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。 矢量图的优点是:(1)缩放、旋转、移动时图像不会失真。(2)存储和传输时数据量较小。 矢量图的缺点是:(1)图像显示时花费时间比较长。(2)真实世界的彩色图像难以转化为矢量图。
图形与图像 矢量图 点位图
130x94 260x188 520x376 图像的基本属性 1、分辨率 屏幕分辨率: 指显示屏上能够显示出的象素数目。同样大小显示屏能够显示的象素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。(640×480,1024 × 768)
图像的基本属性 图像分辨率: 指组成一副图像的像素的密度,一般用单位长度上包含像素的个数来衡量。常用单位为DPI(dots per inch),即每英寸多少点。
图像的基本属性(续) 2、像素深度 像素深度是指存储每个像素所用的位数。像素深度决定彩色图像每个像素可能有的颜色数,或者确定灰度图像每个像素可能有的灰度级数。 3、调色板 一个彩色图像假如只包含24位真彩色空间中的16个离散的点(16色图),则可以建立一个颜色查找表,表中的每一行记录一组RGB值,实际像素的值用来指定该点颜色在查找表中的索引值,这样就可以大大缩小存储量。这个颜色查找表就叫做调色板。
图像的基本属性(续) 4、真彩色、伪彩色与直接色 真彩色:真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(调色板)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。 直接色:每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。
2D取样图象的表示方法 • 单色图像用一个矩阵表示; • 彩色图像用一组矩阵(3个或4个)表示; • 矩阵的行数是垂直分辨率,列数是水平分辨率; • 矩阵元素是彩色分量的灰(亮)度值,一般用整数表示.
Black and white image 黑白图象的表示
Gray scale image 灰度图象的表示
R component G component B component 彩色图象的表示
全景图像(Panorama) • 2D取样图像只是在某个固定观察点所“看到的”景物投影(图像)的数字化表示,它缺乏景物的全部信息。 • 3D物体一般有六个表面,从不同角度获取3D物体的若干不同方位的实景照片,并按照相互的位置关系拼接 起来,就可以形成整个物体(场景)的全景图象。 • 显示全景图像时,用户可以任意改变角度观看,也可以任意改变观察距离,走近或退后观看。
2类全景图象 • 从同一个视点对周围环境作360度观察所得到的视图。即以视点为中心,有一个圆柱面(或球面),圆柱面(或球面)外部的景物投影在这个圆柱面(或球面)上,即为该景物的全景图象。 • 从许多不同视点来看同一个物体,在以物体为中心的360度圆柱面(球面)上生成该物体的投影,即为该物体的全景图象。
四叉树和八叉树表示法 • 每个(二)三维空间均分为(4)8个子空间 • 如果子空间是同质的:称为体素(体元,voxel),不再细分 • 颜色、材质、密度、其它物理特征等都相同 • 全空或全满 • 如果非同质的,子空间再做同样的均分
常用的图像文件 名称 性质 方法 用途 公司/组织 BMP 无损 RLC Windows MS TIFF 无损 RLC,LZW desktop Aldus,MS publishing GIF 无损 LZW Internet CompuServe PNG 无损 LZ77,Huffman Internet W3C JPEG 有损 DCT,Huffman Internet ISO
BMP图像文件 • 微软公司提出,在Windows操作系统下使用的一种标准图像格式, • 支持单色、16色、256色、真彩色图像, • 一个文件存放一幅图像,可以使用RLC进行无损压缩,也可不压缩图像数据, • 非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持。 • 文件扩展名是bmp或者dib
BMP图像文件格式 BMP文件大体上分为四个部分:
BMP图像文件头 typedef struct tagBITMAPFILEHEADER { WORD bfType; /* 说明文件的类型 */ DWORD bfSize; /* 说明文件的大小,用字节为单位 */ WORD bfReserved1; /* 保留,设置为0 */ WORD bfReserved2; /* 保留,设置为0 */ DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构 开始到实际的图像数据之间的字 节 偏移量 */ } BITMAPFILEHEADER;
BMP图像信息头 typedef struct tagBITMAPINFOHEADER { DWORD biSize; /* 说明结构体所需字节数 */ LONG biWidth; /* 以像素为单位说明图像的宽度 */ LONG biHeight; /* 以像素为单位说明图像的高度 */ WORD biPlanes; /* 说明位面数,必须为1 */ WORD biBitCount; /* 说明位数/像素,1、2、4、8、24 */ DWORD biCompression; /* 说明图像是否压缩及压缩类型 */ DWORD biSizeImage; /* 以字节为单位说明图像大小 */ LONG biXPelsPerMeter; /* 说明水平分辨率,像素/米 */ LONG biYPelsPerMeter; /* 说明垂直分辨率,像素/米 */ DWORD biClrUsed; /* 说明图像实际用到的颜色数,如果为0 则颜色数为2的biBitCount次方 */ DWORD biClrImportant; /*说明对图像显示有重要影响的颜色 索引的数目,如果是0,表示都重要。*/ } BITMAPINFOHEADER;
BMP图像文件格式 调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。 typedef struct tagRGBQUAD { BYTE rgbBlue; /*指定蓝色分量*/ BYTE rgbGreen; /*指定绿色分量*/ BYTE rgbRed; /*指定红色分量*/ BYTE rgbReserved; /*保留,指定为0*/ } RGBQUAD;
BMP图像文件格式 紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。 每行必须是4的整数倍。
GIF图像文件格式 GIF(Graphics Interchange Format)格式由CompuServe公司于87年开发,版本号GIF87a,89年扩充后版本号为GIF89a。 GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。
GIF文件格式的特点 • 颜色数较少(不超过256色) ,文件特别小,压缩比可调,适合网络传输。 • GIF文件采用了LZW无损压缩算法来存储图像数据。 • GIF文件允许设置背景的透明属性。 • GIF文件格式可在一个文件中存放多幅彩色图像并且制作出幻灯片或者动画效果。 • GIF文件支持图像数据的交叉存储方式,这样一个大的图像可以逐步显示,让用户首先看到图像概貌,然后逐步清晰。 • GIF文件定义的图像中可以加入文本。
GIF图像的累进显示 0 1 2 3 4 5 6 7 8 9 10 11 12
GIF支持透明背景 • GIF 图象中的某个色彩,在浏览器显示该图像时被忽略而不被显示出来。 • 效果是使图像浮现在页面上,增强了网页的外观。
ANIMATED GIF图像 • GIF89a可以将数张图存成一个文件,从而形成动画效果(动态GIF, ANIMATED GIF) 。
GIF颜色控制 • From rich color image to color image with fewer colors
真彩图转256色图 流行色算法:对彩色图像中所有色彩出现的次数进行统计分析,从而选取频率最高的N(256)种颜色,为这N(256)种颜色建立调色板。算法特点:算法简单容易实现,变换效果好,但一些出现频率较低,但对人眼视觉效果明显的信息将丢失。 中位切分算法:在RGB彩色空间中,R、G、B三基色对应于空间的三个坐标轴,将每一坐标轴都量化为0~255, 形成一个边长为256的彩色立方体,所有可能的颜色都对应于立方体内的点。将该立方体切分为256个小立方体,每个立方体中都包含相同数量的在图像中出现的颜色点。取每个小立方体的中心点,则这些中心点构成256个颜色。算法特点:广泛应用于图像处理领域,但算法复杂,资源开销大。