440 likes | 620 Views
第 4 章 文本与图形图像资源获取与处理. Contents. 4.1 文本资源的获取与处理. 4.2 图形、图像资源获取与处理. 4.1 文本资源的获取与处理. 4.1.1 文本概述. 文本是文字、数字和符号的统称,是最常 用也是最基本的多媒体素材。 文本文件: TXT 、 DOC 、 WPS 、 PDF. 4.1.2 文本的获取. 4.1 文本资源的获取与处理. 键盘输入: 主要的输入方法。通过键盘,英文信息可直接输入;中文信息则通过不同的中文输入编码来完成。 键盘输入法按编码原理可分为:
E N D
Contents 4.1 文本资源的获取与处理 4.2 图形、图像资源获取与处理 Company Logo
4.1 文本资源的获取与处理 4.1.1 文本概述 • 文本是文字、数字和符号的统称,是最常 用也是最基本的多媒体素材。 • 文本文件:TXT、DOC、WPS、PDF Company Logo
4.1.2 文本的获取 4.1 文本资源的获取与处理 • 键盘输入:主要的输入方法。通过键盘,英文信息可直接输入;中文信息则通过不同的中文输入编码来完成。 键盘输入法按编码原理可分为: • 音码输入法,如全拼、智能ABC、拼音加加、智能狂拼、谷歌输入法、搜狗输入法、QQ输入法等; • 形码输入法,如五笔、郑码等; • 音形码输入法,如二笔、自然码、一笔等; Company Logo
4.1 文本资源的获取与处理 4.1.2 文本的获取 • 软键盘输入,可输入一些特殊的符号。 Company Logo
4.1 文本资源的获取与处理 4.1.2 文本的获取 • 手写输入:一种非常人性化的中英文输入法,适合于不习惯键盘操作的人群和没有标准英文键盘的场合 ,指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程。 Company Logo
4.1 文本资源的获取与处理 4.1.2 文本的获取 • 语音输入:语音输入是通过计算机中的音频处理系统(主要包括声卡和麦克风),采集处理人的语音信息,再经过语音识别处理,将说话内容转换成对应的文字完成输入。如:IBM ViaVoice Pro 简体中文版 Company Logo
4.1 文本资源的获取与处理 4.1.2 文本的获取 • OCR输入:是指用扫描仪将印刷文字以图像的方式扫描到计算机中,再用OCR文字识别软件将图像中的文字识别出来,并转换为文本格式的文件,完成文本信息的输入。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 要将大量的印刷体形中手写体文字转换成电子文本素材,常用的方法是通过扫描仪扫描后,再使用OCR文字识别技术将其识别转换为电子文本。OCR是Optical Character Recognition的简称,即光学字符识别技术。常用的OCR文字识别软件有:汉王OCR、清华紫光TH-OCR、中晶尚书OCR,丹青OCR等。下面以汉王OCR6.0为例,来介绍如何对扫描后的图像进行文字识别。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 汉王OCR6.0界面 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 打开扫描后的图像 • 图像反白 本软件只处理白底黑字的图像,若扫描得到的图像不是白底黑字,点“编辑”菜单中的“图像反白”命令作反白处理。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 旋转图像 若发现当前图像不是正常位置显示,选择“编辑”菜单内的“旋转图像”菜单项,再选择相应的旋转方向,按90度旋转当前图像(可以连续旋转),将当前图像旋转到正常位置。 • 倾斜校正 • 自动倾斜校正 若扫描后的图像是倾斜的,按系统测定的角度自动 倾斜校正。选择“编辑”菜单的“自动倾斜校正”,可以对倾斜的图像作自动倾斜校正使之正常显示。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 手动倾斜校正: 若图像是倾斜的或自动倾斜校正效果不佳,可选择“编辑”菜单中的“手动倾斜校正”,出现如图接口,手工调整横竖坐标,进行校正操作。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 剪切噪音 点击工具栏中的按钮 ,按住鼠标左键,拖动鼠标选中图像中的噪音(黑点或黑框),放开鼠标左键,就可以将噪音清除。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 版面分析 移动游标箭头到文件图像上的适当位置(例如文章段首),按住鼠标左键不放,拖动至另一适当位置(例如文章段尾),再放开左键,划分出所要识别的图像框图(见图像框线),重复此操作,以划分出全部图像框的框图。另外,还可以定义各图像框的版面属性为横栏、竖栏、表格、图像。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 识别图像和检查识别结果 选中要识别的图像页,单击按钮或单击“识别”菜单中的“开始识别”命令,对所选图像进行版面识别。 识别过的图像,系统会将识别结果在识别窗口中显示出来。如果没有识别的图像,识别窗口为灰色,所以识别完图像后,应该检查有没有图像页是否有没识别的图像块。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 字符校对 如果在识别图像前,有些噪音没去掉,或图像校正不是很准确,识别出的文字会不太准确。 出现的红字,便是识别不出来的字体,如果错字少,可以直接进行输入校正,但建议把噪音全部去除、图像校正准确后,再进行识别。 Company Logo
4.1 文本资源的获取与处理 4.1.3扫描识别 ——汉王OCR • 输出文本 Company Logo
4.1 文本资源的获取与处理 4.1.4网页文本素材的下载和处理 • 一般情况下,网页上文本内容可以直接选择复制下来,或者直接保存为网页文件或文本文件。但是,也有一些网页上的文本内容不能直接被选择和复制,也不能被保存为网页文件或文本文件。为了获得这些网页上的文本素材,可采用以下方法。 Company Logo
4.1 文本资源的获取与处理 4.1.4网页文本素材的下载和处理 • 1、在网页的空白处用鼠标右击,在快捷菜单中选择“查看源文件”,弹出网页的源文件编辑窗口。该窗口一般是记事本窗口。 • 2、查看该文件的内容,将正文前的所有内容删除,然后保存为文本文件。 • 3、将保存的文件的扩展名.txt改为网页文件的扩展名.htm。 • 4、再次打开该文件后,文本内容就可以被复制下来。 Company Logo
4.1 文本资源的获取与处理 4.1.4网页文本素材的下载和处理 • 不能复制内容或将网页另存的情况举例 http://zzzy.chinacourt.org/public/paperview.php?id=102914 Company Logo
4.1 文本资源的获取与处理 4.1.4网页文本素材的下载和处理 Company Logo
4.2 图形、图像资源获取与处理 4.2.1 图形、图像概述 课件中使用的图片有两种形式,即矢量图形和位图图像。 • 图形,又称矢量图,是用一组指令来描述几何图形的点、线、框、圆、面等元素,如office家族,“插入”菜单中的“剪贴画”或“自选图形”等,皆为矢量图形,可直接用绘图工具进行绘制,不文不详细介绍。其特点是:放大后不失真,文件数据量小。网络上比较流行的flash便是矢量动画。 • 位图,主要用于表示真实照片图像和包含复杂细节的绘画等,其特点是:放大后易失真,文件数据量大。 Company Logo
4.2 图形、图像资源获取与处理 4.2.1 图形、图像概述 Company Logo
4.2 图形、图像资源获取与处理 4.2.1 图形、图像概述 • 文件格式: • 点阵图形图像文件 BMP(Bitmap)、GIF(Graphics Interchange Format)、TIF/TIFF(Tag Image File Format) • 数学描述图形图像文件 WMF(Windows Metafile Format)、EMF(Enhanced Meta File) 、ICO(Icon file) JPG/JPEG(Joint Photographic Expert Group) Company Logo
4.2 图形、图像资源获取与处理 4.2.2 图像资源的获取途径和方法 • 从光盘中获取 • 从互联网获取 Company Logo
4.2 图形、图像资源获取与处理 4.2.2 图像资源的获取途径和方法 • 从外部设备获取 • 屏幕图像的截取除了可以使 用windows提供的printscreen 按键的方法外,还可以使用各种 截图软件,如SnagIt。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop PS是电脑上的图像处理软件Photoshop的缩写,教师要掌握课件中图片素材的应用及处理,PS是首选处理工具之一,这也是课件制作功必须掌握的基本功。 • 新建并保存文件。文件名为“荷塘月色”,文件扩展名.psd。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 用PS处理课件位图素材 • 打开图像 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 修复图像 仿制图章工具 ,去除月色图片上的呢图网标识。 操作要领:先点选图章工具,然后按照ALT,再用图章工具去选择画面上需要复制的点,放开ALT,用图章工具去需用粘贴的画面部分点击。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 添加滤镜特效 “滤镜”——“模糊”——“表面模糊” Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop 保存图像为“月色处理.psd” Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 调整亮度——对比度 “图像”——“调整”——“亮度/对比度” Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 调整图像大小 “图像”——“图像大小” 保存图像为“荷花1处理.psd” Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 磁性套索工具 选择选区(如下左图),反选(“选择”——“反向”)按delete去除图像背景 保存图像为“荷花2处理.psd” Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop 另注:对于大片的相同或者相近色,可以用魔棒工具 或魔术橡皮擦工具 等来去除背景,如: Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop 背景有没完全去除,可以在其图层下方新建一填充和前景反差大的颜色的图层来查看,如下图所示,可以发现背景并没有去除干净,这时,可配合橡皮擦或套索工具来进一步擦除。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 合成图像 1)将以上三张处理后的图像,分别用移动工具拖至荷塘月色.psd中。 2)“编辑”——“自由变换” ,调整图像至合适比例,按回车确认变换。 3)根据需要,适当调整色相/饱和度或亮度/对比度。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop 4)将两朵荷花所在的图层,按ctrl选中,右键合并图层。 5)添加图层蒙版 ,拉由黑到白的渐变 ,使其过度自然。 图层蒙版是一项非常有用的技术,它可以遮盖掉图层中你不需要的部分,而不必真正破坏图层的像素。 注:蒙版中黑色部分,作用于 相应图层,则使该部分完全透 明。 蒙版中白色部分,作用于相应 图层,对图层无影响,即图层 完全不透明。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 添加文字效果 添加文字,并利用图层面板上的“添加图层样式” ,给文字添加外发光效果。 Company Logo
4.2 图形、图像资源获取与处理 4.2.3 图像素材的处理——photoshop • 优化并输出图像(“文件”——“存储为Web所用格式” ) 在photoshop中处理的图像存储为web格式,可以较大程度地优化图像文件,使图像文件和图像文件大小有较高的平衡点,在保证图像质量的前提下,可以使文件更小。 Company Logo