150 likes | 240 Views
多媒体搜索引擎. 复习. 期末考试. 时间 6 月 27 号 15:30-17:30 地点 数学馆西 113 考场纪律 手机关机 不使用计算器 没有复杂计算 不使用除电子钟外的任何电子设备. 考试内容. 传统搜索引擎 数据压缩 多媒体内容理解 多媒体搜索引擎. 4. 输入. 2. 理解. 5. 显示. 3. 索引. 1. 获取 / 存储. 传统搜索引擎. 五大部分及其相互关系、功能. 信息. 传统搜索引擎. 布尔检索 关键字检索概念 关键字的布尔运算 倒排文件 基于倒排文件的快速布尔运算 关键字的索引结构
E N D
多媒体搜索引擎 复习
期末考试 • 时间 • 6月27号15:30-17:30 • 地点 • 数学馆西113 • 考场纪律 • 手机关机 • 不使用计算器 • 没有复杂计算 • 不使用除电子钟外的任何电子设备 Multimedia Search Engine
考试内容 • 传统搜索引擎 • 数据压缩 • 多媒体内容理解 • 多媒体搜索引擎 Multimedia Search Engine
4. 输入 2. 理解 5. 显示 3. 索引 1. 获取/存储 传统搜索引擎 • 五大部分及其相互关系、功能 信息 Multimedia Search Engine
传统搜索引擎 • 布尔检索 • 关键字检索概念 • 关键字的布尔运算 • 倒排文件 • 基于倒排文件的快速布尔运算 • 关键字的索引结构 • 二叉树,Hash,Trie Multimedia Search Engine
传统搜索引擎 • 词典建立 • 分词 • 正则式匹配 • 词典分词 • 正向最大匹配,反向最大匹配,双向匹配 • 禁用词表 • 归一化 • 拼写矫正与近音替换 Multimedia Search Engine
传统搜索引擎 • 查询结果处理 • 排序 • 词频,非线性词频 • tf-idf • SEO SPAM • 基于链接的排序 • PageRank • HITS Multimedia Search Engine
传统搜索引擎 • 相关反馈 • 原理,实现方法 • 优点,缺点 • 性能评价 • 性能指标 • 精度、查全率、F-score • 相互关系 Multimedia Search Engine
数据压缩 • 多媒体信息表示 • 文字 • codepage • 声音、图像 • 采样:时域/空域/频域,信号带宽,采样定理 • 量化:量化噪声,信噪比,非均匀量化 Multimedia Search Engine
数据压缩 • 多媒体数据压缩 • 数据可压缩的原理:冗余 • 信息论 • 熵:定义,计算方法 • 熵编码 • 霍夫曼编码 • 霍夫曼树:构造,使用 • 计算平均码长 • 算术编码 • 原理 Multimedia Search Engine
数据压缩 • 多媒体数据压缩 • 字典编码 • 原理:LZ77, LZ78 • 优点,缺点 • 预测编码:原理,优点,缺点 • 变换编码 • DCT,小波 • 原理,优点,缺点 • 心理视/听觉模型 Multimedia Search Engine
多媒体内容理解 • 步骤 • 分割,特征提取,分类 • 分割 • 图像分割 • 前/背景分割:最大熵,松弛算法 • 对象分割:边缘检测,聚类(MeanShift) • 视频分割 • 镜头分割 Multimedia Search Engine
多媒体内容理解 • 特征提取 • 颜色 • 平均颜色,颜色矩,各种颜色直方图 • 纹理 • 灰度共生矩阵,Tamura颜色特征,Gabor特征 • 形状 • 面积、周长、圆度…… • 傅立叶描述子 Multimedia Search Engine
多媒体内容理解 • 特征提取 • 特征降维 • 目的,方法(主分量分析,分组降维) • 分类 • 线性分类器 • 原理,做法 • 训练方法:方程组求解,SVM • 概率分类器:GMM,EM Multimedia Search Engine
多媒体搜索引擎 • 高维索引 • 目的,概念,原理 • 最近邻查询,范围查询 • K-d-b树,R-树,基于空间分割的高维索引 • 多媒体查询输入 • 关键字,QBE,草图,…… • 可视化推荐 • 各自的优缺点 Multimedia Search Engine