Two-Dimensional PCA: A New Approach to Appearance-Based Face Representation and Recognition

Two-Dimensional PCA: A New Approach to Appearance-Based Face Representation and Recognition 作者：Jian Yang, David Zhang 讲解人：牛志恒 zhniu@jdl.ac.cn

报告提纲 • 作者介绍 • 文章介绍 • 前人相关工作简介 • 相关基础知识简介 • 理论描述 • 实验分析 • 简单评述 • 提出问题

作者的相关信息 • Jian Yang • EDUCATIONS • Ph.D Department of Computer Science, Nanjing University of Science and Technology (NUST), 2002 • M.S Applied Mathematics from Changsha Railway University, 1998 • B.Sc Mathematics from the Xuzhou Normal University, 1995 • PUBLICATIONS • Jian Yang; Frangi, A.F.; Jing-Yu Yang; David Zhang; Zhong Jin; KPCA plus LDA: a complete kernel Fisher discriminant framework for feature extraction and recognition. Pattern Analysis and Machine Intelligence, IEEE Transactions on Volume 27, Issue 2, Feb. 2005 Page(s):230 - 244 • Jian Yang, David Zhang, Alejandro F. Frangi, Jing-Yu Yang: Two-Dimensional PCA: A New Approach to Appearance-Based Face Representation and Recognition. IEEE Trans. Pattern Anal. Mach. Intell. 26(1): 131-137 (2004) • Jian Yang, Hui Ye, David Zhang: A new LDA-KL combined method for feature extraction and its generalisation. Pattern Anal. Appl. 7(1): 40-50 (2004) • Jian Yang, Zhong Jin, Jingyu Yang, David Zhang, Alejandro F. Frangi: Essence of kernel Fisher discriminant: KPCA plus LDA. Pattern Recognition 37(10): 2097-2100 (2004) • Jian Yang, Jing-Yu Yang, Alejandro F. Frangi, David Zhang: Uncorrelated Projection Discriminant Analysis And Its Application To Face Image Feature Extraction. IJPRAI 17(8): 1325-1347 (2003) • Jian Yang, Jing-Yu Yang, Alejandro F. Frangi: Combined Fisherfaces framework. Image Vision Comput. 21(12): 1037-1044 (2003) • Jian Yang, Jing-Yu Yang: Why can LDA be performed in PCA transformed space? Pattern Recognition 36(2): 563-566 (2003) • Jian Yang, Jing-Yu Yang, David Zhang, Jian-feng Lu: Feature fusion: parallel strategy vs. serial strategy. Pattern Recognition 36(6): 1369-1381 (2003) • Jian Yang, Jing-Yu Yang: Generalized K-L transform based combined feature extraction. Pattern Recognition 35(1): 295-297 (2002) • Jian Yang, Jing-Yu Yang, David Zhang: What's wrong with Fisher criterion? Pattern Recognition 35(11): 2665-2668 (2002) • Jian Yang, Jing-Yu Yang: From image vector to matrix: a straightforward image projection technique - IMPCA vs. PCA. Pattern Recognition 35(9): 1997-1999 (2002)

作者的相关信息 • David Zhang（张大鹏） • EDUCATIONS • Ph.D Electrical & Computer Engineering, University of Waterloo, 1994 • Ph.D Computer Science, Harbin Institute of Technology (HIT), 1985 • M.S Computer Science, Harbin Institute of Technology (HIT), 1983 • B.Sc Computer Science, Peking University, Beijing, 1974 • EMPLOYMENT • Adjunct Professor (2002- ) Department of System Design, University of Waterloo, Canada • Guest/Adjunct Professor (2000- ) Shanghai Jiao Tong University / Tsinghua University • Full Professor (1999- ) Department of Computing, Hong Kong Polytechnic University (PolyU) • Associate Professor (1995-1999) Department of Computer Science, City University of Hong Kong (CityU) Department of Computing, Hong Kong Polytechnic University (PolyU) • Adjunct Professor / Department of Computer Science and Engineering Supervisor of PhD (1995- ) Harbin Institute of Technology (HIT), China • Associate Professor (1988-1991) National Key Lab of Pattern Recognition, Institute of Automation Chinese Academy of Science, Beijing, China • Postdoctoral Fellow (1986-1988) Department of Automation, Tsinghua University, Beijing, China • Lecturer (1974-1980) Department of Computer Science, Heilongjiang University, China

SELECTED HONORS • Academic Awards • Project Awards • Supervised Student Awards • Patents • SELECTED ACTIVITIES (1998 - ) • Current Editorial Activities • Conference Organization • Industry Consultants • Leaderships • RESEARCH GRANTS (as Principal Investigator)(1996-) • INVITED TALKS • PARTIAL PUBLICATIONS • BOOKS • BOOK CHAPTERS • SELECTED JOURNAL PAPERS • SELECTED CONFERENCE PAPERS

文章的相关信息 • 文章出处:IEEE TPAMI • 发表时间:JANUARY 2004 • 相关文献 • J. Yang, J.Y. Yang, “From Image Vector to Matrix: A Straightforward Image Projection Technique—IMPCA vs. PCA,” Pattern Recognition, vol. 35, no. 9, pp. 1997-1999, 2002.

前人相关工作的介绍

中文摘要 • 本文引入了2DPCA图像表示方法的一种新技术。与PCA不同， 2DPCA是基于2维图像矩阵而不是1维向量，因而特征提取的时候图像不必预先转化成一个向量。直接使用原始图像矩阵来构建图像协方差矩阵，它的特征向量用来作特征提取。为了检验和评估2DPCA的性能，在ORL、AR和Yale人脸数据库上进行了一系列的实验。在所有实验中2DPCA的识别率都高于PCA。实验结果也显示了2DPCA在特征提取的效率上要更高于PCA。

文章的组织结构 • INTRODUCTION • TWO-DIMENSIONAL PRINCIPAL COMPONENT ANALYSIS • Idea and Algorithm • Feature Extraction • 2DPCA-Based Image Reconstruction • EXPERIMENTS AND ANALYSIS • Experiment on the ORL Database • Experiment on the AR Database • Experiment on the Yale Database • Evaluation of the Experimental Results • CONCLUSION AND FUTURE WORK

相关基础知识的介绍 • 设样本集为在中，均值，协方差矩阵，分解为其中是正交阵，是对角阵。于是PCA变换为。变换后的样本均值为0，协方差矩阵为对角阵，它包含了的所有特征值，其对应的特征向量是不相关的。

2DPCA • X是n维列向量，A是m×n的图像矩阵，Y是线性变换后的m维投影向量。 • 定义Y的协方差矩阵的迹为总散度： • 最大化这个准则，就找到了最优的投影方向X使得投影后的向量Y分得最开。

表示为： • 所以 • 我们记

称作图像协方差（散度）矩阵。从定义可以看出它是非负定的n×n维矩阵。假设有M张训练图像，第j张图像表示为 ，所有训练图像的均值记作。 • 准则化为

最大化上式的X称作最优投影轴。最优投影轴是 的最大特征值对应的特征向量。通常一个最优投影轴是不够的，因此选对应特征值最大的取前d个相互正交的单位特征向量作为最优投影轴。

证明： 令

特征提取 • 2DPCA的最优投影向量用来做特征提取。对于给定的样本图像A，有 • 得到的投影特征向量称作样本图像A的主成分（向量）。 • 主成分向量形成m×d的矩阵称作样本图像A的特征矩阵或特征图像。

分类方法 • 采用最近邻分类。任意两个图像的特征矩阵和之间的距离定义为： • 给定测试样本B，如果，并且，则分类结果是。

基于2DPCA的图像重构 • 主成分向量是，令，，那么。 • 由于是正交的，所以图像A的重构图像为： • 令，它的大小和图像A一致，称作图像A的重构子图。当d＝n时，是完全重构；当d<n时，是近似重构。

实验

ORL

Yale

结论 • 2DPCA与PCA（Eigenfaces）比较 • 优点： • 提取特征的方法简单、直接 • 实验对比中显示识别率高 • 提取特征的计算效率高 • 缺点： • 表示图像时需要的系数多，因此需要更多的存储空间 • 分类所需的计算时间稍多

为什么2DPCA的性能优于PCA • 对于小样本数据（比如人脸识别）来说， 2DPCA更加稳定。因为它的图像协方差矩阵比较小。 2DPCA比PCA能更加精确的刻画图像的协方差矩阵

对文章的评价 • 文章对传统的PCA进行了对2D的扩展，虽然理论描述简单，但却想无人之想，做无人所做。善哉！善哉！ • 实验大量而丰富，效果显著，但是否在现实中实用值得讨论。

提出的问题 • PCA表示图像时，近似图像与原始图像具有最小均方误差（MSE）。2DPCA是否也具有相似的性质？ • 2DPCA需要更多的系数，虽然后面加上PCA可以降维，但是这样做的道理并不清晰。是否能推出更有效的方法？ • 文中实验可以看到数据量偏少（人数），对更大的数据量（比如千人），更复杂的变化2DPCA是否依然有效？

谢谢大家！

Two-Dimensional PCA: A New Approach to Appearance-Based Face Representation and Recognition

Two-Dimensional PCA: A New Approach to Appearance-Based Face Representation and Recognition

Presentation Transcript

One Dimensional Flow

AS 9 - REVENUE rECOGNITION

Pattern Recognition and Machine Learning

PCA vs ICA vs LDA

Results-Based Management: Logical Framework Approach

Speech Recognition and Understanding

Chapter 7: Dimensional Analysis and Modeling

Chapter 7: Representation and Manipulation of Knowledge in Memory: Images and Propositions

Pattern Recognition and Machine Learning

What is a Two-Dimensional (2D) Instructional Materials?

Geometry

Applying back propagation to shape recognition

Hidden Markov Models for Speech Recognition

Rule-Based Reasoning: Constraint Solving and Deduction

Neural Networks

Articulatory Feature-Based Speech Recognition

From Knowledge Representation to Reality Representation

Gesture Recognition

Sparse Representation for Image Reconstruction, and Face Recognition?

6.870 Object Recognition and Scene Understanding

Speech Recognition

Efficient Part-Based Recognition of Multiple Object Classes