170 likes | 338 Views
可能聚类算法及其有效性研究 报告人:王其娜. 可能性理论. 可能性理论最早是由 Gains 和 Kohout 在研究可能性自动机( Possible Automata )时提出的,但 Zadeh 将可能性概念与模糊集合相联系,最先提出可能性分布、可能性测度、可能性理论的概念,给出了可能性概念的模糊集合解释。. Zadeh :人们决策所需的大部分信息在本质上是可能性的,而非概率的。 可能性理论:处理基于自然语言表达和模糊命题表示的知识(信息)不确定性的 工具。. 佟欣 . 基于可能性理论的模糊可靠性设计 [D]. 大连 : 大连理工大学 , 2004.
E N D
可能聚类算法及其有效性研究 报告人:王其娜
可能性理论 可能性理论最早是由Gains和Kohout在研究可能性自动机(Possible Automata)时提出的,但Zadeh将可能性概念与模糊集合相联系,最先提出可能性分布、可能性测度、可能性理论的概念,给出了可能性概念的模糊集合解释。 Zadeh:人们决策所需的大部分信息在本质上是可能性的,而非概率的。 可能性理论:处理基于自然语言表达和模糊命题表示的知识(信息)不确定性的工具。 佟欣. 基于可能性理论的模糊可靠性设计[D]. 大连: 大连理工大学, 2004. Zadeh L A. Fuzzy sets as a basis for a theory of possibility[J]. Fuzzy Sets and Systems, 1978, 1: 3-28.
可能性聚类算法 FPCM PFCM 避免重合 PCA93 PCA96 PCA06 降低算法对初始参数的依赖性 基于核方法的可能性聚类 可能性聚类算法 研究现状
Krishnapuram R, Keller J M. A possibilistic approach to clustering[J]. IEEE Transactions on Fuzzy Systems, 1993, 1(2): 98-110. Krishnapuram R, Keller J M. The possibilistic c-means algorithm: Insights and recommendations[J]. IEEE Transactions on Fuzzy Systems, 1996, 4(3): 385-393. Yang M S, Wu K L. Unsupervised possibilistic clustering[J]. Pattern Recognization, 2006, 39(1): 5-21. PCA93、PCA96、PCA06
PCA93、PCA96 将可能性理论引入模糊问题中,更好的描述数据的隶属程度,解决了FCM抗噪能力差的缺点。
PCA06 改进PCA93、PCA96对参数的依赖性
Pal N R, Pal K, Bezdek J C. A mixed c-means clustering model[J]. Proceedings of the Fuzzy Systems, Spain, 1997, 1: 11-21. Pal N R, Pal K, Keller J M, et al. A possibilistic fuzzy c-means clustering algorithm[J]. IEEE Transactions on Fuzzy Systems, 2005, 13(4): 517-530. FPCM、PFCM
FPCM(1997) 模型中每个点对聚类原型同时产生隶属度和典型性,即解决了FCM对噪声敏感的问题,又避免了PCA的重合聚类问题。
FPCM(1997) 模型中每个点对聚类原型同时产生隶属度和典型性,即解决了FCM对噪声敏感的问题,又避免了PCA的重合聚类问题。
PFCM(2005) FPCM模型中约束样本点对聚类的可能性的行和为1,使得在处理大数据集的时候产生不合适的典型值。PFCM放松了对典型性值的行和约束。
PFCM(2005) FPCM模型中约束样本点对聚类的可能性的行和为1,使得在处理大数据集的时候产生不合适的典型值。PFCM放松了对典型性值的行和约束。
聚类有效性函数应该具备以下特征:1)可伸展性;2)处理不同类型属性的能力;3)发现任意形状的聚类;4)用于决定输入参数的领域知识最小化;5)处理噪声数据的能力;6)对于输入记录的顺序不敏感;7)高维性;8)基于约束的聚类;9)可解释性和可用性。聚类有效性函数应该具备以下特征:1)可伸展性;2)处理不同类型属性的能力;3)发现任意形状的聚类;4)用于决定输入参数的领域知识最小化;5)处理噪声数据的能力;6)对于输入记录的顺序不敏感;7)高维性;8)基于约束的聚类;9)可解释性和可用性。 模糊聚类有效性 Yang M S, Wu K L. Unsupervised possibilistic clustering[J]. Pattern Recognization, 2006, 39(1): 5-21.
改变PC指标对聚类数目c单调变化的趋势 模糊隶属度和数据集合结构 MPC WPE KYI 可能性聚类环境 模糊隶属度 划分系数(PC)划分熵(PE) FS XB SC GPC GPE GXB 模糊聚类有效性 研究现状
基于模糊划分的有效性指标 1. 划分系数(PC: partition coefficient): 2. 划分熵(PE: partition entropy):
基于模糊划分的有效性指标 3. FS(Fukuyama and Sugeno): 4. XB(Xie and Beni, Pal and Bezdek):
可能性环境下有效性评价 Generalized cluster validity indexes:标准化为1,将适用于模糊聚类算法有效性评价的指标PC、PE、FS、XB,转换成GPC、GPE、GFS、GXB。 实验结果显示:GPC 、GPE、GFS、GXB能更好的反映数据结构,拥有更好的稳定性。