210 likes | 439 Views
社交网络中的可信用户识别. 陈文强 1 ,邹权 1 ,陈珂 2 ,江弋 1 ,林琛 1 1 厦门大学信息科学与技术学院 2 广东石油化工学院计算机科学与技术系. 大纲. 1. 背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结. 社交网络中的可信用户. 用户的决策行为 常常受别人评论的影响. 识别出可信用户,帮助用户决策 了解WEB用户的行为模式,帮助建立专家搜索系统. 面临的挑战. 难以界定可信用户的有效特征 类别高度不平衡问题. 大纲. 1.背景 2. 相关工作 3.可信用户的识别 4.实验设置与分析 5.总结.
E N D
社交网络中的可信用户识别 陈文强1,邹权1,陈珂2,江弋1,林琛1 1 厦门大学信息科学与技术学院 2 广东石油化工学院计算机科学与技术系
大纲 1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结
社交网络中的可信用户 用户的决策行为 常常受别人评论的影响 识别出可信用户,帮助用户决策 了解WEB用户的行为模式,帮助建立专家搜索系统
面临的挑战 难以界定可信用户的有效特征 类别高度不平衡问题
大纲 1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结
相关工作 - pagerank and hits Page L, Brin S, Motwani R, et al. The pagerank citation ranking: Bringing order to the web. In Technical report, Stanford Digital Library Technologies Project, 1998. Kleinberg J. Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5):604{632, 1999. Jurczyk P and Agichtein E. Discovering authorities in question-answer communities using link analysis. In Proc.of CIKM, 2007. Campbell C, Maglio P, Cozzi A, et al. Expertise identication using email communications. In Proc. Of CIKM, 2003. Dom B, Eiron I, Cozzi A, et al. Graph-based ranking algorithms for e-mail expertise analysis. In Proc. Of workshop on Data Mining and Knowledge Discovery, 2003
相关工作 - 随机过采样、随机降采样 Japkowicz N, Stephen S. The Class Imbalance Problem: A Systematic Study. Intelligent Data Analysis. 2002, 6(5): 429–449. Batista G E, Prati R C, Monard M C. A Study of the Behavior of Several Methods For Balancing Machine Learning Training Data. ACM SigKDD Explorations, 2004, 6(1): 20–29. Chawla N V, Bowyer K W, Hall L O, Kegelmeyer W P. SMOTE: Synthetic Minority Over-Sampling Technique. Journal of Artificial Intelligence Research, 2002, 16(6): 321–357.
大纲 1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结
大纲 1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结
大纲 1.背景 2.相关工作 3.可信用户的识别 4.实验设置与分析 5.总结
总结 1、提取识别可信用户的有效特征,包括社会网络特征和文本特征等41个特征 2、采用随机采样、降采样构建平衡的数据集 3、集成分类器D3C进行分类,提高了ROC面积、敏感性和特异性
谢谢! 论文作者:陈文强 电子邮箱:irwenqiang@gmail.com