170 likes | 401 Views
کنفرانس داده کاوی ایران. عنوان مقاله : انتخاب نمونه به وسیله مجموعهھای راف در سیستمھای طبقه بند یادگیر شماره مقاله: 1632 ارائه دهنده: فرزانه شعله مولفین: فرزانه شعله،علی حمزه، ستار هاشمی عنوان Session : B3 زمان : 16:00 – 15:45.
E N D
کنفرانس داده کاوی ایران عنوان مقاله: انتخاب نمونه به وسیله مجموعهھای راف درسیستمھای طبقه بند یادگیر شماره مقاله:1632ارائه دهنده: فرزانه شعلهمولفین: فرزانه شعله،علی حمزه، ستار هاشمیعنوانSession: B3زمان: 16:00 – 15:45 چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
فهرست مطالب • مقدمه • سیستمهای طبقه بند یادگیر : XCS • مجموعههای راف • روش پیشنهادی • آزمایشات و نتایج • جمع بندی و نگاهی به آینده • منابع چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
مقدمه • سیستمهای طبقه بند یادگیر(LCS)، سیستمهای مبتنی بر قوانین هستند که با الهام ازاصول تکاملی نظریه داروین و یادگیری شناختی در سال 1976 توسط هلند ارائه شدهاند. یادگیری تقویتی داده کاوی تخمینتابع چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
Learning Classifier Systems LCS (Rule-base system) سیستمهای طبقهبند یادگیر E n v i r o n m e n t at State Action Reward St rt Rules چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
eXtended Classifier System E n v i r o n m e n t Reward Rt State St Detectors Effectors Population [P] Rules describing the current solution Action Delay Matching Action Set [A] Action Evaluation Action Selection Rules in [M] with the selected action Prediction Array Match Set [M] Rules whose condition match st Action Set at t-1 [A]-1 RL: Update parameters Rules in [M] with the selected action GA چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
مجموعههای راف • تئوری مجموعههای راف، در اوایل سال 1980 توسط پاولاك پایه گذاری شد. • این تئوری، با تحلیل جدولهای داده سروكار دارد و روشهایی را برای زدودن و كاستن اطلاعات نامربوط یا مازاد بر نیاز از پایگاههای داده مهیا میسازد. چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
مجموعههای راف • با هر مجموعه رافX، دو مجموعه به نامهای تقریب پایینی و تقریب بالایی مرتبط و همراه میشود. Set X Positive Region Boundary Region Negative Region چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
انگیزه انجام این پژوهش • با وجود دقت خوبی که XCS در حل مسائل داده کاوی دارد اما در مواجه با مجموعه دادههای بزرگ دچار مشکل میشود. تئوری مجموعههای راف بزرگ بودن مجموعه داده RS آنالیز فضای مسئله نمونههای زیاد (فضای مسئله گسترده) ابعاد زیاد چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
روش پیشنهادی Train Test Prototype Selection Certain Rules Rough Set Data Reducer Fitness Chromosome Genetic Algorithm Matching NO YES Boundary Data XCS label چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
روش پیشنهادی دادههای پیوسته پارتیشنبندی: گسستهسازی دادههای وصفی پارتیشنبندی: انتخاب ویژگیهایی چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
مثال • مثال Positive regions Certain Rules If 0 ≤ x ≤ 3.23 and 0.74 ≤ y ≤ 10 then class is 1 If 6.49 ≤ x ≤ 10 and 0 ≤ y ≤ 0.74 then class is 2 If 6.49 ≤ x ≤ 10 and 0.74 ≤ y ≤ 10 then class is 2 Data set Boundary regions Rough Set Data Reducer XCS Discretization points Genetic Algorithm [(0,3.23,6.49,10),(0.0.74,10)] چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
آزمایشات و نتایج • مجموعه دادههای انتخابی UCI Machine Learning Repository چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
آزمایشات و نتایج • کارایی روش پیشنهادی در مقایسه با XCS α-confidence 0.001 چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
جمع بندی و نگاهی به آینده • روشی ارائه شده با هدف، آنالیز فضای مسئله توسط تئوری مجموعههای راف و انتخاب پیش الگوهای مطمئن میباشد. • سیستم طبقهبند یادگیر XCS، در مسایل داده کاوی از جمله طبقهبندی سعی در پوشش تمامی فضای مسئله دارد. این سیستم، در برخورد با دادههای زیاد با فضای مسئله وسیع ممکن است دچار مشکل شود. • نتایج ارائه شده نشان میدهد که با کاهش فضای مسئله به نواحی مرزی، سیستم طبقه بند جدید قادر خواهد بود به دقت بهتری در طبقهبندی داده دست یابد. مجموعه دادههایی با ویژگیهای مختلط برخورد با مجموعه دادههای نویزی چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
منابع • J.H. Holland. Adaptation, In Rosen, R., Snell, F., eds.: Progress in theoretical biology. Academic Press, New York, p.p. 263–293, 1976. • S.W. Wilson, Classifier fitness based on accuracy. Evolution Computation 3(2), p.p. 149–175, 1995. • S.W. Wilson, Generalization in the XCS classifier system. In: Genetic programming 1998: proceedings of the third annual conference, Morgan-Kaufmann, Cambridge, p.p. 665–674, 1998. • M.V. Butz, T. Kovacs, P.L. Lanzi and S.W.Wilson, Toward a theory of generalization and learning in XCS. IEEE Transaction Evolutionary Computation 8(1), p.p. 28–46, 2004. • J. Bacardit and M.V. Butz, Data mining in learning classifier systems: comparing XCS with GAssist. In: IWLCS 2003–2005, revised selected papers, Lecture Notes in Computer Science, vol 4399, p.p. 282–290, 2007. • M. Studley and L. Bull, X-tcs: accuracy-based learning classifier system robotics. In: IEEE Congress on Evolutionary Computation, CEC, p.p. 2099–2106, 2005. • S.W. Wilson, Function approximation with a classifier system. In: GECCO 2001. Morgan-Kaufmann, San Francisco,(2001), 974–981. • A.J. Bagnall and G.C. Cawley, Learning classifier systems for data mining: A comparison of XCS with other classifiers for the Forest Cover dataset, In Proceedings of the IEEE/INNS International Joint Conference on Artificial Neural Networks (IJCNN-2003), p.p. 1802-1807, 2003. • T.H. Nguyen, S. Foitong and O. Pinngern, Rough set and XCS in classification problems. International Conference on Computer and Communication Engineering, ICCCE. , p.p. 4806–811, 2008. چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
منابع • Z. Pawlak, Rough sets. International Journal of Computer and Information Sciences 11, (1982),341-356. • H. Dam, K. Shafiand A.H. Abbass, Can evolutionary computation handle large datasets? A study into network intrusion detection. In: Conference on Artificial Intelligence, volume 3809 of Lecture Notes in Computer Science, Springer, p.p. 1092–1095, 2005. • J. Komorowski, Z. Pawlak, L. Polkowski, et. al., Rough Sets: A Tutorial, in Rough Fuzzy Hybridization: A New Trend in Decision-Making (ed. S. K. Pal, A. Skowron), Springer-Verlag, Singapore, p.p. 3-98, 1999. • M. Butz and S.W. Wilson, An algorithmic description of XCS. In IWLCS-2000, Lecture Notes in Artificial Intelligence (LNAI-1996). Berlin: Springer-Verlag, 2001. • Z. Pawlak, Rough Sets and Data Analysis, Proceeding of IEEE Conference, ISSN:0-7803-3687-9, 1996. • Z. Pawlak, Rough Sets: Theoretical Aspects of Reasoning about Data, Springer, Formerly Kluwer Academic ublishers, Boston, Dordrecht, London, 1991. • X. Llora` and J. M. Garrell, Evolving Partially-Defined instances with Evolutionary Algorithms, In: ICML'2001. Morgan Kauffmann, p.p. 337-344, 2001. • S.W. Wilson, Mining oblique data with XCS. In: IWLCS 2000, Paris, France, 15–16 September 2000, revised papers, Lecture notes in computer science, vol 1996. Springer, Heidelberg, p.p. 158–176, 2001. چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران
با تشکر چهارمین کنفرانس داده کاوی ایران، 10 آذر ماه 1389، دانشگاه صنعتی شریف، دبیرخانه دائمی کنفرانس داده کاوی ایران