310 likes | 486 Views
درخت کاوی فازی بر پایه شمول نسبی Fuzzy Tree Mining Based On Partial Inclusion. استاد راهنما : دکتر رهگذر سبحان موسوی نژاد مرداد 89. مراجع. فهرست مطالب. مقدمه اصول درخت کاوی فازی گذری بر درخت کاوی غیر فازی نمایش درخت به روش RSF ایده بنیادی : Partial Inclusion الگوریتم پیشنهادی
E N D
درخت کاوی فازی بر پایه شمول نسبیFuzzy Tree Mining Based On Partial Inclusion استاد راهنما : دکتر رهگذر سبحان موسوی نژاد مرداد89
فهرست مطالب • مقدمه • اصول درخت کاوی فازی • گذری بر درخت کاوی غیر فازی • نمایش درخت به روش RSF • ایده بنیادی : Partial Inclusion • الگوریتم پیشنهادی • نتایج تجربی • مراجع
مقدمه • زیر درخت x در درخت y وجود دارد اگر و تنها اگر • تمامی نودهای آن در y موجود باشند • ترتیب پدر و فرزندی حفظ شود • ترتیب همزادی رعایت گردد
اصول درخت کاوی فازی • درجه پدر و فرزندی Ancestor – Descendant Degree • درجه ترتیب همزادی Sibling Ordering Degree • شمول نسبی Partial Inclusion • شباهت نودها Node Similarity
گذری بر درخت کاوی غیر فازی • درخت کاوی در 2 فاز : • تولید زیر درخت های کاندید • انتخاب زیر درخت های مکرر • الگوریتم های Level Wise • استفاده از خاصیت Apriori • محدودیت ها
گذری بر درخت کاوی غیر فازی (ادامه) • مفهوم Supportدر اینجا : • تعریف فرمال رابطه زیر درختی :
نمایش درخت به روشRSF • نمایش هر درخت با استفاده از بردار: • بردار موقعیت نود پیشین Predecessor Position Vector • بردار برچسب Label Vector • ساختن بردار ها با استفاده از DFS • مزایای این شیوه نمایش • استفاده بهینه از حافظه
ایده بنیادیPartial Inclusion • شمول نسبی • تعریف فرمال :
بحث Support (ادامه) • تعریف : برای یک پایگاه داده D، و برای آستانه τ و یک درخت S، مقدار Support برای S در D به صورت زیر تعریف می شود: • که در آن :
الگوریتم پیشنهادی • در ابتدا دقت شود : • حالت های متعددی برای منطبق شدن یک الگو بر اساس رویکرد جدید وجود دارد برای پوشانیدن تمامی این حالات، راه سختی در پیش است : Scalability Problem
الگوریتم پیشنهادی (ادامه) • به ازای هر درخت Tموجود در D • به ازای هر نود n در الگوی S • تمام نودهای موجود در Tرا تا هنگام تطابق یک نود با n، اسکن کن • در صورت پیدا کردن یک مورد تطابق، به دنبال تطابقات بیشتر بگرد • در صورت عدم تطابق با هیچ یک از نودهای T • به سراغ نود بعدی در S برو • یکی به تعداد Mismatch ها اضافه کن • اگر تعداد Mismatch ها از τ بیشتر شد، به سراغ درخت بعدی برو.
نتایج تجربی • پارامتر های تولید پایگاه داده درختی :
مراجع • F. DelRazoLopez, A .Laurent, P .Poncelet, M .Teisseire. FTMnodes: Fuzzy tree mining based on partial inclusion. Fuzzy Sets and Systems 160(15): 2224-2240 (2009) • F.D.R. López, A. Laurent, P. Poncelet, M. Teisseire, Fuzzy tree mining: go soft on your nodes, in: Proc. Internat. Fuzzy Systems Association World Congress (IFSA 07), Lecture Notes in Computer Science, Vol. 4529, Springer, Berlin, Heidelberg, 2007, pp. 145–154. • S. Sanchez, A. Laurent, P. Poncelet, M. Teisseire, Fuzbt: a binary approach for fuzzy tree mining, in: Proc. 11th IPMU Internat. Conf. on Information Processing and Management of Uncertainty in Knowledge-Based Systems (IPMU 2006), 2006.
با سپاس از توجه شما سبحان موسوی نژاد مرداد89