1 / 72

כריית נתונים

כריית נתונים. כריית נתונים. אנטיליגנציה עסקית ( BI ) סטטיסטיקה יישום חשוב של מחסן אלגוריתמים לומדים. מטרת כלי ה- Data mining.

roxy
Download Presentation

כריית נתונים

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. כריית נתונים

  2. כריית נתונים • אנטיליגנציה עסקית (BI) • סטטיסטיקה • יישום חשוב של מחסן • אלגוריתמים לומדים

  3. מטרת כלי ה- Data mining • המטרה: * גילוי קשרים, הקבצות, מגמות, חוקים * רכישת ידע • על מנת: * הפיכת ידע להחלטה עסקית * רכישת יתרון אסטרטגי

  4. כריית נתונים • כמו בכריית זהב - • הקשרים קיימים • אך נסתרים

  5. טכנולוגיות מחשוביות ואלגוריתמים • שיטה אחת לכל הצרכים ? • טכניקות שונות - לבעיות שונות • אתגר – הבנה והתאמה

  6. - BIהשגת ידע - Knowledge • לא רק הבנה (מה קורה ) • צעד אחד קדימה • חיזוי קדימה

  7. BI השגת ידע - Knowledge • מי הם הלקוחות הפוטנציאלים למוצר החדש ? • בחירה לפי תיעדוף • איך לפרסם? • באיזה אמצעי מכירה לנקוט ?

  8. BIהשגת ידע - Knowledge • UPA • Understand • Predict • Act • ONLINE– REAL TIME

  9. EFM–Enterprise Feedback Management • Approach • ארגון ממוקד לקוח • מיקוד על ערך המגע עם הלקוח • הלקוח שותף להחלטות הארגון • תקשורת דו-כיוונית - * מהנתונים לכיוון הלקוח * מהלקוח לבסיס הנתונים (השלמת נתונים)

  10. EFM–Enterprise Feedback Management • לאחר ביקור בתחנת שירות – מחכה אימייל • הלקוח נשאל על טיב השירות • תובנות הלקוח מצורפות לתמונת לקוח • תשובותיו לסקרים מצורפות לתמונת לקוח

  11. EFM–Enterprise Feedback Management • נשמרים: "נתונים קשים" וכן נתונים "רכים" • "קשים" - נתוני פעילות עסקית • "רכים" - מחשבות/השקפות/דעות • נתונים "רכים" יותר יציבים וקבועים • יתכן שארעה נטישה בגלל מעברדירה • אבל השקפהוהעדפה - אינןמשתנות

  12. דוגמא: בנק • מי שנכנס לאתר – נשאל שאלות • בפעם הבאה כשיכנס לאתר יקבל הצעות ספציפיות • הצעות המתאימות לתמונת הלקוח

  13. דוגמא: Yamaha Motors • רצון הלקוח קובע את תכונות האופנוע הבא • בעזרת סקרים מתכננים - * כידון * אגזוז * צבע * מראה

  14. סוגי בעיות • בעיות חיזויPredictive Analytics, Classification / Forecasting • בעיות פילוח לפי אשכולות – Clustering • מציאת רצף פעילויות – Association Analysis

  15. הנתונים שבמחסן • נתונים מטויבים • טיוב - ? • נתונים לאאיכותיים - * מסקנות מוטעות * החלטות שגויות

  16. תהליך ניתוח מבוסס גילוי • אין הנחות • בסיס נתונים גדול • הצפת - קשרים, הקבצות, תבניות וחוקים

  17. דוגמא • מטרה: הגדרת אוכלוסיית לקוחות למבצעמכירות • גילוי הקבצות שונות • אין הנחה מי הקבוצה המתאימה למבצע • בסיום - ההחלטה

  18. יישומים, טכניקות, ואלגוריתמים

  19. יישומים • תחום המכירות

  20. יישומים • פילוח לקוחות (Customer Profiling): * פרופיל הלקוחות - - זיהוי ? - הגדרה ? * טכניקה ? * מטרה - ?

  21. יישומים • ניתוח נטישה • (Churn Management) • קשרים בין נתוניפעילות ובין נטישה • זיהוי סיבות הנטישה • זיהוי תכונות לקוח נוטש

  22. ניתוח נטישה • מה ניתן לעשות ? • עלות שימור – עלות גיוס • מידת הצ'יפור כפונקציה של ההסתברות לנטישה • דוגמא: ? • טכניקה ?

  23. יישומים • ניתוח סל קניות • (Market Basket Analysis) • ניתוח הרגלי הקנייה של לקוחות • המטרה: * מוצרים – לקוח לאורך זמן * מוצרים הנרכשים יחד • ההבנה מסייעת: ?

  24. ניתוח סל קניות • ההבנה מסייעת: * קביעת רמות מלאי * תכנוןשטח המדפים * הצגת מוצרים על מדפים • טכניקה:?

  25. יישומים • שיווק ממוקד • (Targeted Marketing) • ניתוח צורות שונות של אמצעי שיווק שהביאו בעבר לבצוע קניה • המטרה: ?

  26. שיווק ממוקד - מטרות • התאמת אמצעי השיווק לסוגי הלקוחות * דיוור ישירים * קטלוגים * תכנון אתר הבית * תכנון מספר סוכנים *זיהוי תכונות של ?

  27. יישומים • איתור הונאות • (Fraud Detection) • תחומים: בנקאות, מסחר בניירות ערך, טלקומוניקציה, ביטוח, ושירותי בריאות • יישומים: ?

  28. איתור הונאות • יישומים: * כרטיסי אשראי * שיחות טלפון * מונה חשמל * מונה מים

  29. יישומים • דירוג אשראי-ניהול סיכוני אשראי • (Credit Scoring) • תקנות רגולטוריות באזל2 • זיהוי סיכונים במתן אשראי • זיהוי לקוחות העומדים לשנות את דירוג האשראי שלהם

  30. יישומים • יישומי ביטוח ובריאות • (Insurance and Health Care) • ניתוח תביעות מבוטחים • ההסתברות • תוחלת התביעה • פרמיית הוגנת

  31. יישומי ביטוח ובריאות • זיהוי טיפולים רפואיים המתבצעים ביחד • זיהוי טפולים מוצלחים למצבי מחלה מסוימת

  32. יישומים • בקרת איכות • (Quality Control) • ניתוח תקלות בקווי הייצור • חיזוי גורמים לתקלות

  33. טכניקות • הצגה ויזואלית של הנתונים • (Visualization) • גרפים - תרשימים • צבעים - הצגה תלת-מימדית • טכניקה נפוצה - דיאגרמת פיזור (Scatter Diagram) • דיאגראמת דו מימדית המציגה פיזור הנתונים לפי שני פרמטרים

  34. דוגמא לדיאגרמת פיזור • מה ניתן ללמוד?

  35. טכניקות • מציאת רצף של פעילויות (Association Rules) • זיהוי נתוניםהקשורים עם נתונים אחרים • הצגת חוקיות הסתברותית • 80% מרכישות בהן נרכשה גבינת צאן כללו גם רכישת מעדן חלב דל שומן • עוד ? • מתאימה לבעיות מסוג ניתוח סל הקניות

  36. מציאת רצף של פעילויות (Association Rules) • 92%מהלקוחות להם מנוי לעיתון "גלובס" ומנוי העוסק במוסיקה - יש להם גם מנוי לירחון העוסק במכוניות

  37. טכניקות • ניתוח סדר הופעה • Sequence Based Analysis • הבנת סדר ביצוע העסקאות על ציר הזמן • מטרה: ? • לדוגמא: ?

  38. מטרה • הבנת תבנית ההתנהגות לגבי קרות אירוע מסוים (רכישת מוצר באינטרנט) כדי לצפות מראש קרות האירוע בעתיד

  39. דוגמאות • מסלול מנצחשל לינקים המביאלביצוע קניהבפועל

  40. דוגמאות • איתור תהליכי טיפול מוצלחים למחלה • זיהוי הסתבכויות ממתן תרופות • "אם ניתן טיפול x אזי ההסתברות להופעת דלקת y לאחר חודש הינה p%" • "אם מניה x עולה ביותר מ- 20% בעוד מדד המניות יורד אזי מניה y תעלה כעבור שבוע בהסתברות p%"

  41. טכניקות • ניתוח אשכולות • (Cluster Analysis) • פילוח אוכלוסייה לאוסף אשכולות • דמיון בין אובייקטים השייכים לכל אשכול • המטרה: ?

  42. תהליך בניית האשכולות • אלגוריתם - * מגדיר דפוס התנהגות * בונה אשכולות * משייך לקוחות * מזהה מאפיינים • הבנת תוצאות ההקבצה מחייבת הבנה בנתונים

  43. תהליך בניית האשכולות

  44. טכניקות • סיווג (Classification) • נפוץ • תהליך חיזוי • מודל סיווג ע"פ היסטוריה • הקבצות ידועות • יישומים: ?

  45. סיווג (Classification) • יישומים: * כשל אשראי * כשל תהליך ייצור * הונאות * נטישה

  46. סיווג (Classification) • סוגיאלגוריתמים - * רגרסיה איזה ? * עצי החלטות * רשתות עצביות

  47. אלגוריתמים • עצי החלטה ( Decision Tree) • העיקרון: * זיהוי גורמים * ז"א: חיפוש תכונה/פרמטר המנבאת התנהגות * מיון ע"פ חשיבות * הצגה - עץ

  48. אוסף של כללי החלטה • Rules for 1 - contains 4 rule(s) • Rule 1 for 1 • if AGE = 2 • and PAY_WEEK = 2.0 • then 1 • Rule 2 for 1 • if CLASS = 1 • and PAY_WEEK = 2.0 • then 1 • Rules for 0 - contains 2 rule(s) • Rule 1 for 0 • if PAY_WEEK = 1.0 • then 0 • Rule 2 for 0 • if AGE = 1 • then 0

  49. שלבים בשימוש בעצי החלטות • בנית העץ(Decision Tree Induction) - סיווג לקוחות פוטנציאלים * שהפכו * שלא הפכו - האלגוריתם בונה עץ החלטות

More Related