170 likes | 324 Views
Pozitif ve Negatif Ürün İlişkilerini İncelemek için Bir Çerçeve: Yeniden Madencilik (Re- mining ). Ayhan Demiriz G. Ertek, T. Atan ve U. Kula 30 Haziran 2010, YA/EM 2010 Sabancı Üniversitesi. İçerik. Kavramlar Giriş Negatif İlişki Madenciliği Metodoloji Kısa Tanım
E N D
Pozitif ve Negatif Ürün İlişkilerini İncelemek için Bir Çerçeve: Yeniden Madencilik (Re-mining) Ayhan Demiriz G. Ertek, T. Atan ve U. Kula 30 Haziran 2010, YA/EM 2010 SabancıÜniversitesi
İçerik • Kavramlar • Giriş • NegatifİlişkiMadenciliği • Metodoloji • KısaTanım • YenidenMadencilikSürecininPerakendecilikVerileriÜzerineUygulanması • VeriModeli • İlişkiMadenciliğininUygulanması • BetimselYenidenMadencilik • GörselKeşifeYönelikYenidenMadencilik • Sonuç
ÇalışmanınTemeli • Pozitifvenegatifilişkimadenciliğiyaygınolarakbüyükölçekliperakendecilikverileriniincelemedebaşarılıolarakkullanılmaktadır • Fiyatverilerioperasyonelverilerinbirparçasıolduğuhaldeverimadenciliğindeçokazkullanılmıştır. • Hem pozitif hem de negatifilişkimadenciliğindefiyatverilerininkullanılmasınaolanaksağlamak • Yurt genelinde 200’den fazlamağazasıolanbirhazırgiyimperakendecisineaitverilerianalizetmek
Terminoloji • İlişkimadenciliğişeklindekurallarıbulmayaçalışır. • DestekveGüvenkuralıngücünübelirler. • Negatifilişkimadenciliğiiseşeklindekikurallarıbulmayaçalışır. Öyleki , Y’ninyokluğu (alınmadığı) anlamınagelir. • Ürünikamelerinibulmadanegatifilişkimadenciliğikullanılabilir.
NegatifİlişkiMadenciliği A F • Adaynegatifilişkilerüçfarklıyöntemleeldeedilebilir • Sıkürünkümelerininçocuklarıörneğin{DJ} • Sıkürünkümesindenbirürünvesıkürünkümesinininçocuğuörneğin{CJ} • Sıkürünkümesindenbirürünvediğersıkürününkardeşiörneğin{CH} Frequent Itemset C H B G D E J K
Dolaylıİlişki • {AB} ve {AC} ürünkümelerininherikisi de sıktır. • Fakat {BC} ürünkümesisıkdeğildir. • O zaman {BC} ürünkümesihakkında A ürünüüzerindendolaylıilişkiyesahiplerdirhükmünevarabiliriz. • {BC} ürünkümesinegatifilişkiiçinbiradaykümedir. A C B
Ana Adımlar • Pozitifvenegatifilişkileyesahipürünçiftlerieldeedilir. • Pozitifvenegatifilişkiyesahipürünçiftlerisırasıyla ‘+’ ve ‘-’ olaraketiketlenir • Ürünveürünçiftlerineaitözellikleredayanarakyenibirverisetihazırlanır • Yeniverisetiüzerindekeşfedayalıgörselanaliz, betimselvetahmineyönelikyenidenverimadenciliği (re-mining) gerçekleştirilir
MuhtemelKullanımAlanları • Alana özgübilgiyiyeniverimadenciliğiadımındakullanma • Alana özgübilgiyiorjinalverimadenciliğiadımındakullanmayarakkarmaşıklığınazaltılması • Sadeceilişkimadenciliğineözgüdeğildirbaşkayöntemlerle de birliktekullanılabilir • Verimadenciliğisonuçlarınıanlamakveanalizetmekiçinkullanılabilir
VakaÇalışması • Türkiye’ninöndegelenhazırgiyimperakendezincirindenverilereldeedilmiştir • Veriler, 2007 yazsezonundabir merchandise grubuna (örneğinerkek) aittümsatış, iadevestokhareketleriniiçermektedir • SKU seviyesindeanalizbüyükdeğişkenliğesahipolduğundanürünhiyerarşisindebirüstkademeolan model bazındaanalizleryapılmıştır • Toplam 710 modelden 600 tanesianalizlerdekullanılmıştır • Toplam 2.753.260 satışişleminde 4.376.886 ürünsatışıgerçekleşmiştir
İlişkiMadenciliğiSonuçları • Destekseviyesi 100 kabuledildiğinde 600 ürün de sıktır • 3930 pozitifve 2433 negatifilişkiyesahipürünçiftibulunmuştur
YeniBirÖğrenmeProblemi • Pozitifvenegatifilişkilerdenöğrenebilirmiyiz? • İlişkileriaçıklamakiçinkurallarbulabilirmiyiz? • Ürünçiftleriiçinyenideğişkenlernasıloluşturulmalıdır (örneğin AB için mi yoksa BA için mi?) • Rastgele mi sıralanmalı? Yoksa belli birdüzende mi? • Yüksekfiyatlıürünvedüşükfiyatlıürün?
BetimselYenidenMadencilik • Kararağaçlarıbuamaçiçinkullanılabilir • C5.0, negatifilişkileriçin 53 kuralvepozitifilişkileriçinse 11 kuralbulmuştur • `-' sınıfiçinbirörnek: IfStartWeekH > 11 and AvgPriceL_H0_L1 > 0.844 andCategoryL = 0208 andCorrNormPrice_HL ≤ 0.016 Then `-'. • Yüksekfiyatlıürün 11. haftadansonrasatılırsave • Ortalama normalize edilmişdüşükürününfiyatıtekbaşınasatıldığında 0.844’ten büyükiseve • Düşükfiyatlıürününkategorisi “0208” iseve • Normalize edilmişfiyatlararasındakikorelasyon 0.016 tan küçükveyaeşitise, hedefsınıf ‘-’ tır
BetimselYenidenMadencilik • Başkabirörnekkural: ifLifeTimeL ≤ 21 andMinPriceH > 19.99 andCategoryH = 0271 andCorrNormPrice_HL ≤ 0.005 then ‘-’ • ‘+’ sınıfiçinörnek: ifMaxPriceH ≤ 14.43 and StdDevPriceH_H1_L0 ≤ 0.05 then ‘+’. • ‘+’ sınıfiçindiğerbirörnek : ifLifeTimeH > 23 andLifeTimeL ≤ 21 andMaxPriceH > 12.21 andCorrNormPrice_HL > 0.003 then ‘+’.
Sonuç • Verimadenciliğisürecini, ekadımveyenibirverisetiilezenginleştirebilenbirçerçeveönerilmiştir • Bu yöntemle, ilk verimadenciliğisonuçlarınınaçıklanmasınısağlayankurallarbulunabilmektedir • Dolaylıolarakpozitifvenegatifkantitatifilişkimadenciliğiyapılabilmektedir • Potansiyelolarakilişkimadenciliğininyanındadiğerverimadenciliğiyaklaşımlarındadakullanılabilir