230 likes | 589 Views
Sınıflandırma Modeli. K-Nearest Neighbor Sınıflandırıcı. /12. K-Nearest Neighbor (K-En Yakın Komşu) Sınıflandırıcısı. Benzerlik ile öğrenme : Bana arkadaşını söyle, sana kim olduğunu söyleyeyim ( Tell me who your friends are and I’ll tell you who you are )
E N D
Sınıflandırma Modeli K-Nearest Neighbor Sınıflandırıcı /12
K-Nearest Neighbor (K-En Yakın Komşu) Sınıflandırıcısı Benzerlik ile öğrenme: Bana arkadaşını söyle, sana kim olduğunu söyleyeyim (Tell me who your friends are and I’ll tell you who you are) “Sarı saçlı kız” ı yeni bir örnek olarak düşünelim. Mevcut sınıflar içerisinde kendisine en yakın özelliklere sahip olan sınıfa dahil olacaktır.
B E ? B A B A Sınıf: B K-Nearest Neighbor Algoritması • Gelen yeni bir örneğin (E) hangi sınıfta dahil olacağına karar verelim: • Yeni örnek E ‘ nineğitim seti içerisinde yer alan bütün örnekler ile arasındaki uzaklığı (distance)hesaplanır • E için eğitim seti içerisindeki en yakın k örnek seçilir • E , en yakın k komşusu arasında en fazla olan sınıfa atanır
K-Nearest Neighbor Sınıflandırıcı Komşular arasındaki uzaklık • Her örnek nümerik değerlerden oluşan bir özellikler kümesi ile gösterilir • İki örnek arasındaki uzaklık Euclidean distance ile hesaplanır ve “Yakınlık” olarak adlandırılır • X ve Y arasındaki Euclidean distance X=(x1, x2, x3,…xn) ve Y =(y1,y2, y3,…yn) ise: • Distance (Mert, Ayla)=sqrt [(35-22)2+(35bin-50bin)2 +(3-2)2] Mert: Yaş=35 Gelir=35bin Kredi kartı sayısı=3 Ayla: Yaş=22 Gelir=50bin Kredi kartı sayısı=2
B B A A Sınıf: B /12 K-Nearest Neighbor: Öğrenme Tabanlı Örnek • Model kurulmaz: Eğitim verisindeki bütün örnekler kullanılır • Gelen yeni bir örnek sınıflandırılıncaya kadar her türlü işlem bekletilir B
K-Nearest Neighbor Sınıfladırıcı Örnek : 3-Nearest Neighbors
K-Nearest Neighbor Sınıflandırıcısı Sağlam ve Zayıf Yönler Sağlam: • Uygulamak ve kullanmak basittir • Anlaşılabilir – tahmini açıklamak kolaydır • Gürültüye sahip veriler için sağlamdır Zayıf: • Bütün örneklerin saklanması için çok hafızaya ihtiyaç vardır • Yeni bir örneği sınıflandırmak çok zaman alır (gelen yeni bir örneğin diğer örneklerle mesafesinin hesaplanması ve karşılaştırılması) /12
Yaş >= 40 H E Sınıf=A Gelir>=50K B H E B A Sınıf = B KKsayısı > 3 B A Sınıf: B E H Sınıf = B Sınıf = A K-Nearest Neighbor Sınıflandırıcı K-Nearest Neighbors (K-Enyakın Komşuluk) Sınıflandırma Ağaç Modeli
K-Nearest Neighbor Sınıflandırıcı olsaydı Mert: yaş=35 gelir=150bin Kredi kartı sayısı=3 Ayla: yaş=22 gelir=215bin Kredi kartı sayısı=2 Distance (Mert, Ayla)=sqrt [(35-22)2+(150,000-215,000)2+(3-2)2] • Komşular arasındaki mesafeyi hesaplarken bazı özellikler baskın olmaktadır. Örneğimizde gelir özelliğinin olduğu gibi. Bu tip değerlerin normalize edilmesi önemlidir. • Örnek: gelir yüksek gelir = 500bin Mert’in geliri150/500, Ayla’nın geliri de 215/500 olarak normalize edilir
K-Nearest Neighbor Sınıflandırıcı Değişkenlerin Normalize edilmesi B
K-Nearest Neighbor Sınıflandırıcısı • Uzaklık (distance) normalde nümerik değerler kullanılarak hesaplanır D = sqrt [(35-37)2+(35-45)2 +(3-2)2]=10.25 Nominal bir özelliğe sahip olsak ? Örnek: evli /12