380 likes | 1.18k Views
İleri İstatistik Teknikleri. Üç tür yalan vardır: Yalan, Kuyruklu Yalan, İstatistik Benjamin Disraeli Dördüncü tür yalan İleri İstatistiktir, Emre Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim
E N D
İleri İstatistik Teknikleri Üç tür yalan vardır: Yalan, Kuyruklu Yalan, İstatistik Benjamin Disraeli Dördüncü tür yalan İleri İstatistiktir, Emre Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim “Hayat fena halde futbola benzer: dört doğru pas yüzde 90 gol demektir” Bir filmden
İleri İstatistik Teknikleri • ? Neden “ileri” teknikler? • Amaç: Eldeki “veriyi” “bilgiye” dönüştürebilmek - Veri vs. Bilgi
İstatistiksel Yöntemler • Betimleyici (Descriptive) Yöntemler • Verili herhangi bir dağılımı bir ya da birden çok katsayıda anlatabilmek - Örn: şirkettekilerin yaş ortalaması • Açıklayıcı (Explanatory) Yöntemler • Bir veri setinde olası ilişkileri sergilemek - Örn: Şirkettekilerin ayakkabı numaralarıyla aldıkları maaş arasındaki ilişki
Betimleyici Yöntemler • Amaç: Eldeki dağılımı en iyi şekilde temsil etmek • Araçlar: • Ortalama: • Medyan: • Mod:
Betimleyici Yöntemler • Veeee.... • Varyans/Standart Sapma: • Neden:
Dağılım: 6,6,6 Ortalama: 6 Medyan: 6 Mod: 6 Std. Sapma: 0 Dağılım: 0,6,12 Ortalama: 6 Medyan: 6 Mod: 6 Std: Sapma: 6 İki Dağılımın Hikayesi Amaç: Görünenin Ötesine Bakabilmek
Açıklayıcı Analizler • Amaç: Verili bir sette olası ilişkileri keşfetmek ya da öngörülen hipotezleri test etmek
Görünenin Arkası.... Genel Ortalama: 51, Std. Sapma: 22 Kadınlar Ortalama: 46, Std. Sapma: 23 Erkekler Ortalama: 46, Std. Sapma: 21
Ve Görünenin Arkası... Erkekler Kadınlar
Açıklayıcı Analizler • Amaç: İlk bakışta görül(e)meyen ilişkileri sergileyip ilişkisel açıklamalar getirmek • Y= f(x) ie: İnternet kullanımı= f(cinsiyet) ie: Yaşam biçimi= f(gelir) ie: Tüketim kalıpları= f(yaşam biçimi)
Örnek: Gelişmişlik ve Yaşam Kalitesi • BM verilerinden elde edilen bir tablo... • Araştırma sorusu: Gelişmişlik ve Yaşam Kalitesi arasındaki ilişki • İşlemleştirme: • Gelişmişlik: Kişi Başına Düşen GSMH • Yaşam Kalitesi: Çocuk ölümleri
Sorular • Grafiği ne kadar temsil ediyor? • Ne gibi çıkarımlar yapabiliyoruz? • “Forecasting” yapılabiliyor mu? • İlişkinin “boyutu” ve “yönü” ölçülebiliyor mu? Ne Kadar Yeterli?
Amaç: Daha iyi analiz, daha iyi veri • Covariance (kovaryans) • Correlation Coefficient (korelasyon)
Sonuçlar • Covariance: 2115,318 • Correlation: -0,60165 Çıkarılacak Sonuç Ne?
Amaç: Nedensel İlişkileri Göstermek • Y= f(x) • X, Y’nin belirleyicisi mi? • X, Y’yi ne kadar belirliyor? • X, Y’yi ne yönde belirliyor?
Regresyon Analizi • Y= f(x) • Y= a+bx • Regresyon Denklemi:
Regresyon Analizinin Açılımları • Çoklu Regresyon • Kukla Değişkenli Regresyon (Dummy Variable) • Binomial/Multinomial Regression
Regresyon Analizinin “cız-kaka”ları • Arkasında çok ciddi üç varsayım vardır. • Regresyon analizi sadece “interval” ya da “ratio” ölçümleme düzeyinde yapılır • “Do not use any mathematical model without understanding it”
Kümeleme ve Birleştirme Analizleri • Bütün olgular birbiriyle ilişkilidir. Aradaki ilişkinin 0 olduğu yerde bile... • Birleştirme analizlerinin amacı olguların birbirleriyle olan ilişkilerinden yola çıkarak işimizi kolaylaştırmaktır • 1. Değişken sayısını azaltabilirler • 2. Vaka sayısını azaltabilirler • 3. Boyut sayısını azaltabilirler
Faktör Analizi: Değişken Sayısını Azaltmak • Analize tabi bütün değişkenler birbiriyle ilişkili. • Bu değişkenlerin bazıları birbirleriyle daha kuvvetli ilişki sahibi. • Kuvvetli ilişki sahibi değişkenleri birleştirerek aza indirmek mümkün. • Değişkenlerarası korelasyon matrisi kullanılarak “faktör”ler inşa ediliyor
“Case” Sayısı Azaltmak: Clustering • Verili değişkenler bazında analize alınan “case”ler birbirlerine benzerler • Bu benzerlik bir ya da daha fazla boyutta olabilir • Benzerliklerden yola çıkarak “clusters” oluşturmak mümkün • Benzerlikler metric mesafelerle ölçülüyor
Boyut Sayısını Azaltmak: MDS • Analizde gözönünde tuttuğumuz her değişken bir “boyut” sayılabilir. • İki-üç boyuttan fazlasını “visualize” etmek kolay değil. • Değişkenler arasındaki uzaklıktan yola çıkılarak bu boyut sayısı azaltılabilir. • Değişkenler arasındaki uzaklıklar metric olarak ölçülebilir
Ve mutlu son.... • “İstatistiksel araçlarınız ne kadar güçlü, ne kadar gelişmiş olursa olsun, unutmamanız gereken tek şey var: • Bu verileri okuma yazması olmayan demiryolu bekçileri topladı” Sir John Maynard Keynes