500 likes | 1.06k Views
Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler. Sıklık Tablosu. Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır. Neden Sınıflandırma?.
E N D
Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler
Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır.
Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte yetersiz kalabilir.
Neden Sınıflandırma? • Beden kitle indeksi, şişmanlığın bir ölçüsü olarak kullanılır, çeşitli hastalıklar için de risk faktörüdür. • Şişmanlık göreceli bir kavram olduğundan aritmetik ortalama ve standart sapma, beden kitle indeksi verisinin dağılma özelliklerini göstermez. • Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.
Neden Sınıflandırma? Beden Kitle İndeksi Durum <18.5 kg/ düşük kilolu 18.5-24.9 kg/ m2 normal kilolu 25-29.9 kg/ m2 hafif şişman 30-34.9 kg/ m2 1. derecede şişman 35-39.9 kg/ m2 2. derecede şişman 40 kg/ m2 3.derecede şişman + Dünya Sağlık Örgütü
Verilerin Sınıflandırılması • Nitel verilerde sınıflama için bir yöntem ya da kural yoktur. • Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir.
Verilerin Sınıflandırılması Sayısal verilerde sınıflandırma Tanımlar Değişim Aralığı:En büyük değer – En küçük değer (R) Sınıf Sayısı:Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)
Verilerin Sınıflandırılması Sınıflandırmada Aşamalar 1. Verileri küçükten büyüğe sıralama 2. Sınıf sayısı ya da sınıf aralığı belirleme 3. A.S. ve Ü.S. ların belirlenerek sınıfların oluşturulması 4. Sınıf mutlak sıklıklarının belirlenmesi 5. Göreli sınıf sıklıklarının hesaplanması
Verilerin Sınıflandırılması • Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, • Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) • Veri setindeki değerler sadece bir sınıfa ait olmalıdır.
Örnek 1: 50 Yetişkinin Beden Kitle İndeksi Değerleri
Verilerin Sınıflandırılması 1. Sınıf sayısı belirleme Daha önceki bilgilerimize göre BKI için 6 sınıf ilk bakışta uygun görülmektedir. 2. A.S. Ve Ü.S. ların belirlenmesi R = 41.43-12.78 = 28.65 4.78 (Sınıf aralığı) c = 28.65 / 6 = 4.775 İlk sınıfın alt sınırı En Küçük değer (12.78) dir. Sonraki sınıfın alt sınırı 12.78 + 4.78 = 17.56
Sınıfların Belirlenmesi 50 Yetişkine İlişkin Beden Kitle İndeksi Dağılımı Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f 11
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f 11 12
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f 11 12 12
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f 11 12 12 4
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f 11 12 12 4 6
Sınıfların Mutlak Sıklıklarını Bulma 50 Yetişkinin Beden Kitle İndeksi Değerleri
Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma f 11 12 12 4 6 5
f Sınıf A.S. Ü.S. 11 1 12.78 17.55 12 2 17.56 22.33 3 22.34 27.11 12 4 4 27.12 31.89 6 5 31.90 36.67 5 6 36.68 41.45 Sınıfların Mutlak Sıklıklarını Bulma %f 22 24 24 8 12 10
f Ü.S. Sınıf A.S. 1 12.78 17.55 11 2 17.56 22.33 12 3 22.34 27.11 12 4 27.12 31.89 4 6 5 36.67 31.90 6 36.68 41.45 5 Sınıf Değeri Bulma S %f 22 15.165 24 19.945 24.725 24 29.505 8 34.285 12 39.065 10
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Aritmetik Ortalamanın Hesaplanması
Ü.S. %f f s Sınıf A.S. 1 12.78 17.55 11 22 15.165 2 17.56 22.33 19.945 12 24 3 22.34 27.11 24 24.725 12 4 27.12 29.505 4 31.89 8 34.285 6 5 36.67 12 31.90 39.065 6 36.68 41.45 5 10 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama f s 166,815 239,340 296,700 118,020 205,710 195,325 1221,91
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Sınıflandırılmamış veriden hesaplanan a. ortalama = 24,893
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
397,80 4773,60 611,32 7335,84 870,54 3482,16 1175,46 7052,76 1526,07 7630,35 32804,68 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama s Sınıf A.S. f Ü.S. s2 f s2 f s %f 1 12.78 17.55 229,97 2529,67 166,815 11 22 15.165 239,340 2 17.56 19.945 22.33 12 24 3 22.34 27.11 24 24.725 296,700 12 4 27.12 118,020 4 29.505 8 31.89 6 5 34.285 36.67 12 31.90 205,710 6 36.68 195,325 5 41.45 39.065 10 1221,91
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması Sınıflandırılmamış veriden hesaplanan s.sapma= 7,61
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Tepe Değerinin Hesaplanması • Sınıflandırılmış verilerde tepe değeri, en fazla frekansa sahip olan sınıfın sınıf değeridir. (tek tepeli dağılım) • Bir dağılımda veriler iki sınıfta yoğunlaşıyorsa bu dağılama ise iki tepeli dağılım denir. İkiden fazla sınıfta yoğunlaşıyor ise çok tepeli dağılım denir. • Beden kitle indeksi örneğinde veriler iki sınıfta yoğunlaşmaktadır.( 2. ve 3. sınıf) Dolayısıyla tepe değeri iki sınıfın sınıf değeridir. (19.945 ve 27.725)
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Yapay Sınıf Değerleri İle Aritmetik Ortalamanın Hesaplanması Bu yöntemde sınıflara hesaplama kolaylığı sağlayacak biçimde yapay sınıf değerleri atanır. Yapay sınıf değerleri atanırken hesaplama kolaylığı sağlanabilmesi için sınıf sıklığı en büyük olan sınıfın yapay sınıf değeri sıfır alınır. Yapay sınıf kolonu sıklık tablolarında b ile gösterilir. Sıfırdan üste doğru bir azaltılarak alta doğru bir artırılarak b sütunu oluşturulur.
f S Ü.S. Sınıf A.S. 1 12.78 17.55 11 15.165 2 17.56 22.33 12 19.945 A 3 22.34 27.11 24.725 12 4 27.12 31.89 4 29.505 34.285 6 5 36.67 31.90 6 36.68 41.45 5 39.065 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama b -2 -1 0 1 2 3
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama A: b sütununda 0(sıfır) konulan sınıfın karşısındaki sınıf değeri
f b S Ü.S. Sınıf A.S. 1 12.78 17.55 11 15.165 -2 2 17.56 22.33 12 19.945 -1 3 22.34 27.11 24.725 0 12 4 27.12 31.89 4 29.505 1 34.285 2 6 5 36.67 31.90 6 36.68 41.45 5 39.065 3 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama f b -22 -12 0 4 12 15 -3
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
f b f b b2 Ü.S. Sınıf A.S. -22 1 12.78 4 17.55 11 -2 2 17.56 22.33 -12 1 12 -1 3 22.34 0 0 27.11 0 12 4 4 27.12 1 31.89 4 1 12 4 2 6 5 36.67 31.90 15 6 36.68 41.45 9 5 3 -3 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması f b2 44 12 0 4 24 45 129
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
Sınıf A.S. f Ü.S. %f S 1 12.78 17.55 22 11 15.165 2 17.56 12 22.33 24 19.945 3 22.34 12 27.11 24 24.725 4 27.12 8 31.89 4 29.505 5 31.90 34.285 6 36.67 12 6 36.68 41.45 5 39.065 10 Sınıf Ara Değeri Bulma Sınıf ara değeri, o sınıfın üst sınırı ile bir alttaki (sonraki) sınıfın alt sınırının ortalamasıdır. SAD 17,555 22,335 27,115 31,895 36,675
S Sınıf A.S. %f f Ü.S. SAD 1 12.78 17.55 22 11 15.165 17,555 2 17.56 12 22.33 24 19.945 22,335 3 22.34 12 27.11 24 24.725 27,115 4 27.12 31.89 4 29.505 8 31,895 5 31.90 34.285 6 36.67 12 36,675 6 36.68 41.45 5 12 39.065 Den Daha Az Sıklıkları Bulma DDAS 11 23 35 39 45
f Sınıf A.S. %f S Ü.S. DDAS SAD 1 12.78 17.55 22 11 15.165 17,555 11 2 12 17.56 22.33 24 19.945 22,335 23 3 12 22.34 27.11 24 24.725 35 27,115 4 27.12 31.89 4 29.505 8 31,895 39 5 34.285 6 36.67 31.90 12 36,675 45 6 36.68 41.45 5 10 39.065 Den Daha Az Göreli Sıklıkları Bulma DDAGS(%) 22 46 70 78 90
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması P : Belirlenen yığılımlı yüzde n : Toplam gözlem sayısı L:Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıktan öncekinin sınıf ara değeri y :Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıktan önceki sınıfın “den daha az” değeri f:Belirlenen yığılımlı yüzdenin içinde bulunduğu sınıfın sıklığı c : Sınıf Aralığı
Sınıf A.S. Ü.S. f SAD DDAS 1 12.78 17.55 11 11 17,555 2 17.56 22.33 12 23 22,335 3 27.11 22.34 12 35 27,115 4 4 31.89 27.12 39 31,895 6 31.90 36.67 5 45 36,675 5 41.45 6 36.68 Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması P = 0.25 n = 50 c = 4,78 DDAGS(%) L f 22 46 y P 70 78 90
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması Sınıflandırılmamış veriden hesaplanan %25 = 20.145
Sınıf A.S. Ü.S. f SAD DDAS 1 12.78 17.55 11 11 17,555 2 17.56 12 22.33 23 22,335 3 12 27.11 22.34 35 27,115 4 31.89 4 27.12 39 31,895 31.90 6 36.67 5 45 36,675 5 41.45 6 36.68 Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde Ortancanın Hesaplanması P = 0.5 n = 50 c = 4,78 DDAGS(%) L 22 f 46 70 y P 78 90
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde Ortancanın Hesaplanması Sınıflandırılmamış veriden hesaplanan ortanca = 22.86