780 likes | 1.34k Views
Tanımlayıcı İstatistikler. Tanımlayıcı İstatistikler. Yaygınlık Ölçüleri. Yer Gösteren Ölçüler. Konum Ölçüleri. Merkezi Eğilim Ölçüleri. Yer Gösteren Ölçüler. Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır.
E N D
Tanımlayıcı İstatistikler Yaygınlık Ölçüleri Yer Gösteren Ölçüler Konum Ölçüleri Merkezi Eğilim Ölçüleri
Yer Gösteren Ölçüler • Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır. • Bu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir.
Merkezi Eğilim (Ortalama) Ölçüleri Aritmetik Ortalama Ortanca Tepe Değeri Oran Konum Ölçüleri Yüzdelikler Çeyrekler
Aritmetik Ortalama • Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek 2: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması
Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Bu dağılımda 29 yaş aşırı bir değerdir ve ortalamayı etkiler ve aritmetik ortalamanın yüksek çıkmasına neden olur.
Ortanca Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır. Örnek 3: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında 11, 11, 12, 12, 12 13, 14, 29 , 13, Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer
Denek sayısı çift olduğunda Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı 12, 13, 11, 12, 14, 29, 12, 13, 15 11 Yaşlar sıraya dizildiğinde 11 11 12 12 12 13 13 14 15 29 Denek sayısı çift olduğundan Ortanca ve (n+2)/2=6. değerlerin (n/2)=5. 13 12 + ortalamasıdır. 12.5 Ortanca = = 2
Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur. Ortanca, dağılımın orta noktası hakkında bilgi verir. ve aşırı değerlerden etkilenmez.
Tepe Değeri • Tepe değeri dağılımda en fazla tekrarlanan değerdir. Örnek 4: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.
Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. • En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. • Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.
Oran Nitelik veriler; aritmetik ortalama, ortanca, tepe değeri gibi ortalama ölçüleri ile özetlenmez. Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler.
Örnek 5: Eczacılık fakültesi birinci sınıf öğrencilerinin cinsiyet dağılımı Oran farklı bir ortalama ölçüsü olarak algılansa da bir aritmetik ortalamadır.
2. Çeyrek (Ç2) 3. Çeyrek (Ç3) 1. Çeyrek (Ç1) Konum Ölçüleri Çeyrekler Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür. Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır. Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür.
Örnek 6: 15 kişinin yaşları aşağıdaki gibidir. 6 2 3 5 5 7 10 9 7 3 5 8 7 5 5 Yüzdelikleri bulurken dağılımdaki değerler küçükten büyüğe sıraya dizilir. 2 3 3 5 5 5 5 5 6 7 7 7 8 9 10 • Çeyrek (25. Yüzdelik)=0.25x15=3.75. gözlemin değeridir. 1.Çeyrek 3. İle 4. arasında 4.’ değere daha yakındır. Bu durumda Ç1=3.Değer + (4.Değer – 3.Değer)0.75 3. Çeyrek (75. Yüzdelik)=0.75x15=11.25. Gözlemin değeridir. 3. Çeyrek 11. Ve 12. Değerler arasındadır. Örneğimizde 11. ve 12. değer aynı olduğundan Ç3=7
Yüzdelikler Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.
Örnek 7: 24 adet tablete ilişkin ağırlıklar (mg) aşağıdaki gibidir
24 tablet ağırlığına ilişkin 30. Yüzdelik (Y30) bulunmak istenirse, Sıraya dizilmiş tablet ağırlığı değerlerinde 24 x 0.30 = 7.2 olduğundan Y30, 7. ve 8. değerler arasındadır. 7. gözlem=3150mg 8. gözlem=3200mg 50x0.20=10mg Y30 = 3150+10=3160mg
24 tablet ağırlığına ilişkin 60. Yüzdelik(Y60) bulunmak istenirse, Sıraya dizilmiş tablet ağırlığı değerlerinde 24 x 0.60 = 14.4 olduğundan Y60, 14. ve 15. değerler arasındadır. 14. gözlem=3400mg 15. gözlem=3450mg 50x0.40=20mg Y60 = 3400+20=3420mg
Yaygınlık Ölçüleri Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir. • Bir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir.
Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır.
Çeyrek Sapma Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler ; • Dağılım (Değişim) Aralığı • Standart Sapma • Varyans • Çeyreklikler Arası Genişlik • Değişim Katsayısı
Dağılım AralığıDağılım aralığı en basit yaygınlık ölçüsüdür.Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur.R ile gösterilirR= En Büyük Değer-En Küçük Değer
Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez. • Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. • Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür.
Standart Sapma • Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. • Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. • Dağılımın yaygınlığı arttıkça standart sapma büyür. • Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır.
Standart Sapma • Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. • Standart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. • Çarpık dağılımlarda kullanılması önerilmez!
Standart Sapma N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Örneklem S. Sapması Kitle S. Sapması
Örnek Dağılım I için Standart Sapma Eşitliğine göre standart sapma hesaplanması 0 0 6 -5 25 1 0 0 6 9 81 15 0 0 6 -4 16 2 122
Örnek Dağılım II için Standart Sapma Eşitliğine göre standart sapma hesaplanması -3 9 3 1 1 7 0 0 6 -1 1 5 0 0 6 3 9 9 20
Varyans Standart sapmanın karesine varyans denir (s2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.
Çeyreklikler Arası Genişlik Dağılımdaki verilerin ortadaki 0.50 ‘sinin yer aldığı aralığı belirlemek için kullanılır. ÇAG = Ç3 – Ç1 Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. 2.5 ÇAG = 7 – 4.5 = Değerlerin yarısı 2.5 birimlik bir aralık içindedir.
Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez. • Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. • Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. • Eğer incelenen dağılım simetrikse 25. ve 75. Yüzdelikler ortancadan eşit uzaklıktadır.
Çeyrek Sapma • Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. • Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. • Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.
Örnek 8: Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. Bu değer, Ç1 ve Ç3’ün ortanca dan ortalama olarak 1.25 birim farklı olduğunu gösterir.
Değişim Katsayısı İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız. • Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir. • Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. • Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir.
Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısı hesaplanır
DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım I’deki değerler ortalamaya göre %82.3’lük bir değişim gösterirken, dağılım II’deki değerler %33.3’lük bir değişim göstermektedir.
Örnek 9: 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: Standart sapmalar farklı olmasına rağmen değişim katsayıları aynıdır. SS DK
Verilerin Sınıflandırılması, Sıklık tabloları ve Sıklık tablolarından elde edilen tanımlayıcı istatistikler
Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte kimi zaman yetersiz kalabilir.
Neden Sınıflandırma? • Örneğin, sadece beden kitle indeksinin aritmetik ortalama ve standart sapmasını belirtmek, beden kitle indeksi verisinin dağılma özelliklerini göstermez. • Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.
Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu (frekans tablosu) denir. Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır.
Verilerin Sınıflandırılması • Nitel verilerde sınıflama için bir yöntem ya da kural yoktur. • Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir.
Sayısal verilerde sınıflandırma • Sayısal verilerde ise sınıflama için dikkat edilmesi gereken çeşitli kurallar bulunur.
Verilerin Sınıflandırılması • Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, • Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) • Veri setindeki değerler sadece bir sınıfa ait olmalıdır.
Verilerin Sınıflandırılması Sayısal verilerde sınıflandırma Tanımlar Değişim Aralığı:En büyük değer – En küçük değer (R) Sınıf Sayısı:Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf:Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı:Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları:Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri:Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı:Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%):Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)