1 / 70

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler. Tanımlayıcı İstatistikler. Yaygınlık Ölçüleri. Yer Gösteren Ölçüler. Konum Ölçüleri. Merkezi Eğilim Ölçüleri. Yer Gösteren Ölçüler. Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır.

diane
Download Presentation

Tanımlayıcı İstatistikler

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tanımlayıcı İstatistikler

  2. Tanımlayıcı İstatistikler Yaygınlık Ölçüleri Yer Gösteren Ölçüler Konum Ölçüleri Merkezi Eğilim Ölçüleri

  3. Yer Gösteren Ölçüler • Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır. • Bu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir.

  4. Merkezi Eğilim (Ortalama) Ölçüleri Aritmetik Ortalama Ortanca Tepe Değeri Oran Konum Ölçüleri Yüzdelikler Çeyrekler

  5. Aritmetik Ortalama • Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek 2: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması

  6. Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Bu dağılımda 29 yaş aşırı bir değerdir ve ortalamayı etkiler ve aritmetik ortalamanın yüksek çıkmasına neden olur.

  7. Ortanca Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır. Örnek 3: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında 11, 11, 12, 12, 12 13, 14, 29 , 13, Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer

  8. Denek sayısı çift olduğunda Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı 12, 13, 11, 12, 14, 29, 12, 13, 15 11 Yaşlar sıraya dizildiğinde 11 11 12 12 12 13 13 14 15 29 Denek sayısı çift olduğundan Ortanca ve (n+2)/2=6. değerlerin (n/2)=5. 13 12 + ortalamasıdır. 12.5 Ortanca = = 2

  9. Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur. Ortanca, dağılımın orta noktası hakkında bilgi verir. ve aşırı değerlerden etkilenmez.

  10. Tepe Değeri • Tepe değeri dağılımda en fazla tekrarlanan değerdir. Örnek 4: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.

  11. Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. • En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. • Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.

  12. Oran Nitelik veriler; aritmetik ortalama, ortanca, tepe değeri gibi ortalama ölçüleri ile özetlenmez. Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler.

  13. Örnek 5: Eczacılık fakültesi birinci sınıf öğrencilerinin cinsiyet dağılımı Oran farklı bir ortalama ölçüsü olarak algılansa da bir aritmetik ortalamadır.

  14. A Okulunda Öğrencilerin Ağırlıklarının Dağılımı

  15. 2. Çeyrek (Ç2) 3. Çeyrek (Ç3) 1. Çeyrek (Ç1) Konum Ölçüleri Çeyrekler Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür. Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır. Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür.

  16. Örnek 6: 15 kişinin yaşları aşağıdaki gibidir. 6 2 3 5 5 7 10 9 7 3 5 8 7 5 5 Yüzdelikleri bulurken dağılımdaki değerler küçükten büyüğe sıraya dizilir. 2 3 3 5 5 5 5 5 6 7 7 7 8 9 10 • Çeyrek (25. Yüzdelik)=0.25x15=3.75. gözlemin değeridir. 1.Çeyrek 3. İle 4. arasında 4.’ değere daha yakındır. Bu durumda Ç1=3.Değer + (4.Değer – 3.Değer)0.75 3. Çeyrek (75. Yüzdelik)=0.75x15=11.25. Gözlemin değeridir. 3. Çeyrek 11. Ve 12. Değerler arasındadır. Örneğimizde 11. ve 12. değer aynı olduğundan Ç3=7

  17. Yüzdelikler Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.

  18. Örnek 7: 24 adet tablete ilişkin ağırlıklar (mg) aşağıdaki gibidir

  19. 24 tablet ağırlığına ilişkin 30. Yüzdelik (Y30) bulunmak istenirse, Sıraya dizilmiş tablet ağırlığı değerlerinde 24 x 0.30 = 7.2 olduğundan Y30, 7. ve 8. değerler arasındadır. 7. gözlem=3150mg 8. gözlem=3200mg 50x0.20=10mg Y30 = 3150+10=3160mg

  20. 24 tablet ağırlığına ilişkin 60. Yüzdelik(Y60) bulunmak istenirse, Sıraya dizilmiş tablet ağırlığı değerlerinde 24 x 0.60 = 14.4 olduğundan Y60, 14. ve 15. değerler arasındadır. 14. gözlem=3400mg 15. gözlem=3450mg 50x0.40=20mg Y60 = 3400+20=3420mg

  21. Yaygınlık Ölçüleri Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir. • Bir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir.

  22. Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır.

  23. Çeyrek Sapma Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler ; • Dağılım (Değişim) Aralığı • Standart Sapma • Varyans • Çeyreklikler Arası Genişlik • Değişim Katsayısı

  24. Dağılım AralığıDağılım aralığı en basit yaygınlık ölçüsüdür.Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur.R ile gösterilirR= En Büyük Değer-En Küçük Değer

  25. Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez. • Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. • Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür.

  26. Standart Sapma • Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. • Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. • Dağılımın yaygınlığı arttıkça standart sapma büyür. • Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır.

  27. Standart Sapma • Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. • Standart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. • Çarpık dağılımlarda kullanılması önerilmez!

  28. Standart Sapma N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Örneklem S. Sapması Kitle S. Sapması

  29. Örnek Dağılım I için Standart Sapma Eşitliğine göre standart sapma hesaplanması 0 0 6 -5 25 1 0 0 6 9 81 15 0 0 6 -4 16 2 122

  30. Örnek Dağılım II için Standart Sapma Eşitliğine göre standart sapma hesaplanması -3 9 3 1 1 7 0 0 6 -1 1 5 0 0 6 3 9 9 20

  31. Varyans Standart sapmanın karesine varyans denir (s2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.

  32. Çeyreklikler Arası Genişlik Dağılımdaki verilerin ortadaki 0.50 ‘sinin yer aldığı aralığı belirlemek için kullanılır. ÇAG = Ç3 – Ç1 Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. 2.5 ÇAG = 7 – 4.5 = Değerlerin yarısı 2.5 birimlik bir aralık içindedir.

  33. Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez. • Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. • Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. • Eğer incelenen dağılım simetrikse 25. ve 75. Yüzdelikler ortancadan eşit uzaklıktadır.

  34. Çeyrek Sapma • Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. • Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. • Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.

  35. Örnek 8: Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. Bu değer, Ç1 ve Ç3’ün ortanca dan ortalama olarak 1.25 birim farklı olduğunu gösterir.

  36. Değişim Katsayısı İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız. • Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir. • Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. • Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir.

  37. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısı hesaplanır

  38. DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım I’deki değerler ortalamaya göre %82.3’lük bir değişim gösterirken, dağılım II’deki değerler %33.3’lük bir değişim göstermektedir.

  39. Örnek 9: 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: Standart sapmalar farklı olmasına rağmen değişim katsayıları aynıdır. SS DK

  40. Verilerin Sınıflandırılması, Sıklık tabloları ve Sıklık tablolarından elde edilen tanımlayıcı istatistikler

  41. Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte kimi zaman yetersiz kalabilir.

  42. Neden Sınıflandırma? • Örneğin, sadece beden kitle indeksinin aritmetik ortalama ve standart sapmasını belirtmek, beden kitle indeksi verisinin dağılma özelliklerini göstermez. • Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.

  43. Neden Sınıflandırma?

  44. Öğrencilerin şişmanlık durumuna ilişkin sıklık tablosu:

  45. Neden Sınıflandırma?

  46. Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu (frekans tablosu) denir. Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır.

  47. Verilerin Sınıflandırılması • Nitel verilerde sınıflama için bir yöntem ya da kural yoktur. • Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir.

  48. Sayısal verilerde sınıflandırma • Sayısal verilerde ise sınıflama için dikkat edilmesi gereken çeşitli kurallar bulunur.

  49. Verilerin Sınıflandırılması • Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, • Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) • Veri setindeki değerler sadece bir sınıfa ait olmalıdır.

  50. Verilerin Sınıflandırılması Sayısal verilerde sınıflandırma Tanımlar Değişim Aralığı:En büyük değer – En küçük değer (R) Sınıf Sayısı:Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf:Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı:Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları:Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri:Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı:Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%):Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)

More Related