1 / 49

TEMEL BETİMLEYİCİ İSTATİSTİKLER MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ

TEMEL BETİMLEYİCİ İSTATİSTİKLER MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ. BETİMLEYİCİ İSTATİSTİK. Betimsel istatistik istatistik bilim alaninda üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, ozetlenmesi ve analiz edililmesi ile ilgili istatistiktir.

fathi
Download Presentation

TEMEL BETİMLEYİCİ İSTATİSTİKLER MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TEMEL BETİMLEYİCİ İSTATİSTİKLER MERKEZİ EĞİLİM VEDAĞILIM ÖLÇÜLERİ

  2. BETİMLEYİCİ İSTATİSTİK • Betimsel istatistikistatistikbilim alaninda üç temel kısmından biridir. Sayısal verilerinin derlenmesi, toplanması, ozetlenmesi ve analiz edililmesi ile ilgili istatistiktir. • Betimsel istatistiğin çıkarımsal istatistikten veya daha uygun terimle endüktif istatistikten ana farkı betimsel istatistiğin hedefinin kantitatif sayı değerleri veya sayım veya sıralama değerleri halinde olan bir veri setini kantitatif veya grafik şekilde ifade edip özetlemek olması ve çıkarımsal istatistik gibi bu verilerin temsil ettiği kabul edilen istatistiksel anakütle karekteri hakkında kestirim veya hipotez sinaması için analitik ifadeleri elde etme hedefi olmamasıdir. Kantitatif verilerin analizi esas sonuçlarini endüktif istatistik analizleri kullanarak elde etmeye hedefli bir çalışma olsa bile, bunun yanında formel analize destek sağlamak için mutlaka betimsel istatistik araçlarının kullanılması gerekmektedir. Örneğin konuları insan davranışları olan bir formel istatistiksel analiz kapsayan bir çalışma tipik olarak tüm kapsamlı örneklem büyüklüğü, önemli altgrupların örneklem büyüklüğü, (ortalama yaş, veri konusu olarak ele alınan kişilerin erkek/kadin oranları gibi) değişik demografik, sosyal veya kliniksel karakterleri de kapsayan tablolarla birlikte verilir.

  3. MERKEZİ EĞİLİM VE DAĞILIM ÖLÇÜLERİ • Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin aldığı değerlerin birbirinden ne kadar farklı olduğunun ölçüsüdür. En sık kullanılan merkezi eğilim ölçüleri aritmetik ortalama, tepe değer, ortanca, çeyreklikler ve geometrik ortalamadır. En sık kullanılan dağılım ölçüleri ise, değişim genişliği, çeyrek sapma, varyans, standart sapma, standart hata ve değişim katsayısıdır.

  4. 2.1. Merkezi Eğilim Ölçüleri 2.1.1. Aritmetik Ortalama Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür. Birimlerin belirli bir değişken bakımından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Eşit aralıklı ve oran ölçme düzeyinde ölçülen değişkenler için kullanılır. Aritmetik ortalama hem kitle hem de örneklem için hesaplanır.

  5. Örnek: Ankara Üniversitesi Tıp Fakültesi Hastanesi kardiyoloji servisinde yatan hastaların hastanede kalış süreleri hakkında bilgi sahibi olunmak istenmektedir. Rasgele seçilen 15 hastanın hastanede kalış süreleri aşağıdaki gibi saptanmıştır. 20, 40, 10, 10, 26, 17, 17, 15, 22, 12, 12, 5, 5, 14, 15 Hastaların hastanede kalış sürelerine ilişkin aritmetik ortalamayı hesaplayınız Cevap:

  6. Aritmetik ortalamanın özellikleri, • Bir veri seti için sadece bir aritmetik ortalama vardır. • Nicel verilere uygulanabilir. • Birim değerlerinde meydana gelen değişim çok küçük olsa bile aritmetik ortalamayı etkiler. • Aritmetik ortalama ile birim değerleri arasındaki farkların toplamı sıfırdır. • Aritmetik ortalama ile birim değerleri arasındaki farkların kareleri toplamı minimum bir değerdir.

  7. 2.1.2. Tepe Değer (Mod) Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. Tepe değerin hesaplanmasında birimlerin büyüklük sırasına konulması şart değilse de, bu işlemin yapılması tepe değerin bulunmasında kolaylık sağlar.

  8. Örnek: Bir grup öğrencinin ağırlıklarına ilişkin veriler sırasıyla şöyledir: 56, 57, 57, 58, 69, 69, 69, 80, 81, 82 Öğrencilerin ağırlıklarına ilişkin tepe değeri hesaplayınız. Cevap: Yukarıdaki veri gurubunda en çok tekrarlanan değer 69 olduğundan TD = 69’dur.

  9. Tepe değerin özellikleri, • Denek sayısı az olduğunda tepe değer güvenilir bir ölçü değildir. • Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe değer olabilir. Bu durumda ya tepe değerini hesaplamaktan vazgeçilir ya da frekans tablosu tek tepe değerli bir dağılım olacak şekilde yeniden düzenlenir. • Tepe değer hesaplanırken birimlerin tümü işleme katılmadığı için uç değerlerden etkilenmez. • Nicel ve nitel verilerin her iki türü için de uygundur. • Eğrisi J, ters J ve U şeklinde olan veriler için tepe değer kullanılmaz.

  10. 2.1.3. Ortanca (Medyan) Bir veri gurubundaki değerlerin küçükten büyüğe sıralandığında tam ortaya düşen değer ortanca değeridir. Kitledeki birimlerin sayısı çok fazla ise verilerin özetlenmesinde merkezi eğilim ölçüsü olarak ortanca kullanılabilir. Ortanca, sınıflama ölçme düzeyi ile ölçülen değişkenler için kullanılmaz. Eşit aralıklı, oran ve sıralama ölçme düzeyinde ölçülen değişkenler için kullanılır.

  11. Örnek: Aynı hastalığa sahip 12 kişilik bir gruba yapılan ilaç tedavisi sonucu iyileşme süreleri gün olarak aşağıdaki gibi verilmiştir.

  12. Ortancanın özellikleri, • Aşırı uç değerlerden etkilenmez. • Birim değerleri ile ortanca arasındaki farkın yarısı negatif yarısı pozitiftir. • ∑ |Xi – ortanca|= minimum’dur.

  13. Aritmetik ortalama, ortanca ve tepe değer arasındaki ilişki verilerin dağılımının çarpıklığı hakkında bilgi verir. 2.1.4. Aritmetik Ortalama, Tepe Değer ve Ortanca Arasındaki İlişki

  14. 2.1.5. Çeyreklikler • Küçükten büyüğe doğru sıralanmış verileri dört eşit parçaya bölen değerlere çeyrek değerler denir. Birinci çeyreklik (Q1), veriler küçükten büyüğe sıralandığında verilerin %25 ini sağında, %75 ini solunda bırakan değerdir. İkinci çeyreklik ortancaya denk gelmektedir. Üçüncü çeyrek değer (Q3), veriler küçükten büyüğe sıralandığında verilerin %75 ini sağında, 22 • %25 ini solunda bırakan değerdir. Yani sıralı verilerde, ortancadan küçük olan değerlerin ortancası birinci çeyrek değer, ortancadan büyük olan verilerin ortancası üçüncü çeyrek değerdir.

  15. 2.6.1. Geometrik Ortalama

  16. Geometrik ortalamanın özellikleri, • Herhangi bir veri sıfır veya negatif değerli ise geometrik ortalama hesaplanamaz. • Uç değerlerden aritmetik ortalama kadar etkilenmez. • Aritmetik ortalamadan küçüktür. • Gözlem sonuçlarının geometrik ortalamaya oranlarının çarpımları 1 dir.

  17. 2.2. Dağılım Ölçüleri 2.2.1. Değişim Genişliği

  18. 2.2.2. Çeyrek Sapma

  19. 2.2.3. Varyans ve Standart Sapma • Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir. Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya koyan bir dağılım ölçüsüdür. Kitle varyansı , örneklem varyansı ile gösterilir. • Standart sapma varyansın kareköküdür. Kitle standart sapması , örneklem standart sapması s ile gösterilir.

  20. 2.2.4. Standart Hata

  21. 2.2.5. Değişim Katsayısı

  22. 2.2.6. Çarpıklık (Skewness) • Bir dağılımın normal dağılıma göre simetrik ya da çarpık olup olmadığını belirten bir ölçüdür. a3 ile gösterilir. Simetrik (normal) dağılımda a3değeri 0 (sıfır)’dır. Gözlemsel dağılım simetrik ise çarpıklık ölçüşünün sıfıra eşit ya da çok yakın olması gerekir. Pozitif çarpıklık küçük değerlerin fazlalıkta olduğunu, negatif çarpıklık ise büyük değerlerin fazlalıkta olduğunu gösterir. Herhangi bir veri setinde ortalamanın medyandan büyük olması durumunda sağa çarpık dağılım, ortalamanın medyandan küçük olması durumunda sola çarpık dağılım ortaya çıkar.

  23. 2.2.7. Basıklık(Kurtosis) • Basıklık dağılımın “dikliğini” veya “düzgünlüğünün” yani verilerin tepe noktalarının durumu hakkında bilgi veren ölçüttür. Sıfıra yakın bir basıklık normal dağılıma yakın bir şekli oluşturur. Basıklık için pozitif bir değer ise normalden daha dik bir dağılıma işarettir. • Negatif bir basıklık değeri ise normalden daha düz bir dağılıma işarettir.

  24. SPSS Analyse Menüsü • İstatistiksel analiz yöntemlerini uygulamak için kullanılan bir menüdür.

  25. 1- Reports: Analyzemenüsünün bir alt menüsü olan Reports ile veri setinde yer alan satır (Report Summaries in Rows), sütun (Report Summariesin Columns) ya da tümüne (Case Summaries) ilişkin kısa rapor içeriğinde tanımlayıcı istatistikler hesaplanır.

  26. OLAP Cubes: Seçilen değişkenlerin istatistiksel işlemlerini yapar. • Case summaries: Verilerin frekans ve çapraz tablolarının oluşturulması, belirtici istatistiklerin hesaplanması, grafik çizimi ve raporlanmasını sağlar. • Report Summaries in Row: Sıralara ilişkin özet istatistikler hesaplar. • Report Summaries in Column: Değişkenlerle ilgili özet istatistikler hesaplar.

  27. 2- Descriptive Statistics: Analyzemenüsünün bir alt menüsü olan Descriptive Statisticsile veri setine ilişkin frekans tablosu, tanımlayıcı istatistikler, grafikler ve çapraz tablolar (Frequencies, Descriptive Statistics, Explore, Crosstabs) oluşturulur.

  28. Frequencies: Verilerin frekans tablosunu, belirtici istatistikleri, dağılım ölçülerini hesaplar ve grafiklerini çizer. • Descriptives: Verilerin belirtici istatistiklerini ve asimetrik dağılım ölçüleri olan çarpıklık (kurtosis), basıklık (skewnes) ölçülerini hesaplar. • Explore: Tüm birimlerin yada her bir gruptaki birimlerin belirtici istatistiklerini hesaplar ve yayılım grafiklerini çizer. Bir değişkenin diğer değişkene göre istatistiklerini bulur. • Crosstabs: İki yada daha fazla değişkenin ikili çapraz tablolarını düzenler. Hazırlanan tablolara testler yapılır ve özet istatistikler bulunur. Sayısal değişkenler kodlama ile az sayıdaki gruba bölünerek çapraz tablolar düzenlenir.  

  29. TRANSFORM MENÜSÜ Veri dosyasındaki değişkenlerden yeni değişkenler türetmek, dönüşüm işlemlerini gerçekleştirmek için kullanılan bir menüdür.  

  30. 1) Compute Computealt menüsünde, nümerik ve string değişkenler için hesaplamalar yapılarak tüm birimler için yeni değişkenler oluturulabilir ya da varolan bir değişkenin değerleri değiştirilebilir. Mantıksal koşullar altında verinin alt grupları için hesaplamalar yapılabilir. Aritmetik fonksiyonlar, istatistiksel fonksiyonlar, dağılım fonksiyonları ve string fonksiyonları ile 70’in üzerinde farklı fonksiyon oluşturulabilir. 2) Count Her bir birim için iki ya da daha fazla değişkende aynı değer veya değerlere sahip gözlemlerin sayılmasını sağlar.

  31. 3) Recode Recodealt menüsündeki Into Same Variables alt menüsü, bir değişkenin belirlenen aralıktaki değerlerinin yeni kod değerlerine dönüştürülmesini ve bu kod değerlerinin aynı değişken üzerine yazdırılmasını sağlar. Into Different Variables alt menüsü, bir değişkenin belirlenen aralıktaki değerlerinin yeni kod değerlerine dönüştürülmesini ve bu kod değerlerinin farklı bir değişken olarak yazdırılmasını sağlar.

  32. Uygulama : • YTÜ İstatistik bölümü öğrencilerinden SPSS dersini alan 20 öğrencinin vize ve final notları aşağıdaki gibidir. Merkezi eğilim ve dağılım ölçülerini hesaplayınız. Vize 90,00 60,00 20,00 100,00 30,00 15,00 60,00 70,00 60,00 24,00 21,00 22,00 80,00 90,00 80,00 20,00 70,00 45,00 50,00 65,00 Final 20,00 75,00 20,00 80,00 50,00 20,00 50,00 77,00 10,00 25,00 27,00 25,00 60,00 40,00 70,00 25,00 90,00 75,00 45,00 85,00

  33. 1) Merkezi Eğilim Ölçülerinin Bulunması

  34. 20 öğrencinin aldığı final notlarının ortalaması 48’dir.

  35. 20 öğrencinin final notuna ilişkin ortanca değer 47’dir. • Tepe değeri 20’dir. Bunun anlamı 20’ye yakın not alan öğrencilerin sayısının fazla olmasıdır. Mean > Median > Mod Yönlü Eğimli

  36. Geometrik Ortalamanın bulunması:

  37. Geometrik Ortalamanın bulunması:

  38. Yapılan işlemler sonucu aşağıdaki çıktıya ulaşılır. Geometrik Ortalama (40,87) < Aritmetik Ortalama (48,45)

  39. 2) Dağılım Ölçülerinin Bulunması

  40. Dağılım Genişliği ve Maximum, Minimum Değerlerinin çıktıları aşağıdaki gibidir. • Değişim Genişliği = Max – Min • Final sınavından alınan en yüksek not 90 en düşük not ise 10’dur.

  41. Standart Sapma, Varyans ve Standart Hata bulunması.

  42. Standart Hata, Standart Sapma ve Varyans Değerlerinin çıktıları aşağıdaki gibidir. • Standart sapma 26,142 bulunmuştur. Buradan 20 öğrencinin finalden aldıkları notlar arasındaki farklılığın fazla olduğunu söyleyebiliriz.

  43. Analyze DescriptivesStatistics  Frequencies Basıklık ve Çarpıklığın Ölçülmesi • Skewness (Çarpıklık Katsayısı) • Kurtosis (Basıklık Katsayısı)

  44. Basıklık Katsayısı : - 1,540 Çarpıklık Katsayısı : 0,161 • Dağılım standart normal dağılıma uygun değildir. • Uygun olması için her iki katsayının 0’a eşit olması gerekirdi. • Basıklık katsayısı 0’dan küçük (negatif değerli) ise dağılım basıktır. • Çarpıklık katsayısı 0’dan büyük (pozitif değerli) ise dağılım • + yöne eğimli ve sağa çarpıktır.

  45. SORU : 92 kişiden ölçülen sistolik kan basınçları aşağıda verilmiştir. Bu verileri bilgisayara girerek istenilenleri bulunuz. 120 124 200 65 101 114 116 98 154 140 120 80 114 122 165 190 166 152 135 123 143 119 111 100 147 112 111 114 154 99 178 107 97 68 122 105 99 65 154 124 189 174 157 164 144 113 90 110 86 186 106 200 199 146 167 156 197 67 86 115 69 156 110 95 108 180 146 98 95 130 105 120 112 154 160 141 125 196 146 165 125 98 118 130 79 178 166 80 73 84 88 85 a) Aritmetik ortalama (mean), ortanca değer (median), en küçük değer (min), en büyük değer (max), değişim aralığı (range), standart sapma (standarddeviation), standart hata (standart error of mean) değerlerini bulunuz. b) Çarpıklık katsayısı (skewness)’ nı bularak çarpıklığın şeklini belirleyiniz. c) Basıklık katsayısı (kurtosis)’nı bularak eğrinin basık mı yoksa sivri mi olduğunu belirleyiniz.

  46. 1-) Ortalama , ortancavetepedeğerihakkındakısacabilgiverinizve SPSS ‘de bunlarınbulunmasınısağlayanadımlarıyazınız . • Cevap : Ortalama , Birimlerinbelirlibirdeğişkenbakımındanaldıklarıdeğerlerintoplamınınbirimsayısınabölümüolaraktanımlanır. • Ortanca , Birverigurubundakideğerlerinküçüktenbüyüğesıralandığında tam ortayadüşendeğerortancadeğeridir. • TepeDeğeri , Birverigrubunda en çoktekrarlanandeğeretepedeğer(mod) denir. • SPSS’deverilergirildiktensonrasırasıylaşunlaryapılır : Analyze sekmesinden descriptive statistics , oradan da frequencies tıklanır . Çıkanekrandamean,medianve mode seçilerek continue kutusunatıklanır . • 2-) Std. Hata , Std. SapmaveVaryanskonusundakısacabilgiverip SPSS ‘de yapılmasıgerekenadımlarısöyleyiniz . • Cevap : Varyans, birimdeğerlerininortalamadansapmalarınınkarelertoplamınınbirimsayısınabölünmesiileeldeedilir. • Standartsapmavaryansınkareköküdür • Standarthata, örneklemaritmetikortalamasınınhatasınıifadeeder. • SPSS de Analyze sekmesinden descriptive statistics , oradan da frequencies tıklanır . Çıkanekrandavarianca , std. error ve std. deviation kutucuklarıişaretlendiktensonra continue ‘yabasılır . • 3-)Analysemenüsüve descriptive statistics sekmesinikısacaanlatınız . • Cevap : Analysemenüsüistatistikselanalizyöntemleriniuygulamakiçinkullanılanbirmenüdür . • Desciriptive statistics iseverilerinfrekanstablosunu, belirticiistatistikleri, dağılımölçülerinihesaplayıpgrafikleriniçizmemiziveçapraztablooluşturmamızısağlar .

More Related