1 / 103

Bölüm 3

Bölüm 3. Tanımlayıcı İstatistikler. Tanımlayıcı İstatistikler. Bir veri setini tanımak veya birden fazla veri setini karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı istatistikler denir .

vina
Download Presentation

Bölüm 3

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bölüm 3 Tanımlayıcı İstatistikler

  2. Tanımlayıcı İstatistikler • Bir veri setini tanımak veya birden fazla veri setini karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı istatistikler denir. • Analizlerde kullanılan veri tiplerine (basit, gruplanmış, sınıflanmış) göre hesaplamalarda kullanılacak formüller değişmektedir.

  3. Tanımlayıcı İstatistikler Yer Ölçüleri 1)Aritmetik ort. 2)Geometrik ort. 3)Harmonik ort. 4)Mod 5)Medyan 6)Kartiller • Değişkenlik Ölçüleri • Range • (Değişim Aralığı) • 2) Ort. Mutlak sapma • 3) Varyans • 4) Standart Sapma • 5) Değişkenlik(Varyasyon) • Katsayısı Çarpıklık Ölçüleri 1)Pearson Asimetri Ölçüsü 2)Bowley Asimetri Ölçüsü Basıklık Ölçüleri

  4. Yer Ölçüleri • Yer ölçüsünü belirlemek amacıyla veri analizini yapacak kişi, öncelikle veri seti için hangi ölçüyü kullanması gerektiğine karar vermelidir.

  5. Tanım • Merkezi Eğilim Ölçüsü • Veri setinin orta noktası veya merkezinin değeridir.

  6. 1) Aritmetik Ortalama • Üzerinde inceleme yapılan veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir. • Örnek: • Sınav notlarının ortalaması, • Yaz aylarında m2’ye düşen ortalama yağış miktarı

  7. Örnek Ortalaması ve Anakütle Ortalaması x , x-bar şeklinde telaffuz edilir ve örneklemin ortalamasıdır. x x = n x µ = N µ, “mü” şeklinde telaffuz edilir ve anakütle ortalamasıdır

  8. 1 14 19 31 50 Bir Denge Noktası Olarak Ortalama • 1, 14, 19, 31, 50 sayılarının ortalaması =23 tür. Şekil sayıları bir çizgi üzerinde yerleştirilmiş eşit küçük ağırlıklar şeklinde gösterir.1,14,19,31,50 • Aritmetik ortalama denge noktasıdır.

  9. Basit Veriler için Aritmetik Ortalama Örneği Örnek: İzmir ilinde ilköğretim ikinci sınıfta okuyan öğrenciler üzerinde yapılan bir araştırmada rasgele 8 öğrenci seçilmiş ve ailenizde kaç çocuk vardır sorusuna aşağıdaki gibi cevap vermişlerdir. Ailelerin çocuk sayılarının ortalamasını hesaplayınız. 1,3,2,1,4,5,6,2 n = 8 i = 1,2,…,8

  10. Gruplanmış Veriler İçin Aritmetik Ortalama f : frekans k: grup sayısı i = 1,2,3,……….,k

  11. Örnek: Bir otomobil bayisinde 80 gün boyunca yapılan inceleme sonucunda satılan arabaların adetlerine göre dağılımı yandaki tabloda verilmiştir. Buna göre bir gün içinde satılan ortalama araba sayısını hesaplayınız.

  12. Sınıflanmış Veriler İçin Aritmetik Ortalama f : frekans k : sınıf sayısı i = 1,2,3,……….,k m : sınıf orta noktası • Sınıflanmış verilerde her bir sınıf içindeki değerlerin neler olduğu bilinmediğinden dolayı ve yalnızca her bir sınıfın frekans değerleri bilindiğinden dolayı sınıfı temsil etmek üzere sınıf orta noktaları hesaplamada kullanılır. • Kullanılan formül gruplanmış veriler için kullanılan formüle benzerdir.

  13. Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının aritmetik ortalamasını hesaplayınız.

  14. Ağırlıklı Ortalama

  15. 2) Geometrik Ortalama • Bir veri setinde bulunan n adet elemanın çarpımının n nci dereceden kökünün alınmasıyla elde edilen yer ölçüsüdür. • Geometrik ortalamanın formülüne bakıldığında hesaplama zorluğu olduğundan dolayı logaritma ifadesi kullanılır. Genellikle basit veriler için kullanışlı olup negatif sayılar için kullanışlı değildir.

  16. Geometrik Ortalama’nın Kullanım Alanları • Ortalama oranları, • Değişim Oranları, • Logaritmik dağılış gösteren veri setleri, için kullanışlıdır. Örnek: fiyat indeksleri, faiz formülleri.

  17. Örnek: Abac şirketinin yıldan-yıla olan fuel deki tüketim harcamalarının değişimi yüzde -5, 10, 20, 40, ve 60. büyüme faktörlerinin geometrik ortalamasını kullanarak harcamalardaki ortalama yıllık yüzde değişim belirlenir. Büyüme faktörleri için yüzde değişim dönüştürme ile elde edilenler; 0.95 1.10 1.20 1.40 1.60

  18. G = anti log 0,27045 = 100,08971 ≈ 1,229

  19. 3) Harmonik Ortalama • Bir veri setinde bulunan n adet elemanın çarpma işlemine göre terslerinin ortalamasının tersinin alınmasıyla elde edilen yer ölçüsüdür. Genellikle basit veriler için kullanışlıdır.

  20. Harmonik Ortalama’nın Kullanım Alanları Zaman verileri için kullanışlıdır. Örnek: Zaman birimi başına hız, para birimi başına satın alınan birim sayısı. Belirli koşullar ve fiyat tipleri için zaman verilerinin ortalamalarının hesaplanmasında kullanılan bir yer ölçüsüdür. Zamana bağlı hız, fiyat verimlilik gibi oransal olarak ifade edilebilen verilerin ortalamasın alınmasında da kullanılabilir. NOT: ARİTMETİK ORT. > GEOMETRİK ORT. > HARMONİK ORT.

  21. Örnek: Bir tekstil fabrikasında çalışan dört kişinin bir pantolonu ütüleme süreleri aşağıda verilmiştir. Buna göre bu fabrikada bir pantolon ortalama kaç dakikada ütülenir? İşçi 1: 10 dk. İşçi 2: 6 dk. İşçi 3: 4 dk. İşçi 4 : 5 dk.

  22. 4) Mod • Bir veri setinde en çok gözlenen ( en çok tekrar eden ) değere veya frekansı en fazla olan şans değişkeni değerine mod adı verilir. • Veri setinin modu olmayacağı gibi birden fazla da modu olabilir. • Mod genellikle kesikli şans değişkenleri için oluşturulan gruplanmış verilerde aritmetik ortalama yerine kullanılabilir.

  23. Mod • Mod, büyük veri setlerinde verinin daha çok nerede toplandığını bulmak için kullanılır. Örneğin erkek kıyafetleri satan bir perakendeci, potansiyel müşterilerini belirlemek için gömlek kol uzunluğu ve gömlek yaka ölçüsüyle ilgilenebilir. • Nicel veri seti çok büyük olmadığı zaman mod anlamlı olmayabilir. • Sınıflandırılmış veriler için kullanılabilecek tek merkezi eğilim ölçüsüdür.

  24. Örnekler • Modu 1,10 • 1 den fazla moda sahip , 27 ve 55 • Modu yok 1) 5,40 1,10 0,42 0,73 0,48 1,10 2) 27 27 27 55 55 55 88 88 99 3) 1 2 3 6 7 8 9 10

  25. Gruplanmış Veriler İçin Mod Basit verilerde bulunduğu gibi hesaplanır. Örnek: Bir otomobil bayisinde 80 gün boyunca yapılan inceleme sonucunda satılan arabaların adetlerine göre dağılımı yandaki tabloda verilmiştir. Buna göre araba satışları için mod değeri nedir? En yüksek frekansa sahip olan gözlem değeri 2 olduğundan dolayı araba satışları için mod değeri 2’dir.

  26. Sınıflanmış Veriler İçin Mod • Sınıflanmış verilerde mod değeri hesaplanırken ilk olarak mod sınıfı belirlenir. • Mod sınıfı frekansı en yüksek olan sınıftır. • Mod sınıfı belirlendikten sonra bu sınıf içerisinde yer alan modun tam değeri sınıf frekansı ve kendine komşu olan sınıf frekansları dikkate alınarak hesaplanır.

  27. Mod = = Mod Sınıfı Aralığının Alt Sınırı = Mod Sınıfı Frekansı - Kendinden Bir Önceki Sınıf Frekansı = Mod Sınıfı Frekansı – Kendinden Bir Sonraki Sınıf Frekansı i = Mod Sınıfının Sınıf Aralığı

  28. Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının mod değerini hesaplayınız. Mod sınıfı

  29. Frekansı en yüksek olan sınıf mod sınıfı olarak belirlenir.Mod sınıfı belirlendikten sonra formülde ilgili değerler yerine koyularak mod değeri hesaplanır.

  30. 5) Medyan • Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adı verilir. • Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir. • Medyan, veri setindeki tüm elemanlardan etkilenmez.

  31. Basit Veriler İçin Medyan • Veri Setinin Hacmi Tek Sayı İse; • nci gözlem değeri medyandır. • Veri Setinin Hacmi Çift Sayı İse; • ve nci gözlem değerinin aritmetik • ortalaması medyandır.

  32. 5.40 1.10 0.42 0.73 0.48 1.10 0.66 0.42 0.48 0.66 0.73 1.10 1.10 5.40 Tam ortadaki değer medyandır. MEDYAN 0.73 5.40 1.10 0.42 0.73 0.48 1.10 0.42 0.48 0.73 1.10 1.10 5.40 Medyan bu iki noktanın arasına düşmektedir 0.73 + 1.10 MEDYAN 0.915 2

  33. Gruplanmış Veriler İçin Medyan • Gruplanmış verilerde medyan değeri hesaplanırken veri setinin tam orta noktasının hangi gruba ait olduğunu belirlemek için birikimli frekans sütunu oluşturulur. • Sıra numarası belirlendikten sonra o sıra numarasına ait grup medyan değeri olarak ifade edilir.

  34. Örnek: Bir un fabrikasının satış mağazasında bir gün içinde satılan un paketlerinin gramajlarına göre satış adetleri aşağıda verilmiştir. Buna göre veri seti için medyan değerini hesaplayınız. • n/2 ve (n/2)+1 nci gözlem değerlerine karşılık gelen değerler (40 ve 41 nci sıra ) 3 olduğundan dolayı medyan değeri 3’tür.

  35. Frekans dağılımı aşağıdaki gibi olsaydı (n+1)/2nci elemana (45 nci elemana) karşılık gelen değer 4 olacağından dolayı veri setinin medyanı 4 olarak hesaplanacaktır.

  36. Sınıflanmış Veriler İçin Medyan • Sınıflanmış verilerde medyan değeri hesaplanırken ilk olarak medyan sınıfı belirlenir. • Medyan sınıfı birikimli frekanslar dikkate alındığında toplam frekansın yarısını içinde bulunduran sınıftır. • Medyan sınıfı belirlendikten sonra medyan sınıfından bir önceki sınıfın birikimli frekansı ve medyan sınıfı frekansı dikkate alınarak hesaplanır.

  37. Lmed : Medyan sınıfının alt sınırı fl : Medyan sınıfından bir önceki sınıfın birikimli frekansı fmed : Medyan sınıfının frekansı i: Sınıf Aralığı

  38. Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının mod değerini hesaplayınız. Medyan sınıfı

  39. Toplam 50 adet gözlem olduğundan dolayı, birikimli frekans sütununda 50/2 =25 nci gözlemin bulunduğu sınıf medyan sınıfı olarak belirlenir.

  40. Veriler mod etrafında simetrik oldukları zaman, mod, medyan ve artimetik ortalama birbirlerine eşit olur. Eğer örneklem aynı anakütleden çekilmişse, aritmetik ortalama diğer ölçülere göre daha güvenilirdir

  41. 6) Kartiller • Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda dört eşit parçaya ayıran üç değere kartiller adı verilir. • İlk % 25’lik kısmı içinde bulunduran 1. Kartil (Q1), % 50’lik kısmı içinde bulunduran 2. Kartil (Q2), % 75’lik kısmı içinde bulunduran 3. Kartil (Q2), olarak adlandırılır. • %50’lik kısmı içinde bulunduran 2. Kartil (Q2) aynı zamanda veri setinin medyanıdır. %25 %25 %25 %25 Q1 Q2 Q3

  42. Basit Veriler İçin Kartiller • 1.Kartil Q1 • nci gözlem değeri, • 3.Kartil Q3 • nci gözlem değeri,

  43. Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için Q1 ve Q3 değerlerini hesaplayınız. 30,42,56,61,68,79,82,88,90,98 (n+1)/4 ‘ncü verinin sıra numarası (10+1)/4 = 2,75’dir. Q1= 42 + 0,75 .(56 - 42) = 52,5 , 3(n+1)/4 ‘ncü verinin sıra numarası 3(10+1)/4 = 8,25’dir. Q3= 88 + 0,25.(90 - 88) = 88,5 ‘dir.

  44. Veri seti aşağıdaki gibi verilseydi, 30,42,56,61,68,79,82,88,90 (n+1)/4 ‘ncü verinin sıra numarası (9+1)/4 = 2,5’dir. Q1= 42 + 0, 5 .(56 - 42) = 49 , 3(n+1)/4 ‘ncü verinin sıra numarası 3(9+1)/4 = 7,5’dir. Q3= 82 + 0, 5.(88 - 82) = 85 , olarak hesaplanacaktı.

  45. Gruplanmış Veriler İçin Kartiller • Gruplanmış verilerde kartiller hesaplanırken veri setinin ilk çeyrek ve son çeyrek kısmını tam olarak ifade etmek amacıyla birikimli frekans sütünü oluşturulur. • Gruplanmış verilerde örnek hacminin tek veya çift olduğuna bakılmaksızın • n/4 ncü eleman 1.Kartil (Q1), • 3n/4 ncü eleman ise 3.Kartil (Q3), • olarak ifade edilir.

  46. Örnek: Bir un fabrikasının satış mağazasında bir gün içinde satılan un paketlerinin gramajlarına göre göre satış adetleri aşağıda verilmiştir. Buna göre veri seti için Q1 ve Q3 nedir? • n/4 ncü ( 20 nci ) sıra numarasına karşılık gelen gözlem 3 olduğundan; 1.kartil 3, 3n/4 ncü ( 60 ncı ) sıra numarasına karşılık gelengözlem 4 olduğundan; 3.kartil 4’tür.

  47. Sınıflanmış Veriler İçin Kartiller • Sınıflanmış verilerde kartiller hesaplanırken ilk olarak birikimli frekans sütunu oluşturularak kartil sınıfları belirlenir. • Kartil sınıfları belirlenirken gruplanmış verilerde olduğu gibi n/4 ve (3n)/4 ncü sıralardaki elemanların hangi sınıflara ait iseler o sınıflar kartil sınıfları olur. • Kartil sınıfları belirlendikten sonra bu sınıflardan bir önceki sınıfın birikimli frekansı ve mevcut sınıf frekansı dikkate alınarak kartil değerleri hesaplanır.

  48. 1. Kartil 2. Kartil 3. Kartil

More Related