410 likes | 1.51k Views
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri. Verilerin İşlenmesi
E N D
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri • Verilerin İşlenmesi • Yapılan bir araştırmada elde edilen veriler dağınık, düzensiz ve karmaşık bir hal içerir. Bu şekliyle veriden anlamlı bir sonuca ulaşmak mümkün değildir. İstatistik analizin hammaddesi niteliğinde olan bu ham verinin işlenerek düzenli ve anlaşılır hale getirilmesi gerekir. • Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır.
Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri
Veri DüzenlemeZaman Serileri • Bir değişkenin değerlerinin zamanın şıklarına göre (gün, ay, mevsim, yıl vb.) değişimini gösteren serilere zaman serisi denir. Zaman serisi verileri eşit zaman aralıkları ile derlenmiş verilerden oluşur.
Veri DüzenlemeKalitatif (niteliksel) Veriler ve Dağılışları • Kalitatif (Niteliksel) verileri basit tasnif ya da bileşik tasnif işlemine tabi tutabiliriz. Basit tasnif işlemi sadece bir değişkenin şıklarına göre yapılan tasniftir. Yanda öğrencilerin mezun oldukları lise değişkeninin şıklarına göre dağılışı basit tasnif işlemine örnek gösterilebilir.
Aşağıdaki tabloda öğrencinin mezun olduğu lise değişkeni ile cinsiyet değişkeninin birlikte değişimi bileşik tasnif işlemi ile gösterilmiştir. Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi
Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya da ölçülebilir özellik taşıyan değişkenlere ait verilerin istatistik bölünme serileri ile gösterilmesinde basit, tasnif edilmiş ve gruplanmış seriler kullanılır. Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir. Veri DüzenlemeNiceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi
Basit seri örnekleri Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi
Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Tasnif edilmiş seri örnekleri
Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Gruplanmış seri örnekleri
Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir. Bu değişken tamsayı dışında değerler almaz. Bu sebeple sınıflar arası boşluklar oluşur.
Basit ve tasnif edilmiş serilerle verinin anlaşılır hale gelmesi mümkün olmuyorsa böyle durumlarda veriyi sınıflara ayırarak gruplanmış seriye dönüştürmek gerekebilir. Veriyi gruplamak için aşağıdaki Sturges sınıf aralığı formülü kullanılabilir. S: Sınıf aralığı Xmax: Verinin en büyük değeri Xmin: Verinin en küçük değeri N: Veri sayısı Basit ve tasnif edilmiş serinin Gruplanmış seriye dönüştürülmesi
Bir verinin gruplanmış seriye dönüştürülmesi • Xmin: 25 Xmax: 95 • Serinin sınıf aralıkları 11 birim olacak şekilde gruplanması uygun olacaktır.
Çapraz Tablolar • Bazı durumlarda değişkenin iki farklı özelliğinin aynı tabloda eşleştirilmiş olarak gösterilmesi istenebilir. Böyle durumlarda çapraz tablo kullanılır. Tabloda satıra istatistik birimlerin bir özelliği, sütuna diğer özelliği yazılarak ortak eleman sayıları hücrelere yazılmak suretiyle çapraz tablolar oluşturulur. Çapraz tablolar hem niteliksel, hem de niceliksel veriler için oluşturulabilir. Aşağıda MYO öğrencilerinin mezun oldukları lise türü ve öğrenim gördükleri bölümlere göre dağılışı verilmiştir. Bu tablo niteliksel veriler için düzenlenmiş bir tablodur.
Verilerin Grafiklerle Gösterilmesi • Niteliksel seriler ve Tasnif edilmiş seriler için çubuk diyagramı
Gruplanmış serinin Histogram grafiği Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği sürekli karakterde verilerin grafiği olması sebebiyle histogram sütunların birbirine bitişik olmasıdır
Gruplanmış serinin Histogram grafiği • Sınıf aralıkları eşit olmadığı durumda da histogram grafiği yine önceki örnekte olduğu gibi çizilir, yani histogram sütunlarının alanını frekansa eşit yapacak şekilde frekansların yeniden hesaplanması gerekir. Yanda öğrenci notları serisi farklı sınıf aralıkları ile verilmiştir
Gruplanmış serinin Histogram grafiği Eğer seri açık sınıflı ise histogramı çizilemez. Birinci sınıfın alt limiti veya son sınıfın üst limiti veya ortadaki gruplardan birisi yoksa bu seri açık sınıflı seri olur (20-25 sınıfında 20 veya 25 den birisi yoksa)
Frekans Eğrisi (Poligonu) Histogram sütunlarının üst orta noktalarından geçen grafiktir. Bu grafik dağılımın şeklini ortaya koymada kullanılan bir grafiktir.
Dairesel Grafikler • Özellikle niteliksel (sayısal olmayan) değişken değerlerinin grafikle gösterilmesinde kullanılırlar. Dairenin frekanslara açısal olarak paylaştırılması ile elde edilir. Bir birimin açısal karşılığı şöyle bulunur. • Açısal değer • Her kategorinin frekansı bu 3 ile çarpılarak dairedeki açısal değeri bulunur.
Zaman Serisi Grafiği (Çizgi Grafiği) • Zamana bağlı olarak sabit aralıklarla toplanmış olan verilerin eğilimini ve değişimini izleyebilmek için çizgi grafiklerinden faydalanılır. Grafikte yatay eksen zamanı, dikey eksen ise zaman serisi değerlerini göstermektedir. Zaman serileri artan, azalan, durağan ya da periyodik değişen veya bu özelliklerin bir kısmını içeren verilerden oluşur. Nüfus, gelir, enerji tüketimi, konut sayısı vs. artan zaman serilerine örnek gösterilebilir. Modası geçen, teknolojisi eskiyen ürünlerin satışı azalan zaman serisi niteliğindedir. Konutlarda tüketilen doğalgaz miktarı, meşrubat tüketimi vb. hem eğilimli hem de periyodik değişim gösteren bir özelliğe sahiptir.
Dağılım Grafiği • Aralarında ilişki olduğu düşünülen iki değişkenin birbirine göre nasıl bir değişim gösterdiğini, nasıl bir ilişki içinde olduğunu gösteren grafiklerdir. Genellikle bu değişkenlerden bir etkileyen (bağımsız, açıklayan), diğeri etkilenen (bağımlı, açıklanan) değişken olarak ortaya çıkar. Bir malın fiyatı ile onun talebi arasında ters bir ilişki olduğu düşünülür. Kişilerin gelirleri ile tüketim harcamaları arasında pozitif bir ilişkinin olduğu kabul edilir. Aşağıda öğrencilerin matematik notları ile istatistik notları arasındaki ilişki dağılım grafiği ile gösterilmiştir.
Üç boyutlu grafikler Çapraz tablo şeklindeki verilerin grafikle gösteriminde kullanılır. Bu grafikte dikey eksen frekansları, yatay eksenler ise değişkenin iki özelliğini gösterecek şekilde dizayn edilir.
Merkezi Eğilim Ölçüleri (Ortalamalar) • Analitik Ortalamalar • Aritmetik • Geometrik • Harmonik • Kareli ortalama • Analitik olmayan ortalamalar • Mod • Medyan • Kartil, Desil ve Santiller
I. Merkezi Eğilim Ölçüleri (Ortalamalar) • Bir veri setinin merkez noktasını gösteren, serinin normal değerinin bir göstergesi olan ve veriyi tek bir değerle ifade eden değerlere merkezi eğilim ölçüleri adı verilir. Bir verinin ortalaması onun en küçük ve en büyük değeri arasında yer alır. Ortalamaların Faydaları: Ortalamaların faydaları kısaca şöyle özetlenebilir. • Ortalamalar çoğu zaman serinin normal değerini gösterir. Tabi bunun için serinin dağılımının da aşırı çarpık olmaması gerekir. • İstatistik analiz işleminin temel elemanlarından biridir. • Aynı birimle ölçmek kaydıyla farklı serileri karşılaştırmaya imkan tanır. • Tek bir sayı olması sebebiyle hatırda tutulması kolaydır.
Ortalamalar verinin tamamını kapsayıp kapsamamasına göre analitik ve analitik olmayan ortalamalar şeklinde iki grupta incelenir. Analitik (Hassas ortalamalar) Verideki bütün değerleri dikkate alarak hesaplanan ortalamalardır. Analitik ortalamalar verinin özelliğine ve hesap tarzına göre dört farklı şekilde elde edilir. 1.1. Aritmetik ortalama 1.2. Geometrik ortalama (G) 1.3. Harmonik ortalama (H) 1.4. Kareli ortalama (K).
Aritmetik ortalama serideki gözlem değerleri toplamının toplam gözlem sayısına oranıdır. Basit seride Tasnif edilmiş seride Gruplanmış seride Xi : i. gözlem değeri fi : i. değerin frekansı mi : i. sınıfın orta noktası N : toplam gözlem sayısı 1.1. Aritmetik ortalama
Örnek: Adapazarı'nda nisan ayı ortalama yağışlarını tahmin etmek için geçmiş nisan ayı yağış rakamlarından rasgele 7 tanesi seçilmiş ve aşağıdaki sonuçlar elde edilmiştir. Bu verilerden hareketle Adapazarı'nda nisan ayı yağışlarının aritmetik ortalamasını hesaplayınız.
ÖrnekBir işletmede aynı parçayı üreten işçilerin bu parçayı üretim sürelerinin dağılımı aşağıdaki gibi gözlenmiştir. Parça üretim süresinin aritmetik ortalamasını bulunuz.
ÖrnekBir işyerinde yapılan telefon görüşmelerinin süresinin dağılımı için aşağıdaki gruplanmış seri verilmiştir. Buna göre görüşme süresinin aritmetik ortalamasını bulunuz.
Tartılı Aritmetik Ortalama • Bir serideki gözlem değerlerlerinin önem dereceleri farklı olursa, bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem derecesini gösteren katsayılar (tartılar) kullanılır. Örnek olarak öğrencilerin ortalama notlarını hesaplarken derslerin kredileri tartı olarak düşünülürken, ücretlerin belirlenmesinde kıdem tartı olarak kabul edilebilir. • Basit seride • Tasnif edilmiş seride • Gruplanmış seride
Örnek Aşağıda bir öğrencinin almış olduğu dersler, notları ve kredileri verilmiştir. Not ortalamasını tartılı aritmetik ortalama cinsinden hesaplayınız.
ÖrnekBir işletmede işçilerin saat ücretleri çalıştıkları süre (kıdem) dikkate alınarak belirlenmektedir. Veriler aşağıdaki gibi olduğuna göre bu işletmede ortalama saat ücretini tartılı aritmetik ortalama cinsinden hesaplayınız.
Tartılı aritmetik ortalamanın kullanıldığı yerler - Veriler arasında önem farkı bulunması halinde kullanılır. - Oranların ve ortalamaların ortalaması hesaplanırken kullanılır. - Ortalama maliyet ve satış fiyatı, bileşik fiyat ve miktar indekslerinin hesaplanmasında da tartılı ortalama kullanılır. ÖrnekBir işletmede bulunan üç tezgahın belli bir günde ürettikleri malların sayısı ve üretimlerindeki kusurlu oranları aşağıdaki tabloda verilmiştir. Buna göre bu tezgahların ürettiği mamul kütlesinin kusurlu oranını bulunuz.
Aritmetik ortalamanın özellikleri 1 - Aritmetik ortalama hassas bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı değere doğru kayma gösterir. 2 - Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin toplam değeri elde edilir. 3- Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları toplamı sıfır olur. 4- Serideki değerlerin aritmetik ortalamadan sapmalarının kareleri toplamı minimum olur. 5- Aritmetik ortalama özellikle normal dağılıma yakın serilerin ortalaması için elverişlidir. 6-Bir serinin değerleri, diğer iki serinin değerleri toplamından oluşuyorsa bu serinin aritmetik ortalaması da diğer iki serinin aritmetik ortalamaları toplamına eşit olur.X =Y +Z