120 likes | 387 Views
MATEMATİK İSTATİSTİK VE GÜVENİLİRLİK. 1. GİRİŞ. Çevremizdeki istatistikler. Her ayın 3. günü açıklanan, bir önceki ayın enflasyon oranları, Borsa endeksinin her gün aldığı yön ve değer, Ekonominin yıllık büyüme hızı, Ortalama ücretlerdeki artış, İthalat ve ihracattaki gelişmeler,
E N D
MATEMATİK İSTATİSTİK VE GÜVENİLİRLİK 1. GİRİŞ
Çevremizdeki istatistikler • Her ayın 3. günü açıklanan, bir önceki ayın enflasyon oranları, • Borsa endeksinin her gün aldığı yön ve değer, • Ekonominin yıllık büyüme hızı, • Ortalama ücretlerdeki artış, • İthalat ve ihracattaki gelişmeler, • Gelir dağılımındaki dengesizliğin boyutları, • Kentlerdeki gecekondulaşma hızı, • Gazetelerin satış rakamları, • Televizyon kanallarının izlenme oranları, • Kamuoyu yoklamaları, • Maç sonlarındaki oyun istatistikleri, • vb…
İstatistik??? • İstatistik = Sayısal Veriler • “Bu ayın fiyat endeksleri yayımlandı.” • “İstatistiklere göre dış ticaret açığımız rekor düzeyde.” • “İşletmede verimlilik istatistikleri düzenlemeliyiz.” • İstatistik = Kuramlar ve Teknikler • “Bu fakültede istatistik okutuluyor.” • “Bu işletmenin kalite kontrolünde istatistik kullanılıyor.”
İstatistik Teknikleri • İstatistik teknikleri genellikle 3 bölüme ayrılarak incelenir. • Tanımlayıcı (Descriptive) Teknikler • Sorgulayıcı (Exploratory) Teknikler • Çıkarımcı (Inferential) Teknikler
Tanımlayıcı (Descriptive) Teknikler • Tanımlamak = bir olayı özellikleriyle belirtmek • Betimleyici teknikler verilerin toplanması, bölümlendirilmesi, özetlenmesi ve sunulması ile ilgilenirler. • Verilerin özelliklerini ortaya koymak için çizelgeler, çizimler ve özet bilgi hesaplamaları yapılır.
Sorgulayıcı (Exploratory) Teknikler • Verilerin ön incelemesi şeklinde de adlandırılabilir. • Zaman zaman tanımlayıcı tekniklerin işlevini görürler. Zaman zaman da bir yol gösterici ve ipucu olarak çıkarımcı teknikler gibi kullanılırlar. • Anlaşılması kolay tekniklerdir. Buna karşılık çıkarımcı tekniklere göre daha kaba sonuçlar üretirler. • Veriler çok sayıda ise kavranabilmesi için özetlenmesi gerekir. • Bu amaçla histogram, dal-yaprak, kutu, serpilme gibi çizimler yapılarak, sıklık dağılımı, düzey, yaygınlık, çarpıklık, basıklık, toplanma ve ilişki ölçüleri gibi değerler hesaplanır.
Çıkarımcı (Inferential) Teknikler Toplanmış verilerin düzenlenip sunulması GENELLEME • Araştırmacının toplamış olduğu veriler genellikle daha büyük bir topluluktan elde edilmiştir. • Asıl bilinmek istenen ve hakkında yargıya varılmak istenen daha büyük topluluğa ana kütle (popülasyon), • bu anakütleden derlenmiş veriler topluluğuna da örneklem (sample) denilir. • Bir ana kütle hakkında sonuçlar çıkarmaya yarayan istatistik tekniklerine çıkarımcı (tümevarımcı) teknikler adı verilir. • Anaktülenin çeşitli özelliklerini yansıtan değerlere anakütle göstergesi (parametre), bunları kestirmek için örneklemden elde edilen benzer özelliği gösteren değere de örneklem göstergesi denilebilir.
Tanımlayıcı İstatistikler • Sınıflama Sınıflama incelenen vasfın aynı şıkkına sahip birimlerin kümeler halinde ayrılması şeklinde tanımlanabilir. • Sınıflama sonucunda elde edilen her bir şıkkın tekrarlanma sayısı ise “frekans” olarak adlandırılır. • Sınıflama ile ilgili sorun ücret, meslek, doğum yeri gibi vasıfların şıklarının on binleri bulmasıdır. • Bu tür vasıflar için tüm şıkların ifade edildiği durumlarda dahi kitlenin kavranması ve elde edilen sonuçların sağlıklı olarak yorumlanması mümkün olmaz. Bunun için gruplama yöntemine başvurulur.
Tanımlayıcı İstatistikler • Gruplama Gruplama bir vasfın homojen şıklarının bir araya getirilmesi işlemidir. • Örneğin doğum yerlerinin düzenlenmesinde şıkların il ya da bölge bazında bir araya getirilmesi ya da gelir düzeyinin, Geliri yok, 1000 YTL’den az, 1001-2000 YTL, 2001-3000 YTL, 3001 YTL ve yukarısı şeklinde gelir aralığı gruplarına ayrılması gruplamaya örnek olarak verilebilir. • Gruplama ile çok şıklı vasıfların şık sayısı azaltılarak kavranamayacak derecede uzun tablolar anlaşılır hale getirilir. • Ancak grupların fazla büyütülmesinde bazı sakıncalar ortaya çıkabilir. • Grupların homojen olmama tehlikesi bu sakıncalardan en önemlisidir. • Örneğin 0-9 yaş gurubu ölümler hakkındaki bir araştırma için homojen değildir. Çünkü yeni doğmuş çocukların ölüm oranı diğerlerinin, özellikle 5-9 yaş arasının ölüm oranından kat kat yüksektir.
Tanımlayıcı İstatistikler • Seriler Gözlem sonuçlarını zaman ve mekan vasıfları ile belirli bir vasfın şıklarına göre sıralanmış olarak gösteren sayı dizileridir. • Seriler sayılan özelliklerine göre “zaman serileri”, “mekan serileri”, “bölünme serileri” ve “bileşik seriler” olmak üzere dört başlık altında incelenebilirler. • Aylara göre üretim miktarları, yıllara göre enflasyon rakamları zaman serisine örnek olarak gösterilebilir. • Bölgelere göre üretim miktarı, illere göre ortalama gelir düzeyleri mekân serisine örnek olarak verilebilir. • Bir kitlenin belirli bir vasfın şıklarına göre sıralanmış şekline ise “bölünme serisi” ya da “frekans bölünmesi” denir. • “Bileşik serilerin” temel özelliği ise gözlem sonuçlarının iki ya da daha fazla vasfa göre bir arada gösterilmesidir.
Tanımlayıcı İstatistikler • Frekans ve Yüzde Frekans (f) belli bir kategoriye uyan (örnek: sigara içmeyen 32 kişi; 45 yaşının üstünde 20 kişi) ya da belli bir seçeneği tercih eden kişilerin sayısını göstermek için kullanılır. • Yüzde ise belli bir kategoriye ait frekansın toplam frekansa oranıdır. • Aritmetik Ortalama Aritmetik ortalama, birimlerin toplanması ve elde edilen sonucun toplam birim sayısına bölünmesi ile bulunur.
Tanımlayıcı İstatistikler • Medyan bir ölçeğin orta noktasıdır. • Medyanın üzerinde ve altında eşit miktarda değer bulunur. • %50 oranı medyanın diğer bir ifade şeklidir. • Özellikle grup üyelerinin büyük bir çoğunluğu benzer özellikler gösteriyor, bazıları ise çok farklı özellikler taşıyorsa kullanılabilecek en uygun teknik medyandır. • Mod bir dizideki diğer değerlerden daha yüksek frekansa sahip değerdir. • Standart Sapma Aritmetik ortalamayı kullandığınızda tüm değerleri hesaba katarsınız. • Eğer bir iki adet çok yüksek ya da düşük değer söz konusu ise, ortalama suni olarak düşüş ya da artış gösterebilir. • Bu gibi durumlarda medyan yardımcı olmakla birlikte, yine de sizi yanlış yönlendirebilir. • Standart sapma ortalama değere olan uzaklıklar üzerinden hesaplanan bir değerdir.