570 likes | 951 Views
İstatistikte Bazı Temel Kavramlar. Kaynaklar. Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme İstatistik Yöntemler ve Uygulaması, H.Arıcı. Evren Gözlem alanına giren obje ya da bireylerin tümü Örneklem Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup.
E N D
İstatistikte Bazı Temel Kavramlar Kaynaklar • Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme • İstatistik Yöntemler ve Uygulaması, H.Arıcı • Evren • Gözlem alanına giren obje ya da bireylerin tümü • Örneklem • Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup
Değişken • Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denir • Değişkenler nicel ya da nitel olabilir. • Nitel veriler • Sayısal veriler • -kesikli sayısal veriler (maç kazanma sayısı) • -sürekli sayısal veriler (boy, kilo) • Nitelik ve sayısal veriler arasındaki ilişki (boy sınıflandırması)
Ölçme • objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir. • Değişkenler hakkında bilgi edinmek için yapılır • Ölçüm • Ölçme sonucunda elde edilen değer
0 1 2 3 4 5 6 X=2.8 X=5.0 • Anlamlı rakam 5 cm = 5,0cm
Sayıları yuvarlama 5,387123 = 5,39 = 5,4 = 5 İstatistikte Bazı Temel kavramlar • Aritmetik Ortalama • Aralık (range) • Sapma • Standart sapma • Ölçümlerin dağılımı ve standart sapma ile ilişkisi
Değişken Range X= değerlerin toplamı/değer sayısı Aritmetik ortalama d2 d1 Sapma
Standart sapma: • Bir dizi ölçümün gösterdiği değişimin en güvenilir ölçüsüdür. • Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür. • Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır
Standart sapma: • Standart sapma /bütün elemanların ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir. [ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi) ve yukarıdaki ifadenin karekökü.. ortalama değer
Ortanca (medyan) • 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2 • Çift ise n/2 nci ile n+2/2 nci değeri /2 dir. • Veriler büyükten küçüğe doğru sıralanır ortadaki iki değerin aritmetik ortalaması alınır • 5,5,6,6,7,9,9, 7+1/2 • 5,5,6,6,7,9,9,10 8/2=4, 8+2/4=5 • 6+7=13/2=6,5
Tepe değer (mod) • Dağılımda en fazla tekrarlanan değerdir. • Frekansı en fazla olan sınıfın değeridir. • 5,5,6,6,6,7,9,9,10
Ölçme Sonucunun Gösterilmesi X = 5,8 ± 0,25 Yanlış Gösterim X = 58 ± 0,2 X = 58.3 ± 2 X = 58.3 ± 0.2 Doğru Gösterim
İstatistiksel Verileri Tasnif Etme • İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu: • Sözel ifadelerle açıklama • Tablolar halinde düzenleme • Grafikle gösterme • Verileri değerlendirerek istatistiksel ölçüler bulma • Bu yöntemlerde birkaçını birlikte uygulama
Verilerin grafikle gösterilmesi • Çizgi grafiği • Çubuk grafik (Histogram) • Pasta grafiği 12 10 Frekans 8 6 4 2 30 40 40 50 60 70 80 90 Puan
8 7 Frekans 6 5 4 3 30 40 40 50 60 70 80 90 Puan
İstatistiksel Verileri Tasnif Etme Pasta grafiği Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır
Doğru Grafik Seçme AB Ülkelerinde Genel Lise Meslek Lisesi Oranları İkisi de olabilir. Birincisi daha uygun
Doğru Yanlış Doğru Grafik Seçme Ülkelere Göre Eğitim Yaşı
Doğru Yanlış Doğru Grafik Seçme Yıllara göre okul yaşı
NORMAL DAĞILIM NEDIR • İstatistikanalizyapılırken, dağılımınözelliğiçokönemlidir. • Çünküfarklıdağılımgösterenverilereuygulanacaktanımlayıcıveanalitikistatistikyöntemleri de farklıdır. • Parametriktestlerinuygulanabilmesiiçin, dağılımın normal ya da normaleyakınolmasıgerekir.
Normal dağılım, • Standartsapması • Frekanseğrisiçanşeklindeolansimetrikdağılımdır. • Normal dağılımsimetrikolduğuiçin, normal dağılımgösterendeğişkenlerinortalama, ortancavemodlarıeşittir
Dağılımşekliölçütleri : Çarpıklık –1 ve +1 arasındayeralır. • Deneklerortalamadandahabüyükdeğerlerdetoplanıyorsa, negatifbasıkya da soldanbasık, • Küçükdeğerlerdetoplanıyorsapozitifbasıkya da sağdanbasıkdağılımdansözedilir.
Dağılım özelliğinin önemi nedir • Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. • Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir
NORMAL DAĞILIMIN KRİTERLERİ • Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. • Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir. • Amabuizleniministatistikyöntemlerle de test edilmesigerekir. Shapiro-Wilks (n<30) veLilliefors (n>30) kolmagorwsimirnov. Yada shefitestleribuamaçlasıklıklakullanılantestlerdir. Bu testlerde p değeri <0.05 isedağılımın normal olmadığısonucunavarılır.
Verilerin normal dağılmadığıdurumlardaikiişlemyapılabilir : • 1. Verileredönüşümuygulayarak, onların normal dağılımauymalarınısağlamak. • 2. Varolanverilereparametrikolmayanbir test uygulamak
KESTİRİM • Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır • Güvenaralığıvegüvensınırları : Belirlibirolasılıkla, bilinmeyenevrendeğeriniiçerendeğerleraralığıdır. • Sıklıkla %95, bazen de %90 ve %99 güvensınırlarıkullanılmaktadır.
Hipotez testleri : • Farklılıkolmadığınınvarsayıldığıhipoteze, yoklukhipotezi, farksızlıkhipotezi, sıfırhipotezi, başlangıçhipoteziadıverilirveHoilegösterilir. • H1ilegösterilenalternatifhipotezadıverilenhipotezise, Hohipotezinin tam tersidir.
P değeri ve yanılma düzeyi : • Hohipotezininreddedilmesiiçinhesaplananolasılığın %5 ya da dahaazolmasıgenelliklekabuledilensınırdır; yaniHohipotezinindoğruluğuiçinhesaplananolasılık %5 ya da dahaküçükse, buhipotezinkabuledilemeyeceğiyargısınavarılır
Parametrikvenonparametriktestler : Istatistikselanalizyapılmadanönce, verilerinkategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olupolmadığınabakılmalıdır. • Kategorikverilerdeparametrikolmayanisatistiklerkullanılırken, sürekliverilerdeiseparametrikistatistiklerkullanılır
Bağımlı gurup- bağımsız gurup kavramı • Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur • Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.
BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI • İki ortalama arasındaki farkın anlamlılık testi • T. Testi • Gerekli koşullar • 1.Karşılaştırılacak iki gurup vardır • 2. Guruplar birbirinden bağımsızdır • 3. Veriler sürekli veri gurubundadır • 4: evren dağılımları normal dağılım gösterir • 5. Evren varyansları eşitti.
Mann-Witney U testi • İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır. • Parametrik koşulları sağlanmadığı durumda kullanılır
Bağımsız ikiden çok gurubun karşılaştırılması • Tek yönlü varyans analizi • İkiden çok bağımsız gurup olduğunda ve parametrik koşullar sağlandığında uygulanır. • Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.
Varyans analizinde farkın kaynaklandığı gurubu belirleme • Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede • 1. duncan yöntemi • Tukey HSD yöntemi • Dunnet yöntemi • Studentnevman-Keuls Yöntemi kullanılır
Korelasyon • Korelasyon: iki değişken arasında bağıntı olup olmadığını araştırma • Korelasyon katsayısı – r - • Regrasyon analizi: bağıntının türünü bulma
Korelasyon Fizik Notları Matematik Notları
Korelasyon kararı için bir-kaç veri yeter mi? Ortalama ömür Ülke nüfusu
Resim Notları Matematik Notları Korelasyon var mı?
Korelasyon var mı? Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.
Grafik Analizi • Basit korelasyon işlemlerinde kullanılır. • Grafik çizimi işlem sırası: • Eksenlerin belirlenmesi • Uygun ölçek seçimi • Verilerin yerleştirilmesi • Lineer grafik elde edilmesi • Eğim bulunması
Eksenlerin belirlenmesi Bağlı değişken(birim) Serbest değişken (birim)
Ölçek Seçimi Kütle Hacim Her iki ölçek uygun değil
Ölçek Seçimi Kütle Hacim Y ölçeği uygun değil
Kütle Hacim Ölçek Seçimi X ölçeği uygun değil