1 / 42

Temel Istatistik Terimleri ve Dagilimlar

Temel Tanimlar. Her bilim kolunda oldugu gibi istatistik de kendine ait terimler

Ava
Download Presentation

Temel Istatistik Terimleri ve Dagilimlar

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Temel Istatistik Terimleri ve Dagilimlar

    3. Temel tanimlar Yigini tanimlayan bir nicelikle rneklemi tanimlayan bir nicelik birbirinden farklidir. Istatistik: Yigini temsil ettigi dsnlen verileri kullanarak hesaplanmis nicelikler Parametre: Yiginla zdeslestirilen idealize edilmis nicelik. Parametreler direkt olarak llemezler ve bu nedenle istatistikle tahmin edilirler. Parametreler Yunan harfleriyle istatistikler ise Roma harfleriyle gsterilir.

    4. Yigin ve rneklem

    5. Yigin ve rneklem

    6. Yigin ve rneklem

    7. Ortalama ve Standard Sapma Verilen degerlerin ortalamasi en az bir daha fazla anlamli basamakla gsterilmelidir. Standard sapma ise en az anlamli basamaga kadar hesaplanmalidir. rnek: NO3 lmleri = 6.9, 7.8, 7.9,7.1 Ortalama = 7.42 mg/l s = 0.499

    8. Hassasiyet, Yanlilik ve Dogruluk

    9. Yanlilik Yanlilik = y-m Yigin ortalamasinin (m) 8 mg/l oldugunu biliyorsak, yanlilik lm sonularinin ortalamasi (y) ile 8 mg/l arasindaki farktir. Yanlilik sistematik hataya isaret eder. Eger kaynagi tespit edilirse ortadan kaldirilabilir. Soru: Daha fazla sayida lm yapmak yanliligi ortadan kaldirir mi?

    10. Hassasiyet Hassasiyet: Tekrar edilen lmler arasindaki farklara gre belirlenir. lmler arasi farklardan kaynaklanan bu sailmalar deneydeki rasgele (deneysel) hatalar ile ilgilidir. Eger hassas bir lm sz konusuysa bu hatalar kktr. Hata byklg daha fazla sayida lm yapip ortalamasi alinarak saglanabilir. Soru: Deneysel hatalar tamamen ortadan kaldirilabilir mi?

    11. Deneysel Hatalar (grlt) Gerek deger m ve llen deger yi ise Yi = m + ei ei: hata payi, gzlemlerdeki dalgalanma ya da bir deneyden digerine degisen fark. Bir yanlislik, yanlilik, bir gaf degil, istatistiksel lmenin kainilamaz bir sonucudur. Aletin durumu Kullananin becerisi Numune alma sirasindaki hatalar Ortam sartlarindaki farkliliklar

    12. Normallik,Rastsallik ve Bagimsizlik

    13. Rastsallik Rastsal, bir yigina ait gzlemlerden rasgele birinin ekilmesi durumunda, yigindaki her bir elementin esit ekilme sansi olmasi demektir. Rastsallik terimi aksi sylenmedigi takdirde, genellikle yanlilik veya bir korelasyonun olmadigi anlamina gelir.

    14. rnek

    15. rnek,Devam

    16. rnek Ancak rastsalligin kontrolnde deneye etki eden tm faktrler gz nne alinmalidir. rnegin nitrat rneklerinde deneyi yapan kisilere gre veri izildiginde sekildeki gibi bir durum iktiginda verilerin rastsalligindan sz edemeyiz.

    17. Bagimsizlik Bir dizi gzlemden bilinmeyen nedenlerden deneysel hatalarin bir sre etkin olarak kaldigini varsayalim. yle ki birinci gzlem y1 yksekse ikinci gzlem y2 de yksek oluyor. Bu durumda y1 ve y2 istatistiksel olarak bagimsiz degildir. Bir veri setinin bagimsiz olmamasi hesaplanan varyans degerini ciddi sekilde bozar ve normal ya da t dagilimina bagli olarak yapilan ikarimlar hatali olabilir.

    18. Bagimsizlik, rnek Verilen nitrat verilerinin bagimsiz olup olmadigi hakkinda ne diyebilirsiniz?

    19. Bagimsizlik evresel veriler sz konusu oldugunda, aritma tesisi giris ikis konsantrasyonlari , irmaktaki su kalitesi degerleri, bunlarin bir nceki lm degerinden etkilenmemesi mmkn degildir. ikis kalitesi ok kt ise bu bir sre devam edecektir. O nedenle bu tip verileri degerlendirirken otomatik olarak bagimsizdir varsayimini yapamayiz. Veri setinde bagimsizliktan sz edilemiyorsa, bu durumda zel yntemler kullanilmalidir.

    21. Standartlastirilmis Normal Dagilim

    22. rnek

    23. t dagilimi (Students t) Herhangi bir normal degiskeni standartlastirmak iin m ve syi bilmemiz gerekir. z = (y-m)/s s = s t = (y-n)/s

    24. t dagilimi Eger rneklem byklg sonsuz ise (N ? ?) t dagilimi normal dagilima esittir. Eger rneklem byklg kk ise kuyruklar daha yayilmis hale gelir ve t degerleri kullanilir. t tablosunu kullanirken serbestlik derecesi(sd) gerekir. Sd (Tabloda df, degree of freedom = N-1)

    26. rnek 20 birimli bir rneklem iin verinin %5nin byk olacagi t degeri katir? Normal dagilimda karsilik gelen z degeri katir? t = 1.724 (Tablodan). Excelde =tters (2*olasilik;Serbestlik derecesi) = tters(0.1;19) z = tablodan = 1.64 Excelde =normsters (1-olasilik) = normsters(0.95)

    27. Ortalama ve Varyansin Dagilimi Tm istatistikler rastsal degiskenlerdir ve ortalama ve bir varyansi olan bir olasilik dagilimi ile tanimlanabilirler. Ortalamanin rnekleme dagilimini incelemek iin n birimli rastsal rneklemleri aldigimizi varsayalim ve her birinin ortalamasini hesaplayalim. Bir ok farkli ortalama y degeri elde ederiz ve olasilik dagilimi seklinde y dagilimini izebiliriz. Bu ortalamanin rneklem dagilimini verir. Eger gzlemlerin (y) ortalama civarindaki sapmalari rastsal ve bagimsizsa o zaman ynin dagilimini ortalamasi m ve varyans s2/n olacaktir.(s2/n ortalamanin varyansi. )

    28. Ortalamanin Varyansi

    29. rnek 27 adet nitrat numune lmnn ortalamasi 7.51 mg/l. s = 1.383. Ortalamanin standart hatasi katir? sy = s/ vn=0.266 mg/l

    30. Karsilastirmalar Eger yigin varyansi bilinmiyorsa, ki ogunlukla byledir, normal dagilimi karsilastiracagimiz referans dagilim olarak kullanamayiz. Bunun yerine sy yerine syyi yerlestirip t dagilimini kullaniriz. rnek: Nitrat verisi (n=27) iin y= 7.51 mg/l m = 8 mg/l. Eger gerek ortalama 8 mg/l ise 7.51 gibi dsk bir lm ortalamasi ikma olasiligi nedir?

    31. rnek, devam

    32. rnek t referans dagilimi bir olayin sirf sans eseri olma olasiligini verir. Dagilimin kuyruk blgesine dsen bir olay siradisi olarak dsnlebilir. Eger olay siradisi bulunmuyorsa buna istatistiksel olarak anlamli denir.

    33. Anlamlilik Testleri ve Gvenlik Araligi Istatistiksel tmevarim: Bilinmeyen yigin parametreleri hakkinda deneysel veriye dayanarak degerlendirme yapmak Diyelim ki gerek yigin ortalamasinin degerini bilmiyoruz. Eger nitrat numunesi lmlerinin ortalamasini 7.51 bulduysak, yiginin gerek ortalamasinin 8.00 mg/l olma olasiligi nedir? Bu degerlendirme iin anlamlilik testleri ve gvenlik araligi kullanilan en yaygin iki metottur.

    34. Anlamlilik Testleri 1. Hipotez testi seklinde olur: Hipotez testi iin bir sifir hipotezi, bir alternatif hipotez ve bir de testin sonucunun belirlenecegi anlamlilik dzeyi degeri (a) ya ihtiya vardir. Test edilecek hipotez: Ho : m = 8 mg/l Ho sifir hipotezi veya geersizlik hipotezi diye adlandirilir. Ha :m<8 veya m>8 (tek ynl) veya Ha: m?8 (ift ynl) H: alternatif hipotez Anlamlilik dzeyi: 0.05 (sifir hipotezinin yanlislikla reddedilme riski)

    35. 1. Hipotez Testleri, rnek Nitrat lm sonulari iin ortalamanin 8.0 mg/l oldugunu a =0.05 dzeyinde test edin. zm: Ho=m=8 mg/l Ha=m<8 mg/l (tek ynl test) a=0.05 Hesaplanan t, a=0.05 yani %5 olma olasiligi olan t istatistiginden kkse, Sifir hipotezi reddedilecektir. Serbestlik derecesi 26 iin bu kritik t degeri tablodan bulunur. tk=t(26,0.05)=-1.706 t<tk .

    36. Hipotez Testleri, rnek t<tk . -1.842<-1.706. Bu durumda alternatif hipotez lehine sifir hipotezi reddedilir. Yani ortalamasinin 7.51 bulundugu nitrat lmlerinin ait oldugu yiginin ortalamasinin %5 riskle, 8 olmadigini syleyebiliriz.

    37. ift Ynl Test Ho : m = 8 mg/l Ha : m ? 8 mg/l (ift ynl test) a=0.05. Bu durumda t referans dagiliminin hem negatif hem de pozitif kuyruk alanlari dikkate alinir. Simetriden dolayi bu kuyruk alanlari birbirine esittir. 0.05/2 = 0.025. Serbestlik derecesi 26 iin kritik t degeri tablodan bulunur. tk=t(26,0.025)=2.056 (excelde =tters(0.05;26)) t = 1.842 t>tk (-1.842>-2.056). Sifir hipotezini reddetmek iin yeterli kanit yok.

    38. Tek Ynl ift Ynl

    39. Hangi Test? Genel olarak bir yaniti yok. Problemin ierigi hangi testin kullanilmasi gerektigini belirler. rnegin eger pozitif sapma bir sorun ama negatif sapma sorun degilse tek ynl test kullanilir. rnegin yksek degerler kanuna uygunlugu ihlal etmek demek oldugu bir durumda uygunlugunu degerlendirmek ya da verimliligi artirilmasi bir bir A maddesi eklediginizdeki durumu degerlendirmek iin tek ynl test diger taraftan rnegin A maddesinin verimliligi degistirip degistirmedigine bakmak isterseniz ift ynl testi kullanabilirsiniz.

    40. 2. Gvenlik Araligi Genellikle parametre degerinin hangi degerler arasinda kalacagini belirtmek daha bilgilendiricidir. a = 0.05 ise, yukaridaki ifade bize gerek degerin %95 ihtimalle gvenilirlik araligi iinde oldugunu gsterir.

    41. rnek Nitrat lmleri iin %95lik gvenlik araligini hesaplayin.

    42. zet Yigin: m,s,s2 rneklem, y,s Yiginin parametreleri rneklemden elde edilen istatistikler yardimiyla hesaplanir. Istatistikler rastsal degiskenlerdir ve ortalamasi ve varyansi olan bir olasilik dagilimina sahiptirler. Tm deneyler lm hatasina sahiptirler. Dogruluk hem yanliligin hem de hassasligin bir fonksiyonudur. Bilimsel arastirmalarda istatistigin grevi hatayi nicelendirmek ve karar vermek zere veri kullanildiginda hatayi gz nne almaktir.

    43. zet Eger normal ana dagilimin ortalamasi m, varyansi s2 ise rneklem ortalamasi y, ortalamasi m ve varyansi s2 /n olan normal bir dagilima sahiptir. s2 bilinmiyorsa s2 ile tahmin edilir ve t dagilimi kullanilir. Hipotez testleri istatistiksel tmevarim iin kullanilan bir yntem olmakla birlikte basit bir karsilastirmayi bile gereksiz yere karmasiklastirirlar. Gvenilirlik araligi istatistiksel olarak hipotez testlerinin karsiligi olup daha basit ve anlasilirdir. Yigin parametresinin dsmesi gereken araligi verir.

More Related