180 likes | 409 Views
Hipot ézisvizsgálat alapok ismétlés Nemparaméteres eljárások bevezető. Ps zichológiai statisztika II., 1. alkalom Balázs Katalin. Populáció, minta. Fontos tisztázni a megfigyelés egységét. A pszichológiában általában a személy, de lehet az iskola vagy család is. Populáció:
E N D
Hipotézisvizsgálat alapok ismétlésNemparaméteres eljárások bevezető Pszichológiai statisztika II., 1. alkalom Balázs Katalin
Populáció, minta Fontos tisztázni a megfigyelés egységét. A pszichológiában általában a személy, de lehet az iskola vagy család is. Populáció: A számunkra érdekes megfigyelési egységek összessége, melyekről állításokat akarunk megfogalmazni. Minta: A kísérleti vagy vizsgálati egységek összessége. A minta akkor ideális, ha reprezentatív a populációra nézve, ha kellően nagy és ha véletlen, független mintaválasztást alkalmazunk. A minta kiválasztása lehet random mintavétel vagy önkéntes jelentkezés. Csak random mintavétel esetében következtethetünk a populációra! Megkülönböztetünk kísérletet (kontrollált körülmények) és megfigyelést. Ok-okozati összefüggést csak kísérlet esetében lehet levonni, mert lehetnek olyan változók a megfigyelésben, amelyeket nem ismerünk, de a csoportba sorolást és az eredményt is befolyásolják. Megfigyelés is hasznos: -ok-okozati összefüggés feltárása nem mindig cél (kínai és európai reakciója nyugtatóra) -megalapozhat kísérletet (a szoba színe és a teljesítmény) -ritkán mégiscsak levonható ok-okozati összefüggés (gyermekrablás és PTSD)
Populáció, minta Csoportba sorolás Random (kísérlet) Nem random (megfigyelés) Random Populációra Mintavétel vonatkozó következtetések Random mintavétel hiánya Ok-okozati következtetés levonható
Standard normál eloszlás N(0,1)
Mintavétel-hipotézisvizsgálat A populáció: N(2,2), μ=2, σ=2 Számos mintavétel, a mintaátlagokat kiszámoljuk A mintaátlag a legritkább esetben egyezik a populációátlaggal, viszont jobb híján belőle következtetünk a pop. átlagra. Minél nagyobb a minta annál jobb a közelítés. Centrális határeloszlás elve: bármely eloszlásból kellően nagy elemszámú számos mintát véve a paraméterek eloszlása normális lesz. Ez teszi kiemelkedővé a normális eloszlást.
Standard normál eloszlás Z eloszlás, a görbe alatti terület adja egy-egy intervallum valószínűséget 95% 2.5% 2.5% -1.96 1.96
Standard normál eloszlás Megtartási tartomány Elutasítási tartomány Elutasítási tartomány -1.96 Kritikus érték 1.96 Kritikus érték
Következtetések Valóság H0 igaz H0 nem igaz Döntés H0-t megtartjuk H0-t elutasítjuk
Következtetések Valóság H0 igaz H0 nem igaz Döntés jogos H0-t elfogadás II. fajú hiba megtartjuk H0-t jogos elutasítjuk I. fajú hiba elutasítás
Paraméteres versus nemparaméteres eljárások Paraméteres eljárások: • feltételezik az adatok folytonosságát, normalitását, a szórások homogenitását • amennyiben ezen feltételek nem teljesülnek az eljárások torzítanak, a paraméterbecslések, standard hiba becslése sem megbízható • a hipotéziseket egy-egy paraméterre (átlag, szórás) fogalmazzuk meg Nemparaméteres eljárások: • robusztus eljárások: nem érzékenyek a folytonosság és normalitás hiányára • binomiális, nominális és ordinális változók esetében is jól használható statisztikákat kínálnak • használhatók intervallum és arány skálák esetében is (sokszor ez esetben ha nem használjuk ki a skálák tulajdonságait)
Binomiális eloszlás A binomiális eloszlású változónak két értéke van (a kódolás 1 és 0 leggyakrabban) Pl. beteg, nem beteg férfi, nő kezelt, nem kezelt Az elosztást egyértelműen meghatározza az egyik érték aránya, valószínűségének meghatározása. Valószínűség hipotetikus populáció vagy kísérlet esetén. Pl. pbeteg=0.33 pférf i=0.42 pkezelt=0.57 A változó átlagát a 1-essel kódolt alternatíva aránya adja. Jelölése: . Másik alternatíva: Pl. 1,1,0,1,0,1 A változó varianciája is egyenesen következik az átlagból. Miért? Pl.
Binomiális eloszlás • Tekintsünk olyan családokat, amelyekben 6 gyermek van, azaz N = 6, és a binomiális eloszlás alapján számoljuk ki annak valószínűségeit, hogy a családban 0, 1, 2, 3, 4, 5, 6 fiú van. Forrás:http://www.hik.hu/tankonyvtar/site/books/b163/ch04s01s01.html
Binomiális próba A binomiális próba segítségével tesztelhetjük, hogy az általunk vizsgált dichotóm változó, a minta alapján, az általunk feltételezett populációbeli eloszlást követheti-e. Próbastatisztikaként használhatjuk a binomiális eloszlást, ebben az esetben egy egzakt tesztről van szó, azaz pontosan azt adja meg, hogy mi a valószínűsége a kapott értéknek a konzervatív hipotézis igaz volta esetén. R-ben: binom.test(k,N,p=π) H0: A minta eloszlása megfelel a populációbeli feltételezett eloszlásnak H1: A minta eloszlása különbözik a populációban feltételezett eloszlástól
Binomiális próba Ha a mintanagyság kellően nagy, a binomiális helyett normális eloszlású közelítést alkalmazunk. Mi a kellően nagy? Pl.43 egyetemistából 31 azt mondja első gyermekének fiút szeretne, 12 lányt. H0: általában ugyanannyian akarnak fiút, mint lányt. ( )
Esélyek (odds) az arányok helyett Sokszor sokkal inkább célszerű az egyik alternatíva esélyét meghatározni a másikhoz képest a populáció eloszlásában az arány helyett az összes válasz tekintetében. Pl. 0.05 az arányok közötti eltérés ( ) 0.45 és 0.5 esetében ez sokkal kevésbé jelentős, mint 0.05 és 0.1 esetében. A mintában: Depressziós esetek a nyugtató szedésekor:0.742. Az esélye a depressziónak: 0.742/(1-0.742)=2.876 az 1-hez. Az esély egy szám 0 és plusz végtelen között. A 0.5-ös arány megegyezik az 1:1-hez eséllyel. Ha az igen esélye , a nemé és az igen aránya
Kontingencia táblázat A kontingencia táblázat az együttes gyakoriságokat foglalja össze. A sorok és az oszlopok különböző változók lehetséges értékeinek gyakoriságait foglalják össze. Az egyes cellák az együttes gyakoriságokat tartalmazzák. A kontingencia táblázat binomiális változók esetében 2x2-es (a sorösszegeket és az oszlopösszegeket nem számítva).
Esélyek arányai (Odds ratio) Az esélyek hányadai releváns alternatívát nyújtanak két minta összehasonlítására. Ha az esélyek a két populációban és , az odds ratio az Az esélyek hányada azt adja meg, hogy hányszor valószínűbb egy jelenség az egyik csoportban, mint a másikban. Pl. Azaz placebót szedve a 1.53-szor nagyobb az esélye a depressziónak, mint nyugtatót szedve. Miért jó? • A gyakorlatban ez sokkal stabilabb mutató, mint az arány. • Retrospektív tanulmányoknál csak ez használható
Prospektív versus retrospektív vizsgálat A függő és független változó az esetek nagy részében meghatározható. Ha a független változó két értékénél egy-egy mintát veszünk vagy random módon a két csoportba elosztjuk a mintánkat, a vizsgálat prospektív. Pl. Nyugtató és placebó. Ha azonban a függő változó két értékére nézve veszünk egy-egy mintát, a vizsgálat retrospektív. Ekkor számunkra releváns módon csak az odds ratiot lehet számolni. Pl. Dohányzás és tüdőrák. Az arányok vizsgálatánál fontos az, hogy honnan közelítünk (függő vagy független változó). Az esély bárhonnan nézve 2 az 1-hez.