630 likes | 793 Views
Általános lineáris modellek. GLM az SPSS programban 2011. Elmélet. A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek „okai” a független változók,
E N D
Általános lineáris modellek GLM az SPSS programban 2011.
Elmélet • A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. • A teljes heterogenitás egyik része az, amelynek „okai” a független változók, • a másik heterogenitás-rész pedig az, amelynek „okait” az egyéb, általunk nem vizsgált tényezők tartalmazzák. Ez utóbbit sokszor a véletlen hatásaként, hibaként is emlegetik.
Lineáris modell yij = + i + eij ahol: yij a függő változó értéke a kísérlet főátlaga, fix hatás i fix hatás, oka a független változó, faktor eij hiba, vagy eltérés
A variancia-analízis alkalmazásának feltételei • a maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) • a maradékok (hibák) normális eloszlású, nulla várható értékű sokaság • a maradékok szórásai a kezeléskombinációk celláin belül egyformák
Alapfogalmak 1. • Faktor: a vizsgálatba bevont független változókat, pl. különböző kezeléseket, tényezőket. • Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. • Kvalitatív és kvantitatív faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, ellenkező esetben kvantitatív faktorokról beszélünk. • Kezelések (cellák): Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből előálló kombinációk a kezelések. Pl. amikor a 2 faktor műtrágyaadagok és öntözési módok, akkor a kezelések a (műtrágyaadagok, öntözési módok) összes lehetséges kombinációjából áll.
Alapfogalmak 2. • Interakció: Két változó kapcsolatában akkor áll fenn interakció (kölcsönhatás), ha változó hatása függ az változó szintjétől és fordítva. • Egy szempontos variancia-analízis: Variancia-analízis, ahol csak egy faktor van. • Több szempontos variancia-analízis: Variancia-analízis, ahol kettő vagy több faktor van. • Egyváltozós variancia-analízis: ANOVA technika, amely egy függő változót használ. • Többváltozós variancia-analízis: ANOVA technika, amely kettő vagy több függő változót használ.
Jelölések • n: az adatok száma • k: csoportok száma • r: ismétlések száma • Csoport átlag:
Egytényezős variancia-analízis • Segítségével egy tényező hatását lehet vizsgálni a függő változó mennyiségi alakulására. A tényező, faktor valamilyen csoportképző ismérvvel rendelkezik, a függő változó pedig legtöbbször skála típusú adat.
H0 • A nullhipotézis, hogy az átlagok egyenlők, nincs közöttük különbség. Ez a technika a kétmintás t-teszt általánosítása, kiterjesztése több mintára.
Variancia-analízis lépései • A variancia-analízis modell felállítása. • Szignifikancia-szint megválasztása • A variancia-analízis kiszámítása, az F-próba. • A modell érvényességének ellenőrzése. • Amennyiben az F-próba szignifikáns, középértékek többszörös összehasonlítása.
A modell felállítása • A modellben a mérési, megfigyelési értékeket összegként képzeljük el. • Kísérleti elrendezésnek megfelelő modellalkotás
Lineáris modell yij = + i + eij ahol: yij a függő változó értéke a kísérlet főátlaga, fix hatás i fix hatás, oka a független változó, faktor eij hiba, vagy eltérés
Példa • Egy termesztő k kukoricafajta termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a 4 fajta termesztése esetén azonos terméseredményre számíthatunk-e.
Eltérés négyzetösszegek (SS) • Összes: alapadatok eltérés négyzetösszege • Csoportok között: csoportátlagok eltérés négyzetösszege * r • Csoporton belül: csoportok eltérés négyzetösszegeinek összege
Szabadságfokok (df) • Csoportok között: k-1 • Csoporton belül: n-k • Összes: n-1
Varianciák • Az eltérés négyzetösszegek osztva a szabadságfokokkal. • SScsk/3 • SScsb/8 • SSössz/11
Mi annak a valószínűsége? • Véletlenül 16,38 F-értéknél nagyobbat kapunk egy 3, 8 szabadságfokú F-eloszlás esetén. • P=0,00089
Mikor szignifikáns az F-próba? • Ha létezik legalább egy szignifikáns kontraszt a csoportok között.
A modell érvényességének ellenőrzése • Függetlenség • Normális eloszlás • Azonos varianciák
A maradék független a kezelés és blokk hatástól • valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) • Vizsgálat: • Maradékok leíró statisztikája kezelések szerint • a maradékok ábrázolása a megfigyelt és becsült értékek függvényében
Maradékok és a megfigyelt értékek közötti függetlenség
Maradékok és a becsült értéket közötti függetlenség
Maradék normális eloszlású, nulla várható értékű • Grafikus normalitás vizsgálat • Hisztogram • Q-Q plot • Numerikus normalitás vizsgálat • Kolmogorov-Smirnov • Shapiro-Wilk
Mintán belüli szórás azonosság tesztelése • Levene-teszt • H0 a szórások megegyeznek
Amennyiben a Levene-teszt szignifikáns • Robusztus tesztek alkalmazása • Welch-tesz • Brown-Forsythe
Post hoc analízisek Középérték összehasonlító tesztek
Az F-próba szignifikáns • Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. • A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: • előzetes, un. a priori kontrasztok és • az analízis után elvégezhető, un. post hoc analízisek
Post hoc analízisek • A csoportok szórása megegyezik • LSD • Tukey • Bonferroni • Scheffe • Dunett • Student-Newman-Keuls • Duncan • A csoportok szórása különbözik • Tamhane
LSD-teszt (legkisebb szignifikáns differencia) • Alkalmazhatóság feltételei: • A csoportok szórása egyenlő • Véletlenszerűen kiválasztott két csoport összehasonlítására jó
Tukey-teszt • Studentizált terjedelmen alapuló teszt, a p-elemű részcsoportokat ugyanazzal a kritikus értékkel hasonlítja össze. Itt a teljes vizsgálat elsőfajú hibája rögzített, és az egyes összehasonlítások elsőfajú hibája n növekedésével csökken, s így a másodfajú hiba nő.
Bonferroni-teszt • Páronkénti átlagok különbségének vizsgálatára használható, a két csoport elemszáma lehet különböző is. Lényege, hogy az -hibához tartozó t-értéket korrigálja a független összehasonlítások számának megfelelően.
Scheffe-teszt • A hagyományos tesztek közé tartozik. Ez már valóban a Hg hipotéziseket vizsgálja. Az egyszerű F-próba akkor utasítja el a H0-hipotézist, ha létezik egy a<>0 vektor, amelynél a konfidencia-intervallum nem tartalmazza a 0-t. Ha k darab összehasonlítandó csoport van, akkor k(k-1)/2 összehasonlítást kell végezni. A statisztikája:
Dunnett-teszt • A Dunnett-teszt (1955) egy kijelölt csoportot (kontroll) hasonlít össze a többivel. Eredetileg egyenlő elemszámokra volt érvényes, de később elkészült az általánosítása egyenlőtlen elemszámokra is. Lényegét tekintve páronkénti összehasonlítást végez szimultán, de meg kell adni egy kezdő, kontroll csoportot, és ehhez hasonlítja a többi csoport átlagát. Statisztikája: =kontroll csoport