240 likes | 521 Views
ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA). CURS 5. ANALIZA DISPERSIONALĂ (ANOVA).
E N D
ANALIZA DISPERSIONALĂ (ANOVA) • Metoda analizei dispersionale (ANOVA) (“analiză de varianţă”), este utilizată pentru a verifica gradul în care valorile reale, empirice ale unei caracteristici se abat de la valorile teoretice, determinate în general cu ajutorul mediilor sau al ecuaţiilor de regresie. • Ea studiază efectul variabilei/variabilelor independente asupra celei dependente, altfel spus, măsura în care variaţia caracteristicii rezultative este dependentă sau nu de factorul (factorii) de grupare. • are la bază metoda grupării, prin ea separându-se influenţa factorilor esenţiali (determinanţi) de influenţa factorilor consideraţi întâmplători (aleatori) asupra caracteristicii “efect”. • în funcţie de numărul factorilor înregistraţi ce-şi exercită influenţa asupra caracteristicii rezultative (unul, doi sau mai mulţi), analiza dispersională se poate efectua după un model unifactorial, bifactorial sau multifactorial.
ANALIZA DISPERSIONALĂ (ANOVA) • Pentru fiecare variantă/interval de variaţie a caracteristicii cauzale X, se înregistrează o distribuţie de valori ale variabilei efect Y, distribuţie pe care o putem caracteriza, de regulă, prin nivelul mediu. • Dacă aceste medii ale variabilei Y, pe grupe după X sunt egale sau foarte puţin diferite, atunci se concluzionează că variabila independentă X nu influenţează variaţia variabilei dependente Y (vezi a) • Cu cât mediile lui Y pe grupe după X diferă mai mult unele de altele, cu atât X influenţează mai mult pe Y.
Analiza dispersională unifactorială a) medii de grupă egale; b) mediile de grupă inegale
Analiza dispersională unifactorială • Ipoteza nulă susţine egalitatea între mediile grupelor din colectivitatea generală, alcătuite după variabila X: • Ipoteza alternativă susţine că cel puţin două medii ale grupelor nu sunt egale: • Se testează, deci, dacă diferentele intre mediile de grupă nu sunt prea mari pentru a fi puse doar pe seama întâmplării (a factorilor aleatori), iar dacă există cel puţin două medii semnificativ diferite, înseamnă că factorul de grupare X are o influenţă semnificativă asupra variabilei Y. • Mediile grupelor din colectivitatea generală sunt aproximate prin mediile grupelor din eşantion ( , ),
Analiza dispersională unifactorială • Medii condiţionate (medii parţiale): • Media generală a eşantionului:
Analiza dispersională unifactorială • Varianţa dintre grupe (varianţă factorială, sistematică) arată influenţa factorului cauzal asupra variaţiei lui Y: • Varianţa din interiorul grupelor (varianţă reziduală) exprimă influenţa factorilor aleatori asupra lui Y: • Varianţa totală reflectă influenţa tuturor factorilor (sistematici – X şi reziduali) asupra lui Y:
Analiza dispersională unifactorială • Pentru a asigura comparabilitatea varianţelor, ele sunt raportate la numărul gradelor de libertate, obţinându-se dispersii corectate: • Dispersia corectată factorială (sistematică): • Dispersia corectată reziduală:
Analiza dispersională unifactorială • Testul F (Fisher) este raportul între dispersia corectată sistematică şi cea reziduală: • Presupuneri pentru aplicarea testului F: • cele “r” grupe din eşantion sunt extrase aleator din cele “r” grupe ale colectivităţii totale; • Fiecare grupă din colectivitatea generală are o distribuţie normală, iar abaterile medii pătratice ale acestora sunt egale:
Analiza dispersională unifactorială • Valoarea calculată a testului F se compară cu valoarea critică, corespunzătoare nivelului de semnificaţie α şi gradelor de libertate (r-1) şi (n-r): F α; r-1; n-r. • Regula de decizie este: • Dacă Fcalc≤ F α; r-1; n-r, atunci se acceptă H0, deci mediile de grupă nu diferă semnificativ unele de altele, iar eventualele diferenţe ce pot apare pot fi puse pe seama întâmplării. În acest caz, variabila Y este independentă de factorul de grupare X şi analiza dispersională este punctul final al analizei. • Dacă Fcalc> F α; r-1; n-r, atunci se acceptă H1, deci între mediile de grupă există o diferenţă semnificativă, care nu poate fi pusă pe seama acţiunii factorilor aleatori. În acest caz, variabila Y depinde semnificativ de factorul de grupare X şi trebuie aplicate în continuare metodele de analiză a legăturilor dintre variabile.
Analiza dispersională unifactorială • Aplicaţie: • Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest produs are câteva avantaje faţă de vechiul produs, printre care: • Este mai practic (uşor) de utilizat; • Are o calitate cel puţin la fel de bună ca şi a vechiului produs; • Preţul noului produs este semnificativ mai mic decât al vechiului produs. • Pentru a decide care este cea mai bună strategie de marketing, directorul acestui departament a dispus realizarea unui studiu în 3 oraşe: • În oraşul A, campania de publicitate s-a axat pe uşurinţa folosirii noului produs; • În oraşul B, campania de publicitate s-a axat pe calitatea net superioară a noului produs; • În oraşul C, campania de publicitate s-a axat pe preţul inferior al noului produs. • În toate cele 3 oraşe, s-au înregistrat vânzările săptămânale, în mai multe săptămâni consecutive. • Directorul de marketing ar dori să ştie dacă există diferenţe semnificative între vânzările medii săptămânale din cele 3 oraşe (nivel de semnif. 5%)
Analiza dispersională unifactorială • Aplicaţie:
Analiza dispersională unifactorială • Volumul mediu al vânzărilor pe fiecare strategie: • Volumul mediu al vânzărilor pe total: • Varianţele:
Analiza dispersională unifactorială • Dispersiile corectate: • Statistica F: • Cum rezultă că se respinge H0, se acceptă H1, deci cel puţin două medii diferă semnificativ. Aşadar, pentru o probabilitate de 95%, se poate afirma că tactica de marketing aleasă pentru promovare produsului a influenţat vânzările.
Aplicaţie. Prelucrare în EXCEL Nivel minim de semnificaţie→prob. maximă cu care garantăm că H1 adev. Varianţă sistematică Varianţă reziduală Grade de libertate Dispersie corec- tată sistematică Varianţă totală Val. calc. a test F Val. critică a test F Dispersie corec- tată reziduală
Analiza dispersională unifactorială • Formulele devin:
Modelul de analiză dispersională bifactorială • se identifică doi factori de influenţă, iar variabilitatea caracteristicii rezultative poate să fie pusă: • pe seama influenţei primului factor; • pe seama influenţei celui de-al doilea factor; • pe seama interacţiunii celor doi factori; • pe seama întâmplării (factorului rezidual).
Concluzii • modelele de analiză dispersională nu explică relaţia dintre variabile • verifică doar măsura în care valorile reale ale unei caracteristici se abat de la valorile teoretice, precum şi măsura în care aceste variaţii sunt sau nu dependente de factorul/factorii de grupare. • metoda analizei dispersionale poate fi utilizată atât înaintea, cât şi după aplicarea metodelor corelaţiei şi regresiei statistice. • Testul F se poate utiliza şi pentru testarea validităţii modelului de regresie. • în general, în analiza dispersională, nivelurile x1, x2, ..., xr sunt niveluri ale unei variabile categoriale (numite şi tratamente), dar, cum ceea ce este valabil pentru o scală inferioară (nominală) este valabil şi pentru orice altă scală superioară (ordinală, de intervale, de rapoarte), analiza se poate extinde.