270 likes | 579 Views
ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA). Curs 3. ANALIZA DISPERSIONALĂ (ANOVA).
E N D
ANALIZA DISPERSIONALĂ (ANOVA) • Metoda analizei dispersionale (ANOVA) (“analiză de varianţă”), este utilizată pentru a verifica gradul în care valorile reale, empirice ale unei caracteristici se abat de la valorile teoretice, determinate în general cu ajutorul mediilor sau al ecuaţiilor de regresie. • Ea studiază efectul variabilei/variabilelor independente asupra celei dependente, altfel spus, măsura în care variaţia caracteristicii rezultative este dependentă sau nu de factorul (factorii) de grupare. • are la bază metoda grupării, prin ea separându-se influenţa factorilor esenţiali (determinanţi) de influenţa factorilor consideraţi întâmplători (aleatori) asupra caracteristicii “efect”. • în funcţie de numărul factorilor înregistraţi ce-şi exercită influenţa asupra caracteristicii rezultative (unul, doi sau mai mulţi), analiza dispersională se poate efectua după un model unifactorial, bifactorial sau multifactorial.
Analiza dispersională unifactorială a) medii de grupă egale; b) mediile de grupă inegale
Analiza dispersională unifactorială • Ipoteza nulă susţine egalitatea între mediile grupelor din colectivitatea generală: • Ipoteza alternativă susţine că cel puţin două medii ale grupelor nu sunt egale: • Se testează, deci, dacă diferentele intre mediile de grupă nu sunt prea mari pentru a fi puse doar pe seama întâmplării (a factorilor aleatori), iar dacă există cel puţin două medii semnificativ diferite, înseamnă că factorul de grupare are o influenţă semnificativă asupra variabilei Y. • Mediile grupelor din colectivitatea generală sunt aproximate prin mediile grupelor din eşantion ( , ),
Analiza dispersională unifactorială • Media generală a eşantionului:
Analiza dispersională unifactorială • Pentru a asigura comparabilitatea varianţelor, ele sunt raportate la numărul gradelor de libertate, obţinându-se dispersii corectate: • Dispersia corectată factorială (sistematică): • Dispersia corectată reziduală:
Analiza dispersională unifactorială • Testul F (Fisher) este raportul între dispersia corectată sistematică şi cea reziduală: • Presupuneri pentru aplicarea testului F: • cele “r” grupe din eşantion sunt extrase aleator din cele “r” grupe ale colectivităţii totale; • Fiecare grupă din colectivitatea generală are o distribuţie normală, iar abaterile medii pătratice ale acestora sunt egale:
Analiza dispersională unifactorială • Valoarea calculată a testului F se compară cu valoarea critică, corespunzătoare nivelului de semnificaţie α şi gradelor de libertate (r-1) şi (n-r): F α; r-1; n-r. • Regula de decizie este: • Dacă Fcalc≤ F α; r-1; n-r, atunci se acceptă H0, deci mediile de grupă nu diferă semnificativ unele de altele, iar eventualele diferenţe ce pot apare pot fi puse pe seama întâmplării. În acest caz, variabila Y este independentă de factorul de grupare şi analiza dispersională este punctul final al analizei. • Dacă Fcalc> F α; r-1; n-r, atunci se acceptă H1, deci între mediile de grupă există o diferenţă semnificativă, care nu poate fi pusă pe seama acţiunii factorilor aleatori. În acest caz, variabila Y depinde semnificativ de factorul de grupare şi trebuie aplicate în continuare metodele de analiză a legăturilor dintre variabile.
Analiza dispersională unifactorială • Aplicaţie: • Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest produs are câteva avantaje faţă de vechiul produs, printre care: • Este mai practic (uşor) de utilizat; • Are o calitate cel puţin la fel de bună ca şi a vechiului produs; • Preţul noului produs este semnificativ mai mic decât al vechiului produs. • Pentru a decide care este cea mai bună strategie de marketing, directorul acestui departament a dispus realizarea unui studiu în 3 oraşe: • În oraşul A, campania de publicitate s-a axat pe uşurinţa folosirii noului produs; • În oraşul B, campania de publicitate s-a axat pe calitatea net superioară a noului produs; • În oraşul C, campania de publicitate s-a axat pe preţul inferior al noului produs. • În toate cele 3 oraşe, s-au înregistrat vânzările săptămânale, în mai multe săptămâni consecutive. • Directorul de marketing ar dori să ştie dacă există diferenţe semnificative între vânzările medii săptămânale din cele 3 oraşe (nivel de semnif. 5%)
Analiza dispersională unifactorială • Aplicaţie:
Aplicaţie. Prelucrare în EXCEL Nivel minim de semnificaţie→prob. maximă cu care garantăm că H1 adev. Varianţă sistematică Varianţă reziduală Grade de libertate Dispersie corec- tată sistematică Varianţă totală Val. calc. a test F Val. critică a test F Dispersie corec- tată reziduală
Aplicaţie. Prelucrare în EXCEL • Cum Fcalc>Fcritic vom respinge H0 si vom accepta pe H1 cu o probabilitate maxima de 100-p_value%=100-4,28=95,72%. Strategia de marketing a influentat semnificativ variatia vanzarilor.