1 / 23

ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA)

ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA). CURS 5. ANALIZA DISPERSIONALĂ (ANOVA).

easter
Download Presentation

ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ELEMENTE DE ANALIZĂ DISPERSIONALĂ(ANOVA) CURS 5

  2. ANALIZA DISPERSIONALĂ (ANOVA) • Metoda analizei dispersionale (ANOVA) (“analiză de varianţă”), este utilizată pentru a verifica gradul în care valorile reale, empirice ale unei caracteristici se abat de la valorile teoretice, determinate în general cu ajutorul mediilor sau al ecuaţiilor de regresie. • Ea studiază efectul variabilei/variabilelor independente asupra celei dependente, altfel spus, măsura în care variaţia caracteristicii rezultative este dependentă sau nu de factorul (factorii) de grupare. • are la bază metoda grupării, prin ea separându-se influenţa factorilor esenţiali (determinanţi) de influenţa factorilor consideraţi întâmplători (aleatori) asupra caracteristicii “efect”. • în funcţie de numărul factorilor înregistraţi ce-şi exercită influenţa asupra caracteristicii rezultative (unul, doi sau mai mulţi), analiza dispersională se poate efectua după un model unifactorial, bifactorial sau multifactorial.

  3. ANALIZA DISPERSIONALĂ (ANOVA) • Pentru fiecare variantă/interval de variaţie a caracteristicii cauzale X, se înregistrează o distribuţie de valori ale variabilei efect Y, distribuţie pe care o putem caracteriza, de regulă, prin nivelul mediu. • Dacă aceste medii ale variabilei Y, pe grupe după X sunt egale sau foarte puţin diferite, atunci se concluzionează că variabila independentă X nu influenţează variaţia variabilei dependente Y (vezi a) • Cu cât mediile lui Y pe grupe după X diferă mai mult unele de altele, cu atât X influenţează mai mult pe Y.

  4. Analiza dispersională unifactorială a) medii de grupă egale; b) mediile de grupă inegale

  5. Analiza dispersională unifactorială • Ipoteza nulă susţine egalitatea între mediile grupelor din colectivitatea generală, alcătuite după variabila X: • Ipoteza alternativă susţine că cel puţin două medii ale grupelor nu sunt egale: • Se testează, deci, dacă diferentele intre mediile de grupă nu sunt prea mari pentru a fi puse doar pe seama întâmplării (a factorilor aleatori), iar dacă există cel puţin două medii semnificativ diferite, înseamnă că factorul de grupare X are o influenţă semnificativă asupra variabilei Y. • Mediile grupelor din colectivitatea generală sunt aproximate prin mediile grupelor din eşantion ( , ),

  6. Analiza dispersională unifactorială

  7. Analiza dispersională unifactorială • Medii condiţionate (medii parţiale): • Media generală a eşantionului:

  8. Analiza dispersională unifactorială

  9. Analiza dispersională unifactorială • Varianţa dintre grupe (varianţă factorială, sistematică) arată influenţa factorului cauzal asupra variaţiei lui Y: • Varianţa din interiorul grupelor (varianţă reziduală) exprimă influenţa factorilor aleatori asupra lui Y: • Varianţa totală reflectă influenţa tuturor factorilor (sistematici – X şi reziduali) asupra lui Y:

  10. Analiza dispersională unifactorială • Pentru a asigura comparabilitatea varianţelor, ele sunt raportate la numărul gradelor de libertate, obţinându-se dispersii corectate: • Dispersia corectată factorială (sistematică): • Dispersia corectată reziduală:

  11. Analiza dispersională unifactorială • Testul F (Fisher) este raportul între dispersia corectată sistematică şi cea reziduală: • Presupuneri pentru aplicarea testului F: • cele “r” grupe din eşantion sunt extrase aleator din cele “r” grupe ale colectivităţii totale; • Fiecare grupă din colectivitatea generală are o distribuţie normală, iar abaterile medii pătratice ale acestora sunt egale:

  12. Analiza dispersională unifactorială

  13. Analiza dispersională unifactorială • Valoarea calculată a testului F se compară cu valoarea critică, corespunzătoare nivelului de semnificaţie α şi gradelor de libertate (r-1) şi (n-r): F α; r-1; n-r. • Regula de decizie este: • Dacă Fcalc≤ F α; r-1; n-r, atunci se acceptă H0, deci mediile de grupă nu diferă semnificativ unele de altele, iar eventualele diferenţe ce pot apare pot fi puse pe seama întâmplării. În acest caz, variabila Y este independentă de factorul de grupare X şi analiza dispersională este punctul final al analizei. • Dacă Fcalc> F α; r-1; n-r, atunci se acceptă H1, deci între mediile de grupă există o diferenţă semnificativă, care nu poate fi pusă pe seama acţiunii factorilor aleatori. În acest caz, variabila Y depinde semnificativ de factorul de grupare X şi trebuie aplicate în continuare metodele de analiză a legăturilor dintre variabile.

  14. Analiza dispersională unifactorială • Aplicaţie: • Un producător de sucuri de mere a realizat un nou produs: concentrat lichid. Acest produs are câteva avantaje faţă de vechiul produs, printre care: • Este mai practic (uşor) de utilizat; • Are o calitate cel puţin la fel de bună ca şi a vechiului produs; • Preţul noului produs este semnificativ mai mic decât al vechiului produs. • Pentru a decide care este cea mai bună strategie de marketing, directorul acestui departament a dispus realizarea unui studiu în 3 oraşe: • În oraşul A, campania de publicitate s-a axat pe uşurinţa folosirii noului produs; • În oraşul B, campania de publicitate s-a axat pe calitatea net superioară a noului produs; • În oraşul C, campania de publicitate s-a axat pe preţul inferior al noului produs. • În toate cele 3 oraşe, s-au înregistrat vânzările săptămânale, în mai multe săptămâni consecutive. • Directorul de marketing ar dori să ştie dacă există diferenţe semnificative între vânzările medii săptămânale din cele 3 oraşe (nivel de semnif. 5%)

  15. Analiza dispersională unifactorială • Aplicaţie:

  16. Analiza dispersională unifactorială • Volumul mediu al vânzărilor pe fiecare strategie: • Volumul mediu al vânzărilor pe total: • Varianţele:

  17. Analiza dispersională unifactorială • Dispersiile corectate: • Statistica F: • Cum rezultă că se respinge H0, se acceptă H1, deci cel puţin două medii diferă semnificativ. Aşadar, pentru o probabilitate de 95%, se poate afirma că tactica de marketing aleasă pentru promovare produsului a influenţat vânzările.

  18. Aplicaţie. Prelucrare în EXCEL

  19. Aplicaţie. Prelucrare în EXCEL Nivel minim de semnificaţie→prob. maximă cu care garantăm că H1 adev. Varianţă sistematică Varianţă reziduală Grade de libertate Dispersie corec- tată sistematică Varianţă totală Val. calc. a test F Val. critică a test F Dispersie corec- tată reziduală

  20. Analiza dispersională unifactorială

  21. Analiza dispersională unifactorială • Formulele devin:

  22. Modelul de analiză dispersională bifactorială • se identifică doi factori de influenţă, iar variabilitatea caracteristicii rezultative poate să fie pusă: • pe seama influenţei primului factor; • pe seama influenţei celui de-al doilea factor; • pe seama interacţiunii celor doi factori; • pe seama întâmplării (factorului rezidual).

  23. Concluzii • modelele de analiză dispersională nu explică relaţia dintre variabile • verifică doar măsura în care valorile reale ale unei caracteristici se abat de la valorile teoretice, precum şi măsura în care aceste variaţii sunt sau nu dependente de factorul/factorii de grupare. • metoda analizei dispersionale poate fi utilizată atât înaintea, cât şi după aplicarea metodelor corelaţiei şi regresiei statistice. • Testul F se poate utiliza şi pentru testarea validităţii modelului de regresie. • în general, în analiza dispersională, nivelurile x1, x2, ..., xr sunt niveluri ale unei variabile categoriale (numite şi tratamente), dar, cum ceea ce este valabil pentru o scală inferioară (nominală) este valabil şi pentru orice altă scală superioară (ordinală, de intervale, de rapoarte), analiza se poate extinde.

More Related