240 likes | 536 Views
SKÚMANIE ZÁVISLOSTÍ. PREDNÁŠKA. Skúmanie závislostí je podmienené účelom prieskumu, napr. závislosť medzi premennými: cena, reklama, kvalita, príjem, vzdelanie, atď. a premennými: kupujúci/nekupujúci danú značku, preferencie, tržby, podiel na trhu. 2 skupiny premenných:
E N D
PREDNÁŠKA • Skúmanie závislostí je podmienené účelom prieskumu, napr. závislosť medzi premennými: cena, reklama, kvalita, príjem, vzdelanie, atď. a premennými: kupujúci/nekupujúci danú značku, preferencie, tržby, podiel na trhu. • 2 skupiny premenných: • prediktívne (vysvetľujúce, nezávislé) • kriteriálne (vysvetľované, závislé) • Pri výbere metód pri skúmaní závislostí je potrebné brať do úvahy: • počet závisle premených • počet nezávisle premenných • použitie škály • Skúmanie závislostí: • Nominálna škála • Ordinálna škála • Kardinálna škála
Typy škál: • Nominálna škála – meranie asociácií • Ordinálna škála – poradová korelácia • Kardinálna škála – regresná a korelačná analýza
NOMINÁLNA ŠKÁLA • meranie asociácií (c2 test štvorcovej kontingencie) • miery asociácie: • pre alternatívne znaky • pre množné znaky
Príklad • vychádzame z nasledovnej kontingenčnej tabuľky
Výpočet + záver • testovacia charakteristika • tabuľková hodnota =2(, (m-1).(k-1) 2(0,05, (3-1).(2-1)) = 5,99 4,67 < 5,99 H0 nezamietame, pohlavie nevplýva na frekvenciu pitia nealkoholických nápojov
Miery asociácie • ak potvrdíme asociáciu medzi znakmi A a B, má význam merať jej intenzitu • pri alternatívnychznakoch používame: • koeficient asociácie • koeficient korelácie kvalitatívnych znakov • Dané miery nadobúdajú hodnoty z intervalu <-1, 1>. • Nulová hodnota znamená nezávislosť. • Čím je hodnota v absolútnom vyjadrení bližšia k 1, tým je závislosť silnejšia.
Miery asociácie pri množnýchznakoch používame: • Pearsonov koeficient • Čuprovov koeficient • Cramerov koeficient • Pearsonov koeficient nadobúda hodnota z intervalu <0, 1), Čuprovov a Cramerov koeficient nadobúdajú hodnoty z <0, 1>. • Nulová hodnota znamená nezávislosť. • Čím je hodnota bližšia k 1, tým je závislosť medzi znakmi A a B silnejšia.
Miery asociácie - výpočet Príklad: pohlavie – frekvencia pitia • Pearsonov koeficient • Čuprovov koeficient • Cramerov koeficient • závislosť je mierna, z hľadiska ZS štatisticky nevýznamná
ORDINÁLNA ŠKÁLA • Poradová korelácia • posúdenie, či existuje závislosť v poradiach • Postup: • každej štatistickej jednotke priradíme poradové číslo podľa veľkosti hodnoty znaku, čiže hodnoty xj pretransformujeme na poradia xj*, a hodnoty yj pretransformujeme na poradia yj* • závislosť 2 znakov: Spearmanov koeficient poradovej korelácie • závislosť viac ako 2 znakov: Kendallov koeficient zhody.
SPEARMANOV KOEFICIENT • údaje v tvare (2 znaky) : • SPEARMANOV KOEFICIENT PORADOVEJ KORELÁCIE
SPEARMANOV KOEFICIENT • Spearmanov koeficient: hodnoty z intervalu -1, 1, čím je hodnota v abs. vyjadrení bližšia k 1, tým je závislosti vyššia a opačne. • ak n>8, je možné testovať významnosť Spearmanovho koeficientu H0: Sp. koeficient nie je št. významný H1: Sp. koeficient je št. významný testovacia charakteristika: H0 hypotézu zamietame, ak testovacia charakteristika je ≥ tabuľková hodnota, ktorá má Studentovo rozdelenie t a, n-2
KENDALLOV KOEFICIENT • ak posudzujeme závislosť viac ako 2 súborv kde:k – počet štatistických súborov n – rozsah súborov
KENDALLOV KOEFICIENT • Kendallov koeficient: hodnoty z intervalu 0, 1, čím je hodnota bližšia k 1, tým je zhoda v poradí vyššia, t.j. závislosť je silnejšia. • ak n>7, je možné testovať významnosť Kendallovho koeficientu H0: Kend. koeficient nie je št. významný H1: Kend. koeficient je št. významný testovacia charakteristika: H0 hypotézu zamietame, ak testovacia charakteristika je ≥ tabuľková hodnota, ktorá má c2 rozdelenie s (n-1) stupňami voľnosti.
KARDINÁLNA ŠKÁLA • Regresná a korelačná analýza • Regresná úloha: • nájsť funkčný vzťah medzi x a y (výber najvhodnejšej funkcie a odhad jej parametrov (MNŠ)) • regresná funkcia: Y = A + BX + e • Korelačná úloha: • posúdiť tesnosť závislosti = miery tesnosti závislosti
Príklad • Firma sa zaujíma o účinnosť marketingového mixu. Za týmto účelom vo vybraných 40 regiónoch sledovala u daného výrobku: • tržby (Y) • účinok reklamy vyjadrený počtom televíznych šotov za mesiac (X1) • počet predajných zástupcov (distribútorov) (X2) • výkonnosť veľkopredajcov – hodnotení na základe škály: • 1 – slabý • 2 – uspokojivý • 3 – dobrý • 4 - vynikajúci
Príklad • viacnásobná regresná a korelačná analýza – klasickýprístup • Y = A+ B1X1 + … + BkXk + e • MNŠ získame koeficient b3=11,5 • t.j. v priemere sa zmení predaj o 11 500 Sk za každú jednotku výkonnosti veľkopredajncu, čiže uspokojivý veľkopredajca môže očakávať predaj o 11 500 Sk vyšší ako slabý, ... • prírastok je konštantný alternatívnyprístup – pomocou umelýchpremenných
UMELÉ PREMENNÉ • názvy: dummy variable, binárne premenné, 0-1 premenné, kvalitatívne premenné • Ich podstata: predstavujú kvalitatívne vysvetľujúce premenné v reg. analýze a robia regresný model flexibilnejší. • vychádzame z toho, že na vysvetľovanú premennú môžu pôsobiť aj premenné ako pohlavie, sociálna skupina, vzdelanie, národnosť. • ak sú v modeli použité ako vysvetľované premenné len kvalitatívne premenné = ANOVA
UMELÉ PREMENNÉ • v našom príklade: index výkonnosti veľkopredajcu • potrebné zaviesť 3 umelé premenné:
UMELÉ PREMENNÉ • Y=A+A1D1+A2D2+A3D3+B1X1+B2X+e • príklad: • Y=A+9,2.D1+20,3.D2+33,3.D3+ ...... • 9,2: uspokojivý veľkopredajca môže očakávať tržby o 9 200Sk vyššie ako slabý veľkopredajca • 20,3:dobrý veľkopredajca môže očakávať tržby vyššie o 20 300 Sk ako slabý veľkopredajca • 33,3:výborný veľkopredajca môže očakávať tržby vyššie o 33 300 Sk ako slabý veľkopredajca • všetky koeficienty porovnávame s nulovým stavom (D1, 2, 3 = 0), t.j. so slabým veľkopredajcom • Použitie umelých premenných indikuje, že vzťah medzi tržbami a indexom výkonnosti veľkopredajcu nie je lineárny, rozdiely nie sú konštantné.