140 likes | 333 Views
PREDNÁŠKA. RNDr. Ľudmila Grešová. Korelačná a regresná analýza Rozoznávame 2 typy závislosti medzi premennými 1. funkčnú závislosť – poznáme konkrétny predpis y = f(x), kde každej hodnote x odpovedá jedna
E N D
PREDNÁŠKA RNDr. Ľudmila Grešová
Korelačná a regresná analýza Rozoznávame 2 typy závislosti medzi premennými 1. funkčnú závislosť – poznáme konkrétny predpis y = f(x), kde každej hodnote x odpovedá jedna hodnota y 2. stochastickú (náhodnú) závislosť – každému x môže odpovedať viac hodnôt y
Ak náhodné premenné sú nezávislé, potom k(X,Y) = 0 a teda aj ρ(X,Y) = 0. Ak ρ(X,Y) = 0 → X,Y sú nekorelované ρ(X,Y) ≠ 0 → X,Y sú korelované Koeficient korelácie nás informuje o sile štatistickej závislosti (hovoríme tomu aj tesnosť väzby) medzi X a Y. Korelačná analýza – časť MŠ, ktorá sa zaoberá štúdiom miery závislosti Regresná analýza – študuje tvar (typ) závislosti náhodných premenných
Koeficient korelácie je mierou lineárnej korelácie. Platí Ak 0,3 ≤ ρ< 0,5 → mierna tesnosť, 0,5 ≤ ρ< 0,7 → výrazná tesnosť, 0,7 ≤ ρ< 0,9 → vysoká tesnosť, 0,9 ≤ ρ → veľmi vysoká tesnosť.
V úlohách korelačného počtu budeme pre koeficient korelácie používať vzorec Ak |ρ|= 1 → lineárna funkčná závislosť
Najjednoduchšou formou korelácie medzi dvoma kvantitatívnymi znakmi je jednoduchá lineárna korelácia, ktorú je možné popísať lineárnou regresnou priamkou. Jej rovnica je – vyjadruje závislosť znaku y na x alebo – vyjadruje regresiu x na y. Konštanty nazývame koeficienty alebo parametre regresie.
Metóda najmenších štvorcov Je daný štatistický súbor, ktorý má n dvojíc , i = 1, 2,...,n. Z rôznych možností, ktorými možno preložiť priamku cez body v korelačnom diagrame je najvhodnejšia tá alternatíva, pri ktorej sa súčet odchýlok empirických (skutočných) hodnôt od teoretických bude rovnať nule, to znamená
Pre použitie vo všeobecnosti sa táto podmienka upravila – súčet štvorcov odchýlok empirických hodnôt od teoretických má byť minimálny min. V našom prípade, ak označíme min.
Po úprave dostaneme sústavu normálnych rovníc a parametre a, b vyriešime Cramerovym pravidlom. (1)
Podobne koeficienty určíme minimalizovaním súčtu štvorcov vodorovných vzdialenosti každého bodu od priamky . V rovniciach (1) vymeníme za a naopak. Dostaneme sústavu rovníc a nájdeme koeficienty .
Dá sa dokázať, že platí . Čím je tento súčin bližší k jednej, tým sú regresné priamky bližšie k sebe a tým viac je oprávnený náš predpoklad o lineárnej závislosti oboch premenných.
Príklad 1. U deväť náhodne vybraných otcov bola zistená ich výška a výška ich dospelých synov. Údaje sú v tabuľke. Určte a) odhady regresných koeficientov prvej a druhej regresnej priamky; b) korelačný koeficient.
Na zistenie spoľahlivosti hodnoty koeficientu korelácie sa používa tzv. stredná chyba koeficientu korelácie kde n je počet dvojíc hodnôt znakov medzi ktorými meriame závislosť. Koeficient korelácie je spoľahlivou mierou tesnosti závislosti vtedy, keď je väčší ako trojnásobok teoretickej strednej chyby, teda
Príklad 2. U desiatich náhodne vybraných študentov bola zistená ich výška a hmotnosť. Vypočítajte koeficient korelácie medzi výškou a hmotnosťou týchto študentov. Údaje sú uvedené v tabuľke