220 likes | 359 Views
Hodnocení závislosti kvantitativních znaků. Jednorozměrná statistika. – hodnocení 1 znaku (proměnné) v různých souborech (ZS, VS) ; vzájemné porovnání souborů. Vícerozměrná statistika. – závislost mezi 2 a více znaky v jednom souboru ; vyjádření a popis vzájemného vztahu mezi proměnnými.
E N D
Hodnocení závislosti kvantitativních znaků
Jednorozměrná statistika – hodnocení 1 znaku (proměnné) v různých souborech (ZS, VS); vzájemné porovnání souborů Vícerozměrná statistika – závislost mezi 2 a více znaky v jednom souboru; vyjádření a popis vzájemného vztahu mezi proměnnými
Vztahy mezi 2 proměnnými (obecně): • Funkční závislost(matematika, fyzika) • - každé číselné hodnotě jednoho znaku (proměnné xi) odpovídá 1 přesná hodnota znaku druhého (proměnná yi) Přesný popis rovnicí (vzorcem) – např. vztah mezi poloměrem kruhu a jeho obvodem, plochou. yi (2r) Pevný příčinný vztah, neovlivněný náhodou (závislá p.- následek) xi (r) (nezávislá p.- příčina)
Korelační (statistická) závislost(biologie, medicína) • - jedné číselné hodnotě prvního znaku (proměnné xi) odpovídá celá řada náhodných hodnot znaku druhého (proměnná yi) Volná závislost – změna 1.znaku vyvolá změnu 2.znaku jen s určitou pravděpodobností (znaky spolu korelují). (spojení celého komplexu různých příčin a následků, včetně náhodných vlivů.) (bodový diagram) yi (hmotnost) xi (výška)
Popis a charakteristika korelační závislosti v biologii: Odhadování nejbližší funkční závislosti (ke které se korelační závislost blíží) - aproximace Funkční závislost vyjádříme rovnicí.
Typy funkčních závislostí: • Lineární závislost: y = kx +q k – směrnice přímky (=tg ; sklon přímky) q – posun přímky na ose y +k +q -q -k
Kvadratická (parabolická) závislost: y = ax2+bx +c • Hyperbolická závislost:
Odhadování nejvýstižnější funkční závislosti pro korelační vztah: Bodový diagram - podle charakteru rozložení bodů: a) lineární závislost b) nelineární závislost A) Lineární korelace • Empirická křivka: • pro opakované měření v bodě xi získáme několik hodnot yi(zjistíme jejich průměr)
yi (empirická křivka - VS) xi Empirická křivka – popisuje závislost na úrovni VS(odhad skutečné závislosti)
Aproximace – zjištění teoretické přímky: • (výpočet koeficientů přímky y=kx + q: regresní analýza) VS: n- počet členů korelační dvojice (xi; yi) (kvalitativní stránka závislosti: vlastnosti přímky – sklon, posun)
Výpočet 2 bodů pro sestrojení přímky: - zvolíme x1 y1 =kx1 + q - zvolíme x2 y2 = kx2 + q yi y2 (teoretická přímka - ZS) y1 xi x1 x2
Korelační analýza – zjištění těsnosti vztahu: (výpočet korelačního koeficientu: r) („parametrická korelace“ ) r – kvantitativně vyjadřuje sílu závislosti (rozptýlení bodů v bodovém diagramu) r = -1; +1
r = 0 r <0 r >0 Přímá závislost nepřímá závislost r =+1 závislost úplná (funkční) r = -1 závislost úplná (funkční)
Významnost korelačního koeficientu Testujeme hypotézu nezávislosti pomocí t-testu: Test.kritérium: Střední chyba korelačního koeficientu: = n-2 Porovnáme s tab.krit. hodnotou Studentova rozdělení t1-/2() :
Pokud t t1-/2() zamítáme hypotézu nezávislosti X a Y (r je statisticky významný) Pokud t t1-/2() platí hypotéza nezávislosti X a Y (r je statisticky nevýznamný) Významnost korel.koeficientu souvisí s rozsahem VS: - čím větší je n souboru, tím větší je významnost r (při stejné velikosti).
B) Nelineární korelace Bodový diagram: Namáhavost výpočtů nelineárních regresních rovnic řešení pomocí počítače Stat. SW – polynomiální regrese (křivky různého tvaru) Např. polynom 4.řádu: y=ax4 +bx3 +cx2 +dx +e – Spearmanův koeficient pořadové korelace (neparametrický – nevyžaduje normalitu dat)
Kvalitativní znaky barva, tvar, výskyt anomálie, onemocnění, úhyn apod. (charakterizované četnostmi výskytu v souboru) ne – empirická (pozorovaná) četnost znaku ve VS no– očekávaná (teoretická) četnost znaku v ZS Výpočty: testování rozdílu četností mezi soubory zjišťování závislosti kvalitativních znaků
2 – test(test shody četností) m – počet kvalitativních tříd ve VS (varianty znaku) Je-li 2 > 2krit.významnýrozdíl mezi ne a no(při zvolené ) Je-li 2 2krit.nevýznamný rozdíl mezi ne a no Použití: • porovnání četnosti onemocnění ve VS se statistickou nemocností • porovnání výskytu onemocnění ve 2 a více VS • zjišťování závislosti kvalitativních znaků
Test rozdílu empirické a teoretické četnosti (VS x ZS) VS: n=146 ZS: p=4,5% (0,045) enteritis: 13 ne:13 (N) 133 (Z) no : p. n= 0,045.146= 6,57 (N) (1- p). n= 0,955.146= 139,43 (Z) 2 krit.0,05 =3,841 2 krit.0,01 =6,635 Významnost: p<0,05
Test rozdílu 2(a více) empirických četností (VSxVS) Porovnání několika skupin empirických četností mezi sebou Každá skupina: několik kvalitativních tříd Př.: při vyšetření masa srnčí zvěře na parazitární napadení byl sledován počet pozitivních a negativních vzorků ze 3 lokalit (A,B,C) v republice. Liší se lokality?
(100,34) (20,66) (118,59) (24,41) (87,07) (17,93) noij 3 skupiny– k (i) 2 třídy– m (j) ne – empirické četn. no – teoretické četn.
Vypočteme testovací kritérium: Počet stupňů volnosti: = (k-1).(m-1)=2 Tabulková kritická hodnota: 20,05(2)=5,99 2 2krit. rozdíl mezi pozorovanými četnostmi je stat. nevýznamný (p>0,05) Závěr.: výskyt parazitárního napadení srnčí zvěře se v lokalitách A, B a C významně neliší.