1 / 41

STATISTIKA

STATISTIKA. „VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“. Teze přednášky prof. MVDr. Petra Dvořáka, CSc. Exaktnost věd. „míra platnosti určité zákonitosti, vztahu, popisu, pravidla“ matematika x biologie 1 + 1 = 2 1 + 1 ~ (v 68 %) 2

marcie
Download Presentation

STATISTIKA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISTIKA „VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“ Teze přednášky prof. MVDr. Petra Dvořáka, CSc.

  2. Exaktnost věd • „míra platnosti určité zákonitosti, vztahu, popisu, pravidla“ • matematika x biologie • 1 + 1 = 2 1 + 1 ~ (v 68 %) 2 • „věda je omyl na úrovni své doby“

  3. ETAPY STATISTICKÉHO ZKOUMÁNÍ • Statistické zjišťování (plán experimentu, rozsah souboru, přesnost, pravděpodobnost testování, shromažďování dat) • Zpracování statistických údajů (výsledky, setřídění, tabulky, grafy) • Vyhodnocení zpracovaných údajů a jejich analýza (diskuse a závěr, konečný výsledek - nejčastěji střední hodnota a míra její variability, analýza, • 0 hypotézu potvrdíme, vyvrátíme, • zdůvodníme, srovnáme s jinými autory)

  4. Statistické zjišťování • ZÁKLADNÍ X VÝBĚROVÝ soubor N, X (µ), σ n, x, s Výběr NÁHODNÝ X ZÁVISLÝ pomocí PC, tabulek člověkem, neobjektivní

  5. Zákon rozdělení náhodných veličin • Každé hodnotě, či množství hodnot z každého intervalu je přiřazena pravděpodobnost, že náhodná veličina nabude určitou hodnotu, resp. hodnotu v rámci určitého intervalu.

  6. ROZDĚLENÍ ČETNOSTI četnost sledovaný znak - tuk [%]

  7. ZNAKY SPOJITÉ X NESPOJITÉ (diskrétní) KVALITATIVNÍ X KVANTITATIVNÍ ROZDĚLENÍ SOUBORU ZNAKŮ normální, exponenciální, studentizované atd.

  8. Charakteristika souboru znaků • VARIABILITA (proměnlivost) • ASYMETRIE (šikmost) • EXCES (špičatost)

  9. Normální rozložení a interval spolehlivosti Čím plošší křivka, tím větší variabilita sledovaného znaku, tím více plochy pro odlehlé hodnoty s nižší pravděpodobností.

  10. Chyby stanovení (měření) • HRUBÉ – testování odlehlých hodnot • SOUSTAVNÉ – opravný faktor • NÁHODNÉ – třídění statistických dat

  11. Test odlehlých hodnotQ – test (Deanův –Dixonův test) R= xmax-xmin Tabulka hodnot QT (Eckschlager et al. 1980)

  12. Zpracování statistických údajů • Třídění statistických dat • Statistické charakteristiky • Tabulky – uvádějí přesné hodnoty • Grafy – udávají průběh závislostí

  13. Třídění statistických dat 1. Podle obměn dle diskrétního znaku 2. Intervalové rozdělení četností u velkého počtu znaků nebo značného rozsahu souboru - Počet intervalů 6 – 20 - Stejná šířka intervalů - Střed intervalu – celé číslo

  14. Stupnice nepravdy STATISTIKA VELKÁ LEŽ LEŽ 2 1 3

  15. Statistické charakteristiky Střední hodnoty (míry polohy) 1. Aritmetický průměr X x (nikoliv Ø - technický průměr trubky) .

  16. Střední hodnoty (míry polohy) 2. Medián hodnota znaku stojícího přesně uprostřed souboru, který byl uspořádán podle velikosti Necitlivý k extrémním hodnotám.

  17. Střední hodnoty (míry polohy) 3. Modus má nejvyšší četnost • L dolní hranice modálního intervalu, • D1 rozdíl četností modálního intervalu a • četností jemu předcházejícímu intervalu, • D2 rozdíl četností modálního a následujícího • intervalu, • h šířka intervalu

  18. Míry variability • Variační rozpětí

  19. Metoda nejmenších čtverců ∑Δ = 0 rozptyl (variance) = ------ + Δ + + + + ∑Δ2 n

  20. Míry variabilitysměrodatná odchylka σ výběru sstřední chyba výběru, SD standard deviation n – 1 = ν počet stupňů volnosti výběrového souboru n > 50 ↔ ν se významem blíží N základního souboru • n < 8 • n ≥ 8

  21. Míry variability • relativnísměrodatná odchylka sr Variační koeficient Vx, vk[%] kontrola vzorců !!!

  22. Míry variability • Směrodatná odchylka průměru sx(střední chyba průměru) S.E.M. standard errorofmean • X = ( x ± sx ) jednotka

  23. 68,3 % pravděpodobnost X = | x ± sx | 95,4 % pravděpodobnost X = | x ± 2sx |99,7 % pravděpodobnostX = | x ± 3sx |

  24. Vícerozměrné statistické soubory Závislosti, kde hodnotě nezávisle proměnné odpovídá jediná hodnota (nebo střední hodnota) závisle proměnné nazýváme funkční závislost dvourozměrného statistického souboru. Lineární, exponenciální, logaritmické, polynomické různého stupně

  25. Metoda lineární regresey = bx + a y Závisle proměnná + Δ + + + α + a Nezávisle proměnná x b = tg αa

  26. Výpočet parametrů lineární regresey = bx + a

  27. Grafické metody Metoda těžišť Metoda obalových přímek

  28. Korelace - těsnost závislosti • Koeficient korelace r | -1; 1| • Koeficient determinace r2 . 100 [%] (kolik % bodů leží ideálně na přímce) • Index korelace I |0; 1| • u nelineárních závislostí

  29. Korelacestupeň závislosti, těsnost • r < 0,3 nízká • 0,3 – 0,5 mírná (9 – 25 %) • 0,5 – 0,7 význačná (25 – 49 %) • 0,7 – 0,9 velká (49 – 81 %) • 0,9 – 0,99 velmi vysoká (81 – 99 %)

  30. Testování hypotéz • prokázat shodnost nebo rozdílnost několika souborů získaných dat • úkolem je vypočítat hodnotu tzv. testovacího kriteria α , tuto hodnotu porovnat s hodnotou ”kritickou” (nalezneme v tabulkách pro určitou pravděpodobnost 95 nebo 99 %) definovanou pro hladinu významnosti testů α = 0,05 a α = 0,01

  31. Testování hypotéz • Procentuální interval shody Testování kvantitativních znaků studentův t-test analýza variance ANOVA Testování kvalitativních znaků χ2 test test nezávislosti v kontingenčních tabulkách

  32. Procentuální interval shody • Rychlá orientační metoda ve cvičeních • Experimentální hodnotu vyjádříme jako procento hodnoty tabulkové (ta je 100 %) • rozdíl ± 1 % (5 %) odpovídá α = 0,01 (0,05) • Testování shody experimentálních souborů výsledků mezi sebou • Sřední hodnota jednoho z nich se považuje za 100 %.

  33. t - test • test průkaznosti rozdílů dvou průměrů ze souborů na sobě nezávislých • základní ku výběrovému µ : x • dva výběrové vůči sobě 1) rozsahy shodné 2) rozsahy různé

  34. t - test n homogenita rozptylů ! F test ν = nA + nB - 2

  35. nehomogenita rozptylů • je třeba vypočítat počet stupňů volnosti ν

  36. Párový t - test • testování rozdílu dvou průměrů na sobě závislých znaků - před pokusem po pokusu - dvojice hodnot na témže jedinci - hodnocení léčiva dvěma metodami

  37. ANOVA - analýza variancejednofaktorová • rozdíl mezi průměry několika na sobě nezávislých souborů • TESTOVACÍ KRITÉRIUM KRITICKÁ HODNOTA tabulky rozdělení F f1 k-1 k = sloupce (skupiny) f2 n-k n = řádky (hodnoty) f1 počet stupňů volnosti čitatele f2 počet stupňů volnosti jmenovatele ANOVA dvoufaktorová bez interakce

  38. testování nezávislosti kvalitativních znaků • χ2 test (2 znaky ve 2 souborech) • test nezávislosti v kontingenčních tabulkách

  39. χ2 test α = 0,05 χ2(1) = 3,84 α = 0,01 χ2(1) = 6,63

  40. Tabulky a grafy • název musí být natolik výstižný, aby čtenář nemusel číst text • na osu x grafu – nezávisle proměnnou • na osu y grafu – závisle proměnnou • veličiny [ jednotky ] • graf uvádí přehledně závislost a variabilitu • tabulka uvádí přesné hodnoty • zaokrouhlování !

  41. Grafické metody • Metoda těžišť, sudý počet bodů n = 6 – 10 • Metoda vyhodnocování terčů • Metoda obalových přímek n > 20

More Related