1 / 81

ELLA–CS Producer of medical devices

ELLA–CS Producer of medical devices. …durability !!!!!. Ronald Aylmer Fisher ( 17. února 1890 , Londýn , Spojené království – 29. července 1962 , Adelaide , Austrálie ) byl anglický statistik , evoluční biolog , eugenik a genetik . Zakladatel moderní matematické statistiky .

aira
Download Presentation

ELLA–CS Producer of medical devices

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ELLA–CSProducer of medical devices

  2. …durability !!!!!

  3. Ronald Aylmer Fisher (17. února1890, Londýn, Spojené království – 29. července1962, Adelaide, Austrálie) byl anglický statistik, evoluční biolog, eugenik a genetik. Zakladatel moderní matematické statistiky.

  4. Srovnání – pro posouzení efektu intervence je třeba porovnat objekty vystavené této intervenci a objekty, které jí vystaveny nebyly (tzv. kontrolní skupina). Randomizace (znáhodnění) – výběr jednotek, které budou pozorovány, vystaveny různým druhům intervence resp. budou zařazeny do kontrolní skupiny, se musí dít na základě pravděpodobnostního výběru. Replikace (opakování) – vícenásobné opakování měření umožní posoudit náhodnou variabilitu měřených veličin, a tím i určit přesnost měření. Citováno z „http://cs.wikipedia.org/wiki/Pl%C3%A1nov%C3%A1n%C3%AD_experiment%C5%AF

  5. Blokový design, stratifikace – rozdělení experimentálních jednotek do bloků či strat, které vykazují podobné vlastnosti, umožní redukovat vliv zdrojů variability, které nejsou předmětem zkoumání. Faktoriální uspořádání – experiment může zkoumat vliv několika faktorů (různých intervencí) naráz, včetně jejich synergických efektů. Ortogonalita – faktoriální experiment má být navržen tak, aby umožňoval posoudit nezávisle vliv každého jednotlivého faktoru. Citováno z „http://cs.wikipedia.org/wiki/Pl%C3%A1nov%C3%A1n%C3%AD_experiment%C5%AF

  6. Deskriptivní statistika PGS 2010 Presentace ELLA-CS, Brno, 2010, schváleno doc.ing.Josef Hanuš, CSc, přednosta Ústavu lékařské biofyziky, LFUK Hradec Králové

  7. Biostatistika, Lékařská statistika Proč: variabilita dat To není běžné v přírodních vědách (chemie, fyzika) změna barvy lakmusového papírku závisí na pH roztoku, při ponoření do kyseliny ve 100 % zčervená a nikdo nečeká, že bude jen 95 případech ze 100. Dáme-li 100 pacientům s bolestí hlavy paracetamol, neočekáváme, že všichni ucítí úlevu Budeme-li stejné osobě měřit krevní tlak za stejných podmínek s rozlišením 1 mmHg několik dní za sebou, pravděpodobnost, že dostaneme stejnou hodnotu je méně než 50 % Překrývá skutečné rozdíly nebo souvislosti Přijetí či zamítnutí předem formulované hypotézy na předem zvolené hladině pravděpodobnosti

  8. Biostatistika, Lékařská statistika Generalizace pozorování spolehlivost zobecnění jevu pozorovaného na vybraných jedincích na definovanou populaci výběr musí být representativní náhodný každý jedinec musí mít stejnou šanci dostat se do daného výběru dostatečně velký závisí na variabilitě zkoumaných veličin a přesnosti s jakou je můžeme měřit

  9. Statistika Deskriptivní (popisná) charakteristiky (statistiky) polohy, variability, presentace dat (tabulky, grafy) úplné soubory dat Inferenční (induktivní) závěry, rozhodnutí o populaci na základě pozorování vybraných jedinců populace, základní soubor, všichni jedinci, kteří splňují podmínku výskytu určujícího znaku (ů) rozsah konečný, nekonečný

  10. Měrné stupnice Zkoumané znaky - proměnné veličiny, jejich hodnoty jsou data nominální - různé kategorie bez možnosti srovnání velikosti (pořadí): krevní skupiny, národnost, diagnosa; binární (pohlaví) ordinální - různé kategorie, jež lze seřadit podle velikosti (vyléčen, zlepšen, nezlepšen, zhoršen, zemřel), ale nemá cenu určovat rozdíl intervalová - rozdíl má reálný význam (teplota), nula stupnice je náhodná poměrová - reálná nula (hmotnost)

  11. Typy dat kvalitativní - nominální kvantitativní - intervalová a poměrová nespojitá, diskrétní - pouze celá čísla spojitá - libovolná hodnota (v určitém intervalu) vzhledem k přesnosti měření mají často charakter diskrétních (TK měřený tonometrem) ordinální - mezi i kvantitativní na ně transformujeme - mikrocyt, normocyt, makrocyt

  12. Variabilita dat Zdroje biologická proměnlivost chyby měření (jiný význam než v běžné mluvě – error × mistake) rozdíl hodnoty naměřené a hodnoty správné nebo populačního průměru,  hrubé systematické, jednostranné metody přístroje osobní náhodné, oboustranné elementární, stejně velké, stejně pravděpodobné kladné i záporné, menší pravděpodobnější než větší, binomické rozložení, přecházející v rozdělení Gaussovo (normální)

  13. Výsledek měření • Přesnost měření • precision • přesnost • accuracy • správnost • resolution • rozlišení

  14. Zápis dat 3 platné cifry - 0,1 % nejmenší zjistitelný rozdíl TK 5 mm Hg podíl - implikuje velikost souboru 10 - 1 platná cifra (desítky procent) 100 - 2 platné cifry (jednotky procent) 60 000 dětí - P = 0,5143

  15. Charakteristiky polohy a variability Míry polohy aritmetický průměr - populační a výběrový medián modus kvantily Míry variability variační rozpětí rozptyl, směrodatná odchylka - populační a výběrové kvantilová rozpětí

  16. Míry polohy znaku Aritmetický průměr Medián Modus může se stát, že se najde více hodnot, které se v datech vyskytují se stejnou četností rozložení bimodální, trimodální, multimodální Excel – první hodnotu, kterou najde v případě, že rozložení je multimodální Kategorická data binární (0, 1) – ar. průměr – četnost výskytu 1

  17. Míry polohy znaku 2 Kvantily – vzestupně setříděná data k udává pořadové číslo (index) naměřené hodnoty q – daný kvantil, n – počet pozorování kvartily (Q = 4), decily (Q = 10), percentily (Q = 100) 15 čísel: 1. kvartil = (1  15)/4 = 3,75 1. decil = (1  15)/10 = 1,5 x4 x2 Jestliže zlomek není celé číslo, je k nejbližší vyšší celé číslo Varianta EDF v souboru Percentile-type.doc v KIS

  18. Míry proměnlivosti znaku Odchylka Populační rozptyl Výběrový rozptyl Směrodatné odchylky , s Variační koeficient Standardní chyba (aritmetického) průměru rozpětí - variační (inter)kvartilové (inter)decilové

  19. Gaussovo rozdělení Normální, Gaussovo rozdělění dat teoretické  populační rozdělení, charakterizované populačním aritmetickým průměrem  populační směrodatnou odchylkou  hustota pravděpodobnosti výskytu dané hodnoty - zvonový tvar (bell shaped curve) nejčastější naměřená hodnota (nulová chyba) v intervalu  ±  leží 68 % všech naměřených dat v intervalu  ± 1,96 ×  leží 95 % všech naměřených dat v intervalu  ± 2,58 ×  leží 99 % všech naměřených dat

  20. z transformace z skór

  21. Standardizovaná Gaussovakřivka

  22. Distribuční funkce

  23. Hustotní funkce

  24. Vlastnosti Nejčastěji používanými charakteristikami polohy a variability jsou průměr a směrodatná odchylka oprávněné pouze tehdy, jestliže můžeme předpokládat Gaussovo rozložení dat spojitá veličina, ležící v intervalu –, + biologické veličiny toto rozdělení v podstatě mít nemohou. V příznivém případě nemůžeme prokázat, že se od něj významně liší nejedná-li se o tyto případy, lepšími (správnějšími) charakteristikami polohy a variability jsou medián, modus a (různá) rozpětí

  25. Unimodální sešikmená rozložení

  26. Symetrická, ale též odchýlená Špičatost (kurtosis) plošší - platykurtická užší - leptokurtická d’Agostinův Omnibus test

  27. Bimodální rozložení

  28. lepto- a platy- kurtické rozdělení

  29. t-rozdělení,Studentovo tvar závisí na počtu stupňů volnosti df (degrees of freedom)

  30. Meze spolehlivosti bodový x intervalový odhad 95% interval spolehlivosti aritmetického průměru

  31. Tabulka s popisnou statistikou n – počet pacientů, min – minimální hodnota, max – maximální hodnota, AP – aritmetický průměr, DMS, HMS – 95% dolní a horní interval spolehlivosti, M – medián, distr – rozložení G – Gaussovo, NG – negaussovské Zvláštní pozornost je třeba věnovat počtu platných cifer jednotlivých veličin a v celé tabulce tento počet zachovávat

  32. Testování hypotéz PGS 2010

  33. Testování hypotéz Odpověď na otázku (tou by měl každý projekt začít): Je chirurgická léčba (Parkinsonovy choroby) lepší (úspěšnější) než léčba medikamentózní? Je nový lék účinnější než starý? Má méně vedlejších účinků? Existuje spojitost (asociace) mezi dávkou léku a velikostí odezvy (poklesem krevního tlaku)? Je výsledek daného vyšetření u nemocných s danou chorobou jiný (častější, méně častý) než u zdravých jedinců?

  34. Testování hypotéz vědecká, výzkumná hypotéza prokázat s přiměřenou mírou spolehlivosti, za rámec rozumných pochybností, zda tuto hypotézu můžeme přijmout či zamítnout to je většinou nemožné všechny čínské děti jsou černovlasé i když uděláme velký výběr (103, 106) a všichni jsou skutečně černovlasí, ještě to naši hypotézu nedokazuje najdeme-li jediného blonďáka, tak můžeme (musíme) hypotézu zamítnout logicky jednodušší je tedy formulovat hypotézu zamítající určitou hypotézu než hypotézu potvrzující to je základem statistických hypotéz

  35. Testování hypotéz statistická hypotéza chirurgická léčba není lepší než léčba medikamentózní nový lék není účinnější než starý, nemá méně vedlejších účinků neexistuje spojitost mezi dávkou léku a velikostí odezvy výsledek daného vyšetření není jiný než u zdravých jedinců kvantifikuje spolehlivost, pochybnost. Určuje pravděpodobnost skutečnosti, že správná (platná) hypotéza bude zamítnuta nebo špatná (neplatná) přijata

  36. Testování hypotéz – příklad chceme srovnat účinnost dvou léků na hypertenzi ze skupiny 100 hypertoniků jich 50 náhodně zařadíme do skupiny léčené lékem A a druhých 50 budeme léčit lékem B za rozumnou míru účinnosti obou preparátů můžeme považovat hodnotu TK, zjištěnou v obou skupinách po třech měsících za předpokladu gaussovského rozložení dat v obou souborech, výsledek vyjádříme pomocí průměrů a směrodatných odchylek TK v obou skupinách

  37. Testování hypotéz – příklad, pokračování za předpokladu gaussovského rozložení dat v obou souborech, výsledek vyjádříme pomocí průměrů a směrodatných odchylek TK v obou skupinách statistickou hypotézu formulujeme tak, že není rozdíl mezi µA a µB, tj., že µA = µB neboli, že µA - µB =0

  38. Testování hypotéz – příklad problém je, že populační průměry neznáme a k výpočtu musíme použít charakteristiky výběrové (průměry a standardní chyby průměrů) statistika dává návod k odhadu pravděpodobnosti, že µA - µB =0

  39. Nulová(null) hypotéza - H0 srovnávané parametry (statistické charakteristiky) jsou stejné  jejich rozdíl je roven nule nemůžeme-li ji zamítnout, plyne z toho, že se v provedeném experimentu nepodařilo na zvolené hladině významnosti prokázat rozdíl srovnávaných charakteristik předem zvolená hladina významnosti (nulové hypotézy) se označuje α obvykle se volí 0,05 (5 %), 0,01 (1 %) není to však důkaz, že srovnávané charakteristiky jsou shodné takže formulace zní: nezamítáme nulovou hypotézu ne vždy nežádoucí: Ovlivňuje provoz jaderné elektrárny délku života v okolí do vzdálenosti x km?

  40. Hypotéza alternativní - HA, H1 přijímáme ji, můžeme-li zamítnout hypotézu nulovou oboustranná - srovnávané charakteristiky jsou různé jednostranná - a) první je větší než druhá b) první je menší než druhá mělo by být stanoveno před tím, než je výsledek testu znám a měl by existovat racionální důvod pro její formulaci (někteří statistici principiálně použití jednostranné alternativní hypotézy odmítají) Statistický test počítá tzv. testové kritérium T, jehož hodnota je hodnota kvantilu rozdělení nějaké veličiny (nejčastěji Studentova, t).

  41. Hypotéza alternativní - HA, H1 Výsledek srovnáváme v případě oboustranné alternativní hypotézy s hodnotou kvantilu pro pravděpodobnost 1 – α/2 v případě jednostranné alternativní hypotézy s hodnotou kvantilu pro pravděpodobnost 1 – α jestližeT ≥ hodnotě korespondujícího kvantilu, říkáme, že T leží mimo obor přijetí nulové hypotézy a zamítáme ji pravděpodobnost, příslušející k hodnotě T se nazývá p-hodnota jestliže p-hodnota ≤ αnulovouhypotézu zamítáme při zamítnutí nulové hypotézy se uvede její hladina významnosti α v podstatě to znamená, že alternativní hypotéza je přijata na hladiněvýznamnosti 1 −α Rozdíl mezi αa p je v tom, že první pravděpodobnost se určuje před začátkem testování, zatímco druhá je výsledkem výpočtu testového kritéria

  42. Parametrické testy srovnávájí různé statistické charakteristiky dat majících Gaussovo rozdělení nemůžeme zamítnout nulovou hypotézu, že data pocházejí z populace, která má Gaussovo rozdělení na začátku je proto nutné otestovat normalitu dat ve výběru D‘Agostino Omnibus výběrový průměr (zjištěnou hodnotu) s populačním jednovýběrový test hypotézy o průměru dva (nebo více) výběrových průměrů nepárový t-test, ANOVA rozdíly hodnot stejné veličiny (hladiny léku v krvi) zjištěné za různých podmínek (za 4 a 8 h po podání, různou metodou) u stejných jedinců párový t-test výběrové rozptyly F-test koeficienty modelů (regrese, korelace)

  43. Testování hypotéz Hladina významnosti pravděpodobnost, že zamítneme H0 i když je platná chyba I. druhu,  0,05 = 5% = *, 0,01 = 1% = **, 0,001 = 1‰= ***

  44. Testování hypotéz srovnáváme hodnotu testového kritéria s hodnotou příslušného kvantilu odpovídajícího rozdělení v uvedeném příkladu s rozdělením Gaussovým  = 0,05 0,01 0,001 pro jednostrannou alternativní hypotézu (1 - ) 0,95 0,99 0,999 1,64 2,33 3,09 pro oboustrannou alternativní hypotézu (1 - /2) 0,975 0,995 0,9995 1,96 2,58 3,29

  45. Testování hypotéz pravděpodobnost, že přijmeme nulovou hypotézu i když je neplatná chyba II. druhu,  (1 - ) je tzv. síla (power) testu. Je mírou jeho robustnosti, tj. citlivosti na splnění předpokladů Např. jaký bude výsledek testu, když testovaná veličina je diskrétní a ne spojitá, data nemají normální rozdělení ap. je spojena se zvolenou hodnotou hladiny významnosti. Čím je hladiny významnosti menší ( je větší), tím je též síla testu menší J. Knížek, P. Stránský: Příspěvek k nápravě opomíjení významu síly testů ve studiích z experimentální medicíny, ČLČ, 144, 2005, č. 2, s.: 56 – 58. Skutečný stav Výsledek testu H0 je platná H0 je neplatná Přijmi H0 správně chyba  Zamítni H0 chyba  správně

More Related