1 / 29

BIOSTATISTIKA

BIOSTATISTIKA. za studente medicine. Temeljni statistički pojmovi.

dex
Download Presentation

BIOSTATISTIKA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. BIOSTATISTIKA za studente medicine

  2. Temeljni statistički pojmovi

  3. Statistika se bavi rezultatima opisa/mjerenja/ankete više jedinki (bioloških ili drugih). Ti se rezultati (podaci) zovu varijable, zato što se mijenjaju od jedinke do jedinke (za razliku od konstanti). Statističke se analize razlikuju prema vrstama varijabli: 1. Kategorijske (kvalitativne, nominalne) 2. Ordinalne (poredbene, ljestvične) 3. Metričke (kvantitativne)

  4. 1.Kategorijske (kvalitativne, nominalne) se varijable sastoje od nekoliko vrijednosti, među kojima ne postoji prirodan redoslijed. Tipičan je primjer spol, kategorijska varijabla koja ima dvije vrijednosti (muški, ženski). Spol, bračni status (vjenčan, nevjenčan), 5-godišnje preživljenje raka dojke (da, ne) primjeri su binarnih (ili dihotomnih) kategorijskih varijabli. Neke kategorijske varijable (rasa, religiozna pripadnost, nacionalnost, krvna grupe, tip bolesti ili lijeka) su multikategorijske, tj. imaju više od dvije vrijednosti.

  5. 2. Ordinalne (ljestvične) varijable imaju vrijednosti među kojima postoji prirodan poredak, ali nije precizno određeno koliko se vrijednosti međusobno razlikuju. Primjeri su: socijalni sloj (1=siromašan, 2=srednji, 3=bogat), tumorski stadij (1=bez metastaza, 2=lokalne metastaze, 3=metastaze prisutne i u udaljenijim organima i 4=obilje metastaza na mnogim lokacijama), te razni “skorovi” (zbrojevi) kojima se u medicini označava stupanj ozljede, bolesti ili pouzdanosti dijagnoze. Ocjena na usmenom ispitu također je primjer ordinalne varijable, jer je subjektivna.

  6. 3. Metričkim ili kvantitativnim varijablama možemo pridružiti realne brojeve (ili točke pravca), te ih podvrgavati matematičkim operacijama. To su sve prirodne, fizikalne veličine (prostorne dimenzije, vrijeme, tlak, masa), kao i mnogi biološki parametri (npr. koncentracije raznih sastojaka krvi, volumen pluća, tjelesna visina i masa, dob, tlak krvi). Metričke varijable mogu imati međusobno razmaknute, diskretne vrijednosti (npr. broj poroda, broj recidiva bolesti, broj brakova, broj lomova kostiju). Najčešće su vrijednosti metričkih varijabli kontinuirane, bez rupa među mogućim veličinama.

  7. Ponekad se metričke varijable prikazuju na skali bez prirodne nule (npr. temperatura u C, ocjena na temelju test-ispita), pa ne možemo praviti omjere (npr. 20 C nije dva puta viša temperatura od 10 C). To rješavamo uporabom prirodne skale (temperatura u stupnjevima kelvina, umjesto ocjene-broj bodova na testu, itd.).

  8. U medicini se često zbog jednostavnosti metričke varijable prikazuju kao kategorijske ili ordinalne. Tako se bolesnici često razvrstavaju u skupine prema graničnim vrijednostima krvnih tlakova u normotoničare (osobe normalnog krvnog tlaka) i hipertoničare (osobe kojima je krvni tlak povišen). Drugi su primjer dobne skupine (djeca: <13 godina, adolescenti: između 13 i 18 godina, mlađi odrasli: od 18 do 35 godina, odrasli: od 35 do 65 godina, starije osobe: od 65 do 80 godina i stare osobe)

  9. Kategorijske varijable prikazujemo najlakše: svakoj vrijednosti varijable pridružena je njena učestalost (frekvencija), tj. broj jedinki koje imaju tu vrijednost (to su npr. brojevi muških i ženskih studenata vaše generacije). Sve učestalosti varijable čine distribuciju (raspodjelu) te varijable. Grafički distribucije prikazujemo kao stupičaste dijagrame (engl. bar chart) ili tzv. pite (engl. pie chart). Slično možemo prikazati i vrijednosti ordinalnih varijabli.

  10. TABLICA 1.1. Načini poroda 600 beba u jednoj bolniciNačin poroda Broj beba PostotakNormalni 478 79.7 Forceps 65 10.8 Carski rez 57 9.5 Ukupno 600 100

  11. Primjer stupičastog (“bar chart”) dijagrama

  12. Primjer dijagrama tipa pita (“pie diagram”)

  13. I metrički se podaci mogu prikazati kao distribucije, ako ih prvo svrstamo u razrede (inače ne, jer svaku određenu točnu vrijednost često ima samo po jedna jedinka). To je smisleno ako metričkih podataka ima dovoljno (recimo više od 100). U suprotnom je broj razreda premali i ne vidi se oblik raspodjele, ili je u pojedinim razredima premalo podataka za pouzdaniju procjenu. Valja paziti da među razredima nema preklapanja.

  14. Koncentracije hemoglobina (g/100 mL) u 70 žena 10.2 13.7 10.4 14.9 11.5 12.0 11.0 13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.6 10.5 13.7 11.8 14.1 10.3 13.6 12.1 12.9 11.4 12.7 10.6 11.4 11.9 9.3 13.5 14.6 11.2 11.7 10.9 10.4 12.0 12.9 11.1 8.8 10.2 11.6 12.5 13.4 12.1 10.9 11.3 14.7 10.8 13.3 11.9 11.4 12.5 13.0 11.6 13.1 9.7 11.2 15.1 10.7 12.9 13.4 12.3 11.0 14.6 11.1 13.5 10.9 13.1 11.8 12.2

  15. Hb (g/100 mL) Učestalosti Postoci8-8.9 1 1.4 9-9.9 3 4.3 10-10.9 14 20.0 11-11.9 19 27.0 12-12.9 14 20.0 13-13.9 13 18.6 14-14.9 5 7.1 15-15.9 1 1.4 Ukupno 70 100

  16. Stupičasti dijagram (histogram) metričke varijable

  17. Deskriptivna statistikaDistribucije metričkih podataka moguće je dodatno opisivati, jer su metrički podaci realni brojevi (za razliku od kategorijskih i ordinalnih podataka). Aritmetička sredina je prosječna vrijednost konačnog skupa metričkih podataka. Ako se metrička varijabla sastoji od N podataka (x1, x2, …, xN) aritmetička je sredina njihov zbroj podijeljen s N, što skraćeno pišemo, koristeći  kao simbol za zbrajanje:x = x/N

  18. Aritmetička je sredina u sredini simetrično distribuiranih podatka (kada su odstupanja od prosjeka podjednaka s obje strane).U sredini nesimetričnih distribucija nije aritmetička sredina, već medijan. To je, dakle, ona vrijednost od koje je pola podataka manje, a druga polovina veća.Ako neparan broj N podataka poredamo po veličini, medijan je (N+1)/2 po redu. Ako je broj podataka paran, ne postoji srednji. Tada se medijan računa kao aritmetička sredina između dva susjedna oko sredine.

  19. Osim medijana, koriste se i drugi parametri koji opisuju kojim tempom podaci rastu po veličini: donji kvartil je granica koja razdvaja po veličini prvih 25% podataka od ostalih (većih), dok je od gornjeg kvartila 75% podataka manje, a ostatak veći. Razlika između gornjeg i donjeg kvartila zove se interkvartilni raspon i obuhvaća 50% podataka. Vrijednost koja ima najveću učestalost je mod distribucije. Kod simetričnih raspodjela aritmetička sredina, medijan i mod jedna su te ista vrijednost.

  20. Srednja vrijednost, mod i medijan opisuju grupiranje podataka oko središta, te se nazivaju mjerama centralne tendencije. One ne govore o raspršenju podataka oko tih središta. Rasap vrijednosti (širinu distribucije) možemo opisivati pomoću razlike izmeđunajveće i najmanje vrijednosti. To je ukupna širina raspodjele, koju potpuno određuju samo dvije, ponekad slučajne vrijednosti. Prosječno apsolutno odstupanje od aritmetičke sredine je informativnije. Još je bolja (iz matematičkih razloga u koje ne ulazimo) tzv. standardna devijacija(SD): kvadratni korijen iz prosjeka kvadrata odstupanja podataka od aritmetičke sredine:

  21.  Koeficijent varijacije (CV) je standardna devijacija izražena u postocima od aritmetičke sredine:

  22. “Srce” statistike je simetrična, zvonolika raspodjela koju nazivamo normalnom ili Gaussovom raspodjelom. Potpuno je određena s dva parametra: 1. aritmetička sredina određuje os simetrije, dok 2. standardna devijacija podataka određuje širinu raspodjele i njen točan oblik (ne postoje dvije različite normalne raspodjele s istom aritmetičkom sredinom i standardnom devijacijom!).

  23. Za metričke varijable koje slijede normalnu raspodjelu vrijedi da sljedeći rasponi obuhvaćaju podatke na način:aritmetička sredina  1 SD: oko 2/3 (68%) podataka aritmetička sredina  1.96 SD: oko 95% podataka aritmetička sredina  2.58 SD: oko 99% podataka

  24. Statističke metode koje pretpostavljaju normalnu raspodjelu varijabli zovu se parametrijske metode. Njihova je moć sadržana u činjenici da je veliko broj normalno raspoređenih podataka potpuno određen s dva parametra distribucije, poznavajući koje znamo cijeli skup.

  25.  Standardna pogreškaaritmetičke sredine(SE) je standardna devijacija aritmetičkih sredina. Možemo je odrediti tako da puno puta dobivamo podatke na N jedinki (uzorcima) iz nekog velikog skupa (populacije). Npr. ako izračunam aritmetičku sredinu tjelesne visine vaše generacije i tako zaredom 30 godina. Potom se izračuna srednja vrijednost tih 30 srednjih vrijednosti i njena standardna devijacija. Takva su istraživanja opsežna i često nemoguća. Na sreću, SE se da procijeniti iz standardne devijacije i broja podataka N samo jednog uzorka:

  26. SE govori koliko je pouzdana procjena aritmetičke sredine populacije iz aritmetičke sredine samo jednog uzorka iz populacije

  27.  Standardna devijacija je mjera individualne varijabilnosti podataka dobivenih jednim uzorkovanjem oko njihove aritmetičke sredine, dok standardna pogreška govori za varijabilnost aritmetičkih sredina tijekom budućih uzorkovanja.  SE je uvijek manja od SD, tim više što je broj uzoraka N veći, ali veza nije linearna: da bi SE smanjili na polovicu, potrebno je broj uzoraka učetverostručiti (ne udvostručiti).  Ako je populacijska raspodjela varijable normalna, isto vrijedi i za raspodjelu aritmetičkih sredina uzoraka iz populacije. Štoviše, ako su uzorci iz populacije dovoljno veliki, njihove aritmetičke sredine slijede normalnu raspodjelu bez obzira na populacijsku raspodjelu varijable.

More Related