1 / 42

Valentina Mladinov

Valentina Mladinov. Osnove statističke obrade I dio. SADRŽAJ. I dio Što je statistika i čime se bavi? Reprezentativni uzorak Vjerojatnost Srednja vrijednost II dio Mjere disperzije Normalna i druge raspodjele Statistička značajnost. STATISTIKA.

annot
Download Presentation

Valentina Mladinov

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Valentina Mladinov Osnove statističke obrade I dio

  2. SADRŽAJ I dio Što je statistika i čime se bavi? Reprezentativni uzorak Vjerojatnost Srednja vrijednost II dio Mjere disperzije Normalna i druge raspodjele Statistička značajnost

  3. STATISTIKA • Začeci u praktičnom pitanju – vjerojatnost pogotka/dobitka u igrama na sreću • - Girolamo Cardano (1560) – “Knjiga o igrama kockom” • Galileo Galilei (1620) – “Razmišljanja o igrama kockom” • Blaise Pascal (oko 1655)

  4. Statistički način mišljenja jednog će dana za svakodnevni život građana postati jednako neophodan kao znanje čitanja i pisanja H.G.Wells (1866-1946)

  5. TEORIJA VJEROJATNOSTI • Bavi se slučajnim događajima • KONTINUUM 0 – 1 0 – APSOLUTNA NEMOGUĆNOST 0.5 – JEDNAKA MOGUĆNOST ZA OBA ISHODA 1.0 APSOLUTNA SIGURNOST

  6. STATISTIKA = grana primjenjene matematike koja se bavi prikupljanjem, obradom, interpretacijom i prezentacijom podataka = obrada brojčanih podataka radi jasnijeg prikazivanja (Boris Petz)

  7. STATISTIKA DESKRIPTIVNA STATISTIKA: • bavi se opisavanjem prikupljenih podataka dobivenih prilikom ispitivanja ili mjerenja • sređivanje i sažimanje podataka kako bi bili što pregledniji • (npr. aritmetička sredina; standardna devijacija) ? Koje je prosječno vrijeme inkubacije gripe XYZ ? ? Koliko je veliki varijabilitet ? ? Gdje se pojedini rezultat nalazi u odnosu na sve ostale rezultate ? ? Kako se određena pojava raspoređuje u prirodi (oblik distribucije) ?

  8. INFERENCIJALNA STATISTIKA: • služi analizi uzoraka i pronalaženju pravilnosti ili razlika unutar ili među uzorcima • omogućuje nam stvaranje zaključaka (smijemo li generalizirati iz konkretnog uzorka na opću zakonitost) - (npr. hipoteza, otkrivanje veza među varijablama, modeliranje odnosa ili sličnih postupaka poput analize varijance, faktorske analize... ) ! REPREZENTATIVNOST UZORKA

  9. UZORAK - POPULACIJA Najčešće nismo u mogućnosti ispitati/mjeriti neku pojavu na populaciji (često je populacija beskonačna) → ispitujemo UZORAK, koji mora biti reprezentativan

  10. REPREZENTATIVNI UZORAK • Uzorak mora dobro odražavati populaciju (u njemu moraju biti zastupljene sve karakteristike populacije) • Reprezentativnost uzorka ovisi o: - veličini uzorka - odabir uzorka (najčešće: slučajni) - varijabilnost pojave

  11. VELIČINA UZORKA OVISI O: 1. ŽELJENOJ PRECIZNOSTI REZULTATA (veća preciznost → veći uzorak) 2. VARIJABILNOSTI POJAVE (veći varijabilitet → veći uzorak) 3. FREKVENCIJI POJAVE (rjeđa pojava → veći uzorak)

  12. VJEROJATNOST Za zaključivanje iz uzorka na populaciju presudna je uloga TEORIJE VJEROJATNOSTI

  13. SREDNJE VRIJEDNOSTI • Medijan • Mod • Aritmetička sredina

  14. Medijan (centralna vrijednost) • (C) je vrijednost koja se u nizu rezultata poredanih po veličini nalazi točno u sredini Primjer: Rezultati mjerenja su: 7 9 4 7 8 7 10 6 6 9 8 Poredani po veličini: 4 6 6 7 7 7 8 8 9 9 10 Položaj C = (N + 1) / 2

  15. Medijan (centralna vrijednost) C = (N + 1) / 2 • Ako je broj rezultata paran, računamo aritmetičku sredinu dva srednja rezultata • Medijan se koristi kad imamo i neke ekstremne rezlutate pa aritmetička sredina ne daje pravu sliku

  16. Modalna (dominantna) vrijednost (D) je ona vrijednost koja je u nizu rezultata najčešća (ima najveću frekvenciju) • prednost: na nju utječe samo frekvencija rezultata - Mod se ne može odrediti ako ne postoje najmanje 2 jednake vrijednosti varijable.

  17. Aritmetička sredina • Suma svih rezultata podijeli se s brojem • rezultata • Nema ju smisla računati ako imamo ekstremne rezultate

  18. Harmonijska sredina • Računa se u onim situacijama kada obilježja elemenata jednog skupa stoje u recipročnom odnosu s obilježjem elemenata nekog drugog skupa Primjer: prosječni km/sat, prosječni broj slova u minuti...

  19. Geometrijska sredina • Primjenjuje se u analizi vremenskih nizova • Pomoću nje izračunava se prosječna stopa promjene pojave Primjer: koliko je puta prosječno populacija ljudi u nekom mjestu porasla?

  20. MJERE DISPERZIJE • Srednje vrijednosti nam opisuju skup koji smo izmjerili ali nisu dovoljne • Vrijednosti (rezultati) variraju u zavisnosti od mnogo faktora i slučajnih utjecaja • Npr. dva skupa mogu imati iste aritmetičke sredine ali različite distribucije • Da bismo mogli zaključivati o distribuciji pojave, a time i o populaciji, trebaju nam mjere disperzije (raspršenja)

  21. Mozgalice....

  22. Zabrinjavajući podaci… “Od 1970, postotak ljudi u dobi od 18 do 34 godine koji žive kod kuće sa svojim roditeljima narastao je 48%, od 12.5 milijuna na 18.6 milijuna” (Izvor: USAToday) ?

  23. Najopasnije zanimanje u Hrvatskoj “…u Hrvatskoj je najnesigurnije raditi u građevinarstvu. Naime, prema podacima Inspektorata za prošlu godinu, od ukupno 39 smrtnih slučajeva kao posljedica ozljeđivanja na radu, čak je 17 bilo u građevinarstvu.” Izvor: http://www.tportal.hr/vijesti/hrvatska/80924/Gradevinar-najopasnije-zanimanje-u-Hrvatskoj.html ?

  24. Čudotvorne kreme… ?

  25. Grubi marketing… ?

  26. II dio

  27. MJERE DISPERZIJE • Kada računamo neku srednju vrijednost, želimo da nam ona predstavlja / reprezentira sve naše rezultate • Srednju vrijednost možemo računati samo ako nam se rezultati skupljaju (grupiraju) oko neke srednje vrijednosti → Sama srednja vrijednost nam nije dovoljna, moramo znati i kako se grupiraju rezultati oko te srednje vrijednosti

  28. MJERE DISPERZIJE • Raspon • Srednje odstupanje • Standardna devijacija • Koeficijent varijabilnosti

  29. Raspon = razlika između najvećeg i najmanjeg rezultata - vrlo nesigurna mjera: obično je to veći, što je veći broj mjerenja

  30. Srednje odstupanje = prosječna veličina odstupanja pojedinačnih rezultata, bez obzira na smjer odstupanja srednje odstupanje = | Xi –X | / N • može se računati uz aritmetičku sredinu, medijan i mod (nedovoljan za složenija računanja)

  31. Varijanca / Standardna devijacija • Aritmetička sredina je težište rezultata, tj. vrijednost od koje suma odstupanja iznad i ispod nje uvijek iznosi nula • Kada bismo računali prosječno odstupanje a da vodimo računa o predznaku, onda bismo uvijek dobili nulu • Predznake izbjegnemo tako da ih kvadriramo

  32. Varijanca / Standardna devijacija = zbrojimo kvadrirana odstupanja i izračunamo im aritmetičku sredinu • Varijanca = prosječna suma kvadriranih odstupanja • Korijen iz varijance puno se lakše definira i prikazuje = STANDARDNA DEVIJACIJA

  33. STANDARDNA DEVIJACIJA = drugi korijen iz varijance = drugi korijen iz prosječne sume kvadriranih odstupanja • govori nam koliko dobro aritmetička sredina reprezentira uzorak

  34. Koeficijent varijabilnosti • pokazuje nam koliki postotak vrijednosti aritmetičke sredine iznosi vrijednost standardne devijacije • Služi nam za uspoređivanje varijabilnosti različitih pojava • (npr. u kojem svojstvu neka grupa varira više, a u kojem manje, ili usporedba između 2 različite grupe u istom svojstvu

  35. NORMALNA DISTRIBUCIJA • Normalna distribucija • = Gaussova krivulja • = zvonasta krivulja

  36. video

  37. NORMALNA DISTRIBUCIJA → rezultanta istodobnog djelovanja velikog broja faktora koji djeluju u različitim smjerovima po slučaju i najčešće se poništavaju

  38. UVJETI za dobivanje normalne distribucije • Da se pojava koju mjerimo raspoređuje po normalnoj krivulji • Da imamo veliki broj rezultata (mjerenja) • Da su sva mjerenja standardizirana • Skupina na kojoj obavljamo mjerenja mora biti homogena po svim svojstvima i heterogena samo za ono svojstvo koje mjerimo

  39. NORMALNA DISTRIBUCIJA • Poznavanje aritmetičke sredine i standardne devijacije potpuno nam definira raspodjelu rezultata • znamo na koji dio standardne devijacije pada određeni rezultat, tj. možemo točno odrediti položaj pojedinca u grupi • (z-vrijednosti)

  40. NORMALNA DISTRIBUCIJA

  41. KORELACIJA

More Related