1 / 20

Obrada empirijskih podataka

Obrada empirijskih podataka. deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi osnovnih parametara osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih ljestvica) se mogu klasificirati na:

jetta
Download Presentation

Obrada empirijskih podataka

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Obrada empirijskih podataka • deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi osnovnih parametara • osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih ljestvica) se mogu klasificirati na: • Kvalitativne: nominalne (Da, Ne, Dobar, Loš...), ordinalne (rangovi) • Kvantitativne: diskretne (cjelobrojne vrijednosti, pobrojane), kontinuirane (neprekinute, mjerene) Diskretne varijable – nastaju prebrojavanjem Kontinuirane varijable – nastaju mjerenjem

  2. Grafička obrada empirijskih podataka • vrste grafičkih prikaza: • Histogram (‘bar chart’) – prikazivanje učestalosti podataka stupićima te povezivanje vrhova u poligon frekvencija Primjer: • histogramski prikaz za diskretnu varijablu • direktno očitavanje vjerojatnosti pojave pojedine • vrijednosti varijable • histogramski prikaz za kontinuiranu varijablu • prikaz preko razreda podataka po kojima klasificiramo podatke • u tehnici se radi sa razredima jednake veličine (širine)

  3. kumulanta – histogramski prikaz frekvencija koje se kumuliraju od najnižega ka najvišem razredu • mogućnost prikaza relativnih frekvencija (u %) na ordinati • ‘Box- whisker’ prikaz (prikaz ‘kutija – brkovi’) – jedno od najčešćih prikaza podataka Primjer: • ‘box-whisker’ prikaz za kontinuiranu varijablu • prikaz je moguće kreirati u različitim verzijama • (središnja točka medijan/aritmetička sredina, • podjela po percentilima/intervalima povjerenja...) • jednostavna dijagnostika problematičnih podataka • (ekstrema, ‘outliera’) • mogućnost prikazivanja dva ili više uzoraka • paralelno te brzo dijagnosticiranja njihovih relacija i • karakteristika

  4. ‘Stem-leaf’ prikaz (prikaz ‘stabljika - list’) Primjer: • prikaz ‘stabljika-list’ se najčešće koristi na • podacima koji su u decimalnom obliku gdje • se znamenka cijelog broja prikazuju kao • stabljika a decimalni dio kao ‘list’ • Ostali prikazi: • ‘Individual plot’, • ‘Scatter plot’, • ‘Line plot’, • ‘Dot plot’ , • ‘Marginal plot’ , • ‘Area plot’, • ‘Pie chart’ • ‘Normal probability plot’, • ...

  5. Primjer grafičke analize podataka: Na jednom uzorku izmjerene su vrijednosti vlačne čvrstoće šarže čeličnog lima (u N/mm2). Nakon mjerenja dobiveni su sljedeći podaci: 430, 440, 450, 460, 440, 430, 410, 410 440, 440, 430, 440, 420, 450, 430, 450 420, 440, 420, 450, 410, 440, 460, 430

  6. Numerička obrada empirijskih podataka • MJERE POLOŽAJA • aritmetička sredina – suma svih elemenata u populaciji podijeljena sa brojem • elemenata populacije (težište – paralela sa mehaničkim modelom) najvažnije svojstvo aritmetičke sredine: • mod – podatak(ili razred) koji ima najveću frekvenciju • - mod dijeli distribuciju frekvencija na rastuću i padajuću stranu • - vrste distribucija s obzirom na mod

  7. medijan – 50% podataka je manje, a 50% veće od te vrijednosti • kvantili - vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na • q jednakihdijelova Medijan Kvartili Decili Percentili

  8. MJERE RASIPANJA • standardna devijacija σ – prosječno odstupanje svakog podatka od arit. sredine • varijanca σ2 – prosječno kvadratno odstupanje svakog podatka od arit. sredine • nepristrana procjena varijance osnovnog skupa (σo2) : • koeficijent varijacije, V – međusobno uspoređivanje varijabilnosti pojava ili svojstava • - pokazuje koliki odnos vrijednosti aritm. sredine iznosi vrijednost standardne devijacije (u %) koeficijent varijacije (relativna mjera rasipanja) • raspon, Rx – razlika najveće i najmanje vrijednosti u nekom nizu podataka

  9. MOMENTI STATISTIČKIH SKUPOVA • mehanički model - greda, oslonac i opterećenje ( x1,x2, ... – jedinične sile) x1 x2 x3 x4 x5 x6 x7 0 • centralni moment r-tog reda – moment oko centra (aritmetička sredina): r=0 M0=1 r=1 M1=0 r=2 M2=σ2 r=3 M3 r=4 M4 varijanca koeficijent asimetrije koeficijent spljoštenosti • pomoćni moment r-tog reda – moment oko točke 0 r=0 m0=1 r=1 m1= aritmetička sredina

  10. svaki |α3|: 0 - 0,25 zanemariva asimetrija 0,25 – 0,50 slaba asimetrija 0,50 – 0,75 srednja asimetrija 0,75 - + jaka asimetrija • MJERE OBLIKA STATISTIČKOG SKUPA • koeficijent asimetrije (Skewness) – mjera nagnutosti distribucije na lijevu ili desnu stranu pozitivna asimetrije α3>0 nema asimetrije α3=0 negativna asimetrija α3<0

  11. koeficijent spljoštenosti (Kurtosis)– mjera spljoštenosti (zaobljenosti) distribucije • normiranje na nulu (jednostavnije očitavanje) spljoštenost α4<3 (α’4<0) normalna spljoštenost α4=3 (α’4=0) izduženost α4>3 (α’4>0)

  12. Primjer dva skupa: • sa istim očekivanjem a različitom varijancom • sa istim očekivanjem i varijancom ali različitim elementima

  13. OPĆI SLUČAJ ZA DISKRETNE I KONTINUIRANE VARIJABLE • diskretne varijable: očekivanje varijanca • vjerojatnost diskretne varijable: učestalost vjerojatnost • funkcija distribucije F(x) diskretne varijable (kumulanta):

  14. zbrajanja frekvencija (kumuliranje)

  15. kontinuirane varijable: očekivanje očekivanje varijanca • funkcija gustoće vjerojatnosti (kontinuirana varijabla): • svojstva f.g.v. :

  16. funkcija distribucije vjerojatnosti (kontinuirana varijabla): povezanost f.g.v. i funkcije distribucije

  17. Primjer: Sljedeći podaci prezentiraju temperature ‘O-ring’ brtvi raketnog motora prilikom testiranja sustava paljenja: 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 73, 70, 57, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 75, 76, 58, 31. Potrebno je odrediti sve osnovne statističke parametre i grafički prikazati podatke.

  18. Razdioba aritmetičkih sredina i centralni granični teorem • uzorkovanjem i analizom zaključujemo što se događa u osnovnom skupu • uzorak mora biti sličan osnovnom skupu

  19. razdioba aritmetičke sredine uzoraka se vrlo brzo približava normalnoj raspodjeli neovisno o vrsti raspodjele u osnovnom skupu ako veličina uzorka n teži u beskonačnost Primjer: Bacaju se igrače kocke. Nakon bacanja crta se distribucija prosječnih vrijednosti. Nakon ‘dovoljno’ (n>30) bacanja može se smatrati da se distribucija aritm. sredina ponaša po normalnoj distribuciji.

  20. Nepristrane procjene parametara osnovnog skupa (populacije) • aritmetička sredina: • procjena očekivanja E(x)=µ osnovnog skupa – baza za intervalnu procjenu očekivanja • nepristrana procjena varijance: • procjena varijance osnovnog skupa (σo2) • intervalna procjena varijance osnovnog skupa: • nepristrana procjena standardne pogreške aritmetičke sredine:

More Related