210 likes | 609 Views
Obrada empirijskih podataka. deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi osnovnih parametara osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih ljestvica) se mogu klasificirati na:
E N D
Obrada empirijskih podataka • deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi osnovnih parametara • osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih ljestvica) se mogu klasificirati na: • Kvalitativne: nominalne (Da, Ne, Dobar, Loš...), ordinalne (rangovi) • Kvantitativne: diskretne (cjelobrojne vrijednosti, pobrojane), kontinuirane (neprekinute, mjerene) Diskretne varijable – nastaju prebrojavanjem Kontinuirane varijable – nastaju mjerenjem
Grafička obrada empirijskih podataka • vrste grafičkih prikaza: • Histogram (‘bar chart’) – prikazivanje učestalosti podataka stupićima te povezivanje vrhova u poligon frekvencija Primjer: • histogramski prikaz za diskretnu varijablu • direktno očitavanje vjerojatnosti pojave pojedine • vrijednosti varijable • histogramski prikaz za kontinuiranu varijablu • prikaz preko razreda podataka po kojima klasificiramo podatke • u tehnici se radi sa razredima jednake veličine (širine)
kumulanta – histogramski prikaz frekvencija koje se kumuliraju od najnižega ka najvišem razredu • mogućnost prikaza relativnih frekvencija (u %) na ordinati • ‘Box- whisker’ prikaz (prikaz ‘kutija – brkovi’) – jedno od najčešćih prikaza podataka Primjer: • ‘box-whisker’ prikaz za kontinuiranu varijablu • prikaz je moguće kreirati u različitim verzijama • (središnja točka medijan/aritmetička sredina, • podjela po percentilima/intervalima povjerenja...) • jednostavna dijagnostika problematičnih podataka • (ekstrema, ‘outliera’) • mogućnost prikazivanja dva ili više uzoraka • paralelno te brzo dijagnosticiranja njihovih relacija i • karakteristika
‘Stem-leaf’ prikaz (prikaz ‘stabljika - list’) Primjer: • prikaz ‘stabljika-list’ se najčešće koristi na • podacima koji su u decimalnom obliku gdje • se znamenka cijelog broja prikazuju kao • stabljika a decimalni dio kao ‘list’ • Ostali prikazi: • ‘Individual plot’, • ‘Scatter plot’, • ‘Line plot’, • ‘Dot plot’ , • ‘Marginal plot’ , • ‘Area plot’, • ‘Pie chart’ • ‘Normal probability plot’, • ...
Primjer grafičke analize podataka: Na jednom uzorku izmjerene su vrijednosti vlačne čvrstoće šarže čeličnog lima (u N/mm2). Nakon mjerenja dobiveni su sljedeći podaci: 430, 440, 450, 460, 440, 430, 410, 410 440, 440, 430, 440, 420, 450, 430, 450 420, 440, 420, 450, 410, 440, 460, 430
Numerička obrada empirijskih podataka • MJERE POLOŽAJA • aritmetička sredina – suma svih elemenata u populaciji podijeljena sa brojem • elemenata populacije (težište – paralela sa mehaničkim modelom) najvažnije svojstvo aritmetičke sredine: • mod – podatak(ili razred) koji ima najveću frekvenciju • - mod dijeli distribuciju frekvencija na rastuću i padajuću stranu • - vrste distribucija s obzirom na mod
medijan – 50% podataka je manje, a 50% veće od te vrijednosti • kvantili - vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na • q jednakihdijelova Medijan Kvartili Decili Percentili
MJERE RASIPANJA • standardna devijacija σ – prosječno odstupanje svakog podatka od arit. sredine • varijanca σ2 – prosječno kvadratno odstupanje svakog podatka od arit. sredine • nepristrana procjena varijance osnovnog skupa (σo2) : • koeficijent varijacije, V – međusobno uspoređivanje varijabilnosti pojava ili svojstava • - pokazuje koliki odnos vrijednosti aritm. sredine iznosi vrijednost standardne devijacije (u %) koeficijent varijacije (relativna mjera rasipanja) • raspon, Rx – razlika najveće i najmanje vrijednosti u nekom nizu podataka
MOMENTI STATISTIČKIH SKUPOVA • mehanički model - greda, oslonac i opterećenje ( x1,x2, ... – jedinične sile) x1 x2 x3 x4 x5 x6 x7 0 • centralni moment r-tog reda – moment oko centra (aritmetička sredina): r=0 M0=1 r=1 M1=0 r=2 M2=σ2 r=3 M3 r=4 M4 varijanca koeficijent asimetrije koeficijent spljoštenosti • pomoćni moment r-tog reda – moment oko točke 0 r=0 m0=1 r=1 m1= aritmetička sredina
svaki |α3|: 0 - 0,25 zanemariva asimetrija 0,25 – 0,50 slaba asimetrija 0,50 – 0,75 srednja asimetrija 0,75 - + jaka asimetrija • MJERE OBLIKA STATISTIČKOG SKUPA • koeficijent asimetrije (Skewness) – mjera nagnutosti distribucije na lijevu ili desnu stranu pozitivna asimetrije α3>0 nema asimetrije α3=0 negativna asimetrija α3<0
koeficijent spljoštenosti (Kurtosis)– mjera spljoštenosti (zaobljenosti) distribucije • normiranje na nulu (jednostavnije očitavanje) spljoštenost α4<3 (α’4<0) normalna spljoštenost α4=3 (α’4=0) izduženost α4>3 (α’4>0)
Primjer dva skupa: • sa istim očekivanjem a različitom varijancom • sa istim očekivanjem i varijancom ali različitim elementima
OPĆI SLUČAJ ZA DISKRETNE I KONTINUIRANE VARIJABLE • diskretne varijable: očekivanje varijanca • vjerojatnost diskretne varijable: učestalost vjerojatnost • funkcija distribucije F(x) diskretne varijable (kumulanta):
kontinuirane varijable: očekivanje očekivanje varijanca • funkcija gustoće vjerojatnosti (kontinuirana varijabla): • svojstva f.g.v. :
funkcija distribucije vjerojatnosti (kontinuirana varijabla): povezanost f.g.v. i funkcije distribucije
Primjer: Sljedeći podaci prezentiraju temperature ‘O-ring’ brtvi raketnog motora prilikom testiranja sustava paljenja: 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 73, 70, 57, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 75, 76, 58, 31. Potrebno je odrediti sve osnovne statističke parametre i grafički prikazati podatke.
Razdioba aritmetičkih sredina i centralni granični teorem • uzorkovanjem i analizom zaključujemo što se događa u osnovnom skupu • uzorak mora biti sličan osnovnom skupu
razdioba aritmetičke sredine uzoraka se vrlo brzo približava normalnoj raspodjeli neovisno o vrsti raspodjele u osnovnom skupu ako veličina uzorka n teži u beskonačnost Primjer: Bacaju se igrače kocke. Nakon bacanja crta se distribucija prosječnih vrijednosti. Nakon ‘dovoljno’ (n>30) bacanja može se smatrati da se distribucija aritm. sredina ponaša po normalnoj distribuciji.
Nepristrane procjene parametara osnovnog skupa (populacije) • aritmetička sredina: • procjena očekivanja E(x)=µ osnovnog skupa – baza za intervalnu procjenu očekivanja • nepristrana procjena varijance: • procjena varijance osnovnog skupa (σo2) • intervalna procjena varijance osnovnog skupa: • nepristrana procjena standardne pogreške aritmetičke sredine: