310 likes | 727 Views
Osnove statistike. Kombinatorika i vjerojatnost Obrada empirijskih podataka Mjere položaja i rasipanja. Kombinatorika. Slučajni događaj – događaj koji se pod nekim okolnostima može ali i ne mora dogoditi. Služe pri određivanju vjerojatnosti slučajnih događaja Modeli u kombinatorici:
E N D
Osnove statistike • Kombinatorika i vjerojatnost • Obrada empirijskih podataka • Mjere položaja i rasipanja
Kombinatorika • Slučajni događaj – događaj koji se pod nekim okolnostima može ali i ne mora dogoditi. Služe pri određivanju vjerojatnosti slučajnih događaja • Modeli u kombinatorici: • Permutacije (bez ponavljanja i s ponavljanjem) • Varijacije (bez ponavljanja i s ponavljanjem) • Kombinacije • Složene kombinacije
Permutacije • permutacije bez ponavljanja: • niz n istovrsnih elemenata kojima se određuje broj mogućih redoslijeda (poređaja) Primjer: Na koliko se načina može poredati niz od 4 kuglice različite boje? • permutacije s ponavljanjem: • niz n istovrsnih elemenata među kojima postoje određene podgrupe - određuje se broj mogućih redoslijeda (poređaja) Primjer: Na koliko se načina može poredati niz od 6 kuglica (2 crvene, 2 plave te zelena i žuta)?
Varijacije • varijacije bez ponavljanja: • niz n istovrsnih elemenata iz kojeg se uzima uzorak r te se određuje broj različitih (mogućih) ishoda Primjer: Koliko različitih uzoraka od po 3 kuglice možemo složiti iz skupa od 5 kuglica? • varijacije s ponavljanjem: • niz n istovrsnih elemenata iz kojeg se uzima uzorak r te se određuje broj različitih (mogućih) ishoda s mogućnošću ponavljanja elemenata iz skupa n do maksimalno r-puta Primjer: Igranje sportske prognoze. Na koliko se načina može ispuniti listić sportske prognoze ako se na listiću nalazi 12 parova, a mogući ishodi su 1,0 i 2?
Kombinacije • kombinacije bez ponavljanja – (s ponavljanjem nemaju smisla): • niz n istovrsnih elemenata iz kojeg se uzima uzorak od r elemenata te se određuje broj različitih (mogućih) sastava uzorka gdje nije bitan redoslijed već sadržaj (sastav) Primjer: Koliko treba ispuniti nizova da bi se u LOTU 7/39 sigurno dobila ‘sedmica’? NAPOMENA: budući da nije bitan redoslijed odabiranja (izvlačenja) kuglica radi se o kombinacijama.
Složene kombinacije • složene kombinacije – skup od N elemenata sadrži podskup elemenata sa svojstvom A i podskup elemenata sa svojstvom Ā (non A) N SKUP (N-M) (Ā) M (A) UZORAK n x el A (n-x) el Ā
Vjerojatnost • Slučajni događaj – događaj koji se pod nekim okolnostima može a i ne mora dogoditi • Elementarni događaj – mogući ishod slučajnog događaja • Skup (polje) mogućih događaja – skup koji se sastoji od elementarnih događaja • Vjerojatnost – mogućnost pojave nekog elementarnog događaja koji se promatra n – broj svih mogućih ishoda (događaja) n(A) – broj događaja sa svojstvom A - nemoguć događaj - siguran događaj • Protivna vjerojatnost
Primjer: Bacamo kocku. Kolika je vjerojatnost da će kocka pokazati broj 2 ili 4 ili 6? • Teoremi vjerojatnosti (slučaj složenih događaja): • zbrajanje vjerojatnosti - P(A1) ili P(A2) • zanima nas vjerojatnost da se dogodi A1 ili A2 • uz uvjet da su događaji A1 i A2 disjunktni (međusobno se isključuju) • množenje vjerojatnosti(NEZAVISNI DOGAĐAJI)- P(A1) i P(A2) • zanima nas vjerojatnost događaja da se dogodi A1 i A2 (istovremeno) Primjer: Bacamo kocku i novčić. Kolika je vjerojatnost da će kocka pokazati broj 6 i novčić pasti na ‘glavu’?
množenje vjerojatnosti(UVJETNI DOGAĐAJI)- P(A1) i P(A2) • zanima nas vjerojatnost događaja da se realizira A1 i A2 • jedan događaj utječe na vjerojatnost drugog događaja Primjer: U kutiji je 10 kuglica, 6 bijelih i 4 crvene kuglice. Kolika je vjerojatnost da prva i druga kuglica budu bijele ako izvučenu kuglicu ne vraćamo u kutiju? A1 - prva kuglica bijela A2 – druga kuglica bijela • ostale vjerojatnosti - uvjet da se elementarni događaji ne isključuju te da se dogodi bar jedan događaj • slučaj kada tražimo vjerojatnost pojave događaja A1 ili A2 ili A1 i A2. Takova vjerojatnost se računa na način da se od sume vjerojatnosti za događaje A1 , A2 oduzme vjerojatnost događaja A1 i A2 istovremeno (izbjegavanje dvostruke vjerojatnosti).
Upotreba teorije vjerojatnosti na primjerima iz prakse • Slučaj serijskog spoja – problem vezan za pouzdanost sustava Primjer: Pojednostavljen slučaj vjerojatnosti pogotka cilja projektilom. Projektil na putu do cilja prolazi kroz faze koje imaju svoju vjerojatnost uspjeha. Vjerojatnost uspješnog pogotka cilja se može prikazati kao serijski spoj faza (vjerojatnosti uspjeha svake faze). Svaka faza ima vjerojatnost uspjeha 0,99. Kolika je vjerojatnost uspješnog pogotka cilja? Za uspješan pogodak projektil mora uspješno proći sve faze. Radi se o serijskom spoju (množenju vjerojatnosti).
Slučaj paralelnog spoja – problem vezan za pouzdanost sustava Primjer: U kritičnom dijelu nekoga procesa važno je da je barem jedna pumpa u stanju ispravnog rada kako ne bi došlo do zastoja. Ako su vjerojatnosti ispravnog rada (pouzdanost) svake pumpe R=0,99 kolika je vjerojatnost da sustav funkcionira ispravno? Budući da je P(ispravnog rada)+P(zastoja)=1 možemo pisati sljedeće:
Obrada empirijskih podataka • deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi osnovnih parametara, identifikacija procesa • osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih ljestvica) se mogu klasificirati na: • Kvalitativne: nominalne (Da, Ne ; Dobar, Loš...), ordinalne (rangovi) • Kvantitativne: diskretne (cjelobrojne vrijednosti, pobrojane), kontinuirane (neprekinute, mjerene) Diskretne varijable – nastaju prebrojavanjem Kontinuirane varijable – nastaju mjerenjem
Grafička obrada empirijskih podataka • vrste grafičkih prikaza: • Histogram (‘bar chart’) – prikazivanje učestalosti podataka stupićima te povezivanje vrhova u poligon frekvencija Primjer: • histogramski prikaz za diskretnu varijablu • direktno očitavanje vjerojatnosti pojave pojedine • vrijednosti varijable • histogramski prikaz za kontinuiranu varijablu • prikaz preko razreda podataka po kojima klasificiramo podatke • u tehnici se radi sa razredima jednake veličine (širine)
kumulanta – histogramski prikaz frekvencija koje se kumuliraju od najnižega ka najvišem razredu • mogućnost prikaza relativnih frekvencija (u %) na ordinati • ‘Box- whisker’ prikaz (prikaz ‘kutija – brkovi’) – jedno od najčešćih prikaza podataka Primjer: • ‘box-whisker’ prikaz za kontinuiranu varijablu • prikaz je moguće kreirati u različitim verzijama • (središnja točka medijan/aritmetička sredina, • podjela po percentilima/intervalima povjerenja...) • jednostavna dijagnostika problematičnih podataka • (ekstrema, ‘outliera’) • mogućnost prikazivanja dva ili više uzoraka • paralelno te brzo dijagnosticiranja njihovih relacija i • karakteristika
‘Stem-leaf’ prikaz (prikaz ‘stabljika - list’) Primjer: • prikaz ‘stabljika-list’ se najčešće koristi na • podacima koji su u decimalnom obliku gdje • se znamenka cijelog broja prikazuju kao • stabljika a decimalni dio kao ‘list’ • Ostali prikazi: • ‘Individual plot’, • ‘Scatter plot’, • ‘Line plot’, • ‘Dot plot’ , • ‘Marginal plot’ , • ‘Area plot’, • ‘Pie chart’ • ‘Normal probability plot’, • ...
Primjer grafičke analize podataka: Na jednom uzorku izmjerene su vrijednosti vlačne čvrstoće šarže čeličnog lima (u N/mm2). Nakon mjerenja dobiveni su sljedeći podaci: 430, 440, 450, 460, 440, 430, 410, 410 440, 440, 430, 440, 420, 450, 430, 450 420, 440, 420, 450, 410, 440, 460, 430
Numerička obrada empirijskih podataka • MJERE POLOŽAJA • aritmetička sredina – suma svih elemenata u populaciji podijeljena sa brojem • elemenata populacije (težište – paralela sa mehaničkim modelom) najvažnije svojstvo aritmetičke sredine: • mod – podatak(ili razred) koji ima najveću frekvenciju • - mod dijeli distribuciju frekvencija na rastuću i padajuću stranu • - vrste distribucija s obzirom na mod
medijan – 50% podataka je manje, a 50% veće od te vrijednosti • kvantili - vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na • q jednakihdijelova Medijan Kvartili Decili Percentili
MJERE RASIPANJA • standardna devijacija σ – prosječno odstupanje svakog podatka od arit. sredine • varijanca σ2 – prosječno kvadratno odstupanje svakog podatka od arit. sredine • nepristrana procjena varijance osnovnog skupa (σo2) : • koeficijent varijacije, V – međusobno uspoređivanje varijabilnosti pojava ili svojstava • - pokazuje koliki odnos vrijednosti aritm. sredine iznosi vrijednost standardne devijacije (u %) koeficijent varijacije (relativna mjera rasipanja) • raspon, Rx – razlika najveće i najmanje vrijednosti u nekom nizu podataka
MOMENTI STATISTIČKIH SKUPOVA • mehanički model - greda, oslonac i opterećenje ( x1,x2, ... – jedinične sile) x1 x2 x3 x4 x5 x6 x7 • centralni moment r-tog reda – moment oko centra (aritmetička sredina): r=0 M0=1 r=1 M1=0 r=2 M2=σ2 r=3 M3 r=4 M4 varijanca koeficijent asimetrije koeficijent spljoštenosti • pomoćni moment r-tog reda – moment oko točke 0 r=0 m0=1 r=1 m1= aritmetička sredina
svaki |α3|: 0 - 0,25 zanemariva asimetrija 0,25 – 0,50 slaba asimetrija 0,50 – 0,75 srednja asimetrija 0,75 - + jaka asimetrija • MJERE OBLIKA STATISTIČKOG SKUPA • koeficijent asimetrije (Skewness) – mjera nagnutosti distribucije na lijevu ili desnu stranu pozitivna asimetrije α3>0 nema asimetrije α3=0 negativna asimetrija α3<0
koeficijent spljoštenosti (Kurtosis)– mjera spljoštenosti (zaobljenosti) distribucije • normiranje na nulu (jednostavnije očitavanje) spljoštenost α4<3 (α’4<0) normalna spljoštenost α4=3 (α’4=0) izduženost α4>3 (α’4>0)
Primjer dva skupa: • sa istim očekivanjem a različitom varijancom • sa istim očekivanjem i varijancom ali različitim elementima
SLUČAJNA VARIJABLA - DEFINIRANJE • diskretne varijable: očekivanje varijanca • vjerojatnost diskretne varijable: učestalost vjerojatnost • funkcija distribucije F(x) diskretne varijable (kumulanta):
kontinuirane varijable: očekivanje očekivanje varijanca • funkcija gustoće vjerojatnosti (kontinuirana varijabla): • svojstva f.g.v. :
funkcija distribucije vjerojatnosti (kontinuirana varijabla): povezanost f.g.v. i funkcije distribucije
Primjer: Sljedeći podaci prezentiraju temperature ‘O-ring’ brtvi raketnog motora prilikom testiranja sustava paljenja: 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 73, 70, 57, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 75, 76, 58, 31. Potrebno je odrediti sve osnovne statističke parametre i grafički prikazati podatke.