E N D
Prikupljanje podataka o obilježjima svih jednica statističkog skupa često je preskupo ili zahtijeva previše vremena, a katkad nije ni moguće, ako je on npr. beskonačan – u takvim slučajevima vrši se reprezentativno promatranje kojim se obuhvaća samo dio jedinica statističkog skupa • Pojava koja se želi upoznati ili istražiti tom metodom zove se populacija ili osnovni skup, a njezin dio koji se u tu svrhu ispituje zove se uzorak • Uzorak je reprezentativan ako po svojim osnovnim karakteristikama nalikuje na osnovni skup (umanjena slika osnovnog skupa)
Nužno je sastaviti jasan i precizan plan odabira elemenata u uzorak • Plan sadrži: • ciljeve istraživanja, • određivanje statističkih skupova - utvrditi što je jedinica skupa, opseg skupa, definirati skup pojmovno, prostorno i vremenski • određivanje okvira izbora: • popis jedinica osnovnog skupa iz kojeg se izabire uzorak, npr. registri poslovnih subjekata ili • popis jedinica izbora uzoraka koje obuhvaćaju više elemenata osnovnog skupa, npr., istražujemo li pomoću uzorka stavove punoljetnog pučanstva, jedinica izbora može biti osoba, ali i kućanstvo ili stambena zgrada
podatke koje treba prikupiti, • model uzorka (nacrt, dizajn): • troškovi, • osobitosti osnovnih skupova, • način izbora elemenata u uzorak za svaki izbor • utvrđuju se izrazi za statističko-analitičke veličine iz uzorka, među kojima su i izrazi za veličine pogrešaka zbog primjene uzorka • raspoloživa sredstva, • postupke prikupljanja podataka
Uzorkom se dolazi do procjenekarakteristika osnovnog skupa, a statističkom metodom određuje se pouzdanost i preciznost te procjene – svi ti postupci čine metodu koja se zove metoda uzorakaili reprezentativna metoda • S obzirom na način izbora jedinica, razlikuje se: NAMJERNI UZORAK • izabiru se jedinice prema odluci istraživača (anketara) • ispituju se dostupni članovi skupa • izabiru se jedinice u sklopu kvota Ne može se brojčano izraziti veličina pogreške, pa se primjenjuju metode deskriptivne statistike
SLUČAJNI UZORAK • svaki član skupa ima vjerojatnost izbora u uzorak veću od nule • podaci se analiziraju prema načelima inferencijalne statistike (procjenjuju se nepoznati parametri i testiraju hipoteze o njima i oblicima rasporeda osnovnih skupova) • mogu se izračunati pogreške nastale primjenom uzorka – važno za prosudbu kakvoće zaključivanja
PROCJENA ARITMETIČKE SREDINE OSNOVNOG SKUPA • AS osnovnog skupa μ je parametar koji se procjenjuje: • Brojem npr. zanimaju li nas prosječna primanja stanovnika nekog područja, možemo izabrati uzorak od n stanovnika tog područja, izračunati AS uzorka i zaključiti da su ona istovjetna prosječnim primanjima stanovnika cijelog područja • Intervalom formiramo interval određene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. veća je vjerojatnost da će se u njemu naći AS osnovnog skupa
Interval procjene AS populacije gradimo tako da AS uzorka s jedne strane dodamo, a s druge strane oduzmemo stanoviti broj zistandardnih pogrešaka procjene – broj ovisi o željenoj pouzdanosti intervalne procjene • Broj zi se naziva koeficijent pouzdanosti procjene(koeficijent povjerenja) • Najčešće se formiraju intervali procjene s 95%-tnom pouzdanosti, a u tom slučaju koeficijent povjerenja iznosi 1.96 (očitava se iz tablice površine ispod normalne krivulje: 0.95 : 2 = 0.4750)
Interval procjene AS glasi: Središnja točka intervala je AS uzorka x oko koje se gradi interval, sa željom da se u njemu nađe AS populacije μ P = pouzdanost γ (gama) = vjerojatnost pogreške u procjeni AS populacije (1 γ) = pouzdanost intervalne procjene
Osim koeficijenta povjerenja, mora se izračunati i standardna pogreška AS. U izrazima za njezino računanje koriste se sljedeći simboli: = standardna pogreška procjene AS populacije σ = standardna devijacija populacije (ako je otprilike poznata) s = standardna devijacija uzorka = standardna devijacija populacije procijenjena pomoću uzorka N = opseg populacije n = opseg uzorka f = frakcija izbora. To je odnos veličine uzorka i veličine populacije, tj. f = n / N. Recipročna vrijednost frakcije izbora N / n zove se korak izbora
za uzorkeveće od 30 jedinica koeficijent pouzdanosti z uzimamo iz tablice površina ispod normalne razdiobe: z = 1.96 (uz 95% pouzdanosti procjene) z = 2.58 (uz 99% pouzdanosti procjene) • za uzorkemanje od 30 jedinica koeficijent pouzdanosti z ne možemo uzeti iz tablice površina ispod normalne razdiobe već ga uzimamo iz Studentove tablice za k = n 1 stupnjeva slobode, uz željenu vjerojatnost procjene (najčešće 0.95 ili 0.99)
studentova distribucija tabelirana je tako da se iz tablice očitava koeficijent t za određenu proporciju jedinica koje se odbacuju s njezina desnog kraja • u pretkoloni tablice su navedeni stupnjevi slobode, a u zaglavlju su koeficijenti t za proporcije jedinica 0.10, 0.05, 0.025, 0.01 i 0.005 smještenih na desnom kraju distribucije • želimo li npr. napraviti intervalnu procjenu AS populacije s 95% pouzdanosti, moramo formirati interval takve širine da se u njemu nađe proporcija od 0.95 jedinica Studentove distribucije. U tom je slučaju proporcija preostalih jedinica smještenih na krajevima distribucije 1 0.95 = 0.05. Na desnom kraju distribucije se tada nalazi proporcija jedinica 0.05 : 2 = 0.025 pa ćemo traženi koeficijent pouzdanosti naći u stupcu t.025 i u retku koji odgovara broju stupnjeva slobode u konkretnom slučaju (veličini uzorka umanjenoj za jedan)
želimo li npr. intervalnu procjenu s 95%-tnim povjerenjem, a uzorak je veličine 20, traženi se koeficijent pouzdanosti (povjerenja) nalazi u tabeli Kritične vrijednosti t, Studentove distribucije na presjeku 19. retka i stupca t.025 i iznosi 2.093
PRIMJER 1. Na otoku koji ima 1620 domaćinstava slučajno smo izabrali 100 domaćinstava i zabilježili za svako od njih koliko hektara obradive zemlje posjeduje. Izračunali smo aritmetičku sredinu tog uzorka koja je iznosila 1.83 ha. Pomoću standardne devijacije tog uzorka procijenili smo standardnu devijaciju populacije i dobili s = 1.36 ha. Izračunajte s 99% pouzdanosti kolika je prosječna površina obradive zemlje svih domaćinstava na tom otoku. N = 1620, n = 100, x = 1.83, = 1.36, 99% pouzdanosti z = 2.58 > 0.05
Traženi je interval procjene: Prosječna površina obradive zemlje na promatranom otoku nalazi se između 1.49 ha i 2.17 ha uz 99% pouzdanosti
PRIMJER 2. Od 186 elemenata jednog osnovnog skupa slučajno smo izabrali 20 jedinica. Aritmetička sredina tog uzorka iznosi 2.5, a standardna devijacija je 1.204. Uz 95% pouzdanosti procijenite aritmetičku sredinu promatrane populacije. N = 186, n = 20, x = 2.5, s = 1.36, 95% pouzdanosti t= 2.093 > 0.05
Traženi je interval procjene: AS promatrane populacije nalazi se između 1.96 i 3.04 uz 95% pouzdanosti
PROCJENA TOTALA OSNOVNOG SKUPA • TotalT je zbroj vrijednosti numeričke varijable konačnog osnovnog skupa. Ako konačni osnovni skup ima N elemenata, tada je AS populacije: odatle slijedi da se u procjeni totala populacije može pogriješiti N puta onoliko koliko se griješi u procjeni njezine AS
kao procjena totala populacije brojem (simbol ) služi nam AS uzorka pomnožena opsegom populacije, tj. • za intervalnu procjenu totala potrebna je i standardna pogreška totala (simbol )
interval procjene totala osnovnog skupa glasi: ili, za mali uzorak (n < 30):
PRIMJER 3. U svrhu ispitivanja vremena potrebnog za dolazak na rad, od 915 djelatnika jedne tvrtke anketirano je 150 osoba. Pomoću tog uzorka dobiveni su ovi rezultati: prosječno vrijeme je 47 minuta, a standardna pogreška AS uzorka 0.0747. Izračunajte 99% pouzdan interval procjene totala osnovnog skupa, tj. ukupno vrijeme potrebno za dolazak na rad svih djelatnika promatrane tvrtke. N = 915, n = 150, x = 47, = 0.0747 99% pouzdanosti z = 2.58
Interval procjene: Ukupno vrijeme potrebno za dolazak na rad svih djelatnika promatrane tvrtke nalazi se između 42829 minuta i 43181 minuta uz 99% pouzdanosti
PROCJENA TOTALA OSNOVNOG SKUPA • Proporcija konačnog osnovnog skupa je parametar koji označava omjer članova skupa s određenim oblikom obilježja M i opsega skupa N, tj. • proporciju preostalih N M jedinica koje nemaju traženo obilježje označavamo sa q: Vrijedi: p + q = 1
procjenitelj proporcije osnovnog skupa brojem je proporcija uzorka: , gdje je m broj članova uzorka s određenim oblikom obilježja, a n veličina uzorka • Standardna pogreška računa se pomoću izraza: ako je f < 0.05 ako je f ≥ 0.05
interval procjene proporcije za velike uzorke: • za male uzorke procjenjivanje na ovakav način nije moguće • kao kriterij za dovoljnu veličinu uzorka može se primijeniti pravilo: > 9
PRIMJER 4. Građevinski poduzetnik treba preuzeti pošiljku od 5000 keramičkih pločica. Među 200 pločica, izabranih na slučajan način iz pošiljke, nađeno je 40 pločica druge klase. Uz pouzdanost od 90% procijenite proporciju pločica druge klase u cijeloj pošiljci. Kako je tražena pouzdanost 90% , iz tablice za površinu ispod normalne krivulje treba očitati koeficijent pouzdanosti z za površinu koja iznosi polovinu pouzdanosti, tj. za 0.90 : 2 = 0.45. Među površinama navedenim u tablicama nema površine koja iznosi točno 0.45, pa ćemo potražiti onu koja je najbliža tom broju. U ovom su slučaju to dvije površine: 0.4495 i 0.45053, pa se možemo odlučiti ili za z = 1.64 ili z = 1.65
< 0.05 • Konstruirat ćemo interval pouzdanosti s koeficijentom z = 1.64 • interval pouzdanosti: Uz pouzdanost 90% procjenjujemo da se udio pločica druge klase u cijeloj pošiljci kreće između 17.2 i 22.8%