290 likes | 676 Views
osnove teorije uzoraka. Osnove teorije uzoraka. UZORAK: slučajni, reprezentativni dio osnovnog skupa – populacije. Uzorci:. ( ). f x. f x. ( ). razdioba. aritmetičke. sredine uzorka. osnovni. skup. m. x x. ,. x. 1. x. 2. x. 3. x. 4. x. 5. x. 6.
E N D
Osnove teorije uzoraka UZORAK: slučajni, reprezentativni dio osnovnog skupa – populacije Uzorci:
( ) f x f x ( ) razdioba aritmetičke sredine uzorka osnovni skup m x x , x 1 x 2 x 3 x 4 x 5 x 6 Raspon osnovnog skupa Razdioba aritmetičke sredine uzorka osnovni skup: aritm. sredina uzorka:
Nepristrane procjene parametara osnovnog skupa Pojam nepristrane procjene: neka varijabla nepristrano procjenjuje parametar osnovnog skupa Θako vrijedi: dakle: uzorka nepristrano procjenjuje očekivanja osn. skupa dakle: varijanca uzorka nije nepristrana procjena varijance osnovnog skupa dakle: varijabla nepristrano procjenjuje varijancu osnovnog skupa
Standardna pogreška aritmetičke sredine uzorka • Pomoću varijable s2 određuje se • VAŽNO: k = (n – 1)... broj stupnjeva slobode uzorka od n podataka standardna pogreška ar. sredine
Intervalna procjena očekivanja osnovnog skupa interval povjerenja (vjerodostojnosti) varijabla standardizirane normalne razdiobe
Važno: • Veliki uzorci: n > 30 elemenata, podataka • vrijednost varijable z → iz standardizirane normalne razdiobe • Mali uzorci: n ≤ 30 elemenata, podataka • koristiti Studentovu t-razdiobu • Studentova t-razdioba • simetrična • za velike uzorke se ne razlikuje od normalne razdiobe
Konačno: • Za velike uzorke Koristiti standardiziranu (jediničnu) normalnu razdiobu • Za male uzorke Koristiti Studentovu t-razdiobu s parametrom k = n – 1
Primjer: • Podaci utvrđeni u nekom procesu:52.1, 49.0, 51.4, 50.0, 50.3, 49.6, 50.6, 50.8, 51.0, 51.7Intervalno procijeniti očekivanje osnovnog skupa iz kojeg potječe uzorak, uz interval vjerodostojnosti 1 – = 0,95 (95%) • Rezultati dobijeni računanjem, iz uzorka:n = 10; = 50,65; s = 0.96
Opaska • U slučaju kada je poznata standardna devijacija osnovnog skupa, nije nužno korištenje Studentove t-razdiobe kao ni nepristrane procjene standardne pogreške • U tom je slučaju: • Za prethodni primjer:ako prihvatimo da je standardna devijacija osnovnog skupa , slijedi:
Intervalna procjena proporcija • Uzorkovanje nekog dvoslojnog osnovnog skupa (populacije) u kojem neki događaj ima proporciju P rezultiralo bi slučajnom varijablom p, tj. proporcijom istog događaja ali u uzorku: Vrijedi: uz povjerenje (vjerodostojnost) procjene (1 – a)
Važne pretpostavke: • proporcija uzorka • sp ... nepristrana procjena standardne pogreške proporcije uzorka: • n ... veličina uzorka • VRIJEDI SAMO ZA VELIKE UZORKE (n → 100)
Intervalna procjena varijance • Varijance (osobito malih) uzoraka ne rasipaju se normalno oko varijance osnovnog skupa • Vrijedi (K. Pearson, 1857.–1936.) • varijabla rasipa se prema c2 razdiobi s k = n – 1 stupanj slobode uz vjerojatnost (1 – a)
Konačno: uz razinu povjerenja (1 – a)
Testiranje statističkih hipoteza • T.S.H. predstavlja postupak donošenja odluke na bazi uzorka • uzorak, n podataka: x1, x2, ... , xn • rezultati se uzorka mogu shvatiti kao točka u n-dimenzionalnom prostoru • prostor se može podijeliti na dva međusobno disjunktna dijela (koji se isključuju), dio A i dio B U praksi: umjesto n-dimenzionalnog modela služimo se jednodimenzionalnim varijablama (uglavnom).
Postavimo dvije hipotezeH0: nulta hipotezaH1: alternativna hipoteza • Ako se točka T kao realizacija uzorka nađe u dijelu A, smatramo hipotezu H0 ispravnom i prihvaćamo je • Ako se točka T kao realizacija uzorka nađe u dijelu B, smatramo hipotezu H0 neispravnom i odbacujemo je
Pogreške pri testiranju hipoteza • Očito: pri uporabi opisanog modela moguće su pogreške • Uzrok pogrešaka: slučajnost odabira elemenata uzorka! • Vrste pogrešaka: • Pogreška 1. vrste nastaje odbacivanjem nulte hipoteze H0 (i prihvaćanjem alternativne hipoteze H1) iako je hipoteza H0 ispravna: • Vjerojatnost pogreške 1. vrste: • Pogreška 2. vrste nastaje prihvaćanjem hipoteze H0 u uvjetima ispravnosti alternativne hipoteze H1 • Vjerojatnost pogreške 2. vrste:
Jakost testa • Jakost (moć) testa predstavlja vjerojatnost odbacivanja nulte hipoteze kada je uistinu neispravna: • očito: +p = 1 p = 1– ISPRAVNO ODBACIVANJE Ho
Testiranje hipoteza za očekivanje Hipoteze: • Uzorak – osnovni skup, hipoteze • Razdioba aritmetičke sredine uzorka • Studentova razdioba s k = n – 1 st. slob. Pogodna jednodimenzionalna varijabla: Ako je odbaciti Ho, uz vjerojatnost pogreške 1. vrste a ... varijabla Studentove t-razdiobe, k = n – 1 stup. slobode
Primjer: • Podaci iz primjera za intervalnu procjenu očekivanja n = 10; = 50.65; s = 0.96; • Provjeriti hipotezu da je riječ o podacima skupa čije je očekivanje 51.5 jedinica, naprama alternativnoj hipotezi • Vjerojatnost pogreške 1. vrste a neka iznosi 0.05 (a = 0.05) Zaključak:
Provjera hipoteza uzorak – uzorak • 1. skup: očekivanje m1, varijanca s201 1. uzorak: n1 podataka, • 2. skup: očekivanje m2, varijanca s202 2. uzorak: n2 podataka, Hipoteze:
aritmetička sredina svakog od uzoraka rasipat će se oko očekivanja skupa iz kojeg uzorak potječe • njihova razlika rasipat će se oko veličine • pretpostavimo li da je hipoteza Ho istinita, , varijabla d će se rasipati oko 0.
... za uzorke s (n1 + n2– 2) > 30 • pri tome je standardna pogreška varijable d: • varijabla pogodna za testiranje nulte hipoteze: ... za uzorke s (n1 + n2 – 2) ≤ 30, i ako se n1 i n2 znatno razlikuju ... varijabla Studentove t-razdiobe s k = n1 + n2 – 2 s. s. Ako odbaciti Ho, uz vjerojatnost pogreške 1. vrste a.
slučaj: uzorak – osn. skup osnovni dvoslojni skup s proporcijom P elementa sa svojstvom A. uzorak n elemenata s proporcijom p važno: E(p) = P rasipanje proporcije p oko proporcije P ima standardnu pogrešku: slučaj: uzorak – uzorak osnovni skupovi uzorci nulta hipoteza: alternativna hip.: Testiranje hipoteza za proporcije(atributivne podatke) 1. skup, proporcije P1 2. skup, proporcije P2 n1 pod., proporcija p1 n2 pod., proporcija p2
varijabla za testiranje hipoteze Ho : P razlika d = p1 – p2 rasipa se oko E(d) = 0, ako pretpostavimo istinitost nulte hipoteze varijabla pogodna za testiranje nulte hipoteze: Vrijedi samo za VELIKE uzorketj. n 100 Zaključak:Ako
Usporedba (testiranje) varijanci • 1. Osnovni skup: očekivanje m1, varijanca s201 nepristrana procjena varijance • 2. Osnovni skup: očekivanje m2, varijanca s202 nepristrana procjena varijance • Nulta hipoteza: naprama alternativnoj • Varijabla ... varijabla F-razdiobe s kb = n1 – 1 s.s. ikn = n2 – 1 s.s.
Ako: Frač. > F0 odbaciti Ho Konvencija: Tipično: a = 0.05; 0.01 • F-razdioba: utemeljio G. Snedecor (1881.–1934.) • Naziv F-razdioba u čast R. Fishera (1890.–1962.) VAŽNO: Svakom testu aritmetičkih sredina mora prethoditi provjera značajnosti razlika među varijancama