290 likes | 805 Views
Opredelitev statistike. Statistika je veda, ki se ukvarja z masovnimi pojavi. velike količine kvantitativnih podatkov. ven. Osnovni pojmi. Spremenljivka = znak, ki predstavlja različne izraženosti nekega pojava Zvezne in diskretne spremenljivke Merske ravni spremenljivk
E N D
Opredelitev statistike Statistika je veda, ki se ukvarja z masovnimi pojavi. velike količine kvantitativnih podatkov ven
Osnovni pojmi Spremenljivka = znak, ki predstavlja različne izraženosti nekega pojava • Zvezne in diskretne spremenljivke • Merske ravni spremenljivk • Nominalna 1 - moški, 2 - ženske • Ordinalna 1 - nikoli, 2 - občasno, 3 - pogosto, 4 - vedno • Intervalnatemperatura (25°C) • Razmernostnatelesna višina (176 cm) • Neodvisne (X) in odvisne (Y) spremenljivke ven
Osnovni pojmi Univariatna analiza = analiza posamezne spremenljivke: njenega povprečja, razpršenosti, porazdelitve Bivariatna analiza = analiza odnosa med dvema spremenljivkama (korelacija), napovedovanje vrednosti Y na podlagi X (regresija) Multivariatna analiza = analiza odnosa med več spremenljivkami ven
Osnovni pojmi V populaciji težko preučimo(izmerimo) vse enote. • Populacija in vzorec • Deskriptivna in inferenčna statistika • Parameter in statistika vzorčenje posploševanje z vzorca na populacijo ven
Verjetnostno vzorčenje naključen izbor vsak element ima enako možnost izbora v vzorec visoka zunanja veljavnost • Naključno vzorčenje (lista elementov; vrečka, tabele naključnih števil, PC (Excel); reprezentativnost ni garantirana!) • Stratificirano vzorčenje (razdelitev populacije na razrede, naključno vzorčenje iz razredov / proporcionalno vzorčenje) • Sistematično vzorčenje (naključno določen začetek, korak k elementov) • Vzorčenje klastrov (naključen izbor klastra oziroma vzorčne enote, vzorec = vsi člani klastra) • Večstopenjsko vzorčenje (določimo večje klastre, naključno izberemo nekaj klastrov, naključno vzorčimo iz posameznega klastra) ven
Druge tehnike vzorčenja • Priložnostno vzorčenje (problem prostovoljnih udeležencev) • Namensko vzorčenje (udeleženci imajo določene lastnosti): • vzorčenje pogostih primerov • vzorčenje ekstremnih primerov oz. raznolikosti • vzorčenje ekspertov • kvotni vzorec • vzorčenje po principu “snežne kepe” ven
Urejanje podatkovindeskriptivna statistika = opis glavnih značilnosti zbranih podatkov = opis preučevanih značilnosti vzorca (navadno) ven
Urejanje podatkov po velikosti Štetje pogostosti pojavljanja posameznih vrednosti spremenljivke Frekvenčna porazdelitev Združevanje v razrede Pregled zbranih podatkov
8 7 6 5 f 4 3 2 1 0 0 1 2 3 4 5 6 7 8 stres Grafični prikazi frekvenčne porazdelitve Histogram Frekvenčni poligon ven
f f f f f f X X X X X X Oblika porazdelitve Negativno /pozitivno asimetrična (asimetrična v levo, v desno) koničasta / sploščena normalna bimodalna J - krivulja pravokotna ven
Grafični prikazi frekvenčne porazdelitve Prikazi porazdelitev pri nominalnih spremenljivkah ven
X f cfZM cpZM 1 3 3 ,100 2 6 9 ,300 3 7 16 ,533 4 6 22 ,733 5 4 26 ,867 6 4 30 1,000 Rangiranje Štetje podatkov, manjših od neke vrednosti X f cfZM p cpZM 1-2 9 9 ,300 ,300 3-4 13 22 ,430 ,733 5-6 8 30 ,266 1,000 ven
100 30 90 25 80 70 20 60 % f 50 15 40 10 30 20 5 10 0 0 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 X X Grafični prikazi frekvenčne porazdelitve Graf kumulativnih frekvenc Graf kumulativnih odstotkov percentili, decili, kvartili
1, 2, 2, 3, 3, 3, 4, 4, 14 1, 2, 2, 3, 3, 3, 4, 4, 5 Mo = 3 Me = 3 M = 4 Mo = 3 Me = 3 M = 3 Mere povprečja modus mediana aritmetična sredina
Mere razpršenosti VR = Xmax - Xmin + 1 • variacijski razmik • povprečni absolutni odklon od povprečja • varianca • standardna deviacija VR = 5 POM = 8 / 9 var = 12 / 9 N = 9 M = 3 ven
Mere razpršenosti VR = Xmax - Xmin + 1 • variacijski razmik • povprečni absolutni odklon od povprečja • varianca • standardna deviacija VR = 14 POM = 20 / 9 var = 120 / 9 N = 9 M = 4 ven
100 90 80 70 60 % 50 40 30 14 20 10 0 0 1 2 3 4 5 6 7 stres Q3 Q1 Me Q interkvartilni razmik ven
f f koničasta / sploščena X X Mere asimetričnosti in sploščenosti Negativno /pozitivno asimetrična (asimetrična v levo, v desno) ven
Grafični prikaz ven
Grafični prikaz ven
Normalna porazdelitev M = 3 SD = 1.15 2·SD = 2.3 95 % rezultatov bi padlo med 0.7 in 5.3 ven
Položaj rezultata v porazdelitvi f standardizirani odklon: 50 55 X f Primerjava rezultatov na različnih testih 50 55 X
Položaj rezultata v porazdelitvi Standardizirani odklon: X = 5 p = 0.96 X = 2 X -0.45 3.00 0.70 1.85 4.15 5.30 6.45 z +3.00 -3.00 0.00 -2.00 -1.00 +1.00 +2.00 p = 0.19
100 90 80 70 60 % 50 40 30 20 10 0 0 1 2 3 4 5 6 7 stres Položaj rezultata v porazdelitvi Percentilni rang ven
Opis porazdelitve: povzetek • frekvenčna porazdelitev: • N, O, I, R • povprečje: • O: Mo, Me • I, R: Mo, Me, M • razpršenost: • O: VR, Q • I, R: VR, Q, POM, var, SD ven