150 likes | 413 Views
luokittelua…. summafrekvenssi on kaikkien luokkien frekvenssien summa ∑ p i = s i s i = s 1 + s 2 +… (luokkien frekvenssien summa) n n = kaikkien havaintojen lukumäärä prosentuaalinen summafrekvenssi onkaikkien luokkien prosentuaalisten frekvenssien summa
E N D
luokittelua… • summafrekvenssi on kaikkien luokkien frekvenssien summa ∑ pi= si si = s1 + s2 +… (luokkien frekvenssien summa) n n = kaikkien havaintojen lukumäärä • prosentuaalinen summafrekvenssi onkaikkien luokkien prosentuaalisten frekvenssien summa ∑ pi= si x 100 n • Esim. 70 henkilön painojen jakauma (luokkien alle 65.5 kg summafrekvenssi on) ∑ pi= si = 37 = 0.357 pros. summafrekv. ∑ pi= si x 100 = 35.7 n 70 70
1-ulotteisen jakauman tunnusluvut • tunnusluku tiivistää havaintoaineiston tärkeimmät piirteet keskiluvuiksi • aritmeettinen keskiarvo x = 1 ∑ xi n ∑ xi = x1 + x2 + x3 … n = havaintojen määrä x = yksittäisen havainnon lukuarvo
keskiluvut… Esim. Keihäänkärkien pituus x = 1 ∑ xi= 359 = 32.6 cm n 11 keskiarvon laskeminen luokitellusta frekvenssijakaumasta (painotettu keskiarvo) x = 1 ∑ fi xi∑ fi = havaintojen kokonaismäärä n xi = luokkakeskus
keskiluvut… Esim. 70 henkilön keskiarvo alkuperäisestä aineistosta x = 1 ∑ xi= 50 + 91 +72…62 = 4924 = 70.3 kg n 70 70 Esim. 70 henkilön painitettu keskiarvo frekvenssijakaumasta x = 1 ∑ fi ki= 49.5 x 12 + 59.5 x 13…99.5 x 3 = 4905 =70.1 kg n 70 70 • painotetussa keskiarvossa lasketaan luokkakeskuksien (ki) keskiarvo
keskilukuja… • mitä artimeettinen keskiarvo kuvaa? • keskiarvo sijoittuu havaintoarvojen painopisteeseen (keinulaitaesimerkki) • keskiarvon käyttövaatimuksena vähintään intervalliasteikko • keskiarvon kritiikkiä • ihmistä ei voi kutistaa numeroiksi • liiallinen käyttö • keskiarvo on epätyypillinen mittari • esim. Keskiarvoperhe todellisuudessa erittäin harvinainen
keskilukuja… • Mediaani (Me) • ilmaisee havaintoaineiston keskikohdan (keskimmäinen arvo) • vaatimuksena vähintään järjestysasteikko • laskeminen • järjestetään havaintoarvot pienimmästä suurimpaan • jos havaintoja pariton määrä Me on suuruusjärjestyksessä keskimmäinen havainto • jos havaintoja parillinen määrä Me on kahden keskimmäisen havainnon keskiarvo
keskilukuja… • mediaanin laskeminen käytännössä esim. 70 henkilön painojen jakauma Md = 70 + 70 = 70 2 luokitellusta aineistosta Md = Li + n/2 – si – 1 x ci = 64.5 + 70/2 –25 x 10 = 69.8 fi 19 Li = 64.5 (mediaanin todellinen alaraja) si = 25 (edellisen luokan summafrekvenssi) ci = 10 (mediaaniluokan pituus)
keskilukuja… • mediaanin kritiikkiä • mediaani ei ole herkkä havaintoaineiston muutoksille (robusti mittari) • käyttäytyy mittakaavan muutosten suhteen kuten keskiarvo • Moodi (mode) • havaintosarjan tyypillisin arvo, jonka frekvenssi on suurin • edellytyksenä ainoastaan luokitteluasteikko • monihuippuisissa frekvenssijakaumissa voi olla useita moodeja
keskilukuja… • moodin laskeminen käytännössä Esim. 70 henkilön painojen jakauma - moodiluokan frekvenssi 19 (havaintoa) => moodiluokan luokkakeskusta 69.5 kg voidaan käyttää moodin arvona -laskemalla frekvenssijakaumasta Mo = Li + di-1 x ci = 64.5 + 6 x 10 = 69.95 ≈ 70 di-1 + di+1 6 + 5 • Li = moodiluokan alaraja • di-1 = moodiluokan ja sitä edeltävän frekvenssin erotus • di+1 = moodiluokan ja sitä seuraavan frekvenssin erotus • ci = moodiluokan pituus
keskilukuja… • moodin kritiikkiä • hyvin robusti • käyttäytyy siirron ja mittakaavan suhteen kuten keskiarvo • yksihuippuisessa tasaisessa jakaumassa keskiarvo, mediaani ja moodi yhtyvät • Jakauman muodosta: • vino yksihuippuinen jakauma voi olla: • oikealle vino (oikea häntä pitempi kuin vasen häntä) • vasemmalle vino (vasen häntä pitempi kuin oikea häntä)
keskilukuja… • Fraktiilit • Mediaanin kaltaisia tunnuslukuja, jotka kuvaavat havaintojakauman “sijaintia” Q = P x n p = prosentin fraktiili 100 • tavallisimmat fraktiilit ovat • alakvartiili = Q1 = 25/100 x n • yläkvartiili = Q3 = 75/100 x n • mediaani on fraktiilin erikoistapaus! • Q2 = 50/100 x n
keskilukuja… • esim. 70 henkilön painojen ala (Q1)- ja yläkvartiili (Q3): Q1= 25/100 x n = 25/100 x 17.5 > Q1 = x(18) =61 Q3= 25/100 x n = 75/100 x 52.5 > Q3 = x(53) =81 • laskemalla luokista Q1 = Li + 25/100 x n – Si-1 x ci = 54.5 + 25/100 x 70 -12 x 10 ≈ 58.7 fi 13 • Q1 on pienempien havaintoarvojen mediaani • Q3 on suurempien havaintoarvojen mediaani
keskilukuja… • Voidaan laskea tarvittaessa haluttuja järjestystunnuslukuja (mm. prosenttipisteitä) Esim. desiili on 10/100 x n (vrt. kvartiilien laskeminen) • Minimi ja maksimiarvot Esim. 70 henkilön painojen jakauma • Min = 47 kg • Max = 99 kg
keskilukuja… • Muita keskilukuja • harmoninen keskiarvo • geometrinen keskiarvo • liukuva keskiarvo