390 likes | 854 Views
Skaitinės charakteristikos. Aprašančios statistikos. Absoliučios statistikos arba padėties statistikos [ statistics of location ] aritm.vidurkis, max ir min, mediana, moda aprašo padėtį skaičių ašyje bet neaprašo formos.
E N D
Aprašančios statistikos • Absoliučios statistikos arba padėties statistikos [statistics of location] • aritm.vidurkis, max ir min, mediana, moda • aprašo padėtį skaičių ašyje • bet neaprašo formos. • Santykinės statistikos arba sklaidos statistikos [statistics of dispersion] • dispersija, vid.kv.nuokrypis, asimetrija, ekscesas, pasiskirstymo plotis [range] • aprašo formą
Dvimatis taškinis grafikas (scatterplot) su prišlietinėmis histogramomis
Dvimatis taškinis grafikas (scatterplot) su prišlietiniais box-and-whiskers grafikais
Aritm.vidurkio, medianos ir modos lyginimas Labiausiai vartojamas vidurkis, kadangi: a) jo standartinė paklaida yra mažiausia iš visų vietos statistikų, b) jo skaičiavimai lengviausi, c) jis pats linkęs barstytis normaliai, nors skirstinys gali būti nenormalus. • Vidurkio trūkumai - ji labai veikia nukrypusios vertės, o medianą ir modą jos veikia mažai. • Vidurkis yra jautresnis skirstinio formos pokyčiams, todėl labiau tinka, kai norima atsižvelgti į skirstinio formą. • Vienviršūnių, simetriškų skirstinių vidurkis, mediana ir moda sutampa. Pvz., normalusis skirstinys. • Vienviršūnių asimetriškų skirstinių (lognormaliojo tipo) vidurkis būna arčiausiai ilgosios uodegos, moda - toliausiai nuo jos, mediana - tarp vidurkio ir modos.
Nuokrypiai: paprastasis nuokrypis • Rodo nuokrypį nuo vidurkio nuokrypis (deviate): • Paprastų nuokrypių suma visada lygi 0, kadangi vidurkis - svorio centras. • Nenaudojamas kaip bendra sklaidos charakteristika.
Nuokrypiai: Vidutinis absoliutus nuokrypis • Angl. average deviation • Jis nebūna lygus nuliui. • Kažkada labai populiarus, dabar nebenaudojamas, jį nukonkuravo vidutinis kvadratinis nuokrypis.
Nuokrypiai: Vidutinis kvadratinis nuokrypis • Angl.standard deviation(SD) • Liet. dar vadinamas standartiniu nuokrypiu • Susijęs su dispersija.
Dvimatis taškinis grafikas (scatterplot) su prišlietiniais medianų ir kvartilių grafikais
Dvimatis taškinis grafikas (scatterplot) su prišlietiniais vidurkių ir vid.kv.nuokrypių grafikais
Ką apie duomenis sako Sx? • [+1·σx ; - 1·σx] apima 68.27% duomenu. • [+2·σx ; -2·σx] apima 95.45% duomenu • [+3·σx ; -3·σx] apima 99.73% duomenu. • 50% duomenu yra intervale 0.674·σx. • 90% duomenu yra intervale 1.960·σx. • 95% duomenu yra intervale 2.576·σx.
[+1·σx ; - 1·σx] apima 68.27% duomenų
[+2·σx ; -2·σx] apima 95.45% duomenų
[+3·σx ; -3·σx] apima 99.73% duomenų
Sx naudingumas • Xvid=64 cm • Sx=17 cm • Vadinasi, intervale [64-17 cm; 64+17 cm] yra ~68% duomenų
Dispersija • Angl. variance • Paprastai naudojama kaip tarpinis dydis skaičiavimuose. • Nepatogi, nes: • miglota biologinė/fizinė prasmė (dimensija kvadratu) • dažnai yra labai didelis ar labai mažas skaičius (nes skaičiuojama per nuokrypio kvadratus)
Nepaslinktosios statistikos • Angl. unbiased statistics • Nepaslinktosios statistikos požymis: Paėmus daug to pat dydžio imčių iš tos pačios generalinės aibės, šių imčių statistikų vidurkis lygus atitinkamam generalinės aibės parametrui. • Pvz.:
Paslinktosios statistikos • Angl. biased statistics • Paslinktosios statistikos požymis: Paėmus daug to pat dydžio imčių iš tos pačios generalinės aibės, šių imčių statistikų vidurkis nelygus atitinkamam generalinės aibės parametrui. • Pvz.
Paslinktosios statistikos • Paslinktosios statistikos „paslinktai“ atspindi atitinkamą generalinės aibės parametrą. • Norint gauti įvertį, artimesnį atitinkamam generalinės aibės parametrui, reikia specialių pataisų.
Pataisos • Dispersijai – Beselio pataisa: • Todėl
Pataisos Vidutinis kvadratinis nuokrypis: • Beselio pataisa • Gurlando-Tripathio pataisa (Gurland, Tripathi, 1971) Ši pataisa mažai reikšminga mažoms imtims (C5=1,0638; C30=1.0086)
Variacijos koeficientas (1) • Angl. coefficient of variation vartojant šią pataisą Vx turi būti skaičiuojamas iš Sx be pataisos Cn. • Vx pataisa svarbi, kai imtys mažos.
Variacijos koeficientas (2) • Neturi dimensijos • Leidžia palyginti dviejų imčių išsibarstymą apie vidurkį – net skirtingų požymių imčių (nepriklausomai nuo matavimo vienetų)
Variacijos koeficientas (3) Variacijos koeficiento biologinė prasmė: mažos reikšmės leidžia spėti, kad a) tai evoliucijos griežtai ribojamas požymis, b) tai homeostazės griežtai ribojamas požymis.
Variacijos koeficientas (4) Vx=1933,9%
Asimetrijos koeficientas (1) • Angl. skew • Rodo asimetriją
Asimetrijos koeficientas (2) g1=-0,45
Asimetrijos koeficientas (3) g1=2,38
Ekscesas • Angl. kurtosis • Rodo skirtinio bukumą/smailumą ar dviviršūniškumą • Formulėje atimamas 3 tam, kad normaliojo skirstinio ekscesas būtų lygus 0.
Asimetrijos koef. ir ekscesas – paslinktos statistikos • Asimetrija ir ekscesas yra paslinktos statistikos, tad jų pataisos – daugikliai: • asimetrijai – • ekscesui -