260 likes | 894 Views
APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija. Grafinis pateikimas. Grafinis pateikimas. 75th Procentilė. 75th Procentilė. Vidurkis( *). Mediana. 25th Procentilė. 25th Procentilė. Kraštutinės reikšmės. Grafinis pateikimas.
E N D
APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija
Grafinis pateikimas 75th Procentilė 75th Procentilė Vidurkis( *) Mediana 25th Procentilė 25th Procentilė Kraštutinės reikšmės
Grafinis pateikimasRyšio grafikas (koreliacija) Sergamumo skrandžio vėžiu ir Mg koncentracijos vandenyje ryšys
Išskirtys • Pagal stebėjimo padėtį duomenų aibėje. • Empirinė taisyklė • Tarp 2-3 - duomuo išskirtinis
IšskirtysNormalus skirstinys • Standartizuotos z reikšmės:Sąlyginė išskirtis 2-3Išskirtis >3
IšskirtysSkirstinys nenormalus Skaičiavimas pagal interkvartilinį plotį IQR. Išskirtis <Q1-3xIQR arba >Q3+3xIQR Sąlyginė išskirtis nuo Q1-3xIQR iki Q1-1,5xIQR arba nuo Q3+1,5xIQR iki Q3+3xIQR
Duomenų transformacija • Logaritminė • Rangavimas
Logaritminė ir kt. • Galima gauti panašų į normalų skirstinį • Naudojama parametrinių analizės metodų taikymui (bet nepaverčia duomenų aibės skirstinio į normalų, nekinta aprašomosios statistikos pasirinktys) • Sudėtinga interpretacija
Jei skirstinys normalus, kokius metodus (parametrinius ar neparametrinius) naudoti, toliau analizuojant/lyginant duomenis? Naudojami parametriniai metodai (vidurkiai, SD, pasirenkamas pvz. Pirsono koreliacijos koeficientas ir pan.)
Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius) naudoti, toliau analizuojant duomenis? • Galima mėginti transformuoti taip, kad būtų pasiskirstę simetriškiau. • Transformuotų reikšmių vidurkis • kiekvieno stebėjimo logaritmas, o ne originali reikšmė • “ištempiamas” intervalas tarp minimalių reikšmių • “suspaudžiami” intervalai maksimalių reikšmių.
Lovų skaičius 48 slaugos ligoninėse Lovų skaičiaus 48 slaugos ligoninėse ln f-ja 25 10 20 8 Dažnis abs. 15 6 Dažnis 10 4 5 2 0 0 2,00 0 50 3,00 100 4,00 150 200 5,00 250 6,00 300 Lovų skaičius ln_lovų_sk x =3,69, SD =0,76 x =55,06, SD =55,9 Transformacijos pavyzdys
Kitas vidutinio dydžio parametras asimetriškiems skirstiniams • Geometrinis Vidurkis • ln XG= (ln[xi] )/ n • Transformuotų reikšmių logaritmų vidurkis • ln - natūrinis logaritmas • Taigi: • eln[XG] = Geometrinis Vidurkis
Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius) naudoti, toliau analizuojant duomenis? • Jei transformacija padėjo, t.y. skirstinį galima laikyti normaliu, tada taikomi parametriniai metodai, toliau naudojant transformuotus duomenis. (Pastaba: tai jokiu būdu nereiškia, kad apibūdinant imtį požymis pristatomas kaip turintis normalų skirstinį). • Jei transformacija nepadėjo, taikomi neparametriniai metodai, t.y. ranginiai (medianos, pasirenkamas pvz. Spirmano koreliacijos koeficientas ir pan.)
Rangavimas • Duomenų (skaitmeninių ir ordinalių) suskirstymas eilės tvarka, priskiriant rango numerį. • Duomens originali vertė pakeičiama rango numeriu (sąlyginė vertė). • Galima iš karto įvertinti eiliškumą duomenų aibėje. • Nurodo, kokioje duomenų aibės vietoje yra konkretus duomuo. • Naudojama taikant neparametrinius analizės metodus
Rangavimo pavyzdysI variantas • Mėnesio pajamos
Rangavimo pavyzdysII variantas • Mėnesio pajamos
Rangavimo pavyzdysIII variantas • Mėnesio pajamos