1 / 26

APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija. Grafinis pateikimas. Grafinis pateikimas. 75th Procentilė. 75th Procentilė. Vidurkis( *). Mediana. 25th Procentilė. 25th Procentilė. Kraštutinės reikšmės. Grafinis pateikimas.

Download Presentation

APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

  2. Grafinis pateikimas

  3. Grafinis pateikimas 75th Procentilė 75th Procentilė Vidurkis( *) Mediana 25th Procentilė 25th Procentilė Kraštutinės reikšmės

  4. Grafinis pateikimas

  5. Grafinis pateikimasRyšio grafikas (koreliacija) Sergamumo skrandžio vėžiu ir Mg koncentracijos vandenyje ryšys

  6. Išskirtys

  7. Išskirtys • Pagal stebėjimo padėtį duomenų aibėje. • Empirinė taisyklė • Tarp 2-3 - duomuo išskirtinis

  8. IšskirtysNormalus skirstinys • Standartizuotos z reikšmės:Sąlyginė išskirtis 2-3Išskirtis >3

  9. IšskirtysNormalus skirstinys

  10. IšskirtysSkirstinys nenormalus Skaičiavimas pagal interkvartilinį plotį IQR. Išskirtis <Q1-3xIQR arba >Q3+3xIQR Sąlyginė išskirtis nuo Q1-3xIQR iki Q1-1,5xIQR arba nuo Q3+1,5xIQR iki Q3+3xIQR

  11. IšskirtysSkirstinys nenormalus

  12. Pavyzdys excel’-yje

  13. Duomenų transformacija • Logaritminė • Rangavimas

  14. Logaritminė ir kt. • Galima gauti panašų į normalų skirstinį • Naudojama parametrinių analizės metodų taikymui (bet nepaverčia duomenų aibės skirstinio į normalų, nekinta aprašomosios statistikos pasirinktys) • Sudėtinga interpretacija

  15. Jei skirstinys normalus, kokius metodus (parametrinius ar neparametrinius) naudoti, toliau analizuojant/lyginant duomenis? Naudojami parametriniai metodai (vidurkiai, SD, pasirenkamas pvz. Pirsono koreliacijos koeficientas ir pan.)

  16. Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius) naudoti, toliau analizuojant duomenis? • Galima mėginti transformuoti taip, kad būtų pasiskirstę simetriškiau. • Transformuotų reikšmių vidurkis • kiekvieno stebėjimo logaritmas, o ne originali reikšmė • “ištempiamas” intervalas tarp minimalių reikšmių • “suspaudžiami” intervalai maksimalių reikšmių.

  17. Lovų skaičius 48 slaugos ligoninėse Lovų skaičiaus 48 slaugos ligoninėse ln f-ja 25 10 20 8 Dažnis abs. 15 6 Dažnis 10 4 5 2 0 0 2,00 0 50 3,00 100 4,00 150 200 5,00 250 6,00 300 Lovų skaičius ln_lovų_sk x =3,69, SD =0,76 x =55,06, SD =55,9 Transformacijos pavyzdys

  18. Transformacijos pavyzdys

  19. Kitas vidutinio dydžio parametras asimetriškiems skirstiniams • Geometrinis Vidurkis • ln XG= (ln[xi] )/ n • Transformuotų reikšmių logaritmų vidurkis • ln - natūrinis logaritmas • Taigi: • eln[XG] = Geometrinis Vidurkis

  20. Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius) naudoti, toliau analizuojant duomenis? • Jei transformacija padėjo, t.y. skirstinį galima laikyti normaliu, tada taikomi parametriniai metodai, toliau naudojant transformuotus duomenis. (Pastaba: tai jokiu būdu nereiškia, kad apibūdinant imtį požymis pristatomas kaip turintis normalų skirstinį). • Jei transformacija nepadėjo, taikomi neparametriniai metodai, t.y. ranginiai (medianos, pasirenkamas pvz. Spirmano koreliacijos koeficientas ir pan.)

  21. Rangavimas • Duomenų (skaitmeninių ir ordinalių) suskirstymas eilės tvarka, priskiriant rango numerį. • Duomens originali vertė pakeičiama rango numeriu (sąlyginė vertė). • Galima iš karto įvertinti eiliškumą duomenų aibėje. • Nurodo, kokioje duomenų aibės vietoje yra konkretus duomuo. • Naudojama taikant neparametrinius analizės metodus

  22. Rangavimo pavyzdysI variantas • Mėnesio pajamos

  23. Rangavimo pavyzdysII variantas • Mėnesio pajamos

  24. Rangavimo pavyzdysIII variantas • Mėnesio pajamos

  25. Pavyzdys excel’-yje

More Related