620 likes | 1.04k Views
POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY. PREDNÁŠKA 2. čo sú popisné charakteristiky rozdelenie popisných charakteristík. charakteristiky polohy charakteristiky variability charakteristiky šikmosti charakteristiky špicatosti. POPISNÉ CHARAKTERISTIKY.
E N D
PREDNÁŠKA 2 • čo sú popisné charakteristiky • rozdelenie popisných charakteristík • charakteristiky polohy • charakteristiky variability • charakteristiky šikmosti • charakteristiky špicatosti
POPISNÉ CHARAKTERISTIKY • číselné charakteristiky, ktoré koncentrovanou formou jedným číslom vyjadrujú určitú vlastnosť skúmaného štatistického znaku • vystihujú typické črty radu rozdelenia početností daného štatistického znaku • väčšina z nich -len pre kvantitatívne znaky
POPISNÉ CHARAKTERISTIKY • rozlišujeme: • charakteristiky polohy • charakteristiky variability • charakteristiky šikmosti • charakteristiky špicatosti
CHARAKTERISTIKY POLOHY alebo stredné hodnoty vyjadrujú určitú úroveň (polohu) znaku, okolo ktorej sú ostatné hodnoty viac či menej koncentrované
CHARAKTERISTIKY POLOHY • rozlišujeme: • priemery (jednoduchá, vážená forma) • aritmetický • geometrický • harmonický • ostatné stredné hodnoty • modus • medián (kvantily)
CHARAKTERISTIKY POLOHY - vlastnosti • majú byť typickou hodnotou štatistického súboru • musia byť jednoznačne definované • pri výpočte sa do úvahy berú všetky jednotky štatistického súboru • majú byť ľahko zistiteľné • mali by slúžiť k porovnávaniu stredných hodnôt za niekoľko súborov • majú čo najmenej podliehať náhodnostiam výberu
PRIEMERY Priemerpredstavuje často rovnomernosť alebo normu, ktorá neexistuje. Keď v priemere každý zje hus, je možné, že niektorí zjedia dve, resp. viac, iní žiadnu.
PRIEMERY • aritmetický priemer • jednoduchý • vážený • n – počet pozorovaní x1, x2, x3.....xn • j=1,2,3,....n ni=n
PRIEMERY • priemery - aritmetický priemer (napr. priemerná mzda, priemerná denná teplota, atď.) • Príklad: priemerná mzda (jednoduchý aritmetický priemer) 500 € 550 € 720 € 1 770 € : 3 = 590 € 350 € 620 € 800 € 1 770 € : 3 = 590 € 500 550 720 350 620 800
PRIEMERY • aritmetický priemer - vážená forma príklad: výpočet priemernej známky • každú známku je potrebné násobiť (vážiť) počtom študentov, až potom robíme súčet - „vážený súčet“, ktorý následne podelíme počtom študentov Priemerná známka: 1,92
PRIEMERY • aritmetický priemer – výpočet z intervalového rozdelenia početnosti (vážená forma) Priemer = 658,49 Priemerný plat pracovníkov predstavuje 658 €, t.j. v priemere každý pracovník zarobí túto čiastku.
PRIEMERY • vlastnosti aritmetického priemeru: • stálosť súčtu hodnôt • platí nerovnosť: x min< x pr.<x max • súčet odchýlok od priemeru sa rovná 0 • súčet štvorcov odchýlok od priemeru je minimálny
PRIEMERY • vlastnosti aritmetického priemeru: • Aritmetický priemer súčtu (rozdielu) hodnôt xj a yj dvoch štatistických znakov sa rovná súčtu ich aritmetických priemerov. • Aritmetický priemer konštánt je rovný konštante. • Ak pripočítame k jednotlivým hodnotám znaku konštantu c, zvýši sa o túto konštantu aj ich aritmetický priemer. • Ak vynásobíme jednotlivé hodnoty znaku konštantou c, ich priemer bude c-násobkom aritmetického priemeru.
PRIEMERY Aritmetický priemer nemá väčšinou žiadny odraz v skutočnosti. Každá priemerná rodina má 2,2 dieťaťa, našťastie to neznamená to, čo vidíme na obrázku.
PRIEMERY • geometrický priemer- používa sa pri časových radoch (rast HDP za tri roky, vývoj inflácie za päť rokov...) jednoduchý vážený
Vývoj HNP SR za rr.95-99 v US$ na obyv. a rok PRIEMERY V roku 1997 oproti r. 96 vzrástol HNP na obyv. o 8,12% V roku 1997 oproti r. 96 vzrástol HNP na obyv. na 108,12%
PRIEMERY Z jednotlivých koeficientov rastu možno vypočítať: priemerný koeficient rastu Za obdobie rokov 1995-99 HNP v SR rástol ročne približne o 4,9%.
PRIEMERY • harmonický priemer- používa sa, ak existuje medzi skúmanými hodnotami znaku a výsledným javom nepriamy vzťah (výpočet priemernej rýchlosti vozidla) • jednoduchý • vážený
PRIEMERY HARMONICKÝ PRIEMER - príklad: Predpokladajme, že ideme 30 km ďaleko a prvých 15 km prejdeme rýchlosťou 15 km za hod. a druhých 15 km rýchlosťou 75 km za hod. Akú priemernú rýchlosť sme dosiahli za hodinu?
PRIEMERY Harmonický priemer (jednoduchý) Prvú trať ideme rýchlosťou 15km/hod… k jej prejdeniu potrebujeme práve 1hod. - 60 minút (15/15*60) Druhú trať (15 km) ideme rýchlosťou 75 km/hod…. K jej prejdeniu potrebujeme len 12 minút (15/75*60) celková doba jazdy je teda 72 minút. Aritmetický priemer nás zmýli výsledkom (15+75)/2=45km za hodinu. K zisteniu priemernej doby jazdy pre oba úseky potrebujeme 60min+12min= 72/2 = 36 minút pre každý úsek jazdy, čo predstavuje priemernú rýchlosť 25 km / hod. (15/36*60=25)
OSTATNÉ STREDNÉ HODNOTY • význam pri nesymetrických rozdeleniach u kvantitatívnych znakov, • pri kvalitatívnych znakoch • Patria sem: • Kvantily – kvartily (medián) • Modus
Kvantily • Sú hodnoty znaku, ktoré v empirickom štatistickom súbore rozdeľujú štatistický súbor na rovnako početných častí.
Kvantil Najčastejšie používané kvantily • kvantily, pre ktoré = 100, sú percentily • kvantily, pre ktoré = 10, sú decily • kvantily, pre ktoré = 4, sú kvartily • kvatil, pre ktorý =2, je medián • Ak k = 1, hovoríme o dolnom kvantile (dolnom percentile, decile, kvartile). • Ak k = -1, hovoríme o hornom kvantile (hornom percentile, decile, kvartile).
Kvartily • Predstavujú 3 reálne čísla, ktoré rozdeľujú usporiadaný štatistický súbor na 4 rovnakopočetné časti. • Patrí sem: • Prvý (dolný) kvartil určuje 25% najnižších hodnôt v súbore • Druhý kvartil = medián určuje 50% najnižších hodnôt v súbore • Tretí (horný) kvartil určuje 25% najvyšších hodnôt v súbore
MEDIÁN Medián - prostredná hodnota vštatistickom súbore usporiadanom podľa skúmaného znaku ( napr. výška prostredného pracovníka)
Medián je prostredná hodnota v usporiadanom štatistickom súbore. Usporiadame ženy podľa výšky, a zistíme, ktorá z nich je prostredná.
MEDIÁN • určovanie mediánu v štat. súbore, v ktorom je nepárny počet štatistických jednotiek n- nepárny počet Medián
MEDIÁN • b) určovanie mediánu v štat. súbore, v ktorom je párny počet štat. jednotiek
MEDIÁN • určovanie mediánu pri intervalovom rozdelení početností • dá sa určiť len mediánový interval, do ktorého medián patrí. V rámci tohto intervalu potom medián určíme približne na základe absolútnych početností a -dolná hranica medián. intervalu h-rozpätie medián. intervalu -početnosť medián. intervalu - kumulat. početnosť po mediánový interval
MEDIÁN • Výpočet mediánu z intervalového rozdelenia početnosti Prostredný plat je 689 €, čo znamená, že 50% pracovníkov má plat vyšší a 50% pracovníkov nižší ako 689 €.
KvaRtil Výpočet dolného, resp. horného kvartilu z intervalového rozdelenia početnosti
KvaRtil – výpočet dolného kvartilu 25% pracovníkov má plat do 11 074 Sk a 75% pracovníkov má plat vyšší ako 11 074 Sk.
KvaRtil – výpočet horného kvartilu 75% pracovníkov má plat do 12 438 Sk a 75% pracovníkov má plat vyšší ako 12 438 Sk.
Grafické zobrazenie kvartilov • Krabicový graf – box plot Z grafu je možné vyčítať informácie: • o úrovni znaku v súbore • o variabilite znaku v súbore • asymetrii znaku v súbore
MODUS Modus - - najpočetnejšia alebo najčastejšie sa vyskytujúca hodnota v štat. súbore - je definovaný v jednovrcholových rozdeleniach početností
MODUS • bezprostredne sa dá určiť v štat. súbore, ak poznáme individuálne hodnoty znaku x a ich početností • v prípade intervalového rozdelenia početnosti sa priamo určí iba modálny interval, t.j. interval s najväčšou početnosťou v štat. súbore. V rámci tohto intervalu sa modus určí:
MODUS • na základe vzťahu početností modálneho a priľahlých intervalov a - dolná hranica modálneho intervalu h - rozpätie intervalu d0- rozdiel medzi početnosťou modálneho intervalu a predchádzajúceho intervalu d1- rozdiel medzi početnosťou modálneho intervalu a nasledujúceho intervalu
MODUS • Výpočet v prípade intervalového rozdelenia početnosti Najčastejšie dosahovali pracovníci plat739 €.
Vzájomná poloha modusu, mediánu a aritmetického priemeru v štatistickom súbore - symetrické rozdelenie - nesymetrické rozdelenie - pozitívna asymetria - negatívna asymetria
CHARAKTERISTIKY VARIABILITY • variabilita– menlivosť hodnôt znaku v štatistickom súbore • Charakteristiky variability vyjadrujú: • ako veľmi sa hodnoty znaku menia, navzájom líšia • do akej miery sú hodnoty znaku koncentrované okolo stredných hodnôt
CHARAKTERISTIKY VARIABILITY • porovnanie súborov z hľadiska variability menšia variabilita väčšia variabilita
CHARAKTERISTIKY VARIABILITY • miery variability: • A) miery variability, ktorých veľkosť ovplyvňujú len niektoré hodnoty znaku v súbore • variačné rozpätie • kvantilové rozpätie • kvartilové rozpätie • kvartilováodchýlka
CHARAKTERISTIKY VARIABILITY B) miery variability, ktorých veľkosť ovplyvňuje každá hodnota znaku v súbore: - absolútne - priemerná odchýlka - rozptyl - smerodajná (štandardná) odchýlka - relatívne - pomerná priemerná odchýlka - variačný koeficient
CHARAKTERISTIKY VARIABILITY • variačné rozpätie • najjednoduchšia miera variability • informatívny charakter – berie do úvahy len krajné hodnoty • rozdiel medzi maximálnou a minimálnou hodnotou v súbore R = xmax – xmin • jeho veľkosť závisí od veľkosti krajných hodnôt (extrémne hodnoty), t.j. je citlivá voči extrémnym hodnotám - nevýhoda
CHARAKTERISTIKY VARIABILITY • rozptyl(disperzia, variancia) Øs2 • priemerný štvorec odchýlok od priemeru • meria variabilitu v druhých mocninách mernej jednotky • je neinterpretovateľný - nevýhoda jednoduchá forma vážená forma
CHARAKTERISTIKY VARIABILITY • Vlastnosti rozptylu: • Rozptyl konštánt sa rovná nule. • Ak pripočítame ku všetkým hodnotám znaku rovnakú konštantu, rozptyl sa nezmení • Ak násobíme všetky hodnoty xj konštantou c, rozptyl takto vzniknutých hodnôt je násobkom štvorca konštanty c a rozptylu pôvodných hodnôt: s2cx=c2.s2
CHARAKTERISTIKY VARIABILITY • smerodajná (štandardná) odchýlkaØs • vyjadruje variabilitu súboru v pôvodných merných jednotkách • o koľko +/- sa v priemere jednotlivé hodnoty odchyľujú od priemeru • variačný koeficient Øv • vyjadruje variabilitu súboru v % • koľko % z priemeru predstavuje smerodajná odchýlka • slúži na porovnávanie variability znakov vo viacerých súboroch