360 likes | 696 Views
Prednášky zo Štatistických metód. Prednášajúci: doc. Ing. Peter OBTULOVIČ,CSc Pracovisko: Katedra štatistiky a operačného výskumu FEM SPU Nitra S – pavilón 1 poschodie Telefon: 4123 E-mail: Peter.Obtulovic@uniag.sk. Adresa: www.fem.uniag.sk/cvicenia.
E N D
PrednáškyzoŠtatistických metód Prednášajúci: doc. Ing. Peter OBTULOVIČ,CSc Pracovisko: Katedra štatistiky a operačného výskumu FEM SPU Nitra S – pavilón 1 poschodie Telefon: 4123 E-mail: Peter.Obtulovic@uniag.sk
V súčasnosti sme presycovaní informáciami najrôznejších druhov, tak v osobnom ako aj pracovnom živote. Ako je známe informácie sú dáta premenené do zrozumiteľnej formy tým, že je im priradený určitý význam. Každé naše rozhodnutie je z väčšej či menšej miery podložené efektívnym využívaním informácií a schopnosťou premeniť dáta na informácie lepšie, ako to dokážu iní, čo je bezpochyby v priamej úmere ku kvalite týchto rozhodnutí. Ciest, ako z údajov dostať to dôležité a aktuálne je viac, ale vždy v popredí takýchto postupov stoja metódy štatistickej analýzy dát. Existujú rôzne spôsoby premeny dát na informácie, obvykle sú navzájom veľmi tesne poprepájané, a každý systém ich zahrňuje hneď niekoľko (napr. sumarizácia dát, vizualizácia dát, triedenie, výber účelovo relevantných dát, porovnávanie, konštrukcia sekundárnych ukazovateľov, prepočty a štatistické metódy, šírenie informácií a pod.) Z latinského slovného spojenia „status rei publice“, (= stav veci verejnej) sa postupne vyvinulo označenie štatistika. Štatistika mala teda v histórii význam súhrnu znalostí o významných štátnych záležitostiach. Štatistika historicky vznikla z úradného zisťovania, univerzitnej štátovedy, politickej aritmetiky a teórie pravdepodobnosti.
K úradným zisťovaniam dochádzalo už niekoľko tisíc rokov pred naším letopočtom v starom Egypte, resp. v Číne, kedy vtedajší vládcovia potrebovali poznať čo najpresnejšie údaje pre vojenské účely ( sčítanie mužov schopných bojovať ), finančné účely ( sčítanie všetkých obyvateľov povinných platiť dane, súpis ich majetku apod. ). Úradné alebo úradnícke zisťovania sa v priebehu času neustále zdokonaľovali až k dnešnej podobe sčítania ľudu (spojených často so súpisom domov a bytov), ktoré sa dnes vykonávajú vo všetkých kultúrnych štátoch sveta približne každých desať rokov. Od polovice 18. storočia , hlavne v Nemecku sa rozšírila tzv. univerzitná štátoveda, ktorá mala za cieľ čo najvierohodnejšie popísať obyvateľstvo, územie, obchod, peňažníctvo, armádu atď. (znamenitosti resp. pozoruhodnosti ) vlastného a cudzích štátov. V hospodársky vyspelejšom Anglicku sa rozvíja politická aritmetika skúmajúca rôzne spoločenské javy na podklade objektívnych záznamov (hlavne číselných). Hlavný predstavitelia John Graunt (1620 – 1674) a Wiliam Petty (1623 – 1687) skúmali predovšetkým pravidelnosti v rodení a umieraní, počet obyvateľstva a zloženie rodín, závislosti výšky príjmov od ich povolania a veku. Skúmali teda hromadné javy, ktoré bolo možné po ich preštudovaní ovplyvňovať mocensky štátom (politicky) a používali k tom čísla a rôzne prepočty (aritmetika).
Zásadný význam pre rozvoj štatistiky mala teória pravdepodobnosti, ktorej základy sa vyskytovali v prácach Geromina Cardana (1501 – 1576) ale aj Galileo Galilea (1564 –1642). K spoluzakladateľom teórie pravdepodobnosti patria aj francúzski matematici Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665), Holanďan Christian Huygens (1629-1695). Významné miesto v rozvoji teórie pravdepodobnosti zohrali aj práce Jacoba Bernoulliho (1654-1748), Jána Bernoulliho (1667-1705), Daniela Bernoulliho (1700-1754), Thomasa Bayesa (1702-1761), Pierre Simeona de Laplacea (1749-1827), Simeona Denisa Poissona (1781-1840), Karla Fridricha Gaussa (1777-1855), Pafnutija Lvoviča Čebyševa (1821-1894), Andreja Andrejoviča Markova (1856-1922), a Alexandra Michajloviča Ljapunova (1857-1918). Významnú úlohu v procese budovania modernej štatistiky v 19. storočí zohral belgický matematik, astronóm a štatistik Lambert Adolphe Jacques Quételet (1796-1874), ktorý rozvíjal štatistiku ako disciplínu, ktorá má nielen popisovať a pozorovať hromadné javy ale ich aj vysvetľovať. Od polovice 19. storočia dochádzalo k popisovaniu a analyzovaniu hromadných javov pomocou číselného hodnotenia aj v oblastiach prírodných a technických vied, obzvlášť v biológii, antropológii, meteorológii, fyzike a pod. Na rozvoji štatistiky sa podieľal celý rad významných vedcov, z ktorých spomeňme aspoň Francisa Galtona (1822-1911), Karla Pearsona (1857-1936), alebo Ronalda A. Fishera (1890-1962) a iní.
Slovo štatistika sa v bežnom živote veľmi často používa v rôznych významoch: údaje ( číselné aj slovné ) praktickú činnosť spočívajúca v získavaní údajov o hromadných javoch vednú disciplínu, ktorá skúma zákonitosti hromadných javov, hľadá v nich určité zákonitosti a zaoberá sa metódami ich skúmania. myslí sa ním úrad, ktorý zabezpečuje zber, spracovanie a poskytovanie štát. údajov, používa sa aj pre označenie výsledkov, grafov, tabuliek publikovaných v tlači, v televízii ako napr. kriminálna štatistika, štatistika nehodovosti, štatistika prístupu na stránku www. v rámci odbornej terminológie tejto vednej disciplíny sa pojmom štatistika označujú aj niektoré miery, vzorce a charakteristiky – napr.: priemer, rozptyl. Čím sa teda zaoberá štatistika dnes? V podnikovej praxi je základnou úlohou štatistiky pomôcť analytikom pochopiť zmysel, alebo obsah dát. Získať z nich informácie nie v podobe napr. denných záznamov daného mesiac, ale v agregovanej podobe napr. ako priemer za daný mesiac. Štatistika vlastne zovšeobecňuje výsledok veľkého počtu pozorovaní (napr. priemerný hodinový zárobok vo firme). Z toho vyplýva náplň štatistiky - skúmanie hromadných javov.
Základné štatistické pojmy Pre pochopenie ďalšieho výkladu je nevyhnutné zadefinovať niektoré často používané pojmy: 1. HROMADNÝ JAV. 2. ŠTATISTICKÁ JEDNOTKA 3. ŠTATISTICKÝ SÚBOR 4. ŠTATISTICKÝ ZNAK 1. Hromadný jav je každý jav alebo udalosť , ktorá sa vyskytuje u veľkého počtu individuálnych jedincov - nositeľov tohto javu. Konkrétna podoba javu u každého jednotlivca môže byť iná v závislosti od rôznych faktorov, činiteľov, ktoré ho ovplyvňujú. Napriek tomu, že konkrétne podoby sa odlišujú, pomocou štatistiky možno na ich základe spoznať podstatu hromadného javu, jeho zákonitosti a pravidelnosti, dospieť k zovšeobecnejúcim záverom. Jednotlivý individuálny jav je pre štatistiku zaujímavý len ako súčasť hromadného javu. Sám o sebe nie je postačujúci pre realizáciu štatistickej analýzy. Štatistické skúmanie si vždy vyžaduje hromadné pozorovanie javu. Predpokladajme, že chceme skúmať koľko korún obyvatelia SR mesačne vynakladajú na rôzne druhy výrobkov. Javom, ktorý chceme skúmať bude teda nákup, alebo spotreba výrobku za mesiac. Je to jav hromadný, pretože sa vyskytuje u veľkého počtu jedincov. Na to, aby sme získali predstavu o tom, koľko obyvatelia SR mesačne vynakladajú na daný tovar, nám však nestačí spýtať sa len seba, alebo svojich známych, ak počet obyvateľov SR je viac ako 5 miliónov
2. štatistická jednotka - je nositeľ individuálnej podoby hromadného javu, je to teda základný prvok, na ktorom možno skúmať konkrétny prejav určitého hromadného javu. Môžu to byť napr. poľnohospodárske podniky, zvieratá, plodiny, veci , udalosti, osoby a pod. • 3. štatistický súbor - je množina štatistických jednotiek, ktoré vyhovujú určitým vopred zadaným kritériám a sú, alebo by mohli byť nositeľom skúmaného hromadného javu. Podmienky, ktoré určujú, či daná štatistická jednotka bude súčasťou štatistického súboru, vymedzujú štatistický súbor: • vecne - stanovenie vlastností, ktoré musí spĺňať štatistická jednotka • časovo - určenie časového úseku alebo okamihu, v ktorom sa štatistické jednotky zahŕňajú do skúmania - dátum alebo čas zisťovania • priestorovo - určenie miesta alebo územia, na ktorom sa vykoná štatistické zisťovanie • rozsah štatistického súboru - je číslo vyjadrujúce počet štatistických jednotiek, ktoré spĺňajú stanovené kritéria a patria tak do štatistického súboru • Štatistický súbor všetkých jednotiek, ktorý je predmetom skúmania nazývame základný súbor. Jeho rozsah môže byť konečný i nekonečný, spravidla je ale veľký. Z toho dôvodu sa z úsporných a časových dôvodov vykonáva výberové šetrenie, kedy sa zo základného súboru určitým spôsobom vyberú len niektoré jednotky, čím sa získa výberový súbor. Výsledky získané z výberových šetrení slúžia potom k úsudkom o základnom súbore.
Každá štatistická jednotka je nositeľom určitých vlastností (atribútov), ktoré nazývame štatistickými znakmi. 4. Štatistické znaky rozdeľujeme z rôznych hľadísk. Podľa toho, či sa vyskytujú alebo nevyskytujú rovnako pri všetkých štatistických jednotkách daného súboru, rozoznávame štatistické znaky: a) spoločné , ktorých výskyt je podmienkou príslušnosti danej jednotky k štatistickému súboru a vyplýva z definície štatistickej jednotky, b) variabilné, ktoré sa pri jednotlivých štatistických jednotkách daného súboru môžu rôzne vyskytovať. Podľa toho, či sú štatistické znaky priamym výrazom vlastnosti štatistickej jednotky alebo ju charakterizujú iba sprostredkovane - nepriamo, rozdeľujeme ich na: a) priame (výška v cm, vek v rokoch, a pod.) b) nepriame (kvalitu výrobku pomocou jeho životnosti, a pod) Podľa počtu variantov, ktoré môžu nadobúdať, rozdeľujeme štatistické znaky na: a) alternatívne, ktoré nadobúdajú iba dva varianty (napr. pohlavie) b) množné, ktoré môžu nadobúdať mnoho (najmenej tri) varianty (národnosť, povolanie, a pod.) Podľa toho, z akého hľadiska charakterizujú štatistickú jednotku, rozdeľujeme štatistické znaky na: a) časové, ktoré charakterizujú štatistické jednotky z hľadiska času, b) priestorové, ktoré charakterizujú štatistické jednotky z hľadiska miesta, c) vecné charakterizujúce ich vecné stránky a rozdeľujeme ich na: ◘ kvalitatívne (slovné tiež kategoriálne, nominálne) znaky, ktoré majú diskrétne neusporiadané znaky napr. farba, výrobná značka , národnosť, pohlavie... ◘ kvantitatívne (číselné) vyjadrujú vlastnosti štatistických jednotiek pomocou čísiel, numericky.
SPOLOČNÉ VARIABILNÉ Rozdelenie štatistických znakov ŠTATISTICKÉZNAKY PRIAME NEPRIAME VECNÉ PRIESTOROVÉ ČASOVÉ VECNÉ KVALITATÍVNE KVANTITATÍVNE ALTERNATÍVNE MNOŽNÉ SPOJITÉ DISKRÉTNE
Pokiaľ kvalitatívny štatistický znak môže nadobúdať len dve obmeny hovoríme o znaku alternatívnom (napr.: pohlavie). Znak ktorý pripúšťa viac ako dve obmeny nazývame znakom množným. Kvantitatívne štatistické znaky sa ďalej členia na: poradové (ordinálne) - sú číselné znaky, ktoré majú diskrétne hodnoty, ktoré možno usporiadať, ale nevieme medzi nimi špecifikovať mieru rozdielu, merateľné (kardinálne) - ostatné číselné znaky, pri ktorých možno vyčísliť mieru rozdielu. Z praktických dôvodov rozlišujeme kvantitatívne znaky na spojité a diskrétne (nespojité). Spojité štatistické znaky môžu nadobúdať v rámci určitého intervalu ľubovoľné hodnoty (hrubá mzda, spotreba materiálu, zisk, pridaná hodnota...). Nespojité štatistické znaky nadobúdajú len niektoré číselné hodnoty, najčastejšie prirodzené čísla alebo celé nezáporné čísla (počet detí, počet členov domácností, počet porúch v sérii výrobkov...). V poslednej dobe sa veľmi často namiesto pojmu štatistický znak používa termín štatistická premenná (zo softvérového označenia „variable“). Oba tieto názvy však môžeme považovať za celkom rovnocenné.
Štatistickú prácu je možné rozdeliť do niekoľkých etáp. Ide spravidla o etapu štatistického zisťovania etapu štatistického spracovania etapu štatistického rozboru Štatistické zisťovanie je praktická činnosť, ktorou sa zhromažďujú údaje o skúmaných javoch. Výsledky štatistického zisťovania - zistené údaje - sú predmetom ďalšieho spracovania. Rozlišujeme primárne zisťovanie - ak sa údaje o určitých javoch zisťujú len na účely štatistického skúmania. Sekundárne zisťovanie - ak sa údaje zaznamenané na iné účely využívajú pri štatistickom skúmaní. Ak sa zisťovanie neopakuje, hovoríme o jednorazovom štatistickom zisťovaní, ak sa pravidelne opakuje, potom hovoríme o periodickom zisťovaní, ak sa nepravidelne opakuje, potom hovoríme o nepravidelnom zisťovaní. 2. Štatistickým spracovaním rozumieme triedenie údajov, opis štatistického súboru pomocou číselných charakteristík a vyjadrenie podstatných poznatkov o ňom v tabuľkách prípadne v grafoch. 3. Štatistický rozbor je konečnou fázou štatistického skúmania. Zahrňuje analýzu výsledkov štatistického spracovania a formulovanie záverov, ktoré z nich vyplývajú.
Triedenie a prezentácia štatistických dát Výsledkom štatistického zisťovania je spravidla veľké množstvo údajov, ktoré sú neprehľadné, a ani skúsený pracovník z nich mnoho nevyčíta. Aby vynikli charakteristické rysy a zákonitosti analyzovaného štatistického znaku a aby sa údaje stali prehľadnými musíme ich obvykle najskôr zatriediť. Triedením rozumieme rozdelenie jednotiek súboru do takých skupín, aby čo najlepšie vynikli charakteristické vlastnosti skúmaných javov. Triedením dosiahneme okrem usporiadania údajov do prehľadnej formy aj ich zhustenie. Štatistický znak podľa ktorého triedenie uskutočňujeme sa nazýva triediacim znakom. Štatistický súbor môžeme triediť podľa ľubovoľného štatistického znaku, dôležité však je voliť taký triediaci znak, ktorý je z hľadiska cieľa skúmania podstatný a umožní charakterizovať čo najlepšie podstatu skúmaných javov. Podľa počtu triediacich znakov rozlišujeme triedenie jednostupňové (ak ku triedeniu používame jeden triediaci znak) resp. viacstupňové (ak ku triedeniu používame viac triediacich znakov).
Pri triedení sa musia dodržať dve hlavné zásady: zásada úplnosti zásada jednoznačnosti. Zásada úplnosti triedenia vyžaduje vytváranie skupín (tried) tak, aby sa do niektorej z nich dala zaradiť každá štatistická jednotka. Pri triedení nesmie vzniknúť situácia, že niektorú štatistickú jednotku nemôžeme do niektorej zo zvolených tried zaradiť. Zásada jednoznačnosti triedenia znamená, že triedy vytvárame tak, aby sa o každej štatistickej jednotke dalo explicitne rozhodnúť, do ktorej z nich patrí. Triedy sa nesmú vzájomne prekrývať, aby nevznikla pochybnosť ani o jednej štatistickej jednotke pri rozhodovaní.
Triedenie podľa kvalitatívnych znakov Pri triedení štatistických jednotiek podľa kvalitatívneho štatistického znaku sa štatistický súbor rozdeľuje do tried podľa variantov, alebo obmien zvoleného kvalitatívneho znaku. Jednotlivé triedy volíme tak, aby úplne a jednoznačne definovali všetky obmeny triediaceho znaku. Ak má triediaci znak len dve obmeny nazývame takéto triedenie podvojné alebo dichotomické, ak má triediaci znak viac ako dve obmeny nazývame takéto triedenie množné alebo multinomické. Na základe podvojného alebo množného triedenia podľa jedného, dvoch alebo k kvalitatívnych znakov sa získajú početnosti prvého, druhého alebo k - tého stupňa. Celkový počet štatistických jednotiek v súbore budeme označovať n, a v súlade z vyššie zavedeným členením budeme označovať túto početnosť ako početnosť nultého stupňa. Výsledky triedenia podľa dvoch kvalitatívnych znakov je možné usporiadať do tzv. asociačnej tabuľky: početnosti prvého stupňa (a), (b)... Početnosti druhého stupňa (ab), (αβ)... početnosť nultého stupňa n
Tabuľka má rozmer 2x2, pričom v jednotlivých políčkach tabuľky sú početnosti 2. stupňa, v súčtovom stĺpci a riadku (označenom Spolu) sú početnosti 1. stupňa a v pravom dolnom rohu je celkový počet jednotiek súboru n – početnosť nultého stupňa. Okrem absolútnych početností, vyjadrujúcich absolútny počet jednotiek v príslušnej triede je možné uviesť aj relatívne početnosti (vo forme koeficienta alebo percent). Relatívne početnosti získame ako podiel absolútnych početností a celkového počtu jednotiek, poprípade podielu absolútnych početností a súčtových hodnôt v riadkoch alebo stĺpcoch. Také početnosti je potom potrebné presne interpretovať vzhľadom na zvolený základ pri výpočte relatívnych početností. Ak pri triedení štatistického súboru podľa kvalitatívnych znakov aspoň jeden triediaci znak nadobúda viac ako dva varianty, hovoríme o množnom (multinomickom) triedení. V prípade dvoch kvalitatívnych znakov A a B, ktoré majú m a p variantov sa výsledky triedenia usporiadajú do tzv. kontingenčnej tabuľky
Príklad 1.1 Skúmali sme 36 firiem v Nitrianskom kraji zaoberajúcich sa výrobou plastových okien s klasickou technológiou označenou „a“, a novou technológiou, označenou „b“. Sledovali sme tržby celkom v mil. €,počet montážnych skupín vo firme a systém uzatvárania okien. Údaje sú uvedené v tabuľke 1.3. Definujeme najskôr základné pojmy: štatistický súbor – súbor 36 firiem Nitrianskeho kraja štatistická jednotka – firma štatistické znaky – technológia výroby plastových okien, (kvalitatívny štatistický znak, alternatívny s dvomi obmenami znaku a, b) – Tržby celkom v mil. €, (kvantitatívny znak spojitý) – počet montážnych skupín vo firme, (kvantitatívny znak diskrétny ) – systém uzatvárania okien, (kvalitatívny znak množný s počet obmien znaku tri, L,S,P)
Úloha :Zatrieďte súbor firiem podľa znaku technológia výroby a systém uzatvárania okien vhodným spôsobom. Súbor zotriedime do kontingenčnej tabuľky ( tabuľka1.4 ): Tabuľka 1.4 Kontingenčná tabuľka k príkladu 1.1 - absolútne početnosti. Otázky? (odpoveď): Aký je celkový počet firiem? (36) Koľko firiem používa technológiou a? ( 16 ) Koľko firiem používa systém uzatvárania okien P? ( 11 ) Koľko firiem používa systém uzatvárania okien S a technológiu výroby b. ( 9 ).
Triedenie podľa kvantitatívnych znakov Triedenie podľa kvantitatívneho znaku (znakov) je proces usporiadania jednotiek do tried, ktoré získame usporiadaním variantov triediaceho znaku do rastúcej postupnosti a každej triede priradíme počty príslušných štatistických jednotiek. Tieto počty nazývame triedne početnosti a vzniknutú tabuľku, tabuľkou rozdelenia početností. Pri triedení štatistického súboru podľa kvantitatívneho znaku sa celkový počet štatistických jednotiek n v štatistickom súbore rozdelí do m skupín (tried) a to: a) ak je triediaci znak diskrétny a nadobúda iba málo variantov (orientačne ak m < 20), predstavuje každá jeho konkrétna obmena samostatnú triedu. b) ak je triediaci znak diskrétny s veľkým počtom variantov (orientačne ak ) alebo znak spojitý, zostavia sa triedy tak, že ich tvorí vždy určité rozpätie hodnôt znaku, triedny interval. Kvantitatívne štatistické znaky sa spravidla označujú veľkými písmenami z konca abecedy X, Y, Z a pod. Každý kvantitatívny štatistický znak je vlastne premenná veličina, ktorá v štatistickom súbore nadobúda rôzne hodnoty. Jednotlivé obmeny štatistického znaku X potom označujeme
Príklad 1.2 Zotrieďte súbor 36 firiem z príkladu 1.1 podľa triediaceho znaku počet montážnych skupín. Počet montážnych skupín je diskrétny štatistický znak s malým počtom obmien (6), preto zvolíme triedenie do radu rozdelenia početností s triedami rovnými priamo obmenám štatistického znaku zoradenými od najmenšej hodnoty po najväčšiu. Výsledné triedenie je uvedené v tabuľke 1.7. Otázky ? a ( odpovede).: Koľko firiem má 3 montážne skupiny ? ( 10 ) Koľko percent firiem má 6 montážnych skupín ? ( 8,33 % ) Koľko PD v súbore má maximálne 4 montážne skupiny ? ( 27 ) Koľko percent PD má v súbore maximálne dve montážne skupiny ? ( 22,22 % )
Pri triedení podľa diskrétneho štatistického znaku s veľkým počtom obmien, alebo spojitého znaku je potrebné pred samotným triedením stanoviť : - počet tried m tj. počet skupín ( intervalov ), do ktorých sa rozdelí štatistický súbor, - šírkuh ( rozpätie ) intervalov. Pri stanovení počtu tried a šírky intervalov treba mať na zreteli, že intervalovým triedením sa zastrie časť pôvodných informácií o štatistickom súbore, ktoré sme mali k dispozícii pri individuálnych údajoch. Triedne početnosti udávajú iba počet jednotiek v príslušnej triede a zo zotriedených údajov sa už nedajú zistiť jednotlivé hodnoty znaku. Počet tried by nemal byť príliš malý, aby sa nestratila základná vypovedacia schopnosť údajov v štatistickom súbore. Na druhej strane ani veľký počet tried nie je žiaduci, lebo dochádza k zníženiu prehľadnosti triedenia a zastretiu určitých čŕt charakteristických pre rozloženie hodnôt znaku v súbore. Na stanovenie počtu tried nie je nijaké pevné pravidlo. Niektorí autori odporúčajú stanoviť počet intervalov od 5 do 20, pričom vychádzajú z prepočtu :
So stanovením počtu tried úzko súvisí aj stanovenie šírky (rozpätia) intervalov. Triedne intervaly sú jednoznačne stanovené, ak je určená jeho dolná (DH) a horná hranica (HH). Rozdiel medzi dolnou a hornou hranicou je šírka (rozpätie) intervalu. Triedne intervaly môžu byť: • s rovnakou šírkou intervalu, kedy rozpätie každej triedy je rovnaké • s nerovnakou šírkou intervalu, kedy rozpätie zvolených tried je rôzne. • Z hľadiska ďalšieho spracovania údajov štatistického súboru je výhodné voliť pre triedne intervaly rovnakú šírku, aj keď v niektorých prípadoch si však charakter skúmaného znaku vyžaduje voliť triedne intervaly s nerovnakým rozpätím. • Pre stanovenie šírky intervalu opäť neplatí žiadne jednoznačné pravidlo, avšak rozpätie intervalu závisí od rozdielu maximálnej a minimálnej hodnoty znaku a od počtu tried. Približne sa dá určiť zo vzťahu:
V niektorých prípadoch sa necháva prvý a posledný interval otvorený, tj. na začiatku rozdelenia nemá stanovenú dolnú hranicu, alebo na konci rozdelenia nemá posledný interval hornú hranicu. K takto stanoveným intervalom je však vhodné uviesť dodatočné informácie o štatistických jednotkách. Výsledkom triedenia podľa kvantitatívneho diskrétneho znaku s veľkým počtom obmien a podľa kvantitatívneho znaku spojitého je opäť rad rozdelenia početností resp. intervalové rozdelenie početností v tvare tabuľky (tabuľka 1.7 ).
Podľa toho, koľko triediacich znakov sa pri triedení používa, rozoznávame: • jednostupňové (jednoduché) triedenie, ak sa štatistický súbor triedi iba podľa jedného znaku • viacstupňové (kombinačné) triedenie, ak sa štatistický súbor triedi súčasne podľa viacerých štatistických znakov. • Prezentácia údajov • Grafické zobrazenie často poskytuje rýchlu a prehľadnú predstavu o tendenciách a charakteristických rysoch analyzovaných javov. Grafické zobrazenie je tiež účinným popularizujúcim prostriedkom štatistických výsledkov. O niektorých z nich sa teraz stručne zmienime. • Rozdelenie početností sa môže graficky znázorniť polygónom rozdelenia početností. V súradnicovom systéme spojíme úsečkami body o súradniciach ( ), pre i = 1, 2, ..., m, kde sú hodnoty znaku a im zodpovedajúce absolútne početnosti početností. Ak nahradíme absolútne početnosti, relatívnymi početnosťami , obdržíme polygón relatívnych početností. • Pre údaje o počte montážnych skupín z tabuľky 1.7 je polygón rozdelenia početností na obrázku 1.1.
Pre grafické vyjadrenie intervalového rozdelenia početností sa najčastejšie používa histogram početností. Jedná sa o stĺpcový graf tvorený pravidelnými rovnobežníkmi, ktorých základne majú dĺžku zvolených triednych intervalov a výšku zodpovedajúcu veľkosti príslušných triednych početností ( absolútnych alebo relatívnych ). Histogram rozdelenia početností z tabuľky 1.8 pre štatistický znak tržby uvádzame na obrázku 1.2.
Inou formou grafu sú bodové diagramy. Jedná sa o body umiestnené v súradnicovej sústave. Slúžia k znázorneniu závislosti medzi dvoma kvantitatívnymi znakmi, podrobnejšie sa s bodovými grafmi oboznámime neskoršie pri korelačnom počte. K vyjadreniu štruktúry obmien štatistického znaku slúžia kruhové grafy. V kruhových grafoch sú znázornené triedne početnosti kruhovým výsekom, ktorý je úmerný podielu jednotlivých tried na celku. Kruhový graf pre zobrazenie rozdelenia početnosti počtu montážnych skupín v príklade 1.1 je na obrázku 1.3.