1.44k likes | 2.76k Views
ÁLTALÁNOS STATISZTIKA I. A statisztika definíciója. A statisztika: információk gyűjtése, feldolgozása és közzététele. A statisztika mint módszertudomány , magában foglalja a statisztikai fogalmak, módszerek elméleti ismereteit; a különböző szakstatisztikák speciális ismereteit;
E N D
A statisztika definíciója. A statisztika: információk gyűjtése, feldolgozása és közzététele. A statisztika mint módszertudomány, magában foglalja • a statisztikai fogalmak, módszerek elméleti ismereteit; • a különböző szakstatisztikák speciális ismereteit; • az információk gyűjtéséhez, feldolgozásához szükséges módszertani ismereteket.
A statisztika definíciója. (folyt.) A mindennapi gyakorlatban a statisztikai munka: • végezhető főtevékenységként (hivatalos statisztikai szolgálat) • végezhető egy adott tudományág művelésében segédtevékenységként (pl. csillagászat, gyógyszerkutatás, stb.)
A főtevékenységként végzett statisztikai munka: közszolgáltatási tevékenység. • 1993. évi XLVI. Törvény a statisztikáról „A statisztika feladata és célja, hogy valósághű, tárgyilagos képet adjon a társadalom, a gazdaság, a tulajdonviszonyok, a környezet állapotáról és változásairól. A statisztikai tevékenység ellátása a hivatalos statisztikai szolgálat feladata.” • A hivatalos statisztikai szolgálat által létrehozott termékek és szolgáltatások ingyenesek. A szolgálat működését az állami költségvetésben erre a célra előirányzott pénzügyi támogatás biztosítja.
A statisztikai tevékenység termelési folyamata. • Kiindulópont: a felhasználói igények felmérése és lefordítása a statisztikai fogalmak nyelvezetére. • Az ezt követő termelési folyamat fő szakaszai: • az adatgyűjtések tervezése és szervezése; • a begyűjtött elemi adatok ellenőrzése és feldolgozása; • a statisztikai adatok közzététele, tájékoztatás.
Mi a statisztikai adat? • A statisztikai adatgyűjtés egy adott sokaság egyedeire vonatkozik, melynek során az egyedek különböző tulajdonságainak (ismérveinek) a megfigyelés időpontjában fennálló állapotát rögzítik. Így keletkeznek az elemi (vagy egyedi) adatok. • Az elemi adatokkal különböző műveleteket végeznek, melynek eredményei azok a statisztikai adatok, amelyekkel gyakorlatban találkozunk.
A STATISZTIKAI ADAT ÁLTALÁNOS LEÍRÁSA. elemi adatok statisztikai adat (vállalat, háztartás, termék) (termelési érték, létszám, lakóhely) a megfigyelési egység tulajdonságai (a megfigyelés időpontja) (a megfigyelési egységek sokasága) adatgyűjtés adatbevitel és javítás (osztályozások, csoportosítások) (műveletek) adatfeldolgozás
A statisztika alapfogalmai. 1) Sokaság. 2) Ismérvek. 3) Mérési skálák. 4) Statisztikai sorok. 5) Statisztikai táblák.
Sokaság. sokaság nem akarjuk v. tudjuk megfigyelni a regiszter lefedési hibái célsokaság felvételi keret minta-sokaság
Sokaság. (folyt.) Célsokaság: azon egységek összessége, amelyre az adott statisztikai felvételből számított adatok vonatkoznak. Felvételi keret: a célsokaságba tartozó egyedek azon halmaza, amelynek megfigyelése egy adott felvétellel történik. A célsokaság helyett a tényleges felvétel lehetőségét a keretsokaság biztosítja, de a következtetések a célsokaságra vonatkoznak. Mintasokaság: a vizsgált sokaságnak egy olyan részsokasága, amelynek megfigyeléséből kapott eredményeket, becsléssel a célsokaság egészére vonatkoztatjuk.
Sokaság. (folyt.) Példa. Sokaság: Gazdasági szervezetek. Célsokaság: 5 főnél többet foglalkoztató gazdasági szervezetek. Felvételi keret: Adott időszakban működő 5 főnél többet foglalkoztató gazdasági szervezetek. Mintasokaság:A gazdasági szervezetekmintavételi terv alapján kiválasztott, 10%-a.
A sokaság nyilvántartása: a regiszter. Egy adott sokaságba tartozó azonosítható egyedek rendszerezett listája, mely tartalmazza az egyedek legfontosabb paramétereit is.
Regiszterek. • Népességnyilvántartás • Gazdasági szervezetek regisztere • Kiskereskedelmi regiszter • Gépjármű-nyilvántartás • Földnyilvántartás Tartalmuk: • Azonosítási paraméterek (név, cím, azonosító szám) • Réteg-paraméterek (tevékenység, méret, gazdálkodási forma) • Demográfiai paraméterek (keletkezés, megszűnés) • Kapcsolati paraméterek
Ismérvek. Mennyiségi ismérv: A sokaság egységeit jellemző olyan tulajdonság, mely számokkal fejezhető ki. (Például: életkor, a termelés nagysága, a foglalkoztatottak száma). Minőségi ismérv: A sokaság egységeit jellemző olyan tulajdonság, mely minőségi jellemzővel fejezhető ki. (Például: nem, foglalkozás, tevékenység). Területi ismérv: a sokaság egységeinek térbeli elhelyezkedése. Időismérv: a megfigyelés időpontja, időszaka.
Mérési skálák. Névleges: az ismérvértékek azonossága, vagy különbözősége állapítható csak meg (pl. nem). Sorrendi: egy ismérv szerinti sorba rendezés (pl. helyezési sorrend) Intervallum: a kezdőpont kiválasztása önkényes, így csaka skálaértékek különbségei adnak információt (pl. hőmérséklet) Arány: ezen a skálán a kezdőpont adott és rögzített (0), így minden matematikai és statisztikai művelet egyértelműen elvégezhető.
Statisztikai sorok. Leíró sorok: a sokaság különböző ismérvek szerinti adatainak felsorolása. Összehasonlító sorok: több sokaság adatainak, összehasonlítása, illetve egy sokaság különböző időszakra vonatkozó adatainak, összehasonlítása. Csoportosító sorok: a sokaság egyedeinek értékeit csoportosítjuk, egy adott ismérv szerint.
Statisztikai táblák. • Egyszerű tábla: csoportosítást nem tartalmaz, nincs összesen rovat (általában leíró sorokhoz használják). • Kombinációs tábla: két vagy több ismérv szerinti csoportosítást tartalmaz. • A statisztikai adatok pontossága. • Abszolút hiba: az utolsó szignifikáns számjegy helyértéke osztva kettővel. • Relatív hiba: az abszolút hiba és a közölt adat hányadosa. • Egy vállalkozás 2005.évi nettó árbevétele 25 218 ezer Ft volt. • Abszolút hiba(korlát): 500 Ft • Relatív hiba: 500:25218=0,0198 ~2%.
A statisztikai tábla kellékei. Táblacím. Mértékegység Forrás
A statisztikai tábla kellékei. A vendégforgalom megoszlása a motiváció szerint 2005-ben. százalék Forrás: KSH
A sokaság egy ismérv szerinti vizsgálata. • Rangsor, osztályközös gyakorisági és értékösszegsorok. • Középértékek. • Szóródási mutatók. • Koncentráció-mutató. • Momentumok. • Alakmutatók.
Rangsor. Egy áruházlánc napi forgalma millió Ft-ban boltonként A sokaság: egy áruházlánc boltjai Ismérv: a bolt napi forgalma Értékek: 14; 12,3; 15; 14; 12,6; 15,8; 15,2; 16,2; 17; 16,8; 17,6; 18,4; 19,4; 18,6; 20,2; 20,8; 21,8; 22,2; 23,2; 23; 24,8. Az értékeket növekvő rangsorba állítva: Rangsor: 12,3; 12,6; 14; 14; 15; 15,2; 15,8; 16,2; 16,8; 17; 17,6; 18,4; 18,6; 19,4; 20,2; 20,8; 21,8; 22,2; 23; 23,2; 24,8.
Osztályközös statisztikai sorok. • Az osztályköz-szám meghatározása:a „2” olyan hatványa, ami már nagyobb, mint a sokaság száma (a kitevő adja az osztályközök számát) • A példában:a sokaság száma N= 21; 2 az ötödiken (32) már meghaladja ezt az értéket, tehát az osztályközök száma (k): 5 A példában: 24,8 – 12,3 = 12,5 : 5 = 2,5 • Osztályköz-hossz meghatározása a rangsorból:
Osztályközös statisztikai sorok. • Az osztályköz-határok megállapítása: Úgy kell meghatározni, hogy az ismérvértékek egyértelműen besorolhatók legyenek valamelyik – de csak egy – osztályközbe. A valódi osztályköz határok azonban hézagmentesen illeszkednek. Ezért közlési osztályköz határokat állapítunk meg úgy, hogy az osztályközök felső határát egy egységgel csökkentjük. Példa: Valódi osztályközök Közlési osztályközök
Osztályközös gyakorisági sorok. Gyakoriság (fi): az osztályközbe tartozó ismérvértékek száma Relatív gyakoriság (gi): az ismérvértékek számának %-os megoszlása osztályközönként
Osztályközös gyakorisági sorok. Kumulálás: az osztályközök gyakoriságának, értékösszegének összeadása lépésről-lépésre lefelé, vagy felfelé: (f’i; g’i;S’i;Z’i) Az osztályközép kiszámítása: (az osztályközepeket a hézagmentesen igazodó valódi osztályköz határok alapján számítjuk ki) Például: 12,3+14,8 = 27,1: 2 = 13,55 ~ 13,6
Osztályközös értékösszeg-sorok. Értékösszeg (Si): az osztályközbe tartozó ismérvértékek összege Például az első osztályközben: 12,3+12,6+14+14=52,9 ~53 Relatív értékösszeg (Zi): az értékösszegek %-os megoszlása osztályközönként
Becsült értékösszeg-sor kiszámítása. Becsült értékösszeg (Ŝi): az osztályközepek megszorzása a gyakoriságokkal: Például: 4 * 13,6 = 54,4
Középértékek. • Számított középértékek számtani átlag mértani átlag harmonikus átlag négyzetes átlag • Helyzeti középértékek módusz medián
Számtani átlag. Példa. A Sziget fesztivál napi látogatóinak száma (ezer fő): 50,0; 53,2; 57,4; 60,0; 62,5; 64,6; 66,2; 68,8; 70,0. Mennyi a napi átlagos látogatószám? ezer fő
Transzformáció. Példa. A Sziget fesztivál napi látogatóinak száma jövőre mindennap 2 ezer fővel több lesz, azaz: 52,0; 55,2; 59,4; 62,0; 64,5; 66,6; 68,2; 70,8; 72,0. Mennyi lesz a napi átlagos látogatószám? ezer fő Transzformációval:
Transzformáció. (folyt.) Példa. A Sziget fesztivált 30-szor annyian nézik naponta a TV-ben, mint amennyien kilátogatnak egy-egy napon. (napi látogatók száma (e fő): 50,0; 53,2; 57,4; 60,0; 62,5; 64,6; 66,2; 68,8; 70,0) TV nézők száma (e fő): 1500; 1596; 1722; 1800; 1875; 1938; 1986; 2064; 2100. Mennyi a TV-nézők napi átlagos száma? ezer fő Transzformációval:
Súlyozott számtani átlag. Példa. Egy árusnál kínált görögdinnyék jellemzői: Mekkora a dinnyék átlagos súlya?
A számtani átlag tulajdonságai: • Az átlagolandó értékek és az átlag különbségének összege nulla. • Ha az átlagolandó értékekből levonunk egy konstans számot, és a különbségeket négyzetre emeljük, akkor az eltérések négyzetösszege akkor lesz a legkisebb, ha a konstans a számtani átlag. (Négyzetes minimum tulajdonság)
Mértani átlag. vagy a logaritmusok számtani átlaga. Hamburgerek eladása. Példa. Hány %-kal változott évente átlagosan a hamburgerek eladása 2001-ről 2005-re?
Súlyozott mértani átlag. Példa. Egy fapados légitársaság pilótái ennyi órát repültek egy adott napon: Átlagosan hány órát repültek aznap a pilóták? óra
Harmonikus átlag. Egy Forma1-es autóversenyen három versenyzőnél mért kerékcsere-idők (másodperc): 6,5; 7,1; 8,3. Átlagosan mennyi idő volt a kerékcsere? Példa. mp
Súlyozott harmonikus átlag. Példa. A fagylalt forgalma és ára három árusnál: Átlagosan mennyibe kerül egy gombóc fagylalt? Ft / gombóc
Négyzetes átlag. Példa. Egy mobiltelefonnal egy-egy napon készített fényképek száma: 5, 14, 18, 22, 55, 90, 120. Átlagosan hány db fényképet készítettek naponta? db
Súlyozott négyzetes átlag. Példa. Egy görkorcsolya-parkban a sportolni vágyó fiatalok ennyi időt töltöttek el adott napon: Átlagosan mennyi időt töltöttek a látogatók aznap a görkorcsolya-parkban?
A módusz. a.) Diszkrét változó esetén: a leggyakrabban előforduló ismérvérték. b.) Osztályközös gyakorisági sor esetén: 1.lépés: a legnagyobb gyakorisággal rendelkező osztályköz kiválasztása a példában a második osztályköz gyakorisága a legnagyobb (6)
2.lépés:a módusz értékének meghatározása a példában:
A módusz.(folyt.) Ha eltérő az osztályközök hossza, akkor a gyakoriságokat át kell számolni azonos hosszúságú osztályközökre. Példa. Egy uszodában az alábbi távokat úszták az emberek: * 500 m-es osztályköz-hosszúságra eső gyakoriságok
a.) Meghatározása rangsorból. Először megállapítjuk, hogy a rangsor hányadik tagja lesz. A példában az első kvartilis: A keresett kvantilis az ott található x érték. A rangsornak az ötödik értéke 15, a hatodik 15,2. A kettő közötti különbséget szorozzuk a sorszám tört részével 0,2 x 0,5 = 0,1 és hozzáadjuk az alsó értékhez Tehát az első kvartilis: 15,1 tagja a rangsornak
A példában a második kvintilis: tagja a rangsornak A keresett kvintilis az ott található x érték. A rangsornak a nyolcadik értéke 16,2 ; a kilencedik 16,8. A kettő közötti különbséget szorozzuk a sorszám tört részével: 0,6 x 0,8 = 0,48 és hozzáadjuk az alsó értékhez: 0,48 + 16,2 Tehát a második kvintilis: 16,68