1 / 51

STATISZTIKA II. 2. Előadás

STATISZTIKA II. 2. Előadás. Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék. Mintavétel. A mintából való következtetés az induktív statisztika lényege. Két alapvető feladata:

Download Presentation

STATISZTIKA II. 2. Előadás

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISZTIKA II.2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék

  2. Mintavétel A mintából való következtetés az induktív statisztika lényege. Két alapvető feladata: Becslés: a mintából számított jellemzők alapján közelítjük a sokasági jellemzők értékét. Hipotézisvizsgálat: a sokaságra tett bizonyos feltevések (hipotézisek) minta alapján történő statisztikai megerősítése vagy cáfolása.

  3. A becslés és a hipotézisvizsgálat feladatainak csoportosítása: • milyen sokasági jellemzőt vizsgálunk • milyen, mekkora és mennyi a minta száma • milyen feltételezéseket teszünk illetve fogadunk el a vizsgálat során.

  4. Véletlen mintavételi tervek Független, azonos eloszlású (FAE) minta: független, azonos eloszlású elemekből álló minta. Véges sokaságból, azonos valószínűségű, visszatevéses kiválasztással vagy végtelen sokaságból azonos valószínűségű kiválasztással nyert minta. Egyszerű véletlen (EV) minta: Véges sokaságból azonos kiválasztási valószínűséggel, visszatevés nélkül választott minta. (Komplett lista szükséges)

  5. Statisztikai becslések Sok területen, eltérő módon végzünk közelítő számításokat – becslés kifejezés használata (értékösszeg becslése osztályközös gyakorisági sorból, hiányzó adatok becslése adatfelvételkor) Becslés: a sokasági jellemzők értékének minta alapján történő közelítő meghatározása. • Pontbecslés - egy sokasági jellemzőnek egy ponttal való becslése (a mintából egy értéket határozunk meg). • Intervallumbecslés - egy sokasági jellemzőnek egy intervallummal történő becslése (alsó és felső határ).

  6. Pont és intervallumbecslés Sokasági érték Sokasági érték Pontbecslés Intervallumbecslés

  7. – Pontbecslés (Intervallumbecslés) – Hipotézisvizsgálat

  8. Pontbecslések Becslőfüggvény (estimator) a mintaelemekre épített függvény, amely alkalmas arra, hogy segítségével pontbecsléseket készítsünk. A becslőfüggvény mintáról mintára állandó, de a minták változnak, maga a becslés (estimate) vagy maguk a becsült értékek változók. A pontbecslések értékei is mintáról mintára változnak, és ha a minta véletlen (valószínűségi) minta, akkor a becslések valószínűségi változókként viselkednek. A becslőfüggvényeket ekkor a momentumaikkal és eloszlásukkal jellemezhetjük.

  9. Becslőfüggvények és becslések értékelése Általánosan a keresett sokasági jellemző: Θ; θ A becslés: kalap: Becsülhető pl. • Sokasági átlag • Értékösszeg • Szórás • Arány

  10. Becslőfüggvények és becslések értékelése Pontbecsléskor egy sokasági jellemző becslésére több becslőfüggvény is készíthető pl. sokasági átlag (várható érték): - mintaátlag, - minta mediánja, - legkisebb és legnagyobb mintaelem számtani átlaga. Becslőfüggvény: jó – jobb – legjobb Leggyakrabban a változók első két momentumát használjuk becslési kritériumként. ?????

  11. Momentumok • A eltérések r-edik hatványaiból számított számtani átlag. • Az r-edik momentum (A=0): súlyozatlan: súlyozott: vegyük észre, hogy:

  12. Centrális momentumok • Ha , az r-edik centrális momentum: • súlyozatlan: súlyozott: • vegyük észre, hogy:

  13. Becslőfüggvények és becslések értékelése Becslési kritériumok • Torzítatlanság • A becslőfüggvény becsült értéke megegyezik a becsülni kívánt sokasági jellemzővel • Konzisztencia • Nagy minta esetén a becsült érték nagy valószínűséggel közelítse meg a sokasági jellemző értéket. A torzítás mértéke egy megengedett határon belül marad. • Hatásosság • A becslés szórása (standard hiba) a lehető legkisebb legyen.

  14. Torzítatlanság, torzítás • Torzítatlanság (a becslőfüggvény tulajdonsága): az összes lehetséges mintán számított becslések várható értéke megegyezik a becsülni kívánt sokasági jellemzővel (a becslések a cél körül szóródnak). Várható érték Sokasági jellemző

  15. Két torzítatlan becslőfüggvény közül azt tekintjük jobbnak, amelyiknek az összes lehetséges mintán értelmezett varianciája kisebb.

  16. Minimumvariancia (minimális variancia kritérium) (a torzítatlan becslőfüggvény tulajdonsága): két vagy több torzítatlan becslőfüggvény közül az, amelyiknek legkisebb a szórásnégyzete (varianciája).

  17. Torzítatlanság és a variancia esetei Torzítatlan, kis variancia Torzítatlan, nagy variancia Torzított, kis variancia Torzított, nagy variancia

  18. EV (visszatevés nélküli) mintaalapsokaság: 1, 5, 10, 12

  19. Torzítatlanság, torzítás Várható érték Sokasági jellemző Torzítás (bias)

  20. Torzított becslés esetén Átlagos négyzetes hiba - Mean Square Error (MSE): a variancia és a torzítás négyzetének összege

  21. Aszimptotikus vagy nagymintás elmélet • Aszimptotikusan torzítatlan becslőfüggvény véges minták esetén torzított, de ez a torzítás a mintanagyság minden határon túl történő növelésével 0-hoz tart. Ha érvényesül akkor aszimptotikusan torzítatlan

  22. Aszimptotikus vagy nagymintás elmélet A gyakorlati statisztika több száz vagy több ezer elemű mintái már igen nagynak tekinthetők. A gyakorlati statisztika széles körben használja a közelítő nagymintás eredményeket.

  23. Korrigált tapasztalati variancia: torzítatlanul becsüli a sokasági varianciát. (Excelben a SZÓRÁS függvény ezt használja fel. A SZÓRÁSP az alapsokaságból számított szórást adja.)

  24. Konzisztencia Konzisztencia (a becslőfüggvény tulajdonsága): a becslőfüggvény torzítatlan vagy legalább nagy minták esetén torzítatlan és varianciája a mintanagyság növelésével 0-hoz tart. Kedvező tulajdonság, mivel elegendően nagy minta esetén egészen kis szóródással tetszőlegesen közel juthatunk a becslés tárgyához, azaz becslésünk pontossága nagy lesz.

  25. Pontbecslés módszerei Analógia Legkisebb négyzetek elve Maximum likelihood elv Momentumok módszere Rendszerint a sokaságot elemeivel adjuk meg. A megfelelő eloszlás jellemzőit, paramétereit kell becsülni.

  26. Pontbecslés módszerei • Analógia A mintában a vizsgálni kívánt sokasági mutatónak megfelelő mutatót határozzuk meg, és alkalmazzuk becslőfüggvényként. SokaságMinta átlag átlag szórás szórás arány arány

  27. Pontbecslés módszerei (Analógia) sokasági átlag mintaátlag A sokasági és a mintaelemekkel ugyanazokat a műveleteket végeztük el. Kivétel pl. a sokasági értékösszegnek a mintából történő becslésekor a N/n-szeresével célszerű becsülni.

  28. Pontbecslés módszerei (legkisebb négyzetek elve) • Legkisebb négyzetek módszere (LKN) általában tetszőleges modell, szűkebb értelemben valószínűségeloszlás illesztésére szolgáló módszer. Olyan paramétereket keres, melyek esetén a megfigyelt és a modellből számított értékek eltérés négyzetösszege (euklideszi távolsága) minimális. nagyon széles körben elterjedt

  29. Pontbecslés módszerei (momentumok módszere) • Momentumok módszere: (ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a sokaság elméleti, és a nekik megfelelő mintabeli empirikus momentumok megegyeznek.

  30. Pontbecslés módszerei (momentumok módszere) Pl. exponenciális eloszlás esetén a sokasági paraméter az eloszlás várható értéke (első elméleti momentuma), ennek becslőfüggvénye a minta első (empirikus) momentuma, azaz a minta átlaga. Ez a módszer elég általános feltételek mellett konzisztens becslőfüggvényt eredményez.

  31. Pontbecslés módszerei (maximum likelihood módszer, ML) • Maximum likelihood módszer: (ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a leginkább hihető (valószínű), hogy a kiválasztott minta a megfelelő eloszlásból származik.

  32. Pontbecslés módszerei (maximum likelihood módszer, ML) Ha egy sokaságban jó (0) és selejtes (1) darabok vannak, és a selejtesek P arányát akarjuk becsülni kételemű mintákból, akkor visszatevéses esetben (FAE) a lehetségesmintákat és azok bekövetkezésivalószínűségét a következő táblázat mutatja:

  33. A 2. oszlop az ún. likelihood függvény, ami az egyes lehetséges minták bekövetkezésének valószínűségét adja. (2. és 4. eset)

  34. Pontbecslés módszerei (maximum likelihood módszer, ML) Az ML-lel készült becslőfüggvények konzisztensek, és végtelenbe tartó mintanagyság esetén minimális varianciájúak, határeloszlásuk (a becslések eloszlása nagy minták esetén) normális.

  35. Intervallumbecslés Az intervallumbecslés azt keresi, hogy melyik az az intervallum (alsó és felső határ), amelyik előre meghatározott nagy (pl. 95%-os) valószínűséggel tartalmazza a becsülni kívánt jellemzőt - konfidencia-intervallum Ismételt mintavétel esetén az esetek átlagosan (1-α)*100 százalékában igaz, az hogy az intervallum lefedi (tartalmazza) a keresett sokasági jellemzőt. Megbízhatósági (konfidencia) paraméter

  36. Intervallumbecslés Normális eloszlású sokaság esetén a mintaátlag is normális eloszlású

  37. Intervallumbecslés z változó standard normális eloszlást követ Annak a valószínűsége, hogy a z változó egy (z1,z2) intervallumba esik (Standard normális eloszlásfüggvény értékeinek táblázata)

  38. Intervallumbecslés a standardizált változó egy szimmetrikus (-z, z) intervallumba esése

  39. Intervallumbecslés hibahatár hibahatár

  40. Intervallumbecslés A napi értékesítés normális eloszlású. Feltételezhető, hogy a szórás 6 db. Készítsen nagy (95%-os) megbízhatósággal intervallum becslést (a 48 nap adata alapján) az ismeretlen sokasági várható értékre.

  41. Intervallumbecslés

  42. Intervallumbecslés A mintavételt 10 alkalommal elvégezve a következő eredményeket kaptuk (66 darabos átlagot feltételezve):

More Related