620 likes | 840 Views
Kvantitatív módszerek. Készítette: Dr. Kosztyán Zsolt Tibor kzst@vision.vein.hu http ://vision.vein.hu/~kzst/oktatas/km/index.htm. 1. A Kvantitatív módszerek c. tárgy célja.
E N D
Kvantitatív módszerek Készítette: Dr. Kosztyán Zsolt Tibor kzst@vision.vein.hu http://vision.vein.hu/~kzst/oktatas/km/index.htm 1.
A Kvantitatív módszerek c. tárgy célja • Oktatási cél: A hallgatók megismerjék a legfontosabb mennyiségi módszereket, melyeket mind a termelésirányításban, mind a projektek, mind pedig a logisztika területén hatékonyan tudnak alkalmazni. Ezenkívül a hallgatók ismerkedjenek meg a legfontosabb statisztikai módszerekkel.
A tárgy oktatói Előadók: • Dr. Csizmadia Tibor (egyetemi adjunktus) • Dr. Kovács Zoltán (egyetemi tanár) • Dr. Kosztyán Zsolt Tibor (egyetemi adjunktus, tárgyfelelős) Gyakorlatvezetők: • Hegedűs Csaba (Ph.D hallgató) • Kiss Judit (Ph.D hallgató)
Tantárgyi tematika • 1: Matematikai-statisztikai módszerek és elemzések (hipotézis vizsgálat, többváltozós regresszió számítás, keresztmetszeti és idősoros vizsgálatok problémái, kezelése) • 2: Szimuláció: Monte Carlo módszerek. Szoftvercsomagok szolgáltatásai, alkalmazásuk a mennyiségi problémák megoldásánál. • 3: Lineáris programozási feladatok alkalmazása (termelési és szállítási feladatok). Sorbanállási modellek. Készletgazdálkodási modellek kezelése. Előrejelzés KZST KZ CST
Matematikai statisztika • A statisztikai megfigyelés véletlen tömegjelenségekre irányul. • A statisztikai minta véletlen jelenségre vonatkozó véges számú megfigyelés eredménye. Események bekövetkezésének, illetve be nem következésének hosszú megfigyelés során valószínűsége van.
Hipotézisvizsgálat • A statisztika egyik fő alkalmazási területe a döntések alátámasztása statisztikai hipotézisek vizsgálatával. • Null-hipotézis (H0): különbség hiányát állítja • Alternatív hipotézis (Hl): különbség meglétét állítja
Hipotézisvizsgálat • A nullhipotézis ismeretében egy próbastatisztikát számítunk, amelynek ismerjük az eloszlását. Az eloszlást ismerve megmondhatjuk, milyen valószínűséggel kaphatunk egy próbastatisztika értéket, ha a hipotézis igaz. • Ha a valószínűség kicsi, a hipotézist elvetjük, azaz valószínűtlen, hogy H0 igaz lenne.
Hipotézisvizsgálat • Elsőfajú hiba: H0 igaz, de elvetjük • A hiba elkövetési valószínűségét szignifikancia-szintnek nevezzük • (p=0,05) 95%, hogy H0 igaz • Másodfajú hiba: H0 nem igaz, de elfogadjuk. Baloldali tesztek Kétoldali tesztek Jobboldali tesztek H0 = H1 < H0 = H1 > H0 = H1 ≠
Statisztikai próbák • Parametrikus próbák: normál eloszlású minták • két mintát kell összevetnünk • Átlagok azonosak-e: kétmintás t-próba • Szórások azonosak-e: F-próba • Nem parametrikus próbák: teszt alkalmazása nem függ a változók eloszlásától; függetlenség- és homogenitás vizsgálat – c2próba, KS-próba
Összefüggés-vizsgálat • Több megfigyelt tényező hogyan függ egymástól • Ellenőrzött, laboratóriumi körülmények között az összefüggés függvénykapcsolatként írható le. • A társadalomtudomány területén előforduló jelenségek annyira bonyolultak, hogy az események bekövetkezése sokszor a véletlentől is függ.
Összefüggés-vizsgálat • Sztochasztikus kapcsolat: a független változó értéke nem határozza meg egyértelműen a függő változó értékét, (pl. véletlenszerűen ingadozik egy legvalószínűbb érték körül.)
Összefüggés-vizsgálat • Egyik változó változásával a másik milyen irányba és mennyit változik? REGRESSZIÓ-ANALÍZIS • Két változó között milyen irányú és mennyire szoros kapcsolat van? KORRELÁCIÓ-ANALÍZIS
Regresszió-analízis • Két változó kapcsolatát leíró függvényt kapjuk eredményül. • Sokszor feltételezünk ok-okozati kapcsolatot, de a vizsgálat nem bizonyítja azt! • Grafikusan pontdiagramra fektetett egyenes, ha lineáris összefüggést feltételezünk.
Regresszió-analízis - SPSS H1 SSR SSE SST H0 H1
Determinációs együttható négyzete: “Residual” “Regression” “Total”
Regresszió-analízis • A regressziós egyenes a vizsgálati tartományon belül érvényes, azon túl, hosszabb távon nem alkalmas predikciós célokra • A regressziós egyenes egyenlete:Y=függő/magyarázott változó X=független/magyarázó változó • Kapcsolat lehet pozitív ↗↗ , vagy negatív↗↘ • Egyenes illesztése legkisebb négyzetek módszerével történik.
Regresszió-analízis alkalmazhatóságának feltételei • E(u)=0 • VAR(u)=s2 • A hibatagok függetlenek egymástól. • x és u függetlenek. • u ~ N(0,s)
Többváltozós regresszió-analízis x1 y1 Nem feltétlen, de legtöbb esetben jó közelítésként használható. Ha a linearitás nem teljesül, akkor át kell konvertálni olyan modellé, amely kölcsönösen egyértelmű az eredeti modellünkre. Az alkalmazhatóság feltételei megegyeznek a lineáris regressziós modell alkalmazásának feltételeivel. x2 • Lineáris-e a regresszió? • Mit jelent a korrelációs együttható értéke? • Milyen feltételek mellett használható a lineáris regressziós modell? y2 x3 R=1 esetén: LINEÁRIS függvénykapcsolat a magyarázó és a magyarázott változók között! R=0 esetén: nincs LINEÁRIS függvénykapcsolat a magyarázó és a magyarázott változók között! R=-1 esetén: (negatív) LINEÁRIS függvénykapcsolat van x és y között! yn xk • E(ui)=0, i :=1,2,…,n (szisztematikus hibát nem vétettünk) • var(ui)=s2, i :=1,2,…,n (nincs heteroszkedaszticitás) • ui és uj függetlenek minden i-re és j-re (nincs autokorreláció) • xi determinisztikus nem valószínűségi változó • ui ~N(0,s2), i :=1,2,…,n • az xj-k között nincs lineáris összefüggés (nincs multikollinearitás)
Többváltozós regresszió-analízis • Magyarázó változók redukálása: • Miért? • Hogyan? • Összes lehetséges megoldás • FORWARD eljárás • BACKWARD eljárás • STEPWISE eljárás Kevesebb magyarázó változó → Kisebb a hiba varianciája. DE! torzított lesz a becslés! Fokozatos „beléptetés”. Mindig a legnagyobb parciális korrelációval rendelkező változót veszi be. Fokozatos „kiléptetés”. Mindig a legkisebb parciális korrelációval rendelkező változót veszi ki. Minden iterációban léphetnek be és léphetnek ki is elemek. Viszont a probléma nem lineáris. Nem biztos, hogy optimális lesz a megoldás.
2. példa • Mi hat a jövedelemre? • Feltételezhetjük pl., hogy • Az iskolai végzettség/elvégzett iskolai osztályok • A munkavállaló neme • A munkavállaló kora • ? • Modell egyenlet: FOJOV=b0+b1ISKOSZT+b2NEME+b3KOR+u Dummy-változó
Eredmények (1) Valamennyi magyarázó változó szükséges! Kicsi a magyarázó képesség! A modellünk és a magyarázó változóink is szignifikánsak!
Javítási lehetőségek • A magyarázóképesség javítására: • Új változók keresése (pl. a település típusa, foglalkoztatás
Korreláció-elemzés • Függ-e egymástól két változó? • A változók normál eloszlásúak • Korrelációs együttható, vagy determinációs tényező (r): Két adatsor (minta) közötti lineáris összefüggés erősségét mérő szám.
Korreláció-elemzés • Pearson féle korrelációs együttható: r • -1<=r<=1 • Nincs kapcsolat, ha értéke nulla, vagy ahhoz közeli. • Az összefüggés jellemzésére az r számértéke alapján különböző fokozatokat állítottak fel. r=±1 1>|r|≥0,75 0,75>|r|≥0,5 0,5>|r|≥0,25 0,25>|r|≥0 r=0 Függvénykapcsolat Nagyon szoros kapcs. Szoros kapcsolat Laza kapcsolat Nagyon laza kapcs. Nincs kapcsolat
Modellek x11 y11 x1 X1 a b y1 Y1 x12 y12 x2 y2 x3 y1t x1n xm1 yp1 Xm ym xn xm2 Yp yp2 ypq c xmk • (lineáris) regressziós modell • kovariancia-analízis • X és Y sokszor nem mérhető közvetlenül. => Főkomponens analízis, faktor analízis. • Nem csupán a modellredukció a fontos, hanem a modell helyességének vizsgálata is! d Az ok-okozati kapcsolatok felderítése a fontos => Útelemzés
Ok-okozati vizsgálatok • Keresztmetszeti vizsgálatoknál nem lehet megnyugtatóan meghatározni az okot és okozatot! • Módszer: • Útelemzés • Ahhoz, hogy a minden kétséget kizáróan el tudjam dönteni, hogy mi az ok és mi az okozat, longitudinális vizsgálatra van szükség.
a b Közvetlen Közvetett c d ! Útelemzés • Többszörös lineáris regresszió alkalmazása. • Az utak erősségét is ki lehet számítani. • Logikailag nehezen vitatható ok-okozati összefüggés kell. • Csak nagyszámú mintaadatbázison alkalmazható. (min 200 elem)
További lehetőségek • Érzékenység-vizsgálat • Szimuláció Ezek azonban nem igazán használható módszerek, ugyanis a szimuláció nem biztos, hogy visszaadja a tényleges ok-okozati kapcsolatot. • Megoldás: longitudinális vizsgálatok. • Legalább két ((időben is) független) mérés összehasonlítása.
Sztochasztikus folyamatok • A sztochasztikus folyamatoknál beszélhetünk folytonos és diszkrét idejű esetről. • Egy sztochasztikus folyamat • A T halmazt időnek nevezik. A sztochasztikus folyamatot folytonos idejű folyamatnak nevezzük, ha , és diszkrét idejű folyamatnak, ha
Az idősorelemzés modelljei • Determinisztikus modell (előre meghatározott pályát követnek az idősorok) • Leíró • Hosszú távú hatások • Véletlennel keveset foglalkozik • Sztochasztikus idősorelemzés • Rövid távú hatásokkal foglalkozik • Véletlennek fontos szerepe van
Idősor komponensei • Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. • Szezonális vagy idényszerű ingadozás: szabályos időszakonként visszatérő, állandó periódushosszúságú hullámzás, amely mindig azonos irányban téríti el az idősor értékét az alapirányzattól. (pl. fagyifogyasztás) • Ciklus: trend alatti vagy feletti tartósabb mozgás. Szabálytalan periodikus ingadozás, általában hosszabb idősoroknál figyelhető meg. (pl. gazdasági ciklusok) • Véletlen ingadozás
Az egyes komponensek közötti kapcsolat Multiplikatív kapcsolat: Additív kapcsolat perióduson belüli rövidebb időszakok(pl. negyedévek) periódusok (pl. évek)
Stacionaritás • Az y jelenség időbeni lefutása: • stabil, • előre jelezhető, • nincs trendhatás • Időfüggetlen: • várható érték, • variancia, • autokovariancia
Idősor analízis – ARIMA-modellek • ARIMA(p,0,0)=AR(p) p-ed rendű autoregresszív folyamatok • ARIMA(0,0,q)=MA(q) q-ad rendű mozgóátlag folyamatok
Idősor analízis – ARIMA-modellek • ARIMA(p,0,q)=ARMA(p,q)=AR(p)+MA(q) p-ed rendű autoregresszív folyamatok + q-ad rendű mozgóátlag folyamatok • Integrált autoregresszív és mozgóátlag folyamatok, ARIMA(p,d,q) modellek: • Derivált idősor: • Második derivált sor: • j-edik derivált sor:
A modellkészítés menete (1) • Az ARIMA modellezés kiindulópontja annak megállapítása, hogy a vizsgálni kívánt idősorunk stacionárius-e, illetve, ha nem, akkor az, hogy alkalmas transzformációval stacionáriussá tehető-e. Ezzel eldöntöttük azt, hogy az adott idősorhoz illeszthető-e ARIMA modell; ha igen, milyen (d) dimenzióval rendelkezik. • Az ARIMA(p,d,q) d-edik derivált sora ARMA(p,q) rendű folyamat!
A modellkészítés menete (2) • A következő kérdés annak megválaszolása, hogy milyen típusú ARMA modell illesztésével próbálkozzunk, illetve milyen legyen az autoregresszivitás (p) és/vagy a mozgóátlagolás (q) rendje. Erre a kérdésre a választ a tapasztalati, vagy a transzformált idősor ACF és PACF értékei alapján adjuk meg. A modellezés ezen fázisát modellazonosításnak (identifikációnak) nevezi a szakirodalom.
ACF, PACF • Autokovariancia függvény (AVF): • Autokorrelációs függvény (ACF): • Parciális autokorrelációs függvény (PACF):
Modellbecslés ACF és PACF segítségével ModellACFPACF MA(q) q-ad rendű MA folyamatEltűnikLecsenga q. tag után AR(p): p-ed rendű AR folyamatLecsengEltűnika p. tag után ARMA(p,q)=AR(p)+MA(q) Lecseng Lecseng ARMA(p,q)= AR(p)+MA(q)EltűnikEltűnik a q. tag után a p. tag után Sem AR, semMANincs szig.Nincs szig.(fehér zaj vagyvéletlen folyamat)értékérték
MA(1) 0<c1 0<c1 PACF ACF 0>c1 0>c1 PACF ACF