200 likes | 335 Views
Veiksnių parinkimo problema. 2013-04-23. Veiksnių parinkimo problema. Veiksnių įtraukimo į regresiją procedūra Visų galimų regresijų metodas t kriterijaus taikymas parenkant statistiškai reikšmingus koeficientus (veiksnius). 1. Veiksnių įtraukimo į regresiją procedūra.
E N D
Veiksnių parinkimo problema 2013-04-23
Veiksnių parinkimo problema • Veiksnių įtraukimo į regresiją procedūra • Visų galimų regresijų metodas • t kriterijaus taikymas parenkant statistiškai reikšmingus koeficientus (veiksnius)
1. Veiksnių įtraukimo į regresiją procedūra • Veiksnių parinkimo žingsniai • Teorinis-loginis veiksnių sąrašas • Matematinė –statistinė parinkimo procedūra
Teorinis-loginis veiksnių sąrašo sudarymas • Praktinės taisyklės: • Veiksnių skaičius susijęs su stebėjimų skaičiumi (n>6k) • Vienas kintamasis vieno veiksnio įtakai aprašyti • Suminiai ir dėmenis sudarantys veiksniai į vieną regresiją netraukiami
Koreguotas determinacijos koeficientas - Koreguotas determinacijos koeficientas
Ysū = 43,39+ 0,78Xmū + e0.25 Ysū = 77,90+ 0,53Xtū +e 0.10 Ysū = 69,04+ 15,59Dvm+e 0.53 Ysū = 20,64+0,69Xmū+0,21Xtū + e 0,25 Ysū = 77,90+0,55Xmū +13,84vm+e 0.63 Ysū = 89,55+ 0,44Xtū+15,15Dvm +e 0.60 Ysū = 51,62+0,45Xmū+0,24Xtū+13,92Dvm+e 0.66 Visųgalimųregresijųmetodas
2. t- kriterijaus taikymas parenkant reikšminius veiksnius • Laipsniško veiksnių įtraukimo metodas Forward • Laipsniško veiksnių išmetimo metodas Backward • Kombinuotas metodas Stepwise
Forward procedūra • Pirmas žingsnis • Apskaičiuojame visas galimas porines regresijas • = f(X1), = f(X2) …= f(Xk) • Palyginame visas apskaičiuotas 1tb1 , 1tb2 ...1tbkstatistikas • Išrenkame didžiausią 1tbjstatistiką • Palyginame gautą 1tbjsu teorine statistikos tn-2, α/2reikšme • Jeigu 1tbj tn-2, ,α/2j veiksnį įtraukiame į regresiją
Forward procedūra • Antras žingsnis • Apskaičiuojame visas galimas dviejų kintamųjų regresijas • = f(Xj, X1), = f(Xj, X2), = f(Xj, Xk), • Palyginame visose regresijose naujai įtraukiamų kintamųjų įverčių apskaičiuotas 2tbj , 2tb2 ...2tbkstatistikas • Išrenkame didžiausią 2tbsstatistiką • Palyginame gautą 2tbssu teorine statistikos tn-3,α/2reikšme • Jeigu 2tbs tn-3,α/2, s veiksnį įtraukiame į regresiją
Forward procedūra • Forward procedūra baigiama: • kai įtraukti visi veiksniai • kai visos naujai įtrauktų veiksnių apskaičiuotos t statistikos mažesnės už tn-k-1, α/2
YPVM = -26,85+ 1,24XDU + e t-0,27 14,40 YPVM = 1318+ 2,86DII + e t 14,38 0,02 YPVM = 1303,16+ 63,63XIII + e t 14,24 0,35 YPVM = 1282,08+ 162,05XIV + e t 14,37 0,87 YPVM = -4616 +332,35XTR + e t -0,88 1,13 YPVM = 1181,94+ 766,265XIV + e t 17,11 4,70 Pvz. Forward metodas (PVZ. 2010)Pirmas žingsnist33;0,05/2= 2,03 Išvada: įtraukiam veiksnį XDU
YPVM = 11121,59+ 1,47XDU -630,47XTR+ e t-3,47 23,70 -7,59 Koreg. R2=0.94 YPVM = -4597,70+ 1,73XDU - 556,48Dkrizė +e t-3,47 14,93 -5,13 Koreg. R2=0. 91 YPVM = -62,48+ 1,24XDU + 157,882DIV +e t-0,66 15,18 2,15 Koreg. R2=0.87 Forward metodas Antras žingsnist32;0,05/2= 2,03
Backward procedūra • Pirmas žingsnis • Apskaičiuojame dauginę regresiją, įtraukdami visą kintamųjų sąrašą = f(x1, x2,...xk) • Surandame visų įverčių apskaičiuotas statistikas: 1tb1, 1tb2 ...1tbk • Išrenkame mažiausią 1tbjstatistiką Palyginame gautą statistikos 1tbj reikšmę su teorine tn-k-1,α/2reikšme Jeigu 1tbj tn-k-1,α/2, j veiksnio į regresiją netraukiame
Backward procedūra • Antras žingsnis • Apskaičiuojame dauginę regresiją be veiksnio j = f(x1, x2 ....xj-1,xj+1, ...xk) • Apskaičiuojame visų įverčių statistikas 2tb1 , 2tb2 ...2tbk • Randame mažiausią 2tbs statistiką • Palyginame gautą 2tbs su teorine statistikos tn-k-1,/2reikšme • Jeigu 2tbs tn-k-1 α/2, s veiksnį pašaliname iš regresijos
Backward procedūra • Backward procedūra baigiama: kai visos apskaičiuotos įverčių t statistikos didesnės už teorinę reikšmę tn-k-1 ,α/2
STEPWISE-kombinuota procedūra • Stepwise procedūros žingsnis pradedamas, kaip Forward procedūroje, ir tęsiamas, kaip Backward.
Veisniųstatistinionereikšmingumopriežastys • Objektyvi priežastis: • Veisnys nedaro įtakos nagrinėjamam reiškiniui • Modeliometikslumai: • Modelio formos parinkimo netikslumai • Neteisingai parinkta veiksnio priklausomybės matematinė išraiška (pvz. įtraukta tiesine forma, o sąveika yra netiesinio pavidalo) • Pažeista multikolinearumo prielaida • Būtina patikrinti veiksnių multikolinerumą
Nereikšmingas laisvasis narys b0 • Regresijos be laisvojo nario koeficientas R2 skaičiuojamas pagal skirtingas formules, todėl jų negalima lyginti • Regresijos lygties paklaidų suma ir paklaidų vidurkis nėra lygūs 0, t.y netenkinama klasikinė regresijos prielaida. • Todėl neverta skubėti eliminuoti laisvąjį narį iš regresijos lygties