210 likes | 502 Views
Regresi dengan Pencilan. Eni Sumarminingsih , Ssi , MM. Identifikasi Pencilan pada Y. Dalam beberapa analisis regresi seringkali ditemukan adanya amatan ekstrem , yaitu bernilai jauh dengan amatan yang lain dalam sampel
E N D
RegresidenganPencilan EniSumarminingsih, Ssi, MM
IdentifikasiPencilanpada Y Dalambeberapaanalisisregresiseringkaliditemukanadanyaamatanekstrem, yaitubernilaijauhdenganamatan yang lain dalamsampel Adanyaamatanekstremataupencilaninidapatmenyebabkan residual yang besardanseringkalimemilikiefek yang besarpadadugaanfungsiregresi yang menggunakanOLS sehinggapendugakoefisienregresimenjadi bias danatautidakkonsisten
Pencilanharusditelitidenganhati – hatiapakahsebaiknyaamataninidipertahankanataudihilangkan. Jikadipertahankan, efekpencilaniniharusdikurangi
SuatuamatandapatmenjadipencilanpadaY ataupadaX ataupadakeduanya
PendeteksianOutlier Untukpendeteksianpencilan , diperlukansuatumatriks yang dinamakan hat matrix yang dilambangkandenganH
Elemendiagonal darimatriksHmemberikaninformasitentang data observasi yang mempunyainilaileverage yang besar Elemen diagonal ke-idarimatriksH yang dilambangkandenganhiidiperolehdari:
Denganadalahvektorbaris yang berisinilai-nilaidarivariabelbebasatauindependendalampengamatanke-i. Padaelemen diagonal matriksH, diperoleh dimana p adalahbanyaknyapeubahdalammodel
Pendeteksianpencilanpada X Jikanilailebihbesardarimakapengamatanke-idikatakansebagaioutlier pada X (leverage point).
PendeteksianPencilanpada Y Hipotesisyang digunakanuntukmengujiadalah: H0 : Pengamatanke-ibukanoutlier H1 : Pengamatanke-imerupakanoutlier Statistikujiyang dapatdigunakanuntukmengujiadalahstudentized residual ataustudentized deleted residual yang didefinisikan:
PendeteksianPencilanpada Y Kriteriayang digunakanuntukmengujiadatidaknyaoutlieradalah dimana p adalahbanyaknyavariabelbebasditambahsatu
PendeteksianPengamatanBerpengaruh Pengamatanberpengaruh • merupakanpengamatan yang berpengaruhbesardalampendugaankoefisienregresi • memilikinilaigalatatausisaan yang besarataumungkin pula tidak, tergantungpada model yang digunakan
Metodeuntukmendeteksipengamatanberpengaruh • Cook’s Distance Cook’s Distance merupakanjarakantarapendugaan parameter dengan MKT yang diperolehdari n pengamatanatauobservasiyaitudanpendugaan parameter yang diperolehdenganterlebihdahulumenghapuspengamatanatauobservasike-iyaitu
Hipotesisuntukmengujiadanyapengamatanberpengaruhadalahsebagaiberikut:Hipotesisuntukmengujiadanyapengamatanberpengaruhadalahsebagaiberikut: H0 : Pengamatanke-itidakberpengaruh H1 : Pengamatanke-iberpengaruh kriteria yang digunakanuntukmengujihipotesistersebutadalahsebagaiberikut:
2. The Difference In Fits Statistic (DFITS) Hipotesisuntukmengujiadanyapengamatanberpengaruhadalahsebagaiberikut: H0 : Pengamatanke-itidakberpengaruh H1 : Pengamatanke-iberpengaruh merupakanpengaruhpengamatanatauobservasike-ipadanilaiduga yang didefinisikansebagai
MetodeuntukPenangananPencilan • MetodeTheil Merupakanmetoderegresinonparametrik Tidakterpengaruhterhadapadanya data outlierataupencilan Asumsi: • Contoh yang diambilbersifatacakdankontinyu; • Regresibersifat linier; • Data diasumsikantidakberdistribusi normal.
Misalkanterdapatn pasanganpengamatan, (X1, Y1), (X2, Y2), …, (Xn, Yn), persamaanregresi linier sederhanaadalah: Theil (1950) dalamSprent (1991, hal 179-180) mengusulkanperkiraanslopegarisregresisebagai median slopedariseluruhpasangangarisdarititik-titikdengannilaiX yang berbeda
Untuksatupasangan (Xi, Yi) dan(Xj, Yj) slope-nyaadalah untuki < j pendugadinotasikandengandinyatakansebagai median darinilai-nilaisehingga
Tugas 1 • Deteksipencilanpada X danpada Y • Deteksiadakahpengamatanberpengaruh • Dugalah beta menggunakanmetodeTheil ** PerhitungandilakukandiExcell **DipresentasikanMinggudepan