1 / 47

Outlier P ada Analisis Regresi

Outlier P ada Analisis Regresi. By Eni Sumarminingsih , SSi , MM. Pendahuluan. Tujuan dari Analisis Regresi adalah mengepas persamaan pada peubah yang terobservasi Model regresi linier klasik mengasumsikan hubungan berikut : Dimana n adalah ukuran contoh

simone
Download Presentation

Outlier P ada Analisis Regresi

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Outlier PadaAnalisisRegresi By EniSumarminingsih, SSi, MM

  2. Pendahuluan TujuandariAnalisisRegresiadalahmengepaspersamaanpadapeubah yang terobservasi Model regresi linier klasikmengasumsikanhubunganberikut : Dimana n adalahukurancontoh Variabel xi1, …, xipadalahvariabelpenjelasdanyiadalahvariabelrespon

  3. Padatheoriklasikdiasumsikaneroreimenyebar normal dengan rata – rata noldanragam2 Jadidengananalisisregresikitamenduga parameter Dari data

  4. Denganmenggunakanmetodependugaregresipada data tersebutdidapatkan Dimanaadalahkoefisienregresi adalahnilaiduga y yang didapatdaripersamaanberikut

  5. Residual ridariamatanke I adalahselisihantara y observasidan y dugaan MetodeKuadratTerkecil (MKT) atau Ordinary Least Square (OLS) adalahmetode paling populeruntukmenduga parameter model regresi

  6. Idedasarmetode OLS adalahmencarinilaidugaparamete yang meminimumkanJumlahKuadratGalat

  7. Efek Outlier padaRegresi Linier Sederhana Model Regresi Linier Sederhana Misalkitamemiliki 5 observasi (x1,y1),…, (x5,y5) yang jikadiplotkanakantampaksepertiberikut : setiaptitiksangatdekatdengangarisregresi

  8. Misalkanterdapatkesalahanpenulisan y4, makatitik (x4,y4) akanterletakjauhdarigarisidealnya. Titikinidinamakan outlier dalam y, danmempengaruhigaris LS

  9. Outlier jugadapatterjadidalam X. Berikutadalah plot dari 5 titik (x1,y1), … (x5,y5) berikutgaris LS-nya

  10. Misalkankitamembuatkesalahandalammencatat x1 sehinggamakakitadapatkangambarberikut

  11. Titik (x1,y1) dinamakan outlier dalamarah x danefeknyapadapenduga LS sangatbesarkarenamerubahgaris LS. Titik (x1,y1) disebutleverage point

  12. Perhatikanbahwa (xk,yk) dalamgambarberikutbukan leverage point. Mengapa?

  13. Breakdown Point Misalkanterdapat sample dengan n titik data Dan misalkan T adalahpendugaregresisehingga Misalkan Z’ adalah sample yang didapatdari Z dimana m titikdalam Z digantidengantitik – titik yang sembarang(adakemungkinan outlier)

  14. Notasikan bias(m; T, Z) adalah bias maksimum yang dapatdisebabkanolehkontaminasitersebut Jika bias (m;T, Z) infinite berarti m outlier dapatmemilikiefek yang besarpada T ataudapatdikatakanbahwa estimator “breaks down”

  15. Breakdown point dari estimator T pada sample Z didefinisikansebagai Dengankata lain, break down point adalahproporsikontaminasiterkecil yang dapatmenyebabkan estimator T menghasilkan yang cukupjauhdari T(Z)

  16. Breakdown point untuk MKT (OLS) adalah Karenatelahkitalihatbahwasatu outlier sudahdapatmerubahnilaikoefisienregresi Hal inimenunjukkanbahwa OLS sangatsensitifterhadap outlier

  17. IdentifikasiPencilanpada Y Dalambeberapaanalisisregresiseringkaliditemukanadanyaamatanekstrem, yaitubernilaijauhdenganamatan yang lain dalamsampel Adanyaamatanekstremataupencilaninidapatmenyebabkan residual yang besardanseringkalimemilikiefek yang besarpadadugaanfungsiregresi yang menggunakan OLS sehinggapendugakoefisienregresimenjadi bias danatautidakkonsisten

  18. Pencilanharusditelitidenganhati – hatiapakahsebaiknyaamataninidipertahankanataudihilangkan. Jikadipertahankan, efekpencilaniniharusdikurangi

  19. Suatuamatandapatmenjadipencilanpada Y ataupada X ataupadakeduanya

  20. PendeteksianOutlier Untukpendeteksianpencilan , diperlukansuatumatriks yang dinamakan hat matrix yang dilambangkandenganH

  21. Penduga Y dapatditulissebagai Dengan

  22. Elemen diagonal darimatriksHmemberikaninformasitentang data observasi yang mempunyainilaileverage yang besar Elemen diagonal ke-idarimatriksH yang dilambangkandenganhiidiperolehdari:

  23. Denganadalahvektorbaris yang berisinilai-nilaidarivariabelbebasatauindependendalampengamatanke-i. Padaelemen diagonal matriksH, diperoleh dimana p adalahbanyaknyapeubahdalam model

  24. Pendeteksianpencilanpada X Jikanilailebihbesardari 2(p+1)/n makapengamatanke-idikatakansebagaioutlier pada X (leverage point).

  25. PendeteksianPencilanpada Y Hipotesis yang digunakanuntukmengujiadalah: H0 : Pengamatanke-ibukanoutlier H1 : Pengamatanke-imerupakanoutlier Statistikujiyang dapatdigunakanuntukmengujiadalahstudentized residual ataustudentized deleted residual yang didefinisikan:

  26. PendeteksianPencilanpada Y Kriteria yang digunakanuntukmengujiadatidaknyaoutlieradalah dimana p adalahbanyaknyavariabelbebasditambahsatu

  27. PendeteksianPengamatanBerpengaruh Pengamatanberpengaruh • merupakanpengamatan yang berpengaruhbesardalampendugaankoefisienregresi • memilikinilaigalatatausisaan yang besarataumungkin pula tidak, tergantungpada model yang digunakan

  28. Metodeuntukmendeteksipengamatanberpengaruh • Cook’s Distance Cook’s Distance merupakanjarakantarapendugaan parameter dengan MKT yang diperolehdari n pengamatanatauobservasiyaitudanpendugaan parameter yang diperolehdenganterlebihdahulumenghapuspengamatanatauobservasike-iyaitu

  29. Jaraktersebutdapatdituliskansebagaiberikut: dengan

  30. Hipotesisuntukmengujiadanyapengamatanberpengaruhadalahsebagaiberikut:Hipotesisuntukmengujiadanyapengamatanberpengaruhadalahsebagaiberikut: H0 : Pengamatanke-itidakberpengaruh H1 : Pengamatanke-iberpengaruh kriteria yang digunakanuntukmengujihipotesistersebutadalahsebagaiberikut, alpha = 0.5:

  31. 2. The Difference In Fits Statistic (DFITS) Hipotesisuntukmengujiadanyapengamatanberpengaruhadalahsebagaiberikut: H0 : Pengamatanke-itidakberpengaruh H1 : Pengamatanke-iberpengaruh merupakanpengaruhpengamatanatauobservasike-ipadanilaiduga yang didefinisikansebagai

  32. Kriteria yang digunakanuntukmengujihipotesistersebutadalah

  33. MetodeuntukPenangananPencilan • MetodeTheil Merupakanmetoderegresinonparametrik Tidakterpengaruhterhadapadanya data outlierataupencilan Asumsi: • Contoh yang diambilbersifatacakdankontinyu; • Regresibersifat linier; • Data diasumsikantidakberdistribusi normal.

  34. Misalkanterdapat n pasanganpengamatan, (X1, Y1), (X2, Y2), …, (Xn, Yn), persamaanregresi linier sederhanaadalah: Theil (1950) dalamSprent (1991, hal 179-180) mengusulkanperkiraanslopegarisregresisebagai median slopedariseluruhpasangangarisdarititik-titikdengannilai X yang berbeda

  35. Untuksatupasangan (Xi, Yi) dan (Xj, Yj) slope-nyaadalah untuki < j pendugadinotasikandengandinyatakansebagai median darinilai-nilaisehingga

  36. Penduga M (M-Estimator) denganFungsi Huber PendugaM adalahsolusi (1) Dimana(.)adalahfungsikriteria yang dapatberubah-ubah

  37. fungsikrtiteria(.)mempunyaibeberapasifatsebagaiberikut:

  38. UntukmendapatkanpendugakoefisienregresimakafungsikriteriaditurunkandandisamakandengannolUntukmendapatkanpendugakoefisienregresimakafungsikriteriaditurunkandandisamakandengannol DimanaadalahhasildiferensiasidarifungsikriteriadanXijadalahobservasike-ipadaregressorke-j

  39. Bentukumumdaripersamaan (1) adalah Dan bentukumumpersamaan (2) adalah

  40. Fungsikriteria Huber yang didefinisikansebagaiberikut :

  41. Dan fungsipengaruhnyaadalah Dengan

  42. Persamaankeduadapatdituliskan Dengan Jikamakapersamaan (2) menjadi

  43. Untukfungsipengaruh Huber, diperlolehpembobotsebagaiberikut :

  44. Langkah-langkahpenghitunganpenduga M:

More Related