1 / 57

ORDINAL REGRESSION

ORDINAL REGRESSION. KELOMPOK 4 / 3SE1 AKBAR DARMAWAN BAKRI MALIK AHMAD ISMAEL IDHO NAJIBULAH Y. S. KARINA ASTUTI SUNDARI TIARA SETYATI. Seorang kreditor ingin mengetahui apakah peminjam memiliki risiko kredit yang baik Telah diketahui beragam informasi keuangan dan pribadi peminjam

tova
Download Presentation

ORDINAL REGRESSION

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ORDINAL REGRESSION KELOMPOK 4 / 3SE1 AKBAR DARMAWAN BAKRI MALIK AHMAD ISMAEL IDHO NAJIBULAH Y. S. KARINA ASTUTI SUNDARI TIARA SETYATI

  2. Seorang kreditor ingin mengetahui apakah peminjam memiliki risiko kredit yang baik • Telah diketahui beragam informasi keuangan dan pribadi peminjam • Dari database nasabah, kreditor menetapkan variabel respon “status account ” dalam lima kategori yaitu : • Tidak ada catatan hutang • Tidak sedang berhutang • Sedang dalam proses pembayaran hutang • Melewati jatuh tempo pembayaran hutang • Kritis / Memiliki catatan buruk di Bank • Variabel Prediktor terdiri dari : • Usia • Banyak kredit di bank • Tipe Rumah • Jangka waktu berhutang (dalam bulan) • Hutang lain yang menjadi tanggungan Menggunakan Regresi Ordinal dalam Credit scoring model

  3. Data yang Digunakansampel SPSS : german_credit.sav

  4. Running Data Klik Analyze >> Regression >> Ordinal

  5. Running Data • Isikan Variabel Dependen “Account Status” • Masukkan Variabel kategorik dalam Kotak Factor(s) • Banyak kredit di bank • Tipe Rumah • Hutang lain yang menjadi tanggungan • Masukkan Variabel non Kategorik sebagai kovariat • Usia • Jangka Waktu Pinjaman

  6. Running Data Pada menu output, centang “Test of parallel lines” untuk mengetahui apakah semua parameter data kategorik memiliki slope/parameter sama

  7. Hasil Dari hasil, muncul peringatan bahwa terdapat 78,3% cell yang berfrekuensi nol. Sedangkan tabel di bawah menunjukkan ringkasan data yang diolah. Semua data valid untukdigunakan.

  8. Hasil Melalui tabel Model Fitting Information, kita dapat mengetahui apakah model dengan prediktor (model final) memberikan pengaruh yang signifikan terhadap model yang hanya menggunakan intercept saja. Dari tabel di samping, terlihat bahwa p-value kurang dari 0,05; sehingga dapat disimpulkan bahwa model dengan prediktor memberikan hasil yang lebih baik daripada model dengan intercept saja. Pengujianinibertujuanuntukmengujiapakah data yngdiobservasitidakkonsistendengan model yang di-fitkan. Jikanilai p-value besar, makadapatdisimpulkanbahwa data danprediksidari model mirip => model yang dibuatbaik. Tetapikarenaterdapatbanyaksel-sel yang kosong, sehinggatidakdapatdipastikanapakahstatistikmengikuti dist. Chi square, memungkinkannilai p-value yang didapatkantidakakurat.

  9. Hasil • Pendekatannilai R2 denganmenggunakanberbagaimetodemenghasilkannilai yang tidakterlalubesar. Yang dapatdiartikanbahwavariabelrespon yang dijelaskanvariabel-variabelprediktortidakterlalubesar. • Terlihatbahwavariabelprediktor yang signifikanmempengaruhivariabelresponadalah: • Jangkawaktuberhutang • Usia • Banyakhutang =1 • Hutang lain yang menjaditanggungan

  10. Hasil Dari pengujian Parallel Lines diatas, telihatbahwa p-value signifikan, dapatdisimpulkanbahwa parameter lokasi (koef. slope) tidaksamauntuksemuakategorirespon. Sehinggaasumsibahwa parameter samauntuksemuakategoritidakberlaku.

  11. PersamaandanInterptretasi • 𝑙𝑛𝑃(𝑌≤0/𝑃(𝑌>0)= -4,631-0,011duration+0,0163age-2,007numcred-1,0384othstal-0,188housng • Interpretasi: • Tanda (-) padavariabeldurationberartipeminjam yang memilikijangkawaktuberhutanglebih lama memilikikecenderunganlebihkeciluntukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Tanda (-) padavariabelnumcredberartipeminjam yang memilikihutangsebanyak 1, cenderunglebihkeciluntukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Tanda (-) padavariabelothstalberartipeminjam yang memilikihutang lain di bank (kategori 1) memilikikecenderunganlebihkeciluntukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Tanda (-) padavariabelhousngberartipeminjam yang status perumahannyasewa (kategori 1) memilikikecenderunganlebihkeciluntukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”).

  12. PersamaandanInterptretasi (2) • Koef. Variabelduration = -0,011, berartipeminjam yang memilikijangkawaktuberhutanglebih lama memilikikecenderungansebesar 0,989 untukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Koef. Variabelage = 0,016, peminjam yang memilikiusialebihtuamemilikikecenderungan 1,016 untukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Koef. Variabelnumcred = -0,2007, berartipeminjam yang memilikihutangsebanyak 1 (kategori 1) memilikikecenderungan 0,134 untukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Koef. Variabelothstal = -1,038, berartipeminjam yang memilikipinjaman lain di bank (kategori 1) memilikikecenderungan 0,354 untukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”). • Koef. Variabelhousng = -0,188, berartipeminjam yang memiliki status perumahansewa (kategori 1) memilikikecenderungan 0,828 untukmemilikistatus account “tidakadacatatanhutang” (dibandingkan minimal status account “kritis”).

  13. Kelompok 1 : • AlziraDoutel • AyuParamudita • FanisaDwitaHanggarani • HariAkhiardyTofri • RezkyMaydaPutri • Rizki Tri Anggara

  14. AnalisisLogistik Ordinal dgn SPSS Sebuahstudibertujuanuntukmelihatfaktor-faktor yang mempengaruhi Confidence in Education. Variabel yang di telitimeliputi : Get news from newspapers, Get news from news magazines, Get news from televisions, Get news from radios, dan Get news from internets.

  15. Case Processing Summary Marginal Percentage bernilai 100% menunjukkansemua data valid digunakan.

  16. Model Fitting Information Nilai significant sebesar 0,000 < α (α=5 %), menunjukkanbahwa model denganvariabelbebaslebihbaikdari model tnpavariabelbebas.

  17. Goodness of Fit Ho : Model yang digunakancocok. H1 : Model yang digunakantidakcocok. Hasilmenunjukkanbahwanilai significant atau p-value > α, ygberarti model regresitelahcocok.

  18. Pseudo R-Square Pada hasilterlihatnilaisepertipada OLS.

  19. Parameter Estimates Get news from newspapers dan Get news from internet significant mempengaruhi Confidence Education.

  20. Test of Parallel Lines Tujuandari Test of Parallel Lines adalahuntukmengujiapakahkoefisien slope samauntuksemuakategorivariabelrespon. Ho : Koefisien slope samauntuksemuavariabelrespon. H1 : Koefisien slope tidaksamauntuksemuavariabelrespon.

  21. KELOMPOK 2 • ALIFIA NIDYA HAPSARI (11.6530) • FARIDATUN NIHAYAH (11.6659) • EMILIA ANISA (11.6637) • M. FIKRI ANWAR (11.6792) • RAISSA SAMANTHA H (11.6851) • RISMA KARLIA (11.6870)

  22. RegresiLogistik Ordinal Data : α = 0,05 Sumber : 1991,General Social Survey

  23. Variabel Dependent (Respon) : • Kepuasanpekerjaan (Job) 1 = Sangattidakpuas (very dissatisfied) 2 = Agaktidakpuas ( A little satisfied) 3 = Agakpuas (moderately satisfied) 4 = Sangatpuas (very satisfied) Variabel Independent (Predictors) : • JenisKelamin(Gender) 0 = laki-laki (male) 1 = perempuan (female) • Pendapatan (Income) 1 = < 5.000 2 = 5.000 – 15.000 3 = 15.000 – 25.000 4 = > 25.000

  24. Output Semua data valid

  25. Output (2) H0 : Model denganvariabelbebasdantanpavariabelbebas(hanyaintersep) samabaiknya H1 : Model denganvariabelbebaslebihbaikdaripadatanpavariabelbebas(hanyaintersep) Nilai sig. sebesar 0.038 < α (0,05) menunjukkanbahwamodel dg variabelbebaslebihbaikdari model tanpavariabelbebas (hanyaintersep).

  26. Output (3) H0 : Model yang digunakandapatmenjelaskanvariabelbebas H1 : Model yang digunakanbelumdapatmenjelaskanvariabelbebas Karenakeduanilaisig. > α(0,05) maka model yang digunakandapatmenjelaskanvariabelbebas

  27. Output (4) • Merupakanperkiraan/pendekatanuntuk R2 sepertipadaregresi OLS pada model non linier. (padamodel non linier tidakbisadihitung R2 scrlangsungsptpada model regresi OLS). • Untuknilai cox and snell : variabel predictors dapatmenjelaskanvariasidarivariabelresponsebesar 9,3%

  28. Output (5) Beberapapersamaan : • 𝑙𝑛()=-3,956+0,029gender-1,231Pendapatan(1) • 𝑙𝑛()=-2.254+0,029gender-1,231Pendapatan(1)

  29. Output (6) H0 : koefisienslope paralel H1 : koefisien slope tidakparalel Karenanilai sig. 0,892 > α (0,05) makakoefisienadalahparalelatausamauntuksetiapkategorivariabelresponsehinggamodelnyabenar

  30. MODEL REGRESI LOGISTIK ORDINAL KELOMPOK 3

  31. Contoh :Seorang mahasiswa STIS melakukan suatu penelitian yang bertujuan untuk mengetahui faktor-faktor yang dapat mempengaruhi minat belajar mahasiswa pada semester 2. Studi ini dilakukan pada 20 orang mahasiswa. Penilaian terhadap minat tersebut dikualifikasikan menjadi tidak minat,minat dan minat sekali. Beberapa variabel yang awalnya yang dinilai dapat mempengaruhi minat belajar mahasiswa tersebut adalah jenis kelamin,IPK semester 1 dan ikut tidaknya mahasiswa pada kegiatan non akademik.

  32. Variabel-variabel1. Dependent : Minat belajar mahasiswatidak minat (0)minat (1)minat sekali (2)2. Independent : - Jenis kelamin perempuan (0)laki-laki (1)- IP semester 1 (kuantitatif)- kegiatan non akademiktidak ikut (0)ikut (1)

  33. Hasil dan Pembahasan (SPSS)1Berdasarkan output SPSS di atas,nilai valid 100% menyatakan bahwa data-data yang ada valid dan dapat dapat diteliti lebih lanjut.

  34. Pemilihan modelHipotesisH0: Model tanpa variabel bebasH1: Model dengan varibel bebasα = 5 %Berdasarkan output SPSS di atas,nilai signifikan 0,007 dimana lebih kecil dari nilai α (0,05) berarti keputusannya menolak H0 , yang menunjukkan bahwa model dengan variabel bebas lebih baik daripada model tanpa variabel bebas.

  35. KECOCOKAN MODELHipotesisH0 : Model cocokH1 : Model tidak cocokα=5%Berdasarkan output SPSS diatas,nilai signifikannya lebih besar dari nilai α,yang berarti model yang digunakan cocok.

  36. Hasil output SPSS di atas merupakan beberapa nilai perkiraan/pendekatan untuk   seperti pada regresi OLS pada model non linier. (pada model non linier tidak bisa dihitung R2 scr langsung spt pada model regresi OLS). Dari output tersebut terlihat bahwa besarnya pengaruh variabel2 independent terhadap variasi dari variabel dependent adalah 45,1% dan sisanya di pengaruhi oleh faktor lain.

  37. Jenis kelamin,IP semester 1 dan keikutsertaan dalam kegiatan non akademik signifikan (pd α = 5%) mempengaruhi minat belajar mahasiswa pada semester 2.

  38. Test of Parallel LinesHipotesisHo : koefisien slopenya sama H1: koefisien slopenya tidak sama Berdasarkan output SPSS di atas,nilai signifikan lebih besar dari nilai α (0,05),yaitu menerima Ho dimana slope yang digunakan adalah berdasarkan kategori yang cocok atau koefisien yang digunakan sama.

  39. PENULISAN PERSAMAAN DAN INTERPRETASIPersamaan regresi logistik ordinal: 𝑙𝑛𝑃(𝑌≤0/𝑃(𝑌>0)=14,062−1,135 jeniskelamin-0,439kegnonakdmik +4,675IPKs1𝑙𝑛𝑃(𝑌≤1/𝑃(𝑌>1)=17,931−1,135jeniskelamin-0,439kegnonakdmik+4,675IPKs1interpretasi:- mahasiswa pada semester 2 yang memiliki minat belajar tersebut lebih besar exp(3,869) kali dibandingkan mahasiswa yang yang tidak memiliki minat belajar ,dengan tanpa dipengaruhi oleh faktor lain.- tanda (-) pada variabel jenis kelamin berarti mahasiswa yang bejenis kelamin perempuan cenderung lebih besar exp(-1,135)kali minatnya untuk belajar dibandingkan dengan mahasiswa yang berjenis kelamin laki-laki.- tanda (-) pada variabel aktif dalam kegiatan non akademik berarti mahasiswa yang tidak mengikuti kegiatan non akademik minatnya untuk belajar cenderung lebih besar exp(-0,439)kali dibandingkan dengan mahasiswa yang mengikuti kegiatan non akademik. -Tanda (+) pada variabel IP semester 1 berarti semakin besar nilai IP mahasiswa pada semester 1 maka semakin besar pula minat mahasiswa untuk belajar pada semester 2.

  40. TERIMA KASIH

  41. ANALISIS DATA KATEGORIK MODEL REGRESI LOGISTIK ORDINAL • Kelompok 5 • AdelinaNamira • Amelia Tangdilambi • Friska S • RestiDeni Mira • TeguhHaryono • Ulfa

  42. ContohSoal Sebuahstudibertujuanuntukmelihatfaktor-faktor yang mempengaruhi 30 mahasiswamudahterkenapenyakitselamasebulanterakhir (masing-masingberkode 0=sangatsering, 1=sering, 2=jarang, dan 3=tidakpernah). Variabel yang ditelitiialahbanyaknyakonsumsivitC (gram), jumlah jam istirahat, bnyaknyamakannasi per hari (kali), dan jam istirahatmalam (masing-masingberkode 0 untuk ≤ pukul 20.00, 1 untuk 20.01-22.00, 2 untuk 22.01-24.00, 3 untuk 00.01-02.00, dan 4 untuk > 02.00)

  43. Data

  44. Output • Valid 100% menyatakansemua data valid • Pada final terdapatsignifikansisebesar 0.031, yang menyatakankurangdari alpha 0.05, sehinggamenunjukkanbahwa model denganvariabelbebaslebihbaikdaripada model tanpavariabelbebas • Untukmengujihipotesis:Ho: Model cocokvs H1: model tidakcocokHasilmenunjukkanterima Ho karenanilai sig p-value > alpha (0.05) yang berarti model regresicocok

  45. Nilai Pseudo R-square merupakanperkiraan/pendekatanuntukRsquaresepertipadaregresi OLS pada model non linear. • Terdapatbanyakjenis pseudo Rsquare, danmasing-masingakanmemberikannilaiperkiraan yang berbeda • Padanilai parameter estimasi, hanyavariabelvitC yang signifikanmempengaruhiseorangmahasiswaterkenapenyakit • Untuk test of parallel lines: • Ho: koefisien slope samauntuksetiapkategorivariabelrespon • H1: koefisien slope tidaksamauntuksetiapkategorivariabelrespon • Keputusan: sig > 0.05. makaterima Ho ataukoefisen slope samauntuksetiapkategorivariabelrespon Output (lanjutan)

  46. Penulisanpersamaan • Persamaan regresilogistik ordinal: ln = 7,029-0,274X1-0,656X2-0,351X3+2,046X40+0,633X41-1,254X42 ln = 8,119-0,274X1-0,656X2-0,351X3+2,046X40+0,633X41-1,254X42 ln = 9,561-0,274X1-0,656X2-0,351X3+2,046X40+0,633X41-1,254X42 ln = 10,469-0,274X1-0,656X2-0,351X3+2,046X40+0,633X41-1,254X42

  47. Interpretasi • KoefiesienvariabelvitC = -0,274, berartikonsumsivitC (per gram) mengakibatkankecendrunganpengaruhsebesar 0.76 kali lebihbesardaripadavariabellainnyaterhadapmenyebabkanpenyakit • Koefiesienvariabel rata2 jumlah jam tidur = -0,656, berarti rata2 jmlh jam tidurmengakibatkankecendrungansebesar 0.519 kali lebihbesardaripadavariabellainnyauntukmenyebabkanpenyakit • Koefiesienvariabel rata2 bnyakmakannasi= -0,351, berarti rata2 bnyakmakannasimengakibatkankecendrungansebesar 0.703 kali lebihbesardaripadavariabellainnyauntukmenyebabkanpenyakit

  48. Interpretasi (lanjutan) • Koefisienvariabel rata2 jam tidurmalampada ≤ pukul 20.00 = 2,046, berartiseseorangygmemiliki rata2 jam tidur ≤ 20.00 memilikikecendrungan 7,7368 kali lebihbesardibandingkan yang memiliki jam tidurlainnya. • Koefisienvariabel rata2 jam tidurmalampadaantarapukul 20.01 – 22.00 = 0,633, berartiseseorangygmemiliki rata2 jam tidurantarapukul 20.01 – 22.00 memilikikecendrungan 1,883 kali lebihbesardibandingkan yang memiliki jam tidurlainnya. • Koefisienvariabel rata2 jam tidurmalampadaantarapukul 22.01 – 24.00 = -1,254, berartiseseorangygmemiliki rata2 jam tidurantarapukul 22.01 – 24.00 memilikikecendrungan 0,285 kali lebihbesardibandingkan yang memiliki jam tidurlainnya.

  49. DEWI MAULIZARESTERIA SIAGIANJULMIATIMUH. SYAIFULYESDI CALVIN KELOMPOK 6

  50. Data

More Related