1 / 55

ANALISIS DATA KATEGORI

ANALISIS DATA KATEGORI. Eni Sumarminingsih. Distribusi Multinomial. Misalnya terdapat c kategori pada variabel respon . Peluangnya dinotasikan {  1 , 2 ,…, c } di mana 1.

marc
Download Presentation

ANALISIS DATA KATEGORI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANALISIS DATA KATEGORI EniSumarminingsih

  2. Distribusi Multinomial • Misalnya terdapat c kategori pada variabel respon. Peluangnyadinotasikan{1 ,2 ,…,c} di mana1. • Untuk n sampel, peluang Multinomial bahwa n1 jatuh pada kategori1, n2jatuh pada kategori 2,…, ncjatuh pada kategori c di mana

  3. Distribusi Multinomial

  4. RegresiLogistik Multinomial RegresiLogistik yang melibatkanvariabelrespondengankategorilebihdariduadenganskala nominal yaitutidakmemilikitingkatansertavariabelprediktor yang bersifatkategoridanataukontinyudisebutsebagairegresilogistik multinomial

  5. Suatuvariabelrespondengan M kategoriakanmembentukpersamaanlogitsebanyak M-1 di manamasing-masingpersamaaninimembentukregresilogistikbiner yang membandingkansuatukelompokkategoriterhadapkategoripembanding

  6. Secaraumum model multinomial logitadalah

  7. Jika yang digunakansebagaipembandingadalahkategori M, makaξM= 0 untuk di mana p adalahbanyaknyavariabelprediktor, sehinggatransformasilogitnya menjadi,

  8. Multinomial Logitdengan 3 KategoriRespon Dalam model regresilogistikdengan 3 kategori Y (Y=0,1,2),dibutuhkan2 fungsilogitdanharusdiputuskankategoriresponmana yang menjadikategoripembanding MisalY=0 sebagaikategoripembandinguntukmembentuk 2 logit (yaitusebagaipembanding untuk Y=1 dan Y=2) maka

  9. MenurutHosmerdanLemeshow (2000) untukmendapatkan model, asumsikanterdapat p variabelprediktordann sampelyang dinotasikansebagaivektorX denganmatrikberukurann x (p+1)di mana X0=1. Dua fungsi logit dinotasikan sebagai:

  10. BentukUmumfungsipeluangdengan 3 kategorirespon

  11. Secarateori, model dengan 3 kategoripeubahresponakanmenghasilkanduafungsilogit. • Sebenarnyadapatdigunakanpasangankategoripembanding yang manasajatergantungdaritujuanyang ingindicapaidalampenelitian, tetapimenurutHosmerdanLemeshow (2000) lebihbaikmenggunakankategori 0 sebagaipembandingkarenamerupakanperluasandari model dengandua • kategorivariabelrespon (biner).

  12. Pendugaan Parameter • Pendugaan parameter dari model logitmenggunakanmetodemaksimum likelihood • Untukmembuatfungsi likelihood pada model dengankategorirespon lebih dari 2 (misalnya 3 kategori) hal pertama yang dilakukan adalahmembuat 3 variabelbiner yang dikode 0 atau 1 untukmenandaigroup membership (anggotakelompok) padasuatuobservasi

  13. Dalamkasusini 3 variabelbinertersebuthanyauntukmenjelaskanfungsi likelihood danbukandigunakanuntukanalisisregresi logistik multinomial yang sebenarnya

  14. PengujianTerhadapPendugaan Parameter • Pengujianpendugaan parameter () secara parsial Ujikoefisienregresisecaraparsialdigunakanuntukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalam model. Hipotesis yang digunakanadalah:

  15. PengujianTerhadapPendugaan Parameter Statistikuji yang digunakanadalahstatistikuji Wald yang dapatditulis:

  16. PengujianTerhadapPendugaan Parameter

  17. PengujianTerhadapPendugaan Parameter

  18. PengujianTerhadapPendugaan Parameter

  19. PengujianTerhadapPendugaan Parameter

  20. PengujianTerhadapPendugaan Parameter

  21. InterpretasiKoefisienregresilogistik • Interpretasidalamregresilogistikmenggunakannilai odds ratio yang menunjukkanperbandingantingkatkecenderungandarikategori yang adadalamsatuvariabelprediktor. • Nilai odds ratio padarespon multinomial menggunakannotasiumumyang digunakandalamresponbiner.

  22. Misalnya Y=0 digunakansebagai kategori pembanding, odd ratio untuk Y=j terhadap Y=0 yang dihitungpadaduanilai adalah

  23. padaregresilogistikpolitomusdengantigakategoriresponakanterbentukdua odds ratio. • Yang pertamaperbandinganpeluangantararesponkategori 1 (Y=1) denganresponkategoripembanding (Y=0) • Yang keduaadalahperbandinganpeluangantararesponkategori 2 (Y=2) denganresponkategoripembanding (Y=0).

  24. KoefisienDeterminasi

  25. Contoh SuatupenelitianinginmengetahuiberapapeluangseseorangterkenaPJK (PenyakitJantungKoroner), PJK disertaihipertensidan PJK disertaihipertensiserta diabetes mellitus. Adapunfaktor – faktor yang didugamempengaruhiterjadinya PJK dankomplikasinya adalahusia, tekanandarahsistole, tekanandarah diastole, kolesterol, HDl, LDL danTrigliserid. VariabelRespon:

  26. Y= 0 (PJK), Y= 1 (PJK disertaihipertensi), Y= 2 (PJK disertai hipertensidan diabetes mellitus). VariabelPrediktor: X1 = Usia (tahun) X2 = Tekanandarahsistole(mmHg) X3 = Tekanan darah diastole (mmHg) X4 = Kolesterol (mg/dl) X5 = HDL (mg/dl)

  27. X6 = LDL (mg/dl) X7 = Trigliserid (mg/dl)

  28. Model regresilogistik multinomial setelahdilakukantransformasiadalahsebagaiberikut: • Model regresi logistik yang pertama

  29. Model regresilogistik yang keduaadalah

  30. Nilai odds ratio model regresi logistik pertama

  31. Interpretasi untuk model logistik pertama, • Untuk variabel X1 diperolehnilai odds ratio sebesar 1.109, berartisetiapbertambahnya1 tahunusiaseseorang yang telahmemilikifaktor-faktorresikoPJK akanmeningkatkanpeluang orang tersebutterkenapenyakitjantungkoronersekaligushipertensisebesar 1.109 kali. • Untukvariabel X2 • dengannilai odds ratio sebesar 9.318 berartidenganbertambahnya 1 • 57 • mmHg tekanandarahsistoleakanmeningkatkanpeluang orang • tersebutterkenapenyakitjantungkoronersekaligushipertensi • sebesar 9.318 kali, sedangkanuntukbertambahnya 1 mmHg tekanan • darah diastole (X3) akan meningkatkan resiko terkena penyakit • jantungsertahipertensisebesar 9.309 kali. Untukvariabelkolesterol • (X4), mengindikasikanbahwadenganmenurunnya 1 mg/dl kadar • kolesterol akan menurunkan resiko terkena penyakit jantung koroner • sekaligushipertensisebesar 0.749 kali. Untukkenaikan 1 mg/dl • kadar HDL (X5) akanmeningkatkanresikoterkena PJK serta • hipertensisebesar 1.704 kali. Sedangkanuntukpenurunan 1 mg/dl • kadar LDL dankadartrigliseriddapatmengurangiresikoterkena • PJK disertaihipertensiberturutturutsebesar 0.488 kali dan 0.895 • kali.

  32. UntukvariabelX2 dengannilai odds ratio sebesar 9.318 berartidenganbertambahnya1 mmHg tekanandarahsistoleakanmeningkatkanpeluangorang tersebutterkenapenyakitjantungkoronersekaligushipertensisebesar9.318 kali, • sedangkanuntukbertambahnya 1 mmHg tekanandarah diastole (X3) akan meningkatkan resiko terkena penyakit • jantungsertahipertensisebesar 9.309 kali.

  33. Untukvariabelkolesterol (X4), mengindikasikanbahwadenganmenurunnya 1 mg/dl kadarkolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligushipertensisebesar 0.749 kali. • Untukkenaikan 1 mg/dl kadarHDL (X5) akanmeningkatkanresikoterkena PJK sertahipertensisebesar 1.704 kali.

  34. Sedangkanuntukpenurunan 1 mg/dl kadarLDL dankadartrigliseriddapatmengurangiresikoterkena PJK disertaihipertensiberturutturutsebesar 0.488 kali dan0.895 kali.

  35. Nilai odds ratio model regresi logistik kedua

More Related