570 likes | 992 Views
ANALISIS DATA KATEGORI. Eni Sumarminingsih. Distribusi Multinomial. Misalnya terdapat c kategori pada variabel respon . Peluangnya dinotasikan { 1 , 2 ,…, c } di mana 1.
E N D
ANALISIS DATA KATEGORI EniSumarminingsih
Distribusi Multinomial • Misalnya terdapat c kategori pada variabel respon. Peluangnyadinotasikan{1 ,2 ,…,c} di mana1. • Untuk n sampel, peluang Multinomial bahwa n1 jatuh pada kategori1, n2jatuh pada kategori 2,…, ncjatuh pada kategori c di mana
RegresiLogistik Multinomial RegresiLogistik yang melibatkanvariabelrespondengankategorilebihdariduadenganskala nominal yaitutidakmemilikitingkatansertavariabelprediktor yang bersifatkategoridanataukontinyudisebutsebagairegresilogistik multinomial
Suatuvariabelrespondengan M kategoriakanmembentukpersamaanlogitsebanyak M-1 di manamasing-masingpersamaaninimembentukregresilogistikbiner yang membandingkansuatukelompokkategoriterhadapkategoripembanding
Jika yang digunakansebagaipembandingadalahkategori M, makaξM= 0 untuk di mana p adalahbanyaknyavariabelprediktor, sehinggatransformasilogitnya menjadi,
Multinomial Logitdengan 3 KategoriRespon Dalam model regresilogistikdengan 3 kategori Y (Y=0,1,2),dibutuhkan2 fungsilogitdanharusdiputuskankategoriresponmana yang menjadikategoripembanding MisalY=0 sebagaikategoripembandinguntukmembentuk 2 logit (yaitusebagaipembanding untuk Y=1 dan Y=2) maka
MenurutHosmerdanLemeshow (2000) untukmendapatkan model, asumsikanterdapat p variabelprediktordann sampelyang dinotasikansebagaivektorX denganmatrikberukurann x (p+1)di mana X0=1. Dua fungsi logit dinotasikan sebagai:
Secarateori, model dengan 3 kategoripeubahresponakanmenghasilkanduafungsilogit. • Sebenarnyadapatdigunakanpasangankategoripembanding yang manasajatergantungdaritujuanyang ingindicapaidalampenelitian, tetapimenurutHosmerdanLemeshow (2000) lebihbaikmenggunakankategori 0 sebagaipembandingkarenamerupakanperluasandari model dengandua • kategorivariabelrespon (biner).
Pendugaan Parameter • Pendugaan parameter dari model logitmenggunakanmetodemaksimum likelihood • Untukmembuatfungsi likelihood pada model dengankategorirespon lebih dari 2 (misalnya 3 kategori) hal pertama yang dilakukan adalahmembuat 3 variabelbiner yang dikode 0 atau 1 untukmenandaigroup membership (anggotakelompok) padasuatuobservasi
Dalamkasusini 3 variabelbinertersebuthanyauntukmenjelaskanfungsi likelihood danbukandigunakanuntukanalisisregresi logistik multinomial yang sebenarnya
PengujianTerhadapPendugaan Parameter • Pengujianpendugaan parameter () secara parsial Ujikoefisienregresisecaraparsialdigunakanuntukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalam model. Hipotesis yang digunakanadalah:
PengujianTerhadapPendugaan Parameter Statistikuji yang digunakanadalahstatistikuji Wald yang dapatditulis:
InterpretasiKoefisienregresilogistik • Interpretasidalamregresilogistikmenggunakannilai odds ratio yang menunjukkanperbandingantingkatkecenderungandarikategori yang adadalamsatuvariabelprediktor. • Nilai odds ratio padarespon multinomial menggunakannotasiumumyang digunakandalamresponbiner.
Misalnya Y=0 digunakansebagai kategori pembanding, odd ratio untuk Y=j terhadap Y=0 yang dihitungpadaduanilai adalah
padaregresilogistikpolitomusdengantigakategoriresponakanterbentukdua odds ratio. • Yang pertamaperbandinganpeluangantararesponkategori 1 (Y=1) denganresponkategoripembanding (Y=0) • Yang keduaadalahperbandinganpeluangantararesponkategori 2 (Y=2) denganresponkategoripembanding (Y=0).
Contoh SuatupenelitianinginmengetahuiberapapeluangseseorangterkenaPJK (PenyakitJantungKoroner), PJK disertaihipertensidan PJK disertaihipertensiserta diabetes mellitus. Adapunfaktor – faktor yang didugamempengaruhiterjadinya PJK dankomplikasinya adalahusia, tekanandarahsistole, tekanandarah diastole, kolesterol, HDl, LDL danTrigliserid. VariabelRespon:
Y= 0 (PJK), Y= 1 (PJK disertaihipertensi), Y= 2 (PJK disertai hipertensidan diabetes mellitus). VariabelPrediktor: X1 = Usia (tahun) X2 = Tekanandarahsistole(mmHg) X3 = Tekanan darah diastole (mmHg) X4 = Kolesterol (mg/dl) X5 = HDL (mg/dl)
X6 = LDL (mg/dl) X7 = Trigliserid (mg/dl)
Model regresilogistik multinomial setelahdilakukantransformasiadalahsebagaiberikut: • Model regresi logistik yang pertama
Interpretasi untuk model logistik pertama, • Untuk variabel X1 diperolehnilai odds ratio sebesar 1.109, berartisetiapbertambahnya1 tahunusiaseseorang yang telahmemilikifaktor-faktorresikoPJK akanmeningkatkanpeluang orang tersebutterkenapenyakitjantungkoronersekaligushipertensisebesar 1.109 kali. • Untukvariabel X2 • dengannilai odds ratio sebesar 9.318 berartidenganbertambahnya 1 • 57 • mmHg tekanandarahsistoleakanmeningkatkanpeluang orang • tersebutterkenapenyakitjantungkoronersekaligushipertensi • sebesar 9.318 kali, sedangkanuntukbertambahnya 1 mmHg tekanan • darah diastole (X3) akan meningkatkan resiko terkena penyakit • jantungsertahipertensisebesar 9.309 kali. Untukvariabelkolesterol • (X4), mengindikasikanbahwadenganmenurunnya 1 mg/dl kadar • kolesterol akan menurunkan resiko terkena penyakit jantung koroner • sekaligushipertensisebesar 0.749 kali. Untukkenaikan 1 mg/dl • kadar HDL (X5) akanmeningkatkanresikoterkena PJK serta • hipertensisebesar 1.704 kali. Sedangkanuntukpenurunan 1 mg/dl • kadar LDL dankadartrigliseriddapatmengurangiresikoterkena • PJK disertaihipertensiberturutturutsebesar 0.488 kali dan 0.895 • kali.
UntukvariabelX2 dengannilai odds ratio sebesar 9.318 berartidenganbertambahnya1 mmHg tekanandarahsistoleakanmeningkatkanpeluangorang tersebutterkenapenyakitjantungkoronersekaligushipertensisebesar9.318 kali, • sedangkanuntukbertambahnya 1 mmHg tekanandarah diastole (X3) akan meningkatkan resiko terkena penyakit • jantungsertahipertensisebesar 9.309 kali.
Untukvariabelkolesterol (X4), mengindikasikanbahwadenganmenurunnya 1 mg/dl kadarkolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligushipertensisebesar 0.749 kali. • Untukkenaikan 1 mg/dl kadarHDL (X5) akanmeningkatkanresikoterkena PJK sertahipertensisebesar 1.704 kali.
Sedangkanuntukpenurunan 1 mg/dl kadarLDL dankadartrigliseriddapatmengurangiresikoterkena PJK disertaihipertensiberturutturutsebesar 0.488 kali dan0.895 kali.