MODEL BERPANGKAT PENUH (MODEL REGRESI)

MODEL BERPANGKAT PENUH (MODEL REGRESI)

DAFTAR SLIDE Formulasi Model Estimasi Parameter Model Pendugaan Interval PengujianHipotesis 2

PENDAHULUAN • Analisisregresiberkenaandenganstudiketergantungandarisatuvariabel yang disebutvariabelrespon yang dilambangkandengany, padasatuataulebihvariabelpenjelasatauperamalyang dilambangkandenganX. • Tujuan: memperkirakanataumeramalkannilaivariabelresponapabilanilaidarivariabelpenjelassudahdiketahui. • Variabelperamal: variabel yang nilainyadapatditentukanataunilainyadapatdiamatinamuntidakdapatdikendalikan. 3

PENDAHULUAN CONTOH : DUA VARIABEL PENJELAS (X) SATU VARIABEL PENJELAS (X) 4

PENDAHULUAN Hubungandiantaraduavariabel: • Fungsional: diekspresikandenganrumusmatematik. y = f(x) fadalahfungsi yang menunjukkannilaiy yang berhubungandengannilaixtertentu. • Statistik: bukanhubungan yang sempurnakarenaobservasitidakterletaktepatpadakurvahubungan. y = f(x) + ε εadalahvariabel random yang memilikifungsidistribusitertentu. 5

PENDAHULUAN 6

PENDAHULUAN • Skala data: • Data kualitatif: • Skalanominal: bisadibedakan, disebutjuga data kategori. • Skalaordinal: bisadibedakandanmemilikiurutantingkatan • Data kuantitatif: • Skalainterval: bisadibedakan, memilikitingkatan, danmemilikinilai yang tidakmutlak. • Skalarasio: samadengan interval tetapitidakmemilikinilainolmutlak. 7

PENDAHULUAN Berdasarkan pengumpulan data, terdapat 2 tipe data untuk model linier: • Observational: Nilai variabel X dalam model linier tidak terkontrol. Contoh: • Data tentang penelitian psikologi, marketing, sosial dsb. • Experimental: Nilai variabel X dalam model linier terkontrol. Contoh: X1 : temperatur, dapat ditentukan misalnya 100, 125, 150 X2 : tekanan, misalnya ditentukan 50, 60, 70 Y : impurity (variabel random) 8

e = b b + Y X i 0 1 Linear Regression Y ? (the actual value of Yi) Yi X Xi

FORMULASI MODEL Model regresi linier sederhanauntuknobservasi: • yi = 0 + 1 xi + i • xi : regressor variable • yi: response variable • 0: the intercept, unknown • 1: the slope, unknown • i: error with E(i) = 0 and Var(i) = 2 (unknown) • The errors are uncorrelated sehinggacov(i,j) = 0; i ≠ j • i = 1, …, n 10

FORMULASI MODEL • Given x, E(y|x) = E(0 + 1 x + ) = 0 + 1 x Var(y|x) = Var(0 + 1 x + ) = 2 • Responses are also uncorrelated. • Regression coefficients: 0, 1 • 1: the change of E(y|x) by a unit change in x • 0: E(y|x=0) 11

PENDUGAAN TITIK Least-squares Estimation of the Parameters • Estimation of 0 and 1 • n pairs: (yi, xi), i = 1, …, n • Method of least squares: Minimize 12

PENDUGAAN TITIK • Least-squares normal equations: 13

The least-squares estimator: PENDUGAAN TITIK 14

PENDUGAAN TITIK Properties of the Least-Squares Estimators: • are linear combinations of yi • are unbiased estimators. 15

PENDUGAAN TITIK 16

PENDUGAAN TITIK Estimator of 2 • Residual sum of squares: 17

PENDUGAAN TITIK • Since , the unbiased estimator of 2 is • MSE is called the residual mean square. • This estimate is model-dependent. 18

FORMULASI MODEL • Model regresi linier bergandauntuknobservasi: dengan : parameter : konstantadiketahui danvariabel random 19

FORMULASI MODEL • Arti parameter regresi: • β0danβidalam model regresidisebutkoefisien. • βi : slopegarisregresi, menunjukkanperubahanpadarataandistribusiprobabilitasY per satuankenaikanXidenganasumsiXj (i≠ j) konstan. • β0 : intersepYdarigarisregresi. • Jikacakupan model tddX = 0, β0menunjukkanrataandistribusiprobabilitasYpadaX = 0. • Jikacakupan model tdktermasukX = 0, β0tidakmemilikiartitertentusebagaibentukterpisahdalam model regresi. 20

FORMULASI MODEL DalamBentukMatriks 21

FORMULASI MODEL PersamaanDalamBentukMatriks dengan y : vektor respon β : vektor parameter X : matriks konstanta , full rank ε : vektor random error 22

ESTIMASI PARAMETER MODEL • Postulate Model: • Model taksiran: • Residual/sisaan: • , metode: • Ordinary Least Square (OLS) • Maximum Likelihood Estimator (MLE) • Generalized Least Square (GLS) 23

ESTIMASI PARAMETER MODEL: OLS • Asumsi: vektor random dengan mean dan varians • Cara: meminimumkan jumlah kuadrat sisaan 24

ESTIMASI PARAMETER MODEL: MLE • Asumsi tambahan: • Tuliskan atau • Tuliskan fungsi likelihood (L): atau • Cari ln(L). • Cari : 25

ESTIMASI PARAMETER MODEL: MLE biased unbiased 26

ESTIMASI PARAMETER MODEL: GLS • Postulate Model: • Model taksiran: • → • Vmatriksdefinitpositifberukurann × n • definitpositif→ definitpositif. • Pendugaminimumkan 27

ESTIMASI PARAMETER MODEL: GLS 28

TEOREMA GAUSS MARKOV Diketahui dengan X matriks full rank n × (k + 1), vektor parameter (k + 1)× 1, dan vektor random n × 1 dengan mean 0 dan varians Penduga kuadrat terkecil adalah penduga yang BLUE (Best Linier Unbiased Estimator) untuk . • Best: varians minimum • Linier: fungsi linier dari variabel respon (y). • Unbiased: 29

ESTIMASI PARAMETER MODEL: GLS Definisi (Myers, hal: 103): Diketahui Z variabel random normal standar dan variabel random berdistribusi chi-squared dengan derajat bebas n dan saling bebas, maka variabel random berdistribusi t dengan derajat bebas n. 30

ESTIMASI PARAMETER MODEL: GLS Teorema (Myers, hal: 105) Diketahui: model , , maka: • dan saling bebas. 31

A random sample of 14 students is selected from an elementary school, and each student is measured on a creativity score (Create) using a new testing instrument and on a task score (Task) using a standard instrument. The Task score is the mean time taken to perform several hand-eye coordination tasks. Because the test for the creativity test is much cheaper, it is of interest to know whether you can substitute it for the more expensive Task score. create a regression equation that will effectively predict a Task score (the dependent variable) from the Create score (the independent variable) ! LATIHAN 32

LATIHAN Sampel 15 pasang data adalahsebagaiberikut • X1 X2 Y • 15 7,7 36 • 22 8,2 39 • 16 7,8 35 • 19 9,3 43 • 22 8,2 40 • 20 8,8 42 • 28 12,1 49 • 14 8,0 38 • X1 X2 Y • 18 8,1 36 • 21 11,2 44 • 26 9,4 35 • 14 10,3 43 • 19 8,5 37 • 22 7,5 41 • 20 8,4 40 Carilahpersamaanregresi linier dari data diatas ! 33

PENDUGAAN INTERVAL • 100(1-α)% CI untuk βj : cjj: elemen diagonal ke –j dari • 100(1-α)% CI untuk • 100(1-α)% confidence region untuk β 34

PENGUJIAN HIPOTESIS • Uji ketepatan Model • Hipotesis: • Metode: analysis of variance (ANOVA) • Statistik uji: • Keputusan: Tolak H0 jika 35

PENGUJIAN HIPOTESIS Tabel ANOVA 36

PENGUJIAN HIPOTESIS • Uji Subvektor • Hipotesis: • Statistik uji: • Keputusan: Tolak H0 jika 37

PENGUJIAN HIPOTESIS Tabel ANOVA 38

PENGUJIAN HIPOTESIS JumlahKuadratTerkoreksi ( dan ) Faktor Koreksi: 39

PENGUJIAN HIPOTESIS H0 : vs H1 : Statistik uji: Kesimpulan: Jika |t*| ≤ t(1 – α/2; n – p): terima H0 40

pertanyaan

MODEL BERPANGKAT PENUH (MODEL REGRESI)