440 likes | 918 Views
DATA MINING : PREDIKSI. Overview Regresi Linear Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion. Overview.
E N D
DATA MINING : PREDIKSI Overview Regresi Linear Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion
Overview • Sbg gambaran, diberikan data mengenai lamanya wkt yg dihabiskan oleh seorang pegawai resto cepat saji utk mengantarkan pesanan ke rumah pelanggan. • Wkt sejak pegawai meninggalkan resto hingga mencapai pintu rmh pelanggan di tampilkan sbb:
Overview • Berapa waktu yg ditempuh utk pesanan ke-26? • Dlm prediksi menggunakan data yg sdh ada utk memprediksi hasil dari satu hal yg baru yg akan muncul selanjutnya. • Prediksi dapat memperkirakan hasil dari hal yg belum terjadi. • Cara prediksi Regresi Linear
Regresi Linear • Regresi Linear (RL) yg dibahas: • RL Sederhana melibatkan 1 variabel pemberi pengaruh • RL Berganda melibatkan >1 variabel pemberi pengaruh • Variabel besaran yg berubah2 nilainya • Contoh variabel: nomor rmh pelanggan, luas rmh pelanggan, jam pemesanan, suhu udara saat pemesanan, jumlah anggota keluarga pemesan, dll • Belum tentu semua variabel relevan dgn kasus yg dihadapi • Variabel dipilah 2 • Variabel pemberi pengaruh dianalogikan sbg “sebab” • Variabel terpengaruh dianalogikan sbg “akibat”
Regresi Linear Variabel pemberi pengaruh (Sebab) Variabel terpengaruh(akibat)
RL Sederhana • RL Sederhana salah satu cara prediksi menggunakan garis lurus utk menggambarkan hubungan di antara 2 atw lebih variabel • Sbg contoh: • Berdasarkan tabel, kita coba menggambarkan jarak sbg sumbu x (dlm km) dan Waktu sbg sumbu y (dlm menit) • Setiap pasang jarak dan waktu di gambarkan sebagai titik.
Tujuan:Membuat garis lurus sedekat mungkin dgn titik2 tsb B lebih baik • Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: • Y = β0 + β1x
n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 _ _ β0 = y - β1x n β1 = 2 n ∑ xi i=1 n ∑ xi2 i=1 n
29,02 – (4,35)(3,32) = = 14,58 n ∑ yi i=1 n ∑ xi i=1 _ _ β0 = y - β1 x n ∑ yixi i=1 (725,42) (82,94) 2745,81 25 n β1 = 4,35 = = 2 (82,94) 2 n ∑ xi i=1 353,18 25 n ∑ xi2 i=1 n
Persamaan grs regresi yg kita cari berbentuk: • Y = β0 + β1x • Berdasarkan perhitungan tsd, maka diperoleh: • Y = 14,58 + 4,35 x • Pengetahuan apa yg didapat? • Bhw wkt tempuh pengiriman 14,58 menit ditambah 4,35 kali jarak rumah pelanggan. • Artinya bila jaraknya 1 km maka, wkt tempuhnya jadi 18,93 menit • Maka, utk pelanggan ke-26 dgn jarak 1,5 km • Y = 14,58 + 4,35 (1,5) • Y = 21,1 menit
Regresi Linear Berganda • Menyusun persamaan linear dgn byk variabel X (pemberi pengaruh) • Bila kita memiliki k buah variabel pemberi pengaruh, maka bentuk persamaan garis regresinya: Y = β0 + β1x1 + β2x2 + ... + βkxk • Sehingga kita dpt menyelesaikan persamaan, sbb:
n n n n • nβ0 + β1 ∑ xi1 + β2 ∑ xi2 + ... + βk ∑ xik = ∑ yi • i=1 i=1 i=1 i=1 • n n n n n • β0 ∑ xi1 + β1 ∑ xi12+ β2 ∑ xi1xi2 + ... + βk ∑ xi1xik = ∑ xi1yi • i=1 i=1 i=1 i=1 i=1 . . . • n n n n n • β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 + ... + βk ∑ Xik2 = ∑ XikYi • i=1 i=1 i=1 i=1 i=1
Penambahan variabel pemberi pengaruh banyaknya lampu merah
n n • n β0 + β1 ∑ xi1 + β2 ∑ xi2 = 725,42 • i=1 i=1 • n n n • β0 ∑ xi1 + β1 ∑ xi12+ β2 ∑ xi1xi2 = 8.001,67 • i=1 i=1 i=1 • n n n • β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 • i=1 i=1 i=1
β0 25 + β1 206 + β2 82,94 = 725,42 β0 206 + β1 2.396 + β2 771,77 = 8.001,67 β0 82,94+ β1 771,77 + β2 353,18 = 2.745,81 • Ketiga persamaan diatas diselesaikan shg diperoleh β0 = 2,31 ; β1 = 2,74 ; β2 = 1,24 • Maka persamaan RL nya: Y = β0 + β1x1 + β2x2 menjadi Y = 2,31 + 2,74 x1 + 1,24 x2
Pengetahuan yg diperoleh: • Dari 2,31 waktu tempuh, akan melewati 2,74 kali lampu merah ditambah 1,24 kali jarak rmh pelanggan • Dari kasus diatas diketahui 1 lampu merah dan 1,5 km jaraknya, maka X1= 1 (lampu) dan X2=1,5 (jarak) shg kita dpt memprediksi lamanya wkt pesanan tiba di rmh pelanggan dgn cara: Y = 2,31 + 2,74 X1 + 1,24 X2 Y = 2,31 + 2,74 (1) + 1,24 (1,5) = 6,91 menit
Analisis Garis Regresi Menggunakan Koefisien Determinasi Kita telah pelajari subbab sblmnya bhw: • Pers. Grs linear pertama dgn var. pemberi pengaruh x = jarak Y = 14,58 + 4,35 X • Pers. Grs linear kedua dgn var. pemberi pengaruh x1 = jml lampu merah dan x2 = jarak tempuh Y = 2,31 + 2,74 X1 + 1,24 X2 • Pertanyaan manakah yg lebih baik? • Solusi dpt menggunakan ukuran koefisien determinasi yg dinotasikan sbg R2
Koefisien Determinasi dpt dihitung dgn rumus: SSE Syy R2 = 1 - n n SSE = ∑ ei2 = ∑ (yi – yi)2 i=1 i=1 ^ n Syy = ∑ (yi – y)2 i=1
Perhitungan Koefisien Determinasi Y = 14,58 + 4,35 X Y = 2,31 + 2,74 X1 + 1,24 X2
Hasil • Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy • = 1 – (4.609,78 / 6.084,02) = 0,2423 = 24,23 % R2 = 1 - • Pers. Regresi kedua (Y = 2,31 + 2,74 X1 +1,24 X2): SSE Syy • = 1 – (115,05 / 6.084,02) = 0,9811 = 98,11 % R2 = 1 -
Hasil • Grs regresi kedua ternyata memiliki Koefisien Determinasi yg lebih tinggi, grs tsb lbh dpt menjelaskan keberagaman wkt pengantaran pesanan. • Utk memprediksi wkt pengantaran sebaiknya menggunakan garis regresi kedua yg mempertimbangkan dua variabel pemberi pengaruh, yaitu banyaknya lampu merah dan jarak rumah pelanggan
Kesimpulan • Kegunaan fungsi prediksi • Cara membuat persamaan garis regresi utk satu atw lbh variabel pemberi pengaruh • Cara melakukan analisis perbandingan antara dua garis regresi berdasarkan koefisien determinasi