1 / 27

DATA MINING : PREDIKSI

DATA MINING : PREDIKSI. Overview Regresi Linear Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion. Overview.

Download Presentation

DATA MINING : PREDIKSI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DATA MINING : PREDIKSI Overview Regresi Linear Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion

  2. Overview • Sbg gambaran, diberikan data mengenai lamanya wkt yg dihabiskan oleh seorang pegawai resto cepat saji utk mengantarkan pesanan ke rumah pelanggan. • Wkt sejak pegawai meninggalkan resto hingga mencapai pintu rmh pelanggan di tampilkan sbb:

  3. Overview

  4. Overview • Berapa waktu yg ditempuh utk pesanan ke-26? • Dlm prediksi menggunakan data yg sdh ada utk memprediksi hasil dari satu hal yg baru yg akan muncul selanjutnya. • Prediksi dapat memperkirakan hasil dari hal yg belum terjadi. • Cara prediksi  Regresi Linear

  5. Regresi Linear • Regresi Linear (RL) yg dibahas: • RL Sederhana  melibatkan 1 variabel pemberi pengaruh • RL Berganda  melibatkan >1 variabel pemberi pengaruh • Variabel  besaran yg berubah2 nilainya • Contoh variabel: nomor rmh pelanggan, luas rmh pelanggan, jam pemesanan, suhu udara saat pemesanan, jumlah anggota keluarga pemesan, dll • Belum tentu semua variabel relevan dgn kasus yg dihadapi • Variabel dipilah 2  • Variabel pemberi pengaruh  dianalogikan sbg “sebab” • Variabel terpengaruh  dianalogikan sbg “akibat”

  6. Regresi Linear Variabel pemberi pengaruh (Sebab) Variabel terpengaruh(akibat)

  7. RL Sederhana • RL Sederhana  salah satu cara prediksi menggunakan garis lurus utk menggambarkan hubungan di antara 2 atw lebih variabel • Sbg contoh: • Berdasarkan tabel, kita coba menggambarkan jarak sbg sumbu x (dlm km) dan Waktu sbg sumbu y (dlm menit) • Setiap pasang jarak dan waktu di gambarkan sebagai titik.

  8. Tujuan:Membuat garis lurus sedekat mungkin dgn titik2 tsb  B lebih baik • Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: • Y = β0 + β1x

  9. n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 _ _ β0 = y - β1x n β1 = 2 n ∑ xi i=1 n ∑ xi2 i=1 n

  10. Perincian perhitungan RL-S

  11. 29,02 – (4,35)(3,32) = = 14,58 n ∑ yi i=1 n ∑ xi i=1 _ _ β0 = y - β1 x n ∑ yixi i=1 (725,42) (82,94) 2745,81 25 n β1 = 4,35 = = 2 (82,94) 2 n ∑ xi i=1 353,18 25 n ∑ xi2 i=1 n

  12. Persamaan grs regresi yg kita cari berbentuk: • Y = β0 + β1x • Berdasarkan perhitungan tsd, maka diperoleh: • Y = 14,58 + 4,35 x • Pengetahuan apa yg didapat? • Bhw wkt tempuh pengiriman  14,58 menit ditambah 4,35 kali jarak rumah pelanggan. • Artinya bila jaraknya 1 km maka, wkt tempuhnya jadi 18,93 menit • Maka, utk pelanggan ke-26 dgn jarak 1,5 km  • Y = 14,58 + 4,35 (1,5) • Y = 21,1 menit

  13. Regresi Linear Berganda • Menyusun persamaan linear dgn byk variabel X (pemberi pengaruh) • Bila kita memiliki k buah variabel pemberi pengaruh, maka bentuk persamaan garis regresinya: Y = β0 + β1x1 + β2x2 + ... + βkxk • Sehingga kita dpt menyelesaikan persamaan, sbb:

  14. n n n n • nβ0 + β1 ∑ xi1 + β2 ∑ xi2 + ... + βk ∑ xik = ∑ yi • i=1 i=1 i=1 i=1 • n n n n n • β0 ∑ xi1 + β1 ∑ xi12+ β2 ∑ xi1xi2 + ... + βk ∑ xi1xik = ∑ xi1yi • i=1 i=1 i=1 i=1 i=1 . . . • n n n n n • β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 + ... + βk ∑ Xik2 = ∑ XikYi • i=1 i=1 i=1 i=1 i=1

  15. Penambahan variabel pemberi pengaruh  banyaknya lampu merah

  16. Perhitungan RL-B

  17. Perhitungan RL-B (lanjutan)

  18. n n • n β0 + β1 ∑ xi1 + β2 ∑ xi2 = 725,42 • i=1 i=1 • n n n • β0 ∑ xi1 + β1 ∑ xi12+ β2 ∑ xi1xi2 = 8.001,67 • i=1 i=1 i=1 • n n n • β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 • i=1 i=1 i=1

  19. β0 25 + β1 206 + β2 82,94 = 725,42 β0 206 + β1 2.396 + β2 771,77 = 8.001,67 β0 82,94+ β1 771,77 + β2 353,18 = 2.745,81 • Ketiga persamaan diatas diselesaikan shg diperoleh β0 = 2,31 ; β1 = 2,74 ; β2 = 1,24 • Maka persamaan RL nya: Y = β0 + β1x1 + β2x2 menjadi Y = 2,31 + 2,74 x1 + 1,24 x2

  20. Pengetahuan yg diperoleh: • Dari 2,31 waktu tempuh, akan melewati 2,74 kali lampu merah ditambah 1,24 kali jarak rmh pelanggan • Dari kasus diatas diketahui 1 lampu merah dan 1,5 km jaraknya, maka X1= 1 (lampu) dan X2=1,5 (jarak) shg kita dpt memprediksi lamanya wkt pesanan tiba di rmh pelanggan dgn cara: Y = 2,31 + 2,74 X1 + 1,24 X2 Y = 2,31 + 2,74 (1) + 1,24 (1,5) = 6,91 menit

  21. Analisis Garis Regresi Menggunakan Koefisien Determinasi Kita telah pelajari subbab sblmnya bhw: • Pers. Grs linear pertama dgn var. pemberi pengaruh x = jarak Y = 14,58 + 4,35 X • Pers. Grs linear kedua dgn var. pemberi pengaruh x1 = jml lampu merah dan x2 = jarak tempuh  Y = 2,31 + 2,74 X1 + 1,24 X2 • Pertanyaan  manakah yg lebih baik? • Solusi  dpt menggunakan ukuran koefisien determinasi yg dinotasikan sbg R2

  22. Koefisien Determinasi dpt dihitung dgn rumus: SSE Syy R2 = 1 - n n SSE = ∑ ei2 = ∑ (yi – yi)2 i=1 i=1 ^ n Syy = ∑ (yi – y)2 i=1

  23. Perhitungan Koefisien Determinasi Y = 14,58 + 4,35 X Y = 2,31 + 2,74 X1 + 1,24 X2

  24. Perhitungan Koefisien Determinasi (2)

  25. Hasil • Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy • = 1 – (4.609,78 / 6.084,02) = 0,2423 = 24,23 % R2 = 1 - • Pers. Regresi kedua (Y = 2,31 + 2,74 X1 +1,24 X2): SSE Syy • = 1 – (115,05 / 6.084,02) = 0,9811 = 98,11 % R2 = 1 -

  26. Hasil • Grs regresi kedua ternyata memiliki Koefisien Determinasi yg lebih tinggi, grs tsb lbh dpt menjelaskan keberagaman wkt pengantaran pesanan. • Utk memprediksi wkt pengantaran sebaiknya menggunakan garis regresi kedua yg mempertimbangkan dua variabel pemberi pengaruh, yaitu banyaknya lampu merah dan jarak rumah pelanggan

  27. Kesimpulan • Kegunaan fungsi prediksi • Cara membuat persamaan garis regresi utk satu atw lbh variabel pemberi pengaruh • Cara melakukan analisis perbandingan antara dua garis regresi berdasarkan koefisien determinasi

More Related