1 / 36

PENGUJIAN DATA

PENGUJIAN DATA. Uji Data. Uji missing data Untuk melihat apakah data yang tidak lengkap/hilang akan memengaruhi pengolahan data secara keseluruhan Uji data outlier

blaine
Download Presentation

PENGUJIAN DATA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PENGUJIAN DATA

  2. Uji Data Uji missing data • Untuk melihat apakah data yang tidak lengkap/hilang akan memengaruhi pengolahan data secara keseluruhan Uji data outlier • Untuk mengetahui sejauh mana data outlier akan mengganggu keseluruhan data, yang dapat mengakibatkan kesalahan dalam menarik kesimpulan Uji asumsi klasik • Untuk mengetahui apakah data memenuhi beberapa asumsi pokok seperti: normalitas data, linearitas data, homoskedastisitas data, dsb.

  3. Analisis Missing Data • Missing data: • Sel-sel kosong pada variabel • Disebabkan karena informasi/data tidak diberikan, sulit diperoleh, atau lupa ditanyakan • Contoh: • Data umur • Data gaji/penghasilan • Dampaknya? • Jika sedikit (sekitar 1%)  dihapus tidak masalah • Jika banyak  perlu pengujian apakah layak diproses lebih lanjut atau tidak

  4. Analisis Missing Data • Uji Keacakan : • Untuk mengetahui apakah data yang hilang bersifat random atau tidak • Random  tidak ada pola tertentu • Contoh: • Kasus 1  lihat buku Singgih Santoso hal.16.

  5. Analisis Missing Data Kasus 1: Uji Keacakan Data Langkah-langkah: • Buka file : missing value.sav • Analyze • Missing value analysis • Masukkan variabel: usia, berat, tinggi dll. ke bagian QUANTITATIVE VARIABLE. • Masukkan variabel minum ke bagian CATEGORICAL VARIABLE. • Masukkan variabel nama ke bagian CASE LABELS. • Pada bagian ESTIMATION (kanan tengah), klik kotak listwise, pairwise, dan EM • Klik ikon PATTERN . Pada bagian DISPLAY klik Tabulated cases.... dan Cases with missing values..... • Klik CONTINUE. • Klik DESCRIPTIVES • Pada bagian INDICATOR VARIABLE STATISTICS, klik Percent missmatch dan klik juga Crosstabulation of .... • Klik OK.

  6. Analisis Missing Data • Bagaimana mengatasi missing data? • Membuang data (kasus) • Mengisi sel (data) yang hilang dengan data tertentu  rata-rata keseluruhan  Lihat contoh Kasus 2.

  7. Analisis Missing Data Kasus 2: Perlakuan terhadap Missing Data Langkah-langkah: • Buka file : missing value.sav • Pilih menu: Transform  Replace Missing Value • Masukkan variabel: usia, berat, tinggi, income, jam kerja dan olah raga ke bagian NEW VARIABLE. • Bagian NAME AND METHOD Bagian NAME  otomatis menampilkan variabel baru USIA_1, dll. Bagian METHOD  pilih Series Mean Abaikan bagian yang lain. 5. Klik OK.

  8. Uji Data Outlier • Outlier : • Data yang secara nyata berbeda dengan data-data yang lain • Mengapa terjadi outlier? • Kesalahan dalam pemasukan data • Kesalahan pengambilan sampel • Memang ada data ekstrim

  9. Deteksi Data Outlier • Deteksi dapat dilakukan dengan 3 cara: • Membuat nilai z (standardisasi data) • Membuat grafik/diagram Scatter Plot • Penyajian Box Plot

  10. Deteksi Data Outlier 1. Standardisasi Data Langkah-langkah: 1. Buka file outlier. 2. Menu Analyse  Descriptive Statistics  Descriptive 3. Masukkan variabel usia, berat, tinggi, income, jam kerja dan olah raga ke bagian VARIABLE(S). 4. Aktifkan (klik) Save standardized values at variables. • Abaikan yang lain lalu klik OK.  Output dapat dilihat pada outlier uji z.sav

  11. Deteksi Data Outlier Rumus standardisasi: _ z = x - X Std. Deviasi Jika nilai z < - 2,5 atau z > + 2,5 maka data tersebut dikategorikan sebagai data outlier.  Lihat tabel output berikut. x = nilai data X = nilai rata-rata Z = Nilai standar

  12. Deteksi Data Outlier

  13. Deteksi Data Outlier

  14. Deteksi Data Outlier 2. Scatter Plot Langkah-langkah: • Buka file outlier. • Menu Graph  Legacy Dialogs  Scatter/Dot • Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER dan tekan tombol DEFINE. • Masukkan variabel income pada sumbu X dan variabel usia pada sumbu Y. • Abaikan bagian yang lain, lalu klik OK  Output dapat dilihat pada outlier scatter plot.sav

  15. Deteksi Data Outlier Scatter Plot Outlier Outlier

  16. Deteksi Data Outlier 3. Box Plot Langkah-langkah: • Buka file outlier. • Menu Analyse  Descriptive Statistics  Explore ... • Masukkan variabel usia dan berat pada kotak DEPENDENT LIST. • Pada bagian DISPLAY (kiri bawah), klik Plots • Buka kotak PLOTS, lalu nonaktifkan steam and leaf pada bagian DESCRIPTIVES. • Klik Continue. • Abaikan yang lain lalu klik OK.  Output disimpan pada file outlier box plot

  17. Deteksi Data Outlier Output: Ekstrim Max Outlier Median Min

  18. Deteksi Data Outlier Ketentuan Box Plot: • Outlier  Jika data terletak 1,5 kali panjang box plot, yang dimulai dari batas atas atau batas bawah • Ekstrim  Jika data terletak melebihi 3 kali panjang box plot, yang dimulai dari batas atas atau batas bawah

  19. Penanganan Outlier Ada dua cara penanganan outlier: • Dihilangkan/dibuang, jika dianggap mencerminkan data yang sesungguhnya atau karena kesalahan pengambilan data, kesalahan inputing dsb. • Dipertahankan, jika data tersebut memang ada atau tidak ada indikasi kesalahan. Pilihan no.1 atau no.2  tergantung pengguna.

  20. Uji Normalitas Data • Tujuan: • Untuk mengetahui apakah data terdistribusi secara normal  bentuk lonceng (bell shape) • Data yang baik  distribusi normal

  21. Uji Normalitas Data Contoh : • Buka file outlier • Menu Analyze  Descriptive Statistics  Explore... • Masukkan variabel usia dan berat pada kotak DEPENDENT LIST • Pada bagian DISPLAY, klik kotak Plots • Buka kotak PLOTS • Aktifkan kotak Normality Plots with tests • NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES • Pilih None pada bagian BOXPLOT • Tekan CONTINUE • Abaikan yang lain lalu klik OK.

  22. Uji Normalitas Data OutputNormalitas Data • Kriteria uji  lihat Kolmogorov-Smirnov dan Shapiro-Wilk • Jika Sig. > 0.05  data terdistribusi normal • Jika Sig. < 0.05  data tidak terdistribusi normal

  23. Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi normal Data bergerombol disekitar garis uji Data menyebar secara acak, tidak membentuk pola tertentu

  24. Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi tidak normal Data bergerombol disekitar garis uji, namun ada data yg terletak jauh dari sebaran data Data membentuk pola tertentu, ke kanan bawah kemudian naik ke atas

  25. Penanganan Data Tidak Normal Ada 4 perlakuan: • Menambah jumlah data • Menghilangkan data penyebab tidak normal • Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang • Terima apa adanya. Pilih alat analisis yang tepat, misalnya gunakan uji nonparametrik

  26. Uji Homoskedastisitas Data • Tujuan: • Untuk mengetahui apakah sebuah kelompok data mempunyai varians yang sama (seperti yang seharusnya terjadi). • Jika varians-nya sama  homoskedastisitas Jika varians-nya tdk sama  heteroskedastisitas • Alat uji: • Levene Test • Analisis Residual  grafik

  27. Uji Homoskedastisitas Data Contoh : • Buka file homoskedastisitas • Menu Analyze  Descriptive Statistics  Explore... • Masukkan variabel tinggi dan jam kerja pada kotak DEPENDENT LIST • Masukkan variabel minum pada kotak FACTOR LIST • Pada bagian DISPLAY, tetap pada pilihan both • Buka kotak PLOTS • Pilih none pada bagian BOXPLOTS • NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES • Pada bagian SPRED VS LEVEL WITH LEVENE TEST, pilih power estimation. • Tekan CONTINUE, abaikan yang lain lalu klik OK.

  28. Uji Homoskedastisitas Data Output • Hipotesis: • H0 : kedua varians populasi sama • H1 : Kedua varians populasi berbeda/tidak identik • Jika: • Sig. > 0.05  H0 diterima , artinya varians-nya sama • Sig. < 0.05  H0 ditolak, artinya varians-nya berbeda

  29. Uji Homoskedastisitas Data Kesimpulan: • Varians data tinggi konsumen yg minum sedikit air mineral berbeda secara nyata dengan varians data tinggi konsumen dengan banyak minum air mineral. • Heteroskedastisitas • Varians data jam kerja konsumen yang minum sedikit air sama dengan varians data konsumen dengan banyak minum air mineral  homoskedastisitas

  30. Penanganan Terhadap Adanya Heteroskedastisitas Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang dengan Levene Test.

  31. Uji Linearitas Data • Linearitas adalah keadaan di mana hubungan antara variabel dependen dengan variabel independen bersifat linear (garis lurus) dalam range variabel tertentu. • Pengujian dilakukan dengan scatter plot (diagram pencar)

  32. Uji Linearitas Data Contoh : Uji asumsi linearitas variabel usia – income Buka file homoskedastisitas • Menu Graph  Legacy Dialogs  Scatter/dot • Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. • Masukkan variabel usia pada sumbu X dan variabel olahraga pada sumbu Y. • Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: • Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR • Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi • Tutup chart editor utk kembali ke output grafik.

  33. Uji Linearitas Data Output: Variabel Usia - Olahraga

  34. Uji Linearitas Data Contoh : Uji asumsi linearitas variabel Olahraga - Berat Buka file homoskedastisitas • Menu Graph  Legacy Dialogs  Scatter/dot • Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. • Masukkan variabel berat pada sumbu X dan variabel olahraga pada sumbu Y. • Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: • Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR • Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi • Tutup chart editor utk kembali ke output grafik.

  35. Uji Linearitas Data Output: Variabel Berat - Olahraga

  36. Uji Linearitas Data Kesimpulan: 1. Untuk variabel usia – olah raga  ada hubungan linear (ada linearitas) 2. Untuk variabel berat – olahraga  tidak ada hubungan linear (tidak ada linearitas)

More Related