540 likes | 946 Views
Validitas. Validitas didefinisikan sebagai sejauh mana tes mampu mengukur apa yang didesain untuk diukur . Kelemahan definisi ini adalah implikasi bahwa tes hanya memiliki satu validitas yang barangkali dibentuk dari satu studi saja .
E N D
Validitasdidefinisikansebagaisejauhmanatesmampumengukurapa yang didesainuntukdiukur. • Kelemahandefinisiiniadalahimplikasibahwateshanyamemilikisatuvaliditas yang barangkalidibentukdarisatustudisaja. • Seharusnyatesdapatmemilikibanyakvaliditasberbeda, tergantungpadatujuankhususuntukapatesdirancang, populasisasaran, kondisiketikatesdiadakandanmetodedalammenentukanvaliditas.
Metode yang menentukanvaliditasmeliputi (1) menganalisisisites (2) menghitungkorelasiantaraskorpadatesdanskorpadakriteriayang dimaksuddan (3) membuatinvestigasikarakteristikataususunanpsikologitertentu yang diukurdengantes. • Semuaprosedurinibermanfaatdalamartibahwaproseduritumeningkatkanpemahamanmengenaiapa yang diukurolehtesdanmenyediakaninformasiuntukpembuatankeputusanmengenaiorang.
Mungkinmenarikjugamengevaluasiincremental validitytesyakniseberapajauhtesmenambahprediksidanpemahamanterhadapkriteria yang telahdiprediksipadabeberapatingkat. • Validitastesdipengaruhioleherortidaksistematismaupunerorsistematis (konstan). Karenaalasanini, tesdapatdiandalkantanpaharus valid tetapitidakdapat valid tanpadapatdiandalkan.
ValiditasIsi • Validitasisi (content validity) merujukkelebihdarisekedarpenampilan. Validitasisiberkaitandenganapakahisitesmenimbulkancakupanrespons yang mewakiliseluruh domain atausemestadariketrampilan, pemahamandanperilaku lain yang telahdirancanguntukdiukurolehtes. • Responsterhadapsampel item padates yang dirancangdengansangatbaikdianggapmenjadiindikasimengenairesponsapa yang akandiberikanpadaseluruhsemestaperilakubersangkutan.
Validitasisijugapentingpadaukuranbakat (aptitude), minatdankepribadianmeskipunbarangkalitidaksebanyak yang dapatdilakukanolehvaliditas yang berkaitandengankriteriaatauvaliditassusunan (construct validity). • Salahsatucaramenyelesaikanvaliditasiniadalahdenganmembandingkanisitesdengangarisbesaratautabelspesifikasiberkaitandenganpokokbahasan yang harusdibahasolehtes.
Jikaahlipokokbahasansetujubahwatestampakdanbertindaksebagai instrument yang dirancanguntukmengukurapasaja yang harusdiukurolehtesmakadapatdikatakantesmemilikivaliditasisi. • Denganmendefinisikansemestaisitesdansampeldarisemesta yang harusdimasukkan, perancangtesdapatmenentukanlangkahuntukmembuat instrument valid isi.
Validitas yang terkaitdenganKriteria • Istilahvaliditas yang terkaitdengan criteria (criterion-related validity) merujukpadaprosedur yang berupaskorteskelompokorang yang dibandingkandenganperingkat, klasifikasiatauukuran lain kinerja. • Contohkriteriayang digunakanmemvalidasitesadalahnilaisekolah, peringkatpenyeliadanangkaataudolarjumlahpenjualan. Jikaukurankriteriatersediapadasaattes, concurrent validity tesdapatditentukan. Jikaskorkriteriabelumtersediasampaibeberapasaatsetelahtesdilaksanakan, fokusmenjadipredictive validity tes.
Concurrent Validity • Prosedurvalidasisamawaktu (concurrent validity procedures) digunakanketikatesdilaksanakanpadaorangdenganberbagaikategori, sepertikelompokdiagnostikklinisatau level sosialekonomidengantujuanmenentukanapakahskortespadasatukategoriberbedadariorangpadakategori lain. • SkorpadaMinnesota Multiphasic Personality Inventory (MMPI) misalnyabermanfaatdalammengidentifikasigangguan mental khususkarenatelahditemukanbahwapasien yang didiagnosisolehpsikiatermemilikigangguantertentucenderungmembuatskorberbedapadakelompok item (skala) tertentudaripadaorangpadaumumnya.
Predictive Validity • Validitasprediksi (predictive validity) berkaitandenganseberapaakuratskortesmemrediksiskor criteria sebagaimanaditunjukkanolehkorelasiantaraskortes (predictor) dengankriteriakinerjamasadepan (apa yang diprediksites). • Predictive validity pentingterutamamenyangkuttesbakatatauteskecerdasankarenaskorpadajenis instrument iniseringberkorelasidenganperingkatkelas, skortespencapaiandankriteriakinerja lain.
Standard erorestimate • BagianregresidanprediksidiLampiran A menjelaskanproseduruntukmenentukanpersamaanregresi (persamaanprediksi) untukmeramalkanskorkriteriakelompokorangdariskortesmerekaatauvariabel lain. • Akantetapi, memasukkanskortesseseorangkedalampersamaanregresihanyamenghasilkanestimasiskorsesungguhnyaakandibuatorangberdasarvariabelkriteria. • Jikaskorkriteriaprediksiorangtertentudipandangsebagai mean distribusi normal dariskorkriteriayang diperolehdarikelompokorang yang membuatskorsamadenganvariabel predictor sepertiorangtersebutmakadeviasi standard distribusiiniadalahindekseror rata-rata padaprediksitersebut.
Faktor yang MempengaruhiValiditas yang BerkaitandenganKriteria • Validitas yang berkaitandengankriteriatesdapatdipengaruhiolehbanyakfaktor yang mencakupperbedaankelompok, panjangtes, kontaminasikriteriadanbase rate. • Validitasincremental tesyaknikontribusitesdiatasdandiluarvariabel lain harusjugadipertimbangkandalammemutuskanapakahakanmenggunakantesuntuktujuanseleksidanpenempatan.
PerbedaanKelompok • Karakteristikkelompokorang yang digunakanuntukmemvalidasitesmeliputivariabelsepertijeniskelamin, usiadancirikepribadian. • Faktorini yang disebutdalamkonteksinisebagaivariabelmoderasidapatmempengaruhikorelasiantaratesdanukurankriteria. • Besarnyakoefisienvaliditassepertipadakoefisienreliabilitasjugadipengaruhiolehderajatheterogenitaskelompokvaliditasmengenaiapa pun yang diukurolehtes.
Koefisienvaliditascenderunglebihkecilpadakelompok yang lebihhomogen. Yakni, kelompok yang memilikirentangskortes yang lebihsempit. • Ukurankoefisienkorelasiadalahfungsidarivariabelprediktordanjugavariabelkriteria. • Karenaitu, menyempitkanrentangskormenurutsalahsatuvariabelitucenderungmenurunkankoefisienvaliditasprediksi.
PanjangTes • Sepertireliabilitas, validitasbervariasimengikutipanjangtesdanheterogenitaskelompok yang dites. • Hinggatitikini, skorpadatespanjangdanskorpadates yang diselenggarakanterhadapkelompokindividusangatberanekaragamkarakteristik yang diukurmemilikivarian yang lebihbesardanakibatnya, validitasprediksi yang lebihtinggidaripadatespendekatautes yang diselenggarakanterhadapkelompokorang yang lebihhomogen.
Kontaminasikriteria. • Validitastesterbatasitidakhanyaolehreliabilitastesdankriterianya, tetapijugavaliditas criteria itusendirisebagaiukurandarivariabel yang dimaksud. • Kadang-kadangkriteriadibuatkurang valid ataumenjaditerkontaminasiolehmetodetertentuuntukmengukurskorkriteria. • Contohnya, ahlipsikologiklinis yang mengetahuibahwasekelompokpasientelahdidiagnosissebagaipsikotikmungkintidakmenampakkantandapsikotikpadaresponsteskepribadianparapasienini. • Kemudianmetodekelompokpembanding(method of contrasting groups) yang manaskortespasienpsikotikdibandingkandenganskororang normal akanmenghasilkanbuktisalahmengenaivaliditastesitu.
ValiditasInkremental • Ketikaberupayamengambilkeputusanapakahmenyelenggarakan instrument pemeriksaankhususuntuktujuanprediksiataukandiagnosistikdapatdibenarkandarisegibiaya, validitas yang meningkatsedikitdemisedikit (incremental validity) harusdipertimbangkan. • Incremental validity menyangkutpertanyaanberapatambahanakurasiterhadapprediksiataudiagnostikjikatestertentudimasukkankekumpulansoalprosedurpemeriksaan. • Adakemungkinanmetodepemeriksaan lain yang tidakmahal (observasi, interview, daftarbiografi) dapatmemenuhitujuanpemeriksaan, demikianjugadapatmenyelenggarakantes lain.
Incremen validity berkaitandengankonsepkegunaan (utility), seperti yang diterapkanpadakonteksseleksitenagakerja. • Kegunaantesdidefinisikansebagaikenaikanterukurmututenagakerja yang dipekerjakanataudipromosikanjikatesatauprosedurpemeriksaan lain digunakandibandingkandenganmututenagakerja yang dipekerjakanataudipromosikanjikaproseduritutidakdigunakan.
Construct Validity • Validitasprediksisangatpentingpadaseleksidanpenempatantenagakerjaataupendidikan. Berbagaijenisteskemampuandankadang-kadangteskepribadiandanminatdigunakanuntuktujuanseleksidanpenempatan. • Yang jugalebihpentingmenyangkutteskepribadianadalahvaliditassusunan. • Validitaspenalaran (construct validity) pada instrument pemeriksaanpsikologimengacukesejauhmana instrument tertentumengukursusunan (construct) ataukonseppsikologitertentusepertikecemasan, motivasipencapaian, ekstroversi-introversiatauneurotisme.
Construct validity, yang merupakanjenisvaliditas paling umum, tidakditentukandengancaratunggalataudenganinvestigasi. • Melainkanmelibatkaninvestigasijaringandanprosedur lain yang dirancanguntukmenentukanapakahkonsumenpemeriksaantertentu yang dianggapmengukurvariabelkepribadiantertentumemangbenar-benarmengukurnya.
BuktiatasContruct Validity • Penilaianolehpakarbahwaisitesberkaitandengan construct yang dimaksud. • Analisiskonsistensites. • Penelitianbaikberupakejadian yang dirancangsecaracerdasuntukeksperimenmaupunkelompok yang terjadisecaraalamimengenaiketerhubunganantaraskortesdanvariabel lain yang membedakankelompok-kelompoktersebut.
Korelasiskortesdenganskortesatauvariabel lain yang diharapkanmemilikihubungantertentudiikutidengananalisisfaktorkorelasitersebut. • Menanyaipesertatesataupemeringkatantessecararincimengenairesponsmerekaterhadaptesatauskalaperingkatuntukmengungkapproses mental spesifik yang terlibatpadapemberianresponsterhadap item.
Berbagaijenisinformasimenyumbangkepembentukancontruct validity instrument psikometrik. • Informasitersebutdapatditerimadarianalisispenalaranataustatistikatasvariabel yang diperiksaoleh instrument danpenelitianmengenaikemampuannyamemprediksiperilakupadasituasitempatberlangsungnya construct.
MenurutteoripembelajaranHullian, kecemasanmerupakandorongan (drive) karenaituorangsangatcemasakanlebihmudahterkondisidaripadaorang yang kurangcemas. • Karenaitujika TMAS merupakanukuran yang valid atas construct kecemasan, skortinggipada TMAS harusmengkondisilebihcepatpadasituasiinidaripadaskorrendah. • Verifikasiatasprediksiiniberkontribusisecarasignifikanterhadappenerimaanconstruct validity pada TMAS
ValiditasKonvergendanValiditasDiskriminan • Instrumen yang divalidasi-construct harusmemilikikorelasitinggidenganukuran lain ataumetodepengukuran yang samaconstructnya (validitaskonvergen), tetapikorelasirendahdenganukuranconstruct yang berbeda (validitasdiskriminan). Buktiatasvaliditaskonvergendandiskriminanpada instrument dapatdiperolehdenganmembandingkankorelasiantarukuranberikut : • Construct yang samadenganmenggunakanmetode yang sama. • Construct berbedadenganmetode yang sama. • Construct yang samadenganmetode yang berbeda. • Construct yang berbedadenganmenggunakanmetode yang berbeda.
Construct validity instrument psikometrikdibuktikanmelaluipendekatanciri-kepribadiangandametodegandaataumultitraitmultimethod approach jikakorelasiantara construct yang samadiukurdenganmetode yang samadanmetode yang berbedaadalahlebihtinggisecarasignifikandaripadakorelasiantaraconstruct yang berbeda yang diukurdenganmetode yang samaataumetode yang berbeda.
Kadang-kadang, korelasiantaraconstruct yang berbeda yang diukurdenganmetode yang samalebihtinggidaripadakorelasiantaraconstruct yang samadenganmetode yang berbeda. • Hal iniberartimetode (kumpulansoaltulisantangan, teknikproyeksi, skalaperingkat, interview dll) lebihpentingdaripadaconstruct ataucirikepribadian (trait) dalammenentukanapa pun yang diukurdaripada construct ataucirikepribadian yang dianggapsedangdiperiksa.
PenggunaanTesPadaPengambilanKeputusanPribadi • Sejakjamandahulu, orangdiseleksi, dikelompokkandanditempatkankesejumlahposisiuntukmelaksanakanberagamkewajiban. • Akantetapi, seringprosedur yang diikutipadaseleksi, pengelompokandanpenempatanpersonaliatidakteraturdantidaksistematis. • Beragamproseduruntukseleksidanpenaksiranpersonalia yang banyakdidasarkanpadaobservasisederhanadanintuisitelahdipergunakan. • Contohnya, padasuatusaat, penekananpadafiturfisiksepertibentukkepala, gerakanmatadantampilantubuhsecarakeseluruhan. Asaletnis, status social danhubungan social jugamerupakanfaktoruntukmenentukansiapa yang ditunjukuntukposisitertentu, dipekerjakanuntukpekerjaantertentuatauditerimauntuk program pendidikantertentu.
Penyaringan • Secaratradisional, seleksipersonaliaakanmenyangkutpengidentifikasiandaridaftarpelamar, siapa yang paling mampumelaksanakantugas yang direncanakan. • Padapendekatanini, tespsikologidigunakanbersamadenganinformasi non-tes (sejarahpersonalia, karakteristikfisik, rekomendasidll). Untukmembantumenyeleksipelamar yang dapatmelaksanakantugastertentusecaralangsungatausetelahdi-training dengancepat. • Prosedurseleksipersonaliamungkinagaksederhanaatausangatrumitbergantungpadasifatorganisasidantugas yang dihadapiolehpelamar yang diseleksi. • Pendekatanyang paling sederhanaadalahstrategigagalatauberhasilyaknisemuapelamardiseleksiatauditerimatetapihanya yang mampumelaksanakantugassecaraefektif yang dipertahankan.
Dalambanyakhal, pendekataninimerupakanstrategiseleksi yang ideal tetapijugamahalbagiorganisasidanpelamar. • Akibatnya, hampirsemuaorganisasibesarsaatinimenggunakanbeberapajenisprosedurpenyaringan (screening procedure) yang manapelamar yang jelas-jelastidaksesuaidengantugas (pekerjaan, program ataukegiatan lain) ditolaksecaralangsung. • Jikaprosedurpenyaringanmencakuptesjenistertentu, pelamar yang mencapaiskor minimum tertentu (skorbatasataucut off score) ataulebihtinggipadatesituditerimadanpelamar yang skornyadibawahskorbatasditolak.
KlasifikasidanPenempatan • Penyaringanawalbiasanyadiikutiolehklasifikasidanpemasanganpelamarterpilihkesalahsatudarisejumlahkategoripekerjaan. • Keputusanklasifikasidapatmelibatkanpengelompokankaryawanberdasarskorpadalebihdarisatutespsikologi. Penyaringandanklasifikasiseringdiikutiolehpenempatanorang yang telahterseleksipadatingkattertentupekerjaan program. • Prosesseleksipegawaibiasanyaberisiurutantahap yang berupaserangkaiankeputusanya-tidakberdasarinformasi yang diperolehdariblangkolamaran, suratreferensi, panggilantelepon, interview pribadi, observasidantespsikologi.
Tujuanpengumpulaninformasisepertiituidentikdenganpenerapanpsikologi lain : untukmembuatprediksi yang lebihbaikmengenaiperilakumendatangberdasarkanperilakumasalaludansekarang. • Semakindapatdiandalkandanvalidnyainformasinyasemakinbesarkecenderunganpembuatanprediksi yang akuratatasperilakudipekerjaandi program dankarenaitusemakinsehatkeputusanseleksinya. • Tentu, keandalandanvaliditas instrument danprosedurpemeriksaanpsikologiuntukmembuatkeputusanseleksitidakdapatditentukansemata-matadenganmeneliti material pemeriksaan.
TabelPengharapan • Jikatesdigunakanuntuktujuanseleksiakantidakterlalukorelasi criteria-tesdanpersamaanregresi yang menghubungkankinerjavariabelkriteriaterhadapskortes. • Metodekorelasidapatditerapkankepenyusunantabelpengharapan(expectancy table) teoritis, tetapitabelpengharapanempirisdapatdisusuntanpamenghitungkoefisienkorelasiataustatistiklain kecualifrekuensidanpersentase.
Tabeldisusundaridistribusifrekuensigabunganskor 250 pelamarkerjapada OST (Occupational Selection Test) danpemeringkatan yang diberikankepadaparapelamarolehpara supervisor mereka 6 bulansetelahdipekerjakan. • Interval skor OST dibuatdaftarnyadisisikiritabeldanpemeringkatankinerja (padaskala 1 – 8) adadiatas. • Frekuensi yang tidakditulis miring padaselditabelitumerupakanjumlahkaryawan yang mendapatskor OST didalamrentang 5 poindanpemeringkatankinerjatertentuditunjukkandibagianataskolom. Contohnya, 10 karyawan yang skor OST-nyaantara 81 dan 85 diberiperingkatkinerja 5 oleh supervisor mereka, sedangkan 14 karyawan yang skor OST antara 66 dan 70 diberiperingkatkinerja 4.
Angka yang ditulis miring padakurungdiTabel 5.1 merupakanprosentaseorang yang memilikiskor OST pada interval tertentu yang pemeringkatankinerjanyasamadengannilaiterkaitpadaseltertentuatau yang lebihtinggi. • Contohnya, 85 % karyawan yang skor OST-nyaberadapada interval 81-85 menerimaperingkatkinerja 5 ataulebihdan 61 % dari yang memilikiskor OST antara 66 dan 70 memilikiperingkatkinerja 4 ataulebih. • Misalkan John, karyawanberpotensidarikelompok yang serupadengan yang adadisusunditabel 5.1, membuatskor 68 padaOccupational Selection Test. Kemudiandapatdiestimasipeluang John adalah 61 dari 100 diaakanmenerimaperingkat 4 ataulebihtinggipadakinerjapekerjaanoleh supervisor 6 bulansetelahdimulainyapekerjaanitu, tetapipeluangdiamenerimaperingkatkinerja 6 ataulebihadalahhanya 5 dari 100. Jikaperingkat 4 ataulebihdapatditerimamaka John mungkindipekerjakan.
Faktor yang mempengaruhikeakuratanprediksi • Keakuratanprediksiterhadapskor criteria pelamarbergantungpadatidakhanyaukurankorelasiantaravariabel predictor danvariabel criteria tetapijugapadajumlaherornegatif-salahataupositifsalah, rasioseleksidantingkatdasar (base rate). • Jikaskorbatas (cutoff score) padatesditetapkansangatrendah, akanadabanyakpenerimaan yang tidakbenarataupositifsalah. Yakniparapelamar yang diseleksitetapitidaksuksesdipekerjaanatau program mereka.
Sebaliknya, jikaskorbatasditetapkansangattinggiakanadabanyakpenolakan yang tidakbenaratau negative-salah. • Yakniparapelamar yang tidakdipilihtetapimerekaakansangatsuksesseandainyamerekadipilih. • Karenatujuanseleksipersonaliadiperolehsebanyakmungkin yang “sukses” yaknimemilihorang yang suksesdanmenolakorang yang akangagalberkinerjabaikdipekerjaan – skorbatasharusditetapkansecaracermat.
Ketikamenetapkanskorbataspadatesataukumpulantes, peningkatanmempertimbangkanproporsipelamar yang akandiseleksi, rasioseleksi. • Semakinrendahrasioseleksi, semakintinggiskorbatasnya, demikian pula sebaliknya. Karenajumlaherorpositif-salahdipengaruhiolehdimanaskorbatasditetapkan, orangbisaberpendapatrasioseleksiharusditentukanolehkeseriusanrelatifduajeniserorini. • Apakaherordibuatkarenamenerimapelamar yang gagalmelaksanakanpekerjaansecaramemuaskan (positifgagal) lebihkurangatauseriusdaripadamenolakpelamar yang sebetulnyadapatmelaksanakantugasdenganbaikjikadiadipilih (negatifsalah) ?
Sebaliknya, padapasartenagakerja yang bebasatauterbuka , jumlahpelamarbanyakkarenaiturasioseleksibiasanyaakanrendah. • Rasioseleksirendahberartiskorbataspadatesituperluditetapkanagaktinggi yang akanmenyebabkanlebihrendahnyajumlahpelamar yang diterima. • Jugaakanadalebihsedikitpositifsalahtetapisayangnyaakanadalebihbanyakjumlahpelamar yang ditolak yang sebetulnyaakanmampubekerjabaikdipekerjaanitubiladiberipeluang (negatifsalah). • Persentasepelamar yang berhasilbaikakanbervariasisecaraterbalikdenganrasioseleksitetapijugabervariasisecaralangsung (searah) denganvaliditastesatausaranaseleksilainnya. Secaraumum, semakin valid tesnyaakanmenyebabkansemakinbesarnyapersentasesukses (positifsebenarnyaataunegatidsebenarnya) dansemakinkecilpersentasepositifsalahataunegatifsalah.
Faktor lain yang mempengaruhikeakuratantesdalammenunjukkanorang yang akanberperilakucaratertentuadalahbase rate yakniproporsipelamar yang diharapkanbekerjadenganmemuaskanpadapekerjaantertentumeskipuntidakada instrument atauprosedur yang diterapkan. • Mengenairasioseleksi, tes yang dirancanguntukmemprediksijenisperilakutertentuakansangatefektifjika base rate-nyasangattinggiatausangatrendah. • Karenaalasanini, tes yang dirancanguntukmenyeleksiorangpadapekerjaan yang rumit yang karenaitu relative sedikitsajapelamar yang dapatbekerjabaikakantidakseefektiftes yang dirancanguntukmenyeleksiorangpadapekerjaan yang dilakukandenganmemuaskanolehseparuhpelamar.
Konsep base rate jugapentingpada diagnosis klinis. Contohnyakarenatingkatkejadian (incidence) bunuhdiripadapopulasiumumitusangatrendah (base rate rendah), tes yang dirancanguntukmengenaliorang yang memenuhikriteriadepresiakanlebihtinggikarenapersentaseorangdepresipadapopulasisecaraumumitulebihtinggi (2% hingga 9 % populasi) daripada yang berpotensibunuhdiri. • PengamatankesejumlahTabel Taylor-Russell untukbase rate tertentumemperlihatkanpersentasepelamar yang diharapkansuksesbervariasimengikutisecaralangsungdengankoefisienvaliditastetapisecaraterbalikdenganrasioseleksi.
SkorbatasgandadanRegresiGanda • Serangkaianskortesdanukuran lain digabungkanuntukmembuatkeputusanseleksidanklasifikasi. Salahsatuproseduruntukmenggabungkanskor yang disebutpagarberuntunataubatasganda (multiple cutoff) ialahdenganmenetapkanskorbatas yang terpisahpadatiap-tiapdarisejumlahukuran. • Tanpamemandangseberapatinggiskormerekapadateskemampuankognitif, orang yang tulitekanansuaratidakdiharapkanmenjadikonduktor orchestra yang baik.