MAKALAH EVALUASI
PEMBELAJARAN
“VALIDITAS DAN
RELIABILITAS TES”
Makalah
ini disusun untuk memenuhi tugas mata kuliah Evaluasi Pembelajaran
Disusun
oleh :
1. Timor (12014
2. Nailil
Muna (1201410007)
3. Pramadita Setyowati (1201410014)
4. Tri Wicaksono (1201410026)
5. Putra Triya A. (1201410029)
6. Binta Gunawan (12014100
7. Bayu Aji P. (1201410044)
8. Nur
Aina Dwi W (1201411071)
9. Veti
Kurnia (1201411052)
10. Nur
Faizah (1201411042)
PENDIDIKAN LUAR SEKOLAH
FAKULTAS ILMU
PENDIDIKAN
UNIVERSITAS NEGERI
SEMARANG
2013
BAB I
PENDAHULUAN
A.
Latar
Belakang
Perkembangan konsep penilaian
pendidikan yang ada pada saat ini menunjukkan arah yang lebih luas. Penilaian
program pendidikan menyangkut penilaian terhadap tujuan pendidikan, isi
program, strategi pelaksanaan program dan sarana pendidikan. Penilaian proses
belajar mengajar menyangkut penilaian terhadap kegiatan guru, kegiatan siswa,
pola interaksi guru siswa dan keterlaksanaan program belajar mengajar.
Sedangkan penilaian hasil belajar menyangkut hasil belajar jangka pendek dan
hasil belajar jangka panjang.
Dengan demikian, inti penilaian
adalah proses memberikan atau menentukan nilai kepada objek tertentu
berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut
berlangsung, baik dalam bentuk validitas maupun reliabilitas. Keberhasilan
mengungkapkan hasil dan proses belajar siswa sebagaimana adanya (objektivitas
hasil penilaian) sangat tergantung pada kualitas alat penilaiannya di samping
pada cara pelaksanaannya.
Standarisasi tes mengisyaratkan uji
validitas dan reliabilitas tes . tes yang sudah standar atau baku akan memiliki
nilai manfaat praktis karena hasil yang diperoleh dari penerapan tes itu akan
diperoleh skor yang sahih dan konsisten. Oleh karena itu guru sebelum
menerapkan tes kepada siswa, sebaiknya terlebih dahulu menguji validitas dan
reliabilitas tes yang telah dibuat.
Berdasarkan hal tersebut, maka
penulisan makalah ini akan difokuskan pada pembahasan tentang “Validitas dan Reliabilitas Tes” agar
dapat lebih memahami apa itu sebenarnya validitas dan reliabilitas serta lebih
memahami bagaimana mengetahui suatu alat penilaian dikatakan mempunyai kualitas
yang baik.
B.
Rumusan
Masalah
Adapun yang menjadi rumusan masalah dalam makalah
ini, yaitu:
1. Bagaimana
karakteristik tes hasil belajar yang baik ?
2. Apakah
yang dimaksud dengan validitas tes hasil belajar ?
3. Apakah
faktor-faktor yang mempengaruhi validitas tes hasil belajar ?
4. Apakah
yang dimaksud dengan reliabilitas tes hasil belajar ?
5. Apakah
faktor-faktor yang mempengaruhi reliabilitas tes hasil belajar ?
C.
Tujuan
Berdasarkan rumusan masalah di
atas, maka penulis dapat menguraikan tujuan dari masalah tersebut, yaitu:
1. Untuk
mengetahui karakteristik tes hasil belajar yang baik.
2. Untuk
mengetahui yang dimaksud dengan validitas tes hasil belajar.
3. Untuk
mengetahui faktor-faktor yang mempengaruhi validitas tes hasil belajar.
4. Untuk
mengetahui yang dimaksud dengan reliabilitas tes hasil belajar.
5. Untuk
mengetahui faktor-faktor yang mempengaruhi reliabilitas tes hasil belajar.
BAB II
PEMBAHASAN
A.
Karakteristik
Tes Hasil Belajar
Karakteristik menggambarkan seluruh
tes namun karakteristik itu lebih mungkin menjadi penanda tes standar dari pada
tes yang dikembangkan oleh guru. Tes standar merupakan tes yang dikembangkan
oleh para pakar dan dibuat secara hati-hati. Butir soal tes satu per satu
dianalisis dan direvisi sampai memenuhi standar kualitas tertentu.
Validitas berkaitan dengan apakah
suatu tes mengukur dan untuk siapa tes itu layak digunakan. Sedangkan
reliabilitas mengacu pada konsistensi yang dapat diestimasikan dari data (skor)
dengan menggunakan teknik statistic yang diperoleh dari koefisien korelasi.
Koefisien korelasi menunjukkan angka desimal antara 0,00 sampai 1,00. Angka
yang mendekati 0,00 menunjukkan validitas atau reliabilitas rendah. Sedangkan
angka yang mendekati 1,00 menunjukkan validitas dan reliabilitas tinggi.
Spesifikasi kondisi di dalam ujian juga menjadi karakteristik penting bagi tes
standar.
B.
Validitas
Tes Hasil Belajar
1.
Pengertian
Validitas
Validitas merupakan derajat
kemampuan suatu tes yang mengukur apa yang hendak diukur. Secara tidak langsung
itu meliputi tes dan skala yang terdiri atas sejumlah tugas yang dipilih untuk
berfungsi sebagai indikator hasil belajar.
Validitas berkenaan dengan
ketetapan alat penilaian terhadap konsep yang dinilai sehingga betul-betul
menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai kemampuan
siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan
berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat
menjawab karena tidak memahami pertanyaannya. Validitas tidak berlaku universal
sebab bergantung pada situasi dan tujuan penilaian. Alat penilaian yang telah
valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang
lain.
Dalam menggunakan validitas suatu
tes, ada beberapa hal yang perlu diperhatikan, yaitu :
a. Mengacu
pada materi yang hendak diujikan.
b. Mengacu
pada hasil dari suatu tes atau instrument evaluasi yang dikenakan pada
sekelompok individu.
c. Berkaitan
dengan derajar dengan istilah validasi tinggi, sedang, rendah.
d. Mengacu
pada penggunaan hasil evaluasi.
2.
Teknik-Teknik
Validasi Tes
a.
Validitas
Tes Acuan Normatif
1) Validitas
Isi
Merupakan derajad dimana suatu tes
mengukur bidang-bidang isi pelajaran yang hendak diukur. Hal ini sangat penting
bagi tes hasil belajar. Validitas isi mempersyaratkan adanya validitas butir
soal dan sampel isi pelajaran. Esensi validitas isi berkaitan dengan sampel.
Dan menjadi penting apabila ingin menggambarkan kinerja siswa terhadap suatu
ranah tugas tertentu.
Validitas
isi ditentukan oleh penilaian (judgement) para pakar. Tidak ada rumus untuk
menghitungnya dan tidak ada cara untuk mengungkapnya secara kuantitatif. Para pakar
mengkaji seluruh butir soal dan membuat penilaian tentang seberapa baik butir
soal itu mencerminkan bidang yang diujikan.
2) Validitas
Konstrak
Merupakan derajat dimana suatu tes
mampu mengukur konstruk hipotetik yang hendak diukur. Tahapan validitas
konstruk yaitu mengidentifikasi konstruk yang diperkirakan untuk menghitung
kinerja tes, menarik hipotesis berkenaan dengan kinerja tes dari teori
masing-masing konstruk, menguji hipotesis berdasarkan logika dan data empirik.
3) Validitas
Kongkaren
Merupakan derajat dimana skor suatu
tes berkaitan dengan skor tes lainnya, yakni tes yang telah sahih kemudian
diujikan pada waktu yang bersamaan dengan tes yang baru dibuat.
4) Validitas
Peramalan
Merupakan
derajat dimana suatu tes dapat meramalkan seberapa baik siswa akan melaksanakan
tugas di dalam situasi mendatang. Validitas peramalan ditentukan dengan cara
merumuskan hubungan antara skor tes dengan ukuran keberhasilan pada situasi
yang diinginkan.
b.
Validitas
Tes Acuan Patokan
Tujuan utama TAP untuk mengukur hasil belajar pada
satu tujuan pembelajaran atau lebih, sehingga validitas isi akan menjadi
perhatian utama di dalam menentukan reliabilitasnya.
1) Validitas
Isi
Validitas isi pada TAP berkaitan dengan derajat
kemampuan tes mengukur pencapaian tujuan pembelajaran. Seperti halnya dengan
TAN, pada TAP juga berkaitan dengan validitas butir soal dan validitas sampel
tujuan pembelajaran. Validitas isi juga disebur sebagai validitas deskriptif.
2) Validitas
Peramalan
Validitas peramalan pada TAP mempertanyakan
kemampuan tes meramalkan kinerja siswa di masa depan. Validitas ini juga
disebut sebagai validitas fungsional. Dengan demikian salah satu fungsi tes
adalah untuk membuat peramalan di masa depan. Apabila tes itu baik, maka dapat
dikatakan bahwa tes tersebut memiliki validitas fungsional.
3.
Uji
Validitas
a.
Validitas
eksternal
Merupakan teknik validitas yang mengkorelasikan
antara skor hasil pengukuran baru dengan skor hasil pengukuran lain yang
memiliki tujuan sama.
Rumus Korelasi Product Moment :
rxy =
Ket:
rxy = Koefisien korelasi
antara variabel X dan variabel Y, dua variabel
yang dikorelasikan
X = skor hasil pengukuran baru
Y = skor rapor
N = jumlah siswa
b.
Validitas
Internal
Merupakan teknik validitas yang
berusaha ingin mengetahui kesesuaian antara satu butir dengan keseluruhan
butir. Dua teknik yang digunakan yaitu analisis bagian atau faktor dan analisis
butir.
C.
Faktor
Yang Mempengaruhi Validitas
1. Ketidakjelasan
petunjuk tes.
2. Kesulitan
siswa dalam memahami padanan kata dan struktur kalimat.
3. Tingkat
kesulitan butir soal.
4. Pembuatan
butir soal.
5. Kedwimukaan
(ambiguity).
6. Butir
soal kurang baik.
7. Butir
soal terlalu pendek.
8. Penyusunan
butir soal dalam tes.
9. Pola-pola
jawaban.
D.
Reliabilitas
Tes
1.
Pengertian
Reliabilitas
adalah indeks yang menunjukan sejauh mana suatu
alat ukur dipercaya atau dapat diandalkan. Reliabilitas mengacu
pada keajegan hasil evaluasi, yakni
konsistensi skor tes (test
score) dari masa ke masa.jika seorang guru memperoleh skor yang sama pada tes
yang sama pada kelompok siswa yang sama pada waktu yang berbeda, maka dia dapat
menyimpulkan bahwa hasil tes itu memiliki derajat reliabilitas tes yang tinggi
dari suatu masa ke masa.konsistensi
hasil evaluasi itu menjadi sangat berharga.
Jika didasarkan
pada data yang valid dan ditetapkan secara objektif.
Suatu
hasil evaluasi pada umumnya tidak pernah mencapai konsistensi
secara sempurna. Beberapa
jenis pengukuran tentu memiliki berbagai jenis kesalahan
ada bebrapa faktor
berkaitan dengan karakteristik yang
bersifat temporer atau permanen. Sumber
lain berkaitan dengan karakteristik
tes itu atau cara melaksanakan ujian, pensekoran dan penafsiran
hasil ujian.
Makna reliabilitas
dapatdiklarifikasikan dengan memperhatikan hal- hal berikut :
a. Reliabilitas
mengacu pada hassil yang diperoleh.
b. Estimasi
reliabilitas biasanya mengacu pada jenis konsistensi tertentu.
c. Reliabilitas
adalah penting, namun
bukan menjadi prasyarat bagi validitas.
d. Reliabilitas
selalu menggunakan statistic.
2.
Teknik-teknik
reliabilitas
Penghitungan reliabilitas
untuk tes acuan normative setidak- tidaknya
lebih mudah
dibandingkan dengan pernghitungan validitasa. Ada banyak
jenis reliabilitas yang berbeda-beda, masing-masing
ditentukan dengan cara-cara yang bebeda dan
massing-masing menjelaskan jenis konsistensi
yang berbeda .teknik reliabilitas tes
ulang, bentuk
satara, dan
belah
dua semua nya ditentukan melalui korelasi.
a.
Teknik
Reliabilitas Untuk Tes Acuan Normatif
Skor
tes dapat menjadi reliable atau konsisten secara berbeda.skor itu
dapat dikatagorisasikan sesuaikan dengan apakak sekor-sekor itu diperoleh
dari satu tes yang diujikan sekali, dua kali, ataukah dua tes diujukan
dalam satu waktu sekali.rliabelitas ini dapat diestimasikan dengan
menggunakan teknik korelasi, dan diungkap dengan
angka decimal antara 0,00 sampai
dengan 1,00
1)
Reliabilitas
tes ulang (test-retest reliability)
Teknik reliabilitas tes ulang adalah derajat dimana skor
tes tetap konsisten sepanjang masa. Ia menunjukan sebaran skor yang terjadi
dari bebrapa kegiatan ujian sebagai hasil dari kesalahan pengukuran
2)
Reliabilitas
bentuk setara (Equivalent-form
Reliability)
Teknik reliabilitas setara adalah dua tes yang identik
kecuali untuk soal-soal aktual. Dua bentuk tes itu mengukur bidang isi
pelajaran yang sama, jumlah soal sama, struktur soal sama, tingkat kesulitan
sama, dan petunjukn ujian, penskoran dan penafsiran sama.
3)
Reliabilitas
Belah Dua (Spil-Half
Reliabiliy)
Reliabilitas belah dua merupakan jenis reliabilitas yang
didasarkan pada konsistensi internal dari suatu tes. Karena prosedur
reliabilitas belah dua hanya memerlukan satu kali ujian, maka sumber kesalahan
pengukuran dapat dikurangi, seperti perbedaan situasi dan kondisi ujian, yang
dapat terjadi pada perhitungan reliabilitas tes ulang.
4)
Reliabilitas
kesetaraan nasional (Retional Equivalence
Reliability)
Reliabilitas kesataraan nasional tidak dihitung melalui
korelasi, namun melalui penetapan hubungan antara satu butir soal dengan
seluruh butir lainnya dan total butir soal dalam tes.
b.
Reliabilitas Tes Acuan Patokan
Reliabilitas tes
acuan patokan mengacu pada konsistensi tes mengukur apa yang diukur. Perhatian
tes acuan patokan adalah asesmen derajat stabilitas atau kesetaraan, yakni
reliabilitas bentuk tes ulamg dan kesetaraan.
1)
Tes acuan patokan non-materi
Walaupun secara
teoritik variabilitas skor yang dicapai siswa tidak ada dalam tes acuan
patokan, namun demikian variabilitas itu tetap ada. Oleh karena itu apabila tes
acuan patokan itu diterapkan dan tingkat kinerja setiap siswa dicatat, maka
hampir selalu terjadi variabilitas skor. Derajat variabilitas itu akan
bervariasi dari kelompok ke kelompok dan dari tes ke tes lainnya.
Apabila terdapat
variabilitas skor, maka dapat digunakan pengukuran tradisional untuk menghitung
reliabilitas. Pendekatan yang digunakan untuk menghitung koefisien reliabilitas
pada tes acuan patokan hingga sekarang ini belum ada yang diterima oleh semua
pihak.
2)
Tes acuan patokan materi
Livingston telah
mengusulkan pendekatan untuk membuat estimasi reliabilitas tes acuan patokan.
Rumus yang digunakan pada dasarnya adalah generalisasi dari teori reliabilitas
klasik. Rumus yang digunakan itu menghitung reliabilitas tes acuan patokan
dengan cara pertama-tama menghitung reliabilitas tradisional, seperti pada
acuan tes normatif, kemudian menyesuaikan berdasrkan pada kriteria skor tes
acuan patokan. Rumus yang digunakan hanya cocok untuk jenis tes materi.
E.
Faktor –faktor Yang
Mempengaruhi Reliabilitas
Banyak
faktor mempengaruhi
reliabilitas, beberapa
faktor dberkaitan dengan
tes itu sendiri, siswa yang mengikuti ujian, lingkungan dimana ujian
itu diselenggarakan, administrassi
tes dan prossedur pensekoran. Faktor-faktor
tersebut akan dapat digunakan sebagai bahan untuk memperbaiki proseddur
pengembangan tes, pemakain tes, dan
analisis informasi tes.
Pertimabngan
tentang faktor-faktor
yang mempengaruhi realiabilitas
tes ini buakn saja membantu guru dalam menasirkan kofisien reliabilitass
tes standar searalebih baik,melainkan juga membantu kita didalam
merumuskan tes yang lebih reliable.
Bebrapa faktor
yang dimaksud
secara ringkas dijelaskan sebagai berikut:
1.
Panjang
Tes (length of test)
Kemunginan
cara paling rasional untuk meningkatkan reliabilitas adalah
menambah
jumlah butiran soal.penambahan butiran soal akan memperbaiki
sampel ranah perilaku yang diujikan,
perbaikan sampel ranah perilaku
itu akan menghasilkan validitas lebih tinggi dan mengurangi faktor kebetulan seperti tekanan.
Walaupun
sampel perilaku itu banyak dan dapat menjaddikan butir soal
semakn banyak pula,namun perlu diperhatiakan adalah butiran soal itu
jangan terlalau banyak sehinnga waktu yang disediakan untuk ujian tidak
cukup untuk siswa yang mengerjakannya. Pendeknya, semakin banyak
butir soal yang ada pada suatu tes maka semakin baik sampel perilaku
yang diukur didalam tes tersebut.
2.
Sebaran
skor (spread of scores)
Metode
korelasi untuk mmengestimasi reliabilitas memerlukan sebaran
sekor. Jika sebaran sekor itu
sempit, maka
koefisien reliabilitas akan
menjadi randah.begitu pula jika sebaran skor itu luas, maka koefisien reliabiltas
akan menjadi tinggi.
Sebaran
skor yang diperoleh siswa pada suatu tes adalah tergantung
pada tingkat kesulitan
butir soal yang disajikan
dan kemampuan
siswa dalam mengerjakan soal.
3.
Keobjektivan
skor (score objectivity)
Tes
objektif merupakan tes yang mampu mengurangi subjektivitas penskoran, artinya: setiap orang
yang menskor hassil tes akan menemukan skor yang sama
pada siswa yang sama. Untuk
meningkatkan objektivitas, proses pensekoran harus
dilakuakan seobjektif mungkin dan mengurangi
pengaruh guru dalam menskor hassil ujian siswa.
F.
Penafsiran Koefisien Validitas dan Reliabilitas
Penafsiran
skor koefisien korelasi tergantung pada bagaimana tes itu akan digunakan.
Apabila skor koefisien korelasi digunakan untuk mengestimasikan validitas atau
reliabilitas instrumen pengukuran, maka kriteria yang harus diambil harus lebih
tinggi dibandingkan dengan apabila skor koefisien itu digunakan untuk tujuan
tertentu, sperti penelitian yang mencari hubungan antar variabel. Koefisien
korelasi 0,45 misalnya, dikatakan baik untuk penelitian korelasional, namun
tidak baik untuk dijadikan sebagai indeks validitas prediktif, dan sangat buruk
untuk dijadikan sebagai indeks reliabilitas. Demikian pula, koefisein 0,60
dapat dikatakan baik untuk penelitian prediktif, namun masih belum memuaskan
untuk mengestimasi reliabilitas.
Berkenaan
dengan validitas, seringkali penyusunan tes menghitung koefesien korelasi untuk
menentukan validitas prediktif, yakni derajat hubungan antara skor prediktor
dengan kriterium. Koefesien 0,40, misalnya, akan memiliki sedikit makna bagi
tujuan prediksi, karena hal ini menunjukkan korelasi yang rendah, dan
menunjukkan variasi 16%, sehingga tidak mampu digunakan untuk memprediksi skor
kriterium. Oleh karena itu tes yang skor koefesien korelasi di bawah 0,50
umumnya tidak memiliki manfaat untuk digunakan sebagai instrumen untuk
memprediksi kemampuan sekelompok atau individu siswa. Berkenaan dengan
reliabilitas, berapakah skor koefesien reliabilitas yang baik untuk sebuah tes.
Untuk tes kemampuan dan prestasi belajar yang standar, umumnya skor koefesien korelasi
yang dilipih adalah 0,90. Tes kepribadian umumnya menetapkan skor koefesien
korelasi minimal 0,80.
BAB III
PENUTUP
A.
Kesimpulan
Secara
sederhana pengertian validitas adalah derajat kemampuan suatu tes mengukur apa
yang hendak diukur. Ada bebrapa teknik untuk mengukur validitas tes, yaitu
validitas tes isi, validitas konstrak, validitas kongkaren, dan validitas
peramalan.
Reliabilitas
mengacu pada keajegan hasil evaluasi, yakni konsistensi skor tes dari masa ke
masa. Ada bebrapa teknik untuk mengukur reliabilitas tes, yaitu teknik reliabilitas belah dua, bentuk setara, bentuk
tes-retes, dan bentuk kesetaraan rasional.
B.
Daftar Pustaka
Rifa’i, Achmad. (2007). Evaluasi Pembelajaran. Semarang: UNNES Press
terima kasih infonya ya, sangat membantu
BalasHapus