Senin, 04 Februari 2013

makalah-evaluasi pendidikan

TUGAS TERSTRUKTUR
DOSEN PENGAMPU
Evaluasi Pendidikan
Dra.Hj. Nuril Huda, M.Pd


VALIDITAS DAN RELIABILITAS TES HASIL BELAJAR







Disusun Oleh:
Nahdiatul Husna       : 1101210374

INSTITUT AGAMA ISLAM NEGERI (IAIN) ANTASARI BANJARMASIN
FAKULTAS TARBIYAH
JURUSAN PENDIDIKAN AGAMA ISLAM (PAI)
BANJARMASIN
2012/2013


KATA PENGANTAR

Segala puji syukur kehadirat Allah SWT karena dengan limpahan rahmat-Nya jua lah penulis dapat menyelesaikan makalah ini. Shalawat dan salam semoga selalu tercurahkan kepada Nabi kita Muhammad SAW,keluarga,sahabat dan pengikut beliau hingga akhir zaman. Amin…
Makalah ini disusun dalam rangka memenuhi tugas individu mata kuliah Evaluasi Pendidikan yang diasuh oleh Ibu Dra. Hj. Nuril Huda,M.Pd. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada Ibu Dra. Hj. Nuril Huda,M.Pd yang selaku dosen mata kuliah Evaluasi Pendidikan yang telah memberikan arahan kepada penulis dalam menyelesaikan penulisan makalah yang berjudul Validitas dan Reliabilitas Tes Hasil Belajar ini.
Penulis menyadari bahwa makalah ini jauh dari kesempurnaan. Oleh karena itu, penulis mengharapkan kritik dan saran konstruktif dari pembaca demi kesempurnaan makalah ini di kemudian hari. Akhir kata, semoga makalah ini dapat bermanfaat bagi penulis khususnya dan pembaca pada umumnya. Amin...


Banjarmasin,Desember 2012             


    Penulis                                



DAFTAR ISI

KATA PENGANTAR…......…………………………………………………………..i
DAFTAR ISI………………………………..……………………………………...…ii
BAB I PENDAHULUAN……….…………………………………………………...1
BAB II PEMBAHASAN
VALIDITAS DAN RELIABILITAS TES HASIL BELAJAR
A.    Validitas Tes Hasil Belajar……………………………………………........2
B.     Reliabilitas Tes Hasil Belajar............................................................................8
BAB III PENUTUP
Simpulan.................................................................................................................15
DAFTAR PUSTAKA…………………………………………………………......16



BAB I
PENDAHULUAN

Evaluasi merupakan bagian dari proses belajar mengajar yang secara keseluruhan tidak dapat dipisahkan dari kegiatan mengajar. Evaluasi pendidikan merupakan proses dimana seorang guru menggunakan informasi yang diturunkan dari beberapa sumber informasi agar dapat mencapai tingkat pengambilan keputusan dengan benar. Informasi mungkin diperoleh dari hasil pengukuran menggunakan instrumen untuk menghasilkan data kuantitas tertentu, atau menggunakan teknik lain yang harus menghasilkan data kuantitatif.
Evaluasi memiliki arti penting dalam kegiatan belajar mengajar yang dilaksanakan oleh seorang guru. Diantara tujuan dari evaluasi adalah untuk menilai ketercapaian tujuan pendidikan oleh anak didik, sarana untuk mengetahui apa yang telah anak didik ketahui dalam kegiatan belajar mengajar, dan memotivasi anak didik. Untuk mengevaluasi hasil belajar dan proses belajar siswa, seorang guru menggunakan berbagai macam alat atau instrumen evaluasi seperti tes tertulis, tes lisan, ceklis-observasi, angket-wawancara, dan dokumentasi.
Keberhasilan mengungkap hasil dan proses belajar ini sebagaimana adanya (objektivitas hasil penilaian) sangat bergantung pada kualitas alat penilainya, di samping itu juga yang tidak kalah pentingnya tergantung pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yaitu validitas (ketepatan) dan reliabilitas (ketetapan atau keajegan) alat tes terjamin kualitasnya.[1] Alat tes yang bagaimana dan seperti apa yang dikatakan memiliki validitas dan reliabilias ini, selanjutnya akan kita bahas dalam makalah yan berjudul “Validitas dan Reliabilitas Tes Hasil Belajar” ini.
BAB II
PEMBAHASAN
VALIDITAS DAN RELIABILITAS TES HASIL BELAJAR

C.    Validitas Tes Hasil Belajar
Validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai, sehingga betul-betul menilai apa yang seharusnya dinilai.
Validitas suatu instrumen evaluasi tidak lain adalah derajat yang menunjukkan di mana suatu tes mengukur apa yang hendak diukur. [2]
1.      Teknik Pengujian Validitas Tes Hasil Belajar
Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara. Pertama, penganalisisan yang dilakukan dengan jalan berpikir secara rasional atau penganalisisan dengan menggunakan logika (logical analysis). Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, di mana penganalisisan dilaksanakan dengan menggunakan empirical analysis.[3]
a.      Pengujian Validitas Tes Secara Rasional
Tes hasil belajar (THB) yang setelah dilakukan penganalisisan secara rasional ternyata memiliki daya ketepatan mengukur, disebut tes hasil belajar yang telah memiliki validitas logika (logical validity). Istilah lain untuk validitas logika adalah validitas rasional, validitas ideal, atau validitas das sollen.
Untuk dapat menentuka apakah tes hasil belajar sudah memiliki validitas  rasional ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi isinya (=content) dan dari segi susunan atau konstruksinya (consruct).
1.      Validitas Isi (Content Validity)
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil tersebut. Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan).
Cara yang dapat ditempuh agar isi tes hasil belajar representatif terhadap keseluruhan materi tes adalah memilih konsep-konsep materi yang esensial.Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan yang ada.Selanjutnya setiap konsep dikembangkan beberapa pertanyaan tes.Disinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi validitas isi.Dalam hal tertentu untuk tes yang telah disusun sesuai dengan kurikulum (materi dan tujuan) agar memenuhi validitas isi, dapat pula dimintakan bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan telah memadai atau tidak sebagai sampel tes.[4]
Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari THB adalah dengan jalan menyelenggarakan diskusi panel, yang mengundang para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan.
2.      Validitas Konstruksi (Construct Validity)
Secara etimologis, kata “konstruksi” mengandung arti susunan, kerangka atau rekaan.
Secara terminologis suatu tes hasil belajar dapat dikatakan sebagai tes yang memiliki validitas konstruksi apabila tes hasil belajar tersebut ditinjau dari segi susunan, kerangka atau rekaaannya telah dapat secara tepat mencerminkan suatu konstruksi dalam teori psikologis.
Validitas susunan berarti bahwa tes hasil belajar itu memiliki butir-butir soal atau item yang benar-benar telah dengan tepat mengukur aspek-aspek berpikir (seperti aspek kognitif, aspek afektif, aspek psikomotorik dan sebagainya) sebagaimana dikemukakan dalam tujuan instruksional khusus.
Validitas konstruksi dari suatu hasil belajar dapat dilakukan penganalisisannya dengan jalan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes hasil belajar tersebut, dengan aspek-aspek berpikir yang dikehendaki untuk diungkap oleh tujuan instruksional khusus. Kegiatan menganalisis validitas konstruksi ini dilakukan secara rasional, dengan berpikir kritis atau menggunakan logika.
Pengujian validitas konstruk dapat dilakukan dengan cara menelaah kesesuaian  butir THB dengan kisi-kisi dalam hal kontruksinya. Hasil belajar, faktor (indikator) dan butir-butir instrumen direncanakan dalam kisi-kisi. Hasil belajar tersusun dari beberapa faktor. Butir-butir tertentu merupakan bagian dari sebuah faktor. Menelaah butir YHB dilakukan dengan mencermati kesesuian penempatan butir-butir dlam faktornya. Berbeda dengan penelaahan butir pada uji validitas isi yang meliihat kesewsuaian butir dengan kisi-kisi dalam hal muatannya. Penelaahan butir pada uji validitas konstruk dalam hal konstruksinya. Butir-butir selanjutnya dinyatakan valid apabila menempati faktor sebagaimana kisi-kisinya. Dengan kata lain, butir dikatakan valid apabila kontruksinya seperti direncanakan dalam kisi-kisi.
Pengujian validitas konstruk dapat dilakukan dengan meminta pertimbangan ahli atau rater. Prosedur pengujian serupa dengan pengujian yang sama dalam uji validitas isi. Perbedaanya adalah bahwa permintaan pertimbangandalam pengujian validitas isi adalah kesesuaian butir dengan kisi-kisi dalam hal isi, sedang dalam pengujian validitas konstruk yang dimintakan pertimbangan dalam hal kontruksi. Instrumen dinyatakan valid apabila penilai menunjukkan kesepakatan dalam menilai kontruksi butir yang ditunjukkan oleh korelasi hitung skor kedua penilai yang signifikan pada taraf signifikansi tertentu.[5]
A.    Pengujian Validitas Tes Secara Empirik
Validitas empiris adalah validitas yang bersumber atau diperoleh atas dasar pengamatan di lapangan. Jadi, tes hasil belajar dapat dikatakan telah memiliki validitas empiris apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil pengamatan di lapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah dapat mengukur hasil belajar yang seharusnya diungkap atau diukur melalui tes hasil belajar tersebut.
Untuk menentukan apakah tes hasil belajar sudah memiliki validitas empiris ataukah belum, dapat dilakukan penelurusan dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity).
a.       Validitas Ramalan (predictive validity)
Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Sebagai alat pembanding validitas ramalan adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti perkuliahan di Perguruan Tinggi. Jika ada mahasiswa yang memiliki nilai tes lebih tinggi, namun gagal dalam mengikuti ujian semester, dibandingkan dengan mahasiswa yang nilai tes masuk Perguruan Tinggi lebih rendah maka tes masuk Perguruan Tinggi yang dimaksud tidak memiliki validitas prediksi.
Berdasarkan uraian di atas, jelaslah bahwa untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan atau  belum, dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang ada. Jika diantara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya itu, dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramal yang tepat, artinya apa yang telah diramalkan, betul-betul telah terjadi secara nyata dalam praktek.
Dalam rangka mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang telah ditentukan itu, cara sederhana yang paling sering digunakan adalah dengan menerapkan Teknik Analisis Korelesional Product Moment dari Karl Pearson. Rumusnya sebagai berikut :


b.      Validitas Bandingan (Concurrent Validity)
Suatu tes dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukkan adanya hubungan yang serah, antara tes pertama dengan tes berikutnya.
Dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman yang diperoleh pada masa lalu dibandingkan dengan data hasil tes yang diperoleh sekarang ini. Jika keduanya memiliki hubungan yang searah, maka tes yang memiliki karakteristik seperti itu dapat dikatakan telah memiliki validitas bandingan.
1.    Cara Mencari Validitas Alat Penilaian
Untuk mencari validitas alat penilaian dapat menggunakan berbagai macam rumus, namun yang akan dikemukakan di sini hanya dua macam, masing-masing dengan menggunakan satu bentuk rumus, yaitu:
a.     Validitas alat penilaian secara kesuluruhan
Salah satu cara menghitung untuk mengetahui validitas suatu alat penilaian atau alat ukur, dengan menggunakan rumus “korelasi Product Moment dengan Simpangan”: (Tidak digunakan “dengan Angka Kasar”)
rxy = Koefisien korelasi antara variabel  X dan variabel Y, dua variabel yang dikorelasikan (x= X- dan y= Y-)
= jumlah perkalian x dengan y
= kuadrat dari x ..... = jumlah kuadrat x
= kuadrat dari y..... = jumlah kuadrat y
b.      Validitas item (butir soal)
Validitas item soal maksudnya sebuah item soal dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total . Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain, sebuah item soal memiliki validitas yang tinggi jika skor pada item tersebut mempunayi kesejajaran dengan skor total. Kesejajaran ini dapat  diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus “korelasi Product Moment” dengan simpanan atau angka kasar, namun yang digunakan disini dengan angka kasar.
Validitas item (butir soal) dapat juga bertujuan untuk mencari soal-soal tes mana yang baik dan mana yang kurang baik.
Untuk mengetahui validitas item ini, dapat dilakukan dengan dua cara;
1)    Menghitung setiap butir soal (rumus “korelasi Product Moment”).
2)    Analisis butir soal berdasarkan tingkat kesukaran dan daya pembeda.

B.     Reliabilitas Tes Hasil Belajar
Reliabilitas berhubungan dengan masalah kepercayaan alat tes. Suatu tes mempunyai taraf  kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap bila digunakan berulang kali, atau ada perubahan tetapi tidak berarti.
Untuk dapat memperoleh gambaran yang tetap atau ajeg dari suatu alat ukur memang sangat sulit, karena di samping eksistensi alat ukur tersebut, juga aspek kejiwaan siswa itu sendiri ketika menjawab soal selalu berubah, misalnya kemampuan , kecakapan, sikap, motovasi, dan lain-lain.
Reliabilitas menyangkut ciri pada metode dan alat evaluasi untuk menghasilkan gambaran tentang derajat prestasi belajar yang benar-benar dapat dipercaya (terandalkan).[6]
1.    Hal-hal yang Mempengaruhi Hasil Tes
Paling tidak ada tiga hal yang dapat mempengaruhi hasil tes, di samping hal lainnya, yaitu:
a.    Tes itu sendiri, yaitu panjang atau banyaknya item tes dan kualitas butir-butir soalnya. Tes yang mempunyai banyak butir soal tentu lebih valid dibandingkan dengan tes yang sedikit buTes yang mempunyai banyak butir soal tentu lebih valid dibandingkan dengan tes yang sedikit butir soal. Validitas yang tinggi juga menunjukkan reliabilitas yang tinggi pula. Jika suatu yang sudah diukur reliabilitasnya mendapat tambahan butir soal maka dapat dihitung kembali dengan menggunakan ruValiditas yang tinggi juga menunjukkan reliabilitas yang tinggi pula. Jika suatu yang sudah diukur reliabilitasnya mendapat tambahan butir soal maka dapat dihitung kembali dengan menggunakan rumus “Spearman Brown”, yaitu:


Keterangan:
= Koefisien reliabilitas baru yang dicari
= jumlah butir soal baru: lama
= koefisen reliabilitas lama
Contoh:
Suatu tes terdiri 40 butir soal, ditambah menjadi 60 butir soal, dengan koefisien reliabilitas terdahulu 0,70, maka dihitung koefisien reliabilitas baru adalah:


Jadi besarnya koefisien reliabilitas yang baru adalah 0,78. (nilai ini bisa bertambah dan berkurang)
1)      Jelas tidaknya rumusan item soal
2)      Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab
3)      Petunjuknya jelas sehingga mudah dan cepat dikerjakan
b.    Kondisi testee sendiri, maksudnya testee yang dipilih secara khusus berbeda dengan yang tidak dipilih.
c.     Penyelenggaraan testing itu sendiri, seperti petunjuk dari tester, keberadaan pengawas, dan suasana tempat tes dan dan lingkungan, dan lain-lain.
2.    Cara-cara Mencari Besarnya Reliabilitas
Untuk mengetahui ketetapan  atau reliabilitas ini pada dasarnya dilihat kesejajaran hasil. Beberapa teknik untuk mengetahui reliabilitas ini juga menggunakan rumus “korelasi Product Moment”, atau dilanjutkan dengan rumus “Spearman Brown” atau yang lainnya. Beberapa cara tersebut adalah:
a.    Metode Bentuk Parallel (equivalent)
Metode ini dilakukan dengan menggunakan dua buah alat ukur yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda, dalam bahasa Inggris disebut alternate forms method (parallel forms).
Dari dua alat ukur yang disiapkan kemudian dicobakan pada kelompok siswa yang sama, yang bisa juga disebut double test-double trial method. Sehingga tidak memungkinkan practice effect (masih ingat soal) dan carry over effect (super hati-hati karena pengalaman dalam mengerjakan).
Namun kelemahan dari metode ini adalah pekerjaan tester lebih berat karena harus menyusun dua seri alat ukur, lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
b.   Metode tes ulang (tes-retest method)
Metode tes ulang dapat menghindari penyusunan dua seri tes, dalam metode ini tester hanya menggunakan sebuah alat ukur tetapi dicobakan dua kali, maka dapat disebut single test-double trial method. Hasil kedua kali tes terhadap suatu alat ukur itu dikorelasikan sehingga disebut self correlation method. Dengan metode ini memungkinkan adanya practice effect dan carry over effect, sehingga jarak waktu yang dekat testee masih ingat isi item soal dan jauh testee dapat membaca bahan yang teskan.
Walaupun hasil tes kedua cenderung membaik dari yang pertama, namun yang penting adanya kesejajaran atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.
Contoh:
Tabel: skor dua kali tes dengan seperangkat alat ukur
No
Nama Siswa
Tes Pertama
Tes Kedua
Skor
Rangking
Skor
Rangking
1
Amat
15
3
20
3
2
Bahri
20
1
25
1
3
Carita
9
5
15
5
4
Dermawan
18
2
23
2
5
Endang
12
4
18
4
Tampaknya dari tabel di atas, skor siswa naik, namun kenaikannya dialami oleh semua siswa.
c.    Metode Belah Dua (split-half method)
Kelemahan pada dua metode di atas dapat di atasi dengan metode belah dua ini, karena hanya digunakan satu alat ukur dengan satu kali dicobakan, sehingga tes ini disebut single test-single trial method. Namun metode ini harus dua kali hitung yaitu dengan rumus “Korelasi Product Moment”, dan  dilanjutkan dengan rumus “Spearman Brown”. Sebab ketika membelah dua dan mengkorelasikan dua belahan, maka baru diketahui reliabilitas separo alat ukur. Selanjutnya untuk mengetahui reliabilitas seluruh alat tes harus digunakan rumus “Spearman Brown”  berikut ini:
Keterangan:
= Korelasi antara skor-skor setiap belahan tes
= Korelasi reliabilitas yang dicari (disesuaikan)
Metode ini dapat digunakan dengan dua cara (1) belahan ganjil-genap, dan (2) belahan awal-akhir.
d.   Mencari Reliabilitas Tes Bentuk Uraian
Menilai soal bentuk uraian tidak dapat dilakukan seperti menilai soal objektif. Karena butir-butir soal uraian menghendaki gradualisasi penilaian, barangkali nomor 1 nilainya 0 sampai dengan 5, nomor 2 nilainya 0 sampai dengan 8, nomor 3 nilainya 0 sampai dengan 10, dan seterusnya.
Untuk mencari koefisien reliabilitas tes bentuk uraian, terlebih dahulu ditempuh jalan mencari varians pada masing-masing item soal dan varians pada skor totalnya, selanjutnya dikalikan dengan proporsi item soal, dengan menggunakan rumus Alpha berikut ini:
Keterangan:
K= Jumlah item soal
Vr= Varians butir soal= Varians skor total[7]
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008) membedakan reliabilitas menjadi 2 macam, yaitu:
  • Reliabilitas Konsistensi tanggapan, dan
  • Reliabilitas konsistensi gabungan item
1. Reliabilitas Konsistensi Tanggapan
Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden atau objek terhadap tes tersebut apakah sudah baik atau konsisten. Dalam artian apabila tes yang telah dicobakan tersebut dilakukan pengukuran kembali terhadap obyek yang sama, apakah hasilnya masih tetap sama dengan pengukuran sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakonsistenan, maka hasil pengukuran tersebut tidak mengambarkan keadaan obyek yang sesungguhnya. Untuk mengetahui apakah suatu tes atau instrument tersebut sudah mantap atau konsisten, maka tes/instrument tersebut harus diuji kepada obyek ukur yang sama secara berulang-ulang.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes (Jaali ; 2008) yaitu :
  • Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu yang berbeda.
  • Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua kelompok item yang setara pada saat yang sama.
  • Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek tes dalam waktu yang bersamaan.
2. Reliabilitas Konsistensi Gabungan Item
Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau instrument.. Apabila terhadap bagian obyek ukur yang sama, hasil pengukuran melalui item yang satu kontradiksi atau tidak konsisten dengan hasil ukur melalui item yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau memiliki reliabilitas yang rendah.
Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan menggunakan 3 rumus (Jaali 2008), yakni :
  • Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.
  • Rumus koefisien Alpha atau Alpha Cronbach
  • Rumus reliabilitas Hoyt, yang menggunakan analisis varian

Teknik pengujian validitas item tes hasil belajar
a.    Pengertian validitas item
validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item ( yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas ), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.
b.    Teknik Pengujian Validitas Item Tes Hasil Belajar
berdasarkan uraian diatas maka cukup jelas bahwa sebutir item dapat dikatakan telah memiliki validitas tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya, skor total disini berkedudukan sebagai variable terikat sedangkan variable item merupakan variable bebasnya.
Permasalahannya adalah bagaimana Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu. Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul atau salah.
Setiap butir soal yang dapat dijawab dengan benar diberikan skor 1 ( satu ) sedangkan untuk setiap jawaban yang salah diberikan skor 0 ( nol ) jenis data seperti ini biasanya merupakan tes benar – salah, ya – tidak dan sejenisnya dalam ilmu statistic dikenal dengan disket murni atau data dikotomik. Sedangkan, skor total yang dimiliki oleh masing-masing testee adalah merupakan penjumlahan dari setiap skor itu merupakan data kontinyu.




BAB III
PENUTUP

SIMPULAN
Validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai, sehingga betul-betul menilai apa yang seharusnya dinilai. Validitas suatu instrumen evaluasi tidak lain adalah derajat yang menunjukkan di mana suatu tes mengukur apa yang hendak diukur.
Untuk mencari validitas alat penilaian dapat menggunakan rumus: Validitas alat penilaian secara keseluruhan, validitas item (butir soal)
Reliabilitas berhubungan dengan masalah kepercayaan alat tes. Suatu tes mempunyai taraf  kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap bila digunakan berulang kali, atau ada perubahan tetapi tidak berarti.
Beberapa cara untuk mengetahui reliabilitas yaitu dengan menggunakan metode bentuk parallel, metode tes ulang, metode belah dua dan tes bentuk uraian





DAFTAR PUSTAKA

Ramli, Muhammad. 2007. Evaluasi Pendidikan. Banjarmasin
Sukardi. 2009. Evaluasi Pendidikan. Jakarta: PT. Bumi Aksara
Djamarah, Syaiful Hadi. 2005. Guru dan Anak Didik dalam Interaksi Edukatif. Jakarta: Rineka Cipta
Sudijono, Anas. 2011. Evaluasi Pendidikan. Jakarta: PT. RajaGrafindo Persada


[1] Muhammad Ramli, Evaluasi Pendidikan, Banjarmasin, 2007, hal: 53
[2] Sukardi, Evaluasi Pendidikan, Jakarta, PT. Bumi Aksara, 2009, hal: 31
[3] Anas Sudijono, Evaluasi Pendidikan, Jakarta, PT. RajaGrafindo Persada,2011, hal: 163
[4] http://hamiddarmadi.blogspot.com/2011/05/validitas-tes-dan-item-tes-hasil.html]
[5] http://cobah-ajah.blogspot.com/2012/06/pengujian-validitas-tes-hasil-belajar.html
[6] Syaiful Hadi Djamarah, Guru dan Anak Didik dalam Interaksi Edukatif, Jakarta, Rineka Cipta, 2005
[7]Muhammad, Ramli, ,Evaluasi Pendidikan, (Banjarmasin:  2007) . Hlm. 53-73