UJIAN TENGAH SEMESTER
Oleh :
Panji Sang Putra
(ACC 115 001)
Dosen Pengampu :
Nopriawan Berkat Asi, S.Si, M.Pd
PROGRAM STUDI PENDIDIKAN KIMIA
JURUSAN PENDIDIKAN MIPA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS PALANGKA RAYA
2018
UTS KAPITA SELEKTA
Artikel Tentang Penilaian Hasil Belajar Kimia
Dewasa ini banyak guru kimia yang masih kurang memperhatikan penilaian terhadap hasil belajar siswanya. Kebanyakan Guru hanya ingin mengambil mudahnya saja, yaitu guru hanya memberikan penilaian dengan memberikan soal kepada siswa tanpa mengetahui apakah penilaian tersebut sudah sesuai dengan aspek hasil belajar? Apakah penilaian yang dilakukan atau instrumen sudah mengukur apa yang hendak diukur? Apakah standar sudah sama dengan kemampuan siswa?
Guru masih belum memahami betul tentang beberapa hal yang harus diperhatikan ketika melakukan penilaian hasil belajar. Hal ini didukung dengan fakta lapangan selama ini dalam pembelajaran, baik itu disekolah dasar, SMP, SMA, bahkan sampai perguruan tinggi, masih ada yang namanya MENCONTEK!!!, pada saat ulangan atau ujian dan parahnya, ada sebagian guru yang mengatakan kepada siswanya boleh mencontek asal jangan ketahuan serta mengatakan bahwa mencontek juga merupakan usaha. Menurut penulis, apa yang dikatakan guru ini tidak baik, kita sebagai pendidik jangan mendukung perbuatan yang tidak baik seperti mencontek, tapi sebagai pendidik kita harus mencari cara untuk mengatasi hal tersebut. Mencontek bagi para pelajar sekarang sepertinya sudah sangat membudaya seakan susah untuk ditinggalkan kebiasaan yang buruk tersebut. Menanggapi hal ini, kebanyakan guru menyebutkan bahwa yang salah adalah siswanya. Padahal sebenarnya siswa tidak sepenuhnya salah. Mengapa penulis bilang demikian, karena bila kita perhatikan pada saat ujian siapa yang membuat soal? Pasti guru kan? Nah, oleh karena itu cobalah guru koreksi diri lagi, dengan beberapa pertanyaan berikut : kenapa siswa saya mencontek? Apakah pengajaran yang saya berikan selama ini tidak masuk di siswa? Apakah soal yang saya berikan sulit bagi siswa? Bagaimana cara saya mengatasi ini?
Baik, dari beberapa pertanyaan diatas, kita dapat menyimpulkan bahwa sebenarnya kembali lagi ke gurunya apakah guru sudah melakukan penilaian hasil belajar dengan baik atau belum. Dosen saya pada mata kuliah PHB KIMIA (Penilaian Hasil Belajar Kimia) Prof. Dr. Suandi Sidauruk, M.Pd, mengatakan bahwa sebenarnya yang membuat siswa mencontek adalah ujian yang tidak mengukur apa yang hendak diukur atau standar soal yang diberikan tidak sesuai dengan kemampuan siswa. Karena bila soal yang diberikan tidak mengukur apa yang hendak diukur atau standar soal tidak sesuai dengan kemampuan siswa, maka siswa akan melakukan segala cara agar dapat lulus, yaitu dengan mencontek. Oleh karena itu penilaian hasil belajar harus benar-benar dipahami dengan baik, bagaimana cara membuat instrumen untuk mengukur hasil belajar yang baik.
Adapun upaya yang dilakukan untuk penilaian hasil belajar,
hendaknya memperhatikan beberapa prinsip dan prosedur penilaian seperti :
1. Dalam menilai hasil belajar
hendaknya dirancang sedemikian rupa sehingga jelas abilitas yang harus dinilai,
materi penilaian,alat penilaian, dan interpretasi hasil penilaian. Dimana
sebagai patokan dalam merancang penilaian hasil belajar adalah kurikulum yang
berlaku dan buku pelajaran yang digunakan
2. Penilaian hasil belajar hendaknya
menjadi bagian integral dari proses belajar-mengajar.
3. Penilaian harus menggunakan berbagai
alat penilaian yang sifatnya komprehensif. Dengan sifat komprehensif
dimaksudkan segi atau abilitas yang dinilainya tidak hanya aspek kognitif,
tetapi juga aspek afektif dan psikomotorik.
4. Penilaian hasil belajar hendaknya
diikuti dengan tindak lanjutnya.
Ada beberapa
langkah yang dapat dijadikan pegangan dalam melaksanakan proses penilaian hasil
belajar, meliputi :
a. Merumuskan atau mempertegas
tujuan-tujuan pengajaran, agar dapat memberikan arah terhadap penyusunan
alat-alat penilaian.
b. Mengkaji kembali materi pengajaran
berdasarkan kurikulum dan silabus mata pelajaran. Hal ini penting karena
mengingat isi tes atau pertanyaan penilaian berkenaan dengan bahan pengajaran
yang diberikan.
c. Menyusun alat-alat penilaian, baik
tes maupun non tes yang cocok digunakan dalam menilai tingkah laku yang
tergambar dalam tujuan pengajaran. Dimana dalam penyusunan alat penilaian harus
memperhatikan kaidah-kaidah penulisan soal yang baik.
Dalam penyusunan alat-alat penilaian, hal-hal yang harus ditempuh yakni :
a. Menelaah kurikulum dan buku pelajaran agar dapat
ditentukan lingkup pertanyaan, terutama materi pelajaran.
b. Merumuskan tujuan instruksional khusus sehingga jelas
betul abilitas yang harus dinilainya. Tujuan instruksional khusus harus
dirumuskan secara operasional, artinya bisa diukur dengan alat penilaian yang
biasa digunakan.
c. Membuat kisi-kisi atau blueprint alat penilaian. Dalam
kisi-kisi harus tampak abilitas yang diukur serta proporsinya, lingkup
materi yang diujikan, tingkat kesulitan soal, jenis alat penilaian yang
digunakan, jumlah soal atau pertanyaan, dan perkiraan waktu yang diperlukan
untuk mengerjakan soal tersebut.
d. Menyusun atau menulis soal-soal berdasarkan kisi-kisi
yang telah dibuat. Dalam menulis soal, perhatikan aturan-aturan yang berlaku.
e. Membuat dan menentukan kunci jawaban soal.
d. Menggunakan hasil-hasil penilaian sesuai dengan tujuan
penilaian tersebut, yakni untuk kepentingan pendeskripsian kemampuan siswa,
kepentingan perbaikan pengajaran, kepentingan bimbingan belajar, maupun
kepentingan laporan pertanggungjawaban pendidikan
Dalam konteks penilaian hasil belajar, depdiknas (
2003 ) mengemukakan prinsip-prinsip umum penilaian adalah mengukur
hasil-hasil belajar yang telah ditentukan dengan jelas dan sesuai dengan
kompetensi serta tujuan pembelajaran ; mengukur sampel tingkah laku yang
representatif dari hasil belajar dan bahan-bahan yang tercakup dalam pengajaran
; mencakup jenis-jenis instrumen penilaian yang paling sesuai untuk mengukur
hasil belajar yang diinginkan ; direncanakan sedemikian rupa agar hasilnya
sesuai dengan yang digunakan secara khusus ; dibuat dengan reliabilitas yang
sebesar-besarnya dan harus ditafsirkan secara hati-hati ; dan dipakai untuk
memperbaiki proses dan hasil belajar.
Di samping itu , guru harus memperhatikan pula hal-hal teknis, antara lain
:
a. Penilaian hendaknya dirancang sedemikian rupa,
sehingga jelas abilitas yang harus dinilai, materi yang akan dinilai, alat
penilaian dan interpretasi hasil penilaian.
b. Penilaian harus menjadi bagian integral dalam proses
pembelajaran.
c. Untuk memperoleh hasil yang objektif, penilaian harus
menggunakan berbagai alat ( instrumen ) , baik yang berbentuk tes maupun non
tes.
d. Pemilihan alat penilaian harus sesuai dengan
kompetensi yang ditetapkan.
e. Alat penilaian harus mendorong kemampuan penalaran dan
kreatifitas peserta didik, proyek, dan portofolio.
f. Objek penilaian harus mencangkup aspek pengetahuan,
keterapilan, sikap dan nilai – nilai.
g. Penilaian harus mengacuh kepada prinsip diferensiasi,
yaitu memberikan peluang kepada peserta didik untuk menunjukkan apa yang
diketahui, apa yang dipahami dan apa yang dapat dilakukan.
h. Penilaian tidak bersifat diskriminatif. Artinya, guru
harus berlaku adil dan bersikap jujur kepada semua peserta didik, serta
bertanggung jawab kepada semua pihak.
i.
Penilaian harus
diikuti dengan tindak lanjut (fol-low-up)
j.
Penilaian harus
berorientasi pada kecakapan hidup dan bersifat mendidik.
Prinsip-prinsip
penilaian berbasis kelas beserta penerapan/contohnya :
Dalam melaksanakan penilaian hasil belajar, pendidik atau guru perlu
memperhatikan prinsip-prinsip penilaian sebagai berikut:
1. Valid
Penilaian valid berarti menilai apa yang seharusnya
dinilai dengan menggunakan alat yang sesuai untuk mengukur kompetensi, sehingga
penilaian tersebut menghasilkan informasi yang akurat tentang aktivitas
belajar. Penilaian hasil belajar oleh pendidik harus mengukur pencapaian
kompetensi yang ditetapkan dalam standar isi (standar kompetensi dan kompetensi
dasar) dan standar kompetensi lulusan. Misalnya apabila pembelajaran menggunakan
pendekatan eksperimen maka kegiatan eksperimen harus menjadi salah satu obyek
yang di nilai.
Contoh : Dalam pelajaran kimia, guru menilai kompetensi kemampuan siswa
merancang percobaan dalam praktikum, penilaian dianggap valid jika menggunakan
test percobaan langsung, jika menggunakan tes tertulis maka tes tersebut tidak
valid.
2. Obyektif
Penilaian yang bersifat objektif tidak memandang dan
membeda-bedakan latar belakang peserta didik, namun melihat kompetensi yang
dihasilkan oleh peserta didik tersebut, bukan atas dasar siapa dirinya.
Penilaian harus dilaksanakan secara objektif dan tidak dipengaruhi oleh
subyektivitas penilai.
Contoh : Guru memberi nilai 85 untuk materi konsep mol pada si A yang
merupakan tetangga dari guru tersebut, namun si B, yang kemampuannya lebih
baik, mendapatkan nilai hanya 80. Ini adalah penilaian yang bersifat subyektif
dan tidak disarankan. Pemberian nilai haruslah berdasarkan kemampuan siswa
tersebut.
3. Adil
Peserta didik berhak memperoleh nilai secara adil,
penilaian hasil belajar tidak menguntungkan atau merugikan peserta didik karena
berkebutuhan khusus serta perbedaan latar belakang agama, suku, budaya, adat
istiadat, status sosial, ekonomi, fisik, dan gender.
Contoh : guru kimia laki-laki hendaknya tidak memandang fisik dan
rupa dari murid perempuan yang cantik kemudian memberi perlakuan khusus, semua
murid berhak diperlakukan sama saat KBM maupun dalam pemberian nilai. Nilai
yang diberikan sesuai dengan kenyataan hasil belajar dan kemampuan siswa
tersebut.
4. Terbuka
Penilaian harus bersifat transparan dan pihak yang
terkait harus paham bagaimana pelaksanaan penilaian tersebut, dari aspek
apa saja nilai tersebut didapat, dasar pengambilan keputusan, dan bagaimana
pengolahan nilai tersebut sampai hasil akhirnya tertera, dan dapat diterima.
Contoh : pada tahun ajaran baru, guru Kimia menerangkan tentang kesepakatan
pemberian nilai dengan bobot masing-masing aspek, misal, Partisipasi kehadiran
diberi bobot 20%, Tugas individu dan kelompok 20%, Ujian tengah semester 25%,
ujian akhir semester 35%. Sehingga disini terjadi keterbukaan penilaian antara
murid dan guru.
5. Bermakna
Penilaian hasil belajar oleh pendidik memiliki arti,
makna, dan manfaat yang dapat ditindaklanjuti oleh pihak lain, terutama
pendidik, peserta didik, orang tua, dan masyarakat.
Contoh : bagi guru, hasil penilaian dapat bermakna untuk melihat seberapa
besar keberhasilan metode pembelajaran yang digunakan, sebagai evaluasi untuk
perbaikan kedepan, serta memberikan pengukuran prestasi belajar kepada peserta
didik.
6. Mendidik
Penilaian hasil belajar harus dapat mendorong dan
membina peserta didik maupun pendidik untuk menjadi lebih baik dari sebelumnya
dengan cara memperbaiki kualitas belajar mengajar.
Contoh : Rio mendapatkan nilai 60 untuk pelajaran matematika, 50 untuk
bahasa Indonesia, dan 65 untuk Kimia, namun dalam kegiatan ekstrakurikuler
futsal, ia meraih prestasi yang membanggakan. Rio sadar bahwa ia harus
menyeimbangkan prestasi akademik dan non akademiknya, Kemudian Rio terpacu
untuk mengevaluasi kesalahannya dan memperbaiki kualitas belajar dan hidupnya,
memperoleh nilai yang baik, juga memperoleh prestasi yang baik.
7. Menyeluruh
Penilaian diambil dengan mencakup seluruh aspek
kompetensi peserta didik dan menggunakan berbagai teknik penilaian yang sesuai,
termasuk mengumpulkan berbagai bukti aktivitas belajar peserta didik. Penilaian
meliputi pengetahuan (cognitif), keterampilan (phsycomotor), dan sikap
(affectif).
Contoh : Dalam penilaian hasil akhir belajar, guru Seni Budaya mengumpulkan
berbagai bukti aktivitas siswa dalam catatan sebelumnya, penilaian yang
dikumpulkan mulai dari pengetahuan tentang seni budaya, keterampilan menari,
menggambar, bermusik, kehadiran dalam KBM, dan penilaian sikap peserta didik,
semua hal tersebut digabungkan menjadi satu dan menghasilkan nilai.
8. Berkesinambungan
Pelaksanaan penilaian hasil belajar dilakukan secara
terencana, bertahap, dan terus menerus untuk memperoleh gambaran tentang
perkembangan belajar peserta didik.
Contoh : Guru Kimia melakukan KBM secara terencana, guru menjelaskan materi
tiap pertemuan, memberikan tugas, mengadakan ulangan harian, ujian tengah
semester, serta ujian akhir semester, semua dilaksanakan secara terus menerus
dan bertahap, dan dari setiap tahap tersebut, guru mengumpulkan informasi yang
akan diolah untuk menghasilkan nilai.
9. Akuntabel
Penilaian hasil belajar oleh pendidik dapat
dipertanggung jawabkan, baik dari segi teknik, prosedur, maupun hasilnya.
Contoh : Guru Kimia dapat menjelaskan secara benar kepada pihak terkait,
tentang proses penilaian, teknik penilaian, prosedur, dan hasil yang sesuai
dengan kenyataan kemampuan hasil belajar peserta didiknya.
Prosedur Penilaian
1. Kajian Materi Pembelajaran
Tahap pertama yang harus dilakukan Gadik sebagai
penilai adalah mempelajari dan mengkaji materi pembelajaran dari satu
atau lebih kompetensi dasar. Kajian materi ini dapat dilakukan melalui beberapa
referensi untuk memperoleh bahan secara komprehensif dari beragam sumber dengan
bertolak pada kompetensi yang diharapkan.
2. Memilih Teknik Penilaian
Tahap kedua Gadik memilih atau menentukan teknik
penilaian sesuai dengan kebutuhan pengukuran. Secara garis besar, teknik
penilaian dapat digolongkan menjadi dua, yaitu penilaian melalui tes dan
non tes. Pusdik dan sekolah biasanya para Gadik banyak menggunakan teknik
pertama, yaitu dengan tes. Dalam menentukan keakuratan perlu dipertimbangkan
pemilihan teknik, yaitu tingkat ke-akurat-an dan kepraktisan penyusunan dalam
setiap butir soal. Pemberian nilai dengan cara tes lebih mudah dibandingkan
dengan non tes.
3. Perumusan Kisi – Kisi
Tahap ketiga merumuskan dan membuat matrik kisi-kisi
sesuai dengan teknik penilaian yang telah ditentukan. Kisi-kisi merupakan
deskripsi mengenai informasi dan ruang lingkup dari materi pembelajaran yang
digunakan sebagai pedoman untuk menulis soal atau matriks soal menjadi
tes.Pembuatan kisi-kisi memiliki tujuan untuk menentukan ruang lingkup
dalam menulis soal agar menghasilkan perangkat tes yang sesuai dengan
indikator.
Kisi kisi dibuat berdasarkan kompetensi dasar dan indikator yang
ingin dicapai serta bentuk tes yang akan diberikan kepada peserta didik.Tes
dapat berbentuk tes objektif benar-salah, pilihan ganda atau tes
uraian serta non tes berupa penilaian afektif dan
psikomotorik.
Kisi-kisi berfungsi sebagai pedoman dalam penulisan soal dan
perakitan tes. Dengan adaya kisi-kisi penulisan soal menjadi terarah,
komprehensif dan representatif. Dengan pedoman kepada kisi-kisi penyusunan soal
menjadi lebih mudah dan dapat menghasilkan soal-soal yang sesuai dengan tujuan
tes.
1. Syarat penyusunan Kisi – kisi adalah,
a.
Dapat mewakili
isi silabus atau kurikulum.
b.
Komponen-komponennya
rinci, jelas dan mudah dipahami.
c.
Materi yang
hendak ditanyakan dapat dibuat soalnya sesuai bentuk soal yang ditetapkan.
d.
Sesuai dengan
indikator.
2. Komponen kisi – kisi terdiri dari:
a.
Komponen
Identitas
b.
Jenis Pendidikan
dan jenjang Pendidikan.
c.
Mata
pembelajaran.
d.
Tahun ajaran
e.
Jumlah soal.
f.
Bentuk soal.
g.
Standar
Kompetensi.
h.
Kompetensi
Dasar.
i.
Indikator
Dalam pembuatan kisi-kisi harus memenuhi kemampuan kognitif,
afektif dan psikomotorik yang mengacu kepada teori Bloom sebagai berikut:
1. Aspek Kognitif
Menurut Taksonomi Bloom cakupan yang diukur dalam ranah
Kognitif adalah:
a. Ingatan (C1) yaitu kemampuan seseorang untuk
mengingat. Ditandai dengan kemampuan menyebutkan simbol, istilah,
definisi, fakta, aturan, urutan, metode.
b. Pemahaman (C2) yaitu kemampuan seseorang untuk
memahami tentang sesuatu hal. Ditandai dengan kemampuan menerjemahkan,
menafsirkan, memperkirakan, menentukan, menginterprestasikan.
c. Penerapan (C3), yaitu kemampuan berpikir untuk
menjaring & menerapkan dengan tepat tentang teori, prinsip, simbol pada
situasi baru/nyata. Ditandai dengan kemampuan menghubungkan, memilih,
mengorganisasikan, memindahkan, menyusun, menggunakan, menerapkan,
mengklasifikasikan, mengubah struktur.
d. Analisis (C4), Kemampuan berfikir secara logis
dalam meninjau suatu fakta/ objek menjadi lebih rinci. Ditandai
dengan kemampuan membandingkan, menganalisis, menemukan, mengalokasikan,
membedakan, mengkategorikan.
e. Sintesis (C5), Kemampuan berpikir untuk
memadukan konsep-konsep secara logis sehingga menjadi suatu pola yang baru.
Ditandai dengan kemampuan mensintesiskan, menyimpulkan, menghasilkan,
mengembangkan, menghubungkan, mengkhususkan.
f. Evaluasi (C6), Kemampuan berpikir untuk dapat
memberikan pertimbangan terhadap sustu situasi, sistem nilai, metoda, persoalan
dan pemecahannya dengan menggunakan tolak ukur tertentu sebagai patokan. Ditandai
dengan kemampuan menilai, menafsirkan, mempertimbangkan dan menentukan.
2. Aspek Afektif
Aspek afektif tidak dapat diukur seperti halnya
ranah kognitif, karena dalam ranah afektif kemampuan yang diukur adalah:
a. Menerima (memperhatikan), meliputi kepekaan terhadap
kondisi, gejala, kesadaran, kerelaan, mengarahkan perhatian
b. Merespon, meliputi merespon secara
diam-diam, bersedia merespon, merasa puas dalam merespon, mematuhi
peraturan
c. Menghargai, meliputi menerima suatu nilai, mengutamakan
suatu nilai, komitmen terhadap nilai
d. Mengorganisasi, meliputi mengkonseptualisasikan nilai,
memahami hubungan abstrak, mengorganisasi sistem suatu nilai
e. Karakteristik suatu nilai, meliputi falsafah hidup dan
sistem nilai yang dianutnya
3. Aspek Psikomotorik
Psikomotorik meliputi (1) gerak refleks, (2) gerak
dasar fundamen, (3) keterampilan perseptual; diskriminasi kinestetik,
diskriminasi visual, diskriminasi auditoris, diskriminasi taktis, keterampilan
perseptual yang terkoordinasi, (4) keterampilan fisik, (5) gerakan terampil,
(6) komunikasi non diskusi (tanpa bahasa-melalui gerakan) meliputi: gerakan
ekspresif, gerakan interprestatif.
4. Penulisan Butir Soal
Tahap keempat, Gadik menulis dan membuat
butir-butir soal yang sesuai dengan kisi-kisi dan bentuk soal yang telah
ditentukan. Bila Gadik menggunakan teknik non tes, maka diperlukan
untuk membuat pedoman pengisian instrumen. Misalnya untuk
observasi atau wawancara.
5. Penimbangan/Reviewe
Dalam tahap ini, butir soal dan atau pedoman yang
telah disusun Gadik, ditimbang secara rasional (analisis rasional oleh Gadik) ;
dibaca, ditelaah dan dikaji kembali butir-butir soal dan atau
pedoman yang dibuat telah memenuhi persyaratan.
6. Perbaikan
Pedoman diperbaiki sesuai dengan hasil penimbangan,
bagian-bagian mana yang perlu dikurangi atau ditambah kalimat atau kata-katanya
perbaikan inipun biasanya didasarkan kepada pemikiran peserta didik untuk
memahami isi dari kalimat yang diberikan, hal ini mengandung arti bahwa kalimat
yang disusun hendaknya mudah di pahami oleh para peserta didik .
7. Uji-coba dan Penggandaan.
Uji-coba terhadap tes/soal yang dibuat adalah untuk
menentukan apakah butir soal yang dibuat telah memenuhi criteria yang dituntut,
sudahkah mempunyai tingkat ketetapan, ketepatan, tingkat kesukaran dan daya
pembeda yang memadai. Untuk bentuk non tes kriterianya dituntut adalah tingkat
ketepatan (validitas) dan ketetapan (reliabilitas) sehingga diperoleh perangkat
alat tes ataupun non tes yang baku (standar)
8. Diuji (diteskan)
Setelah diperoleh perangkat alat tes ataupun non tes
yang memenuhi persyaratan sudah barang tentu perangkat alat ini
diorganisasikan, disusun berdasarkan pada bentuk-bentuk atau model-model soal
bagi perangkat tes, dan untuk perangkat non tes.Setelah perangkat tes maupun
non tes digandakan kemudian siap untuk diujikan.
9. Pemberian Skor
Lembar jawaban peserta didik dikumpulkan dan
disusun berdasarkan nomer induk peserta didik untuk memudahkan dalam memasukkan
skor peserta didik. Kemudian dilakukan pemberian skor sesuai dengan kunci
jawaban, sehingga diperoleh skor setiap peserta didik. Untuk bentuk
soal objektif diberi skor 1 jika benar dan 0 jika salah, sedangkan skor bentuk
essay bergantung kepada tingkat kesulitan soal. Untuk menafsirkan siapa yang
lulus dan tidak lulus bergantung pada batas lulus yang dipergunakan
oleh Gadik.
10. Putusan.
Setelah pengelolaan, sampai pada menafsirkan,
Gadik memperoleh putusan akhir dari kegiatan penilaian. Putusan yang
diambil diharapkan obyektif sesuai dengan aturan.
Membuat instrumen penilaian hasil belajar bukan merupakan
hal yang mudah. Terdapat beberapa aspek yang harus diperhatikan untuk membuat
instrument penilaian hasil belajar. Beberapa aspek tersebut meliputi :
1. Mengetahui aspek hasil belajar siswa
Ada 3 aspek
hasil belajar siswa yaitu, pengetahuan, sikap dan keterampilan. Setelah
mengetahui aspek hasil belajar siswa ini, seorang guru harus mampu membuat alat
ukur atau instrumen untuk mengukur aspek pengetahuan, sikap, dan keterampilan
yang dimiliki siswa. Dimana alat ukur untuk setiap aspek itu berbeda-beda.
Contoh alat ukur yang biasa digunakan yaitu test yang meliputi test tertulis
dan lisan, dan pengamatan.
Misalnya untuk mengukur aspek
pengetahuan, urutan yang paling bagus yaitu :
1) Tertulis,
2) Lisan,
3) Pengamatan
Untuk mengukur aspek sikap urutan
yang paling baik yaitu
1) Pengamatan,
2) Tertulis,
3) Lisan
Untuk mengukur aspek keterampilan
urutan yang paling baik yaitu
1) Pengamatan,
2) Tertulis
3) Lisan
Dimana
urutan aspek pengetahuan yang baik yaitu
Menurut ki
hajar dewantoro
Otak à otot
à hati
Pengetahuan à Keterampilan à Sikap
Input à proses
à output
A. INSTRUMEN PENILAIAN HASIL BELAJAR
Pengertian Tes, Pengukuran, dan Penilaian
Bagi
sebagian besar pendidik, istilah tes, pengukuran, dan penilaian adalah istilah
yang sering digunakan dalam menjalankan tugasnya sebagai pengajar. Namun
pengertian yang sebenarnya sering dipertukarkan. Dari ketiga istilah tersebut
masyarakat luas lebih banyak memakai istilah penilaian. Bukankah kehidupan ini
berada di antara dua situasi yaitu positif dan negatif, baik dan buruk, murah
dan mahal, menarik dan membosankan, pandai dan bodoh, tinggi dan rendah, manis
dan pahit, banyak dan sedikit, dan seterusnya. Masyarakat melaksanakan penilaian
dengan menggunakan indera yang terbatas seperti mata, lidah atau hidung.
Artinya penilaian dilaksanakan tanpa menggunakan alat ukur dan pelaksanaan
pengukuran kurang memperhatikan tata cara yang akurat sehingga hasil
penilaiannya tidak sama atau tidak tetap. Perbedaannya menjadi lebih besar
bilamana unsur selera atau kebiasaan diikutkan sebagai faktor penentu dalam
penilaian. Menentukan hasil pembelajaran diupayakan untuk berlaku objektif,
adil dan menyeluruh, oleh karena itu penggunaan alat ukur (tes) yang handal dan
terpercaya mutlak untuk dilaksanakan (diadministrasikan) dengan cara-cara yang
tepat. Alat ukur, pengukuran, penilaian adalah bagian integral dari pembelajaran.
Semuanya sebagai satu kesatuan yang akan menentukan kualitas pembelajaran.
Dalam proses pembelajaran, pendidik dan peserta didik masing-masing berupaya
mensukseskan tugas utama mereka. R.M. Thomas dalam Lien (h.2) menyebutkan bahwa
ada tiga tugas utama yang menjadi perhatian pokok masing-masing pihak, yaitu:
Pihak
Pendidik
|
Pihak Peserta
Didik
|
Apa yang perlu
diajarkan
|
Apa saja yang
perlu dipelajari
|
Bagaimana cara
yang terbaik untuk mengajarkannya.
|
Bagaimana cara
yang terbaik untuk mempelajarinya.
|
Seberapa baik
hasil yang diajarkan
|
Seberapa baik
hasil yang dipelajari
|
.
Menurut
Stock dan kawan-kawan (1987, h. 294) terdapat perbedaan pengertian antara assessment,
appraisal, dan evaluation, antara lain sebagai berikut.
1)
Assessment biasanya dihubungkan dengan kemampuan
seseorang, seperti kecerdasannya, keterampilannya, kecepatannya, ketepatannya
dan lain sebagainya yang terkait dengan pekerjaan atau tugasnya. Untuk membedakan
tingkatan masing-masing kemampuan biasanya dinyatakan dalam angka atau huruf
7½, 75% atau B. Dengan kata lain, angka yang tertulis pada lembar jawaban peserta
didik atau dalam Buku Kemajuan (Rapor) adalah hasil assessment.
2)
Appraisal merupakan pernyataan tentang sesuatu
yang tidak dapat dinyatakan dengan angka atau huruf karena di dalamnya terdapat
unsur pertimbangan (judgment) yang sangat terbatas. Dengan masuknya
pertimbangan yang terbatas ini, maka assessment dan appraisal oleh
beberapa ahli dianggap sama saja.
3)
Penilaian
(evaluation) suatu proses di mana informasi dan pertimbangan diolah untuk
membuat suatu keputusan untuk kebijaksanaan yang akan datang. Dengan kata lain,
penilaian memerlukan hasil assessment dan appraisal dalam ruang lingkup
yang lebih luas.
Diagram di bawah ini merupakan visualisasi dari pengertian antarketiga istilah tersebut.
A.
MENGAPA TES, PENGUKURAN, DAN PENILAIAN PENTING?
Di
atas sudah dikemukakan bahwa pada manusia ada perbedaan individual, melalui
tes, pengukuran, dan penilaian, perbedaan individu ini dapat dibuktikan.
Perbedaan tersebut tidak hanya dalam tingkat kecerdasan atau waktu yang
diperlukan untuk menguasai bahan pembelajaran, tetapi juga perbedaan dalam
sikap, minat, temperamen, karakter, dan penyesuaian pada lingkungan. Oleh
karena itu setiap individu terutama bagi para pendidik harus mengetahui
kualitas setiap anak didiknya atau kualitas masing-masing kelompok didik yang
menjadi asuhannya. Tes, pengukuran, dan penilaian dapat menentukan kualitas
tersebut. Semakin banyak yang diketahui tentang individu/kelompok, keputusan
yang diambil dan atau dilakukan semakin sesuai untuk yang bersangkutan.
Kedekatan keputusan ini tidak lepas dari:
1)
Mengukur
dengan tepat apa yang seharusnya diukur, artinya apa yang akan diukur dan
bagaimana cara mengukurnya. Contohnya: sekiranya ini akan mengukur disiplin
mengenai peraturan sekolah, maka yang akan diukur adalah sikap peserta didik,
bukan kecerdasannya. Caranya, peserta didik diberikan skala sikap (angket) dan
juga diadakan pengamatan (observasi) terus-menerus dan diberi pembinaan. Dalam mengukur
penguasaan/hasil belajar menentukan tujuan apa yang akan ditanyakan juga
memegang peranan penting.
2)
Diperlukan
pengukuran yang akurat, misalnya akan mengukur waktu yang diperlukan untuk
menyelesaikan satu tugas harus jelas apakah diukur dalam menit atau sekon atau
persepuluhan sekon. Pengukuran setempat ini memerlukan alat ukur (jam) yang
memiliki sekon atau persepuluhan sekon. Menilai hasil lukisan yang dibuat
peserta didik harus dirinci dan disepakati oleh penilai apa saja yang akan
diukur dan dinilai misalnya kebersihan, komposisi warna, kesan di belakang
gambar tersebut dan sebagainya.
3)
Tingkatan
ketelitian dalam pengukuran. Dalam pembicaraan sehari-hari sering orang
mengatakan Ali lebih pandai dari Ahmad dan Ahmad masih lebih banyak menguasai
pelajaran dari Adi. Pernyataan penilaian kualitatif seperti ini masih kabur,
dan upaya apa yang harus diberikan kepada Adi dan Ahmad agar mereka sama pintar
dengan Ali masih belum pasti. Lain halnya kalau disebut Ali dapat menjawab 90%
dari pertanyaan yang diberikan sedangkan Ahmad dan Adi masing-masing dapat
menjawab 70% dan 45%. Dengan persentase ini jelas dapat diukur perbedaan
penguasaan mereka, dan yang lebih penting lagi dapat diketahui apa saja yang
belum dikuasai masing-masing, sehingga pendidik dapat memberikan bimbingan yang
tepat agar ketiganya menguasai seluruh apa yang telah dibelajarkan. Dengan
melaksanakan pengukuran dan penilaian menggunakan alat ukur yang baku
diharapkan pendidik akan dapat memberikan pelayanan yang tepat dan sesuai
dengan yang diharapkan peserta didik. Namun berbagai pihak mengajukan sejumlah
kritik atas perlakuan yang ditimbulkan oleh tes, pengukuran, dan penilaian.
Kritik yang ditimbulkan oleh pengukuran dan penilaian, antara lain:
a.
Adanya
pengelompokan individu menjadi kelompok pandai, sedang dan kurang.
b.
Dengan
alat ukur baku, atau EBTA/EBTANAS membuat kurikulum kurang berkembang sesuai
dengan kebutuhan peserta didik atau lingkungan
c.
Kecenderungan
belajar untuk tes (ujian) bukan belajar untuk meningkatkan
pemahaman/penguasaan.
d.
Kecenderungan
untuk menanyakan hal-hal yang berkenaan dengan ingatan (terutama pada tes
objektif).
Pengelompokan Alat Ukur
Yang
dimaksud dengan alat ukur adalah alat ukur yang biasa digunakan dalam kegiatan
pendidikan. Alat ukur yang digunakan para profesional di luar pendidikan bentuk
dan ragamnya bervariasi. Namun sudah banyak alat ukur yang dibakukan sehingga
hasil pengukurannya tidak diragukan. Alat ukur yang digunakan oleh para pendidik
bentuk dan ragamnya juga bervariasi dan masih sangat terbatas alat ukur yang
sudah dibakukan. Ini berarti hasil pengukuran berupa nilai dalam rapor peserta
didik tidak dapat dibandingkan antarsekolah karena alat ukurnya belum tentu
sama dan lagi pula alat ukur tersebut belum baku. Alat ukur dalam pendidikan,
jika dilihat dari prosedur pengumpulan datanya, oleh Payne (h. 75)
dikelompokkan menjadi dua kelompok yaitu alat ukur yang berupa tes dan alat
ukur non-tes (bukan tes). Yang bukan tes (nontes) pada saat pengukuran yang
bersangkutan tidak menyadari bahwa dengan mengisi alat ukur non-tes tersebut
sebenarnya sudah terjadi pengumpulan data mengenai dirinya sendiri. Di lain pihak,
pada saat menggunakan tes (mengadminstrasikan tes), peserta tes sadar
sepenuhnya bahwa kemampuannya sedang diuji. Payne menyatakan bahwa istilah
non-tes adalah penamaan yang kurang tepat (misnoname). Namun demikian
penggunaan istilah ini masih tetap tercantum pada sejumlah literatur. Contoh
non-tes antara lain angket, daftar cek, pedoman observasi, sosiometri, dan sebagainya.
Sedangkan contoh tes antara lain, tes uraian (esai) dan tes objektif. Di bawah
ini akan dibicarakan lebih rinci mengenai bentuk tes, ragam tes, dan
contoh-contoh tes yang banyak digunakan di sekolah, kemudian dilanjutkan dengan
non-tes.
A. TES
Ada sejumlah tes yang jawabannya sudah disediakan, peserta ujian tugasnya memilih satu jawaban yang paling benar atau benar dari sejumlah alternatif yang disediakan. Ini berarti jawaban peserta sudah terarah dan tidak ada kebebasan di luar pilihan yang disediakan. Jumlah pilihan dua atau lebih, dengan kata lain peserta dibatasi dalam memilih jawaban atau jawabannya sangat terbatas atau tertutup. Di lain pihak ada pertanyaan yang sangat terbuka sehingga jawaban siswa sangat bervariasi, artinya tidak ada dua siswa yang jawabannya persis sama. Jadi pertanyaan tersebut menghendaki jawaban yang terbuka. Bertolak dari jawaban yang diharapkan, pola jawaban yang diharapkan, pola jawaban mulai dari yang sangat tertutup sampai dengan yang sangat terbuka, dengan catatan bahwa di antara kedua kutub ini masih terdapat bentuk tes yang lain. Dengan kata lain, dilihat dari pola jawaban, terdapat paling tidak empat macam bentuk tes yaitu tes objektif, tes jawaban singkat, tes penyelesaian masalah, dan tes uraian. Jones mencantumkan Bagan 1.1, yang menggambarkan pengelompokan tes yang didasarkan pada jawaban yang diharapkan.
Bagan 1.1.
Pengelompokan Atas Bentuk Tes (Item Format)
1. Tes Objektif
Jawaban tes sudah tertentu peserta tes hanya memilih jawaban dari alternatif yang dibuat penulis soal. Bentuk tes seperti ini dinamakan bentuk objektif atau tipe objektif. Dalam bagan tersebut bentuk tes objektif tersebut terdiri dari:
a. Pilihan berganda
b. Menjodohkan
a. Pilihan Berganda
Dinamakan Pilihan Berganda karena penulis butir soal selalu menyediakan lebih dari dua alternatif jawaban untuk dipilih satu di antaranya sebagai jawaban yang benar atau yang paling benar. Format
Pilihan Berganda adalah:
……………………... ……… Pokok Soal (stem)
A. ……………………….
B.* ……………………….
C. ……………………….
D. ……………………….
A, B, C, D adalah alternatif
pilihan, B jawaban yang benar
A, C, D adalah pengecoh
Pilihan Berganda memiliki 5 ragam yaitu:
1) Melengkapi Pilihan
Ragam pertama ini pokok soal (stem) boleh dalam bentuk pertanyaan atau pernyataan yang belum sempurna/lengkap.
2) Hubungan Antarhal atau Hubungan Sebab Akibat
Pokok soal dalam ragam ini terdiri dari dua pernyataan yaitu pernyataan pertama dan pernyataan kedua. Tugas peserta ujian adalah mengkaji, apakah ….
A. Pernyataan pertama benar konsepnya, pernyataan kedua benar konsepnya, dan kedua pernyataan tersebut memiliki hubungan sebab akibat.
B. Pernyataan pertama benar konsepnya, pernyataan kedua juga benar konsepnya, tetapi keduanya tidak ada hubungan sebab akibat.
C. Salah satu dari kedua pernyataan tersebut salah konsepnya.
D. Kedua pernyataan tersebut salah konsepnya. Dengan kata lain, empat pilihan di atas (A, B, C, atau D) inilah yang dimunculkan pada saat mengerjakan butir soal tersebut. Empat pilihan ini dapat Anda rumuskan dengan rumusan lain dan jumlah pilihan dapat dibuat lebih dari empat. Dengan menggunakan contoh di bawah ini, pilihlah A, B, C, atau D sebagai jawaban yang benar atau yang paling benar. Dua pernyataan dalam ragam hubungan sebab akibat adalah pernyataan yang terkait dengan materi pembelajaran yang ingin diketahui apakah sudah dikuasai oleh peserta didik. Sebelum menuliskan kedua pernyataan tersebut, kepada peserta ujian harus diberi pengarahan apa yang harus dikerjakan. Pengarahan tersebut mencakup:
Untuk menjawab butir soal berikut (boleh disebutkan nomornya), pilihlah:
A. Jika, pernyataan pertama dan kedua benar konsepnya dan kedua pernyataan itu mempunyai hubungan sebab akibat.
B. Jika pernyataan pertama dan kedua benar konsepnya, tetapi keduanya tidak mempunyai hubungan sebab akibat.
C. Jika salah satu dari kedua pernyataan tersebut salah konsepnya.
D. Jika kedua pernyataan tersebut salah konsepnya.
3) Analisis Kasus
Peserta ujian diberikan satu kasus, biasanya kasus ini kasus nyata (riel) yang terjadi dalam kehidupan. Dengan menggunakan materi kasus tersebut pembuat soal (tes) membuat pertanyaan bentuk pilihan berganda.
4) Melengkapi Berganda atau Pilihan Berganda Kompleks
Ragam butir soal melengkapi berganda digunakan pada pertanyaan yang jawabannya lebih dari satu.
5) Membaca Diagram, Tabel, Grafik, atau Gambar
Ragam kelima ini sebenarnya sama dengan ragam ketiga. Pada ragam ketiga, kasus diutarakan dalam bentuk narasi yang banyak menggunakan kata-kata. Ragam kelima ini kata-kata tersebut diganti dengan diagram, tabel, grafik, atau gambar. Ini berarti dengan satu tabel dapat ditulis beberapa butir soal pilihan berganda yang seragam atau berbagai ragam. Yang pertama dan utama adalah mencari atau merancang satu diagram, atau tabel, atau grafik, atau gambar yang terkait dengan bahan pembelajaran yang ingin diketahui penguasaan peserta didik.
b. Menjodohkan
Menurut Ebel dan Frishie (h.197) ragam soal menjodohkan, memiliki persamaan dengan Pilihan Berganda terutama jika dilihat dari adanya sejumlah pilihan yang disediakan. Menjodohkan juga ada kemiripannya dengan tes jawaban singkat jika dilihat dari cara mengerjakannya. Biasanya menjodohkan digunakan untuk mengukur proses berpikir rendah terutama mengenai ingatan (C1), misalnya mengukur tentang waktu terhadap peristiwa, penulis dengan judul karangannya, negara dengan hasil utamanya, provinsi dengan ibu kotanya dan sebagainya. Di bawah ini dicantumkan satu contoh tes menjodohkan antara provinsi dengan nama ibu kotanya. Dari contoh tersebut Anda dapat melihat bahwa antara premises dengan responses dapat saling dipertukarkan.
Dalam format ini terdapat 5 pokok soal yang masing-masing dapat dijodohkan dengan hanya satu alternatif pilihan yang disediakan. Jumlah pokok soal disesuaikan dengan keperluan namun jumlah pilihan harus lebih banyak.
Tes dengan format Benar Salah menggunakan satu pernyataan. Peserta ujian diminta menilai apakah pernyataan tersebut benar (B) atau salah (S). Jadi pilihan yang disediakan pembuat soal hanya dua yaitu benarkah (B) pernyataan itu atau salah (S) sesuai dengan konsep yang dipelajari selama ini. Penerapan tes B – S di lapangan para pendidik berbeda pendapat. Ada yang tidak setuju menggunakan B – S dalam ujian dan ada yang setuju. Ebel dan Frisbie (h. 139) termasuk yang setuju. Di Indonesia tes B – S masih digunakan di Sekolah Dasar dan di Sekolah Lanjutan Tingkat Pertama, sayangnya proses berpikir yang diukur hampir semuanya mengukur ingatan (C1). Kalau pembuat butir soal tersebut mengembangkan pertanyaan yang mengukur proses berpikir yang lebih tinggi dari C1, tentu akan membantu meningkatkan kualitas SDM Indonesia. Selama belum terjadi upaya perbaikan mengenai penulisan butir soal B – S, seyogianya tes B – S dalam ujian tidak dibenarkan.
1. Tes Jawaban Singkat
Tes bentuk Jawaban Singkat adalah tes yang cara menjawabnya adalah dengan mengisi kata atau kata-kata ke dalam pernyataan yang belum lengkap. Ada kesamaan dengan melengkapi pilihan, perbedaannya terletak pada kata atau kata-kata tersebut harus dipikir sendiri oleh peserta ujian, bukan memilih dari yang sudah disediakan penulis soal. Dengan bentuk ini peserta ujian sedikit sekali kemungkinan untuk menerka, hal ini sekaligus merupakan kelebihan ragam tes ini. Hal inilah yang menyebabkan bentuk tes ini tetap digunakan terutama di tingkat Pendidikan Dasar.
Menurut Ebel dan Frisbie (h. 192) jika jawaban yang diminta cukup panjang seperti pertanyaan:
1) Berikan tiga alasan mengapa …
2) Buatkan daftar mengenai sifat-sifat ….
Pertanyaan berikut ini tidak termasuk tes jawaban singkat tetapi termasuk tes uraian terpimpin.
Tes Jawaban Singkat menurut Gronlund (h. 165) sesuai untuk mengukur hasil belajar yang sederhana atau proses berpikir rendah seperti:
a. Pengetahuan mengenai istilah.
b. Pengetahuan mengenai fakta.
c. Pengetahuan mengenai prinsip, misalnya: jika pada suhu yang tetap tekanan suatu gas diperbesar, apa yang terjadi dengan volumenya?
d. Pengetahuan mengenai metode atau prosedur, misalnya: bagaimana menentukan muatan listrik positif atau negatif?
e. Mengartikan data secara sederhana, misalnya dalam bilangan 651, apakah arti angka 6?
Walaupun tes jawaban singkat diganti dengan Pilihan Berganda namun tes ini masih digunakan dalam berbagai pengukuran karena memiliki kekhususan. Gronlund (h. 167) menyatakan bahwa setiap hasil belajar harus diukur dengan alat ukur yang paling memadai atau paling sesuai.
2. Tes Menyelesaikan Masalah (Problem Solving)
Tes bentuk penyelesaian masalah (problem solving) belum banyak digunakan sebagai alat ukur di Indonesia. Tes bentuk ini memerlukan jawaban yang menggunakan pola berpikir tertentu. Pola ini harus dilatihkan melalui proses pembelajaran. Latihan inilah yang belum banyak dikembangkan di sekolah. Karena tidak dilatihkan, maka peserta didik tidak memperoleh tambahan ilmu dan keterampilan mengenai problem solving karena belum atau jarang sekali digunakan dalam ujian. Namun demikian, di bawah ini akan diuraikan secara singkat mengenai penyelesaian masalah atau pemecahan masalah, dengan harapan pada waktu yang akan datang dalam proses pembelajaran para pendidik akan melatihkannya di sekolah dan pada akhirnya para pendidik akan dapat membuat tes bentuk penyelesaian masalah dan anak didik mampu menjawabnya. Pelajaran IPA, matematika, dan pelajaran IPS tertentu merupakan mata pelajaran yang dapat melatih peserta didik berpikir ilmiah artinya melalui mata pelajaran ini mereka dilatih untuk:
a. merumuskan masalah (menemukan masalah),
b. mengemukakan pendapat (hipotesis) bagaimana caranya menyelesaikan masalah tersebut,
c. mencoba melalui kegiatan (eksperimen) setiap hipotesis yang dikemukakan,
d. mengamati dan mencatat hal-hal yang terjadi selama percobaan(eksperimen) dilaksanakan,
e. Menganalisis dan menyimpulkan hasil percobaan. Lima butir di atas inilah yang diharapkan akan tercantum dalam satu jawaban butir soal bentuk problem solving.
3. Tes Bentuk Uraian
Dari uraian tentang tes objektif, mulai ragam jawaban singkat sampai dengan penyelesaian masalah dapat Anda perhatikan, bahwa jawaban tes yang diharapkan semakin terbuka. Kalau pada tes objektif Anda diminta memilih satu dari pilihan yang disediakan, pada tes problem solving Anda harus menyusun sendiri menurut pola jawaban tertentu dengan tanpa batasan mengikat Anda agar tidak ke luar dari bahasan yang diharapkan. Tes bentuk uraian mengharapkan Anda menyusun sendiri jawaban atas pertanyaan yang disampaikan pembuat soal. Bentuk ini memiliki tiga ragam yaitu:
a. Tes bentuk uraian terpimpin, dalam rumusan pertanyaan tersebut penulis soal mengarahkan untuk menjawab dari aspek-aspek tertentu. Jadi jawaban tidak dibiarkan menurut selera peserta ujian tetapi harus sesuai dengan permintaan penguji. Contoh: Bagaimana pelaksanaan pembukaan UUD 1945 dilihat dari politik luar negeri Indonesia sejak tahun 1965 sampai sekarang. Tes bentuk uraian ini, peserta ujian tidak bebas menjawab, tetapi telah diarahkan (dipimpin) oleh penulis soal bahwa jawaban yang diharapkan hanya mengenai yang ditulis dengan huruf tebal di atas. Ini berarti bila ada peserta ujian yang memberi jawaban tentang hak asasi manusia, kebebasan mimbar dan sejenisnya tidak akan dihargai.
b. Tes bentuk uraian terbatas, menurut Gronlund (h. 233) yang dibatasi tidak hanya pada materi tetapi juga format jawaban. Kedua aspek yang dibatasi menentukan skor jawaban peserta ujian.
Contoh:
1) Mengapa barometer merupakan salah satu alat yang sangat berguna untuk membuat ramalan cuaca. Berikan jawaban dalam satu paragraf (tidak lebih dari 50 kata).
2) Berikan dua situasi yang menggambarkan penerapan hukum permintaan dan penawaran jangan menggunakan contoh yang pernah didiskusikan dalam kelas.
c. Tes bentuk uraian terbuka, tes berikut ini memberi kesempatan kepada peserta ujian untuk memberikan jawaban yang bervariasi. Peserta ujian bebas memilih informasi yang menurutnya tepat untuk jawaban pertanyaan tersebut, ia juga merumuskan sendiri jawaban sesuai dengan yang terbaik menurut pendapatnya dan berupaya untuk mengintegrasikan sejumlah informasi terkait yang merupakan jawaban yang paling tepat. Dengan kata lain, peserta ujian diminta mendemonstrasikan kompetensi yang dimilikinya seperti kemampuan memilih informasi, meramu dan mengintegrasikannya serta memberikan penilaian pada jawabannya sendiri.
Contoh:
Apa yang Anda ketahui tentang “peristiwa Rengas dengklok” pada tahun 1945?
Dengan terbukanya kesempatan bagi peserta tes untuk memberikan jawaban yang bebas atau leluasanya hal ini menyebabkan adanya kekuatan dan kelemahan pada ragam tes uraian terbuka ini, antara lain:
1) Kekuatan tes uraian terbuka:
a) Tidak hanya menanyakan yang faktual, tetapi menantang untuk menggunakan proses berpikir tinggi.
b) Melatih peserta didik untuk berlatih cara belajar yang baik, yaitu tidak sekadar menghafalkan.
c) Membuka kesempatan kepada setiap peserta didik untuk menunjukkan kemampuannya melalui jawaban tes tertulisnya.
d) Mudah dan cepat membuat butir soalnya.
2) Kelemahan tes uraian terbuka
a) Materi butir soal sering terpusat pada pokok bahasan tertentu, sehingga tidak semua materi bahasan terwakili dalam butir-butir tes uraian terbuka.
b) Karena terbatasnya waktu ujian, tidak semua potensi peserta ujian dapat dituangkan dalam jawaban.
c) Penilaian lembar jawaban menyita waktu, dan hasil penilaian cenderung rendah reliabilitasnya (ketetapannya).
d) Dapat menguntungkan pada peserta ujian yang biasa “membual”.
e) Subjektivitas pemeriksa lembar jawaban lebih besar dibandingkan dengan tes bentuk/ragam yang lain.
Dengan tes uraian terpimpin dan tes uraian terbatas sebagian dari kelemahan tes uraian terbuka dapat diatasi khususnya butir 2), c), d), dan e). Setelah memperhatikan hakikat masing-masing bentuk dan ragam soal di atas dan memperhatikan manfaat penerapannya di sekolah, maka selama ini butir soal yang banyak digunakan adalah berbentuk objektif dengan kelima ragamnya serta tes uraian terbatas atau uraian terpimpin. Namun untuk meningkatkan SDM Indonesia pada waktu yang akan datang seharusnya penulisan butir soal objektif supaya dikonsentrasikan pada pengukuran proses berpikir tinggi baik di ujian sekolah maupun dalam EBTA/EBTANAS dan juga tes seleksi untuk memasuki sekolah atau untuk mendapatkan pekerjaan. Rencana ini berjalan wajar kalau proses pembelajaran sudah mengarah pada proses pelatihan berpikir tinggi. Sampai sekarang masalah pembelajaran, dan masalah tes, seperti masalah telur dengan ayam yang mana yang lebih dahulu masih terus diperdebatkan. Guru di sekolah mengatakan “proses pembelajaran di sekolah cenderung pada pembinaan ingatan yang sifatnya faktual, karena EBTA/EBTANAS juga menanyakan yang faktual”. Di lain pihak, pengembang soal merasa kurang wajar kalau pertanyaan EBTA/EBTANAS dikonsentrasikan pada proses berpikir tinggi, pada hal latihan untuk aspek ini masih kurang intensif dilaksanakan di sekolah. Untuk menyelesaikan masalah “telur dan ayam” ini seyogianyalah Menteri Pendidikan Nasional berazam untuk EBTA/EBTANAS tahun 2004 bahwa proses berpikir yang diukur mayoritas proses berpikir tinggi. Seharusnya rencana ini diumumkan kepada semua sekolah dan instansi terkait. Menghadapi tahun 2004 semua pihak terkait/guru, kepala sekolah, penilik/pengawas, Pusat Pengujian, dari tahun ke tahun, menyusun program peningkatan kualitas pembelajaran untuk mencapai rencana Menteri Pendidikan Nasional di atas. Jenis alat ukur yang digunakan untuk menentukan kemajuan proses berpikir peserta didik setelah mengikuti program pendidikan telah dibicarakan di atas. Pada modul berikutnya yaitu modul dua dan tiga, Anda akan dilatih untuk menyusun (mengembangkan) tes yang handal, (tepat, tetap, dan dapat digunakan). Hanya tes yang handal yang dapat dipercaya untuk mengukur kemampuan berpikir peserta didik.
B. NON-TES
Kehadiran peserta didik di suatu lembaga pendidikan tidak hanya sekadar untuk mengasah kecerdasan berpikir, tetapi juga ingin memperoleh keterampilan baru, dan memiliki nurani yang terpuji tidak hanya di mata sesama manusia tetapi juga di hadapan Sang Pencipta. Bukankah dalam Undang-Undang Sistem Pendidikan Nasional No. 20 Tahun 2003 dan di dalam berbagai Ketetapan MPR selalu dicantumkan bahwa tujuan pendidikan adalah untuk membentuk manusia seutuhnya, proses berpikirnya dilatih dan dikembangkan, raganya terutama indranya diberi keterampilan untuk mampu berinteraksi dengan isi alam semesta beserta perkembangan yang melekat padanya, dan yang tidak dapat dilupakan adalah mengisi hati nuraninya agar benar-benar menjadi manusia yang berkepribadian mantap dan mandiri. Dalam Sisdiknas Tahun 2003 disebutkan bahwa: “Pendidikan bertujuan untuk berkembangnya potensi peserta didik agar menjadi manusia yang beriman dan bertaqwa kepada Tuhan Yang Maha Esa, berakhlak mulia, sehat, berilmu, cakap, kreatif, mandiri dan menjadi warga negara yang demokratis serta bertanggung jawab. Tes yang telah dibicarakan adalah alat ukur untuk mengetahui kemajuan proses berpikir peserta didik setelah mengikuti proses pembelajaran. Di bawah ini akan dibicarakan apa dan bagaimana mengukur perkembangan keterampilan manual, serta perkembangan nurani peserta didik, yang oleh Bloom dikelompokkan pada ranah psikomotor dan ranah afektif. Selama ini, kedua ranah ini kurang mendapat penekanan dalam proses pembinaan dan pengembangan di sekolah. Masalahnya sama dengan masalah “telur dan
ayam” yang disebutkan di atas. Upaya ke arah pembinaan dan pengembanganranah kedua dan ketiga ini sebenarnya secara bertahap sudah dilakukan, antara lain pengadaan fasilitas laboratorium IPA, peralatan olahraga, dan pelaksanaan penataran guru mata pelajaran dan sebagainya. Namun dampak upaya ini di sekolah kurang tampak, malah banyak peralatan dan bahan kimia yang rusak atau ditelantarkan. Marilah kita bertekad untuk menekuni alat ukur non-tes sebagaimana kita menekuni tes. Di samping itu, kita berharap agar pemerintah, dalam hal ini Pusat Pengujian, Balitbang, Departemen Pendidikan Nasional, memberikan upaya yang sama, baik pada pengembangan Tes maupun pengembangan non-tes. Sekiranya dua pertanyaan berikut ini Anda sampaikan pada peserta didik Anda, bagaimanakah pola jawaban mereka?
1. Siapakah presiden ketiga Republik Indonesia?
2. Apakah Anda menyenangi pelajaran matematika?
Anda setuju bahwa pola jawaban untuk masing-masing pertanyaan adalah:
Hampir semua peserta didik memberi jawaban yang sama yaitu:
Presiden R. I. ketiga adalah B. J. Habibi. Sedangkan pertanyaan kedua jawabannya bervariasi ada yang sangat senang, ada yang senang, ada yang biasa saja, ada yang tidak senang dan ada yang sangat tidak senang (benci). Perbedaan pola jawaban ini terjadi karena materi pertanyaan pertama mengenai materi yang dipelajari di sekolah yaitu bahan yang harus diingat jadi berkaitan dengan ranah kognitif (proses berpikir). Sedangkan pertanyaan kedua mengenai minat, termasuk pada ranah afektif. Masing-masing memiliki minat tertentu yang belum tentu sama dengan orang lain. Dengan kata lain, untuk mengetahui nurani seseorang, kurang tepat kalau pertanyaan disampaikan langsung. Bagaimana pendapat Anda kalau pertanyaan kedua di atas disampaikan oleh guru matematika kepada anak didiknya langsung? Setujukah Anda bahwa pola jawabannya akan berbeda yaitu hampir tidak ada yang tidak suka dan yang sangat tidak suka. Mengapa terjadi pergeseran bukankah pertanyaannya sama, yang menjawab sama orangnya. Kepada kelompok anak didik yang sama Anda sampaikan pertanyaan berikut: Ini sepotong papan (sambil ditunjukkan) lebar 30 cm, tebal 1,5 cm, dan panjang 2 meter, berapa lama waktu yang Anda perlukan untuk memotong papan ini sehingga masing-masing panjangnya 1 meter? Jawaban yang diterima akan berbeda-beda, dan kalau mereka mencoba memotongnya akan diperoleh angka pelaksanaan yang berbeda dengan angka yang mereka perkirakan. Dari tiga pertanyaan di atas dapat disimpulkan bahwa untuk mengukur ranah afektif dan ranah psikomotor tidak sama dengan ranah kognitif. Mengukur ranah afektif dan ranah psikomotor lebih sukar pelaksanaannya. Pakar pendidikan sepakat bahwa untuk mengukur ranah tersebut sebaiknya dilakukan dengan pengamatan (observasi) dengan mempertimbangkan semua kebaikannya dan keterbatasannya. Micheels dan Karnes dalam Lien (h. 132, 133) menyebutkan kebaikan berikut.
1. Mengamati pekerjaan peserta didik sehari-hari dalam rangka penerapan prinsip dan prosedur merupakan kajian yang berkesinambungan mengenai kemajuan dalam pembelajaran. Ini merupakan dorongan bagi peserta didik dalam mencapai sasarannya.
2. Melalui pengamatan, pendidik memperoleh masukan dalam pembelajaran tanpa mengganggu waktu belajar.
3. Jika pengamatan dapat dilaksanakan secara objektif dan reliabel dibanding dengan alat ukur lainnya maka hasil pengamatan akan dapat menentukan kemampuan peserta didik secara tepat.
4. Perangkat observasi dapat digunakan sebagai alat tambahan yang efektif pada tes perbuatan dan ujian tertulis lainnya.
5. Perangkat observasi akan turut serta mengembangkan ranah afektif (bekerja sama, inisiatif, antusiasme dan sebagainya) sejalan dengan tumbuhnya mata pelajaran terkait. Selanjutnya Lien (h. 133) menyebutkan keterbatasan perangkat observasi berpusat pada pelaksanaan pengadministrasiannya, yaitu:
1) Kurang berhasil dalam merencanakan penggunaan perangkat observasi. Sering terjadi bahwa pendidik kurang dapat membedakan objektif (tujuan instruksional) yang mana yang harus diamati secara cermat dalam proses pembelajaran sehingga semua objektif pembelajaran diberlakukan sama dalam pengamatan. Seharusnya pendidik menentukan lebih dahulu tujuan pembelajaran inti, dan tujuan pembelajaran inti inilah yang harus diamati dari setiap peserta didik.
2) Kurang berhasil mengurangi pengaruh yang menyebabkan rendahnya reliabilitas dalam pengamatan. Yang menyebabkan rendahnya reliabilitas adalah:
a. Kecenderungan memberi penghargaan yang lebih kepada peserta didik yang kelihatannya sibuk, tanpa mempertimbangkan kualitas dan kuantitas hasil pekerjaannya.
b. Terpengaruh karena nilai yang diperoleh selama ini, ataupun kemampuan yang menonjol pada waktu yang belum lama.
c. Kecenderungan pendidik memberi penilaian yang menggunakan rentangan yang sempit.
d. Kecenderungan pendidik memberi nilai akhir atas dasar pengamatan terakhir atau atas dasar satu atau dua pengamatan yang mengesankan.
e. Kecenderungan pendidik untuk memberikan penilaian di luar faktor yang diamati seperti anak yang nakal, menarik, cantik dan sebagainya.
3) Kurang berhasil mengkoordinasikan pengamatan dengan tugas mengajar. Pendidik kurang memanfaatkan waktu mengajar untuk keperluan pengamatan, antara lain pengamatan dilaksanakan pada akhir program. Seharusnya sejak awal pembelajaran sudah diadakan pengamatan, sehingga hasil pengamatan merupakan kumulatif dan masing-masing peserta didik didasarkan pada pengamatan menurut sampel waktu yang memadai. Dalam pelaksanaan di lapangan keterbatasan di atas sedapat mungkin dikurangi serendah-rendahnya, dengan jalan menggunakan perangkat observasi yang sudah diujicobakan. Perangkat observasi terdiri dari pedoman observasi yang dilengkapi dengan petunjuk teknis tentang pedoman tersebut. Dengan adanya petunjuk teknis tidak akan terdapat penafsiran kata, kalimat, ataupun tindakan yang diartikan ganda. Dengan kata lain, perangkat observasi diupayakan untuk menekan subjektivitas pengamat, sehingga hasil-hasil pengamatan dapat berfungsi sebagai informasi penunjang pada hasil pengukuran yang objektif dilakukan melalui alat ukur yang baku.
C. PROSEDUR, TEKNIK, DAN PENDEKATAN PENILAIAN
1. Prosedur Penilaian
Prosedur (procedure) menurut The Contemporary English Indonesia Dictionary artinya cara mengerjakan sesuatu. Dengan demikian prosedur penilaian yang akan dibicarakan di bawah ini adalah cara mengerjakan penilaian yang tepat dan akurat. Dalam kegiatan belajar yang lalu telah disampaikan bahwa hasil penilaian digunakan untuk membuat suatu kebijakan atau keputusan, misalnya, penilaian hasil belajar di sekolah digunakan untuk menentukan keberhasilan peserta didik dalam menguasai berbagai kemampuan yang dirancang berdasarkan kurikulum; penilaian suatu proyek bermuara pada suatu keputusan mengenai keberhasilan mencapai tujuan yang dirancang sejak semula. Dengan kata lain, pelaksanaan penilaian tidak bisa lepas dari tujuan kegiatan yang dinilai. Petugas penilai sebelum memulai merancang aktivitas penilaian selalu memerlukan informasi tentang tujuan kegiatan yang akan dinilai. Jadi untuk melakukan penilaian prosedur pertama dan utama yang harus dikerjakan adalah menentukan tujuan kegiatan atau tujuan sasaran yang akan dinilai. Prosedur lainnya adalah penentuan alat ukur yang tepat, mengembangkan “blue print” (kisi-kisi), pengumpulan data, pengolahan data, dan penulisan laporan. Prosedur tersebut secara singkat akan diuraikan di bawah ini.
a. Menentukan tujuan
Setiap sasaran penilaian sudah ada tujuannya. Contohnya; penilaian hasil belajar di sekolah, sasarannya adalah peserta didik yang mengikuti pembelajaran. Setelah peserta didik mengikuti pembelajaran selama 1 bulan ingin diketahui apakah tujuan pembelajaran selama satu bulan sudah dikuasai peserta didik. Tujuan pembelajaran ini tertulis dalam kurikulum, guru menjabarkan dalam Satpel/Persiapan Mengajar menjadi indikator atau Tujuan Instruksional Khusus (TIK). Dari tujuan khusus inilah penilai memilih tujuan yang penting yang harus diukur ketercapaiannya. Indikator atau tujuan yang dirumuskan secara operasional akan membantu penilai dalam mengembangkan kegiatan selanjutnya. Perlu juga dicatat bahwa dengan rumusan tujuan yang sangat baik belum tentu menjamin hasil akhir yang baik. Apa yang dirumuskan secara baik, kalau pelaksanaannya tidak seperti yang dirumuskan akan membawa hasil akhir yang menyimpang dari yang direncanakan.
Contoh:
Dalam Rencana Pelajaran (Renpel) sudah dicantumkan indikator atau tujuan instruksional khusus yang mengarah pada pencapaian tujuan sebagaimana tercantum dalam kurikulum, namun dalam proses belajar mengajar pendidik tidak melaksanakan seperti yang tertera dalam Renpel. Sudah pasti bahwa hasil pembelajaran akan menyimpang dari kurikulum.
b. Memilih alat ukur yang tepat
Berpedoman pada indikator (TIK) yang direncanakan dan disampaikan dalam proses pembelajaran, penilai dapat memilih atau mengembangkan alat ukur yang dapat mengukur keberhasilan pencapaian indikator tersebut. Kalau dalam pembelajaran dikembangkan ketiga ranah dalam pendidikan, maka dalam kegiatan pengukuran harus disediakan alat ukur yang mengukur proses berpikir (kognitif), keterampilan (psikomotor), dan sikap (afektif). Perlu dicatat bahwa pengembangan ketiga ranah ini tidak sama mudahnya, ada yang sukar dan mengambil waktu yang cukup panjang seperti pengembangan ranah afektif. Di lain pihak ada keterampilan dan proses berpikir yang dapat segera berhasil. Juga perlu dipertimbangkan dari masing-masing ranah tersebut berbagai aspek yang telah banyak dikembangkan dan dilatihkan, sehingga sudah banyak sekali indikator (TIK) yang sudah diselesaikan. Untuk memilih TIK yang benar-benar dapat mewakili apa yang dilaksanakan dalam pembelajaran harus dibuat pemilihan yang tepat dan terpercaya yaitu dengan menggunakan “blue print” (cetak biru = kisi-kisi) pengembangan atau pemilihan butir soal. (Anda dapat memilih sekiranya kumpulan soal atau bank soal sudah Anda miliki, jika tidak Anda harus mengembangkan sendiri sehingga memperoleh butir soal yang handal).
c. Mengumpulkan data
Mengumpulkan data atau mengadministrasikan alat ukur atau melaksanakan pengukuran bukanlah hanya sekadar memberikan buku tes atau angket, namun pelaksana lapangan harus dilatih sehingga setiap petugas memiliki persepsi yang sama dan bertindak seragam dalam kegiatan pengadministrasian ini. Materi yang tercantum dalam alat ukur terutama yang diperkirakan akan menimbulkan keragu-raguan atau pertanyaan, harus dibahas dengan tuntas dalam pelatihan. Adanya buku pedoman pengumpulan data yang dibahas dalam pelatihan sangat membantu petugas/pengumpul data baik dalam upaya menyamakan persepsi maupun dalam tindakan pengumpulan data. Payne (h. 8486) menyebutkan hal-hal yang harus diperhatikan dalam mengumpulkan data:
1) Persiapan pengumpulan data.
2) Saat menjelang pengumpulan data.
3) Saat pelaksanaan pengumpulan data.
4) Saat setelah selesai pengumpulan data.
d. Mengolah data dan menulis laporan
Informasi yang terkumpul baik melalui tes ataupun non-tes harus diolah (diperiksa). Pengolahan data harus dilaksanakan seobjektif mungkin dengan berpedoman pada pengolahan yang disediakan. Memeriksa tes bentuk objektif tidak memakan waktu lama dan hasilnya objektif (apa adanya). Namun mengolah tes bentuk uraian ataupun alat ukur non-tes memerlukan waktu yang cukup lama dan diharapkan pemeriksa dapat bertindak objektif. Jika tes hasil belajar terdiri dari tes bentuk objektif dan bentuk uraian terbatas, bobot kedua bentuk tes ini harus dipertimbangkan sesuai dengan peran pokok bahasan yang diukur oleh butir soal tersebut. Untuk tes bentuk pilihan ganda penerapan formula (rumus) tebakan atau Guessing Formula perlu dipertimbangkan. Nilai yang dicantumkan dalam buku rapor (buku laporan kemajuan), harus diwarnai oleh berbagai kegiatan peserta didik, nilai IPS tidak hanya ditentukan oleh skor ujian akhir catur wulan tetapi skor ulangan harian, mingguan, bulanan, pekerjaan rumah, keaktifan di kelas, kegiatan partisipasi mengerjakan proyek IPS dan lain sebagainya. Buku laporan kemajuan seharusnya menggambarkan prestasi peserta didik tetapi yang tidak kalah pentingnya dua ranah yang lain harus dilaporkan secara rinci, sehingga semua pihak mengetahui aspek apa saja yang dikembangkan di masing-masing jenjang pendidikan.
2. Teknik Penilaian
Pemilihan teknik dalam melaksanakan penilaian tergantung berbagai hal antara lain maksud penilaian, waktu yang tersedia dan kemampuan yang ingin dinilai. Di bawah ini Newby (h. 71) mencantumkan materi yang dinilai dengan teknik penilaian.
3. Pendekatan Penilaian
Penentuan nilai akhir peserta didik di Indonesia lebih sering menggunakan pendekatan acuan relatif/norma (Norm Referenced Measure, PAN) artinya nilai seorang peserta didik ditentukan oleh kemampuan kelompoknya.
Peserta didik dinyatakan berkompeten dalam pekerjaan tertentu manakala ia memiliki pengetahuan, keterampilan dan sikap kerja minimum yang digunakan untuk menyelesaikan pekerjaan tersebut dalam bentuk unjuk kerja/kinerja. Unjuk kerja adalah tingkah laku yang membuahkan suatu hasil, khususnya tingkah laku yang dapat mengubah lingkungan dengan cara-cara tertentu. Dalam pembelajaran, unjuk kerja merupakan penampilan peserta didik dalam
mengerjakan sesuatu tugas yang terkait dengan pembelajaran yang dilakukan.
Hasil belajar peserta didik dilihat dari 3 (tiga) aspek, yaitu:
1. Hasil belajar yang berkaitan dengan perkembangan kognitif.
2. Hasil belajar yang berkaitan dengan perkembangan afektif,
3. Hasil belajar yang berkaitan dengan perkembangan keterampilan
(psikomotor).
3H, Head, Hand, Heart
1) Pengukuran
Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau objek tertentu menurut aturan atau formulasi yang jelas.Dalam pengukuran terdapat dua karakteristik utama, yaitu penggunaan angka atau skala tertentu dan menurut aturan atau formula tertentu. Skala atau angka dalam pengukuran dapat diklasifikasikan kedalam 4 (empat) kategori, yaitu: skala nominal, skala ordinal, skala interval, dan skala rasio.
Skala Contoh nilai ujian
Rasio 0, 1,2, 3, .....100
Interval 0, 1,2, 3, .....100
Ordinal A = sangat memuaskan
B = memuaskan
C = kurang memuaskan
Nominal Lulus, Tidak lulus
2) Penilaian
Penilaian adalah proses memberikan atau menentukan nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Penilaian merupakan kegiatan menafsirkan atau mendeskripsikan hasil pengukuran. Penilaian adalah proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes maupun non tes. Secara garis besar, penilaian dapat dibagi menjadi dua, yaitu:
1. Penilaian formatif
Penilaian formatif dilakukan dengan maksud memantau sejauhmanakah suatu proses pendidikan telah berjalan sebagaimana yang direncanakan
2. Penilaian sumatif.
Penilaian sumatif dilakukan untuk mengetahui sejauhmanakah peserta didik telah dapat berpindah dari suatu unit pembelajaran ke unit berikutnya. Untuk melakukan penilaian hasil belajar perlu memperhatikan prinsipprinsip dan teknik penilaian.
a. Teknik Penilaian
Dalam memperoleh data, pendidik dapat menggunakan berbagai teknik penilaian secara komplementer (saling melengkapi) sesuai dengan kompetensi yang dinilai, sebagaimana diuraikan dalam panduan penilaian masing-masing kelompok mata pelajaran. Teknik-teknik tersebut antara lain terdiri atas:
1) Tes kinerja
Tes kinerja dapat berbentuk tes keterampilan tertulis, tes identifikasi, tes simulasi, dan uji petik kerja. Melalui tes kinerja peserta didik diminta mendemonstrasikan kinerjanya.
2) Observasi
Observasi dilakukan untuk mengumpulkan data kualitatif dan kuantitatif sesuai dengan kompetensi yang dinilai, baik dilakukan secara formal maupun informal. Observasi formal dilakukan dengan cara menggunakan instrumen yang sudah dirancang sebelumnya, sedangkan observasi informal dilakukan tanpa menggunakan instrumen yang dirancang terlebih dahulu.
3) Penugasan
Penugasan dapat dilaksanakan dalam bentuk proyek atau tugas rumah. Proyek adalah sejumlah kegiatan yang dirancang, dilakukan, dan diselesaikan oleh peserta didik di luar kegiatan kelas dan harus dilaporkan secara tertulis maupun lisan dalam waktu tertentu. Tugas rumah adalah tugas yang harus diselesaikan peserta didik di luar kegiatan kelas, misalnya menyelesaikan soal-soal dan melakukan latihan.
4) Portofolio
Portofolio adalah kumpulan dokumen dan karya-karya peserta didik dalam bidang tertentu yang diorganisasikan untuk mengetahui minat, perkembangan, prestasi, dan kreativitas peserta didik.
5) Tes tertulis
Tes tertulis dilakukan dalam bentuk tes yang jawabannya berupa pilihan dan isian. Tes yang jawabannya berupa pilihan meliputi pilihan ganda, benarsalah, menjodohkan, dll. Adapun tes yang jawabannya berupa isian berbentuk isian singkat dan uraian.
6) Tes lisan
Tes lisan dilaksanakan melalui komunikasi langsung tatap muka antara peserta didik dengan seorang atau beberapa penguji. Pertanyaan dan jawaban diberikan secara lisan dan spontan. Tes jenis ini memerlukan daftar pertanyaan dan pedoman pensekoran.
7) Jurnal
Jurnal merupakan catatan pendidik selama proses pembelajaran yang berisi informasi kekuatan dan kelemahan peserta didik yang berkait dengan kinerja ataupun sikap peserta didik yang dipaparkan secara deskriptif.
8) Wawancara
Wawancara dilakukan untuk memperoleh informasi secara mendalam tentang wawasan, pandangan, atau aspek kepribadian peserta didik yang jawabannya diberikan secara lisan dan spontan.
9) Inventori
Inventori merupakan skala psikologis yang dipakai untuk mengungkapkan sikap, minat, dan persepsi peserta didik terhadap sesuatu objek psikologis. Inventori antara lain berupa skala Thurstone, skala Likert, atau skala berdiferensiasi semantik.
10) Penilaian Diri
Penilaian diri merupakan teknik penilaian dengan cara meminta peserta didik untuk mengemukakan kelebihan dan kekurangan dirinya dalam berbagai hal.
11) Penilaian antarteman
Penilaian antarteman merupakan teknik penilaian dengan cara meminta peserta didik untuk mengemukakan kelebihan dan kekurangan temannya dalam berbagai hal. Kombinasi penggunaan berbagai teknik penilaian akan memberikan informasi yang lebih akurat tentang kemajuan belajar peserta didik. Rangkuman bentuk penilaian beserta bentuk instrumennya disajikan dalam tabel berikut.
b. Acuan Penilaian
Dilihat dari perencanaan dan penafsiran hasil tes, pengukuran dalam bidang pendidikan dapat berdasarkan acuan norma/relatif atau acuan kriteria/patokan. Kedua acuan tersebut menggunakan asumsi yang berbeda tentang kemampuan seseorang. Penafsiran hasil tes antara kedua acuan itu juga berbeda, sehingga menghasilkan informasi yang berbeda maknanya. Pemilihan acuan ditentukan oleh karakteristik mata pelajaran yang akan diukur dan tujuan yang akan dicapai. Penilaian acuan norma berasumsi bahwa kemampuan orang berbeda dan dapat digambarkan menurut distribusi normal. Perbedaan itu harus ditunjukkan oleh hasil pengukuran, misalnya setelah mengikuti pembelajaran selama satu semester, peserta didik dites. Hasil tes seorang peserta didik dibandingkan dengan kelompoknya, sehingga dapat diketahui posisi peserta didik tersebut di kelas itu. Penilaian acuan kriteria berasumsi bahwa hampir semua orang dapat belajar apa saja, meskipun dengan waktu yang berbeda. Dalam acuan kriteria, penafsiran skor hasil tes selalu dibandingkan dengan kriteria yang telah ditetapkan. Bagi peserta didik yang telah mencapai kriteria yang telah ditetapkan (standar) diberi pelajaran tambahan yang biasa disebut pengayaan, sedangkan bagi peserta didik yang belum mencapai standar diberi remedi. Ketuntasan belajar setiap indikator yang telah ditetapkan dalam suatu kompetensi dasar atau kriteria ketuntasan minimal (KKM) adalah 75%. Satuan pendidikan harus menentukan kriteria ketuntasan minimal dengan mempertimbangkan tingkat kemampuan rata-rata peserta didik dan pendukung penyelenggaraan pembelajaran. Satuan pendidikan diharapkan meningkatkan kriteria ketuntasan belajar ini terus menerus untuk mencapai kriteria ketuntasan 75% atau lebih. Khusus untuk SMK, nilai mata pelajaran Kompetensi Keahlian Kejuruan kriteria ketuntasannya 7,00.
3) Manfaat pengukuran, penilaian dan tes hasil belajar:
a) Umpan balik bagi:
1) peserta didik
2) Guru
3) Guru lain (misal guru BP)
4) Orang tua
5) Institusi
6) Pejabat
b) Seleksi
c) Diagnosis ........ remedial
d) Pengembangan ilmu pengetahuan ttg pengukuran hasil belajar
e) Menumbuhkan motivasi
f) Pengembangan kurikulum
g) Penempatan (placement test)
4. Keterbatasan Pengukuran, Penilaian, dan Tes Hasil Belajar
Keterbatasan dapat ditinjau dari aspek-aspek:
a. Si pembuat tes
b. Peserta tes
c. Instrumen/alat
d. Lingkungan
Perencanaan tes
Dalam merencanakan tes perlu memperhatikan dan mempertimbangkan hal-hal sebagai berikut:
1. Pengambilan sampel dan pemilihan butir soal.
2. Aspek yang akan diuji.
3. Tipe tes yang akan digunakan.
4. Format butir soal.
5. Jumlah butir soal.
6. distribusi tingkat kesukaran butir soal (25% mudah, 50% sedang, 25% sukar)
Pengembangan tes
Untuk mengembangkan tes dapat diikuti langkah-langkah sebagai berikut:
1. Menyusun kisi-kisi tes.
2. Menulis soal.
3. Menelaah soal.
4. Mengujicoba soal
5. Menganalisis butir soal.
6. Memperbaiki tes.
7. Merakit tes.
8. Melaksanakan tes.
9. Menafsirkan hasil tes.
D. ANALISIS KUALITAS SOAL
Analisis kualitas perangkat soal tes hasil belajar dapat dilakukan dengan dua cara yaitu: analisis secara teoritik (kualitatif) dan analisis secara empiris (kuantitatif). Analisis secara teoritis adalah telaah soal yang difokuskan pada aspek materi, konstruksi, dan bahasa. Aspek materi berkaitan dengan substansi keilmuan yang ditanyakan serta tingkat berpikir yang terlibat, aspek konstruksi berkaitan dengan teknik penulisan soal, dan aspek bahasa berkaitan dengan kekomunikatifan/kejelasan hal yang ditanyakan . Analisis empiris adalah telaah soal berdasarkan data lapangan (uji coba) yang mencakup tingkat kesukaran, daya beda, keberfungsian pengecoh, kebermaknaan butir, dan reliabilitas.
A. Analisis Kualitas Soal Secara Teoritis
Secara teoritis, kualitas soal dapat ditelaah dengan memperhatikan hal-hal sebagai berikut:
1. Tes Bentuk Obyektip
a. Materi:
1) Soal harus sesuai dengan indikator.
2) Pengecoh berfungsi.
3) Setiap soal harus mempunyai satu jawaban yang benar atau yang paling benar.
b. Konstruksi
a) Pokok soal harus dirumuskan secara jelas.
b) Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja.
c) Pokok soal jangan memberi petunjuk ke arah jawaban benar.
d) Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda.
e) Pilihan jawaban harus homogen dan logis ditinjaudari segi materi.
f) Panjang rumusan pilihan jawaban relatif sama.
g) Pilihan jawaban tidak menggunakan pernyataan ”Semua jawaban di atas salah” atau ”{Semua jawaban di atas benar” dan sejenisnya.
h) Pilihan jawaban yang berbentu angka atau waktu disusun berdasarkan urutan besar kecilnya angka atau kronologis waktunya.
i) Gambar/grafik/tabel/diagaram dan sejenisnya harusn jelas dan berfungsi.
j) Butir tes jangan tergantung pada jawaban sebelumnya.
c. Bahasa
a) Setiap tes harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indoensia.
b) Menggunakan bahasa yang komunikatif sehingga mudah dimengerti.
c) Jangan menggunakan bahasa yang berlaku setempat.
d) Pilihan jawaban jangan mengulang kata atau frase yang bukan merupakan satu kesatuan pengertian.
2. Tes Bentuk Uraian
a. Materi:
1) Soal harus sesuai dengan indikator.
2) Batasan pertanyaan dan jawaban yang diharapkan (ruang lingkup) harus jelas..
3) Isi materi sesuai dengan petunjuk pengujkuran.
4) Isi materi yang ditanyakan sudah sesuai dengan jenjang, jenis sekolah, atau tingkat kelas.
b. Konstruksi
1) Rumusan kalimat soal atau pertanyaan harus menggunakan kata-kata tanya atau perintah yang menuntut jawaban terurai, seperti: mengapa, uraikan, jelaskan, bandingkan, hubungkan, tafsirkan, buktikan, dan hitunglah.
2) Buatlah petunjuk yang jelas tentang cara mengerjakan soal.
3) Buatlah pedoman penskoran segera setelah soalnya ditulis dengan cara menguraikan komponen yang akan dinilai atau kriteria peskorannya.
4) Hal-hal lain yang menyertai tes seperti tabel, gambar, grafik, peta, atau yang sejenisnya harus disajikan dengan jelas dan terbaca.
c. Bahasa
1) Rumusan kalimat tes harus komunikatif.
2) Butir tes menggunakan bahasa Indoensia yang baik dan benar.
3) Rumusan tes tidak menggunakan kata-kata/kalimat yang menimbulkan penafsiran ganda atau salah penafsiran..
4) Jangan menggunakan bahasa yang berlaku setempat, jika tes akan digunakan untuk daerah lain atau nasional.
5) Rumusan tes tidak mengandung kata-kata yang dapat menyinggung perasaan peserta ujian.
2. Analisis Secara Empiris
Analisis karakteristik butir soal mencakup analisis parameter kuantitatif dan kualitatif butir soal. Parameter kuantitatif berkaitan dengan analisis butir soal berdasarkan atas tingkat kesukaran, daya beda, dan keberfungsian alternatif pilihan jawaban. Parameter kualitatif berkaitan dengan analisis butir soal berdasarkan atas pertimbangan ahli (expert judgement).
a. Tingkat Kesukaran (TK)
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar.
Tingkat kesukaran adalah angka yang menunjukkan besarnya proporsi peserta tes yang menjawab betul pada suatu butir. Rentang angka ini adalah 0,00 sampai 1,00. Jika suatu butir soal memiliki tingkat kesukaran 0,00 berarti tidak ada peserta tes yang menjawab butir soal tersebut dengan benar. Dengan kata lain butir soal terlalu sukar. Sebaliknya, jika butir soal memiliki tingkat kesukaran 1,00 berarti semua peserta tes dapat menjawab butir soal dengan benar. Dengan kata lain, butir soal terlalu mudah.
Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif. Rumusnya adalah seperti berikut ini (Nitko, 1996: 310).
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah/mudah.
Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal dapat dicontohkan seperti berikut ini.
0,00 - 0,30 : soal tergolong sukar
0,31 - 0,70 : soal tergolong sedang
0,71 - 1,00 : soal tergolong mudah
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes yang sangat sukar (TK= < 0,25) distribusinya berbentuk positif skewed, sedangkan tes yang mudah dengan TK= >0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran. Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar mereka, (2) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki ketepatan data soal.
Di samping kedua kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antarsoal), (2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi antar soal, semakin tinggi reliabilitas.
Tingkat kesukaran butir soal juga dapat digunakan untuk mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk kategori mudah, maka prediksi terhadap informasi ini adalah seperti berikut.
1) Pengecoh butir soal itu tidak berfungsi.
2) Sebagian besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap informasi ini adalah seperti berikut.
1) Butir soal itu "mungkin" salah kunci jawaban.
2) Butir soal itu mempunyai 2 atau lebih jawaban yang benar.
3) Materi yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga kompetensi minimum yang harus dikuasai siswa belum tercapai.
4) Materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk pilihan ganda).
5) Pernyataan atau kalimat soal terlalu kompleks dan panjang.
Namun, analisis secara klasik ini memang memiliki keterbatasan, yaitu bahwa tingkat kesukaran sangat sulit untuk mengestimasi secara tepat karena estimasi tingkat kesukaran dibiaskan oleh sampel (Haladyna, 1994: 145). Jika sampel berkemampuan tinggi, maka soal akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka soal akan sangat sulit (TK = < 0,40). Oleh karena itu memang merupakan kelebihan analisis secara IRT, karena 1RT dapat mengestimasi tingkat kesukaran soal tanpa menentukan siapa peserta tesnya (invariance). Dalam IRT, komposisi sampel dapat mengestimasi parameter dan tingkat kesukaran soal tanpa bias.
b. Daya Beda
Adalah kemampuan suatu item soal untuk membedakan antara testee yang kurang pandai dengan testee yang lebih menguasai materi. Untuk menentukan besarnya indeks daya beda, harus membedakan testee kelompok atas dengan testee kelompok bawah, yaitu kelompok dengan nilai tertinggi dengan kelompok dengan nilai terendah.
Rumus daya beda :
Keterangan :
D = daya beda
JA = jumlah testee kelompok atas
JB = Jumlah testee kelompok bawah
BA = Jumlah testee kelompok atas yang menjawab pertanyaan dengan benar
BB = Jumlah testee kelompok bawah yang menjawab pertanyaan dengan benar
Kualitas daya beda :
0,00 – 0,20 : Jelek
0,21 – 0,40 : cukup
0,41 – 0,70 : baik
0,71 – 1,00 : baik sekali
Daya Pembeda (DP)
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara warga belajar/siswa yang telah menguasai materi yang ditanyakan dan warga belajar/siswa yang tidak/kurang/belum menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini.
1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.
2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat dicurigai "kemungkinannya" seperti berikut ini.
a) Kunci jawaban butir soal itu tidak tepat.
b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar
c) Kompetensi yang diukur tidak jelas
d) Pengecoh tidak berfungsi
e) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak
f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah informasi dalam butir soalnya
Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan warga belajar/siswa yang telah memahami materi dengan warga belajar/peserta didik yang belum memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0) berarti lebih banyak kelompok bawah (warga belajar/peserta didik yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (warga belajar/peserta didik yang memahami materi yang diajarkan guru).
Untuk mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan menggunakan rumus berikut ini.
DP = daya pembeda soal,
BA = jumlah jawaban benar pada kelompok atas,
BB = jumlah jawaban benar pada kelompok bawah,
N =jumlah siswa yang mengerjakan tes.
Hasil perhitungan dengan menggunakan rumus di atas dapat menggambarkan tingkat kemampuan soal dalam membedakan antar peserta didik yang sudah memahami materi yang diujikan dengan peserta didik yang belum/tidak memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut ini (Crocker dan Algina, 1986: 315).
0,40 - 1,00 : soal diterima baik
0,30 - 0,39 : soal diterima tetapi perlu diperbaiki
0,20 - 0,29 : soal diperbaiki
0,19 - 0,00 : soal tidak dipakai/dibuang
c. Keberfungsian Alternatif Pilihan Jawaban
Dalam tes hasil belajar berbentuk objektif dengan model pilihan ganda, umumnya memiliki (4) empat atau (5) lima alternatif pilihan jawaban dimana salah satu alternatif jawabannya adalah jawaban yang benar (kunci jawaban). Alternatif pilihan jawaban yang salah sering disebut dengan istilah pengecoh (distractor). Alternatif pilihan jawaban dalam suatu butir soal dikatakan berfungsi jika semua pilihan jawaban tersebut dipilih oleh peserta tes dengan kondisi di mana jawaban yang benar lebih dipilih dari pada alternatip pilihan jawaban yang lain. Pengecoh berfungsi jika paling sedikit 5% dari peserta tes memilih jawaban tersebut.
d. Omit
Omit adalah proporsi peserta tes yang tidak menjawab pada semua alternatif jawaban). Butir soal yang baik jika omit paling banyak 10% dari peserta tes.
Misal, pada butir 1 setelah dianalisis diperoleh data sbb:
Pilihan jawaban a b c* d omit Jumlah Kelompok Atas 5 7 15 3 0 30 Kelompok Bawah 8 8 6 5 3 30
Jumlah 13 15 21 8 3 60
IK (1) = 21/60 = 0,35
IB (1) = 15/30 – 6/30 = 0,30
Keberfungsian Pengecoh: berfungsi (>5% peserta tes memilih pengecoh)
Omit: butir soal baik karena <10% dari peserta tes yang tidak memilih semua alternatif jawaban
e. Validitas
Suatu instrumen dapat dikatakan memiliki validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud dikenakannya pengukuran tersebut.
Sebuah instrumen evaluasi sangat penting memiliki karakteristik valid. Sebuah instrumen evaluasi menurut Johnson & Johnson (dalam Sukardi, 2011:31) yaitu “apabila instrumen yang digunakan dapat mengukur apa yang hendak diukur”. Menurut Sugiyono (2010), suatu instrumen dikatakan valid berarti instrumen itu mampu dipergunakan untuk mengukur apa yang seharusnya diukur. Suatu instrumen berupa tes dapat dianggap valid ketika dapat mengukur dengan spesifik apa yang telah dipelajari sebagaimana ditentukan oleh tujuan pembelajaran untuk setiap unit atau topik (Kemp, et al. 1994). Menguji validitas sebuah instrumen tes dapat dilakukan dengan pertanyaan-pertanyaan tentang kebenaran atau kesesuaian dari kesimpulan yang dibuat berdasarkan tes skor atau nilai (Bloom, et al. 1981).
Validitas suatu instrumen evaluasi sangat penting sebagai derajat yang menunjukkan di mana suatu tes mengukur apa yang seharusnya diukur. Validitas instrumen evaluasi memiliki beberapa makna penting di antaranya yaitu.
a) Validitas berhubungan dengan interpretasi instrumen evaluasi untuk kelompok atau individu dan bukan berhubungan dengan instrumen itu sendiri.
b) Validitas menunjukkan derajat kategori yang bisa mencakup kategori rendah, menengah, dan tinggi.
c) Prinsip suatu tes yang valid tidak universal, maka perlu adanya perhatian dari para peneliti bahwa instrumen hanya valid untuk suatu tujuan tertentu saja (Sukardi, 2011).
Macam-Macam Validitas
Untuk menguji validitas suatu instrumen evaluasi dapat dibedakan ke dalam beberapa macam berdasarkan kesimpulan yang hendak dicapai.
a) Validitas Isi (Content Validity)
Validitas isi merupakan derajat yang menyatakan bahwa sebuah tes evaluasi dapat mengukur cakupan substansi yang ingin diukur. Untuk memperoleh validitas isi memerlukan 2 aspek penting yaitu valid isi dan valid teknik sampling. Validitas isi mempunyai peran penting untuk tes pencapaian hasil belajar siswa (Sukardi, 2011). Suatu tes hasil belajar dikatakan memenuhi validitas isi apabila tes tersebut betul-betul merupakan bahan-bahan yang representatif terhadap bahan-bahan pelajaran yang diberikan (Nurkancana dan Sunartana, 1990).
b) Validitas Konstruk (Construct Validity)
Validitas kontruk adalah ketepatan suatu tes ditinjau dari susunan tes tersebut. Untuk mengetahui suatu tes memiliki validitas kontruk, maka susunan tes tersebut harus dibandingkan dengan syarat-syarat penyusunan tes yang baik (Nurkancana dan Sunartana, 1990).
c) Validitas Konkuren (Concurent Validity)
Validitas konkuren adalah “derajat di mana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat”. Validitas konkuren ditentukan dengan membangun analisis hubungan atau perbedaan (Sukardi, 2011: 34). Validitas konkuren atau bandingan diartikan sebagai ketepatan suatu tes dilihat dari hubungannya terhadap kecakapan yang telah dimiliki saat ini secara riil (Nurkancana dan Sunartana, 1990).
d) Validitas Prediksi (Predictive Validity)
Validitas prediksi merupakan derajat yang menunjukkan suatu tes dapat memprediksi tentang seberapa jauh siswa akan melakukan tugas-tugas yang direncanakan (Sukardi, 2011). Validitas prediksi atau ramalan dapat diartikan sebagai ketepatan dari suatu instrumen dilihat dari kemampuan instrumen tersebut untuk meramalkan prestasi yang akan dicapai (Nurkancana dan Sunartana, 1990).
Faktor-Faktor yang Mempengaruhi Validitas
Beberapa faktor yang mempengaruhi validitas hasil tes evaluasi, di antaranya.
1) Faktor yang berasal dari dalam tes, yaitu: arahan tes yang disusun dengan makna yang tidak jelas; kata-kata yang digunakan pada instrumen evaluasi terlalu sulit dipahami; item tes dikontruksi dengan jelek; tingkat kesulitan item tes tidak tepat dengan materi yang diterima siswa; waktu yang dialokasi tidak tepat; dan sebagainya.
2) Faktor yang berasal dari administrasi dan skor, yaitu: ada kecurangan dalam tes; petunjuk dari pengawas tidak dapat dilakukan pada semua siswa; teknik pemberian skor tidak konsisten; siswa tidak mengikuti arahan/petunjuk; dan sebagainya.
3) Faktor-faktor yang berasal dari jawaban siswa, yaitu: siswa gagal menjawab tes karena tegang terhadap guru yang jahat; ruangan terlalu ramai dan gaduh sehingga siswa tidak konsentrasi; dan sebagainya (Sukardi, 2011: 38-39).
Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memilki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah dengan teknik korelasi product moment yang dikemukakan oleh pearson (Arikunto, 1997)
f. Reliabilitas Instrumen
Pengertian
Menurut Sukardi (2008: 43) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil konsisten dalam mengukur yang hendak diukur. Sehubungan dengan reliabelitas ini Scarvia B. Anderson dan kawan-kawan (dalam Arikunto, 1997) menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabelitas ini penting. Dalam hal ini validitas lebih penting, dan reliabelitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tapi tidak valid. Sebaliknya tes yang valid biasanya reliable.
1. Tipe-tipe Reliabelitas
Menurut Sukardi (2008) Ada beberapa tipe reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes, ekivalen, dan belah dua yang ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1) Relibalelitas Dengan Tes-Retes
Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama. Dengan melakukan tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur (Sukardi, 2008).
Sedangkan Arikunto (1997: 88) Metode tes ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
1. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
2. Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
3. Korelasikan kedua hasil tes tersebut.
4. Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).
2) Reliabelitas Dengan Bentuk Ekivalensi
Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya mempunyai karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama (Sukardi 2008).
Pernyataan serupa juga disampaikan oleh Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah bahasa Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:
1. Tentukan sasaran yang hendak dites
2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
3. Administrasinya hasilnya secara baik.
4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut
5. Korelasikan kedua hasil skor tersebut (Sukardi, 2008).
Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan pengukuran (Sukardi, 2008). Pernyataan lain juga disampaikan oleh Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
3) Reliebilitas Dengan Bentuk Belah Dua
Menurut Sukardi (2008: 47) Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai berikut:
1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
2. Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.
3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
4. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran (Sukardi, 2008).
5. Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown (Arikunto, 1997):
Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
a) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.
b) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.
c) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah.
d) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.
Berdasarkan apa yang sudah dibahas di atas, maka saran penulis bagi para pendidik :
1. Pendidik harus dapat mengukur hasil belajar siswa berdasarkan aspek pengetahuan, seperti pengetahuan, keterampilan, dan sikap dan menentukan alat ukur yang sesuai dengan aspek pengetahuan tersebut
2. Setelah mengajar peserta didik, guru harus koreksi diri dengan selalu bertanya. Apakah siswa sudah paham dengan apa yang diajarkan? Apakah siswa mengalami kesulitan dalam belajar materi yang diajarkan? Mengapa siswa tidak paham materi yang diajarkan? Kemudian guru memperbaiki lagi cara mengajarnya.
3. Dalam mengukur hasil belajar siswa, soal yang dibuat guru penyampaiannya harus sampai pada tujuannya.
4. Soal ujian yang dibuat guru harus mengukur apa yang diketahui siswa, karena bila soal ujian tidak mengukur apa yang diketahui siswa, maka siswa akan kesulitan dalam mengerjakan soal lalu frustasi.
5. Dalam melakukan evaluasi, guru harus memperhatikan :
a) Tujuan vs program
b) Apa jaminan tujuan sudah sama dengan program?
c) Jenis dan teknik pengumpulan data
d) Teknik analisa data
e) Rekomendasi (upaya mengembangkan pembelajaran)
6. Penilaian hasil belajar yang dilakukan guru harus sahih dan ajeg, yang artinya penilaian yang dilakukan tepat sasaran dan konsisten.
7. Instrumen yang dibuat guru harus mengukur apa yang hendak diukur, standar soal harus disesuaikan dengan kemampuan siswa. Yang artinya soal tes harus sesuai dengan kemampuan siswa dan ujian mengukur apa yang hendak diukur. Bila ujian atau soal tidak mengukur apa yang hendak diukur maka soal tersebut akan membuat kesusahan siswa yang mengerjakan. Bila standar soal tidak sesuai dengan kemampuan siswa, maka akibatnya siswa yang mengerjakan soal akan frustasi, siswa akan berusaha lulus dengan segala cara yaitu MENCONTEK.
8. Ketika melaksanakan penilaian hasil belajar guru harus mengkondisikan kenyamanan siswa dalam mengerjakan soal test.
Sekian artikel tentang penilaian hasil belajar kimia ini, somoga tulisan ini dapat berguna dan bermanfaat bagi pembaca. Akhir kata penulis mengucapkan terima kasih.
Daftar Rujukan :
Arikunto, S. (1997). Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara
Bloom, B. S, Madaus, G. F & Hastings, J. T. 1981. Evaluation to Improve Learning. United States of America: McGraw-Hill, Inc.
Kemp, J. E, Morrison, G. R & Ross, S. M. 1994. Designing Effective Instruction. New York: Macmillan College Publishing Company.
Nurkancana, W dan Sunartana, P. 1990. Evaluasi Hasil Belajar. Surabaya: Penerbit Usaha Nasional.
Noehi Nasoetion, Modul Hakikat Evaluasi Pembelajaran
Sugiyono. 2010. Metode Penelitian Pendidikan. Bandung: Penerbit Alfabeta.
Sukardi. 2011. Evaluasi Pendidikan: Prinsip dan Operasionalnya. Jakarta: PT. Bumi Aksara.
Sukardi. (2008). Evaluasi Pendidikan. Jakarta: Bumi Aksara
Sudji Munadi, Penilaian Hasil Belajar
Komentar
Posting Komentar