keutuhan & kesahan pentaksiran / analisis & interpretasi
DESCRIPTION
TRANSCRIPT
BAB 7 : keutuhan & kesahan teknik pentaksiran
Konsep ‘markah sebenar’
Apakah ‘markah sebenar’
?
KEUTUHAN (KEBOLEHPERCAYAAN)
Ketekalan (consistency) dan kestabilan (stability) ukuran atau alat ukur kajian.
Sakitnya pula kepala
ni..
Pemeriksa A Pemeriksa A
Bagaimana tentukan KEUTUHAN?
kesahanSejauh mana ujian mengukur apa yang hendak
diukur. (Adakah ujian yang dibina menepati matlamat dan objektif ia dibina?)
Kesahan konstruk – konsep/teori
Cth : Semasa anda mengukur apa yang anda labelkan sebagai ‘pemikiran kritis’, adakah itu yang sebenarnya anda
ukur? Adakah anda PASTI anda TAHU apa itu pemikiran kritis?
Kesahan kandungan
Ia berkait dengan memasukkan
kandungan yang SESUAI dan
DIPERLUKAN. JADUAL SPESIFIKASI memberi guru bukti
bahawa ujian mempunyai kesahan
kandungan yang tinggi, bahawa ia
mencakupi apa yang ia harus cakupi.
Adakah ujian memasukkan kemahiran-
kemahiran yang diperlukan untuk
prestasi yang bagus, ataupun
semua aspek mata pelajaran yang
diajar?
Kesahan kRITERIA
Sebuah ujian mungkin utuh tetapi tidak sah apabila markah yang diperolehi oleh pelajar apabila ujian ditadbir beberapa kali adalah lebih kurang sama (konsisten). Namun begitu ujiian tersebut tidak mengukur
apa yang hendak diukur.
Cth:- Ujian ‘bertujuan menguji Penjodoh Bilangan’ tetapi soalan lebih memfokuskan kepada ‘Kata Penghubung’. Namun pelajar dapat menjawab
ujian tersebut secara konsisten walaupun ditadbir sebanyak 3 kali.
Masalah dalam keutuhan uji-uji semula ialah situasi uji-uji semula adalah agak sukar dilaksanakan kerana tidak mungkin pelajar bersedia mengambil ujian yang sama dua kali. Terdapat juga kesan daripada latihan dan ingatan yang mungkin mempengaruhi korelasi tersebut. Pelajar mungkin masih ingat soalan yang ditanya dan menjawab dengan mengingat semula & bukan berdasarkan pengetahuan.
Dalam keutuhan bentuk serupa pula, suatu masalah utama dalam pendekatan ini adalah bahawa anda harus boleh menghasilkan banyak item yang mencerminkan konstruk atau pemboleh ubah yang sama. Ini selalunya bukan suatu yang mudah.
Teknik BENTUK SERUPA atau SELARAS pula ialah dua ujian yang serupa mungkin dari segi bentuk seperti persamaan aras-aras kemahiran yang diuji ataupun pengetahuan, kemahiran atau sikap yang sama ditadbir kepada pelajar.
Faktor-faktor mempengaruhi kesahan & keutuhan
Cuba huraikan gambarajah berikut:-
BAB 9 : analisis & interpretasi markah pentaksiran & melapor pentaksiran
2 JENIS STATISTIK
Bagaimana membuat analisa &
interpretasi?
Statistik deskriptif
Mengapa / bila guna STATISTIK
DESKRIPTIF?
Mengapa / bila guna STATISTIK
DESKRIPTIF?
untuk menerangkan pencapaian pelajar agar mudah difahami data dipersembahkan dalam bentuk graf / carta 2 jenis statistik deskriptif :- ukuran tercondong pusat (min, mod, median) & penyerakan (julat & sisihan piawai) biasanya untuk gambarkan faktor demografi seperti jantina, umur
Apakah batasan
STATISTIK DESKRIPTIF?
Apakah batasan
STATISTIK DESKRIPTIF?
Rumusan / generalisasi hanya boleh dibuat ke atas populasi/ kump yang diukur sahaja.
Membezakan pencapaian dengan sisihan piawai
Mengapa penyerakan data penting?
Memberi gambaran berapa baik min mewakili data - semakin terserak semakin kurang ia mewakili data (besar perbezaan antara markah individu)
Contoh : - Min markah Matematik bagi tiga buah kelas A, B, & C ialah 55. Kelas manakah yang telah mencapai pencapaian terbaik? Min tidak memberitahu kelas mana yang telah mencapai pencapaian lebih baik.
Oleh itu maklumat tentang sisihan piawai diperlukan. Sisihan piawai bagi kelas A, B & C ialah 4.12, 2.00 & 1.00. Lebih besar nilai sisihan piawai maka lebih terserak data. Maksudnya lebih jauh markah daripada min. Oleh itu, Kelas C mendapat pencapaian terbaik.
Statistik inferensi
Mengapa / bila guna STATISTIK
INFERENSI?
Mengapa / bila guna STATISTIK
INFERENSI?
untuk menghuraikan hubungan di antara pembolehubah - pembolehubah kajian (adakah terdapat hbgn antara prestasi dgn pentaksiran kerja kursus) untuk membuat generalisasi / andaian & ramalan untuk membuat perbezaan antara kump pelajar (pencapaian antara lelaki & perempuan)
Apakah batasan
STATISTIK INFERENSI?
Apakah batasan
STATISTIK INFERENSI?
Ketidakpastian kerana statistik ini berdasarkan tekaan / andaian & tidak semua populasi diukur.
Contoh :-Daripada 350 orang penduduk yang dipilih secara rawak di bandar Masai, Johor, 280 orang memiliki kereta jenama Proton.
Contoh analisis deskriptif dibuat:
80% daripada penduduk tersebut memiliki kereta jenama Proton.
Contoh analisis inferensi dibuat:
80% daripada penduduk di Johor memiliki kereta jenama Proton.
•Tiada maklumat diperolehi tentang semua penduduk di Johor, cuma tentang 350 orang penduduk di Masai. Maklumat itu telah diambil dan dibuat generalisasi bagi menggambarkan semua penduduk yang tinggal di Johor.
Daripada 350 orang penduduk yang dipilih secara rawak di bandar Masai, Johor, 280 orang memiliki kereta jenama Proton.
Contoh analisis deskriptif dibuat:
80% daripada penduduk tersebut memiliki kereta jenama Proton.
Contoh analisis inferensi dibuat:
80% daripada penduduk di Johor memiliki kereta jenama Proton.
•Tiada maklumat diperolehi tentang semua penduduk di Johor, cuma tentang 350 orang penduduk di Masai. Maklumat itu telah diambil dan dibuat generalisasi bagi menggambarkan semua penduduk yang tinggal di Johor.
Contoh :-
Sepanjang 3 Ahad yang lalu, Ahmad, seorang penjual kereta telah menjual sebanyak 2, 1 dan 0 unit kereta.
Contoh analisis deskriptif dibuat ialah:
Ahmad menjual secara purata 1 unit kereta sepanjang 3 Ahad yang lalu.
Contoh analisis inferensi dibuat:
Ahmad tidak pernah berjaya menjual lebih daripada dua unit kereta pada hari Ahad.
Sepanjang 3 Ahad yang lalu, Ahmad, seorang penjual kereta telah menjual sebanyak 2, 1 dan 0 unit kereta.
Contoh analisis deskriptif dibuat ialah:
Ahmad menjual secara purata 1 unit kereta sepanjang 3 Ahad yang lalu.
Contoh analisis inferensi dibuat:
Ahmad tidak pernah berjaya menjual lebih daripada dua unit kereta pada hari Ahad.
Sisihan piawai menggambarkan serakan data. Semakin tinggi nilai maka semakin terserak data & semakin jauh data daripada min. Oleh itu, sisihan piawai 5 data adalah lebih terserak dan mjauh dari min berbanding sisihan piawai 2 di mana data lebih berkumpul di sekitar min.
Pencongan positifTerdapat pencongan positif kerana ia mempunyai ekor yang lebih panjang di arah positif. Apakah maksudnya?
Ia bermaksud bahawa lebih ramai pelajar mendapat markah rendah dalam ujian biologi yang menunjukkan bahawa ujian tersebut terlalu susah. Ia mungkin juga bermaksud bahawa soalan-soalan ujian tidak jelas ataupun kaedah mengajar dan bahan gagal menghasilkan hasil pembelajaran yang diinginkan.
Pencongan negatif
Terdapat pencongan negatif kerana ia mempunyai ekor yang mengarah kepada arah negatif. Apakah maksudnya?
Ia bermaksud bahawa lebih ramai pelajar mendapat markah yang tinggi dalam ujian Sejarah tersebut yang menunjukkan bahawa samada ujian tersebut terlalu senang ataupun kaedah mengajar dan bahan yang digunakan Berjaya menghasilkan hasil pembelajaran yang diinginkan.
Skor piawai
Selepas memberikan ujian akhir semester, guru melaporkan markah mentah yang diterima oleh Zulinda, seorang pelajar tingkatan IV:-
80 untuk Sains 72 untuk Sejarah 40 untuk Bahasa Inggeris Dengan markah mentah tersebut sahaja, apakah yang dapat anda katakana tentang pencapaian Zulinda dalam ujian-ujian tersebut ataupun kedudukannya dalam kelas? Sebenarnya, tidak banyak yang anda akan dapat katakan. Tanpa mengetahui bagaimana markah mentah tersebut dibandingkan dengan penyerakan markah untuk setiap mata pelajaran, adalah sukar untuk kita membuat rumusan yang bermakna tentang prestasinya secara bandingan dalam setiap ujian tersebut.
BAGAIMANAKAH ANDA MENJADIKAN MARKAH MENTAH TERSEBUT LEBIH BERMAKNA?
Skor-zMin dan sisihan piawai ketiga-tiga ujian tersebut adalah seperti berikut:
Sains: Markah = 80, Min = 90 dan Sisihan Piawai = 10 Sejarah: Markah = 72, Min = 60 dan Sisihan Piawai = 12 Bahasa Inggeris: Markah = 40, Min = 40 dan Sisihan Piawai = 15
Dengan mengalih markah mentah Zulinda kepada “mata z”, kita dapat katakan bahawa pencapaiannya adalah:
Mata z - 1 untuk Sains Mata z +1 untuk Sejarah Mata z 0 untuk Bahasa Inggeris
Markah saya
negatif??
Markah saya
negatif??
Berdasarkan kepada maklumat tambahan tersebut, pernyataan apakah yang dapat anda buat tentang prestasi Zulinda dalam setiap ujian tersebut?
Skor-tMata / skor T telah digubal oleh W. McCall dalam tahun 1920an dan merupakan salah satu markah standard yang biasa digunakan sekarang. Mata T digunakan dengan meluas dalam psikologi dan pendidikan, khususnya semasa melapor prestasi dalam ujian standard (Nitko, 1983). Mata T adalah markah standard dengan min 50 dan sisihan piawai 10. Formula untuk menghitung mata T adalah:
T = 10 (z) + 50
Mata POSITIF ini lebih baik!
Lengkung normal /loceng
Dark blue is less than one standard deviation from the mean. For the normal distribution, this accounts for about 68% of the set, while two standard deviations from the mean (medium and dark blue) account for about 95%, and three standard deviations (light, medium, and dark blue) account for about 99.7%.
Pentaksiran merujuk norma
Apakah itu norma-norma? Norma adalah CIRI-CIRI SEBUAH POPULASI YANG DIANGGAR DENGAN TEPAT daripada ciri-ciri sebuah sampel subset populasi (dipanggil sampel atau sampel norma). Berdasarkan sampel norma, norma dapat dihasilkan.
Contohnya, sekiranya anda mendapat norma keupayaan membaca kanak-kanak berlainan kumpulan umur, anda akan boleh membandingkan prestasi seorang budak berumur 7 tahun dalam kelas anda dalam ujian keupayaan membaca dengan seluruh populasi.
Dalam erti kata lain, anda boleh tentukan samada budak berumur 7 tahun itu membaca pada tahap kanak-kanak berumur 7 tahun dalam negara ini. Dalam menentukan norma-norma ini anda perlu pastikan bahawa sampel norma adalah mewakili populasi.
Simetri dan berbentuk loceng.
Min, mod dan median adalah sama – terletak di tengah2
Hanya ada satu nilai mod.
Lengkungan bertabur secara selanjar.
Tidak menyentuh paksi-x.
Jumlah luas di bawah lengkung ialah 1.00 / 100%.
UJIAN MERUJUK STANDARD menggunakan band bagi meletakkan murid pada tahap pencapaian dan keupayaannya. Kebiasaannya 6 band digunakan, bermula dengan band 1 hingga 6. Setiap band mempunyai huraian tentang pencapaian dan keupayaan murid bagi setiap konstruk yang ingin dibangunkan dalam diri pelajar seperti yang dinyatakan dalam sukatan pelajaran.
UJIAN MERUJUK NORMA adalah penanda aras yang bertujuan membandingkan prestasi antara kump pelajar. Ujian ini dibina untuk menghasilkan perbezaan pencapaian yang maksimum di kalangan pelajar. Oleh yang demikian, tahap kesukaran ujian perlu dikawal dengan nisbah soalan mudah, sederhana dan sukar ialah 2.5 : 5 : 2.5.
Ujian rujukan norma biasanya menggunakan markah min sebagai rujukan. Ini bermaksud, sekiranya ramai pelajar mendapat skor rendah, maka markah lulus akan rendah juga dan sebaliknya.
Bagaimanakah pula format laporan
pentaksiran?
Kesimpulan
• Penggunaan terancang dan aktif keputusan ujian merupakan sebahagian penting proses pengajaran.
• Matlamat laporan pentaksiran adalah untuk memperbaiki keputusan-keputusan dan membantu sekolah atau institusi memperbaiki dan membantu pelajar belajar dengan lebih lagi.
• Pendidik harus mereka bentuk dan menyediakan laporan tentang keputusan pentaksiran dengan cermat.
• Semasa menyediakan laporan pentaksiran, kita harus peka tentang siapa pembacanya.
• Format laporan pentaksiran akan mempengaruhi motivasi pembaca untuk membaca laporan tersebut serta persepsi yang pembaca perolehi daripada laporan tersebut.
• Kerahsiaan adalah sangat penting dalam melapor keputusan pentaksiran.