chapter 9

14
EDUCATIONAL ASSESMENT CHAPTER 9 ANALISA DAN INTERPRETASI TERHADAP SKOR UJIAN DAN LAPORAN Setelah tamat bab ini, anda seharusnya dapat: Bezakan antara statistik deskriptif dan inferensi Mengira pelbagai langkah kecenderungan memusat Terangkan penggunaan markah standard Huraikan ciri-ciri lengkung normal Terangkan bagaimana hasil penilaian digunakan Senarai jenis maklumat yang dimasukkan ke dalam laporan penilaian Bincangkan format laporan penilaian Terangkan keperluan kerahsiaan BAB TINJAUAN 9.1 Mengapa menggunakan Statistik? 9.2 Penjelasan Skor Ujian 9.3 Skor Standard 9.4 Curve Normal 9.5 Norma 9.6 "Pensil ke bawah" 9.7 Bagaimanakah Keputusan Pelajar Digunakan? 9.8 Siapakah Penonton 9.9 Apakah Jenis Maklumat yang perlu dimasukkan? 9.10 Format yang digunakan 9.11 Bagaimana Maklumat Digunakan? 9.12 Kerahsiaan Ringkasan Terma Utama Bacaan Bab 1: Pengenalan Bab 2: Apa yang Dinilai Bab 3: Menggunakan Ujian Objektif Bab 4: Menggunakan Ujian Esei Bab 5: Menggunakan Projek dan Amali Bab 6: Menggunakan Pemerhatian, Ujian Lisan, dan Portfolio Bab 7: Kebolehpercayaan dan Kesahan Kaedah Penilaian Bab 8: Analisis Item Bab 9: Analisis Markah Ujian dan Laporan Semua data yang anda telah dikumpul kepada prestasi pelajar perlu dianalisis . Dalam bab ini kita akan memberi tumpuan kepada analisis dan interpretasi data yang telah anda kumpul tentang pengetahuan , kemahiran dan sikap pelajar anda . Anda menganalisis dan mentafsir maklumat yang telah dikumpulkan tentang pelajar anda secara kuantitatif dan kualitatif . Untuk analisis kuantitatif data , pelbagai alat statistik digunakan . Setelah dikumpul dan dianalisis

Upload: nurhayati-binti-abu-bakar

Post on 17-Jan-2016

248 views

Category:

Documents


1 download

DESCRIPTION

d

TRANSCRIPT

Page 1: chapter 9

EDUCATIONAL ASSESMENT

CHAPTER 9ANALISA DAN INTERPRETASI TERHADAP SKOR UJIAN DAN LAPORAN

Setelah tamat bab ini, anda seharusnya dapat:

Bezakan antara statistik deskriptif dan inferensi Mengira pelbagai langkah kecenderungan memusat Terangkan penggunaan markah standard Huraikan ciri-ciri lengkung normal Terangkan bagaimana hasil penilaian digunakan Senarai jenis maklumat yang dimasukkan ke dalam laporan penilaian Bincangkan format laporan penilaian Terangkan keperluan kerahsiaan

BAB TINJAUAN9.1 Mengapa menggunakan Statistik?9.2 Penjelasan Skor Ujian9.3 Skor Standard9.4 Curve Normal9.5 Norma9.6 "Pensil ke bawah"9.7 Bagaimanakah Keputusan Pelajar Digunakan?9.8 Siapakah Penonton9.9 Apakah Jenis Maklumat yang perlu dimasukkan?9.10 Format yang digunakan9.11 Bagaimana Maklumat Digunakan?9.12 Kerahsiaan

RingkasanTerma UtamaBacaanBab 1: PengenalanBab 2: Apa yang DinilaiBab 3: Menggunakan Ujian ObjektifBab 4: Menggunakan Ujian EseiBab 5: Menggunakan Projek dan AmaliBab 6: Menggunakan Pemerhatian, Ujian Lisan, dan PortfolioBab 7: Kebolehpercayaan dan Kesahan Kaedah PenilaianBab 8: Analisis ItemBab 9: Analisis Markah Ujian dan Laporan

Semua data yang anda telah dikumpul kepada prestasi pelajar perlu dianalisis . Dalam bab ini kita akan memberi tumpuan kepada analisis dan interpretasi data yang telah anda kumpul tentang pengetahuan , kemahiran dan sikap pelajar anda . Anda menganalisis dan mentafsir maklumat yang telah dikumpulkan tentang pelajar anda secara kuantitatif dan kualitatif . Untuk analisis kuantitatif data , pelbagai alat statistik digunakan . Setelah dikumpul dan dianalisis data penilaian yang dikumpul tentang pelajar , langkah seterusnya adalah untuk menggunakan maklumat yang ada kepada pihak yang berkepentingan seperti ibu bapa , pentadbir sekolah , pihak berkuasa kerajaan, majikan yang berpotensi dan masyarakat. Maklumat ini perlu dikemukakan dalam bentuk yang akan menggalakkan penonton berkenaan untuk membaca dan memahami

Page 2: chapter 9

9.1 APAKAH STATISTIK?

Bagi sesetengah orang, perkataan "Statistik" sering dikaitkan dengan nombor manakala yang lain berpendapat bahawa seseorang itu mestilah baik dalam matematik untuk memahami dan statistik penggunaan. Kedua-dua persepsi ini tidak sama sekali tepat. Statistik adalah lebih daripada nombor. Pasti, ia melibatkan pemasangan, mengelas dan mengira nombor tetapi yang lebih penting adalah bagaimana kita menganalisis data bagi tujuan membuat keputusan dan generalisasi. Malah, ramai di antara kita menggunakan statistik tanpa menyedari ia. Sebagai contoh, apabila kita bercakap mengenai matematik purata skor, pendapatan per kapita daripada ibu bapa di daerah ini, peratusan murid yang mendapat "A", kita bercakap bahasa statistik. Apakah statistik? American Heritage Dictionary® mendefinisikan statistik sebagai: "Matematik pengumpulan, organisasi, dan interpretasi data berangka, terutamanya analisis ciri-ciri penduduk mengikut kesimpulan daripada pensampelan."The Merriam-Webster "s Collegiate Dictionary® mendefinisikan statistik sebagai "satu cabang matematik yang berkaitan dengan pengumpulan, analisis, tafsiran, dan pembentangan massa data berangka".Jon Kettenring, Presiden Persatuan Statistik Amerika mentakrifkan statistik "sebagai sains pembelajaran daripada data. Statistik adalah penting untuk perjalanan yang sepatutnya kerajaan, pusat untuk membuat keputusan dalam industri, dan komponen teras kurikulum pendidikan moden di semua peringkat."

Pendek kata, statistik berkaitan dengan analisis, tafsiran dan persembahan data. Ia diguna pakai kepada pelbagai disiplin ilmu daripada sains fizikal dan sosial kepada kemanusiaan. Statistik telah digunakan secara meluas oleh penyelidik dalam pendidikan dan guru kelas. Dalam menggunakan statistik dalam pendidikan, ia bermula dengan penduduk yang akan dikaji. Ini boleh terjadi kepada semua murid Tahun 5 sekolah rendah di Malaysia yang berjumlah iaitu lebih 500,000 orang. Atas sebab-sebab praktikal, bukan sekadar menyusun data mengenai penduduk keseluruhan, kita biasanya memilih atau mengambil subset penduduk yang dipanggil sampel. Dalam erti kata lain, 40 orang murid Tahun 5 yang anda ajar adalah sampel populasi murid Tahun 5 di negara ini. Data yang anda kumpulkan mengenai pelajar di dalam kelas anda boleh tertakluk kepada DUA jenis analisis statistik bergantung kepada tujuan:

Statistik deskriptif :Anda menggunakan teknik statistik ini kepada " menerangkan " bagaimana pelajar anda dilakukan . Sebagai contoh , anda menggunakan teknik statistik deskriptif untuk meringkaskan data dengan cara yang berguna sama ada secara berangka atau grafik . Tujuannya adalah untuk membentangkan data yang dikumpul supaya ia dapat difahami oleh guru-guru , pentadbir sekolah , ibu bapa , masyarakat dan Kementerian Pelajaran . Teknik-teknik deskriptif biasa digunakan ialah min atau purata dan sisihan piawai. Data juga boleh dikemukakan secara grafik menggunakan pelbagai jenis carta dan graf .

Statistik inferensi: Anda menggunakan teknik statistik inferensi apabila anda mahu untuk membuat kesimpulan mengenai populasi berdasarkan sampel anda. Anda menggunakan statistik inferensi apabila anda ingin mengetahui perbezaan di antara kumpulan pelajar, hubungan antara pembolehubah atau apabila anda mahu untuk membuat ramalan tentang prestasi pelajar. Sebagai contoh, anda ingin mengetahui sama ada kanak-kanak lelaki melakukan lebih baik daripada kanak-kanak perempuan atau sama ada terdapat hubungan antara prestasi dalam penilaian kerja kursus dan peperiksaan akhir. Statistik inferensi sering digunakan ialah ujian-t, ANOVA dan regresi linear.

9.2 MENGAPA MENGGUNAKAN STATISTIK?

Page 3: chapter 9

Misalnya, anda memberikan ujian geografi yang terdiri daripada 30 soalan aneka pilihan untuk kelas anda sebanyak 40 pelajar pada akhir semester dan anda mendapat markah untuk setiap pelajar yang merupakan pengukuran sampel pelajar "keupayaan. Kelakuan diuji boleh menjadi keupayaan untuk menyelesaikan masalah dalam geografi seperti membaca peta, dunia dan tafsiran graf. Salah seorang pelajar anda Mei Ling mendapat 9 soalan betul manakala Lina mendapat 18 soalan betul. Adakah ini bermakna bahawa pengetahuan geografi Lina dan kemahiranya adalah lebih baik daripada Mei Ling? Adakah ini bermakna bahawa pengetahuan geografi dan kemahiran Lina adalah dua kali ganda keupayaan Mei Ling? Adakah markah 9 dan 18 peratus?

Skor atau markah sukar untuk ditafsir kerana mereka markah mentah . Skor mentah boleh mengelirukan jika tidak ada rujukan dibuat kepada " unit " . Oleh itu , ia hanya logik bahawa anda menukar skor untuk satu unit seperti peratusan dan anda mendapat 30 % bagi Mei Ling dan 60 % untuk Lina .Malah penggunaan peratusan mungkin tidak bermakna. Sebagai contoh , mendapat 60 % dalam ujian geografi yang boleh dianggap sebagai " baik " jika ujian itu adalah ujian yang sukar . Sebaliknya , jika ujian itu mudah , maka 60 % boleh dianggap sebagai hanya " purata" . Dalam erti kata lain , untuk mendapatkan gambaran yang lebih tepat daripada skor yang diperoleh pelajar pada ujian geografi , guru hendaklah: Dapatkan maklumat lanjut di mana pelajar mendapat markah tertinggi di dalam kelas dan bilangan soalan yang dijawab dengan betul . Dapatkan maklumat lanjut di mana pelajar memperolehi markah terendah dalam kelas dan bilangan soalan yang dijawab dengan betul .

Ketahui bilangan soalan dengan betul dijawab oleh semua pelajar di dalam kelas.

Ini menggambarkan bahawa markah yang diperolehi oleh pelajar dalam ujian harus diperiksa dengan teliti. Ia tidak cukup untuk hanya melaporkan markah yang diperolehi. Maklumat lanjut perlu diberikan mengenai markah yang diperolehi, dan untuk melakukan ini, anda perlu menggunakan statistik

9.3 MENGGAMBARKAN SKOR UJIAN

Andaikan bahawa anda baru sahaja diberi Ujian Bahasa Inggeris untuk kelas 35 pelajar sekolaha Menengah. Selepas menandakan skrip, anda mempunyai satu set markah bagi setiap pelajar di dalam kelas, anda ingin mengetahui lebih lanjut mengenai bagaimana pelajar anda dilakukan. Lihat Rajah 9.1 yang menunjukkan taburan markah yang diperoleh oleh pelajar dalam ujian. Lajur "frekuensi" menunjukkan berapa ramai pelajar mendapat skor untuk setiap tanda ditunjukkan dan peratusan yang ditunjukkan dalam ruang "peratusan". Anda boleh menggambarkan markah ini menggunakan DUA jenis langkah-langkah, iaitu Kecenderungan Memusat dan Serakan.

A) KECENDERUNGAN MEMUSATIstilah "kecenderungan memusat" merujuk kepada nilai "tengah" dan dikira dengan menggunakan min, median dan mod. Ia adalah petunjuk lokasi markah. Setiap satu daripada tiga langkah dikira secara berbeza, dan yang mana satu untuk digunakan akan bergantung pada keadaan dan apa yang anda mahu untuk menunjukkan (Ebel, 1979).

i) Min: min ini adalah langkah yang paling biasa digunakan kecenderungan memusat. Apabila kita bercakap tentang "purata", kita biasanya merujuk kepada min. Min ialah hanya jumlah semua nilai (markah) dibahagikan dengan jumlah bilangan item (pelajar) dalam set. Hasilnya disebut min aritmetik. Menggunakan data dari Rajah 9.1 dan menggunakan formula di bawah, anda boleh mengira min.

ii) Median: Median ditentukan oleh pengiraan markah yang diperoleh dari terendah kepada nilai yang tertinggi dan mengambil nilai yang adalah di tengah-tengah daripada urutan itu.

Page 4: chapter 9

Sebagai contoh dalam Rajah 9.1, median adalah 53. Median ialah nilai yang membahagikan bawah 50% daripada markah dari 50%. Terdapat 17 orang pelajar dengan skor kurang daripada 53 dan 17 pelajar yang markah adalah lebih besar daripada 52. Jika terdapat nombor genap pelajar, tidak akan ada titik tunggal di tengah-tengah. Jadi, anda mengira median dengan mengambil min bagi dua titik tengah, iaitu membahagikan jumlah kedua-dua markah sebanyak 2.

iii) Mod : Mod ini adalah skor yang paling kerap berlaku dalam set data . Objek yang terdapat dengan paling kerap dalam set data anda ? Dalam Rajah 9.1 , mod ialah 57 kerana 7 pelajar mendapat skor yang . Walau bagaimanapun , anda juga boleh mempunyai lebih daripada satu mod . Jika anda mempunyai dua mod ia adalah bimodal .

B ) Serakan :Walaupun min menerangkan kita tentang kumpulan purata prestasi , ia tidak memberitahu kitabagaimana dekat dengan purata pelajar atau skor min. Sebagai contoh , adakah setiap pelajarmendapat 80 % pada ujian atau markah tersebar dari 0 hingga 100 peratus . serakanadalah pembahagian markah dan antara langkah yang digunakan untuk menggambarkan penyebaran adalahjulat dan sisihan piawai .

i ) Range : Julat skor dalam ujian merujuk kepada markah yang paling rendah dan paling tinggi yang diperolehi dalam ujian . Julat adalah jarak antara ekstrim pengagihan . Sebagai contoh , markah tertinggi yang diperolehi adalah 75 dan skor yang paling rendah diperoleh adalah 40. Oleh itu, julat ini adalah 75 ─ 40 = 35

ii ) Sisihan Piawai : sisihan standard merujuk kepada berapa banyak melakukan skor yang diperoleh pelajar menyimpang atau menangguhkan daripada min . Rajah 9.2 adalah satu set skor yang diperoleh 10 orang pelajar dalam ujian sains . Berdasarkan markah mentah , anda boleh mengira sisihan piawai menggunakan formula yang diberikan di bawah ( Gronlund , 1988) .

Langkah pertama dalam mengira sisihan piawai adalah untuk mencari min yang 390 dibahagikan dengan 10 = 10. __ Seterusnya adalah untuk menolak min dari setiap skor dalam ruangan X dilabel - X . Sila ambil perhatian bahawa semua nombor dalam ruangan ini adalah positif . Perbezaan kuasa dua kemudiannya dijumlahkan dan punca kuasa dua dikira . Sisihan piawai adalah punca kuasa dua positif 153 dibahagikan dengan 9 dan 4.12.Untuk lebih memahami apakah sisihan piawai bermakna, rujuk Rajah 9.3 yang menunjukkan penyebaran markah dengan min tetapi berbeza yang sama sisihan piawai. Bagi Kelas A, dengan sisihan piawai 4.12, kira-kira 68% (1 sisihan piawai) pelajar mendapat antara 34,88 dan 43,12. Untuk Kelas B, dengan sisihan piawai 2, kira-kira 68% (1 sisihan piawai) pelajar mendapat skor antara 37 dan 41. Untuk Kelas C, dengan sisihan piawai 1, kira-kira 68% pelajar mendapat skor antara 38 dan 40.

Kelas B 37.00 39 41.00 SD = 2.00Kelas C 38.00 39 40.00 SD = 1.00Kelas A 34,88 39 43.12 SD = 4.12

Rajah 9.3 Taburan Markah dengan pelbagai Standard Penyelewengan.

Page 5: chapter 9

Perhatikan bahawa semakin kecil sisihan piawai, lebih besar skor cenderung untuk "sekumpulan" sekitar min dan sebaliknya. Oleh itu, ia tidak cukup untuk hanya memeriksa min sahaja kerana sisihan piawai memberitahu kita banyak perkara mengenai penyebaran markah sekitar min. Kelas mana yang anda fikir prestasi yang lebih baik? Min tidak memberitahu kita yang kelas prestasi yang lebih baik. Kelas C adalah yang terbaik kerana kira-kira dua pertiga (⅔) mendapat skor antara 38 dan 40.

SEMAK DIRI 9.1a) Apakah perbezaan di antara pelbagai dan standardb ) Apakah perbezaan di antara sisihan piawai 2 dan sisihan 5 ?

SKEW (PENCONG)Pencongan merujuk kepada pengagihan secara simetri . Pengedaran A menjadi pencong jika satu ekor yang lebih panjang daripada yang lain . Rujuk Rajah 9.4 (a ) yang menunjukkan taburan markah yang diperolehi oleh 38 pelajar pada ujian sejarah. Terdapat suatu herotan negatif kerana ia mempunyai ekor yang lebih panjang ke arah yang negatif . Apakah ertinya ? Ini bermakna bahawa yang lebih ramai pelajar telah mendapat markah yang tinggi pada ujian sejarah yang mungkin menunjukkan bahawa sama ada ujian itu terlalu mudah atau kaedah pengajaran dan bahan-bahan yang telah Berjaya membawa hasil pembelajaran yang dikehendaki.

Rujuk Rajah 9.4 ( b ) yang menunjukkan taburan markah yang diperolehi oleh 38 pelajar pada ujian biologi . Terdapat pencongan positif kerana ia mempunyai ekor yang lebih panjang dalam arah positif . Apakah ertinya ? Ini bermakna bahawa lebih ramai pelajar telah mendapat markah yang rendah dalam ujian biologi yang menunjukkan bahawa ujian itu adalah terlalu sukar . Sebagai alternatif , ia boleh bermakna bahawa soalan tidak jelas atau kaedah pengajaran dan bahan-bahan yang tidak membawa hasil pembelajaran yang dikehendaki.

9.1 AKTIVITISeorang guru mentadbir ujian Bahasa Inggeris untuk 10 kanak-kanak di kelas beliau . Kanak-kanak memperoleh markah berikut : 14 , 28 ,48 , 52 , 77 , 63 , 84 , 87 , 90 dan 98. Untuk berikut taburan markah , mencari yang berikut :a) minb ) medianc ) antarad ) sisihan piawai

9.4 CURVE NORMALKeluk normal (juga dikenali sebagai "lengkung loceng") adalah lengkung bayangan yang sepatutnya mewakili semua fenomena yang berlaku semula jadi. Dalam taburan normal, min, median dan mod mempunyai nilai yang sama. Adalah diandaikan bahawa jika kita mencuba ciri tertentu seperti ketinggian lelaki Malaysia, anda akan mendapati bahawa ketinggian purata sebanyak 5 kaki 4 inci. Walau bagaimanapun, akan ada beberapa orang lelaki yang akan menjadi agak lebih pendek dan jumlah yang sama yang agak tinggi. Dengan memplot ketinggian daripada lelaki Malaysia mengikut kekerapan kejadian, anda dijangka untuk mendapatkan sesuatu yang serupa dengan lengkung taburan normal. Rajah 9.5 menunjukkan lengkung taburan normal untuk IQ berdasarkan Wechsler Intelligence Skala untuk Kanak-kanak. Dalam taburan normal, kira-kira dua pertiga (⅔) daripada individu akan mempunyai IQ di antara 85 dan 115 dengan min 100. Menurut Persatuan Amerika terencat Mental (2006), individu yang mempunyai IQ kurang daripada 70 boleh diklasifikasikan sebagai terencat akal atau terencat akal dan mereka yang mempunyai IQ lebih 130 boleh dianggap sebagai berbakat. Begitu juga, markah ujian yang mengukur ciri-

Page 6: chapter 9

ciri tertentu seperti penguasaan bahasa, keupayaan kuantitatif atau literasi sains penduduk tertentu boleh dijangka akan menghasilkan keluk normal. Keluk normal dibahagikan mengikut sisihan piawai (iaitu - 4s, - 3s ...... + 3s dan 4s) yang ditunjukkan pada paksi mengufuk. Kawasan lengkung antara sisihan piawai ditunjukkan sebagai peratusan pada gambar rajah. Sebagai contoh, kawasan di antara min dan sisihan piawai 1 adalah 34,13%. Begitu juga, kawasan di antara min dan sisihan piawai -1 juga 34,13%. Oleh itu, kawasan di antara sisihan piawai -1 dan sisihan piawai 1 adalah 68,26%. Ertinya dalam taburan normal, 68,26% daripada individu akan markah antara sisihan piawai - 1 dan 1.

Dalam menggunakan lengkung normal , ia adalah penting untuk membuat perbezaan antara nilai sisihan piawai dan skor sisihan piawai . Nilai sisihan piawai ialah pemalar dan ditunjukkan di paksi mendatar dalam Rajah 9.5 . Sebaliknya , skor sisihan standard markah yang diperoleh apabila kita menggunakan formula sisihan piawai (yang kita dibincangkan sebelum ini ) . Sebagai contoh , jika kita mendapat sisihan piawai sama dengan 5 , maka markah untuk 1 sisihan piawai adalah 5 dan skor untuk 2 sisihan piawai adalah 10 , markah untuk 3 sisihan piawai adalah 15 dan sebagainya . Nilai sisihan piawai -1 , -2 , -3 dan akan telah sepadan markah negatif -5 , -10 dan -15 .

Perhatikan bahawa dalam Rajah 9.5, skor z ditandakan dari 1 + untuk + 4 dan ke -1 -4 dengan min sebagai 0. Setiap selang adalah sama dengan satu sisihan piawai. Begitu juga, skor T dilaporkan 10-90 (selang 10) dengan min yang ditetapkan pada 50. Setiap selang 10 adalah sama dengan satu sisihan piawai.

9.5 NORMA

Dalam penilaian rujukan norma, prestasi individu dinilai berkait dengan persembahan orang lain. Ujian rujukan norma jarang digunakan di Malaysia tetapi di Amerika Syarikat, ujian yang standard digunakan secara meluas. Mungkin, kerana sistem pendidikan yang tidak berpusat, penilaian berasaskan sekolah dengan meluas diamalkan. Tiada peperiksaan kebangsaan seperti PMR atau SPM seperti di Malaysia. Oleh itu, guru-guru di Amerika Syarikat yang ingin mengetahui bagaimana pelajar mereka menunjukkan prestasi berbanding dengan pelajar-pelajar lain di negara ini, bergantung kepada ujian rujukan norma untuk membandingkan pencapaian pelajar mereka terhadap prestasi pelajar lain dalam kumpulan norma.

Apakah norma ? Norma adalah ciri-ciri penduduk dianggarkan dengan tepat daripada ciri-ciri subset wakil penduduk ( dikenali sebagai sampel atau sampel norma ) . Berdasarkan sampel norma, norma dihasilkan . Sebagai contoh jika anda mempunyai norma-norma keupayaan membaca untuk kanak-kanak daripada kumpulan umur yang berbeza , anda akan dapat membandingkan prestasi pelajar yang berumur 7 tahun di dalam kelas anda pada bacaan ujian kemampuan berbanding dengan seluruh penduduk. Dalam erti kata lain, anda boleh menentukan keupayaan membaca kanak – kanak di peringkat umur 7 tahun berbanding kanak-kanak berumur 7 tahun yang lain di negara ini. Dalam mewujudkan norma ini anda perlu memastikan bahawa sampel norma adalah wakil penduduk.

Jadual 9.1 Norma untuk Ujian Kemampuan Membaca

Perwakilan :Jika dibandingkan pelajar anda dengan seluruh penduduk, anda hendak memastikan bahawa sampel norma adalah wakil. Dalam erti kata lain, individu yang diuji dalam sampel norma mesti terdiri daripada kumpulan umur yang sesuai, dengan mengambil kira perbezaan jantina, lokasi geografi dan perbezaan budaya. Sebagai contoh, yang berumur 8 tahun dipilih untuk sampel norma harus mencerminkan kanak-kanak berumur 8 tahun di negara ini mengikut jantina (lelaki dan perempuan), lokasi geografi (bandar atau luar bandar) dan perbezaan budaya. Katakanlah sebagai contoh, sampel norma terdiri daripada 3000 kanak-kanak sekolah rendah Malaysia dengan 500 orang pelajar bagi setiap kumpulan umur (berumur 7 tahun = 500 orang pelajar, berumur 8 tahun = 500 dan sebagainya). Sampel norma harus terdiri daripada kanak-kanak di semua negeri di Malaysia,

Page 7: chapter 9

termasuk semua kumpulan etnik di negara ini, yang diambil daripada latar belakang sosio-ekonomi yang berbeza dan lokasi geografi. Berdasarkan sampel norma daripada 3000 kanak-kanak sekolah rendah, norma-norma andaian berikut kepada keupayaan dalam Bahasa Malaysia untuk kanak-kanak Malaysia telah dihasilkan membaca (lihat Rajah 9.1).

Pangkat persentil (peratusan antara) digunakan dalam ujian standard yang membolehkan guru-guru untuk membandingkan pencapaian pelajar mereka dengan kumpulan norma. Seorang pelajar berusia 8 tahun yang memperoleh skor 48 pada ujian yang mempunyai pangkat persentil daripada 84. Ini bermakna bahawa pelajar tersebut dapat membaca pada tahap yang baik atau lebih baik daripada 84% pelajar yang berusia 8 tahun pada ujian tersebut.. Begitu juga, pelajar yang berumur 8 tahun yang memperolehi pangkat persentil 45 keupayaan membaca lebih baik daripada 45% daripada kanak-kanak berumur 8 tahun dalam sampel norma.

Untuk menggunakan norma berkesan , anda perlu yakin bahawa sampel norma adalah sesuai untuk kedua-dua tujuan ujian dan untuk orang yang sedang diuji . Jika anda menyedari bahawa norma-norma ujian adalah tidak mencukupi , anda perlu berhati-hati kerana anda boleh mendapatkan maklumat yang mengelirukan tentang kebolehan pelajar anda . Organisasi yang bertanggungjawab untuk membangunkan norma perlu nyatakan dengan jelas kumpulan diuji kerana anda ingin memastikan bahawa sampel norma adalah sama dengan pelajar anda. Dalam erti kata lain, sampel norma harus terdiri daripada jenis yang sama rakyat dalam kadar yang sama seperti yang terdapat dalam populasi rujukan. Sampel norma harus cukup besar untuk menjadi stabil dari masa ke masa.

9.6 "Pensil ke bawah""Pensil ke bawah" biasanya digunakan frasa untuk menandakan akhir sesi ujian. Tetapi, program ujian anda tidak berakhir dengan kata-kata ini. Sebenarnya, adalah permulaan suatu pelan yang menyeluruh dirangka untuk melaporkan keputusan penilaian anda atau program ujian. Penggunaan dirancang dan keputusan ujian digunakan secara aktif adalah merupakan satu bahagian penting dalam proses pengajaran. Ia tidak cukup untuk menganalisis data penilaian dan melaporkan keputusan kepada pelajar. Jika ini berlaku, maka proses penilaian yang dibuat tidak lengkap.

SEMAK DIRI 9.1a) Senaraikan ciri-ciri lengkung normal.b) Apakah norma? Bagaimanakah norma digunakan?c) Adakah anda fikir kita patut diselaraskan dengan norma ujian untuk pengukuran pelbagai jenis kebolehan?

9.7 Bagaimana Keputusan Penilaian Pelajar Digunakan?Setelah data dianalisis penilaian yang anda telah dikumpul pada akhir semester atau akhir tahun ini, tugas seterusnya adalah untuk membuat laporan mengenai maklumat itu untuk memperbaiki keputusan dan membantu sekolah atau institusi untuk meningkatkan dan membantu pelajar belajar lebih ( Morris Fritz-Gibbon dan Freeman, 1987). Berdasarkan laporan, sekolah atau institusi boleh menentukan: sejauh mana ia telah memenuhi semua hasil pembelajaran atau objektif, kekuatan dan kelemahan bidang mata pelajaran individu, keperluan pembelajaran pelajar sama ada pelajar perlu dinaikkan ke gred atau tahap yang sebahagian daripada kurikulum sekolah yang memerlukan bantuan.Keputusan-keputusan ini adalah kritikal dan pendidik perlu memikirkan bagaimana untuk berhati-hati hasil penilaian dilaporkan dan kepada siapa. Mereka adalah satu-satunya sumber maklumat bahawa sesetengah penonton menerima tentang pembelajaran pelajar sebenar . Oleh itu , para pendidik perlu teliti mereka bentuk dan menyedikan laporan mengenai hasil penilaian . Jika tidak, mereka mungkin mengelirukan penonton dan menyebabkan mereka menyalahtafsirkan dan / atau menyalahgunakan keputusan .

Page 8: chapter 9

9.8 Siapa Sasaran Penonton Di dalam Laporan ini ?

Apabila menyediakan laporan penilaian itu , anda harus sedar yang penonton kerana terdapat banyak pihak berkepentingan yang terlibat dalam mana-mana sekolah atau institusi pendidikan . Apa-apa laporan laporan hasil penilaian akan bergantung kepada apa yang penonton tertentu kehendak dan keperluan . Antara penonton adalah: pelajar tenaga pengajar jawatankuasa kajian semula kurikulum pentadbir sekolah daerah sekolah ibu bapa pihak berkuasa kerajaan guru persatuan atau kesatuan masyarakat badan-badan Pensijilan

Anda harus sedar tentang apa yang setiap ahli penonton ingin tahu dan apa yang anda mahu mereka tahu . Anda perlu menentukan tentang pemahaman data hey , berapa banyak yang mereka mahu , jenis format yang paling berkesan ( ringkasan naratif , graf & carta, berangka. Dalam beberapa kes , anda boleh menghasilkan satu laporan yang menghidangkan pelbagai penonton dan dalam keadaan lain pula anda boleh menghasilkan beberapa laporan, yang sesuai dengan seseorang penonton.

9.9 Apakah Jenis Maklumat Perlu Dimasukkan Dalam Laporan ?

Bergantung kepada penonton , laporan penilaian boleh termasuk maklumat yang cukup untuk menjawab empat soalan asas :1. Apakah yang telah kita lakukan?2. Mengapa kita melakukannya ?3. Apa yang kita dapati ?4. Bagaimana kita akan menggunakannya

Yang paling penting adalah untuk mewujudkan siapa yang memerlukan maklumat. iaitu apa yang penonton mahu. Tanpa mengira siapakah penonton, ia adalah penting untuk memastikan bahawa maklumat tersebut akan memberikan pemahaman yang bermakna terhadap prestasi institusi pendidikan dan para pelajar. Berikut adalah komponen utama yang perlu ada dalam laporan: Apa yang pelajar telah belajar dan keberkesanan sekolah. Dalam erti kata lain nisbah pelajar memenuhi hasil pembelajaran atau objektif.o Peratus jangkaan memenuhi sepenuhnyao Peratus ketara jangkaan mesyuarato Peratus ketara gagal memenuhi jangkaan Data demografi yang membantu menerangkan warga sekolah dan mengenal pasti masalah atau keperluan khas (contohnya, kadar mobiliti, nisbah pelajar dari keluarga berpendapatan rendah). Penunjuk lain keberkesanan sekolah (contohnya, kehadiran, keciciran dan kadar pengijazahan; anugerah akademik; kepuasan), Analisis menunjukkan nisbah pelajar dalam pelbagai kumpulan (misalnya, tahap pendapatan, kumpulan minoriti, pelajar kurang upaya) yang memenuhi objektif / hasil,

9.10 BAGAIMANA BENTUK FORMAT LAPORAN ?

Page 9: chapter 9

Format laporan penilaian akan mempengaruhi motivasi pembaca untuk membaca laporan itu dan juga persepsi bahawa pembaca memperolehi daripada laporan . Mata yang perlu dipertimbangkan apabila mereka bentuk laporan : Tahap detailo Beberapa penonton mungkin lebih suka ringkas , ringkasan mudah untuk dibacao Sesetengah pembaca ingin terperinci.o Boleh menjadi perlu untuk menyediakan laporan yang berbeza untuk penonton yang berbeza . Elakkan hasil laporan yang boleh dikaitkan dengan individu guru . Kecenderungan untuk pembaca untuk mentafsir keputusan sebagai petunjuk keberkesanan guru individu . Tentukan sama ada setiap hasil pembelajaran sentiasa dilaporkan secara berasingan atau sekiranya mereka berkelompok Tentukan jika setiap gred sentiasa dilaporkan secara berasingan Carta , graf , dan jadual yang akan digunakano bantuan Visual digunakan untuk menyampaikan maklumat dengan lebih berkesan dan bermakna daripada teks .

o bantuan Visual harus digunakan dengan berhati-hati kerana carta dan graf kadang-kadang mengelirukan ( contohnya skala yang digunakan adalah jauh lebih kecil daripada julat markah pada ujian a) Perlu ada keseimbangan antara carta , graf , dan jadual kepada tekso Sesetengah orang lebih suka untuk memeriksa carta , graf , jadual atau untuk mendapatkan maklumat kuantitatif .o Sesetengah orang mungkin bosan apabila maklumat diulangi dalam teks.o Sesetengah orang memerlukan maklumat kontekstual yang dibentangkan apabila nombor yang terdapat dalam teks .

Contoh:Carta pai adalah cara terbaik untuk menunjukkan bahagian keseluruhannya. Mereka menekankan penemuan umum, tetapi tidak menunjukan perbezaan kecil dengan jelas. Carta pai dengan lebih daripada lima atau enam keping harus dielakkan. Atas sebab ini, carta pai hanya digunakan dengan data berkategori dengan bilangan kecil nilai atau kategori. Gunakan carta bar apabila anda menunjukkan beberapa kategori.

Contoh:Carta Bar sering digunakan untuk membandingkan perbezaan antara kumpulan. Carta ini , seperti carta pai, juga digunakan dengan data berkategori, dan boleh menggambarkan sehingga kira-kira 15 kategori dengan sangat berkesan. Carta Bar membuakan perbezaan kecil di antara kategori mudah dikenali.Pilihan format laporan mestilah berasaskan kepada bahan di dalam laporan dan penonton. Laporan penuh boleh berguna kepada penonton yang berminat dalam butir-butir penilaian. Mereka juga boleh berfungsi rekod selengkap aktiviti penilaian. Ringkasan penilaian digunakan untuk mengetengahkan penemuan tertentu, untuk memberi tumpuan kepada isu-isu tertentu, dan untuk meringkaskan aktiviti penilaian untuk penonton tidak cenderung untuk membaca laporan penuh. Keputusan juga boleh digunakan dalam nota penilaian, brosur, risalah atau untuk publisiti projek penilaian atau mencari atau menonjolkan sesuatu program. Web pelaporan menyediakan akses mudah untuk pelbagai khalayak , membuat data tertentu yang ada dan interaktif , dan membolehkan penonton untuk menjawab soalan yang disesuaikan . Data adalah untuk dibentangkan sebagai perbandingan dengan piawaian dan jangkaan atau dengan keputusan dari tahun-tahun sebelumnya ; atau dengan penilaian negeri atau ujian norma - dirujuk komersial Penyata mengenai mengapa beberapa pelajar tidak memenuhi hasil / objektif , dan perihal usaha-usaha untuk meningkatkan pembelajaran pelajar ( masa depan , semasa , atau sebelumnya ) . Panjang laporan - Elakkan membuat laporan yang panjang di mana hanya beberapa orang sahaja yang akan membacanya.

Page 10: chapter 9

Untuk memudahkan menyusun pembacaan dan laporan indeks supaya pembaca boleh mencari maklumat yang mereka perlukan dengan cepat Anda harus sedar tentang apa yang setiap ahli penonton ingin tahu dan apa yang anda mahu mereka tahu . Peranti yang berkesan adalah mengandungi ringkasan eksekutif beserta halaman atau nombor bab rujukan dan isi kandungan yang terperinci.

9.11 Bagaimana Maklumat Dalam Laporan Digunakan?

Orang yang menggunakan hasil penilaian sering membuat kesimpulan tentang domain kandungan yang lebih luas daripada yang sebenarnya termasuk dalam penilaian. Sebagai contoh, mereka boleh membuat kenyataan mengenai pencapaian pelajar dalam sejarah dunia, sains alam sekitar berdasarkan kepada jawapan kepada beberapa soalan ujian dipaksa-pilihan. Atau, mereka boleh membuat kenyataan umum mengenai kemahiran menulis pelajar berdasarkan maklum balas kepada gesaan tunggal yang memerlukan penjelasan penulisan kebolehan artistik berdasarkan lukisan krayon rumah. Contoh-contoh ini jelas mewakili generalisasi yang tidak munasabah. Terdapat generalisasi lain yang tidak wajar dan mendapati ia adalah terlambat di mana tidak ada penilaian yang mencukupi untuk semua pelajar. Sumber-sumber ralat mungkin berbeza-beza dari satu keadaan ujian yang lain. Jika ralat yang terhasil daripada sumber-sumber maklumat yang berbeza - seperti pelbagai jenis prosedur penilaian - adalah rawak, mereka mungkin untuk mengimbangi satu sama lain. Atas sebab ini, tafsiran dan penilaian penggunaan mungkin akan bertambah baik jika mereka adalah berdasarkan kepada pelbagai sumber maklumat. Pelbagai sumber maklumat juga membantu mengimbangi kekurangan maklumat yang tidak melindungi kandungan yang dinilai secara menyeluruh (Freeman dan Lewis. 1998). Ia berlaku kerana, seperti yang dibincangkan dalam bahagian sebelum ini mengenai generalisasi, penilaian yang dibuat ringkas dan meliputi hanya sebahagian kecil daripada kandungan. Atau, mungkin kandungan yang termasuk kedua-dua pengetahuan dan kemahiran, dan pelbagai jenis prosedur penilaian (seperti ujian kertas-dan-pensil dan pemeriksaan berasaskan prestasi) harus digunakan dengan bahagian-bahagian yang berlainan itu. Sekali lagi, pelbagai sumber maklumat perlu membolehkan pendidik untuk membuat tafsiran yang lebih sah dan meluas kegunaannya.Sebagai contoh, seseorang itu boleh menarik lebih kukuh kesimpulan tentang pengetahuan dan kemahiran pelajar yang berkaitan dengan perang saudara dari keputusan beberapa penilaian yang setiap tertumpu kepada aspek peperangan. Penilaian adalah beberapa jenis, seperti aneka pilihan atau padanan ujian dan esei tentang sebab-sebab perang, keadaan sosial semasa atau kesan pada negara. Bersama-sama, penilaian dilindungi perang secara komprehensif . Penilaian berasaskan prestasi berganda mungkin digunakan - sebagai contoh , yang memerlukan pelajar untuk penilaian tahap hanya setelah menentukan bahawa penggunaan yang demikian adalah sesuai. Fakulti , kakitangan dan pentadbir yang terlibat dalam perancangan penilaian akan lebih cenderung untuk menggunakan hasil . Penemuan perlu dikongsi dengan ahli jabatan fakulti dalam satu laporan bertulis yang boleh digunakan untuk menjana perbincangan dalam mesyuarat fakulti permukiman tahunan . ( Apakah laporan yang memberitahu anda mengenai kursus atau program ? Apakah perubahan yang mungkin dinyatakan ? Bagaimana jabatan kami boleh menggunakan keputusan ini dengan sebaik-baiknya ? ) Laporan tambahan atau persembahan boleh disediakan untuk penonton yang berbeza , bergantung kepada penilaian keperluan mereka .

9.12 Kerahsiaan

Kerahsiaan adalah amat penting dalam laporan keputusan penilaian . Siapakah yang akan mempunyai akses kepada keputusan ? Laporan terbuka mungkin akan sesuai jika taksiran memberi tumpuan kepada program universiti - lebar dan keputusan akan dikumpulkan di peringkat universiti . Melaporkan kepada pengarah program hanya boleh menjadi yang paling sesuai jika taksiran memberi tumpuan kepada memperbaiki sesuatu program . Pasukan penilaian mesti mengambil berat dengan kerahsiaan peserta , juga . Data perlu diagregatkan untuk melindungi individu dan komen dan maklum balas kaji selidik terbuka disemak semula untuk menghapuskan pengenalan individu .

Page 11: chapter 9

10.1 AKTIVITIa) Apakah jenis laporan penilaian yang disediakan oleh institusi anda ?b ) Bagaimanakah maklumat dalam penilaian yang digunakan ?c ) Siapakah yang menggunakan maklumat di dalam laporan penilaian?

RINGKASAN Statistik adalah sains matematik yang berkaitan dengan analisis , tafsiran dan persembahan data . Data kumpulkan mengenai pelajar boleh tertakluk kepada analisis statistik , yang mempunyai dua tujuan yang berkaitan : deskriptif dan inferens .

Istilah "kecenderungan memusat" merujuk kepada nilai "tengah" dan dikira dengan menggunakan min, median dan mod. Ia adalah petunjuk lokasi markah. min ini adalah semata-mata hasil tambah semua nilai (markah) dibahagikan dengan jumlah bilangan item (pelajar) dalam set. Julat skor dalam ujian merujuk kepada markah yang paling rendah dan paling tinggi yang diperolehi dalam ujian. sisihan standard merujuk kepada berapa banyak melakukan skor yang diperoleh pelajar menyimpang atau menangguhkan daripada min. Skew merujuk kepada simetri pengagihan. A pencong negatif mempunyai ekor yang lebih panjang ke arah yang negatif. A pencong positif mempunyai ekor yang lebih panjang ke arah yang positif. Rata standard merujuk kepada skor mentah yang telah ditukarkan dari satu skala untuk skala yang lain dengan menggunakan min dan sisihan piawai. Z markah memberitahu berapa sisihan piawai dari min skor yang terletak. Rata-T adalah skor yang seragam dengan min 50 dan sisihan piawai 10. Keluk normal (juga dikenali sebagai "lengkung loceng") adalah lengkung bayangan yang sepatutnya mewakili semua fenomena yang berlaku semula jadi. Dalam penilaian norma-dirujuk, individu "prestasi dinilai berhubung dengan orang lain" s persembahan. Norma adalah ciri-ciri penduduk dianggarkan dengan tepat daripada ciri-ciri subset wakil penduduk (dikenali sebagai sampel atau sampel norma). Penggunaan dirancang dan aktif keputusan ujian adalah satu bahagian penting dalam proses pengajaran. Tujuan laporan penilaian ini adalah untuk meningkatkan keputusan dan membantu sekolah atau institusi untuk meningkatkan dan membantu pelajar mempelajari lebih lanjut. Pendidik teliti perlu mereka bentuk dan menyediakan laporan mengenai hasil penilaian. Apabila menyediakan laporan penilaian, perlu sedar siapakah penontonnya.

Format laporan penilaian akan mempengaruhi motivasi pembaca untuk membaca laporan dan persepsi mereka yang didapati dari laporan tersebut . Orang yang Menggunakan hasil Penilaian Sering Membuat Kesimpulan tentang domain kandungan yang lebih luas daripada yang terkandung di dalam penilaian . Kerahsiaan adalah amat penting dalam laporan keputusan penilaian