statistik parametrik dan nonparametrik

17
STATISTIK PARAMETRIK DAN NONPARAMETRIK 1. Statistik Parametrik Parametrik adalah ujian statistik yang melibatkan data normal, sebagaimana data dalam populasi untuk menganggar parameter. Oleh itu, operasi yang melibatkan data normal dinamakan statistik parametrik. Sebaliknya jika data tidak normal, dinamakan bukan parametrik (nonparametric). Sebab itu ujian parametrik perlukan beberapa andaian (assumption) dipenuni supaya dapat menjadi penganggar kepada parameter / populasi, khususnya syarat kernormalan. Contoh kaedah statistik parametrik diantaranya adalah uji-z (1atau 2 sampel ), uji-t (1 atau 2 sampel), korelasi pearson,perancang percubaan (2-way ANOVA), dan lain-lain. 2. Statistik Non Parametrik Statistik non parametrik disebut juga statistic bebas sebaran. Statistik non parametrik tidak mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik boleh digunakan pada data yang mempunyai sebaran normal atau tidak. Statistik nonparametrik biasanya digunakan untuk melakukan analisis pada data muka atau ordinal. Contoh kaedah statistik

Upload: ismi-izmi

Post on 31-Oct-2015

968 views

Category:

Documents


1 download

DESCRIPTION

huhu

TRANSCRIPT

Page 1: Statistik Parametrik Dan Nonparametrik

STATISTIK PARAMETRIK DAN NONPARAMETRIK

1. Statistik Parametrik

Parametrik adalah ujian statistik yang melibatkan data normal, sebagaimana data dalam 

populasi untuk menganggar  parameter. Oleh itu, operasi yang melibatkan data normal 

dinamakan statistik parametrik. Sebaliknya jika data tidak normal, dinamakan bukan

parametrik (nonparametric). Sebab itu ujian parametrik perlukan  beberapa andaian 

(assumption) dipenuni supaya dapat menjadi penganggar kepada parameter / populasi, 

khususnya syarat kernormalan. Contoh kaedah statistik parametrik diantaranya adalah uji-z 

(1atau 2 sampel ), uji-t (1 atau 2 sampel), korelasi pearson,perancang percubaan (2-way 

ANOVA), dan lain-lain.

2.  Statistik Non Parametrik

Statistik non parametrik disebut juga statistic bebas sebaran. Statistik non parametrik tidak 

mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik boleh digunakan 

pada data yang mempunyai sebaran normal atau tidak. Statistik nonparametrik biasanya 

digunakan untuk melakukan analisis pada data muka atau ordinal. Contoh kaedah statistik 

nonparametrik diantaranya adalah Chi-square test, Median test, Friedman test, dan lain-lain

3. Langkah-Langkah Pemilihan Kaedah Statistik

Bilakah kaedah statistik nonparametrik digunakan? Kaedah ujian ini digunakan apabila salah 

satu syarat dalam statistik  parametrik tidak dipenuhi.  Syarat-syarat yang perlu diperhatikan 

untuk menentukan statistik  apa yang akan digunakan dalam analisis, iaitu:

Page 2: Statistik Parametrik Dan Nonparametrik

1. Apakah pengedaran data diketahui? Jika pengedaran data tidak diketahui maka statistik 

yang sesuai adalah statistik nonparametrik. Jika pengedaran data diketahui ,maka kita 

harus melihat jenis pengedaran data tersebut.

2. Apakah data berdistribusi normal? Jika data tidak berdistribusi normal, maka statistik 

yang sesuai adalah statistik nonparametrik. Jika data berdistribusi normal,maka statistik 

yang sesuai adalah statistik parametric

3. Apakah sampel ditarik secara random? Jika sampel tidak ditarik secara random, maka 

statistik yang sesuai adalah statistik nonparametrik. Jika sampel ditarik secara random, 

maka statistik yang sesuai adalah statistik parametrik.

4. Apakah varians kumpulan sama? Jika varians kumpulan tidak sama, maka statistik yang 

sesuai adalah statistik nonparametrik. Jika varians kumpulan sama,maka statistik yang 

sesuai adalah statistik parametric

5. Bagaimana jenis skala pengukuran data? Jika skala pengukuran data nominal dan 

ordinal, maka statistik yang sesuai adalah statistik nonparametrik. Jika skala pengukuran 

data selang dan nisbah, maka statistik yang sesuai adalah statistik parametrik. Langkah-

langkah pemilihan kaedah statistik dapat dilihat pada Gambar 1

Page 3: Statistik Parametrik Dan Nonparametrik

Rajah 1: Carta alir langkah-langkah pemilihan kaedah statistic

DataDistribusi populasi 

diketahui??

Tidak

Tidak

Tidak

Tidak

Ya

Ya

Ya

Ya

Distribusi populasi normal??

Sampel ditarik secara 

random???

Varians kelompok sama??

Skala

pengukuran??

Selang dan Nisbah

STATISTIK

Parametrik

Muka dan Ordinal

STATISTIK

BUKAN PARAMETRIK

Page 4: Statistik Parametrik Dan Nonparametrik

Selain sebaran, salah satu penunjuk penggunaan kaedah statistik parametrik atau 

nonparametrik adalah jenis data. Pengedaran normal merupakan sebahagian daripada 

pengedaran kebarangkalian yang berterusan (continuous probability distribution). Oleh itu 

skala pengukurannya pun haruslah berterusan. Jenis data yang mempunya iskala ukuran yang 

berterusan adalah data nisbah dan selang .Kerana dalam pemilihan kaedah statistik jenis data 

merupakan salah satu penunjuk, maka perlu dijelaskan kembali pengertian dan jenis-jenis data.

JENIS JENIS DATA:

Page 5: Statistik Parametrik Dan Nonparametrik

JENIS JENIS DATA Umumnya data dibahagikan kepada 2 jenis iaitu Data Kuantitatif dan Data 

Kualitatif Data Kuantitatif - data yang diukur dengan nilai numerik seperti tinggi, berat, halaju, 

pendapatan dll Data ini dapat dipecahkan kepada dua- data diskrit dan data selenjar. Data 

diskrit hanya mengambil nilai tertentu berbentuk angka bulat seperti bilangan anak, kereta dll 

Bil. anak = 3 orang Pelajar = 56 orang

Data selenjar boleh mengambil apa-apa nilai di dalam sesuatu selang (perpuluhan atau 

pecahan) seperti jumlah pendapatan, tinggi, berat dll. Tinggi = 1.67 m Pendapatan = RM 

1575.35 CGPA = 3.75 Data Kualitatif – data yang merujuk kepada jenis, sifat atau pangkat 

sesuatu perkara seperti jantina, bangsa, jenama pakaian dan sebagainya. Data ini tidak diukur 

atau dinyatakan di dalam bentuk angka/nombor Bangsa = Melayu Jantina = lelaki

JENIS SKALA UKURAN DATA:

Data dikumpul atau dicerap di dalam pelbagai skala ukuran. Teknik menganalisis dan 

memaparkan sesuatu data bergantung kepada skala ukuran data tersebut. Kesilapan memilih 

teknik analisis dan memaparkan data terhadap jenis data yang tidak sesuai akan membawa 

kepada ralat yang tidak disedari. Skala ukuran data boleh dibahagikan kepada 4 jenis ukuran 

iaitu Skala Norminal , Skala Ordinal , Skala Intervel (Selang) dan Skala Ratio (Nisbah)

Skala Norminal:

Data norminal ialah data yang dikelaskan kepada kumpulan tertentu atau kategori nilai. 

Contohnya jantina responden dikelaskan kepada 2 kategori iaitu lelaki dan perempuan. Pada 

Page 6: Statistik Parametrik Dan Nonparametrik

kebiasaanya, data jantina ini diberi kod angka atau label iaitu 1 bagi lelaki dan 2 bagi 

perempuan. Kod 1 dan 2 ini hanyalah sebagai label semata-mata dan tidak memiliki apa-apa 

erti. Oleh itu operasi- operasi matematik tertentu seperti min, sisihan piawai dan sebaianya 

tidak boleh digunakan terhadap data jenis ini

Skala Ordinal:

Skala Ordinal Skala ordinal tidak hanya mengkelaskan data kedalam kumpulan, tetapi juga 

meletakan pangkat terhadap kumpulan tersebut. Contohnya: Kumpulan kereta Pangkat (1 

paling disukai) SUV 1 Pancuan 4 roda 2 Sedan 3 Mini 4 Kumpulan kereta SUV lebih disukai 

daripada Pacuan 4 roda dan kumpulan kereta Sedan lebih disukai daripada Mini (perbezaan 

satu pangkat).

Walaupun perbezaan antara MPV dengan Pancuan 4 roda dan Sedan dengan Mini adalah sama 

(perbezaan satu pangkat sahaja), kita dapat mengatakan bahawa nilai atau tahap perbezaan 

tersebut adalah sama. Kategori nilai pangkat tidak menggambarkan perbezaan yang sama 

(equal differences) dari segi ukuran atribut. Variabel atau pemboleh ubah yang diukur dengan 

skala Norminal dan Ordinal biasanya dikenali bukan metrik ( non-metrik/non-parametrik).

Skala Interval/Selang:

Nilai yang dicerap/kumpul di dalam nilai asal sebenar Contohnya umur – perbezaan umur 

antara 90 tahun dengan 89 tahun dan antara 14 tahun dengan 13 tahun adalah sama (iaitu 

setahun). Tiap-tiap satu unit perbezaan membawa makna yang sama tanpa mengira di mana 

Page 7: Statistik Parametrik Dan Nonparametrik

ukuran tersebut berada Dalam ukuran selang, kita dapat menerangkan bukan sahaja siapa yang 

lebih tinggi kedudukannya, malah dapat menunjukkan sejauh manakah perbezaan kedudukan 

tersebut (berapa unit).

Skala Ratio:

Nilai yang dikumpul/cerap di dalam nilai asal sebenar Apa yang membezakan dengan ukuran 

Intervel ialah ukuran Ratio mempunyai nilai dasar atau nilai sifar dan kebiasaanya tidak 

mempunyai nilai negatif. Seseorang tidak boleh menyatakan bahawa beratnya ialah kurang dari 

sifar (negatif) atau pendapatnya adalah negatif (kalau berhutang macam mana ???) Skala 

Interval dan Ratio sering menimbulkan kekeliruan (contohnya umur) dan terdapat pengkaji 

yang mengandaikan ukuran Intervel dan Ratio sebagai satu satu kumpulan ukuran data sahaja.

Statistik Deskriptif:

Satu kaedah yang digunakan untuk memerihalkan taburan sesuatu data Terdapat 2 ukuran 

yang digunakan untuk memerihalkan taburan sesuatu data iaitu Ukuran Kecenderungan 

Memusat dan Ukuran Sukatan Ubahan Ukuran Kecenderungan Memusat yang selalu digunakan 

ialah min, mod dan median Ukuran Sukatan Ubahan yang selalu diguna ialah varians, sisihan 

piawai dan julat

MIN/PURATA:

Nilai yang diperolehi daripada hasil bahagi jumlah semua nilai dengan bilangan kes Ianya bukan 

suatu angka mutlak tapi anggaran semata-mata. Kebiasaanya terdapat dua jenis min iaitu min 

Page 8: Statistik Parametrik Dan Nonparametrik

bagi populasi dan min bagi sampel. Min sampel boleh dinyatakan seperti berikut : min sampel = 

∑x n Di mana ∑x = jumlah semua nilai-nilai n = ialah bilangan sampel X

Data Menurut Sumbernya

Berdasarkan sumbernya, data dapat digolongkan menjadi:

a. Data dalaman dan data luaran.

Data dalaman iaitu data yang berpunca dari dalam organisasi. Data luaran yaitu data yang 

berpunca dari luar organisasi.

b. Data primer dan data sekunder

Data primer adalah data yang diperoleh melalui survey lapangan dengan menggunakan kaedah 

pengumpulan data tertentu. Data sekunder adalah data yang telah dikumpulkan oleh lembaga 

pengumpul data dan diterbitkan kepada masyarakat pengguna data. Data sekunder akan lebih 

mempermudah dan mempercepat jalannya penyelidikan. Namun kerana umumnya data 

sekunder dimaksudkan untuk pengguna penyelidik dalam jumlah yang besar, seringkali data 

yang tersedia tidak sesuai dengan keinginan penyelidik. Hal yang sering dikeluhkan apabila kita 

menggunakan data sekunder adalah: 

(1) ragam data statistik yang tersedia semakin banyak tetapi kelompok data yang diperlukan 

bagi suatu kajian sering tidak cukup; 

(2) Data runtut waktu tidak  konsisten dan tidak selalu dapat dipertahankan; 

(3) angka-angka mengenai masalah tertentu yang dikeluarkan oleh pelbagai sumber rasmi 

tidak konsisten satu sama lain. Uji keboleh percayaan data, penyederhanaan, agregasi, dan 

penyesuaian mutlak diperlukan agar diperoleh hasil yang dapat dipertanggungjawabkan

Page 9: Statistik Parametrik Dan Nonparametrik

KLASIFIKASI DATA DAPAT DIPERHATIKAN DALAM RAJAH DI BAWAH:

Statistik Parametrik

 Parametrik bermakna parameter. Parameter adalah penunjuk dari suatu pengedaran hasil 

pengukuran. Indikator dari pengedaran pengukuran berdasarkan statistik parametrik digunakan 

untuk parameter dari pengedaran normal.  Apa yang dimaksudkan dengan pengedaran 

Page 10: Statistik Parametrik Dan Nonparametrik

normal? Bagaimana mengetahui sebuah data berdistribusi normal atau tidak? Hal ini penting 

sekali untuk diketahui kerana berdasarkan normal atau tidaknya pengedaran ini baru dapat 

ditentukan apakah uji statistik parametrik atau nonparametrik yangdigunakan. Distribusi 

normal dikenal juga dengan istilah Gaussian Distribution. Pengedaran normal mengandung dua 

parameter, iaitu rata-rata (mean =    M, varians= S2). Parameter-parameter ini memberikan ciri-

ciri yang unik pada suatu pengedaran  berdasarkan "Lokasi"-Nya (central tendency). Pelbagai 

kaedah statistik bergantung kepada kedua parameter tersebut. Penggunaan kaedah statistik 

parametrik mengikuti prinsip-prinsip pengedaran normal. Prinsip-prinsip dari pengedaran 

normal adalah:

a.Pengedaran dari suatu sampel yang dijadikan objek pengukuranberasal dari pengedaran 

penduduk yang diandaikan terdistribusisecara normal.

b.Sampel diperoleh secara random, dengan jumlah sampel yangdianggap dapat mewakili 

populasi.

c.Pengedaran normal merupakan sebahagian daripada pengedaran kebarangkalianyang 

berterusan (continuous probability distribution). Impilkasinya, skala pengukuran pun harus 

berterusan. Skala ukuran yang berterusan adalah skala nisbah dan selang. Kedua skala ini 

memenuhi syarat untuk menggunakan uji statistik parametric. Bila syarat-syarat ini semua 

dipenuhi, maka kaedah statistik parametrik boleh digunakan

Statistik nonparametrik

Istilah nonparametrik pertama kali digunakan olehWolfowitz, pada tahun 1942. Kaedah statistik 

nonparametrik merupakan kaedah statistik yang boleh digunakan dengan mengabaikan 

andaian-andaian yang melandasi penggunaan kaedah statistik parametrik, terutama yang 

Page 11: Statistik Parametrik Dan Nonparametrik

berkaitan dengan pengedaran normal. Istilah lain yang sering digunakan untuk 

statistik nonparametrik adalah statistik bebas pengedaran (distribution-free statistics) Dan uji 

bebas andaian (assumption-free test). Statistik nonparametrik banyak digunakan pada 

penelitian-penelitian sosial. Data yang diperolehi dalam kajian sosial pada umumnya berbentuk 

kategori atau berbentuk rangking. Uji statistik nonparametrik ialah suatu uji statistik yang tidak 

memerlukan adanya andaian-andaian mengenai sebaran datapenduduk. Uji statistik ini disebut 

juga sebagai statistik bebas sebaran (distribution free). Statistik nonparametrik 

tidak mensyaratkan bentuk sebaran parameter populasi berdistribusi normal. Statistik 

nonparametrik boleh digunakan untuk menganalisis data yang berskala muka atau ordinal 

kerana pada umumnya data berjenis muka dan ordinal tidak merebak normal. Dari segi jumlah 

data, pada umumnya statistic  nonparametrik  digunakan untuk data berjumlah kecil (n <30).

Kelebihan Statistik Nonparametrik

Kelebihan statistik nonparametrik diantaranya:

1) Andaian dalam uji-uji statistik nonparametrik relatif lebih longgar. Jika ujian data 

menunjukkan bahawa salah satu atau beberapa andaian yang mendasari uji statistik 

parametric (Misalnya mengenai sifat pengedaran data) tidak dipenuhi, maka statistik 

nonparametrik lebih sesuai diterapkan dibandingkan statistik parametrik.

2) Perhitungan-perhitungannya dapat dilaksanakan dengan cepat dan mudah, sehingga 

hasil penelitian segera dapat disampaikan.

3)  Untuk memahami konsep-konsep dan kaedah-kaedah tidak memerlukan asas 

matematik serta statistic yang mendalam.

Page 12: Statistik Parametrik Dan Nonparametrik

4) Ujian pada statistik nonparametrik dapat diterapkan jika kita menghadapi  keterbatasan 

data yang tersedia, misalnya jika data telah diukur menggunakan skala ukuran yang 

lemah (muka atau ordinal).

5) Kecekapan statistik nonparametrik lebih tinggi berbanding dengan kaedah parametrik 

untuk jumlah sampel yang sedikit.

Kelemahan Statistik Nonparametrik

Disamping kelebihan, statistik nonparametrik juga mempunyai kelemahan. Beberapa 

kelemahan statistik nonparametrik antara lain:

1)  Jika andaian uji statistik parametrik dipenuhi, penggunaan ujian nonparametrik akan 

menyebabkan pembaziran maklumat walaupun lebih cepat dan mudah.

2) Jika jumlah sampel besar, tahap kecekapan nonparametrik relative  lebih rendah 

berbanding dengan kaedah parametrik.

3) Statistik nonparametrik tidak dapat dipergunakan untuk membuat ramalan (peramalan).