data kontingensi (1).ppt

44

Upload: sci

Post on 08-Dec-2015

51 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: data kontingensi (1).ppt
Page 2: data kontingensi (1).ppt

Membezakan ujikaji multinomial dan binomial

Mengira nilai jangkaan bagi jadual kontigensi

Mengira statistik khi-kuasadua dan darjah kebebasannya yang sesuai.

4.Mengenalpasti jenis ujian yang digunakan untuk menguji hipotesis iaitu ujian kebagusan penyesuaian, ujian ketaksandaran dan ujian homogen

OBJEKTIF

Page 3: data kontingensi (1).ppt

Ujikaji multinomial

Cara takrifan eksperimen multinomial sama cara kita menakrifkan eksperimen Binomial, kecuali eksperimen multinomial mempunyai lebih daripada dua kategori

Page 4: data kontingensi (1).ppt

Ujikaji Multinomial

• Bilangan percubaan adalah tetap• Percubaan adalah tidak bersandar• Semua kesudahan bagi setiap percubaan mestilah diklasifikasikan ke dalam hanya satu daripada pelbagai kategori.• Kebarangkalian untuk kategori yang berbeza adalah tetap.•Contoh: Lontar sebiji dadu sebanyak 100 kali (6 kategori 100 cubaan )

Page 5: data kontingensi (1).ppt

Ujian Kebagusan Penyesuaian

Ujian ini hanya menguji satu pembolehubah populasi sahaja (univariate). •Tujuan ujian ini ialah untuk menguji sama

ada taburan yang dicerap mengikut taburan tertentu (taburan jangkaan) atau sesuai dengan suatu set data.

Page 6: data kontingensi (1).ppt

Andaian

Data dipilih secara rawak.Data tertabur normalData sampel mengandungi jumlah

kekerapan untuk setiap kategoriNilai frekuensi yang dijangka (E) mestilah sekurang-kurangnya 5

(E 5)

Page 7: data kontingensi (1).ppt

Ujian Kebagusan Penyesuaian

O Mewakili frekuensi tercerap

E Mewakili frekuensi jangkaan, E = np

k Mewakili bilangan kategori

n Mewakili jumlah bilangan cubaan

Di dalam ujian kebagusan penyesuaianDk = (k-1)

k = bilangan kategori

Kawasan penolakan hanyalah di hujung

kanan taburan khi-kuasadua

j

2jj2

E

EOχ

Statistik Ujian

Page 8: data kontingensi (1).ppt

Prosedur Menjalankan Ujian Kebagusan Penyesuaian 1.     Tentukan hipotesis

H0 : Populasi mengikut taburan tertentu.

(Atau H0 : p1=p2=…=pk )

H1 : Populasi tidak mengikut taburan tertentu

(Atau H1 : sekurang-kurangnya terdapat satu kebarangkalian berbeza )

2.    Dapatkan frekuensi jangkaan Ej = npj bagi setiap kategori pembolehubah kajian, (pastikan memenuhi E 5 ) Di mana n = bilangan sampel dan

pj = kebarangkalian kategori menurut H0

Page 9: data kontingensi (1).ppt

3. Tentukan aras keertian dan tentukan kawasan kritikal di hujung kanan taburan Nilai kritikal = dengan dk = k – 1dan k = bilangan kategori pembolehubah kajian.

2χ2

dkα,χ

4. Dapatkan statistik ujian

5. Keputusan dan Kesimpulan

Page 10: data kontingensi (1).ppt

Contoh : Satu kajian telah dibuat berkaitan kemalangan di kilang W. Data yang diperolehi telah diringkaskan di dalam jadual di bawah. Uji dakwaan bahawa kemungkinan berlaku kemalangan setiap hari bekerja adalah sama

Hari Isnin Selasa

Rabu Kha Jum

Bil. kemalangan

31 42 18 25 31

Page 11: data kontingensi (1).ppt

Penyelesaian

1.   H0 : p1 = p2 = p3 = p4 = p5 = 1/5

H1 : sekurang-kurangnya satu kebarangkalian adalah tak sama dgn 1/5.

3. Tentukan = 0.05 , darjah kebebasan=4

Nilai kritikal = 20.05,4 = 9.488

2.  Frekuansi jangkaan untuk setiap hari ialah E = 147 * (1/5) = 29.4 > 5

Page 12: data kontingensi (1).ppt

Pengiraan:Hari O E (O-E)2/EIsn 31 29.4 0.0871Sel 42 29.4 5.4Rabu 18 29.4 4.4204Kha 25 29.4 0.6585Jum 31 29.4 0.0871

2 = 10.6531

5. Keputusan dan Kesimpulan :Tolak Ho kerana 10.6531 > 9.488.

Berdasarkan sampel yg diambil, terdapat cukup bukti untuk membuat kesimpulan bahawa kadar kemalangan berlaku setiap hari adalah tidak sama utk = 0.05

4. Statistik ujian 2 = [( Oj – Ej )2/Ej]

Page 13: data kontingensi (1).ppt

Kaedah Nilai-p Rujuk jadual taburan 2 untuk mendapatkan nilap-p .Iaitu nilai-p untuk statistik ujian 2 = 10.6531 dengan dk = 4 terletak antara 9.488 dan 11.143.

• 9.488 < 10.6531 < 11.143

• 0.025 < nilai-p < 0.05

• Oleh kerana nilai-p < 0.05 , tolak H0

• Buat kesimpulan seperti sebelum ini.

Page 14: data kontingensi (1).ppt

ContohTahap pendidikan yang dimiliki oleh wanita daripada sebuah kawasan luar bandar dibahagikan kepada tiga kategori: mempunyai sijil SPM; diploma; ijazah. Seorang pakar demografi menganggar bahawa 28% daripada mereka mempunyai sijil SPM, 61% mempunyai diploma dan 11% mempunyai ijazah. Untuk membuktikan peratusan ini, sampel rawak n=100 wanita telah dipilih dari kawasan tersebut dan tahap pendidikan mereka dicatat. Bilangan wanita bagi setiap tahap pendidikan ditunjukkan di dalam jadual berikut. Guna   = .05. Uji untuk menentukan sama ada data sampel tidak bersetuju dengan peratusan yang dianggar oleh pakar demografi.

Page 15: data kontingensi (1).ppt

Tahap pendidikan  

Sijil SPM Diploma Ijazah Jumlah

22 64 14 100

Page 16: data kontingensi (1).ppt

Penyelesaian

H0:  Kebarangkalian bagi setiap kategori p1= .28, p2= .61, p3= .11

H1: Sekurang-kurangnya dua daripada p1, p2, p3, berbeza daripada nilai yang dinyatakan di dalam hipotesis nol.

  Tahap pendidikan  

  Sijil SPM Diploma Ijazah Total

Frekuensi dicerapFrekuensi dijangka

22 (100)

(.28)=(28)

64 (100)

(61)=(61)

14 (100)

(.11)=(11)

100 100

Kira frekuensi jangkaan

Page 17: data kontingensi (1).ppt

Statistik ujian

Nilai kritikal 20.05,2 = 5.991. Kita

akan tolak H0 jika 2 > 5.991

Oleh kerana nilai statistik ujian 2 = 2.26 adalah kurang daripada 5.991, maka kita gagal tolak H0. Tidak terdapat cukup maklumat untuk menunjukkan data sampel tidak bersetuju dengan peratusan yang dianggar oleh pakar demografi.

Page 18: data kontingensi (1).ppt

LatihanSatu kajian telah dijalankan untuk menentukan sama ada kegemaran surirumah untuk berbelanja di pasaraya pada setiap hari adalah berbeza. Untuk tujuan ini 300 pelanggan pasaraya dipilih secara rawak dan ditanya hari kegemaran mereka dalam seminggu untuk berbelanja. Keputusannya adalah seperti berikut Hari Isnin Sel Rabu Kha Jum Sab Ahad

Bil. pelanggan

10 20 40 40 80 60 50

Adakah data ini boleh mengesahkan bahwa kegemaran surirumah berbelanja adalah berbeza-beza mengikut hari. ( = 0.05)

Page 19: data kontingensi (1).ppt

LatihanSatu sampel rawak bersaiz, n = 500 diperuntukkan kepada k=5 kategori seperti di jadual. Andaikan kita mahu menguji hipotesis nul bahawa kebarangkalian bagi setiap kategori ialah p1 =.1, p2 =.1, p3 =.5, p4 =.1, dan p5 =.2.

KategoriJumlah

1 2 3 4 5

27 62 241 69 101 500

Adakah data yang ada cukup untuk membuktikan bahawa hipotesis nol adalah salah?

Page 20: data kontingensi (1).ppt

Jadual kontigensi

Jadual Kontingensi atau jadual kekerapan dua – hala ialah jadual yang menunjukkan kekerapan yang menepati ciri kepada dua pembolehubah. Pembolehubah pertama digunakan untuk kategorikan baris dan pembolehubah kedua digunakan untuk kategorikan lajur .Tujuan analisis jadual kontigensi adalah untuk menentukan sama ada kebersandaran wujud di antara dua pembolehubah kualitatif.

Page 21: data kontingensi (1).ppt

  Sepenuh masa

Separuh masa

Jumlah baris

PelajarLelaki

393 248 641

PelajarPerempuan

411 368 779

Jumlah lajur

804 616 1420

Contoh Jadual Kontingensi

Page 22: data kontingensi (1).ppt

Ujian ketaksandaran Tujuan ujian ini ialah untuk menguji sama ada wujud hubungan (bersandar) di antara dua pembolehubah (bivariate) bagi satu populasi

• Contohnya kita hendak menguji sama ada sumber kepuasan kehidupan kaum lelaki bergantung kepada tahun kajian dilakukan • Pembolehubah ini perlu diklasifikasikan kepada beberapa kategori diskret dan saling menyisihkan (mutually exclusive).

Page 23: data kontingensi (1).ppt

Prosedur Menjalankan Ujian Ketaksandaran 1.     Tentukan hipotesis

H0 : pembolehubah I tidak bersandar kepada pembolehubah II

H1 : pembolehubah I bersandar kepada pembolehubah II

2.    Dapatkan frekuansi jangkaan Eij bagi setiap kategori pembolehubah kajian, (pastikan memenuhi Eij 5 )

sampelsaiz

lajur)lahbaris)(Jum(JumlahEij

Page 24: data kontingensi (1).ppt

3. Tentukan aras keertian dan tentukan kawasan kritikal di hujung kanan taburan Nilai kritikal = dengan dk = (B-1)(L-1) di mana B = bil. baris dlm. jadual kontigensi

L = bil. lajur dlm. jadual kontigensi

2χ2

dkα,χ

4. Dapatkan statistik ujian

5. Keputusan dan Kesimpulan

ij

2ijij2

E

EOχ

Oij = kekerapan yg dicerap utk baris ke i , lajur ke j

Eij = kekerapan yg dijangka utk baris ke i , lajur ke j

Page 25: data kontingensi (1).ppt

Contoh :

   

Lelaki 1990

Lelaki 2001

  

Pekerjaan 

65 

25

  

Keluarga 

42 

68

  

Lain – lain 

13 

17

Jumlah 

120

110

Jumlah 90 110 30 230

Sumber Kepuasan Hidup

Satu kajian pada tahun 1990 telah dijalankan terhadap 120 lelaki berkahwin dan berumur 30-45 thn mengenai sumber kepuasan hidup mereka. Kajian yg sama dijalankan pula terhadap 110 lelaki berkahwin pada tahun 2001. Maklumat yg diperolehi diringkaskan di dlm jadual kontigensi di bawah. Uji sama ada sumber kepuasan kehidupan lelaki telah berubah atau sebaliknya. (guna = 0.05)

Page 26: data kontingensi (1).ppt

Penyelesaian

1.   H0 : Sumber kepuasan hidup lelaki tidak bersandar kepada tahun kajian

H1 :Sumber kepuasan hidup lelaki bersandar kepada tahun kajian

    Lelaki 1990

  Pekerjaan  O11 = 65E11= 46.96

  Keluarga O12 = 42E12 = 57.39

  Lain-lain O13 = 13E13=15.65

Jumlah  120

Lelaki 2001 O21 = 25E21= 43.04

O22 = 68E22 = 52.61

O23 = 17E23=14.35

110

Jumlah 90 110 30 Jum = 230

Sumber Kepuasan Hidup

2. Frekuensi jangkaan

Page 27: data kontingensi (1).ppt

3. Aras keertian = 0.05

nilai kritikal 20.05,2

= 5.991 di mana dk = ( B – 1)(L – 1)

= ( 2 – 1) (3 – 1) = 2

4. Statistik ujian 2 = [ ( Oij – Eij )2 / Eij]

Page 28: data kontingensi (1).ppt

Pengiraan:O E (O-E)2/E

5. Kesimpulan :Tolak Ho kerana 24.0588 > 5.991. Oleh itu,

berdasarkan sampel yg diambil, terdapat cukup bukti untuk membuat kesimpulan bahawa taburan sumber kepuasan hidup lelaki bersandar kepada tahun kajian yang dibuat pada aras keertian 0.05. Dengan kata lain sumber kepuasan hidup lelaki telah berubah daripada tahun 1990 ke tahun 2001.

65 46.96 6.9302 42 57.39 4.127113 15.65 0.448725 43.04 7.561468 52.61 4.502017 14.35 0.4894

Jumlah : 24.0588

Page 29: data kontingensi (1).ppt

Latihan

Seramai 164 orang siswazah telah ditemubual. Maklumat dikumpul berdasarkan kelas ijazah yang diperolehi dan kategori pekerjaannya. Jadual kontigensi diberikan seperti di bawah :

Kategori Kelas Ijazah yang diperolehi

1 2 3 Jumlah

Jurutera 32 14 17 63

Akauntan 9 17 8 34

Programer 13 11 18 42

Guru 11 6 8 25

Jumlah 65 48 51 164Uji sama ada wujud hubungan di antara kategori pekerjaan dengan kelas ijazah yang diperolehi pada aras keertian 5% .

Page 30: data kontingensi (1).ppt

Tindakan yang perlu diambil jika E < 5

1) Gabung baris atau lajur yang bersesuaian

2) Buang baris atau lajur yang bersesuaian

3) Tambah saiz sampel

Page 31: data kontingensi (1).ppt

ContohBerikut adalah data 487 pemilik harta bagi Negeri Z dan status perkahwinan mereka. Kaji sama ada nilai harta (RM ‘ 000) dan status perkahwinan adalah bersandar bagi pemilik harta di Negeri Z.(Guna = 0.05)

 

Berkahwin

Bujang

Janda/Duda

Jumlahbaris

50 - < 200

227 54 63 344

200 - < 500

60 15 22 97

500 - < 1,000

20 4 7 31

> 1,000 10 2 3 15

Jumlah lajur

317 75 95 Jum: 487

Page 32: data kontingensi (1).ppt

Penyelesaian :

1) H0 : Nilai harta dan status perkahwinan pemilik harta adalah tidak bersandar H1 : Nilai harta dan status perkahwinan pemilik harta adalah bersandar

2) Kekerapan jangkaan, sampelsaiz

lajur)lahbaris)(Jum(JumlahEij

 

Contohnya untuk sel pemilik harta yang berkahwin dan mempunyai nilai harta 50 - < 200 (dalam ribu ringgit ), E11 = (344 x 317) / 487 = 223.92

Page 33: data kontingensi (1).ppt

  Berkahwin Bujang Janda/Duda

Jumlah baris

50 - < 200 O11= 227

E11=223.9

O12= 54

E12=53.0

O13= 63

E13=67.1

344

200 - < 500 O21= 60

E21=63.1

O22 = 15

E22=14.9

O23= 22

E23=18.9

97

500 – < 1,000

O31= 20

E31=20.2

O32= 4

E32=4.8

O33= 7

E33=6.0

31

>1,000 O41= 10

E41=9.8

O42= 2

E42=2.3

O43= 3

E43=2.9

15

Jumlah lajur

317 75 95 Jum = 487

Page 34: data kontingensi (1).ppt

Didapati nilai E32, E42 dan E43 adalah kurang drpd 5 Langkah yang diambil ialah :

Gabungkan nilai harta 500 - < 1,000 dan > 1,000. 

  Berkahwin Bujang Janda/Duda

Jumlah baris

50 - < 200 O11= 227

E11=223.9

O12= 54

E12=53.0

O13= 63

E13=67.1

344

200 - <500 O21= 60

E21=63.1

O22 = 15

E22=14.9

O23= 22

E23=18.9

97

500 O31= 30

E31=29.9

O32= 6

E32=7.1

O33= 10

E33=9.0

46

Jumlah lajur

317 75 95 Jum = 487

Page 35: data kontingensi (1).ppt

3) Aras keertian = 0.05 dan darjah kebebasan ialah dk = (B-1)(L-1) = (3-1)(3-1) = 4. Oleh itu berdasarkan jadual 2 , nilai kritikal ialah 9.488. Ini bermakna H0 akan ditolak jika nilai statistik ujian yang dikira adalah lebih besar drpd 9.488.

4) Statistik Ujian :

ij

2ijij2

E

EOχ

= (227-223.9)2 / 223.9 + (54-53)2 / 53 + (63-67.1)2 / 67.1 + (60-63.1)2 / 63.1 +(15-14.9)2 / 14.9 + (22-18.9)2 / 18.9 + (30-29.9)2 / 29.9 + (6-7.1)2 / 7.1 + (10-9.0)2 / 9.0 = 1.256

Page 36: data kontingensi (1).ppt

Kesimpulan: Oleh kerana statistik ujian jatuh dalam rantau penerimaan maka terdapat bukti yang cukup daripada sampel yang diambil untuk menerima H0 pada aras keertian 5%. Oleh itu, nilai harta dan status perkahwinan pemilik harta adalah tidak bersandar.

5) Didapati 1.256 < 9.488 . Terima H0 

Page 37: data kontingensi (1).ppt

Ujian Kehomogenan

• Tujuan : untuk menguji kesecaman atau keserupaan taburan bagi dua atau lebih populasi yang berbeza.

• Prosedur Ujian Kehomogenan adalah sama seperti Ujian Ketaksandaran kecuali bagi H0 dan H1 .

• H0 : nisbah(perkadaran) elemen bagi ciri yg dikaji untuk dua atau lebih populasi yang berbeza adalah sama

( H0 : p1 = p2 = …=pk ) k adalah bilangan populasi

H1 : nisbah(perkadaran) elemen bagi ciri yg dikaji untuk dua atau lebih populasi yang berbeza adalah tidak sama (H1 : sekurang-kurangnya 1 kadar populasi tidak sama)

Page 38: data kontingensi (1).ppt

Ciri-ciri Ujian Kehomogenan yg berbeza drpd Ujian Ketaksandaran :

1) Jumlah salah satu faktor iaitu sama ada lajur atau baris di dalam jadual kontigensi telah ditetapkan terlebih dahulu.

2) Terdiri daripada dua atau lebih populasi yang berbeza.

Page 39: data kontingensi (1).ppt

Contoh : Satu kajian telah dijalankan untuk mengetahui taburan pencapaian akademik penduduk di Perak dan di Johor. Oleh itu, seramai 250 penduduk Perak dan 150 penduduk Johor telah diambil sebagai sampel. Hasil kajian telah diringkaskan di dalam jadual kontigensi di bawah.

 

  Perak Johor Jumlah baris

Ijazah 70 34 104

Diploma 80 40 120

SPM 100 76 176

Jumlah lajur 250 150 Jum = 400

Uji pada = 0.1 sama ada taburan pencapaian akademik bagi kedua-dua negeri adalah sama atau tidak.

Page 40: data kontingensi (1).ppt

Penyelesaian :

1) H0:Perkadaran bagi pencapaian akademik penduduk untuk setiap tahap pendidikan adalah sama bagi Perak dan Johor. H1:Perkadaran bagi pencapaian akademik penduduk untuk setiap tahap pendidikan adalah tidak sama bagi Perak dan Johor.

2) Kekerapan jangkaan :

sampelsaizlajur)lahbaris)(Jum(Jumlah

Eij

Page 41: data kontingensi (1).ppt

 

  Perak Johor Jumlah baris

Ijazah O11= 70E11=65

O12= 34E12=39

104

Diploma O21= 80E21=75

O22= 40E22=45

120

SPM O31= 100E31=110

O32= 76E32=66

176

Jumlah lajur 250 150 Jum = 400

Didapati semua nilai E > 5

Page 42: data kontingensi (1).ppt

3) Aras keertian = 0.1 dan darjah kebebasan ialah dk = (B-1)(L-1) = (3-1)(2-1) = 2. Oleh itu berdasarkan jadual 2 , nilai kritikal ialah 4.605. Ini bermakna H0 akan ditolak jika nilai statistik ujian yang dikira adalah lebih besar drpd 4.605.

4) Statistik Ujian :

ij

2ijij2

E

EOχ = (70-65)2 / 65 + (34-39)2 /

39 + (80-75)2 / 75 + (40-45)2 / 45 + (100-110)2 / 110 + (76-66)2 / 66 2 = 4.339

Page 43: data kontingensi (1).ppt

5) Didapati 4.339 < 4.605 . Maka, Terima H0 

Kesimpulan:

Oleh kerana statistik ujian jatuh dalam rantau penerimaan maka terdapat bukti yang cukup daripada sampel yang diambil untuk menerima H0 pada aras keertian 10%. Ini bererti taburan pencapaian akademik penduduk di Perak dan di Johor adalah sama.

Page 44: data kontingensi (1).ppt

Latihan

Satu kajian dijalankan untuk membandingkan kadar kesilapan yang dilakukan oleh syarikat kecil, sederhana dan besar dalam akaun mereka. Didapati 50 drpd 950 akaun syarikat kecil, 55 drpd 945 syarikat sederhana dan 65 drpd 940 akaun syarikat besar yang diaudit mengandungi kesilapan. Adakah kadar kesilapan di antara ketiga-tiga jenis syarikat ini berbeza pada aras keertian 0.1 ?