statistik inferens - · pdf filebermakna di antara tahap obesiti dengan tekanan darah...

12
Bengkel Epidemiologi Klinikal & Metodologi Penyelidikan Julai 1999 Dr Azmi Mohd Tamil Jabatan Kesihatan Masyarakat FPUKM Statistik Inferens Apabila kita melakukan sesuatu penyelidikan, kita mahu membuat sesuatu inferens dari data yang terkumpul,contohnya "ubat A lebih baik dari ubat B dalam merawat sesuatu penyakit C" maka Hipotesis Nul akan berbunyi seperti berikut; "tiada perbezaan keberkesanan di antara ubat A dengan ubat B dalam merawat penyakit C" jadi apabila dilakukan statistik inferens, dapat ditentukan sama ada wujud atau tidak perbezaan yang signifikan dari segi keberkesanan di antara ubat A dan ubat B. Jika wujud perbezaan yang bermakna, maka hipotesis nul akan ditolak, iaitu wujud perbezaan keberkesanan yang signifikan antara 2 ubat tersebut (p<0.05). Sebaliknya jika tidak wujud perbezaan yang bermakna, maka hipotesis nul tidak ditolak iaitu tiada perbezaan keberkesanan yang signifikan di antara ubat A dengan ubat B dalam merawat penyakit C (p0.05). Biasanya batas kemaknaan yang digunakan sama ada untuk menolak atau tidak hipotesis nul ditentukan pada 0.05 atau 0.01. Bagi contoh di atas ia ditentukan pada 0.05. Selang keyakinan pula ialah 1-batas kemaknaan. Jika batas kemaknaan 0.05 maka selang keyakinan adalah 95%.

Upload: vominh

Post on 04-Mar-2018

221 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

Bengkel Epidemiologi Klinikal & Metodologi Penyelidikan

Julai 1999

Dr Azmi Mohd Tamil

Jabatan Kesihatan Masyarakat

FPUKM

Statistik Inferens

Apabila kita melakukan sesuatu penyelidikan, kita mahu membuat sesuatu inferens dari datayang terkumpul,contohnya

"ubat A lebih baik dari ubat B dalam merawat sesuatu penyakit C"

maka Hipotesis Nul akan berbunyi seperti berikut;

"tiada perbezaan keberkesanan di antara ubat A dengan ubat B

dalam merawat penyakit C"

jadi apabila dilakukan statistik inferens, dapat ditentukan sama ada wujud atau tidakperbezaan yang signifikan dari segi keberkesanan di antara ubat A dan ubat B.

Jika wujud perbezaan yang bermakna, maka hipotesis nul akan ditolak, iaitu wujudperbezaan keberkesanan yang signifikan antara 2 ubat tersebut (p<0.05).

Sebaliknya jika tidak wujud perbezaan yang bermakna, maka hipotesis nul tidak ditolakiaitu tiada perbezaan keberkesanan yang signifikan di antara ubat A dengan ubat B dalammerawat penyakit C (p0.05).

Biasanya batas kemaknaan yang digunakan sama ada untuk menolak atau tidak hipotesis nulditentukan pada 0.05 atau 0.01. Bagi contoh di atas ia ditentukan pada 0.05.

Selang keyakinan pula ialah 1-batas kemaknaan. Jika batas kemaknaan 0.05 maka selangkeyakinan adalah 95%.

Page 2: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

Ralat

Walaupun telah ditetapkan batas kemaknaan dan selang keyakinan, masih lagi timbulkemungkinan ralat. Ada 2 jenis ralat iaitu Ralat Jenis I dan Ralat Jenis II.

Keadaan Sebenar

Kesimpulan Ujian Kemaknaan Hipotesis Nul Benar (Ho tidak ditolak)

Hipotesis Nul Tidak Benar(Ho ditolak)

Hipotesis Nul Tidak Ditolak Kesimpulan Benar Ralat Jenis II

Hipotesis Nul Ditolak Ralat Jenis I Kesimpulan Benar

Ralat Jenis I - menolak hipotesis nul sedangkan hipotesis ini adalah benar (e.g. didapatibahawa apabila dibandingkan nilai min/perkadaran, wujud perbezaan tetapiperbezaan itu tidak signifikan. Oleh itu hipotesis null ditolak. Mungkindisebabkan oleh masalah seperti saiz sampel terlalu kecil)

Ralat Jenis II - tidak menolak hipotesis nul sedangkan hipotesis ini salah (e.g. didapatibahawa apabila dibandingkan nilai min/perkadaran, tidak wujud perbezaanyang besar tetapi perbezaan itu didapati signifikan. Oleh itu hipotesis nulltidak ditolak. Mungkin disebabkan oleh masalah seperti saiz sampel terlalubesar)

Jenis-jenis Ujian bagi Data Kuantitatif

Parametrik Non-parametrik

Ujian T Independent (Student's T-Test) Wilcoxon Rank Sum test

Ujian T berpasangan Mann Whitney test

ANOVA Kruskal Wallis

Korelasi & Regresi

Page 3: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

Ujian T Independent

Untuk membandingkan min 2 kumpulan yang tidak bersandar (independent). Contohnya minHb di antara kes dan kawalan. 2 variabel akan terlibat iaitu satu variabel kuantitatif dan satulagi variabel kualitatif dengan hanya 2 kemungkinan (e.g. jantina - lelaki dan perempuan).

Formula umum;

t =

Formula khusus;

Jika saiz sampel lebih besar dari 30

Jika saiz sampel lebih kecil atau bersamaan 30 danvarians keduanya sama

t =

t =

di mana;

=

di mana darjah kebebasan; df = (n1+n2-2)

Cara melakukan Ujian T Independent mengggunakan SPSS

Bagi contoh ini, ianya adalah data dari sebuah kajian keberkesanan antara 2 jenis ubat (drug =F dan S) bagi pesakit psikiatri. Hanya mereka yang lengkap rawatan (status=C) dipilih. Yangdibandingkan ialah perubahan skor HAMD selepas 6 minggu rawatan (chhamd6) antara 2kumpulan tersebut.1. Mula-mula buka data tersebut (Jika tidak tahu bagaimana, klik di SINI.)2. Kemudian klik pada menu - Data - Select Cases. Pilih "If condition is satisfied" dan klikpada butang "If..".Pada petak putih taip "status="C""(lihat rajah dibawah) dan klik butang"Continue" dan butang "Okay".

Page 4: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

3. Kemudian klik pada menu Statistics -Compare Means -Independent Samples T Test(seperti rajah dibawah).

4. Pada requester yang timbul, isikan variabel yang ingin dilakukan ujian tersebut. Pada petak"Test Variable(s):", masukkan variabel kuantitatif (chhamd6) yang ingin diuji. Bolehmasukkan lebih dari satu variabel kuantitatif yang ingin diuji. Pada petak "GroupingVariable:", masukkan variabel kualitatif (drug), kemudian klik pada butang "Define Groups"dan masukkan kumpulan yang ingin dibandingkan (S & F). Klik butang "continue" dankemudian butang "okay".

Page 5: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

5. Selepas ini ujian t independent akan dilakukan oleh SPSS dan tingkap "Output" akantimbul menunjukkan hasil analisa. Yang akan kelihatan adalah seperti dibawah;

6. Ini menunjukkan jumlah sampel (N), min dan sisihan piawai bagi chhamd6 bagi kumpulanS dan F.

7. Mula-mula sekali lihat nilai p (Sig.) pada Levene's Test. Jika p0.05, maka gunakan baris"equal variances assumed". Jika p<0.05, gunakan baris "equal variances not assumed". Bagikes di atas, p=0.088, maka kita akan gunakan baris "equal variances assumed". Dapat dilihatbahawa nilai p = 0.497, iaitu p0.05, maka tidak wujud perbezaan dari segi perubahan skorHAMD di antara 2 ubat tersebut selepas 6 minggu rawatan.

Page 6: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

8. Maka jadual yang dilukis bagi laporan tesis adalah seperti di bawah;Jadual 1: Min perubahan skor HAMD selepas 6 minggu rawatan mengikut kumpulanrawatan.

Kumpulan N Min Ujian p

S 32 -72.03+24.09

F 34 -68.42+18.68

Ujian T

t = 0.6830.497

Ujian T Berpasangan

Digunakan apabila perbandingan variabel kuantitatif dilakukan pada individu yang sama.Contohnya apabila individu itu merupakan kedua-dua kawalan dan kes pada kajian yangsama, iaitu sebelum dan sesudah intervensi. Boleh juga digunakan bagi kes dan kawalan yangtelah dipasangkan mengikut kriteria seperti umur, jantina dan etnik (matched pairs). Maka iaakan melibatkan 2 variabel kuantitatif yang berpasangan pada satu kajian.Formula yang digunakan ialah;Mula-mula dikira beza di antara nilai pertama dan nilai kedua bagi setiap individu dalamkajian = D.Kemudian dikira nilai min D dan sisihan piawainya. Dari 2 nilai tersebut, t dikira mengikutformula di bawah;

t =

di mana

=

dan

=

Page 7: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

Cara melakukan Ujian T Berpasangan mengggunakan SPSS

Bagi contoh ini, ianya adalah data dari sebuah kajian keberkesanan antara 2 jenis ubat (drug =F dan S) bagi pesakit psikiatri. Hanya mereka yang lengkap rawatan (status=C) dipilih. Yangdibandingkan ialah perbezaan antara skor HAMD sebelum rawatan (dhamdwk0) denganselepas 6 minggu rawatan (dhamdwk6) bagi ubat F.1. Mula-mula buka data tersebut.2. Kemudian klik pada menu - Data - Select Cases. Pilih "If condition is satisfied" dan klikpada butang "If..".Pada petak putih taip "status="C" and drug="F""(lihat rajah dibawah) danklik butang "Continue" dan butang "Okay".

3. Kemudian klik pada menu Statistics -Compare Means -Paired-Samples T Test (sepertirajah dibawah).

Page 8: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

4. Pada requester yang timbul, isikan variabel yang ingin dilakukan ujian tersebut. Pada petak"Test Variable(s):", masukkan pasangan variabel kuantitatif (dhamdwk0 & dhamdwk6) yangingin diuji. Boleh masukkan lebih dari satu pasangan variabel kuantitatif yang ingin diuji.Klik butang "okay".

5. Selepas ini ujian t berpasangan akan dilakukan oleh SPSS dan tingkap "Output" akantimbul menunjukkan hasil analisa. Yang akan kelihatan adalah seperti dibawah;

6. Ini menunjukkan jumlah pasangan (N), min dan sisihan piawai bagi pasangan dhamdwk0& dhamdwk6 bagi ubat F.

7. Ini menunjukkan korelasi antara pasangan di atas. Tiada korelasi yang bemakna (p0.05).

Page 9: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

8. Dapat dilihat bahawa nilai p = 0.000, iaitu p<0.05, maka wujud perbezaan yang bermaknadari segi skor HAMD selepas 6 minggu rawatan bagi ubat F. Daripada nilai min, dapat dilihatbahawa min selepas rawatan adalah lebih kecil dari min sebelum rawatan. Bagi skor HAMDini bermakna pesakit semakin sembuh dengan rawatan ubat F

9. Maka jadual yang dilukis bagi laporan tesis adalah seperti di bawah;

Jadual 1: Min skor HAMD sebelum dan selepas 6 minggu rawatan bagi ubat F.

Kumpulan N Min D (Beza) Ujian p

Sebelum rawatan vs

Selepas rawatan

3417.61+5.93

Ujian T berpasangan

t = 17.3260.0000

ANOVA (Analysis of Variance)

Untuk membandingkan lebih dari 2 min kumpulan yang tidak bersandar (independent).Merupakan lanjutan dari ujian t. Contohnya min Hb di antara pelbagai kaum di Malaysia. 2variabel akan terlibat iaitu satu variabel kuantitatif dan satu lagi variabel kualitatif denganlebih dari 2 kemungkinan (e.g. ethnik - Melayu, Cina, India & Lain-lain). Hanya dapat menentukan sama ada terdapat perbezaan yang bermakna di antara min-minyang dibandingkan, tetapi tidak dapat yang mana satu yang berbeza. Untuk menentukan minyang mana satu bermakna, perlu analisa lanjut menggunakan ujian t (cara biasa) atau melaluipengiraan LSD dalam post-hoc analysis (cara SPSS).

Formula umum;

Source of

variation

Sum of Squares(variability)

Degrees ofFreedom

Mean Square(Variance)

VarianceRatio

(F)

BetweenGroups

a c a/c

WithinGroups

b d b/d

ad/bc

Daripada nilai F yang dikira, dirujuk kepada jadual F dan dipastikan sama ada nilai p kiraanmelebihi atau kurang dari 0.05.

Page 10: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

Cara melakukan ANOVAmengggunakan SPSS

Bagi contoh ini, ianya adalah data dari sebuah kampung di Hulu Langat bagi semuapenduduk yang berumur 18 tahun ke atas. Yang ingin dikaji adalah hubungan antara tahapobesiti (obesiti iaitu underweight, normal dan overweight) dan tekanan darah diastolik(c5diasto).

1. Mula-mula buka data tersebut

2. Kemudian klik pada menu Statistics -Compare Means -One-Way ANOVA (seperti rajahdibawah).

3. Pada requester yang timbul, isikan variabel yang ingin dilakukan ujian tersebut. Pada petak"Test Variable(s):", masukkan variabel kuantitatif (c5diasto) yang ingin diuji (lihat rajah dibawah). Boleh masukkan lebih dari satu variabel kuantitatif yang ingin diuji. Pada petak"Grouping Variable:", masukkan variabel kualitatif (obesity), kemudian klik pada butangPost Hoc.

Page 11: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

4. Pada requester post-hoc, klik pada LSD (lihat rajah), tekan butang "continue".Kemudiantekan "Options" dan klik pada "Descriptives", tekan butang "continue" dan kemudian butang"okay".

5. Selepas ini analisa ANOVA akan dilakukan oleh SPSS dan tingkap "Output" akan timbulmenunjukkan hasil analisa. Yang akan kelihatan adalah sepertidibawah;

Daripada nilai min dalam jadual deskriptif, dapat dilihat bahawa min diastolik semakinmeningkat mengikut tahap obesiti.

Page 12: Statistik Inferens - · PDF filebermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah pada kumpulan mana satukah yang wujud perbezaan bermakna tersebut?

6. Ini menunjukkan nilai F = 15.106 dan nilai p = 0.000. Maka wujud perbezaan yangbermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah padakumpulan mana satukah yang wujud perbezaan bermakna tersebut? Untuk itu kita lihat padapost-hoc LSD.

7. Dapat dilihat bahawa nilai p<0.05 bagi kesemua perbandingan, maka wujud perbezaanyang bermakna dari segi tahap obesiti dengan tekanan diastolik di antara semua kumpulan.

8. Maka jadual yang dilukis bagi laporan tesis adalah seperti di bawah;

Jadual 1: Min tekanan diastolik dan status obesiti.

Kumpulan Min Ujian p

Kurang berat 78.20+10.46

Normal 82.23+14.05

Lebih Berat 87.97+11.75

ANOVA

F = 15.1060.0000