statistik inferens - · pdf filebermakna di antara tahap obesiti dengan tekanan darah...
TRANSCRIPT
Bengkel Epidemiologi Klinikal & Metodologi Penyelidikan
Julai 1999
Dr Azmi Mohd Tamil
Jabatan Kesihatan Masyarakat
FPUKM
Statistik Inferens
Apabila kita melakukan sesuatu penyelidikan, kita mahu membuat sesuatu inferens dari datayang terkumpul,contohnya
"ubat A lebih baik dari ubat B dalam merawat sesuatu penyakit C"
maka Hipotesis Nul akan berbunyi seperti berikut;
"tiada perbezaan keberkesanan di antara ubat A dengan ubat B
dalam merawat penyakit C"
jadi apabila dilakukan statistik inferens, dapat ditentukan sama ada wujud atau tidakperbezaan yang signifikan dari segi keberkesanan di antara ubat A dan ubat B.
Jika wujud perbezaan yang bermakna, maka hipotesis nul akan ditolak, iaitu wujudperbezaan keberkesanan yang signifikan antara 2 ubat tersebut (p<0.05).
Sebaliknya jika tidak wujud perbezaan yang bermakna, maka hipotesis nul tidak ditolakiaitu tiada perbezaan keberkesanan yang signifikan di antara ubat A dengan ubat B dalammerawat penyakit C (p0.05).
Biasanya batas kemaknaan yang digunakan sama ada untuk menolak atau tidak hipotesis nulditentukan pada 0.05 atau 0.01. Bagi contoh di atas ia ditentukan pada 0.05.
Selang keyakinan pula ialah 1-batas kemaknaan. Jika batas kemaknaan 0.05 maka selangkeyakinan adalah 95%.
Ralat
Walaupun telah ditetapkan batas kemaknaan dan selang keyakinan, masih lagi timbulkemungkinan ralat. Ada 2 jenis ralat iaitu Ralat Jenis I dan Ralat Jenis II.
Keadaan Sebenar
Kesimpulan Ujian Kemaknaan Hipotesis Nul Benar (Ho tidak ditolak)
Hipotesis Nul Tidak Benar(Ho ditolak)
Hipotesis Nul Tidak Ditolak Kesimpulan Benar Ralat Jenis II
Hipotesis Nul Ditolak Ralat Jenis I Kesimpulan Benar
Ralat Jenis I - menolak hipotesis nul sedangkan hipotesis ini adalah benar (e.g. didapatibahawa apabila dibandingkan nilai min/perkadaran, wujud perbezaan tetapiperbezaan itu tidak signifikan. Oleh itu hipotesis null ditolak. Mungkindisebabkan oleh masalah seperti saiz sampel terlalu kecil)
Ralat Jenis II - tidak menolak hipotesis nul sedangkan hipotesis ini salah (e.g. didapatibahawa apabila dibandingkan nilai min/perkadaran, tidak wujud perbezaanyang besar tetapi perbezaan itu didapati signifikan. Oleh itu hipotesis nulltidak ditolak. Mungkin disebabkan oleh masalah seperti saiz sampel terlalubesar)
Jenis-jenis Ujian bagi Data Kuantitatif
Parametrik Non-parametrik
Ujian T Independent (Student's T-Test) Wilcoxon Rank Sum test
Ujian T berpasangan Mann Whitney test
ANOVA Kruskal Wallis
Korelasi & Regresi
Ujian T Independent
Untuk membandingkan min 2 kumpulan yang tidak bersandar (independent). Contohnya minHb di antara kes dan kawalan. 2 variabel akan terlibat iaitu satu variabel kuantitatif dan satulagi variabel kualitatif dengan hanya 2 kemungkinan (e.g. jantina - lelaki dan perempuan).
Formula umum;
t =
Formula khusus;
Jika saiz sampel lebih besar dari 30
Jika saiz sampel lebih kecil atau bersamaan 30 danvarians keduanya sama
t =
t =
di mana;
=
di mana darjah kebebasan; df = (n1+n2-2)
Cara melakukan Ujian T Independent mengggunakan SPSS
Bagi contoh ini, ianya adalah data dari sebuah kajian keberkesanan antara 2 jenis ubat (drug =F dan S) bagi pesakit psikiatri. Hanya mereka yang lengkap rawatan (status=C) dipilih. Yangdibandingkan ialah perubahan skor HAMD selepas 6 minggu rawatan (chhamd6) antara 2kumpulan tersebut.1. Mula-mula buka data tersebut (Jika tidak tahu bagaimana, klik di SINI.)2. Kemudian klik pada menu - Data - Select Cases. Pilih "If condition is satisfied" dan klikpada butang "If..".Pada petak putih taip "status="C""(lihat rajah dibawah) dan klik butang"Continue" dan butang "Okay".
3. Kemudian klik pada menu Statistics -Compare Means -Independent Samples T Test(seperti rajah dibawah).
4. Pada requester yang timbul, isikan variabel yang ingin dilakukan ujian tersebut. Pada petak"Test Variable(s):", masukkan variabel kuantitatif (chhamd6) yang ingin diuji. Bolehmasukkan lebih dari satu variabel kuantitatif yang ingin diuji. Pada petak "GroupingVariable:", masukkan variabel kualitatif (drug), kemudian klik pada butang "Define Groups"dan masukkan kumpulan yang ingin dibandingkan (S & F). Klik butang "continue" dankemudian butang "okay".
5. Selepas ini ujian t independent akan dilakukan oleh SPSS dan tingkap "Output" akantimbul menunjukkan hasil analisa. Yang akan kelihatan adalah seperti dibawah;
6. Ini menunjukkan jumlah sampel (N), min dan sisihan piawai bagi chhamd6 bagi kumpulanS dan F.
7. Mula-mula sekali lihat nilai p (Sig.) pada Levene's Test. Jika p0.05, maka gunakan baris"equal variances assumed". Jika p<0.05, gunakan baris "equal variances not assumed". Bagikes di atas, p=0.088, maka kita akan gunakan baris "equal variances assumed". Dapat dilihatbahawa nilai p = 0.497, iaitu p0.05, maka tidak wujud perbezaan dari segi perubahan skorHAMD di antara 2 ubat tersebut selepas 6 minggu rawatan.
8. Maka jadual yang dilukis bagi laporan tesis adalah seperti di bawah;Jadual 1: Min perubahan skor HAMD selepas 6 minggu rawatan mengikut kumpulanrawatan.
Kumpulan N Min Ujian p
S 32 -72.03+24.09
F 34 -68.42+18.68
Ujian T
t = 0.6830.497
Ujian T Berpasangan
Digunakan apabila perbandingan variabel kuantitatif dilakukan pada individu yang sama.Contohnya apabila individu itu merupakan kedua-dua kawalan dan kes pada kajian yangsama, iaitu sebelum dan sesudah intervensi. Boleh juga digunakan bagi kes dan kawalan yangtelah dipasangkan mengikut kriteria seperti umur, jantina dan etnik (matched pairs). Maka iaakan melibatkan 2 variabel kuantitatif yang berpasangan pada satu kajian.Formula yang digunakan ialah;Mula-mula dikira beza di antara nilai pertama dan nilai kedua bagi setiap individu dalamkajian = D.Kemudian dikira nilai min D dan sisihan piawainya. Dari 2 nilai tersebut, t dikira mengikutformula di bawah;
t =
di mana
=
dan
=
Cara melakukan Ujian T Berpasangan mengggunakan SPSS
Bagi contoh ini, ianya adalah data dari sebuah kajian keberkesanan antara 2 jenis ubat (drug =F dan S) bagi pesakit psikiatri. Hanya mereka yang lengkap rawatan (status=C) dipilih. Yangdibandingkan ialah perbezaan antara skor HAMD sebelum rawatan (dhamdwk0) denganselepas 6 minggu rawatan (dhamdwk6) bagi ubat F.1. Mula-mula buka data tersebut.2. Kemudian klik pada menu - Data - Select Cases. Pilih "If condition is satisfied" dan klikpada butang "If..".Pada petak putih taip "status="C" and drug="F""(lihat rajah dibawah) danklik butang "Continue" dan butang "Okay".
3. Kemudian klik pada menu Statistics -Compare Means -Paired-Samples T Test (sepertirajah dibawah).
4. Pada requester yang timbul, isikan variabel yang ingin dilakukan ujian tersebut. Pada petak"Test Variable(s):", masukkan pasangan variabel kuantitatif (dhamdwk0 & dhamdwk6) yangingin diuji. Boleh masukkan lebih dari satu pasangan variabel kuantitatif yang ingin diuji.Klik butang "okay".
5. Selepas ini ujian t berpasangan akan dilakukan oleh SPSS dan tingkap "Output" akantimbul menunjukkan hasil analisa. Yang akan kelihatan adalah seperti dibawah;
6. Ini menunjukkan jumlah pasangan (N), min dan sisihan piawai bagi pasangan dhamdwk0& dhamdwk6 bagi ubat F.
7. Ini menunjukkan korelasi antara pasangan di atas. Tiada korelasi yang bemakna (p0.05).
8. Dapat dilihat bahawa nilai p = 0.000, iaitu p<0.05, maka wujud perbezaan yang bermaknadari segi skor HAMD selepas 6 minggu rawatan bagi ubat F. Daripada nilai min, dapat dilihatbahawa min selepas rawatan adalah lebih kecil dari min sebelum rawatan. Bagi skor HAMDini bermakna pesakit semakin sembuh dengan rawatan ubat F
9. Maka jadual yang dilukis bagi laporan tesis adalah seperti di bawah;
Jadual 1: Min skor HAMD sebelum dan selepas 6 minggu rawatan bagi ubat F.
Kumpulan N Min D (Beza) Ujian p
Sebelum rawatan vs
Selepas rawatan
3417.61+5.93
Ujian T berpasangan
t = 17.3260.0000
ANOVA (Analysis of Variance)
Untuk membandingkan lebih dari 2 min kumpulan yang tidak bersandar (independent).Merupakan lanjutan dari ujian t. Contohnya min Hb di antara pelbagai kaum di Malaysia. 2variabel akan terlibat iaitu satu variabel kuantitatif dan satu lagi variabel kualitatif denganlebih dari 2 kemungkinan (e.g. ethnik - Melayu, Cina, India & Lain-lain). Hanya dapat menentukan sama ada terdapat perbezaan yang bermakna di antara min-minyang dibandingkan, tetapi tidak dapat yang mana satu yang berbeza. Untuk menentukan minyang mana satu bermakna, perlu analisa lanjut menggunakan ujian t (cara biasa) atau melaluipengiraan LSD dalam post-hoc analysis (cara SPSS).
Formula umum;
Source of
variation
Sum of Squares(variability)
Degrees ofFreedom
Mean Square(Variance)
VarianceRatio
(F)
BetweenGroups
a c a/c
WithinGroups
b d b/d
ad/bc
Daripada nilai F yang dikira, dirujuk kepada jadual F dan dipastikan sama ada nilai p kiraanmelebihi atau kurang dari 0.05.
Cara melakukan ANOVAmengggunakan SPSS
Bagi contoh ini, ianya adalah data dari sebuah kampung di Hulu Langat bagi semuapenduduk yang berumur 18 tahun ke atas. Yang ingin dikaji adalah hubungan antara tahapobesiti (obesiti iaitu underweight, normal dan overweight) dan tekanan darah diastolik(c5diasto).
1. Mula-mula buka data tersebut
2. Kemudian klik pada menu Statistics -Compare Means -One-Way ANOVA (seperti rajahdibawah).
3. Pada requester yang timbul, isikan variabel yang ingin dilakukan ujian tersebut. Pada petak"Test Variable(s):", masukkan variabel kuantitatif (c5diasto) yang ingin diuji (lihat rajah dibawah). Boleh masukkan lebih dari satu variabel kuantitatif yang ingin diuji. Pada petak"Grouping Variable:", masukkan variabel kualitatif (obesity), kemudian klik pada butangPost Hoc.
4. Pada requester post-hoc, klik pada LSD (lihat rajah), tekan butang "continue".Kemudiantekan "Options" dan klik pada "Descriptives", tekan butang "continue" dan kemudian butang"okay".
5. Selepas ini analisa ANOVA akan dilakukan oleh SPSS dan tingkap "Output" akan timbulmenunjukkan hasil analisa. Yang akan kelihatan adalah sepertidibawah;
Daripada nilai min dalam jadual deskriptif, dapat dilihat bahawa min diastolik semakinmeningkat mengikut tahap obesiti.
6. Ini menunjukkan nilai F = 15.106 dan nilai p = 0.000. Maka wujud perbezaan yangbermakna di antara tahap obesiti dengan tekanan darah diastolik. Persoalannya adalah padakumpulan mana satukah yang wujud perbezaan bermakna tersebut? Untuk itu kita lihat padapost-hoc LSD.
7. Dapat dilihat bahawa nilai p<0.05 bagi kesemua perbandingan, maka wujud perbezaanyang bermakna dari segi tahap obesiti dengan tekanan diastolik di antara semua kumpulan.
8. Maka jadual yang dilukis bagi laporan tesis adalah seperti di bawah;
Jadual 1: Min tekanan diastolik dan status obesiti.
Kumpulan Min Ujian p
Kurang berat 78.20+10.46
Normal 82.23+14.05
Lebih Berat 87.97+11.75
ANOVA
F = 15.1060.0000