diagnostik pengaruh bagi model risiko bersaingan dengan ... papers/pert vol. 15 (2) aug... ·...
TRANSCRIPT
Pertanika 15(2), 159-169 (1992)
Diagnostik Pengaruh bagi Model Risiko Bersaingandengan Tapisan Sebagai Satu Risiko
NOORAKMA IBRAHIMdan ISA BIN DAUDJabatan Matematik
Fakulti Sains & Pengajian Alam SekitarUniversiti Pertanian Malaysia
43400 UPM Serdang, Selangor Darul Ehsan/Malaysia
Kata kunci: Risiko bersaingan, cerapan tertapis, kaedah satu-langkah, jarak Cook, jarak kebolehjadian.
ABSTRAKKaedah mengesan cerapan berpengaruh bagi modelrisiko bersainganyangdata tertapis dianggap sebagai satu daripadarisiko dalam model dua risiko yang dikemukakan. Kaedah yang disarankan termasuk kaedah penghapusan cerapan,penghapusan satu langkah Jarak Cook dan jarak kebolehjadian. Penekanan diberi ke atas kesan suatu cerapan terhadappengganggar parameter terhasil. Dua set data digunakan untuk mengilustrasikan kaedah-kaedah int.
ABSTRACT
Methods of detecting influential observations for competing risks model with censoringas one of the risk in a two-risks modelare proposed. These methods include deletion of observations, one-step deletion, Cook distance and likelihood distance.Emphasis is on assessing the impact of an observation on the parameter estimation. Two sets of data are used to illusratethese techniques.
l.PENGENALAN
Kertas ini megemukakan penyelidikan ke atascerapan berpengaruh dalam model risikobersaingan dengan data tertapis sebagai salah saturisiko. Model ini digunakan bagi menganalisis datamandirian yang mempunyai dua atau lebih puncaatu risiko yang menyebabkan kegagalan. Teori risikobersaingan bermula pada kurun kelapan belas danpada tahun 1760 mendapat perhatian sains yanglain apabila Daniel Bernoulli, seorang ahlimatematik juga ahli perubatan mengemukakansoalan berikutan dengan isu semasa ketika itu dansoalannya ialahjika bagi suatu populasi, cacar bolehdihapuskan, apakah kesannya terhadap strukturmortaliti pada peringkat umur yang berbeza? Beliaumengenap pasti bahawa individu yang terselamatdaripada cacar akan menghadapi risiko seterusnyasama seperti individu yang lain di dalam populasitersebut.
Bagi penyesuaian masa kini cacar boleh digantikandengan barah atau penyakit jantung, umpamanyadan kebarangkalian kematian disebabkan penyakittersebut dengan kehadiran risiko yang lain bolehdikirakkan. Selain data klinikal, teori ini juga bolehdilaksanakan ke atas data kebolehpercayaankomponen-komponen dalam bidang industri
termasukjuga bidang ekonomi, demografi dan jugaaktuari.
Apabila menganalisis darta mandirian, perhatianperlu diberi kepada cerapan tertapis kerana masatertapis adalah juga masa kegagalan. Tapisan iniberlaku jika pemerhatian terpaksa diberhentikansebelum terjadi kegagalan akibat kesuntukan masaatau kos mengendalikannya tinggi. Selain itu dataperlu ditapis apabila kegagalan yang berlaku bukandisebabkan oleh punca yang diselidiki atau apabilaindividu hilang daripada kajian. Dalam model yangdiselidik di sini, tapisan merupakan satu risiko keranatapisan pada sesuatu masa x mengelakkan kematiandaripada sesuatu risiko semasa ujian sama sepertikematian pada masa x dari risiko yang lain. Denganini, tapisan dalam model risiko bersaingan akandilayan sebagai satu risiko dan ia mengikut taburanyang tertentu. Di antara artikel dan buku yang telahmembincangkan analisis data mandirian dengancerapan tertapis ialah Kaplan dan Meier (1958), Cox(1972), Kalbfleisch dan Prentice (1980) dan Cox danOakes(1984).
Model risiko bersaingaan seperti model statistikyang lain hanyalah merupakan anggaran memperihalsituasi sebenar tertakluk kepada beberapa kekangandan andaian model Disebabkan ketidaktepatan ini,kestabilan dan variasi keputusan analisis di bawah
NOOR AKMA IBRAHIM DAN ISA BIN DAUD
modifikasi atau gangguan yang kecil ke atas fomulasimodel perlu dikaji. Jika gangguan kacil inimempengaruhi keputusan analisis, model atau datasebaiknya sikaji selidik semula. Sebaliknya jikakesannya tidak ketara, sampel adalah teguh terhadapgangguan yang disengajakan dan andaian modeldianggap kukuh untuk memperihalkan ciri-ciripenting data tersebut.
Kebelakangan ini beberapa artikel dan buku telahditerbitkan yang membincangkan kaedah-kaedahpenilaian pengaruh ke atas model yang diganggutermasuk mengenal pasti cerapan berpengaruh dandata terpencil di dalam konteksanalisis regresi. Cook(1977) telah mengemukakan satu statistik bagimenentukan pengaruhan sesuatu cerapan di dalammodel regresi biasa. Berikutan dengan ini, ramaipenulis telah mencadangkan beberapa statistik untukmengenal pasti satu atau lebih cerapan sebagaicerapan terpencil, berpengaruh atau kedua-duasekali.Mengikuttakrif, cerapan dianggap berpengaruhjikapenghapusnya daripada data menghasilkanperubahan yang besar kepada ciri-ciri penting didalam analisis. Ukuran-ukuran yang akandipertimbangkan di dalam kertas ini adalahberdasarkan fungsi pengaruhan empirikal yang telahdikemukakan oleh Cook( 1977), Cook dan Weisberg(1980, 1982) dan Belsley, Kuh dan Welsch (1980)bagi model regresi. Akan tetapi penulis-penulis initidak mempertimbangkan data tertapis di dalammodel-model mereka. Walaubagaimana-pun terdapatbeberapa penyelidikan diagnostik ke atas data tertapisseperti di dalam penulisan Schoenfeld (1982), BinDaud (1987) yang telah melaksanakannya dalammodel bahaya kadaran Cox (1972) dan Weissfeld danSchneider (1990) dalam model normal linear.
Tumpuan kertas ini ialah megenal pasti cerapan-cerapan berpengaruh bagi model risiko bersaingandengan tapisan yang dianggap sebagai salah saturisiko. Kaedah-kaedah pendiagnosisan termasuklahpenghapusan cerapan, penghapusan satu langkahdan ukuran pengaruh.
2. TATA - TANDA DAN FORMULASI
Katakan suatu populasi tertakluk kepada k puncakegagalan atau risiko, R:,R2, , ̂ d an katakan bagisetiap individu di dalam populasi tersebut dapatdicirikan oleh masa kegagalannya Y^, Y2,...., Yk bersamaRp R̂ , , R̂ masing-masingnya. Pembolehubahrawak Y1(i=l,....,k) menwakili hayat seseorang individuR penyebab yang tunggal dan mempunyai fungsitaburan P.(x)=Kb(Y< x) dengan fungsi ketumpatan
p.(x). Dan fungsi bahayanya ialah h.(x) = p.(x)/ l -P.(x). Mengikut David dan Moeschberger (1978)dengan kehadiransemuak risiko R(e=l, ,k)secaraserentak, hanya V = minimum (Y|, Yk) dan puncakegagalan sebenar, katakan R yang dapat dicerap.Berikutan dengan ini kebarangkalian V melebihi xiaitu fungsi mandiriannya ialah
Kb(V > x) = P(Y,> x,...., Yk > x) (1)
Gail (1975) telah menunjukkanhubungan (1) adalahbenar bagi Yp Y2, , Yk merdeka atau sebaliknya
Katakan X. masa hayat tercerap bersyarat dari puncakegagalan R., maka
X, = = minimum (Y,, Yy...,Yk) (2)
Kebarangkalian kegagalan yang disebabkan oleh R.ialah
n. =Kb[Y. =minimum(Y1,...,Yk)] (3)
dengan n, > 0 d a n ^ n t =1.
Dari (2) dan kemerdekaan Y, fungsi ketumpatanf (x)bagi X., tanpa mengambil kira sebutan peringkatbawah, diberi oleh
f,(x)dt=^Kb[x-dx<y <x]fjKb[Y, > x]
yang demikian
(4)
dengan Pe (x)=l-P1(x).
Katakan N. pembolehubah rawak mewakilibilangan individu yang gagal dari punca R(i=l, 2,...,k) dan X hayat individu kej( j=l,..., n.) yang gagaldari punca R. Fungsi ketumpatan tercantum bagi Xboleh ditulis sebagai
, x l n ] , . . . , x n > = n ^ -
(5)
Fungsi ketumpatan kebarangkali ini adalahbersyaratkan ke atas N. = n. (i = 1 ,.„, k) dan N. suatu
160 PERTANIKA VOL. 15 NO. 2, 1992
DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO
pembolehubah rawak multinational dengan fungsiketumpatan kebarangkalinya
f(n n , ) - - I n 1 (6)
n<»'')'dan
<= n
Jadi, fungsi kebolehjadian yang menjadi tumpuanialah
n! n.dengan
L; = ft,L j-i
nnt (7)
2.1. Model risiko bersaingan dengan kovariat
Dengan menggunakan model yang disarankan olehCox (1972), fungsi ketumpatan kebarangkalian bagimasa kehidupan teori bersekutu dengan punca R ialah
Pi(y)=hoi(y) eksp(ftTZ) eksp[-Hoi (y)eksp(ZTz)] (8)
dengan p vektor baris bagi parameter s regresor
dan Z vektor lajur bagi s kovariat berkaitan dengan
sesuatu individu,
= !»!»,( t)dt
= hoi(y)eksp(pTz)
Andaikan taburan pendasar bagi masa kehidupan
ialah Weilbull dengan h,,(t) = Xcf'x [ho(t) adalah
fungsi bahaya dengan kovariat sama sifar] maka (8)
boleh ditulis sebagai berikut
P j ( y ) = \ c, y ' "eksp(_pTZ ) [ - l , f eksp(PTZ
(9)dengan
y > 0 , ^ i > 0 , C i > 0
3. PENTAFSIRAN DAN ANGGARAN
Di sini parameter regresor P dan pemalar bentuk cakan dianggarkan menggunakan kaedah ke-bolehjadian maksimum. Pendekatan yang bolehdigunakan di antaranya ialah seperti pendekatanNewton-Rhapson, algoritma EM (Dempster e t al1977) dan kompromi Maquardt terubahsuai (David8c Moeschberger 1978, Appendiks B).
Katakan X. masa hingga kegagalan bagi suatuindividu kej gagal dari punca R (i=l,..., k;j=l,..., n) .Berdasarkan (7) dan (9) dengan menganggap
P = ( p;, ,p. 2 , . . . , ps$ ) berbeza bagi setiap R, maka
fungsi kebolehjadian dari sesuatu punca ialah
(10)
Dengan mengambil log asli bagi (10),
lnL. =
j = 1 1 = 1j = 1
j = l 1 = 1 j =1
Untuk keadaan maksimum terhadap X
1 = I j = l
maka
1 = 1 j = 1
(12)
PERTANIKA VOL. 15 NO. 2, 1992 161
NOOR AKMA IBRAHIM DAN ISA BIN DAUD
Dengan
A = -
ainL,31 nc. '
lnL i
2C.
ainL.^i31 np
InL. >
InL
P, c, P P l
anggaran parameter peringkat pertama
6 = [ A ., c , Pi ) (ditandakan sebagai 6 ) apa-
bila menggunakan pendekatan kompromi Mar-quardt terubahsuai (David & Moeschberger 1978)
awal ialahdan nilai 0
9 ' _ 9 " =-W(WAW+5I)" Wg
dengan W matriks m x m penskalaan pepenjuru2 ^ (2) I
dengan unsur pepenjurunya d lnL./d6.dan 8 pemalar bukan negatif. Di sini SL adalahmatriks segiempat sama yang dipilih supayapenumpuan dapat dipercepatkan atau untukmengelakkan keanehan.
4. DIAGNOSTIK BAGI MODEL RISIKO BER-SAINGAN DENGAN TAPISAN SEBAGAI SATURISIKOCook (1977) telah mengemukakan satu prosedurbagi mengesan cerapan-cerapan berpengaruh bagidata penuh dalam model linear. Di sini kami akanmemanfaatkan saranan Cook tetapi kaedahnyaberbeza sedikit kerana tapisan dan penglibatanprosedur berlelaran bagi anggaran parameter.
Kaedah kedua yang akan diperlihatkan ialahdengan menggunakan log kepada fungsikebolehjadian data lengkap dan data dengan satucerapan dihapuskan. Ini dikenali sebagai jarakkebolehjadian. (Cook & Weisberg 1982)
4.1. Ukuran berpengaruh
Kaedah jarak Cook melibatkan anggaran bagiA
parameter 8^^ dengan penghapusan cerapan kejdaripada set dengan setiap penghapusan perludiikuti dengan lelaran sehingga penumpuan danini melibatkan masa yang sangat lama seperti yangtelah diperlihatkan oleh Ibrahim dan Daud (1990).Apa yang boleh dilakukan ialah dengan
menggunakan kaedah satu-langkah. Mungkindengan menggunakan kaedah ini, anggaran danukuran berpengaruh tidak begitujitu tetapi kejituantidak menjadi masalah keranayang pentingnya ialahkita dapat mengenal pasti sesuatu cerapan yangberlainan dari yang lain untuk pertimbanganseterusnya. Inijuga telah diperakui oleh Cook danWeisberg (1982). Pregibon (1981) pulamenyifatkanpenghapusan ini sebagai gangguan terhadap modeldan beliau juga telah menggunakan kaedah satu-langkah dalam diagnostik pengaruh bagi modelregresi logistik.
A
Di sini anggaran kebolehjadian maksimum, 9, ,digunakan sebagai nilai awal. Berdasarkan (13),kaedah satu langkah kepada kompromi Marquardtterubahsuai adalah seperti berikut:-
A
9 r e, =_ [ W(WAW) +5i] wg(j) (14)
yang mana W, A dan g dikira pada 9 ,
Jarak Cook bagi satu-langkah ialah
Di (j) ukuran jarak setelah cerapan kej dihapuskan
( 2 ^( 2) \
d lnL./36 . ) dan
Satu lagi ukuran yang dipertimbangkan ialahjarak kebolehjadian yang ditakrifkan seperti berikut:-
dengan L( 9 ) logasli kepada fungsi kebolehjadian~ i
data lengkap bagi punca R . dan IY 9 \ fungsi
kebolejadian setelah cerapan kej dihapuskan.Seperti perolahan dalam perkembangan di atas,
kaedah satu=langkah boleh disarankan dengan
menggantikan IV 9 \ dengan iaitulY g' )^ i(j) / ' ( ) )
log kebolehjadian pada nilai 9 dianggarkan
dengan satu-langkah (Bin Daud 1987).Jikakonturlog kebolehjadian menghampiri elips,
Jika kontur bagi fungsi kebolehjadian tidakelips, Cook dan Weisberg (1982), berpendapat
PERTANIKA VOL. 15 NO. 2, 1992
DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO
ukuran jarak kebolehjadian mungkin memberikeputusan yang agak menyeleweng daripada yangdijangkakan.
5. CONTOH
Dua contoh dipertimbangkan isitu ujian klinikaluntuk rawatan bar ah orofarinks dan datapemindahan jantung Stanford. Kedua-dua dataterdapat di Appendiks 1 daripada Kalbfleisch danPrentice (1980). Model yang digunakan dalamkedua-dua data ini menganggap kegagalan yangsebenar sebagai risiko pertama dan tapisan sebagairisiko kedua. Anggaran kebolehjadian maksimumyang berasingan dilakukan ke atas setiap risiko bagisetiap data dan diagnostik berpengaruh juga dikirasecara berasingan bagi setiap risiko.
Hanya tujuh kovariat diambil kira bagi data barahorofarinks dan tiga kovariat bagi data pemindahanjantung.
5.1. Ujian klinikal bagi barah orofarinks
Analisis bagi data ini melibatkan 195 kes denganbilangan kematian,n1=142 dan bilangan tapisan n^= 53. Tujuh kovariat dipertimbangkan iaitu umur,jantina, rawatan, kesihatan pesakit, gred, peringkat1 dan peringkat 2. Umur ialah umur pesakit semasadiagnos dan diukur dalam ukuran tahun. Jantinaialahlelaki (=1) danwanita (=2).Terdapatduajenisrawatan iaitu, rawatan terapi beradiasi (=1) danrawatan terapi beradiasi dengan agenkemoterapeutik (=2). Keadaan yang meng-gambarkan kesihatan pesakit terbahagi kepadaempat kategori semasa menjalani rawatan iaitu,tiadakekurangankebolehan (=1), yang hanya bolehdilakukan kerja yang tertentu sahaja (=2), yangmemerlukan bantuan untuk kebersihan diri (=3)dan yang tidak berdaya (terlantar di atas katil),(=4). Gred ialah perbandingan darjah selketumbuhan menyerupai sel hos iaitu, jelas (=1),kurangjelas (=2) dan tidakmenentu (=3). Peringkat1 mengukur saiz ketumbuhan iaitu, ukuran 2 cmatau kurang (=1), ukuran 2 cm hingga 4 cm (=2),ukuran lebih dari 4 cm (=3) dan sangat besar sertaagresif (=4). Peringkat 2 pula mengukur wujudnyapenglibatan nod limpatek iaitu, tiada bukti klinikalbagi kerebakan nod (=0), satu nod positif yangberlegar dan diameternya berukuran tidak lebihdari 3 cm (=1), satu nod positif yang berlegar dabdiameternya lebih dari 3 cm (=2) danbeberapanodpositif yang tidak berlegar (=3).
Model yang telah digunakan ialah model risikoberasingan dengan taburan pendasar bagi masa
kegagalan diandaikan sebagai Weibull, k=2 danpemalar bentuknya berlainan bagi setiap risiko.
Dengan nilai awal c( = 1 dan P = 0 kaedah
kompromi Marquardt terubahsuai berlelaranmemberikan anggaran kebolehjadian maksimumkepada lima titik perpuluhan seperti berikut:-
£, = 0.08508, Ci =1.16552, pn = 0.00406, p, ,=
-0.19071 , p , , = 0.17200, pM = -0.10148,
P,5 = 0. 25932 . pI(i = 0.31154 dan p | 7 = 0.13882
Bagi cerapan tertapis dengan nilai awal Cj = 1 dan
P = 0 anggaran kebolehjadian maksimum adalah
seperti berikut:-
£j = 0.01875 , C2= 3.191124, p2|= -0.01417,
p 2 2 = -0.0205 41, P2S= 0.1 4541
p.M = 0.004646,pa.= 0.38582, p.,fi= 0.06303
dan pir. = 0.12080 serta log kebolehjadian maksimum=-93.37044. Anggaran sisihan piawai asimptot bagipunca pertama dan kedua adalah
s$, ) = 0.06814 s(l2) - 0.02278
s(c\) = 0.07143 s(c\2) - 0.13007
s $ u ) =0.00832 s(P21) =0.01478
s$12) =0.20268 s(fy =0.32575
s$ls) =0.17111 s( |y =0.29921
s$I4) = 0.12027 s$24) = 0.20804
s(^,) =0.07207 s$25) =0.28590
s$16) =0.11647 s(fy =0.19756
s$17) =0.07654 s$27) =0.14253
Bagi i = 1 Jarak kebolehjadian bagi setiap cerapanadalah lebih besar daripada jarak Cook (Rajah 1dan Rajah 2). Didapati cerapan ke-159 memberikannilaijarakCookdanjarak kebolehjadian yang palingbesar berbanding dengan cerapan-cerapan yanglain dan cerapan ini boleh dianggap sebagai titikterpencil.
Bagi i = 2, daripada Rajah 3 iaitu graf bagi jarakCook, jelas kelihatan cerapan<erapan 6, 43, 46,53dan 176 cerapan yang berpengaruh yang mungkin.Tetapi graf jarak kebolehjadian [Rajah 4)menunjukkan cerapan-cerapan yang lain telahdisebut tadi, cerapan ke-186 dan 190 adalah jugacerapan berpengaruh. Jarak kebolehjadian mem-berikan gambaran yang tidak begitujelas bagi i = 2,
PERTANIKA VOL. 15 NO. 2, 1992 163
NOOR AKMA IBRAHIM DAN ISA BIN DAUD
dan ini mungkin disebabkan bilangan cerapantertapis adalah kecil pada keseluruhannya. Oleh itubagi keadaan yang begini lebih baik berpandukanukuran jarak Cook untuk mengesan cerapanberpengaruh.
5.2. Data pemindahan jantung Stanford
Data ini melibatkan 90 kes, n, = 62, nt, =28 dan 3 kova-riat iaitu umur, pembedahan dan pemindahan.Umur ialah umur seseorang itu diterima ketikamenjalani program Stanford ini. Kovariat
pembedahan pula bermaksud pembedahan yangpernah dilakukan (= 1) dan tidak pernah dilakukan(=0) sebelum mengikuti program ini. Pemindahanbermaksud pemindahan dilakukan (=1) dan tiadaberlaku pemindahan (=0) semasa mengikutiprogram.
Dengan nilai awal c} = 1 dan £, = 0, pendekatankomprom Marquardt terubahsuai bagi anggaranmaksimum adalah seperti berikut:-
^ = 0.23933, c > 0.76289 J , , = 0.05587, $ n =-0.8569
12
ID
J -1 •
M
2
n
-
-
-
-
-
-
i j i i i i i i j |
*
J A 1 A 1 _l 1 1 J l f 1
I 17 33 MS hh HI 17 I 13 I2S IMS IE I 177 IR3S 25 Ml 57 73 BS ID5 12 1 137 153 IBS IBS
cerapan
Rajah 1: Rajah Cook bagi data barah orofarinksrisiko pertama
cerapan
Rajah 2: Jarak kebolehjadian bagi data orofarinks
risiko pertama
164 PERTANIKA VOL. 15 NO. 2, 1992
DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO
0.6 -
JL A. . A ft, A ^ i A n i L ,I 17 33 MR B5 HI R7 I 13 I2S (45 IE I 177 IR3
25 Ml 57 73 HH ID5 12 1 137 153 IER IBB
cerapan* *.
Rajah 3: Jarak Cook bagi data barah orofarinksrisiko kedua
I 17 33 MR 65 B I R7 I 13 I2T IMS IGI 177 IS325 Ml 57 73 BR IDS 121 137 153 IBR IB5
cerapan
Rajah 4: Jarak akebolehjadian bagi data orofarinksrisiko kedua
PERTANIKA VOL. 15 NO. 2, 1992 165
NOOR AKMA IBRAHIM DAN ISA BIN DAUD
D.M
I 5 q 13 17 2 I 25 29 33 37 Ml MS MS 53 57 E I E5 ES 73 77 B I B5 8S
Rajah 5: Jarak Cook bagi data barah Stanfordrisiko pertama
13 17 21 25 ^ 33 37 HI H5 4^ 53 57 61 65 5=1 73 77 HI Q5I 5
Rajah 6: Jarak kebokhjadian bagi data Stanfordrisiko pertama
166 PERTANIKA VOL. 15 NO. 2, 1992
DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO
13 17 21 25 21 33 37 41 45 41 53 57 61 55 B1 73 77 Bl B5 B1I 5
Rajah 1: Jarak Cook bagi data barah Stanfordrisiko kedua
I 5 1 13 17 21 25 21 33 37 41 45 41 53 57 6! 55 51 73 77 BI B5
Rajah 8: Jarak kebolehjadian bagi data Stanfordrisiko kedua
PERTANIKA VOL. 15 NO. 2, 1992 167
NOOR AKMA IBRAHIM DAN ISA BIN DAUD
dan^13=-1.42677sertalogkebolehjadian=-56.5087.Bagi cerapan tertapis dengan nilai awal c2 = 1 dan (32
• 0, anggaran kebolehjadian maksimum adalahseperti berikut:-
i2 = 0.74576 = e2 = 1.38135, £2] = -0.02263, $n =
-0.19567, (^ = -0.15521 serta log kebolehjadian =-56.19152. Anggaran sisihan piawai asimptot bagipunca pertama dan kedua adalah:-
8$,) =0.16941 $(%2) =0.65654
s(c\) =0.08743 s(c\) = 0.15330
s( ftu) = 0.01666 s( fl21) = 0.02402
s( ft12) = 0.44220 s( ft22) = 0.47688
s( 313) = 0.33011 s( ^23) = 0.63287
Bagi i * l , daripada Rajah 5, jarak Cookmemberikan gambaran yang jelas bahawa cerapanke-60 dan 85 adalah titik-titik berpengaruh. Tetapidaripada Rajah 6, yangjelas kelihatan ialah cerapanke-85 sahaja dan boleh dianggap sebagaiberpengaruh. Kelainan ini mungkin disebabkanapabila pemindahan beralaku pesakit akanmengikuti rawatan yang berlainan dan kovariatjenisini mestilah diteliti dahulu sebelum modelditentukan.
Bagi i = 2, jarak Cook (Rajah 7) dan jarakkebolehjadian (Rajah 8) tidakdapatmenunjukkandengan jelas cerapan-cerapan yang mungkinberpengaruh. Terdapat sedikit gangguan padakedua-dua graf dan ini berlaku mungkin disebabkankovariat yang bersandaran kepada masa danpengaruh cerapan kegagalan terhadap keseluruhandata.
6. KESIMPULAN
Analisis diagnostik untuk masa kegagalan yangsebenar dalam model risiko bersaingan seperticontoh barah orfarinks menunjukkan kedua-duaukuran iaitu D dan LD berjaya mengesancerapan yang sama. Tetapi ini tidak berlaku ke atasdata Stanford bagi i = 1, walau-pun terdapat satucerapan yang dikesan oleh kedua-dua kaedah.Kelainan ini mungkin disebabkan oleh cirian yangada pada data itu sendiri.
Bagi data tertapis pula beberapa kesimpulanboleh diperoleh daripada penyelidikan ini. Masatapisan itu sendiri boleh menyebabkan kelainancerapan yang dikesan oleh D danLd . Ini bolehdisebabkan oleh pengaruh masa kegagalan sebenarke atas keseluruhan data atau disebabkan taburan
yang bukan kuadratik yang memberikan konturkebolehjadian yang tidak elips dan ukuran yangdiberi agak menyeleweng. Dalam hal ini lebih baikberpandukan jarak Cook bagi mengesan cerapanberpengaruh. Bilangan cerapan juga memainkanperanan untuk menentukan keberkesanan kaedahkebolehjadian dalam mengesan cerapan ber-pengaruh. Didapati jika n2 adalah besar atau samadengan nv kaedah kebolehjadian lebih ber-keseimbangan dengan jarak Cook. Keputusanmemperlihatkan cerapan tertapis juga memberi-kan kesan ke atas anggaran parameter dan perluditeliti apabila penyesuaian model dilakukan keatasnya.
RUJUKAN
BELSLEY, D ,A.,E. KUH and R.E. WELSCH. 1980. Regression
Diagnostics: Identifying Influential Data and SourcesofCollinearity. New York: Wiley.
BIN DAUD, 1.1987. Influence Diagnostics in Regressionwith Censored Data. Ph. D. Thesis, LoughboroughUniversity.
COOK, R. D. 1977. Detection of Influential Observationsin Linear Regression. Technometrics 19: 15-18.
COOK, R. D. and S. WEISBERG. 1980. Characterizationsof an Empirical Influence Function for DetectingInfluential Cases in Regression. Techmetrics 22:495-508.
COOK. R. D. and S. WEISBERG. 1982. Residuals andInfluence in Regression. London: Chapman andHall.
Cox, D. R. 1972. Regression Models and Life Tables(with discussion)./ R. Statist Soc. B34: 187-220.
Cox. D. R. andD. OAKES. 1984. Analysis of SurvivalData.London: Chapman and Hall.
DAVID, H. A. and M. L. MOESCHBERGER. 1978. The Theoryof Competing Risks. London: Griffin.
DEMPSTER, A. P., N. M. LAIRD and D. B. RUBIN. 1977.
Maximum Likehood from Incomplete Data viaEm Algorithm./ R Statist Soc. B39: 1-38.
GAIL, M. 1975. A Review and Critique of some ModelsUsed in Competing Risks Analysis. Biometrics 31:209-222.
IBRAHIM, N. A. and I. DAUD 199O.AnalisisRegresiMudahdan Mengesan Cerapan Berpengaruh bagi DataTertapis. Lapuran Teknikal, 45/1990, JabatanMatematik, Universiti Pertanian Malaysia.
KALBFLEISCHJ. D. andR. L. PRENTICE. 1980. The StatisticalAnalysis of failure Time Data. New York: Wiley.
KAPLAN, E. L. and P. MEIER. 1958. NonparametricEstimatuion from Incomplete Observations./ Amer. Statist Assoc. 53: 457-481.
168 PERTANIKA VOL. 15 NO. 2, 1992
DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO
PREGIBON, D. 1981. Logistics Regression Diagnostics. WEISSFELD, L. A. and H. SCHNEIDER. 1990. Influence
Ann. Statist. 9: 705-724. Diagnostics for the Normal Linear Model withSCHOENFELD, D. 1982. Partial Residuals for the Censored Data. Austral. J. Statistics 32(1): 11-20.
Proportional Hazards Regression Model.Biometrika 69(1): 239-241. (Di ^ ^ 24Ogos 1991)
PERTANIKA VOL. 15 NO. 2, 1992 169