Download - Pendeteksian Outlier Dalam Regresi Logistik Binerdengan Metode Detects Outliers Using Weights Douw
-
PENDETEKSIAN OUTLIER DALAM REGRESI LOGISTIK BINER
DENGAN METODE DETECTS OUTLIERS USING WEIGHTS (DOUW)
Oleh: UJANG JAELANI
140720090025
TESIS Untuk memenuhi salah satu syarat ujian
guna memperoleh gelar Magister Statistika Terapan. Program Studi Magister Statistika Terapan
Bidang Kajian Utama Statistika Sosial
PROGRAM PASCASARJANA UNIVERSITAS PADJADJARAN
BANDUNG 2010
-
PENDETEKSIAN OUTLIER DALAM REGRESI LOGISTIK BINER
DENGAN METODE DETECTS OUTLIERS USING WEIGHTS (DOUW)
Oleh:
UJANG JAELANI
140720090025
Untuk memenuhi salah satu syarat ujian
guna memperoleh gelar Magister Statistika Terapan.
Program Studi Magister Statistika Terapan
Telah disetujui oleh Tim Pembimbing pada tanggal
seperti tertera di bawah ini,
Bandung, Agustus 2010
Dr. Suwanda, M.S. Ketua Tim Pembimbing
Dra. Hj. Anna Chadidjah, MT. Anggota Tim Pembimbing
-
iii
PERNYATAAN
Dengan ini saya menyatakan bahwa:
1. Tesis ini, adalah asli dan belum pernah diajukan untuk mendapatkan gelar
akademik (sarjana, magister, dan / atau doktor), baik di Universitas Padjadjaran
maupun di perguruan tinggi lain.
2. Tesis ini adalah murni gagasan, rumusan, dan penelitian saya sendiri, tanpa
bantuan pihak lain, kecuali arahan Tim Pembimbing.
3. Dalam Tesis ini tidak terdapat karya atau pendapat yang telah tertulis atau
dipublikasikan orang lain, kecuali secara tertulis dengan jelas dicantumkan
sebagai acuan dalam naskah dengan disebutkan nama pengarang dan
dicantumkan dalam daftar pustaka.
4. Pernyataan ini saya buat dengan sesungguhnya dan apabila di kemudian hari
terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, saya bersedia
menerima sanksi akademis berupa pencabutan gelar yang telah diperoleh karena
karya ini, serta sanksi lainnya sesuai dengan norma yang berlaku di perguruan
tinggi ini.
Bandung, Agustus 2010
Yang membuat pernyataan,
Ujang Jaelani NPM. 140720090025
-
iv
ABSTRACT
Thesis Title : Outlier Detection in Binary Logistic Regression with the Detects Outliers Using Weights (DOUW) Method.
Abstract
DOUW method is an outlier detection procedure which also can produce robust parameter estimation in Binary Logistic Regression. In DOUW method, there are four things that must be completed, namely: determination of optimal g1, the number of iterations, the choice of (weight), and the choice of c (level of cut-off). Source data used is the result of Inter-Census Population Survey (SUPAS) in 2005 in Sukabumi Regency and West Java Province. Variables used are as follows: Response Variable (Y) is a type of Marriage and Regressor Variables(Xi) are Religion (X1), Residence Status (X2), Working Status (X3), Migrant Status (X4), and the Old School (X5). From the results of outlier detection, choice of mate value of and c can be concluded that for certain value and the value of c is getting closer to one the number of observations that are detected as outliers more and more. While for certain c value and the value of getting closer to 0 then the number of observations that are detected as outliers less.
Whereas, if viewed from the estimated parameters produced, it can be concluded that changes in the value of the estimated parameters in the regressor variables, from the initial iteration to iteration end, changing the very significance. From these results demonstrate that the presence of outliers greatly affect the estimated parameters are obtained, especially on binary logistic regression. Estimated parameters produced by DOUW method, for the pair and c value whatever, basically get the value that is not too much different, although the number of outliers that are detected are not the same.
Keywords : Binary Logistic Regression, Downweighting, Level of Cut Off, Outlier, Robust Parameter Estimation.
-
v
ABSTRAK
Judul Tesis : Pendeteksian Outlier dalam Regresi Logistik Biner dengan Metode Detects Outliers Using Weights (DOUW).
Abstrak Metode DOUW merupakan suatu prosedur pendeteksian Outlier yang sekaligus dapat menghasilkan estimasi parameter robust pada Regresi Logistik Biner. Dalam metode DOUW, ada empat hal yang harus dilengkapi yaitu: penentuan g1 yang optimal, jumlah iterasi, pilihan (weight), dan pilihan level cut off (c). Sumber data yang digunakan adalah data hasil Survei Penduduk Antar Sensus (SUPAS) Tahun 2005 di Kabupaten Sukabumi dan Provinsi Jawa Barat. Variabel yang digunakan terdiri dari: Variabel Respon (Y) adalah Jenis Pernikahan dan Variabel Regressor (Xi) adalah Agama (X1), Status Tempat Tinggal (X2), Status Bekerja (X3), Status Migran (X4), dan Lama Sekolah (X5). Dari hasil pendeteksian outlier, pemilihan pasangan nilai dan c dapat disimpulkan, bahwa untuk nilai tertentu dan nilai c yang semakin mendekati 1, maka banyaknya pengamatan yang terdeteksi sebagai outlier semakin banyak. Sedangkan untuk nilai c tertentu dan nilai yang semakin mendekati 0, maka banyaknya pengamatan yang terdeteksi sebagai outlier semakin sedikit.
Sedangkan jika dilihat dari estimasi parameter yang dihasilkan dapat disimpulkan, bahwa perubahan nilai estimasi parameter pada variabel regressor dari iterasi awal ke iterasi akhir mengalami perubahan yang sangat signifikans. Dari hasil ini memperlihatkan bahwa keberadaan outlier sangat mempengaruhi estimasi parameter yang diperoleh, khususnya pada regresi logistik biner. Estimasi parameter yang dihasilkan metode DOUW, untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan nilai yang tidak terlalu jauh berbeda, walaupun banyaknya outlier yang terdeteksi tidak sama. Kata Kunci : Regresi Logistik Biner, Downweighting, Level Cut Off,
Outlier, Estimasi Parameter Robust.
-
vi
KATA PENGANTAR
Segala puji dan syukur diucapkan kehadirat Allah SWT atas segala
rahmat, hidayah, dan karunia yang diberikan-Nya, sehingga penulis dapat
menyelesaikan Tesis yang berjudul Pendeteksian Outlier dalam Regresi
Logistik Biner dengan Metode Detects Outliers Using Weights (DOUW)
dengan baik.
Dengan terselesaikannya Tesis ini, penulis mengucapkan terima kasih
yang sebesar-besarnya kepada :
1. Orang tua dan Mertua tercinta yang telah memberikan doa dan dorongan.
2. Istriku tercinta Saidah,S.Pd.I dan ketiga anakku tersayang Razan Muhammad
Ihsan, si kembar yang lucu Rifqi Muhammad Habiburrahman dan Rizqi
Muhammad Habiburrahim yang telah rela dan sabar memberikan dukungan
kepada abinya untuk menyelesaikan studi ini.
3. Bapak Dr. Suwanda, M.S. dan Ibu Dra. Hj. Anna Chadidjah, MT, selaku
dosen pembimbing yang telah banyak meluangkan waktu, tenaga dan pikiran
untuk membimbing, memberikan masukan, arahan dan koreksi serta diskusi
yang berkualitas kepada penulis dalam proses pengerjaan Tesis ini.
4. Bapak Dr. Choiril Maksum dan Ibu Dra. Hj. Enny Supartini, MS selaku
dosen penguji yang telah meluangkan waktu dan tenaga untuk masukan dan
saran dalam proses pengerjaan tesis ini.
5. Seluruh dosen Pascasarjana Jurusan Statistika Terapan Universitas
Padjadjaran, seluruh jajaran akademik, asisten laboratorium yang telah
banyak membantu dalam masa perkuliahan.
-
vii
6. Seluruh jajaran pimpinan Badan Pusat Statistik (BPS) di Pusat yang telah
memberikan kesempatan kepada penulis untuk melanjutkan Program Studi
Magister Statistika Terapan F-MIPA Universitas Padjadjaran Bandung.
7. Kepala BPS Provinsi Jawa Barat Drs. H. Lukman Ismail, MA dan jajarannya
yang telah merekomendasikan penulis untuk mengikuti Program Studi
Magister Statistika Terapan F-MIPA di Universitas Padjadjaran Bandung.
8. Seluruh teman-teman Pascasarjana Jurusan Statistika Terapan Universitas
Padjadjaran Bandung, khususnya angkatan pertama program S2 kerjasama
Badan Pusat Statistik dan Unpad untuk kebersamaannya selama ini.
9. Pak Nurseto Wisnumurti (Pa Ocen) untuk diskusi, sharing, belajar bareng,
dan transfer ilmunya khususnya kepada penulis, umumnya kepada penghuni
kontrakan ST13
10. Seluruh teman-teman kontrakan ST13: Pa Ocen, Mas Dede, Sami, Yanis,
Eko, Ipung, Rio, Yudi, Kharis, Heru, Ucup, dan Budi, juga Ilham atas
kebersamaan dan kekompakannya dalam menempuh studi ini, termasuk
dalam bermain Futsal.
11. Nasrul Wajdi untuk konsultasi program SAS dan semua pihak yang telah
membantu penyelesaian tesis ini, yang tidak dapat disebutkan satu per satu.
Penulis menyadari bahwa terdapat kekurangan dalam penulisan laporan
ini, oleh karena itu kritik dan saran yang membangun sangat diharapkan. Akhir
kata penulis berharap semoga apa yang telah ditulis ini dapat bermanfaat dan
berguna bagi semua pihak.
Bandung, Agustus 2010
Penulis
-
viii
DAFTAR ISI
Halaman
PENGESAHAN . ii
PERNYATAAN . iii
ABSTRACT ... iv
ABSTRAK ..... v
KATA PENGANTAR vi
DAFTAR ISI .. viii
DAFTAR TABEL .. x
DAFTAR GAMBAR . xi
DAFTAR LAMPIRAN .. xii
BAB I PENDAHULUAN .. 1
1.1. Latar Belakang . 1
1.2. Identifikasi Masalah . 3
1.3. Tujuan Penelitian . 3
1.4. Manfaat Penelitian ... 4
1.5.Sistematika Penulisan ... 4
BAB II TINJAUAN PUSTAKA . 5
2.1. Regresi Logistik Biner .. 5
2.2. Beberapa Metode Penaksir Robust dalam Regresi Logistik
Biner ..
6
2.2.1. Metode Trimming . 6
2.2.2. Metode Maximum Estimated Likelihood (MEL)... 7
2.2.3. Metode Weight Maximum Estimated Likelihood
(WEMEL)
8
2.3 Deteksi Outlier dengan Metode Analisis Deviance Residual . 9
-
ix
Halaman
BAB III REGRESI LOGISTIK BINER ROBUST MELALUI METODE
DOUW ..
11
3.1. Metode Detects Outliers Using Weights (DOUW) ... 11
3.2. Algoritma ... 14
3.3. Sumber Data .. 16
3.4. Wanita Menikah Muda dan Faktor-faktor Penyebabnya ........... 16
3.5. Variabel-variabel yang Digunakan .... 18
BAB IV HASIL DAN PEMBAHASAN ........ 20
4.1. Pendahuluan ... 20
4.2. Deskripsi Data Hasil SUPAS 2005 . 21
4.3. Pendeteksian Outlier untuk Data SUPAS 2005 Kabupaten
Sukabumi ..
31
4.4. Pendeteksian Outlier untuk Data SUPAS 2005 Provinsi Jawa
Barat ..
39
BAB V KESIMPULAN DAN SARAN ........ 44
5.1. Kesimpulan 44
5.2. Saran .. 45
DAFTAR PUSTAKA 46
LAMPIRAN ... 48
-
x
DAFTAR TABEL
Halaman
Tabel 4.1. Persentase Wanita Menikah menurut Jenis Pernikahan dan Provinsi di Indonesia Tahun 2005 .....
22
Tabel 4.2 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Kabupaten/Kota di Provinsi Jawa Barat Tahun 2005 ...
23
Tabel 4.3 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Agama yang Dianut di Provinsi Jawa Barat Tahun 2005 .
25 Tabel 4.4 Persentase Wanita menurut Menikah Jenis Pernikahan dan
Status Tempat Tinggal di Provinsi Jawa Barat Tahun 2005 .
27 Tabel 4.5 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Status Bekerja di Provinsi Jawa Barat Tahun 2005
28 Tabel 4.6 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Status Migran di Provinsi Jawa Barat Tahun 2005 ....
29 Tabel 4.7 Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama
Sekolah di Provinsi Jawa Barat Tahun 2005
30 Tabel 4.8 Banyaknya Pengamatan yang Terdeteksi sebagai Outlier dengan
Metode DOUW dan Deviance Residual ........
32 Tabel 4.9 Taksiran Parameter untuk masing-masing Nilai dan c
(Untuk n=967 dan K=5) ..
35 Tabel 4.10 Taksiran Parameter () untuk masing-masing Nilai dan c,
serta Banyaknya Outlier yang Terdeteksi dengan Metode DOUW (Untuk n=967 dan K=5) dan Deviance Residual .
37 Tabel 4.11 Taksiran Parameter dan Banyaknya Outlier yang Terdeteksi
dengan Metode DOUW (n=21.772, K=5, =0.05, dan C=0.05) dan Deviance Residual, serta Nilai Odds Ratio
40
-
xi
DAFTAR GAMBAR
Halaman
Gambar 2.1 X dan Y Outlier .. 8 Gambar 3.1 Flow Chart Metode DOUW 15 Gambar 4.1 Persentase Wanita Menikah menurut Kabupaten/Kota di
Provinsi Jawa Barat ...
24 Gambar 4.2 Persentase Wanita Menikah Muda dan Dewasa di Provinsi Jawa
Barat ...
25 Gambar 4.3 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Agama di Provinsi Jawa Barat ...
26 Gambar 4.4 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Status Tempat Tinggal di Provinsi Jawa Barat .................
27 Gambar 4.5 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Status Bekerja Tinggal di Provinsi Jawa Barat ...
28 Gambar 4.6 Persentase Wanita Menikah menurut Jenis Pernikahan dan
Status Migran di Provinsi Jawa Barat .
29 Gambar 4.7 Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama
Sekolah di Provinsi Jawa Barat ..
31 Gambar 4.8 Scatter Plot antara Observasi dengan Probabilita (G) Pada Data
SUPAS 2005 Kabupaten Sukabumi (untuk n=967, K=5, =0.01, C=0.01) ..
34
-
xii
DAFTAR LAMPIRAN
Halaman Lampiran 1 Data Supas 2005 Kabupaten Sukabumi (n=967) ..... 48 Lampiran 2 Data Supas 2005 Provinsi Jawa Barat (n=21.772) .. 49 Lampiran 3 Langkah-langkah Pengolahan Metode DOUW ... 50 Lampiran 4 Langkah-langkah Pengolahan Metode Analisis Deviance
Residual ...
52 Lampiran 5 Syntax Metode DOUW .. 53 Lampiran 6 Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk
Kabupaten Sukabumi (n=967) .....
60 Lampiran 7 Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk
Provinsi Jawa Barat (n=21.772, =0.05 dan c=0.05) ..
63 Lampiran 8 Output Syntax Metode DOUW untuk =0.01 dan c=0.01 65
-
1
BAB I
PENDAHULUAN
1.1.Latar Belakang
Dalam proses pemilihan model persamaan Regresi Logistik Biner yang
terbaik, terdapat suatu tahapan yang sangat penting dan cukup menentukan,
yaitu tahapan diagnostik model. Dalam tahapan ini salah satu yang dilakukan
adalah pendeteksian terhadap keberadaan satu atau sekelompok pengamatan yang
tidak mengikuti pola pada umumnya, yang dikenal sebagai Outlier. Ferguson dan
Barnet (dalam Soemartini, 2007) mendefinisikan outlier sebagai berikut:
Ferguson, outlier adalah suatu data yang menyimpang dari sekumpulan data yang
lain. Barnett, outlier adalah merupakan pengamatan yang tidak mengikuti
sebagian besar pola dan terletak jauh dari pusat data, dan Sembiring (2003)
berpendapat bahwa outlier adalah pengamatan yang jauh dari pusat data yang
mungkin berpengaruh besar terhadap koefisien regresi.
Keberadaan outlier dapat mempengaruhi kesimpulan akhir dari model
persamaan Regresi Logistik Biner. Oleh karena begitu seriusnya permasalahan
keberadaan dan efek yang ditimbulkan oleh outlier, maka pendeteksian outlier
menjadi sangat penting. Dalam Regresi Logistik Biner, pengamatan dengan
respon sukses tetapi probabilitasnya ditaksir rendah dan pengamatan dengan
respon gagal tetapi probabilitasnya ditaksir tinggi, diklasifikasikan sebagai
outlier (Venter & Rey, 2007). Dalam penelitian ini yang menjadi respon sukses
adalah wanita menikah muda dan respon gagal adalah wanita menikah dewasa.
-
2
Pengamatan dikategorikan sebagai outlier, jika untuk wanita menikah muda
probabilitasnya rendah, sedangkan untuk wanita menikah dewasa probabilitasnya
tinggi.
Apabila terdapat outlier, maka untuk medapatkan model regresi
logistiknya digunakan model regresi logistik yang robust. Metode pertama untuk
mendapatkan model regresi logistik biner robust adalah trimming yang
diperkenalkan oleh Tukey (1960). Secara ringkas, trimming membagi
pengamatan-pengamatan ke dalam beberapa sub set setelah pengamatannya
diurutkan, yakni sub set pertama 5 persen pengamatan terendah, sub set kedua 5
persen pengamatan tertinggi dan sisanya merupakan sub set pengamatan yang
berada di tengah. Untuk sub set pengamatan 5 persen bawah dan 5 persen atas
diberi bobot mendekati nol, sehingga sub set pengamatan tengah merupakan sub
set yang bebas dari outlier. Selanjutnya, untuk menaksir parameter regresi pada
sub set pada pengamatan yang berada di tengah digunakan Maximum Likelihood
Estimator (MLE). Sedangkan untuk sub set pengamatan terendah dan tertinggi
dihilangkan.
Penggunaan trimming dalam regresi logistik biner umumnya dilakukan
pada ruang regressor untuk menghilangkan overlap data, sehingga apabila tidak
terjadi overlap, MLE tidak dijamin eksistensinya (Rousseeuw and Christmann,
2001). Untuk mengatasi masalah eksistensi penaksir, diajukan Maximum
Estimated Likelihood (MEL). Pada perkembangan selanjutnya, diajukan prosedur
penaksir robust lainnya yang tidak melalui trimmed data yang disebut metode
Weight Maximum Estimated Likelihood (WEMEL). WEMEL juga dapat
-
3
mendeteksi outlier dalam ruang regressor yang dikenal sebagai leverage. Dengan
demikian WEMEL bukanlah metode pendeteksi outlier (outlier arah Y), oleh
karena itu diperlukan suatu metode pendeteksi outlier pada arah Y yang sekaligus
mendapatkan taksiran parameternya dalam regresi logistik biner. Metode
konvensional yang biasa digunakan untuk mendeteksi outlier adalah dengan
menghitung nilai deviance residual-nya. Akan tetapi metode konvensional ini
ditujukan hanya untuk mendeteksi outlier, tidak untuk menaksir parameter.
1.2.Identifikasi Masalah
Berdasarkan latar belakang di atas, maka masalah dalam penelitian ini
adalah bagaimana prosedur pendeteksian outlier sekaligus mendapatkan taksiran
parameter robust pada Regresi Logistik Biner dengan metode Detects Outliers
Using Weights (DOUW). Dalam hal ini akan diterapkan pada data hasil Survei
Penduduk Antar Sensus (SUPAS) 2005, dengan variabel respon adalah wanita
menikah muda (respon sukses) dan wanita menikah dewasa (respon gagal).
1.3.Tujuan Penelitian
Tujuan dari penelitian ini adalah mendeteksi outlier sekaligus
mendapatkan taksiran parameter robust dalam Regresi Logistik Biner dengan
metode Detects Outliers Using Weights (DOUW) pada data hasil Survei
Penduduk Antar Sensus (SUPAS) 2005, dengan variabel respon adalah wanita
menikah muda (respon sukses) dan wanita menikah dewasa (respon gagal).
-
4
1.4.Manfaat Penelitian
Adapun manfaat pada penelitian ini adalah sebagai berikut:
a. Bagi BPS, penelitian ini diharapkan mampu memberikan sumbangan yang
berharga, sebagai metode alternatif yang akurat dalam pendeteksian Outlier,
sekaligus mendapatkan taksiran parameter robust pada Regresi Logistik Biner.
b. Bagi Penulis, penelitian ini dapat dijadikan modal awal untuk pengembangan
lebih jauh dalam hal Pendeteksian Outlier pada Regresi Logistik Biner.
1.5. Sistematika Penulisan
Tulisan ini terdiri dari lima bab. Bab satu mengenai pendahuluan yang
terdiri dari latar belakang, identifikasi masalah, tujuan penelitian, manfaat
penelitian dan sistematika penulisan. Bab dua mengenai tinjauan pustaka. Bab tiga
mengenai metodologi penelitian. Bab empat hasil dan pembahasan. Bab lima
kesimpulan dan saran.
-
5
BAB II
TINJAUAN PUSTAKA
2.1.Regresi Logistik Biner
Dalam regresi logistik biner variabel responsnya bersifat dikotonomi yang
mempunyai nilai 1 untuk katgori sukses atau 0 untuk kategori gagal, dan
variabel regressor sebanyak K, yaitu: X1, X2Xk. Misalkan XT = (1, X1,
X2Xk) dengan T melambangkan transpose. Model regresi logistik biner dapat
dirumuskan sebagai berikut :
(2.1)
dimana T = (o, 1.k) adalah vektor koefisien regresi logistik (Hosmer & Lemeshow, 1989). Andaikan terdapat n pengamatan, dimana pengamatan ke-i
adalah (yi, XTi), dengan yi adalah nilai pengamatan Y dan XTi = (1, Xn,1,Xn,k)
adalah vektor nilai yang diamati dari regressor sebanyak K. Dalam model regresi
logistik, biner, variabel respon diekspresikan sebagai:
(2.2)
Dimana mempunyai salah satu kemungkinan dari dua nilai, yaitu:
1 , jika y=1 dengan peluang dan
, jika y=0 dengan peluang 1 .
Sehingga mempunyai rataan nol dan varians 1 .
Dengan mengasumsikan independensi ke-n pengamatan, log likelihood
dinyatakan dengan :
-
6
(2.3)
dimana: 1 log 1 .
Untuk mendapatkan taksiran parameter dapat digunakan MLE dengan memaksimumkan Persamaan (2.3). Sebagaimana telah disebutkan dalam bagian
pendahuluan, outlier bisa memperburuk model (2.1). Hal ini mendorong perlunya
prosedur-prosedur regresi logistik biner robust.
2.2.Beberapa Metode Penaksir Robust dalam Regresi Logistik Biner
2.2.1. Metode Trimming
Prosedur pertama yang akan dijelaskan adalah trimming, yaitu suatu
prosedur dengan memisahkan himpunan bagian data yang diduga sebagai outlier.
Kemudian himpunan bagian data sisanya digunakan untuk menaksir parameter
dengan menggunakan MLE. Metode trimming dapat mengakibatkan tidak adanya
overlap data antara respons dengan kategori sukses dan respon dengan kategori
gagal (yaitu, xi yang bersangkutan dengan yi = 0 dapat dipisahkan oleh
hyperplane dari xi yang bersangkutan dengan yi = 1), akibatnya taksiran parameter
dengan menggunakan MLE tidak dijamin keberadaannya (non-existence).
Walaupun taksiran parameter yang dihasilkan melalui trimming
merupakan taksiran parameter robust, akan tetapi metode trimming tidak dapat
mendeteksi outlier, baik dalam ruang regressor maupun dalam arah Y. Jadi
trimming hanya merupakan metode yang digunakan untuk mendapatkan taksiran
-
7
parameter pada himpunan bagian data yang sudah dipisahkan dari
kemungkinan adanya outlier.
2.2.2. Metode Maximum Estimated Likelihood (MEL)
Rousseuw dan Christmann (2003) memperkenalkan estimator MEL untuk
mengatasi masalah non-existence. Prosedur MEL dapat dijelaskan sebagai
berikut:
Misalkan =0,01,
, =max(, min(1-, )), o=/(1+),
1=(1+)/(1+), dan mentransformasi yi ke =(1yi) o+yi1. Kemudian MEL ditetapkan dengan memilih yang memaksimumkan log
likelihood taksiran,
(2.4)
dimana: , 1 log 1 , .
Berbeda dengan MLE klasik, estimator MEL selalu ada (exist).
Sama halnya dengan trimming, taksiran parameter yang dihasilkan melalui
MEL juga merupakan taksiran parameter robust, akan tetapi MEL tidak dapat
mendeteksi outlier, melainkan ditujukan untuk mengatasi masalah eksistensi
taksiran parameter yang tidak dijamin oleh MLE, karena hilangnya overlap data
oleh trimming.
-
8
2.2.3. Metode Weight Maximum Estimated Likelihood (WEMEL)
Prosedur penaksir robust lainnya adalah WEMEL yang didefenisikan
sebagai penetapan yang memaksimumkan log likelihood terboboti sebagai berikut:
(2.5)
Dalam hal ini pembobotan ditentukan oleh bagian data dalam ruang X
menurut wi = M/max {RD2 (x*i), M}, dimana X*i = (xi-1,..xi,K)T dan RD2 (x*i)
adalah jarak robust (RD) dan M adalah persentil ke-75 dari semua RD2 (X*i), i =
1, ..,n. Dengan cara seperti ini, WEMEL berfungsi sebagai metode untuk
mendeteksi leverage, sehingga WEMEL bukan merupakan prosedur untuk
mendeteksi outlier dalam arah Y. Outlier dapat terjadi dalam ruang X dan dalam
arah Y. Sebagai ilustrasi tentang keberadaan outlier dalam ruang X dan arah Y,
dapat dilihat pada Gambar 2.1 sebagai berikut:
Gambar 2.1: X dan Y outlier
-
9
Area abu-abu yang melibatkan sebagian besar pasangan-pasangan (x1, x2)
bisa dianggap sebagai x-inliers, sementara yang berada di luar area ini adalah x-
outlier, misalnya A, B, D, G, dan H. Untuk keperluan ilustrasi, ditambahkan dua
kontur p(x,)= d dan p(x,)=1d (dengan d kecil). Pengamatan di luar kontur-kontur ini dengan nilai y yang tidak layak, dianggap sebagai y-outlier, khususnya
yang jauh dari kontur, misalnya A dan G. Copas (1988) melakukan pengamatan
dengan y=1 dan p mendekati 0 disebut uplier (misalnya A) dan pengamatan
dengan y=0 tapi p mendekati 1 disebut downlier (misalnya G dan E). Uplier dan
downlier dianggap sebagai bad leverage, dengan pengertian bahwa kemungkinan
akan mempengaruhi koefisien regressi taksiran dengan arah yang sangat berbeda
dari pengamatan-pengamatan lain. Sebaliknya pengamatan-pengamatan seperti
titik B dan H bisa dinamakan good leverage, dalam arti bahwa walaupun kedua
titik ini adalah outlying dalam x-space, nilai y-nya bisa cocok dengan apa yang
diharapkan dari x-region dimana titik tersebut berada.
Mengingat prosedur MEL dan WEMEL merupakan prosedur robust untuk
penanggulangan leverage yang tidak wajar (x-outlier), untuk itu diperlukan
metode pendeteksi outlier dalam arah Y, yang akan dijelaskan pada Bab 3.
2.3.Deteksi Outlier dengan Metode Analisis Deviance Residual
Residual diartikan sebagai ukuran kesesuain antara suatu pengamatan pada
variabel respon dan nilai dugaannya. Residual antara pengamatan ke-i dirumuskan
dengan , dimana adalah nilai respon 0 atau 1 dan adalah nilai
-
10
dugaannya. Deviance Residual pengamatan ke-i dari vektor respon dapat
dinyatakan sebagai berikut:
2
2
/
(2.6)
dimana adalah suatu tanda yang menyatakan positif jika
dan negatif jika .
Secara konvensional, nilai deviance residual dapat digunakan untuk
mendeteksi apakah suatu pengamatan termasuk outlier atau bukan. Metode
konvensional ini disebut sebagai metode analisis deviance residual. Dalam
Metode analisis deviance residual, suatu pengamatan dinyatakan sebagai outlier
apabila nilai mutlak deviance residual-nya lebih besar 2 (Agresti, 1997).
-
11
BAB III
REGRESI LOGISTIK BINER ROBUST MELALUI METODE DOUW
3.1.Metode Detects Outliers Using Weights (DOUW)
Metode DOUW memiliki beberapa kesamaan dengan metode least
trimmed squares (LTS) dari Rousseeuw dan Van Driessen (1999a,b) dalam
regresi biasa. LTS dimulai dengan batas bawah g1, atas beberapa pengamatan
yang bukan outlier (inlier). Kemudian dicari himpunan-bagian G dari pengamatan
dengan ukuran #(G)=g1, yang mempunyai jumlah residu kuadrat terkecil diantara
semua himpunan-bagian ukuran g1. G1 optimal yang ditemukan dengan cara ini
akan dianggap paling mungkin bisa bebas dari outlier dan selanjutnya akan
menghasilkan taksiran koefisien regressi yang paling sedikit dipengaruhi oleh
kemungkinan-kemungkinan outlier. Taksiran koefisien regresi yang didapat
dengan cara ini adalah taksiran LTS berdasarkan pada pengamatan g1. Ada
kemungkinan bahwa pilihan g1 adalah pilihan yang konservatif dalam arti bisa
ada pengamatan di luar G1 yang juga bukan outlier.
Taksiran LTS dapat digunakan untuk menghitung residu pengamatan di
luar G1 dan menggunakan residu-residu ini untuk memutuskan pengamatan-
pengamatan manakah yang akan ditambahkan ke dalam G1 untuk mendapatkan
himpunan-bagian G2 yang lebih besar, yang memuat g2, dimana g2 g1. Pengamatan-pengamatan yang bukan outlier menjadi dasar untuk perkiraan
regresi trimmed pada G2. Optimasi LTS secara komputasi sulit dan jika dikerjakan
secara eksak, membutuhkan beberapa langkah yang kompleks dengan jumlah
-
12
pengamatan yang besar dan secara praktis tidak layak, khususnya dengan jumlah
pengamatan besar. Rousseuw dan Van Drissen (1999a,b) melakukan perhitungan
dengan terlebih dahulu melakukan pemilihan awal G secara acak, dimana # (G) =
g1, kemudian meningkatkan pilihan G secara iteratif sampai konvergen, dengan
menggunakan prosedur yang disebut sebagai C-Steps. Prosedur ini diulang
beberapa kali, solusi terbaik dipilih dan digunakan untuk mewakili G1 optimal
yang dibutuhkan.
Prosedur LTS cukup baik dalam regresi biasa, selanjutnya analogi untuk
kasus Regresi Logistik Biner, dengan menggunakan trimmed likelihood sebagai
pengganti trimmed least squares. Ini berarti bahwa harus dipilih himpunan bagian
G yang memuat g1 pengamatan (bersama dengan ) yang memaksimumkan . Ini juga secara komputasi sulit tetapi sesuai dengan C-Steps yang
sudah tersedia dari Neykoy & Muller (2002). Namun, ketika
mengimplementasikan prosedur ini ditemukan bahwa G1 optimal cenderung
terhenti diantara himpunan bagian-himpunan bagian tanpa adanya overlap,
dimana melalui MLE yang overlap tidak muncul. Hal ini khususnya terjadi bila
diawali dengan g1 konservatif yang jauh lebih kecil dari pada n. Penggantian MLE
dengan MEL menghindari issu non-eksistensi tetapi tidak mengeliminir
kemungkinan bahwa G1 optimal yang dipilih tidak layak. Untuk menghindari
permasalahan ini digunakan pendekatan downweighting dari pendekatan
trimming, dengan memisalkan 0 < < 1 dan untuk himpunan bagian tertentu G
didapat log likelihood terboboti sebagai berikut :
, (3.1)
-
13
Persamaan (3.1) adalah fungsi log likelihood tertimbang dengan wi = 1
untuk i G dan wi = untuk i G. Pengamatan pada G diberi bobot sebesar 1 dan
pengamatan di luar G dengan bobot sebesar Pengamatan yang bukan outlier
harus berada dalam G dan pengamatan yang buruk dalam arti pembuatan
kontribusi rendah harus berada di luar G agar nilai dari Persamaan (3.1) menjadi
besar. Seperti dalam LTS untuk mengambil pengamatan yang baik dalam G,
dicari himpunan bagian G dengan ukuran #(G) = g1 dan yang bersangkutan yang memaksimumkan l(,G) diantara semua himpunan-bagian yang berukuran g1 tertentu. Untuk setiap himpunan G, biasanya relatif mudah menghitung *(G) yang optimal dari l(,G) atas . Akan tetapi, optimasi l(, G) atas dan G secara komputasi sulit tetapi dapat dilaksanakan dengan bentuk prosedur yang lebih
umum dari CSteps, sehingga diperoleh G1 optimal dengan estimator yang
bersangkutan, *(G1). Selanjutnya menentukan kriteria yang dapat dipergunakan untuk
mengidentifikasi outlier. Untuk ini, digunakan level cut-off c dengan 0 < c < 1,
kemudian pengamatan ke-i dinyatakan sebagai outlier jika yi = 1 tetapi
, atau jika yi = 0 tetapi , 1 . Alasannya di sini
adalah jika yi = 1 dan , adalah kecil, ada kemungkinan bahwa
pengamatan ke-i adalah uplier dan dengan demikian bobotnya harus diturunkan.
Selanjutnya, jika yi = 0, dan , besar, ada kemungkinan bahwa
pengamatan ke-i adalah downlier, maka bobotnya harus diturunkan. Setelah
dilakukan penurunan bobot-bobot tersebut, maka diperoleh *(G2) yang memaksimumkan l(, G2).
-
14
3.2.Algoritma
Ada beberapa hal yang harus dilengkapi dalam metode DOUW, yaitu:
pilihan akhir g1, jumlah iterasi dalam C-Steps, pilihan dan pilihan cut-off c.
Pilihan g1 dan jumlah iterasi dinyatakan dalam bentuk algoritma sebagai berikut:
1. Pilih g1=max {[(n+K+1)/2], K+1} berupa bilangan bulat, dengan
n=banyaknya pengamatan, K=banyaknya variabel regressor. Ini sesuai
dengan saran Rousseuw & Van Driessen (1999a) untuk metoda FAST-LTS.
2. Ulangi 50 kali untuk langkah-langkah berikut:
2.1.Pilih himpunan-bagian awal H (1,.n) secara acak dengan #H = K+1.
2.2.Hitung *(H), li(*(H)) dengan Persamaan (2.3) dan cari i sehingga l1(*(H)) ln(*(H)). Tetapkan G = (1,,g1).
2.3. Lakukan langkah ke-2 dalam C-Steps, yang dimulai dengan G dan
diakhiri dengan G.
2.4. Simpan 5 hasil terbaik, dari segi nilai tertinggi (*(G), G). 2.5.Untuk setiap 5 hasil terbaik ini, ulangi iterasi C-Steps hingga konvergen
(sampai 10-6).
2.6. Simpan semua himpunan-bagian G1 yang terbaik, yaitu 5 himpunan
bagian yang telah konvergen dari 50 kali proses iterasi tersebut.
3. Tentukan G2={i:(yi=1 dan , ) atau (yi=0 dan
, 1 )} dan kemudian hitung taksiran tertimbang terakhir
*(G2) yang memaksimumkan li(*,G2). Outlier adalah pengamatan di luar G2.
Selanjutnya, metode DOUW dalam bentuk flowchart sebagai berikut:
-
15
Gambar 3.1. Flowchart Metode DOUW
Ya
Tidak
Untuk J = 1 sampai 50
1. Pilih secara acak #H=K+1, dimana H (1,.n) 2. Hitung *(H), li(*(H) dan cari i sehingga l1(*(H)) ln(*(H)).
Tetapkan G = (1,,g1). 3. Lakukan langkah ke-2 dalam C-Steps yang dimulai dengan G dan diakhiri
dengan G 4. Simpan 5 hasil terbaik, dari nilai tertinggi *(G), G). 5. Untuk setiap 5 hasil terbaik ini, ulangi iterasi C-Steps hingga konvergen
(sampai 10-6). 6. Simpan semua himpunan-bagian G1 yang terbaik, yaitu 5 himpunan bagian
yang telah konvergen dari 50 kali proses iterasi tersebut.
Mulai
Tentukan g1: g1=max{[(N+K+1)/2], K+1}
Berikutnya J
G1 Konvergen
{yi = 1 dan , } atau {yi = 0 dan
, 1 }
OUTLIER
INLIER
Selesai
Hitung Taksiran Parameter
-
16
3.3.Sumber Data
Sumber data yang digunakan dalam penelitian ini adalah data hasil Survei
Penduduk Antar Sensus (SUPAS) Tahun 2005. SUPAS dilaksanakan diantara dua
Sensus Penduduk (sensus yang dilakukan pada tahun yang berakhiran 0). Selama
ini sudah dilaksanakan SUPAS tahun 1976, 1985, 1995, dan terakhir 2005.
SUPAS Tahun 2005 dirancang khusus untuk mendapatkan data ststistik
kependudukan yang dapat dibandingkan dengan hasil Sensus Penduduk 2000
(SP2000). Data yang dikumpulkan meliputi: karakteristik demografi,
ketenagakerjaan, dan sosial budaya. Karakteristik demografi yang dikumpulkan
adalah mengenai fertilitas, mortalitas dan migrasi, serta riwayat kelahiran dan
kematian anak dari wanita pernah kawin. Keterangan yang dihimpun dibidang
ketenagakerjaan mencakup lapangan usaha, jenis pekerjaan, dan status pekerjaan.
Data sosial budaya mencakup tingkat pendidikan, kondisi tempat tinggal, dan
kegiatan penduduk lanjut usia (lansia). SUPAS 2005 juga mencakup pelaporan
kejadian vital kelahiran, kematian, dan perpindahan.
3.4.Wanita Menikah Muda dan Faktor-faktor Penyebabnya
Pusat Studi Kependudukan UNPAD (dalam Warta Demografi, 2000)
melakukan penelitian terhadap wanita usia 15-45 tahun di 12 desa pada 4
kabupaten di Jawa Barat. Hasil penelitian tersebut menunjukkan bahwa rata-rata
usia nikah pertama wanita adalah 16,5 tahun.
Penentuan usia kawin muda dalam penelitian ini dibagi ke dalam dua
kategori. Kategori pertama adalah wanita yang menikah pada usia 19 tahun ke
-
17
bawah, kategori kedua adalah wanita yang menikah pada usia di atas 19 tahun.
Batasan usia nikah pertama untuk wanita didasarkan pada pendapat Bogue (1969)
yang menyatakan bahwa jika pernikahan dilakukan pada usia 19 tahun disebut
nikah muda, sedangkan jika pernikahan dilakukan pada usia 20 tahun disebut
menikah dewasa.
Dari temuan-temuan mengenai pernikahan pada usia muda di atas, faktor
orang tua dalam kehidupan anak sangat berperan bahkan sangat menentukan
kapan anaknya tersebut harus menikah (Siswono, 1990). Masih ada pandangan
dalam masyarakat bahwa menstruasi pertama bagi seorang gadis merupakan tanda
kedewasaan yang kemudian mendorong para orang tua untuk segera menikahkan
anak gadisnya. Bahkan sering terjadi adanya pemalsuan usia bagi anak gadisnya,
dengan tujuan agar anak gadisnya tersebut bisa segera dinikahkan (Hanum, 1997).
Faktor-faktor lain selain faktor orang tua seperti disebutkan pada paragraf
sebelumnya adalah: (1) rendahnya pendidikan, (2) kemiskinan, (3) isolasi daerah,
(4) terbatasnya lapangan pekerjaan, dan (5) rendahnya mobilitas (Warta
Demografi, 2000).
Hasil penelitian Siswono (1999) menyatakan bahwa karakteristik individu
yang berpengaruh pada wanita menikah muda terdiri dari: (1) tingkat pendidikan
yang ditamatkan, (2) agama yang dianut, (3) status tempat tinggal, (4) status
bekerja, dan (5) status migran. Faktor pendidikan berpengaruh terhadap usia
pernikahan seseorang dan mampu meningkatkan usia pernikahan pertama bagi
wanita. Sementara itu, wanita yang bekerja dan berstatus migran memiliki
-
18
kemungkinan menikah usia muda lebih kecil jika dibandingkan dengan yang tidak
bekerja dan berstatus non migran.
Kemungkinan-kemungkinan penyebab dari tingginya persentase wanita
menikah muda di Provinsi Jawa Barat (71,37 persen) dapat ditampilkan dalam
bentuk Model Regresi Logistik Biner. Analisis Regresi Logistik Biner digunakan
karena merupakan sebuah metode yang optimal untuk analisis regresi dengan
variabel respon biner. Dalam penelitian ini variabel respon yang dimaksud terdiri
dari 2 (dua) kategori yaitu: wanita menikah muda (menikah usia 19 tahun ke
bawah) dan wanita menikah dewasa (menikah usia di atas 19 tahun).
3.5.Variabel-variabel yang Digunakan
Dari gambaran data di atas, maka variabel-variabel yang digunakan dalam
penelitian ini adalah :
Variabel Respon (Y):
Jenis Pernikahan, dikategorikan menjadi 2 kategori yaitu:
1 : Menikah Muda (menikah umur 19 tahun)
0 : Menikah Dewasa (menikah umur > 19 tahun)
Variabel Regressor (X):
X1 : Lama bersekolah (tahun)
X2 : Agama yang dianut, dikategorikan menjadi 2 kategori yaitu:
1 : Islam 0 : Non Islam
X3 : Status Tempat Tinggal, dikategorikan menjadi 2 kategori yaitu:
1 : Perdesaan 0 : Perkotaan
-
19
X4 : Status Bekerja, dikategorikan menjadi 2 kategori yaitu:
1 : Bekerja 0 : Tidak Bekeja
X5 : Status Migran, dikategorikan menjadi 2 kategori yaitu:
1 : Migran 0 : Non Migran
-
20
BAB IV
HASIL DAN PEMBAHASAN
4.1.Pendahuluan
Pada Bab ini akan ditampilkan deskripsi data hasil SUPAS 2005 yang
ditampilkan dalam bentuk crosstabs antara jenis pernikahan (variabel respon)
dengan variabel regressor yaitu: agama, status tempat tinggal, status bekerja,
status migran dan lama sekolah. Selain itu juga, disajikan hasil pendeteksian
outlier pada Regresi Logistik Biner dengan Metode DOUW untuk data SUPAS
Tahun 2005 di Kabupaten Sukabumi dan Provinsi Jawa Barat, seperti tercantum
dalam Lampiran 1 dan Lampiran 2. Pengolahan data dilakukan dengan
menggunakan Program SAS 9.2, syntax dalam bahasa SAS dapat dilihat pada
Lampiran 5).
Pendeteksian outlier pada data Kabupaten Sukabumi ditampilkan dengan
beberapa kemungkinan nilai weight ( dan level cut off (c). Nilai-nilai dan c
yang digunakan adalah 0.01, 0.05 dan 0.10. Penggunaan beberapa nilai-nilai
dan c dilakukan pada data Kabupaten Sukabumi karena proses komputasinya
tidak memerlukan waktu yang lama, untuk satu kali proses run data memerlukan
waktu sekitar 10 sampai dengan 15 menit. Selanjutnya dari output yang
dihasilkan, bisa diperoleh gambaran pola sebagai akibat penggunaan pasangan
nilai dan c, baik terhadap jumlah outlier yang terdeteksi maupun taksiran
parameter yang diperoleh.
-
21
Sedangkan untuk pendeteksian outlier Provinsi Jawa Barat digunakan nilai
= 0.05 dan c = 0.05. Penggunaan salah satu pasangan nilai dan c dalam proses
pengolahan data pada Provinsi Jawa Barat merupakan salah satu contoh saja. Hal
tersebut dilakukan karena untuk satu kali proses run data untuk Provinsi Jawa
Barat memerlukan waktu yang cukup lama, sekitar 1 jam lebih untuk satu proses.
4.2.Deskripsi Data Hasil SUPAS 2005
Pada bagian ini akan disajikan ringkasan data yang berhubungan dengan
wanita menikah muda dan faktor-faktor yang mempengaruhinya, yaitu: agama,
status tempat tinggal, status bekerja, status migran dan lama sekolah. Pada Tabel
4.1. di bawah, menunjukkan bahwa secara nasional persentase wanita menikah
muda masih tinggi sebesar 61.9%. Provinsi yang memiliki persentase wanita
menikah muda paling tinggi adalah Jawa Barat sebesar 71.4%. Sedangkan
provinsi yang memiliki persentase wanita menikah mudanya paling rendah adalah
Nusa Tenggara Timur sebesar 38.5%.
Sungguh merupakan suatu phenomena yang cukup menarik untuk dikaji
lebih dalam, bagi sebuah provinsi seperti Provinsi Jawa Barat, provinsi yang
berbatasan langsung dengan ibu kota negara, atau sebagai sebuah provinsi
penyangga ibu kota, ternyata persentase wanita menikah mudanya paling tinggi.
Dari segi sarana dan prasarana pendidikan, Provinsi Jawa Barat juga merupakan
provinsi dimana terletak beberapa perguruan tinggi ternama di Indonesia, sebut
saja: ITB, Unpad, IPB, UI, dan perguruan tinggi lainnya yang tidak kalah
kualitasnya. Tentunya hal ini merupakan suatu tantangan bagi pihak-pihak terkait
-
22
untuk segera merumuskan sebuah kebijakan stategis dan terobosan yang berani,
khususnya dalam peningkatan usia menikah bagi masyarakat Provinsi Jawa Barat.
Tabel 4.1. Persentase Wanita Menikah menurut Jenis Pernikahan dan Provinsi di Indonesia Tahun 2005
No Provinsi Jenis Pernikahan
Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Sumatera Utara 55.88 44.12 2 Sumatera Barat 46.98 53.02 3 Riau 46.99 53.01 4 Jambi 33.95 66.05 5 Sumatera Selatan 40.21 59.79 6 Bengkulu 35.63 64.37 7 Lampung 35.58 64.42 8 Bangka Belitung 43.28 56.72 9 Kepulauan Riau 60.90 39.10 10 DKI Jakarta 54.07 45.93 11 Jawa Barat 28.63 71.37 12 Jawa Tengah 34.76 65.24 13 DI Yogyakarta 53.90 46.10 14 Jawa Timur 31.53 68.47 15 Banten 33.64 66.36 16 Bali 56.50 43.50 17 Nusa Tenggara Barat 39.79 60.21 18 Nusa Tenggara Timur 61.46 38.54 19 Kalimantan Barat 44.71 55.29 20 Kalimantan Tengah 39.11 60.89 21 Kalimantan Selatan 34.22 65.78 22 Kalimantan Timur 45.33 54.67 23 Sulawesi Utara 59.98 40.02 24 Sulawesi Tengah 42.23 57.77 25 Sulawesi Selatan 44.53 55.47 26 Sulawesi Tenggara 39.02 60.98 27 Gorontalo 50.75 49.25 28 Maluku 59.78 40.22 29 Maluku Utara 48.92 51.08 30 Papua 43.07 56.93
INDONESIA 38.09 61.91
Sumber : SUPAS 2005, diolah.
-
23
Untuk meneliti lebih dalam mengenai tingginya persentase wanita
menikah muda di Provinsi Jawa Barat, akan ditunjukkan keadaan wanita menikah
muda menurut faktor-faktor yang mempengaruhinya. Tabel 4.2. menampilkan
persentase wanita menikah menurut jenis pernikahan dirinci menurut
kabupaten/kota.
Tabel 4.2. Persentase Wanita Menikah menurut Jenis Pernikahan dan Kabupaten/Kota di Provinsi Jawa Barat Tahun 2005
No Kabupaten/Kota Jenis Pernikahan
Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Bogor 29.40 70.60 2 Sukabumi 16.78 83.22 3 Cianjur 15.37 84.63 4 Bandung 29.30 70.70 5 Garut 21.77 78.23 6 Tasikmalaya 20.42 79.58 7 Ciamis 21.31 78.69 8 Kuningan 27.39 72.61 9 Cirebon 26.10 73.90 10 Majalengka 20.18 79.82 11 Sumedang 17.08 82.92 12 Indramayu 18.89 81.11 13 Subang 22.33 77.67 14 Purwakarta 23.59 76.41 15 Karawang 23.08 76.92 16 Bekasi 30.61 69.39 17 Bogor 47.61 52.39 18 Sukabumi 36.78 63.22 19 Kota Bandung 50.89 49.11 20 Kota Cirebon 47.89 52.11 21 Kota Bekasi 53.24 46.76 22 Kota Depok 50.02 49.98 23 Kota Cimahi 51.97 48.03 24 Kota Tasikmalaya 34.68 65.32 25 Kota Banjar 28.99 71.01
PROVINSI JAWA BARAT 28.63 71.37
Sumber : SUPAS 2005, diolah.
-
24
Pada Tabel 4.2. di atas, memperlihatkan bahwa terdapat 4 kabupaten yang
persentase wanita menikah muda di atas 80 persen, yakni: Sukabumi 83.22
persen, Cianjur 84.63 persen, Sumedang 82.92 persen dan Indramayu 81.11
persen. Sementara itu terdapat 4 kota yang memiliki persentase wanita menikah
muda di bawah 50 persen, yakni: Bandung 49.11 persen, Bekasi 46.76 persen,
Depok 49.98 persen dan Cimahi 48.03 persen.
Secara ringkas, Kabupaten Cianjur merupakan kabupaten dengan
persentase wanita menikah muda tertinggi di Provinsi Jawa Barat, sedangkan Kota
Bekasi merupakan kota dengan persentase wanita menikah muda terendah.
Dalam bentuk gambar visual dapat dilihat pada Gambar 4.1. berikut:
Gambar 4.1. Persentase Wanita Menikah Muda menurut Kabupaten/Kota di Provinsi Jawa Barat
0
10
20
30
40
50
60
70
80
90
Bog
orSu
kabu
mi
Cia
njur
Ban
dung
Gar
utTa
sikm
alay
aC
iam
isK
unin
gan
Cire
bon
Maj
alen
gka
Sum
edan
gIn
dram
ayu
Suba
ngPu
rwak
arta
Kar
awan
gB
ekas
iB
ogor
Suka
bum
iB
andu
ngC
irebo
nB
ekas
iD
epok
Cim
ahi
Tasi
kmal
aya
Ban
jar
70.6
83 85
7178 80 79
73 7480
83 8178 76 77
69
52
63
4952
4750 48
6571
-
25
Sedangkan dalam Gambar 4.2. di bawah berikut ini menggambarkan
persentase wanita menikah menurut jenis pernikahan:
Gambar 4.2. Persentase Wanita Menikah Muda dan Dewasa di Provinsi Jawa Barat
Selanjutnya, salah satu faktor yang mempengaruhi wanita menikah muda adalah
agama. Tabel 4.2. di bawah menampilkan persentase wanita menikah menurut
jenis pernikahan berdasarkan agama yang dianut.
Tabel 4.3. Persentase Wanita Menikah menurut Jenis Pernikahan dan Agama yang Dianut di Provinsi Jawa Barat Tahun 2005
No Agama Jenis Pernikahan
Menikah Dewasa Menikah Muda
(1) (2) (3) (4)
1 Non Islam 77.13 22.87
2 Islam 27.64 72.36
Sumber : SUPAS 2005, diolah.
71.37
28.63
Wanita Menikah Muda
Wanita Menikah Dewasa
-
26
Dalam bentuk gambar, persentase wanita menikah menurut jenis pernikahan dan
agama, seperti terlihat pada Gambar 4.3. berikut ini:
Gambar 4.3. Persentase Wanita Menikah menurut Jenis Pernikahan dan Agama di Provinsi Jawa Barat
Pada Tabel 4.3. memperlihatkan bahwa wanita yang beragama Islam
memiliki persentase menikah muda jauh lebih tinggi (72.36%) jika dibanding
dengan wanita non Islam (22.87%). Dari data tersebut dapat disimpulkan bahwa
wanita yang beragama non Islam cenderung melakukan pernikahan pada usia
dewasa, sebaliknya terjadi pada wanita yang beragama Islam cenderung menikah
pada usia muda.
Sementara itu, Tabel 4.4. di bawah memperlihatkan bahwa wanita yang
tinggal di perdesaan cenderung melangsungkan pernikahan di usia muda.
Sedangkan yang bertempat tinggal di perkotaan cenderung melangsungkan
pernikahan pada usia dewasa.
MenikahDewasa
MenikahMuda
0
10
20
30
40
50
60
70
80
NonIslamIslam
-
27
Tabel 4.4. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Tempat Tinggal di Provinsi Jawa Barat Tahun 2005
No Status Tempat Tinggal Jenis Pernikahan
Menikah Dewasa Menikah Muda
(1) (2) (3) (4)
1 Perkotaan 77.13 22.87
2 Perdesaan 27.64 72.36
Sumber : SUPAS 2005, diolah.
Persentase wanita menikah menurut jenis pernikahan dan status tempat
tinggal dalam bentuk gambar adalah:
Gambar 4.4. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Tempat Tinggal di Provinsi Jawa Barat
Jika dilihat dari persentase jenis pernikahan dan status bekerja wanita
dapat dilihat pada Tabel 4.5 di bawah ini:
MenikahDewasa
MenikahMuda
0
20
40
60
80
100
PerkotaanPerdesaan
-
28
Tabel 4.5. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Bekerja di Provinsi Jawa Barat Tahun 2005
No Status Bekerja Jenis Pernikahan
Menikah Dewasa Menikah Muda
(1) (2) (3) (4)
1 Tidak Bekerja 28.60 71.40
2 Bekerja 28.69 71.31
Sumber : SUPAS 2005, diolah.
Secara umum baik wanita bekerja maupun tidak bekerja, cenderung melakukan
pernikahan pada usia muda. Akan tetapi wanita yang berstatus tidak bekerja
memiliki kecenderungan menikah pada usia muda daripada wanita yang bekerja,
walaupun perbedaannya sangat kecil. Dalam bentuk gambar dapat disajikan
sebagai berikut:
Gambar 4.5. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Bekerja Tinggal di Provinsi Jawa Barat
0 20 40 60 80
TidakBekerja
Bekerja
MenikahMuda
MenikahDewasa
-
29
Selanjutnya, Tabel 4.6. menampilkan wanita menikah menurut jenis
pernikahan dan status migran. Tabel 4.6 di bawah menunjukkan bahwa wanita
yang berstatus migran cenderung melakukan pernikahan di usia muda dari pada
wanita yang berstatus non migran. Baik wanita berstatus migran atau pun non
migran, wanita cenderung menikah pada usia muda, hal ini terlihat dari persentase
menikah muda untuk masing-masing, yaitu wanita berstatus non migran sebesar
61.89 persen dan migran sebesar 71.39 persen.
Tabel 4.6. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Migran di Provinsi Jawa Barat Tahun 2005
No Status Migran Jenis Pernikahan
Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Non Migran 38.11 61.89
2 Migran 28.61 71.39 Sumber : SUPAS 2005, diolah.
Dalam bentuk visualisasi gambar dapat dilihat pada Gambar 4.6. berikut ini:
Gambar 4.6. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Migran di Provinsi Jawa Barat
0 20 40 6080
NonMigran
Migran
MenikahMuda
MenikahDewasa
-
30
Selanjutnya, persentase wanita menurut jenis pernikahan dan lama sekolah dapat
dilhat pada Tabel 4.7. berikut ini:
Tabel 4.7. Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama Sekolah di Provinsi Jawa Barat Tahun 2005
No Lama Sekolah (Tahun) Jenis Pernikahan
Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 0 13.67 86.33 2 1 11.90 88.10 3 2 11.66 88.34 4 3 15.19 84.81 5 4 11.77 88.23 6 5 13.36 86.64 7 6 19.55 80.45 8 7 27.71 72.29 9 8 29.01 70.99 10 9 31.98 68.02 11 10 39.34 60.66 12 11 42.40 57.60 13 12 69.72 30.28 14 13 87.91 12.09 15 14 81.78 18.22 16 15 89.69 10.31 17 16 91.66 8.34 18 17 83.72 16.28 19 > 19 100.00 0.00
Sumber : SUPAS 2005, diolah.
Dari Tabel 4.7. di atas terlihat bahwa wanita yang lama pendidikannya 6
tahun (jika dikonversi hampir sama dengan lulus SD), persentase menikah
mudanya di atas 80 persen, sementara itu wanita yang lama pendidikannya 9
-
31
tahun (lulus SMP), persentase menikah mudanya berada di sekitar 70 persen dan
lama pendidikannya 12 tahun (lulus SMA), persentase menikah mudanya antara
30-61 persen.
Dari Tabel 4.7. di atas, terlihat dengan jelas adanya pola, bahwa semakin
lama seseorang wanita menamatkan pendidikannya, maka semakin kecil
persentase menikah mudanya. Artinya bahwa wanita yang berpendidikan lebih
tinggi cenderung melangsungkan pernikahannya pada usia dewasa.
Dalam bentuk gambar dapat dilihat pada Gambar 4.7. berikut:
Gambar 4.7. Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama Sekolah di Provinsi Jawa Barat
4.3.Pendeteksian Outlier untuk Data SUPAS 2005 Kabupaten Sukabumi
Menurut data SUPAS 2005, persentase wanita menikah muda di
Kabupaten Sukabumi sebesar 83.22 persen. Ukuran sampel (n) pada data SUPAS
0
20
40
60
80
100
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 >19
MenikahMuda
MenikahDewasa
LamaSekolah(tahun)
-
32
2005 Kabupaten Sukabumi sebanyak 967 pengamatan, yang merupakan penduduk
wanita berumur 10 tahun keatas yang pernah menikah. Jumlah variabel regressor
(K) sebanyak 5, yaitu: Agama yang Dianut, Status Tempat tinggal, Status Bekeja,
Status Migran dan Lama Sekolah, sedangkan variabel responnya adalah Jenis
Pernikahan. Berikut ini adalah ringkasan output hasil pendeteksian outlier:
Dengan mengacu pada langkah-langkah seperti yang tercantum pada
Lampiran 3 dan 4, maka didapat hasil seperti tercantum pada Tabel 4.1 berikut ini:
Tabel 4.8. Banyaknya Pengamatan yang Terdeteksi sebagai Outlier dengan Metode DOUW dan Deviance Residual
Epsilon Level Cut Off (C)
() 0.01 0.05 0.10
(1) (2) (3) (4)
0.01 19 97 108
0.05 0 75 103
0.10 0 75 97
Deviance Residual 27
Pada Tabel 4.8. ditunjukkan bahwa dengan menggunakan nilai = 0.01
dan untuk nilai c = 0.01, 0.05 dan 0.10, dihasilkan banyaknya pengamatan yang
terdeteksi sebagai outlier masing-masing sebanyak 19, 97, dan 108. Sementara,
jika menggunakan nilai = 0.05 dan nilai c = 0.01, 0.05 dan 0.10, dihasilkan
banyaknya pengamatan yang terdeteksi sebagai outlier masing-masing sebanyak
-
33
0, 75, dan 103. Sedangkan jika menggunakan nilai = 0.10 dan nilai c = 0.01,
0.05 dan 0.10, dihasilkan banyaknya pengamatan yang terdeteksi sebagai outlier
masing-masing sebanyak 0, 75, dan 97.
Akan tetapi jika menggunakan nilai c = 0.01 dan nilai = 0.01, 0.05, dan
0.10, banyaknya pengamatan yang terdeteksi sebagai outlier masing-masing
sebanyak 19, 0, dan 0. Sementara, jika menggunakan nilai c = 0.05 dan nilai =
0.01, 0.05 dan 0.10, banyaknya pengamatan yang terdeteksi sebagai outlier
masing-masing sebanyak 97, 75, dan 75. Sedangkan jika menggunakan nilai c =
0.10 dan nilai = 0.01, 0.05 dan 0.10, dihasilkan banyaknya pengamatan yang
terdeteksi sebagai outlier masing-masing sebanyak 108, 103, dan 97. Sedangkan
jika menggunakan deviance residual untuk masing-masing pengamatan, jumlah
outlier yang terdeteksi sebanyak 27 pengamatan.
Dari ringkasan Tabel 4.8. di atas memperlihatkan, bahwa untuk nilai
tertentu dan nilai c yang semakin mendekati 1, maka banyaknya pengamatan yang
terdeteksi sebagai outlier semakin banyak. Sedangkan untuk nilai c tertentu dan
nilai yang semakin mendekati 0, maka banyaknya pengamatan yang terdeteksi
sebagai outlier semakin sedikit.
Sementara, jika pendeteksian outlier dengan cara menghitung deviance
residual-nya, maka jumlah outlier yang terdeteksi sebanyak 27 pengamatan.
Apabila dibandingkan antara metode deviance residual dengan metode DOUW,
maka jumlah outlier yang terdeteksi oleh metode deviance residual hampir sama
dengan metode DOUW untuk pasangan nilai = 0.01 dan nilai c antara 0.01-
-
34
0.05. Secara grafik, penjelasan untuk penggunaan pasangan nilai = 0.01 dan
c=0.01 dapat dilihat pada Gambar 4.8. berikut:
Gambar 4.8. Scatter Plot antara Observasi dengan Probabilitas (G) pada Data SUPAS 2005 Kabupaten Sukabumi
(untuk n=967, K=5, =0.01, C=0.01)
Pada Gambar 4.8. di atas, menggambarkan sebaran peluang masing-
masing pengamatan untuk data SUPAS 2005 Kabupaten Sukabumi (n=967, K=5,
=0.01, dan c=0.01). Tanda segitiga merupakan pengamatan yang terdeteksi
sebagai outlier, sedangkan tanda bulat merupakan pengamatan yang bukan
outlier (inlier). Pengamatan yang terdeteksi sebagai outlier sebanyak 19
Inlier Outlier
-
35
pengamatan. Selanjutnya, untuk memperlihatkan taksiran parameter regresi
logistik biner pada berbagai pasangan nilai dan c, dapat dilihat pada Tabel 4.9.
berikut:
Tabel 4.9. Taksiran Parameter untuk masing-masing Nilai dan c (untuk n=967 dan K=5)
Metode DOUW Taksiran Parameter () Variabel Regressor
Iterasi Awal -0.219096 1.463611 0.07805 -0.017111 -0.289625 -0.064513
Itera
si A
khir
=0.01, C=0.01 -2.228715 28.561103 0.745062 -1.017507 -20.60555 -0.501863
=0.01, C=0.05 6.009056 27.946053 0.991507 -0.932734 -25.14176 -0.768705
=0.01, C=0.10 1.569823 28.53216 1.304153 -1.677466 -20.35584 -0.865654
=0.05, C=0.01 -1.693234 24.742933 0.081209 -0.08635 -19.11177 -0.345153
=0.05, C=0.05 -0.495424 24.879487 0.672546 -0.88321 -18.68798 -0.499501
=0.05, C=0.10 0.630008 27.354837 0.849183 -0.743998 -20.39371 -0.66003
=0.10, C=0.01 -0.731997 25.751983 0.073094 -0.086068 -21.23428 -0.328101
=0.10, C=0.05 -0.645959 24.642839 0.618584 -0.775922 -18.6353 -0.46836
=0.10, C=0.10 0.761374 26.69478 0.484053 -0.415487 -20.80062 -0.581004
Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama
= Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran = Taksiran Parameter untuk Variabel Lama Sekolah
Ringkasan output pada Tabel 4.9. memperlihatkan perubahan taksiran
parameter regresi logistik biner yang dihasilkan dari iterasi pertama sampai iterasi
-
36
terakhir dengan metode DOUW. Taksiran parameter pada iterasi awal untuk
setiap pasangan nilai dan c adalah =-0.219096, =1.463611, =0.07805,
= -0.017111, = -0.289625, dan = -0.064513. Taksiran parameter pada
iterasi awal maksudnya adalah taksiran parameter yang diperoleh dari data tanpa
memperhatikan data tersebut ada atau tidaknya pengamatan yang merupakan
outlier. Sedangkan taksiran parameter pada iterasi akhir adalah taksiran parameter
yang dihasilkan setelah memperhatikan adanya outlier, sehingga taksiran
parameter yang diperoleh pada iterasi akhir merupakan taksiran parameter yang
robust.
Apabila diperhatikan pada Tabel 4.9. di atas, maka terlihat bahwa
perubahan nilai taksiran parameter pada seluruh variabel regressor dari iterasi
awal ke iterasi akhir mengalami perubahan nilai yang sangat signifikans. Sebagai
contoh, nilai taksiran parameter pada iterasi awal untuk =1.463611, berubah
menjadi = 28.561103 pada iterasi akhir untuk =0.01 dan c=0.01. Bahkan
untuk seluruh pasangan dan c berapa pun mengalami peningkatan yang sangat
signifikans. Dari hasil ini memperlihatkan bahwa pengaruh dari keberadaan
outlier sangat serius terhadap taksiran parameter, khususnya pada regresi logistik
biner. Sehingga secara otomatis akan berpengaruh terhadap model regresi logistik
biner yang dihasilkan dan tentunya akan menentukan kesimpulan akhir dari suatu
permasalahan.
Berikutnya, dari metode DOUW ini dapat ditunjukkan keberadaan outlier
dan hasil taksiran parameternya untuk berbagai pasangan nilai dan c pada Tabel
4.10. di bawah ini:
-
37
Tabel 4.10. Taksiran Parameter () untuk masing-masing Nilai dan c, serta Banyaknya Outlier yang Terdeteksi dengan Metode DOUW
(Untuk n=967 dan K=5) dan Deviance Residual
Metode DOUW Taksiran Parameter () Variabel Regressor Banyak
Outlier
=0.01, C=0.01 -2.228715 28.561103 0.745062 -1.017507 -20.60555 -0.501863 19
=0.01, C=0.05 6.009056 27.946053 0.991507 -0.932734 -25.14176 -0.768705 97
=0.01, C=0.10 1.569823 28.53216 1.304153 -1.677466 -20.35584 -0.865654 108
=0.05, C=0.01 -1.693234 24.742933 0.081209 -0.08635 -19.11177 -0.345153 0
=0.05, C=0.05 -0.495424 24.879487 0.672546 -0.88321 -18.68798 -0.499501 75
=0.05, C=0.10 0.630008 27.354837 0.849183 -0.743998 -20.39371 -0.66003 103
=0.10, C=0.01 -0.731997 25.751983 0.073094 -0.086068 -21.23428 -0.328101 0
=0.10, C=0.05 -0.645959 24.642839 0.618584 -0.775922 -18.6353 -0.46836 75
=0.10, C=0.10 0.761374 26.69478 0.484053 -0.415487 -20.80062 -0.581004 97
Deviance Residual 27
Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama
= Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran
= Taksiran Parameter untuk Variabel Lama Sekolah
Tabel 4.10. di atas menampilkan ringkasan output yang memperlihatkan
banyaknya pengamatan yang terdeteksi sebagai outlier dan sekaligus
mendapatkan taksiran parameter yang robust. Hal ini merupakan tujuan utama
dari metode DOUW yaitu: mendeteksi outlier sekaligus mendapatkan taksiran
parameter regresi logistik biner yang robust. Sedangkan jika menggunakan
-
38
metode deviance residual, taksiran parameternya tidak ada, karena metode ini
hanya untuk mendeteksi outlier saja.
Taksiran parameter yang dihasilkan dengan menggunakan metode
DOUW, untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan
nilai yang tidak terlalu jauh berbeda dan tidak merubah tanda pada taksiran
parameternya, walaupun banyaknya outlier yang terdeteksi tidak sama. Seperti
yang telah dijelaskan pada pembahasan Tabel 4.8. sebelumnya, bahwa semakin
besar nilai c yang digunakan, maka semakin banyak pula pengamatan yang
terdeteksi sebagai outlier, begitu juga sebaliknya, semakin kecil nilai c yang
digunakan, maka semakin sedikit pula pengamatan yang terdeteksi sebagai
outlier. Berbeda dengan penggunaan nilai , semakin besar menggunakan nilai ,
maka semakin sedikit outlier yang terdeteksi dan semakin kecil nilai yang
digunakan, maka akan semakin banyak outlier yang terdeteksi. Secara garis besar,
penggunaan nilai c berbanding lurus dengan banyaknya outlier yang terdeteksi.
Sedangkan penggunaan nilai berbanding terbalik dengan banyaknya outlier
yang terdeteksi.
Dari Tabel 4.10. memperlihatkan bahwa taksiran parameter yang
dihasilkan dengan metode DOUW untuk nilai =0.01 dan c=0.01 adalah = -
2.228715, =28.561103, =0.745062, = -1.017507, = -20.60555, dan =
-0.501863, banyaknya pengamatan yang terdeteksi sebagai outlier sebanyak 19
pengamatan, yaitu: pengamatan nomor: 18, 25, 31, 75, 184, 213, 275, 374, 411,
501, 559, 646, 672, 711, 722, 731, 800, 891, dan 927. Sedangkan jumlah outlier
yang terdeteksi oleh metode devians residual sebanyak 27 pengamatan, yaitu
-
39
pengamatan nomor: 18, 25, 28, 31, 75, 135, 146, 184, 191, 213, 229, 275, 374,
411, 415, 501, 559, 646, 662, 672, 711, 722, 731, 733, 800, 891, dan 927. Jika
diperhatikan, nomor pengamatan yang terdeteksi sebagai outlier oleh metode
DOUW, maka akan terdeteksi juga oleh metode deviance residual, begitu juga
sebaliknya. Masing-masing banyaknya pengamatan yang terdeteksi sebagai
outlier beserta nomor pengamatan secara lengkap untuk masing-masing pasangan
dan c dapat dilihat pada Lampiran 6.
Pada Tabel 4.10. di atas, menunjukkan variabel Agama dan Status Tempat
Tinggal wanita bernilai positif, hal ini berarti bahwa orang yang beragana Islam
atau orang yang bertempat tinggal di perdesaan memiliki kecenderungan untuk
melangsungkan pernikahannya pada usia muda. Sedangkan variabel yang bernilai
negatif adalah variabel Status Bekerja, Status Migran, dan Lama Sekolah, hal ini
berarti bahwa, wanita yang bekerja atau berstatus migran atau semakin lama masa
pendidikannya, memiliki kecenderungan untuk menikah pada usia dewasa.
4.4. Pendeteksian Outlier untuk Data SUPAS 2005 Provinsi Jawa Barat
Menurut data SUPAS 2005, persentase wanita menikah muda di Provinsi
Jawa Barat sebesar 71,37 persen, merupakan persentase tertinggi dibandingkan
dengan provinsi lainnya di Indonesia. Ukuran sampel (n) pada data SUPAS 2005
untuk Provinsi Jawa Barat sebanyak 21.772 pengamatan, yang merupakan
penduduk wanita berumur 10 tahun keatas yang pernah menikah. Berikut ini
adalah ringkasan output hasil pendeteksian outlier sekaligus taksiran
parameternya.
-
40
Tabel 4.11. Taksiran Parameter () dan Banyaknya Outlier yang Terdeteksi oleh
Metode DOUW (n=21772, K=5, =0.05 & c=0.05) dan Deviance Residual, serta Nilai Odds Ratio
Metode DOUW Taksiran Parameter () Variabel Regressor Banyak
Outlier
Iterasi Awal 0.206886 0.483644 0.216507 -0.02973 0.175381 -0.08526
Iterasi Akhir 0.10830 2.796836 1.429871 -0.12015 1.406145 -0.44967 1.329
Deviance Residual 663
Odds Ratio 16.39 4.18 0.89 4.08 0.64
Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama
= Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran
= Taksiran Parameter untuk Variabel Lama Sekolah
Pada Tabel 4.11. di atas menunjukkan bahwa banyaknya outlier yang
terdeteksi menggunakan metode DOUW sebanyak 1.329 pengamatan, rincian
nomor pengamatan yang terdeteksi sebagai outlier dapat dilihat pada Lampiran 7.
Sedangkan jika menggunakan metode deviance residual terdeteksi sebanyak 663
pengamatan. Tabel 4.11 juga menunjukkan bahwa variabel Agama, Status Tempat
Tinggal, dan Status Migran bernilai positif, hal ini berarti bahwa wanita yang
beragama Islam atau bertempat tinggal di perdesaan atau berstatus migran
memiliki kecenderungan untuk melangsungkan pernikahannya pada usia muda.
Sedangkan variabel yang bernilai negatif adalah variabel Status Bekerja dan Lama
Sekolah, hal ini berarti bahwa, wanita yang bekerja atau semakin lama masa
pendidikan seorang wanita, memiliki kecenderungan untuk menikah pada usia
dewasa.
-
41
Sementara itu, diperoleh taksiran parameter untuk masing-masing variabel
regressor sebesar =0.10830, =2.796836, =1.429871, = -0.12015, =
1.406145, dan = -0.44967. Sehingga model regresi logistik biner dapat
dinyatakan sebagai berikut:
exp 0.10830 2.796836 1.429871 0.12015 1.406145 0.44967
1 exp 0.10830 2.796836 1.429871 0.12015 1.406145 0.44967
Dimana: X1 adalah Variabel Agama X2 adalah Variabel Status Tempat Tinggal X3 adalah Variabel Status Status Bekerja X4 adalah Variabel Status Status Migran X5 adalah Variabel Status Lama Sekolah
Selanjutnya untuk menginterpretasikan taksiran parameter dalam model
regresi logistik biner, digunakan Odds Ratio, yang diperoleh melalui exponensial
dari . Odds Ratio menggambarkan risiko kecenderungan suatu kategori tertentu
terhadap kategori lainnya (reference category) dalam satu variabel regressor atau
suatu nilai tertentu terhadap nilai lainnya dalam satu variabel tertentu. Odds ratio
untuk masing-masing variabel adalah sebagai berikut:
a. Variabel Agama sebesar 16.39, artinya wanita yang beragama Islam
memiliki kecenderungan menikah muda 16.39 kali dibandingkan dengan
wanita yang beragama non-Islam.
b. Variabel Status Tempat Tinggal sebesar 4.18, artinya wanita yang
bertempat tinggal di perdesaan memiliki kecenderungan menikah muda 4.18
kali dibandingkan dengan wanita yang bertempat tinggal di perkotaan.
-
42
c. Variabel Status Bekerja sebesar 0.89, artinya wanita yang bekerja memiliki
kecenderungan menikah muda 0.89 kali dibandingkan dengan wanita yang
tidak bekerja, atau orang yang tidak bekerja memiliki kecenderungan menikah
muda 1.12 kalinya dibandingkan dengan orang yang bekerja.
d. Variabel Status Migran sebesar 4.08, artinya wanita yang berstatus migran
memiliki kecenderungan menikah muda 4.08 kali dibandingkan dengan wanita
yang non migran.
e. Variabel Lama Sekolah 0.64, artinya wanita yang lama pendidikannya t
tahun memiliki kecenderungan menikah muda sebesar 0.64 kali dibandingkan
dengan wanita yang lama pendidikannya t-1 tahun. Oleh karena variabel lama
sekolah bersifat kontinu, untuk memudahkan dalam menginterpretasikan nilai
odds ratio-nya, maka interpretasi dilakukan untuk setiap 3 tahunan. Dari hasil
perhitungan, {exp(3(-0.44967)}, diperoleh nilai odds ratio untuk 3 tahunan
sebesar 0.26. Artinya, wanita yang lama sekolahnya 6 tahun (lulus SD)
memiliki kecenderungan menikah muda 0.16 kali dibandingkan dengan wanita
yang lama pendidikannya 3 tahun (berhenti di kelas 4 SD), atau wanita yang
sekolahnya berhenti di kelas 4 SD memiliki kecenderungan menikah muda
sebesar 3.85 kali dibandingkan dengan wanita yang lulus SD. Atau contoh
lainnya, wanita yang lulus SMP memiliki kecenderungan menikah muda
sebesar 3.85 kali dibandingkan dengan wanita yang lulus SMA. Walaupun
Odds Ratio untuk setiap 3 tahunan tingkat pendidikan sama, akan tetapi risiko
wanita menikah muda untuk masing-masing tingkatan pendidikan tidaklah
sama. Sebagai contoh, odds ratio wanita yang lulus SMP dengan yang lulus
-
43
SMA nilainya sama dengan odds ratio wanita yang lulus SMA dengan wanita
yang lulus D3 sama, akan tetapi risiko menikah muda wanita lulus D3 dengan
wanita yang lulus SMA tidak sama. Hal ini berlaku untuk setiap tingkatan
pendidikan.
-
44
BAB V
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Pada bab sebelumnya telah dijelaskan bahwa metode DOUW merupakan
suatu prosedur untuk mendeteksi outlier dalam arah y. Dalam metode DOUW,
ada empat hal yang harus dilengkapi yaitu: penentuan g1 yang optimal, jumlah
iterasi, pilihan (weight), dan pilihan level cut off (c). Berdasarkan hasil dan
pembahasan pada bab sebelumnya, maka dapat diambil beberapa kesimpulan
sebagai berikut:
1. Untuk nilai tertentu dan nilai c yang semakin mendekati 1, maka banyaknya
pengamatan yang terdeteksi sebagai outlier semakin banyak. Sedangkan
untuk nilai c tertentu dan nilai yang semakin mendekati 0, maka banyaknya
pengamatan yang terdeteksi sebagai outlier semakin sedikit.
2. Perubahan nilai taksiran parameter pada seluruh variabel regressor dari iterasi
awal ke iterasi akhir mengalami perubahan yang sangat signifikans. Dari hasil
ini memperlihatkan bahwa pengaruh dari keberadaan outlier terhadap taksiran
parameter sangat serius, khususnya pada regresi logistik biner, sehingga secara
otomatis akan berpengaruh terhadap model regresi logistik biner yang
dihasilkan yang akan menentukan kesimpulan akhir dari suatu permasalahan.
3. Taksiran parameter yang dihasilkan dengan menggunakan metode DOUW,
untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan nilai
-
45
yang tidak terlalu jauh berbeda dan tidak merubah tanda pada taksiran
parameternya, walaupun banyaknya outlier yang terdeteksi tidak sama.
5.2. Saran
1. Walaupun pemilihan pasangan konstanta dan c tidak merubah nilai taksiran
parameter regresi logistik biner secara signifikans, akan tetapi perlu dilakukan
kajian lebih dalam untuk membuat panduan yang konkrit dalam pemilihan
kedua nilai konstanta tersebut.
2. Sehubungan dengan proses komputasi yang cukup rumit, maka untuk
penelitian lebih lanjut, perlu kiranya dirancang prosedur yang lebih praktis
dalam proses komputasinya.
-
46
DAFTAR PUSTAKA
Agresti, Alan, (1990), Categorical Data Analysis, John Wiley & Sons, Inc. New
York. ______, (1997), Categorical Data Analysis, John Wiley & Sons, Inc. New York. Bogue O.J, (1969), Principle of Demography, John Wiley & Sons, Inc. New
York. Chen, Collin. Robust Regression and Outlier Detection with the ROBUSTREG
Procedure. Institute Inc., Cary, NC. Page 265-27. Chang, I., Tiao, G.C. dan Chen, C. (1988), Estimation of Time Series Parameters
in the Presence of Outliers, Technometrics, Vol. 30, hal. 193-204. Copas, J.B. 1988. Binary regression models for contaminated data.
Withdiscussion. Journal of the Royal Statistical Society. Series B (Methodological), 50(2):225.265.
Hadi, Ali S.,Rahmatullah Imon, A.H.M and Werner, Mark. (2009), Detection of
Outlier, John Wiley & Sons, Inc. WIREs Comp Stat 2009 1 5770. Hanum, Sri Handayani,(1997), Perkawinan Belia, PPK-UGM dan Fond
Fondation, Yogyakarta. Hosmer, D.W. dan Lemeshow (1989), Applied Logistic Regression, John Wiley,
New York. Midi, Habshah & Jaafar, Asmi (2007), The Residual Plot For A Non-Linear
Regression Model With The Presence Of Outliers And Heteroscedastic Errors, Jurnal Teknologi, 41(C) Dis. 2004: 1126 Universiti Teknologi Malaysia.
Neykov, N.M. & Muller, C.H. (2002). Breakdown Point and Computation of
Trimmed Likelihood Estimators in GLMs. In: R. Dutter et al., editors, Developments in robust statistics, Physica Verlag, Heidelberg.
-
47
Rousseeuw, P.J. & Leroy, A.M. (1987). Robust regression and outlier detection. New York: John Wiley & Sons. 329p.
Rousseeuw, P.J. & Van Driesen, K. 1999a. Computing LTS Regression for Large
Data Sets. Technical report, University of Antwerp. _________. 1999b. A Fast Algorithm for the Minimum Covariance Determinant
Estimator. Technometrics, 41(3):212. 223. Rousseeuw, P.J. & Christmann, A. (2003). Robustness against separation and
outliers in logistic regression. Computational Statistics & Data Analysis, 43(3):315-332, July 2003.
Sembiring, RK. (2003), Analisis Regresi, edisi kedua, ITB.Bandung. Siswono, Eka. (2000). Pergeseran Budaya Perkawinan di Jawa Barat : Suatu
Tinjauan Usia Kawin Pertama dalam Kasus Pekerja Perempuan di Botabek. Warta Demografi. LD-FEUI. Jakarta.
Soemartini (2007). Pencilan (Outlier). Jurusan Statistika Fakultas MIPA UNPAD,
Bandung. Tukey, JW. A. Survey of Sampling from Contaminated Distribution. In. Olkin.
Editor. Contributions to Probability and Statistic. Stanford. Stanford University Press, 1960.P.448-85.
Venter, JH & de la Rey, T (2007), Detects Outlier Using Weights in Logistic
Regression, Centre for Business Mathematics and Informatics (BMI), North-West University, Potchefstroom 2520, South Africa, page 127-160.
Warta Demografi. (2000). Perkawinan dalam Masyarakat yang sedang Berubah. LD-FEUI, Jakarta.
-
48
Lampiran 1 : Data SUPAS 2005 Kabupaten Sukabumi (n=967)
. . . . . . . . . . . . . . . . . . . . .
-
49
Lampiran 2 : Data SUPAS 2005 Provinsi Jawa Barat (n=21.772)
. . . . . . . . . . . . . . . . . . . . . . . .
-
50
Berikut ini adalah langkah-langkah pengolahan metode DOUW dengan
menggunakan Software SAS 9.2:
1. Simpan data SUPAS 2005 yang akan diolah pada suatu folder dalam format
Excel (.xls) atau SPSS (.sav).
2. Buka program SAS 9.2, lalu pada layar Editor masukkan syntax yang sudah
dibuat.
3. Kemudian, baca dengan PROC IMPORT OUT=WORK.(nama file baru).
Misalkan dalam penelitian ini adalah:
PROC IMPORT OUT=WORK.sukabumi DATA FILE="D:\KULIAH S-2\THESIS UJEL 2009-2010\UJEL BAHAN THESIS\RAW DATA SUPAS 2005\SUPAS UNTUK TESIS SUKABUMI SIAP OLAH.sav". DBMS=SAV REPLACE; RUN;
Struktur data pada SUPAS 2005 terdiri dari: JENIS_PERNIKAHAN untuk
variabel Y, X0 untuk mendapatkan nilai , AGAMA,
STATUS_TPTINGGAL, STATUS_BEKERJA, STATUS_MIGRAN, dan
LAMA_SEKOLAH untuk variabel X1 sampai dengan X5.
4. Pada syntax yang ada melalui PROC IML, masukkan nilai pilihan konstanta
epsilon () dan level cut off (c) yang dipilih. Misalnya: proc iml; eps=0.10; cut_off=0.10;
Lampiran 3 : Langkah-langkah Pengolahan Metode DOUW
-
51
Gunakan perintah USE WORK.(nama file baru) untuk membaca nama file
baru yang sudah dirubah dalam bentuk SAS, kemudian definisikan struktur
variabel yang ada pada data SUPAS 2005 untuk variabel Y dan X. Hal ini
dimaksudkan agar program dapat memisahkan variabel Y dan X pada file
baru. Misalnya:
use WORK.sukabumi; read all var {JENIS_PERNIKAHAN} into y; read all var {X0 AGAMA STATUS_TPTINGGAL STATUS_BEKERJA STATUS_MIGRAN LAMA_SEKOLAH} into X;
5. Klik RUN
6. Syntax dinyatakan sudah benar, jika pada layar Log tidak ada pesan error yang
berwarna merah.
7. Hasil outputnya bisa dilihat pada layar Output.
Selanjutnya, hasil output pada langkah-langkah pengolahan metode DOUW di
atas akan dibandingkan dengan metode konvensional (metode analisis devians
residual).
Lanjutan Lampiran 3
-
52
Berikut adalah langkah-langkah untuk mendapatkan nilai devians residual
pada seluruh pengamatan, Pengolahan bisa menggunakan Software SPSS,
Minitab, atau software statistik lainnya yang sudah umum.
1. Buka file data SUPAS 2005 yang sudah disimpan. Pada menu utama pilih
Open, klik Data, kemudian cari file yang akan diolah.
2. Pada menu utama pilih Analyze, klik Regression, klik Binary Logistic.
3. Masukkan variabel Dependent (Y) dan variabel Covariates (X), klik sub
menu Categorical, kemudian masukkan variabel X yang bersifat kategori, kill
Reference Category, pilih kategori mana yang akan dijadikan sebagai
reference category (klik Last jika nilai yang besar yang akan jadi reference
category, klik First jika nilai yang kecil yang jadi reference variabel, untuk
masing-masing variabel), klik Continue, klik sub menu Save, pada sub menu
Residual berikan ceklist Deviance, klik Continue, klik OK.
Lampiran 4 : Langkah-langkah Pengolahan Metode Analisis Deviance Residual
-
53
/****************************************************************/ /* SYNTAX UNTUK DETEKSI OUTLIER */ /* */ /* */ /****************************************************************/ options ls=80 nostimer nodate ps=60; PROC IMPORT OUT= WORK.sukabumi DATAFILE= "D:\KULIAH S-2\THESIS UJEL 2009-2010\UJEL BAHAN TH ESIS\RAW DATA SUPAS 2005\SUPAS UNTUK TESIS SUKABUMI SIAP OLAH.sav" DBMS=SAV REPLACE; RUN; proc iml; eps=0.9; /*ini nilai epsilon*/ cut_off=0.05; /* ini nilai cut off */ /* * Module to calculate Gradient;*/ start gradG (betaG) global (X,y,p_G,w_G); nr=nrow(X) ; nc=ncol(X) ; gG=j(1,nc,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaG[k]*X[n,k] ; end ; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])); ;end ; do k=1 to nc; do n=1 to nr; gG[k]=gG[k]+(y[n]-p_G[n])*w_G[n]*X[n,k]; end; end; return (gG); finish gradG; start hessG (betaG) global(X,p_G,w_G); nr=nrow(X) ; nc=ncol(X) ; hG=j(nc,nc,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaG[k]*X[n,k] ; end ; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc ; do l=1 to nc ; do n=1 to nr; hG[k,l]=hG[k,l]-p_G[n]*(1-p_G[n])*x[n,k]*x[n,l]*w_G[n] ; end ; end ; end ; return (hG); finish hessG; start f_TLR_G (betaG) global(X,y,LL_opt,w_G,D_G,nr,nc,p_G); * initializing; sum_LLG=0; D_G = J(nr,1,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; * Maximum likelihood;
Lampiran 5 : Syntax Metode DOUW
-
54
do n=1 to nr; do k=1 to nc; logit[n]=
logit[n]+betaG[k]*X[n,k]; end; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])); end; do n= 1 to nr; D_G [n] = (y[n]*log(max(1.0E-10,p_G[n]))+(1-y[n])*log(max(1.0E-10,1-p_G[n]))); sum_LLG = sum_LLG + w_G[n]*D_G[n]; end; LL_opt=sum_LLG; return (sum_LLG); finish f_TLR_G; use WORK.sukabumi; read all var {JENIS_PERNIKAHAN} into y; read all var {AGAMA STATUS_TPTINGGAL STATUS_BEKERJA STATUS_MIGRAN LAMA_SEKOLAH} into X; nr=nrow(X); nc=ncol(X); *calculate intitial values; y_initial = J(nr,1,0); beta_initial = J(nc,1,1); do i= 1 to nr; if y[i] < 0.5 then do; y_initial[i] = -1; end; else do; y_initial[i] = 1; end; end; rankx =round(trace(ginv(X)*X)); if rankx < nc then do; beta_initial = J(nc,1,0); end; else do; beta_initial = ginv(X`*X)*X`*y_initial; end; ns=50; best=5; count = j(ns,1,0); G_optimal_b =j(best,nc,0); G_optimal_W = j(nr,best,0); G_optimal_expD = j(nr,best,0); G_optimal_ll = j(best,1,-1.0E10);
Lanjutan Lampiran 5
-
55
/* Repeat Step 1 and Step 2 500(ns) times */ do s = 1 to ns; * ns - number of new beginnings; * Step 1 : construct an initial g-subset using method (b) i.e. starting from a random nc-subset; * Step 1a: starting with a nc-subset (method(B)); count_loop1=0; reason="false"; rc=0; g_constant=Round((nr+nc+1)/2);*tambahan; a=nc+count_loop1; do while (reason="false" & (a
-
56
expDG=exp(D_G); D_ordered = j(nr,1,0); rnk=rank(expDG); D_ordered[rnk]=expDG[]; w=j(nr,1,1); do i =1 to nr;if rnk[i] = min_LL then do; G_optimal_ll[min_index] = LL_opt; G_optimal_b[min_index,] = bopt_G; G_optimal_W[,min_index]=W_g[]; do kkk=1 to nr; G_optimal_expD[kkk,min_index]=exp(D_G[kkk]); end; end; *Step 3: for the 10 best results - carry out C-steps until convergence - keep the BEST solution!!!; BestG_optimal_b =j(nc,1,0); bestG_optimal_W = j(nr,1,0); bestG_optimal_expD = j(nr,1,0); bestG_optimal_ll = -1.0E10; do kkk = 1 to best; stop = "no"; count_loop3 = 0; * Do until the W converge; do while(stop="no" & count_loop3 < 100); count_loop3 = count_loop3+1; opt=J(1,11,.) ; opt[1]=1; *max; opt[2] = 4; w_G=G_optimal_W[,kkk]; call nlpnra( rc, bopt_G, "f_TLR_G", beta_initial,opt,,,,, "gradG", "hessG") ; beta_initial = bopt_G; W_old = W; D_ordered = j(nr,1,0); rnk=rank(D_G); D_ordered[rnk]=D_G[]; w=j(nr,1,1); do i =1 to nr;if rnk[i] = bestG_optimal_ll then do; bestG_optimal_ll = LL_opt; bestG_optimal_b = bopt_G; bestG_optimal_W=W_g; bestG_optimal_expD=exp(D_G); end; * end if sum_log_likelihood>ll; end; * end do list kkk=1 to best; end;
Lanjutan Lampiran 5
-
57
*Our own final step; *after the loop where the best beta has been obtained for the g; start gradF (betaF) global (X,y,p_F,w_F); nr=nrow(X) ; nc=ncol(X) ; gF=j(1,nc,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaF[k]*X[n,k] ; end ; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc; do n=1 to nr; gF[k]=gF[k]+(y[n]-p_F[n])*w_F[n]*X[n,k]; end; end; return (gF); finish gradF; start hessF (betaF) global(X,p_F,w_F,hF); nr=nrow(X) ; nc=ncol(X) ; hF=j(nc,nc,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaF[k]*X[n,k] ; end ; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc ; do l=1 to nc ; do n=1 to nr; hF[k,l]=hF[k,l]-p_F[n]*(1-p_F[n])*x[n,k]*x[n,l]*w_F[n] ; end ; end ; end ; return (hF); finish hessF; start f_TLR_F (betaF) global(X,y,LL_optF,w_F,D_F,nr,nc); * initializing; sum_log_likelihood=0; D_F = J(nr,1,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; * Maximum likelihood; do n=1 to nr; do k=1 to nc; logit[n]= logit[n]+betaF[k]*X[n,k]; end; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])); end; do i= 1 to nr; D_F [i] = (y[i]*log(max(1.0E-10,p_F[i]))+(1-y[i])*log(max(1.0E-10,1-p_F[i]))); sum_log_likelihood = sum_log_likelihood + w_F[i]*D_F[i]; end; LL_optF=sum_log_likelihood; return (sum_log_likelihood); finish f_TLR_F; w_now=bestG_optimal_W; count_loop5=0; expD = bestG_optimal_expD; stop = "no"; w_F=j(nr,1,1); logit_g=j(nr,1,0); p_g=j(nr,1,0); do ss=1 to nr;
Lanjutan Lampiran 5
-
58
do kkkk=1 to nc; logit_g[ss]= logit_g[ss]+bestG_optimal_b[kkkk]*X[ss,kkkk]; end; if -logit_g[ss] > 700 then p_g[ss]=0; else p_g[ss]=1/(1+exp(-logit_g[ss])); end; mat_outlier=J(nr,2,0); do obs=1 to nr; mat_outlier[obs,1]=obs; mat_outlier[obs,2]=p_g[obs,1]; end; print mat_outlier; count_out = 0; do i=1 to nr; if y[i]>0.5 & p_g[i] < cut_off then do ;w_F[i]=eps; count_out = count_out+1;end; if y[i] (1-cut_off) then do ;w_F[i]=eps; count_out = count_out+1;end; end; beta_initial_F =bestG_optimal_b; original=j(nr,1,1); original=w_f; count_loop5 = count_loop5+1; beta_initial_F =bestG_optimal_b; opt=J(1,11,.) ; opt[1]=1; *max; opt[2]=4 ; *detail output; call nlpnra( rc, bopt_F, "f_TLR_F", beta_initial_F,opt,,,,, "gradF", "hessF") ; w_old = w_F; expD=exp(D_F); w_F=j(nr,1,1); logit_f=j(nr,1,0); p_f=j(nr,1,0); do ss=1 to nr; do kkkk=1 to nc; logit_f[ss]= logit_f[ss]+bopt_F[kkkk]*X[ss,kkkk]; end; if -logit_f[ss] > 700 then p_f[ss]=0; else p_f[ss]=1/(1+exp(-logit_f[ss])); end; count_out = 0; do i=1 to nr; if y[i]>0.5 & p_f[i] < cut_off then do ; w_F[i]=eps; count_out = count_out+1; print i; end; if y[i] (1-cut_off) then do ;w_F[i]=eps; count_out = count_out+1; print i; end; end; print count_out;
Lanjutan Lampiran 5
-
59
F_optimal_b =j(nc,1,0); F_optimal_W_expD = j(nr,2,0); F_optimal_ll = -1.0E10; F_optimal_b = bopt_F; F_optimal_W_expD[,1] = w_F; do kkk=1 to nr; F_optimal_W_expD[kkk,2]=exp(D_F[kkk]); end; F_optimal_ll= LL_optF; w_final=w_F;
Lanjutan Lampiran 5
-
60
Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk Kabupaten Sukabumi (n=967) =0.01, C=0.01
=0.01, C=0.05
=0.01, C=0.10
=0.05, C=0.01
=0.05, C=0.05
=0.05, C=0.10
=0.10, C=0.01
=0.10, C=0.05
=0.10, C=0.10
18 1 1
NIHIL
18 1
NIHIL
18 1 25 18 18 25 18 25 18 31 24 24 28 24 28 24 75 25 25 31 25 31 25184 28 28 56 28 56 28213 31 31 75 31 75 31 275 56 56 77 56 77 56 374 75 75 132 75 132