Download - Pendeteksian Outlier Dalam Regresi Logistik Binerdengan Metode Detects Outliers Using Weights Douw

Transcript

PENDETEKSIAN OUTLIER DALAM REGRESI LOGISTIK BINER

DENGAN METODE DETECTS OUTLIERS USING WEIGHTS (DOUW)

Oleh: UJANG JAELANI

140720090025

TESIS Untuk memenuhi salah satu syarat ujian

guna memperoleh gelar Magister Statistika Terapan. Program Studi Magister Statistika Terapan

Bidang Kajian Utama Statistika Sosial

PROGRAM PASCASARJANA UNIVERSITAS PADJADJARAN

BANDUNG 2010
PENDETEKSIAN OUTLIER DALAM REGRESI LOGISTIK BINER

DENGAN METODE DETECTS OUTLIERS USING WEIGHTS (DOUW)

Oleh:

UJANG JAELANI

140720090025

Untuk memenuhi salah satu syarat ujian

guna memperoleh gelar Magister Statistika Terapan.

Program Studi Magister Statistika Terapan

Telah disetujui oleh Tim Pembimbing pada tanggal

seperti tertera di bawah ini,

Bandung, Agustus 2010

Dr. Suwanda, M.S. Ketua Tim Pembimbing

Dra. Hj. Anna Chadidjah, MT. Anggota Tim Pembimbing
iii

PERNYATAAN

Dengan ini saya menyatakan bahwa:

1. Tesis ini, adalah asli dan belum pernah diajukan untuk mendapatkan gelar

akademik (sarjana, magister, dan / atau doktor), baik di Universitas Padjadjaran

maupun di perguruan tinggi lain.

2. Tesis ini adalah murni gagasan, rumusan, dan penelitian saya sendiri, tanpa

bantuan pihak lain, kecuali arahan Tim Pembimbing.

3. Dalam Tesis ini tidak terdapat karya atau pendapat yang telah tertulis atau

dipublikasikan orang lain, kecuali secara tertulis dengan jelas dicantumkan

sebagai acuan dalam naskah dengan disebutkan nama pengarang dan

dicantumkan dalam daftar pustaka.

4. Pernyataan ini saya buat dengan sesungguhnya dan apabila di kemudian hari

terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, saya bersedia

menerima sanksi akademis berupa pencabutan gelar yang telah diperoleh karena

karya ini, serta sanksi lainnya sesuai dengan norma yang berlaku di perguruan

tinggi ini.

Bandung, Agustus 2010

Yang membuat pernyataan,

Ujang Jaelani NPM. 140720090025
iv

ABSTRACT

Thesis Title : Outlier Detection in Binary Logistic Regression with the Detects Outliers Using Weights (DOUW) Method.

Abstract

DOUW method is an outlier detection procedure which also can produce robust parameter estimation in Binary Logistic Regression. In DOUW method, there are four things that must be completed, namely: determination of optimal g1, the number of iterations, the choice of (weight), and the choice of c (level of cut-off). Source data used is the result of Inter-Census Population Survey (SUPAS) in 2005 in Sukabumi Regency and West Java Province. Variables used are as follows: Response Variable (Y) is a type of Marriage and Regressor Variables(Xi) are Religion (X1), Residence Status (X2), Working Status (X3), Migrant Status (X4), and the Old School (X5). From the results of outlier detection, choice of mate value of and c can be concluded that for certain value and the value of c is getting closer to one the number of observations that are detected as outliers more and more. While for certain c value and the value of getting closer to 0 then the number of observations that are detected as outliers less.

Whereas, if viewed from the estimated parameters produced, it can be concluded that changes in the value of the estimated parameters in the regressor variables, from the initial iteration to iteration end, changing the very significance. From these results demonstrate that the presence of outliers greatly affect the estimated parameters are obtained, especially on binary logistic regression. Estimated parameters produced by DOUW method, for the pair and c value whatever, basically get the value that is not too much different, although the number of outliers that are detected are not the same.

Keywords : Binary Logistic Regression, Downweighting, Level of Cut Off, Outlier, Robust Parameter Estimation.
v

ABSTRAK

Judul Tesis : Pendeteksian Outlier dalam Regresi Logistik Biner dengan Metode Detects Outliers Using Weights (DOUW).

Abstrak Metode DOUW merupakan suatu prosedur pendeteksian Outlier yang sekaligus dapat menghasilkan estimasi parameter robust pada Regresi Logistik Biner. Dalam metode DOUW, ada empat hal yang harus dilengkapi yaitu: penentuan g1 yang optimal, jumlah iterasi, pilihan (weight), dan pilihan level cut off (c). Sumber data yang digunakan adalah data hasil Survei Penduduk Antar Sensus (SUPAS) Tahun 2005 di Kabupaten Sukabumi dan Provinsi Jawa Barat. Variabel yang digunakan terdiri dari: Variabel Respon (Y) adalah Jenis Pernikahan dan Variabel Regressor (Xi) adalah Agama (X1), Status Tempat Tinggal (X2), Status Bekerja (X3), Status Migran (X4), dan Lama Sekolah (X5). Dari hasil pendeteksian outlier, pemilihan pasangan nilai dan c dapat disimpulkan, bahwa untuk nilai tertentu dan nilai c yang semakin mendekati 1, maka banyaknya pengamatan yang terdeteksi sebagai outlier semakin banyak. Sedangkan untuk nilai c tertentu dan nilai yang semakin mendekati 0, maka banyaknya pengamatan yang terdeteksi sebagai outlier semakin sedikit.

Sedangkan jika dilihat dari estimasi parameter yang dihasilkan dapat disimpulkan, bahwa perubahan nilai estimasi parameter pada variabel regressor dari iterasi awal ke iterasi akhir mengalami perubahan yang sangat signifikans. Dari hasil ini memperlihatkan bahwa keberadaan outlier sangat mempengaruhi estimasi parameter yang diperoleh, khususnya pada regresi logistik biner. Estimasi parameter yang dihasilkan metode DOUW, untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan nilai yang tidak terlalu jauh berbeda, walaupun banyaknya outlier yang terdeteksi tidak sama. Kata Kunci : Regresi Logistik Biner, Downweighting, Level Cut Off,

Outlier, Estimasi Parameter Robust.
vi

KATA PENGANTAR

Segala puji dan syukur diucapkan kehadirat Allah SWT atas segala

rahmat, hidayah, dan karunia yang diberikan-Nya, sehingga penulis dapat

menyelesaikan Tesis yang berjudul Pendeteksian Outlier dalam Regresi

Logistik Biner dengan Metode Detects Outliers Using Weights (DOUW)

dengan baik.

Dengan terselesaikannya Tesis ini, penulis mengucapkan terima kasih

yang sebesar-besarnya kepada :

1. Orang tua dan Mertua tercinta yang telah memberikan doa dan dorongan.

2. Istriku tercinta Saidah,S.Pd.I dan ketiga anakku tersayang Razan Muhammad

Ihsan, si kembar yang lucu Rifqi Muhammad Habiburrahman dan Rizqi

Muhammad Habiburrahim yang telah rela dan sabar memberikan dukungan

kepada abinya untuk menyelesaikan studi ini.

3. Bapak Dr. Suwanda, M.S. dan Ibu Dra. Hj. Anna Chadidjah, MT, selaku

dosen pembimbing yang telah banyak meluangkan waktu, tenaga dan pikiran

untuk membimbing, memberikan masukan, arahan dan koreksi serta diskusi

yang berkualitas kepada penulis dalam proses pengerjaan Tesis ini.

4. Bapak Dr. Choiril Maksum dan Ibu Dra. Hj. Enny Supartini, MS selaku

dosen penguji yang telah meluangkan waktu dan tenaga untuk masukan dan

saran dalam proses pengerjaan tesis ini.

5. Seluruh dosen Pascasarjana Jurusan Statistika Terapan Universitas

Padjadjaran, seluruh jajaran akademik, asisten laboratorium yang telah

banyak membantu dalam masa perkuliahan.
vii

6. Seluruh jajaran pimpinan Badan Pusat Statistik (BPS) di Pusat yang telah

memberikan kesempatan kepada penulis untuk melanjutkan Program Studi

Magister Statistika Terapan F-MIPA Universitas Padjadjaran Bandung.

7. Kepala BPS Provinsi Jawa Barat Drs. H. Lukman Ismail, MA dan jajarannya

yang telah merekomendasikan penulis untuk mengikuti Program Studi

Magister Statistika Terapan F-MIPA di Universitas Padjadjaran Bandung.

8. Seluruh teman-teman Pascasarjana Jurusan Statistika Terapan Universitas

Padjadjaran Bandung, khususnya angkatan pertama program S2 kerjasama

Badan Pusat Statistik dan Unpad untuk kebersamaannya selama ini.

9. Pak Nurseto Wisnumurti (Pa Ocen) untuk diskusi, sharing, belajar bareng,

dan transfer ilmunya khususnya kepada penulis, umumnya kepada penghuni

kontrakan ST13

10. Seluruh teman-teman kontrakan ST13: Pa Ocen, Mas Dede, Sami, Yanis,

Eko, Ipung, Rio, Yudi, Kharis, Heru, Ucup, dan Budi, juga Ilham atas

kebersamaan dan kekompakannya dalam menempuh studi ini, termasuk

dalam bermain Futsal.

11. Nasrul Wajdi untuk konsultasi program SAS dan semua pihak yang telah

membantu penyelesaian tesis ini, yang tidak dapat disebutkan satu per satu.

Penulis menyadari bahwa terdapat kekurangan dalam penulisan laporan

ini, oleh karena itu kritik dan saran yang membangun sangat diharapkan. Akhir

kata penulis berharap semoga apa yang telah ditulis ini dapat bermanfaat dan

berguna bagi semua pihak.

Bandung, Agustus 2010

Penulis
viii

DAFTAR ISI

Halaman

PENGESAHAN . ii

PERNYATAAN . iii

ABSTRACT ... iv

ABSTRAK ..... v

KATA PENGANTAR vi

DAFTAR ISI .. viii

DAFTAR TABEL .. x

DAFTAR GAMBAR . xi

DAFTAR LAMPIRAN .. xii

BAB I PENDAHULUAN .. 1

1.1. Latar Belakang . 1

1.2. Identifikasi Masalah . 3

1.3. Tujuan Penelitian . 3

1.4. Manfaat Penelitian ... 4

1.5.Sistematika Penulisan ... 4

BAB II TINJAUAN PUSTAKA . 5

2.1. Regresi Logistik Biner .. 5

2.2. Beberapa Metode Penaksir Robust dalam Regresi Logistik

Biner ..

6

2.2.1. Metode Trimming . 6

2.2.2. Metode Maximum Estimated Likelihood (MEL)... 7

2.2.3. Metode Weight Maximum Estimated Likelihood

(WEMEL)

8

2.3 Deteksi Outlier dengan Metode Analisis Deviance Residual . 9
ix

Halaman

BAB III REGRESI LOGISTIK BINER ROBUST MELALUI METODE

DOUW ..

11

3.1. Metode Detects Outliers Using Weights (DOUW) ... 11

3.2. Algoritma ... 14

3.3. Sumber Data .. 16

3.4. Wanita Menikah Muda dan Faktor-faktor Penyebabnya ........... 16

3.5. Variabel-variabel yang Digunakan .... 18

BAB IV HASIL DAN PEMBAHASAN ........ 20

4.1. Pendahuluan ... 20

4.2. Deskripsi Data Hasil SUPAS 2005 . 21

4.3. Pendeteksian Outlier untuk Data SUPAS 2005 Kabupaten

Sukabumi ..

31

4.4. Pendeteksian Outlier untuk Data SUPAS 2005 Provinsi Jawa

Barat ..

39

BAB V KESIMPULAN DAN SARAN ........ 44

5.1. Kesimpulan 44

5.2. Saran .. 45

DAFTAR PUSTAKA 46

LAMPIRAN ... 48
x

DAFTAR TABEL

Halaman

Tabel 4.1. Persentase Wanita Menikah menurut Jenis Pernikahan dan Provinsi di Indonesia Tahun 2005 .....

22

Tabel 4.2 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Kabupaten/Kota di Provinsi Jawa Barat Tahun 2005 ...

23

Tabel 4.3 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Agama yang Dianut di Provinsi Jawa Barat Tahun 2005 .

25 Tabel 4.4 Persentase Wanita menurut Menikah Jenis Pernikahan dan

Status Tempat Tinggal di Provinsi Jawa Barat Tahun 2005 .

27 Tabel 4.5 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Status Bekerja di Provinsi Jawa Barat Tahun 2005

28 Tabel 4.6 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Status Migran di Provinsi Jawa Barat Tahun 2005 ....

29 Tabel 4.7 Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama

Sekolah di Provinsi Jawa Barat Tahun 2005

30 Tabel 4.8 Banyaknya Pengamatan yang Terdeteksi sebagai Outlier dengan

Metode DOUW dan Deviance Residual ........

32 Tabel 4.9 Taksiran Parameter untuk masing-masing Nilai dan c

(Untuk n=967 dan K=5) ..

35 Tabel 4.10 Taksiran Parameter () untuk masing-masing Nilai dan c,

serta Banyaknya Outlier yang Terdeteksi dengan Metode DOUW (Untuk n=967 dan K=5) dan Deviance Residual .

37 Tabel 4.11 Taksiran Parameter dan Banyaknya Outlier yang Terdeteksi

dengan Metode DOUW (n=21.772, K=5, =0.05, dan C=0.05) dan Deviance Residual, serta Nilai Odds Ratio

40
xi

DAFTAR GAMBAR

Halaman

Gambar 2.1 X dan Y Outlier .. 8 Gambar 3.1 Flow Chart Metode DOUW 15 Gambar 4.1 Persentase Wanita Menikah menurut Kabupaten/Kota di

Provinsi Jawa Barat ...

24 Gambar 4.2 Persentase Wanita Menikah Muda dan Dewasa di Provinsi Jawa

Barat ...

25 Gambar 4.3 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Agama di Provinsi Jawa Barat ...

26 Gambar 4.4 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Status Tempat Tinggal di Provinsi Jawa Barat .................

27 Gambar 4.5 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Status Bekerja Tinggal di Provinsi Jawa Barat ...

28 Gambar 4.6 Persentase Wanita Menikah menurut Jenis Pernikahan dan

Status Migran di Provinsi Jawa Barat .

29 Gambar 4.7 Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama

Sekolah di Provinsi Jawa Barat ..

31 Gambar 4.8 Scatter Plot antara Observasi dengan Probabilita (G) Pada Data

SUPAS 2005 Kabupaten Sukabumi (untuk n=967, K=5, =0.01, C=0.01) ..

34
xii

DAFTAR LAMPIRAN

Halaman Lampiran 1 Data Supas 2005 Kabupaten Sukabumi (n=967) ..... 48 Lampiran 2 Data Supas 2005 Provinsi Jawa Barat (n=21.772) .. 49 Lampiran 3 Langkah-langkah Pengolahan Metode DOUW ... 50 Lampiran 4 Langkah-langkah Pengolahan Metode Analisis Deviance

Residual ...

52 Lampiran 5 Syntax Metode DOUW .. 53 Lampiran 6 Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk

Kabupaten Sukabumi (n=967) .....

60 Lampiran 7 Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk

Provinsi Jawa Barat (n=21.772, =0.05 dan c=0.05) ..

63 Lampiran 8 Output Syntax Metode DOUW untuk =0.01 dan c=0.01 65
1

BAB I

PENDAHULUAN

1.1.Latar Belakang

Dalam proses pemilihan model persamaan Regresi Logistik Biner yang

terbaik, terdapat suatu tahapan yang sangat penting dan cukup menentukan,

yaitu tahapan diagnostik model. Dalam tahapan ini salah satu yang dilakukan

adalah pendeteksian terhadap keberadaan satu atau sekelompok pengamatan yang

tidak mengikuti pola pada umumnya, yang dikenal sebagai Outlier. Ferguson dan

Barnet (dalam Soemartini, 2007) mendefinisikan outlier sebagai berikut:

Ferguson, outlier adalah suatu data yang menyimpang dari sekumpulan data yang

lain. Barnett, outlier adalah merupakan pengamatan yang tidak mengikuti

sebagian besar pola dan terletak jauh dari pusat data, dan Sembiring (2003)

berpendapat bahwa outlier adalah pengamatan yang jauh dari pusat data yang

mungkin berpengaruh besar terhadap koefisien regresi.

Keberadaan outlier dapat mempengaruhi kesimpulan akhir dari model

persamaan Regresi Logistik Biner. Oleh karena begitu seriusnya permasalahan

keberadaan dan efek yang ditimbulkan oleh outlier, maka pendeteksian outlier

menjadi sangat penting. Dalam Regresi Logistik Biner, pengamatan dengan

respon sukses tetapi probabilitasnya ditaksir rendah dan pengamatan dengan

respon gagal tetapi probabilitasnya ditaksir tinggi, diklasifikasikan sebagai

outlier (Venter & Rey, 2007). Dalam penelitian ini yang menjadi respon sukses

adalah wanita menikah muda dan respon gagal adalah wanita menikah dewasa.
2

Pengamatan dikategorikan sebagai outlier, jika untuk wanita menikah muda

probabilitasnya rendah, sedangkan untuk wanita menikah dewasa probabilitasnya

tinggi.

Apabila terdapat outlier, maka untuk medapatkan model regresi

logistiknya digunakan model regresi logistik yang robust. Metode pertama untuk

mendapatkan model regresi logistik biner robust adalah trimming yang

diperkenalkan oleh Tukey (1960). Secara ringkas, trimming membagi

pengamatan-pengamatan ke dalam beberapa sub set setelah pengamatannya

diurutkan, yakni sub set pertama 5 persen pengamatan terendah, sub set kedua 5

persen pengamatan tertinggi dan sisanya merupakan sub set pengamatan yang

berada di tengah. Untuk sub set pengamatan 5 persen bawah dan 5 persen atas

diberi bobot mendekati nol, sehingga sub set pengamatan tengah merupakan sub

set yang bebas dari outlier. Selanjutnya, untuk menaksir parameter regresi pada

sub set pada pengamatan yang berada di tengah digunakan Maximum Likelihood

Estimator (MLE). Sedangkan untuk sub set pengamatan terendah dan tertinggi

dihilangkan.

Penggunaan trimming dalam regresi logistik biner umumnya dilakukan

pada ruang regressor untuk menghilangkan overlap data, sehingga apabila tidak

terjadi overlap, MLE tidak dijamin eksistensinya (Rousseeuw and Christmann,

2001). Untuk mengatasi masalah eksistensi penaksir, diajukan Maximum

Estimated Likelihood (MEL). Pada perkembangan selanjutnya, diajukan prosedur

penaksir robust lainnya yang tidak melalui trimmed data yang disebut metode

Weight Maximum Estimated Likelihood (WEMEL). WEMEL juga dapat
3

mendeteksi outlier dalam ruang regressor yang dikenal sebagai leverage. Dengan

demikian WEMEL bukanlah metode pendeteksi outlier (outlier arah Y), oleh

karena itu diperlukan suatu metode pendeteksi outlier pada arah Y yang sekaligus

mendapatkan taksiran parameternya dalam regresi logistik biner. Metode

konvensional yang biasa digunakan untuk mendeteksi outlier adalah dengan

menghitung nilai deviance residual-nya. Akan tetapi metode konvensional ini

ditujukan hanya untuk mendeteksi outlier, tidak untuk menaksir parameter.

1.2.Identifikasi Masalah

Berdasarkan latar belakang di atas, maka masalah dalam penelitian ini

adalah bagaimana prosedur pendeteksian outlier sekaligus mendapatkan taksiran

parameter robust pada Regresi Logistik Biner dengan metode Detects Outliers

Using Weights (DOUW). Dalam hal ini akan diterapkan pada data hasil Survei

Penduduk Antar Sensus (SUPAS) 2005, dengan variabel respon adalah wanita

menikah muda (respon sukses) dan wanita menikah dewasa (respon gagal).

1.3.Tujuan Penelitian

Tujuan dari penelitian ini adalah mendeteksi outlier sekaligus

mendapatkan taksiran parameter robust dalam Regresi Logistik Biner dengan

metode Detects Outliers Using Weights (DOUW) pada data hasil Survei

Penduduk Antar Sensus (SUPAS) 2005, dengan variabel respon adalah wanita

menikah muda (respon sukses) dan wanita menikah dewasa (respon gagal).
4

1.4.Manfaat Penelitian

Adapun manfaat pada penelitian ini adalah sebagai berikut:

a. Bagi BPS, penelitian ini diharapkan mampu memberikan sumbangan yang

berharga, sebagai metode alternatif yang akurat dalam pendeteksian Outlier,

sekaligus mendapatkan taksiran parameter robust pada Regresi Logistik Biner.

b. Bagi Penulis, penelitian ini dapat dijadikan modal awal untuk pengembangan

lebih jauh dalam hal Pendeteksian Outlier pada Regresi Logistik Biner.

1.5. Sistematika Penulisan

Tulisan ini terdiri dari lima bab. Bab satu mengenai pendahuluan yang

terdiri dari latar belakang, identifikasi masalah, tujuan penelitian, manfaat

penelitian dan sistematika penulisan. Bab dua mengenai tinjauan pustaka. Bab tiga

mengenai metodologi penelitian. Bab empat hasil dan pembahasan. Bab lima

kesimpulan dan saran.
5

BAB II

TINJAUAN PUSTAKA

2.1.Regresi Logistik Biner

Dalam regresi logistik biner variabel responsnya bersifat dikotonomi yang

mempunyai nilai 1 untuk katgori sukses atau 0 untuk kategori gagal, dan

variabel regressor sebanyak K, yaitu: X1, X2Xk. Misalkan XT = (1, X1,

X2Xk) dengan T melambangkan transpose. Model regresi logistik biner dapat

dirumuskan sebagai berikut :

(2.1)

dimana T = (o, 1.k) adalah vektor koefisien regresi logistik (Hosmer & Lemeshow, 1989). Andaikan terdapat n pengamatan, dimana pengamatan ke-i

adalah (yi, XTi), dengan yi adalah nilai pengamatan Y dan XTi = (1, Xn,1,Xn,k)

adalah vektor nilai yang diamati dari regressor sebanyak K. Dalam model regresi

logistik, biner, variabel respon diekspresikan sebagai:

(2.2)

Dimana mempunyai salah satu kemungkinan dari dua nilai, yaitu:

1 , jika y=1 dengan peluang dan

, jika y=0 dengan peluang 1 .

Sehingga mempunyai rataan nol dan varians 1 .

Dengan mengasumsikan independensi ke-n pengamatan, log likelihood

dinyatakan dengan :
6

(2.3)

dimana: 1 log 1 .

Untuk mendapatkan taksiran parameter dapat digunakan MLE dengan memaksimumkan Persamaan (2.3). Sebagaimana telah disebutkan dalam bagian

pendahuluan, outlier bisa memperburuk model (2.1). Hal ini mendorong perlunya

prosedur-prosedur regresi logistik biner robust.

2.2.Beberapa Metode Penaksir Robust dalam Regresi Logistik Biner

2.2.1. Metode Trimming

Prosedur pertama yang akan dijelaskan adalah trimming, yaitu suatu

prosedur dengan memisahkan himpunan bagian data yang diduga sebagai outlier.

Kemudian himpunan bagian data sisanya digunakan untuk menaksir parameter

dengan menggunakan MLE. Metode trimming dapat mengakibatkan tidak adanya

overlap data antara respons dengan kategori sukses dan respon dengan kategori

gagal (yaitu, xi yang bersangkutan dengan yi = 0 dapat dipisahkan oleh

hyperplane dari xi yang bersangkutan dengan yi = 1), akibatnya taksiran parameter

dengan menggunakan MLE tidak dijamin keberadaannya (non-existence).

Walaupun taksiran parameter yang dihasilkan melalui trimming

merupakan taksiran parameter robust, akan tetapi metode trimming tidak dapat

mendeteksi outlier, baik dalam ruang regressor maupun dalam arah Y. Jadi

trimming hanya merupakan metode yang digunakan untuk mendapatkan taksiran
7

parameter pada himpunan bagian data yang sudah dipisahkan dari

kemungkinan adanya outlier.

2.2.2. Metode Maximum Estimated Likelihood (MEL)

Rousseuw dan Christmann (2003) memperkenalkan estimator MEL untuk

mengatasi masalah non-existence. Prosedur MEL dapat dijelaskan sebagai

berikut:

Misalkan =0,01,

, =max(, min(1-, )), o=/(1+),

1=(1+)/(1+), dan mentransformasi yi ke =(1yi) o+yi1. Kemudian MEL ditetapkan dengan memilih yang memaksimumkan log

likelihood taksiran,

(2.4)

dimana: , 1 log 1 , .

Berbeda dengan MLE klasik, estimator MEL selalu ada (exist).

Sama halnya dengan trimming, taksiran parameter yang dihasilkan melalui

MEL juga merupakan taksiran parameter robust, akan tetapi MEL tidak dapat

mendeteksi outlier, melainkan ditujukan untuk mengatasi masalah eksistensi

taksiran parameter yang tidak dijamin oleh MLE, karena hilangnya overlap data

oleh trimming.
8

2.2.3. Metode Weight Maximum Estimated Likelihood (WEMEL)

Prosedur penaksir robust lainnya adalah WEMEL yang didefenisikan

sebagai penetapan yang memaksimumkan log likelihood terboboti sebagai berikut:

(2.5)

Dalam hal ini pembobotan ditentukan oleh bagian data dalam ruang X

menurut wi = M/max {RD2 (x*i), M}, dimana X*i = (xi-1,..xi,K)T dan RD2 (x*i)

adalah jarak robust (RD) dan M adalah persentil ke-75 dari semua RD2 (X*i), i =

1, ..,n. Dengan cara seperti ini, WEMEL berfungsi sebagai metode untuk

mendeteksi leverage, sehingga WEMEL bukan merupakan prosedur untuk

mendeteksi outlier dalam arah Y. Outlier dapat terjadi dalam ruang X dan dalam

arah Y. Sebagai ilustrasi tentang keberadaan outlier dalam ruang X dan arah Y,

dapat dilihat pada Gambar 2.1 sebagai berikut:

Gambar 2.1: X dan Y outlier
9

Area abu-abu yang melibatkan sebagian besar pasangan-pasangan (x1, x2)

bisa dianggap sebagai x-inliers, sementara yang berada di luar area ini adalah x-

outlier, misalnya A, B, D, G, dan H. Untuk keperluan ilustrasi, ditambahkan dua

kontur p(x,)= d dan p(x,)=1d (dengan d kecil). Pengamatan di luar kontur-kontur ini dengan nilai y yang tidak layak, dianggap sebagai y-outlier, khususnya

yang jauh dari kontur, misalnya A dan G. Copas (1988) melakukan pengamatan

dengan y=1 dan p mendekati 0 disebut uplier (misalnya A) dan pengamatan

dengan y=0 tapi p mendekati 1 disebut downlier (misalnya G dan E). Uplier dan

downlier dianggap sebagai bad leverage, dengan pengertian bahwa kemungkinan

akan mempengaruhi koefisien regressi taksiran dengan arah yang sangat berbeda

dari pengamatan-pengamatan lain. Sebaliknya pengamatan-pengamatan seperti

titik B dan H bisa dinamakan good leverage, dalam arti bahwa walaupun kedua

titik ini adalah outlying dalam x-space, nilai y-nya bisa cocok dengan apa yang

diharapkan dari x-region dimana titik tersebut berada.

Mengingat prosedur MEL dan WEMEL merupakan prosedur robust untuk

penanggulangan leverage yang tidak wajar (x-outlier), untuk itu diperlukan

metode pendeteksi outlier dalam arah Y, yang akan dijelaskan pada Bab 3.

2.3.Deteksi Outlier dengan Metode Analisis Deviance Residual

Residual diartikan sebagai ukuran kesesuain antara suatu pengamatan pada

variabel respon dan nilai dugaannya. Residual antara pengamatan ke-i dirumuskan

dengan , dimana adalah nilai respon 0 atau 1 dan adalah nilai
10

dugaannya. Deviance Residual pengamatan ke-i dari vektor respon dapat

dinyatakan sebagai berikut:

2

2

/

(2.6)

dimana adalah suatu tanda yang menyatakan positif jika

dan negatif jika .

Secara konvensional, nilai deviance residual dapat digunakan untuk

mendeteksi apakah suatu pengamatan termasuk outlier atau bukan. Metode

konvensional ini disebut sebagai metode analisis deviance residual. Dalam

Metode analisis deviance residual, suatu pengamatan dinyatakan sebagai outlier

apabila nilai mutlak deviance residual-nya lebih besar 2 (Agresti, 1997).
11

BAB III

REGRESI LOGISTIK BINER ROBUST MELALUI METODE DOUW

3.1.Metode Detects Outliers Using Weights (DOUW)

Metode DOUW memiliki beberapa kesamaan dengan metode least

trimmed squares (LTS) dari Rousseeuw dan Van Driessen (1999a,b) dalam

regresi biasa. LTS dimulai dengan batas bawah g1, atas beberapa pengamatan

yang bukan outlier (inlier). Kemudian dicari himpunan-bagian G dari pengamatan

dengan ukuran #(G)=g1, yang mempunyai jumlah residu kuadrat terkecil diantara

semua himpunan-bagian ukuran g1. G1 optimal yang ditemukan dengan cara ini

akan dianggap paling mungkin bisa bebas dari outlier dan selanjutnya akan

menghasilkan taksiran koefisien regressi yang paling sedikit dipengaruhi oleh

kemungkinan-kemungkinan outlier. Taksiran koefisien regresi yang didapat

dengan cara ini adalah taksiran LTS berdasarkan pada pengamatan g1. Ada

kemungkinan bahwa pilihan g1 adalah pilihan yang konservatif dalam arti bisa

ada pengamatan di luar G1 yang juga bukan outlier.

Taksiran LTS dapat digunakan untuk menghitung residu pengamatan di

luar G1 dan menggunakan residu-residu ini untuk memutuskan pengamatan-

pengamatan manakah yang akan ditambahkan ke dalam G1 untuk mendapatkan

himpunan-bagian G2 yang lebih besar, yang memuat g2, dimana g2 g1. Pengamatan-pengamatan yang bukan outlier menjadi dasar untuk perkiraan

regresi trimmed pada G2. Optimasi LTS secara komputasi sulit dan jika dikerjakan

secara eksak, membutuhkan beberapa langkah yang kompleks dengan jumlah
12

pengamatan yang besar dan secara praktis tidak layak, khususnya dengan jumlah

pengamatan besar. Rousseuw dan Van Drissen (1999a,b) melakukan perhitungan

dengan terlebih dahulu melakukan pemilihan awal G secara acak, dimana # (G) =

g1, kemudian meningkatkan pilihan G secara iteratif sampai konvergen, dengan

menggunakan prosedur yang disebut sebagai C-Steps. Prosedur ini diulang

beberapa kali, solusi terbaik dipilih dan digunakan untuk mewakili G1 optimal

yang dibutuhkan.

Prosedur LTS cukup baik dalam regresi biasa, selanjutnya analogi untuk

kasus Regresi Logistik Biner, dengan menggunakan trimmed likelihood sebagai

pengganti trimmed least squares. Ini berarti bahwa harus dipilih himpunan bagian

G yang memuat g1 pengamatan (bersama dengan ) yang memaksimumkan . Ini juga secara komputasi sulit tetapi sesuai dengan C-Steps yang

sudah tersedia dari Neykoy & Muller (2002). Namun, ketika

mengimplementasikan prosedur ini ditemukan bahwa G1 optimal cenderung

terhenti diantara himpunan bagian-himpunan bagian tanpa adanya overlap,

dimana melalui MLE yang overlap tidak muncul. Hal ini khususnya terjadi bila

diawali dengan g1 konservatif yang jauh lebih kecil dari pada n. Penggantian MLE

dengan MEL menghindari issu non-eksistensi tetapi tidak mengeliminir

kemungkinan bahwa G1 optimal yang dipilih tidak layak. Untuk menghindari

permasalahan ini digunakan pendekatan downweighting dari pendekatan

trimming, dengan memisalkan 0 < < 1 dan untuk himpunan bagian tertentu G

didapat log likelihood terboboti sebagai berikut :

, (3.1)
13

Persamaan (3.1) adalah fungsi log likelihood tertimbang dengan wi = 1

untuk i G dan wi = untuk i G. Pengamatan pada G diberi bobot sebesar 1 dan

pengamatan di luar G dengan bobot sebesar Pengamatan yang bukan outlier

harus berada dalam G dan pengamatan yang buruk dalam arti pembuatan

kontribusi rendah harus berada di luar G agar nilai dari Persamaan (3.1) menjadi

besar. Seperti dalam LTS untuk mengambil pengamatan yang baik dalam G,

dicari himpunan bagian G dengan ukuran #(G) = g1 dan yang bersangkutan yang memaksimumkan l(,G) diantara semua himpunan-bagian yang berukuran g1 tertentu. Untuk setiap himpunan G, biasanya relatif mudah menghitung *(G) yang optimal dari l(,G) atas . Akan tetapi, optimasi l(, G) atas dan G secara komputasi sulit tetapi dapat dilaksanakan dengan bentuk prosedur yang lebih

umum dari CSteps, sehingga diperoleh G1 optimal dengan estimator yang

bersangkutan, *(G1). Selanjutnya menentukan kriteria yang dapat dipergunakan untuk

mengidentifikasi outlier. Untuk ini, digunakan level cut-off c dengan 0 < c < 1,

kemudian pengamatan ke-i dinyatakan sebagai outlier jika yi = 1 tetapi

, atau jika yi = 0 tetapi , 1 . Alasannya di sini

adalah jika yi = 1 dan , adalah kecil, ada kemungkinan bahwa

pengamatan ke-i adalah uplier dan dengan demikian bobotnya harus diturunkan.

Selanjutnya, jika yi = 0, dan , besar, ada kemungkinan bahwa

pengamatan ke-i adalah downlier, maka bobotnya harus diturunkan. Setelah

dilakukan penurunan bobot-bobot tersebut, maka diperoleh *(G2) yang memaksimumkan l(, G2).
14

3.2.Algoritma

Ada beberapa hal yang harus dilengkapi dalam metode DOUW, yaitu:

pilihan akhir g1, jumlah iterasi dalam C-Steps, pilihan dan pilihan cut-off c.

Pilihan g1 dan jumlah iterasi dinyatakan dalam bentuk algoritma sebagai berikut:

1. Pilih g1=max {[(n+K+1)/2], K+1} berupa bilangan bulat, dengan

n=banyaknya pengamatan, K=banyaknya variabel regressor. Ini sesuai

dengan saran Rousseuw & Van Driessen (1999a) untuk metoda FAST-LTS.

2. Ulangi 50 kali untuk langkah-langkah berikut:

2.1.Pilih himpunan-bagian awal H (1,.n) secara acak dengan #H = K+1.

2.2.Hitung *(H), li(*(H)) dengan Persamaan (2.3) dan cari i sehingga l1(*(H)) ln(*(H)). Tetapkan G = (1,,g1).

2.3. Lakukan langkah ke-2 dalam C-Steps, yang dimulai dengan G dan

diakhiri dengan G.

2.4. Simpan 5 hasil terbaik, dari segi nilai tertinggi (*(G), G). 2.5.Untuk setiap 5 hasil terbaik ini, ulangi iterasi C-Steps hingga konvergen

(sampai 10-6).

2.6. Simpan semua himpunan-bagian G1 yang terbaik, yaitu 5 himpunan

bagian yang telah konvergen dari 50 kali proses iterasi tersebut.

3. Tentukan G2={i:(yi=1 dan , ) atau (yi=0 dan

, 1 )} dan kemudian hitung taksiran tertimbang terakhir

*(G2) yang memaksimumkan li(*,G2). Outlier adalah pengamatan di luar G2.

Selanjutnya, metode DOUW dalam bentuk flowchart sebagai berikut:
15

Gambar 3.1. Flowchart Metode DOUW

Ya

Tidak

Untuk J = 1 sampai 50

1. Pilih secara acak #H=K+1, dimana H (1,.n) 2. Hitung *(H), li(*(H) dan cari i sehingga l1(*(H)) ln(*(H)).

Tetapkan G = (1,,g1). 3. Lakukan langkah ke-2 dalam C-Steps yang dimulai dengan G dan diakhiri

dengan G 4. Simpan 5 hasil terbaik, dari nilai tertinggi *(G), G). 5. Untuk setiap 5 hasil terbaik ini, ulangi iterasi C-Steps hingga konvergen

(sampai 10-6). 6. Simpan semua himpunan-bagian G1 yang terbaik, yaitu 5 himpunan bagian

yang telah konvergen dari 50 kali proses iterasi tersebut.

Mulai

Tentukan g1: g1=max{[(N+K+1)/2], K+1}

Berikutnya J

G1 Konvergen

{yi = 1 dan , } atau {yi = 0 dan

, 1 }

OUTLIER

INLIER

Selesai

Hitung Taksiran Parameter
16

3.3.Sumber Data

Sumber data yang digunakan dalam penelitian ini adalah data hasil Survei

Penduduk Antar Sensus (SUPAS) Tahun 2005. SUPAS dilaksanakan diantara dua

Sensus Penduduk (sensus yang dilakukan pada tahun yang berakhiran 0). Selama

ini sudah dilaksanakan SUPAS tahun 1976, 1985, 1995, dan terakhir 2005.

SUPAS Tahun 2005 dirancang khusus untuk mendapatkan data ststistik

kependudukan yang dapat dibandingkan dengan hasil Sensus Penduduk 2000

(SP2000). Data yang dikumpulkan meliputi: karakteristik demografi,

ketenagakerjaan, dan sosial budaya. Karakteristik demografi yang dikumpulkan

adalah mengenai fertilitas, mortalitas dan migrasi, serta riwayat kelahiran dan

kematian anak dari wanita pernah kawin. Keterangan yang dihimpun dibidang

ketenagakerjaan mencakup lapangan usaha, jenis pekerjaan, dan status pekerjaan.

Data sosial budaya mencakup tingkat pendidikan, kondisi tempat tinggal, dan

kegiatan penduduk lanjut usia (lansia). SUPAS 2005 juga mencakup pelaporan

kejadian vital kelahiran, kematian, dan perpindahan.

3.4.Wanita Menikah Muda dan Faktor-faktor Penyebabnya

Pusat Studi Kependudukan UNPAD (dalam Warta Demografi, 2000)

melakukan penelitian terhadap wanita usia 15-45 tahun di 12 desa pada 4

kabupaten di Jawa Barat. Hasil penelitian tersebut menunjukkan bahwa rata-rata

usia nikah pertama wanita adalah 16,5 tahun.

Penentuan usia kawin muda dalam penelitian ini dibagi ke dalam dua

kategori. Kategori pertama adalah wanita yang menikah pada usia 19 tahun ke
17

bawah, kategori kedua adalah wanita yang menikah pada usia di atas 19 tahun.

Batasan usia nikah pertama untuk wanita didasarkan pada pendapat Bogue (1969)

yang menyatakan bahwa jika pernikahan dilakukan pada usia 19 tahun disebut

nikah muda, sedangkan jika pernikahan dilakukan pada usia 20 tahun disebut

menikah dewasa.

Dari temuan-temuan mengenai pernikahan pada usia muda di atas, faktor

orang tua dalam kehidupan anak sangat berperan bahkan sangat menentukan

kapan anaknya tersebut harus menikah (Siswono, 1990). Masih ada pandangan

dalam masyarakat bahwa menstruasi pertama bagi seorang gadis merupakan tanda

kedewasaan yang kemudian mendorong para orang tua untuk segera menikahkan

anak gadisnya. Bahkan sering terjadi adanya pemalsuan usia bagi anak gadisnya,

dengan tujuan agar anak gadisnya tersebut bisa segera dinikahkan (Hanum, 1997).

Faktor-faktor lain selain faktor orang tua seperti disebutkan pada paragraf

sebelumnya adalah: (1) rendahnya pendidikan, (2) kemiskinan, (3) isolasi daerah,

(4) terbatasnya lapangan pekerjaan, dan (5) rendahnya mobilitas (Warta

Demografi, 2000).

Hasil penelitian Siswono (1999) menyatakan bahwa karakteristik individu

yang berpengaruh pada wanita menikah muda terdiri dari: (1) tingkat pendidikan

yang ditamatkan, (2) agama yang dianut, (3) status tempat tinggal, (4) status

bekerja, dan (5) status migran. Faktor pendidikan berpengaruh terhadap usia

pernikahan seseorang dan mampu meningkatkan usia pernikahan pertama bagi

wanita. Sementara itu, wanita yang bekerja dan berstatus migran memiliki
18

kemungkinan menikah usia muda lebih kecil jika dibandingkan dengan yang tidak

bekerja dan berstatus non migran.

Kemungkinan-kemungkinan penyebab dari tingginya persentase wanita

menikah muda di Provinsi Jawa Barat (71,37 persen) dapat ditampilkan dalam

bentuk Model Regresi Logistik Biner. Analisis Regresi Logistik Biner digunakan

karena merupakan sebuah metode yang optimal untuk analisis regresi dengan

variabel respon biner. Dalam penelitian ini variabel respon yang dimaksud terdiri

dari 2 (dua) kategori yaitu: wanita menikah muda (menikah usia 19 tahun ke

bawah) dan wanita menikah dewasa (menikah usia di atas 19 tahun).

3.5.Variabel-variabel yang Digunakan

Dari gambaran data di atas, maka variabel-variabel yang digunakan dalam

penelitian ini adalah :

Variabel Respon (Y):

Jenis Pernikahan, dikategorikan menjadi 2 kategori yaitu:

1 : Menikah Muda (menikah umur 19 tahun)

0 : Menikah Dewasa (menikah umur > 19 tahun)

Variabel Regressor (X):

X1 : Lama bersekolah (tahun)

X2 : Agama yang dianut, dikategorikan menjadi 2 kategori yaitu:

1 : Islam 0 : Non Islam

X3 : Status Tempat Tinggal, dikategorikan menjadi 2 kategori yaitu:

1 : Perdesaan 0 : Perkotaan
19

X4 : Status Bekerja, dikategorikan menjadi 2 kategori yaitu:

1 : Bekerja 0 : Tidak Bekeja

X5 : Status Migran, dikategorikan menjadi 2 kategori yaitu:

1 : Migran 0 : Non Migran
20

BAB IV

HASIL DAN PEMBAHASAN

4.1.Pendahuluan

Pada Bab ini akan ditampilkan deskripsi data hasil SUPAS 2005 yang

ditampilkan dalam bentuk crosstabs antara jenis pernikahan (variabel respon)

dengan variabel regressor yaitu: agama, status tempat tinggal, status bekerja,

status migran dan lama sekolah. Selain itu juga, disajikan hasil pendeteksian

outlier pada Regresi Logistik Biner dengan Metode DOUW untuk data SUPAS

Tahun 2005 di Kabupaten Sukabumi dan Provinsi Jawa Barat, seperti tercantum

dalam Lampiran 1 dan Lampiran 2. Pengolahan data dilakukan dengan

menggunakan Program SAS 9.2, syntax dalam bahasa SAS dapat dilihat pada

Lampiran 5).

Pendeteksian outlier pada data Kabupaten Sukabumi ditampilkan dengan

beberapa kemungkinan nilai weight ( dan level cut off (c). Nilai-nilai dan c

yang digunakan adalah 0.01, 0.05 dan 0.10. Penggunaan beberapa nilai-nilai

dan c dilakukan pada data Kabupaten Sukabumi karena proses komputasinya

tidak memerlukan waktu yang lama, untuk satu kali proses run data memerlukan

waktu sekitar 10 sampai dengan 15 menit. Selanjutnya dari output yang

dihasilkan, bisa diperoleh gambaran pola sebagai akibat penggunaan pasangan

nilai dan c, baik terhadap jumlah outlier yang terdeteksi maupun taksiran

parameter yang diperoleh.
21

Sedangkan untuk pendeteksian outlier Provinsi Jawa Barat digunakan nilai

= 0.05 dan c = 0.05. Penggunaan salah satu pasangan nilai dan c dalam proses

pengolahan data pada Provinsi Jawa Barat merupakan salah satu contoh saja. Hal

tersebut dilakukan karena untuk satu kali proses run data untuk Provinsi Jawa

Barat memerlukan waktu yang cukup lama, sekitar 1 jam lebih untuk satu proses.

4.2.Deskripsi Data Hasil SUPAS 2005

Pada bagian ini akan disajikan ringkasan data yang berhubungan dengan

wanita menikah muda dan faktor-faktor yang mempengaruhinya, yaitu: agama,

status tempat tinggal, status bekerja, status migran dan lama sekolah. Pada Tabel

4.1. di bawah, menunjukkan bahwa secara nasional persentase wanita menikah

muda masih tinggi sebesar 61.9%. Provinsi yang memiliki persentase wanita

menikah muda paling tinggi adalah Jawa Barat sebesar 71.4%. Sedangkan

provinsi yang memiliki persentase wanita menikah mudanya paling rendah adalah

Nusa Tenggara Timur sebesar 38.5%.

Sungguh merupakan suatu phenomena yang cukup menarik untuk dikaji

lebih dalam, bagi sebuah provinsi seperti Provinsi Jawa Barat, provinsi yang

berbatasan langsung dengan ibu kota negara, atau sebagai sebuah provinsi

penyangga ibu kota, ternyata persentase wanita menikah mudanya paling tinggi.

Dari segi sarana dan prasarana pendidikan, Provinsi Jawa Barat juga merupakan

provinsi dimana terletak beberapa perguruan tinggi ternama di Indonesia, sebut

saja: ITB, Unpad, IPB, UI, dan perguruan tinggi lainnya yang tidak kalah

kualitasnya. Tentunya hal ini merupakan suatu tantangan bagi pihak-pihak terkait
22

untuk segera merumuskan sebuah kebijakan stategis dan terobosan yang berani,

khususnya dalam peningkatan usia menikah bagi masyarakat Provinsi Jawa Barat.

Tabel 4.1. Persentase Wanita Menikah menurut Jenis Pernikahan dan Provinsi di Indonesia Tahun 2005

No Provinsi Jenis Pernikahan

Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Sumatera Utara 55.88 44.12 2 Sumatera Barat 46.98 53.02 3 Riau 46.99 53.01 4 Jambi 33.95 66.05 5 Sumatera Selatan 40.21 59.79 6 Bengkulu 35.63 64.37 7 Lampung 35.58 64.42 8 Bangka Belitung 43.28 56.72 9 Kepulauan Riau 60.90 39.10 10 DKI Jakarta 54.07 45.93 11 Jawa Barat 28.63 71.37 12 Jawa Tengah 34.76 65.24 13 DI Yogyakarta 53.90 46.10 14 Jawa Timur 31.53 68.47 15 Banten 33.64 66.36 16 Bali 56.50 43.50 17 Nusa Tenggara Barat 39.79 60.21 18 Nusa Tenggara Timur 61.46 38.54 19 Kalimantan Barat 44.71 55.29 20 Kalimantan Tengah 39.11 60.89 21 Kalimantan Selatan 34.22 65.78 22 Kalimantan Timur 45.33 54.67 23 Sulawesi Utara 59.98 40.02 24 Sulawesi Tengah 42.23 57.77 25 Sulawesi Selatan 44.53 55.47 26 Sulawesi Tenggara 39.02 60.98 27 Gorontalo 50.75 49.25 28 Maluku 59.78 40.22 29 Maluku Utara 48.92 51.08 30 Papua 43.07 56.93

INDONESIA 38.09 61.91

Sumber : SUPAS 2005, diolah.
23

Untuk meneliti lebih dalam mengenai tingginya persentase wanita

menikah muda di Provinsi Jawa Barat, akan ditunjukkan keadaan wanita menikah

muda menurut faktor-faktor yang mempengaruhinya. Tabel 4.2. menampilkan

persentase wanita menikah menurut jenis pernikahan dirinci menurut

kabupaten/kota.

Tabel 4.2. Persentase Wanita Menikah menurut Jenis Pernikahan dan Kabupaten/Kota di Provinsi Jawa Barat Tahun 2005

No Kabupaten/Kota Jenis Pernikahan

Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Bogor 29.40 70.60 2 Sukabumi 16.78 83.22 3 Cianjur 15.37 84.63 4 Bandung 29.30 70.70 5 Garut 21.77 78.23 6 Tasikmalaya 20.42 79.58 7 Ciamis 21.31 78.69 8 Kuningan 27.39 72.61 9 Cirebon 26.10 73.90 10 Majalengka 20.18 79.82 11 Sumedang 17.08 82.92 12 Indramayu 18.89 81.11 13 Subang 22.33 77.67 14 Purwakarta 23.59 76.41 15 Karawang 23.08 76.92 16 Bekasi 30.61 69.39 17 Bogor 47.61 52.39 18 Sukabumi 36.78 63.22 19 Kota Bandung 50.89 49.11 20 Kota Cirebon 47.89 52.11 21 Kota Bekasi 53.24 46.76 22 Kota Depok 50.02 49.98 23 Kota Cimahi 51.97 48.03 24 Kota Tasikmalaya 34.68 65.32 25 Kota Banjar 28.99 71.01

PROVINSI JAWA BARAT 28.63 71.37

Sumber : SUPAS 2005, diolah.
24

Pada Tabel 4.2. di atas, memperlihatkan bahwa terdapat 4 kabupaten yang

persentase wanita menikah muda di atas 80 persen, yakni: Sukabumi 83.22

persen, Cianjur 84.63 persen, Sumedang 82.92 persen dan Indramayu 81.11

persen. Sementara itu terdapat 4 kota yang memiliki persentase wanita menikah

muda di bawah 50 persen, yakni: Bandung 49.11 persen, Bekasi 46.76 persen,

Depok 49.98 persen dan Cimahi 48.03 persen.

Secara ringkas, Kabupaten Cianjur merupakan kabupaten dengan

persentase wanita menikah muda tertinggi di Provinsi Jawa Barat, sedangkan Kota

Bekasi merupakan kota dengan persentase wanita menikah muda terendah.

Dalam bentuk gambar visual dapat dilihat pada Gambar 4.1. berikut:

Gambar 4.1. Persentase Wanita Menikah Muda menurut Kabupaten/Kota di Provinsi Jawa Barat

0

10

20

30

40

50

60

70

80

90

Bog

orSu

kabu

mi

Cia

njur

Ban

dung

Gar

utTa

sikm

alay

aC

iam

isK

unin

gan

Cire

bon

Maj

alen

gka

Sum

edan

gIn

dram

ayu

Suba

ngPu

rwak

arta

Kar

awan

gB

ekas

iB

ogor

Suka

bum

iB

andu

ngC

irebo

nB

ekas

iD

epok

Cim

ahi

Tasi

kmal

aya

Ban

jar

70.6

83 85

7178 80 79

73 7480

83 8178 76 77

69

52

63

4952

4750 48

6571
25

Sedangkan dalam Gambar 4.2. di bawah berikut ini menggambarkan

persentase wanita menikah menurut jenis pernikahan:

Gambar 4.2. Persentase Wanita Menikah Muda dan Dewasa di Provinsi Jawa Barat

Selanjutnya, salah satu faktor yang mempengaruhi wanita menikah muda adalah

agama. Tabel 4.2. di bawah menampilkan persentase wanita menikah menurut

jenis pernikahan berdasarkan agama yang dianut.

Tabel 4.3. Persentase Wanita Menikah menurut Jenis Pernikahan dan Agama yang Dianut di Provinsi Jawa Barat Tahun 2005

No Agama Jenis Pernikahan

Menikah Dewasa Menikah Muda

(1) (2) (3) (4)

1 Non Islam 77.13 22.87

2 Islam 27.64 72.36

Sumber : SUPAS 2005, diolah.

71.37

28.63

Wanita Menikah Muda

Wanita Menikah Dewasa
26

Dalam bentuk gambar, persentase wanita menikah menurut jenis pernikahan dan

agama, seperti terlihat pada Gambar 4.3. berikut ini:

Gambar 4.3. Persentase Wanita Menikah menurut Jenis Pernikahan dan Agama di Provinsi Jawa Barat

Pada Tabel 4.3. memperlihatkan bahwa wanita yang beragama Islam

memiliki persentase menikah muda jauh lebih tinggi (72.36%) jika dibanding

dengan wanita non Islam (22.87%). Dari data tersebut dapat disimpulkan bahwa

wanita yang beragama non Islam cenderung melakukan pernikahan pada usia

dewasa, sebaliknya terjadi pada wanita yang beragama Islam cenderung menikah

pada usia muda.

Sementara itu, Tabel 4.4. di bawah memperlihatkan bahwa wanita yang

tinggal di perdesaan cenderung melangsungkan pernikahan di usia muda.

Sedangkan yang bertempat tinggal di perkotaan cenderung melangsungkan

pernikahan pada usia dewasa.

MenikahDewasa

MenikahMuda

0

10

20

30

40

50

60

70

80

NonIslamIslam
27

Tabel 4.4. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Tempat Tinggal di Provinsi Jawa Barat Tahun 2005

No Status Tempat Tinggal Jenis Pernikahan

Menikah Dewasa Menikah Muda

(1) (2) (3) (4)

1 Perkotaan 77.13 22.87

2 Perdesaan 27.64 72.36

Sumber : SUPAS 2005, diolah.

Persentase wanita menikah menurut jenis pernikahan dan status tempat

tinggal dalam bentuk gambar adalah:

Gambar 4.4. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Tempat Tinggal di Provinsi Jawa Barat

Jika dilihat dari persentase jenis pernikahan dan status bekerja wanita

dapat dilihat pada Tabel 4.5 di bawah ini:

MenikahDewasa

MenikahMuda

0

20

40

60

80

100

PerkotaanPerdesaan
28

Tabel 4.5. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Bekerja di Provinsi Jawa Barat Tahun 2005

No Status Bekerja Jenis Pernikahan

Menikah Dewasa Menikah Muda

(1) (2) (3) (4)

1 Tidak Bekerja 28.60 71.40

2 Bekerja 28.69 71.31

Sumber : SUPAS 2005, diolah.

Secara umum baik wanita bekerja maupun tidak bekerja, cenderung melakukan

pernikahan pada usia muda. Akan tetapi wanita yang berstatus tidak bekerja

memiliki kecenderungan menikah pada usia muda daripada wanita yang bekerja,

walaupun perbedaannya sangat kecil. Dalam bentuk gambar dapat disajikan

sebagai berikut:

Gambar 4.5. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Bekerja Tinggal di Provinsi Jawa Barat

0 20 40 60 80

TidakBekerja

Bekerja

MenikahMuda

MenikahDewasa
29

Selanjutnya, Tabel 4.6. menampilkan wanita menikah menurut jenis

pernikahan dan status migran. Tabel 4.6 di bawah menunjukkan bahwa wanita

yang berstatus migran cenderung melakukan pernikahan di usia muda dari pada

wanita yang berstatus non migran. Baik wanita berstatus migran atau pun non

migran, wanita cenderung menikah pada usia muda, hal ini terlihat dari persentase

menikah muda untuk masing-masing, yaitu wanita berstatus non migran sebesar

61.89 persen dan migran sebesar 71.39 persen.

Tabel 4.6. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Migran di Provinsi Jawa Barat Tahun 2005

No Status Migran Jenis Pernikahan

Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Non Migran 38.11 61.89

2 Migran 28.61 71.39 Sumber : SUPAS 2005, diolah.

Dalam bentuk visualisasi gambar dapat dilihat pada Gambar 4.6. berikut ini:

Gambar 4.6. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Migran di Provinsi Jawa Barat

0 20 40 6080

NonMigran

Migran

MenikahMuda

MenikahDewasa
30

Selanjutnya, persentase wanita menurut jenis pernikahan dan lama sekolah dapat

dilhat pada Tabel 4.7. berikut ini:

Tabel 4.7. Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama Sekolah di Provinsi Jawa Barat Tahun 2005

No Lama Sekolah (Tahun) Jenis Pernikahan

Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 0 13.67 86.33 2 1 11.90 88.10 3 2 11.66 88.34 4 3 15.19 84.81 5 4 11.77 88.23 6 5 13.36 86.64 7 6 19.55 80.45 8 7 27.71 72.29 9 8 29.01 70.99 10 9 31.98 68.02 11 10 39.34 60.66 12 11 42.40 57.60 13 12 69.72 30.28 14 13 87.91 12.09 15 14 81.78 18.22 16 15 89.69 10.31 17 16 91.66 8.34 18 17 83.72 16.28 19 > 19 100.00 0.00

Sumber : SUPAS 2005, diolah.

Dari Tabel 4.7. di atas terlihat bahwa wanita yang lama pendidikannya 6

tahun (jika dikonversi hampir sama dengan lulus SD), persentase menikah

mudanya di atas 80 persen, sementara itu wanita yang lama pendidikannya 9
31

tahun (lulus SMP), persentase menikah mudanya berada di sekitar 70 persen dan

lama pendidikannya 12 tahun (lulus SMA), persentase menikah mudanya antara

30-61 persen.

Dari Tabel 4.7. di atas, terlihat dengan jelas adanya pola, bahwa semakin

lama seseorang wanita menamatkan pendidikannya, maka semakin kecil

persentase menikah mudanya. Artinya bahwa wanita yang berpendidikan lebih

tinggi cenderung melangsungkan pernikahannya pada usia dewasa.

Dalam bentuk gambar dapat dilihat pada Gambar 4.7. berikut:

Gambar 4.7. Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama Sekolah di Provinsi Jawa Barat

4.3.Pendeteksian Outlier untuk Data SUPAS 2005 Kabupaten Sukabumi

Menurut data SUPAS 2005, persentase wanita menikah muda di

Kabupaten Sukabumi sebesar 83.22 persen. Ukuran sampel (n) pada data SUPAS

0

20

40

60

80

100

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 >19

MenikahMuda

MenikahDewasa

LamaSekolah(tahun)
32

2005 Kabupaten Sukabumi sebanyak 967 pengamatan, yang merupakan penduduk

wanita berumur 10 tahun keatas yang pernah menikah. Jumlah variabel regressor

(K) sebanyak 5, yaitu: Agama yang Dianut, Status Tempat tinggal, Status Bekeja,

Status Migran dan Lama Sekolah, sedangkan variabel responnya adalah Jenis

Pernikahan. Berikut ini adalah ringkasan output hasil pendeteksian outlier:

Dengan mengacu pada langkah-langkah seperti yang tercantum pada

Lampiran 3 dan 4, maka didapat hasil seperti tercantum pada Tabel 4.1 berikut ini:

Tabel 4.8. Banyaknya Pengamatan yang Terdeteksi sebagai Outlier dengan Metode DOUW dan Deviance Residual

Epsilon Level Cut Off (C)

() 0.01 0.05 0.10

(1) (2) (3) (4)

0.01 19 97 108

0.05 0 75 103

0.10 0 75 97

Deviance Residual 27

Pada Tabel 4.8. ditunjukkan bahwa dengan menggunakan nilai = 0.01

dan untuk nilai c = 0.01, 0.05 dan 0.10, dihasilkan banyaknya pengamatan yang

terdeteksi sebagai outlier masing-masing sebanyak 19, 97, dan 108. Sementara,

jika menggunakan nilai = 0.05 dan nilai c = 0.01, 0.05 dan 0.10, dihasilkan

banyaknya pengamatan yang terdeteksi sebagai outlier masing-masing sebanyak
33

0, 75, dan 103. Sedangkan jika menggunakan nilai = 0.10 dan nilai c = 0.01,

0.05 dan 0.10, dihasilkan banyaknya pengamatan yang terdeteksi sebagai outlier

masing-masing sebanyak 0, 75, dan 97.

Akan tetapi jika menggunakan nilai c = 0.01 dan nilai = 0.01, 0.05, dan

0.10, banyaknya pengamatan yang terdeteksi sebagai outlier masing-masing

sebanyak 19, 0, dan 0. Sementara, jika menggunakan nilai c = 0.05 dan nilai =

0.01, 0.05 dan 0.10, banyaknya pengamatan yang terdeteksi sebagai outlier

masing-masing sebanyak 97, 75, dan 75. Sedangkan jika menggunakan nilai c =

0.10 dan nilai = 0.01, 0.05 dan 0.10, dihasilkan banyaknya pengamatan yang

terdeteksi sebagai outlier masing-masing sebanyak 108, 103, dan 97. Sedangkan

jika menggunakan deviance residual untuk masing-masing pengamatan, jumlah

outlier yang terdeteksi sebanyak 27 pengamatan.

Dari ringkasan Tabel 4.8. di atas memperlihatkan, bahwa untuk nilai

tertentu dan nilai c yang semakin mendekati 1, maka banyaknya pengamatan yang

terdeteksi sebagai outlier semakin banyak. Sedangkan untuk nilai c tertentu dan

nilai yang semakin mendekati 0, maka banyaknya pengamatan yang terdeteksi

sebagai outlier semakin sedikit.

Sementara, jika pendeteksian outlier dengan cara menghitung deviance

residual-nya, maka jumlah outlier yang terdeteksi sebanyak 27 pengamatan.

Apabila dibandingkan antara metode deviance residual dengan metode DOUW,

maka jumlah outlier yang terdeteksi oleh metode deviance residual hampir sama

dengan metode DOUW untuk pasangan nilai = 0.01 dan nilai c antara 0.01-
34

0.05. Secara grafik, penjelasan untuk penggunaan pasangan nilai = 0.01 dan

c=0.01 dapat dilihat pada Gambar 4.8. berikut:

Gambar 4.8. Scatter Plot antara Observasi dengan Probabilitas (G) pada Data SUPAS 2005 Kabupaten Sukabumi

(untuk n=967, K=5, =0.01, C=0.01)

Pada Gambar 4.8. di atas, menggambarkan sebaran peluang masing-

masing pengamatan untuk data SUPAS 2005 Kabupaten Sukabumi (n=967, K=5,

=0.01, dan c=0.01). Tanda segitiga merupakan pengamatan yang terdeteksi

sebagai outlier, sedangkan tanda bulat merupakan pengamatan yang bukan

outlier (inlier). Pengamatan yang terdeteksi sebagai outlier sebanyak 19

Inlier Outlier
35

pengamatan. Selanjutnya, untuk memperlihatkan taksiran parameter regresi

logistik biner pada berbagai pasangan nilai dan c, dapat dilihat pada Tabel 4.9.

berikut:

Tabel 4.9. Taksiran Parameter untuk masing-masing Nilai dan c (untuk n=967 dan K=5)

Metode DOUW Taksiran Parameter () Variabel Regressor

Iterasi Awal -0.219096 1.463611 0.07805 -0.017111 -0.289625 -0.064513

Itera

si A

khir

=0.01, C=0.01 -2.228715 28.561103 0.745062 -1.017507 -20.60555 -0.501863

=0.01, C=0.05 6.009056 27.946053 0.991507 -0.932734 -25.14176 -0.768705

=0.01, C=0.10 1.569823 28.53216 1.304153 -1.677466 -20.35584 -0.865654

=0.05, C=0.01 -1.693234 24.742933 0.081209 -0.08635 -19.11177 -0.345153

=0.05, C=0.05 -0.495424 24.879487 0.672546 -0.88321 -18.68798 -0.499501

=0.05, C=0.10 0.630008 27.354837 0.849183 -0.743998 -20.39371 -0.66003

=0.10, C=0.01 -0.731997 25.751983 0.073094 -0.086068 -21.23428 -0.328101

=0.10, C=0.05 -0.645959 24.642839 0.618584 -0.775922 -18.6353 -0.46836

=0.10, C=0.10 0.761374 26.69478 0.484053 -0.415487 -20.80062 -0.581004

Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama

= Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran = Taksiran Parameter untuk Variabel Lama Sekolah

Ringkasan output pada Tabel 4.9. memperlihatkan perubahan taksiran

parameter regresi logistik biner yang dihasilkan dari iterasi pertama sampai iterasi
36

terakhir dengan metode DOUW. Taksiran parameter pada iterasi awal untuk

setiap pasangan nilai dan c adalah =-0.219096, =1.463611, =0.07805,

= -0.017111, = -0.289625, dan = -0.064513. Taksiran parameter pada

iterasi awal maksudnya adalah taksiran parameter yang diperoleh dari data tanpa

memperhatikan data tersebut ada atau tidaknya pengamatan yang merupakan

outlier. Sedangkan taksiran parameter pada iterasi akhir adalah taksiran parameter

yang dihasilkan setelah memperhatikan adanya outlier, sehingga taksiran

parameter yang diperoleh pada iterasi akhir merupakan taksiran parameter yang

robust.

Apabila diperhatikan pada Tabel 4.9. di atas, maka terlihat bahwa

perubahan nilai taksiran parameter pada seluruh variabel regressor dari iterasi

awal ke iterasi akhir mengalami perubahan nilai yang sangat signifikans. Sebagai

contoh, nilai taksiran parameter pada iterasi awal untuk =1.463611, berubah

menjadi = 28.561103 pada iterasi akhir untuk =0.01 dan c=0.01. Bahkan

untuk seluruh pasangan dan c berapa pun mengalami peningkatan yang sangat

signifikans. Dari hasil ini memperlihatkan bahwa pengaruh dari keberadaan

outlier sangat serius terhadap taksiran parameter, khususnya pada regresi logistik

biner. Sehingga secara otomatis akan berpengaruh terhadap model regresi logistik

biner yang dihasilkan dan tentunya akan menentukan kesimpulan akhir dari suatu

permasalahan.

Berikutnya, dari metode DOUW ini dapat ditunjukkan keberadaan outlier

dan hasil taksiran parameternya untuk berbagai pasangan nilai dan c pada Tabel

4.10. di bawah ini:
37

Tabel 4.10. Taksiran Parameter () untuk masing-masing Nilai dan c, serta Banyaknya Outlier yang Terdeteksi dengan Metode DOUW

(Untuk n=967 dan K=5) dan Deviance Residual

Metode DOUW Taksiran Parameter () Variabel Regressor Banyak

Outlier

=0.01, C=0.01 -2.228715 28.561103 0.745062 -1.017507 -20.60555 -0.501863 19

=0.01, C=0.05 6.009056 27.946053 0.991507 -0.932734 -25.14176 -0.768705 97

=0.01, C=0.10 1.569823 28.53216 1.304153 -1.677466 -20.35584 -0.865654 108

=0.05, C=0.01 -1.693234 24.742933 0.081209 -0.08635 -19.11177 -0.345153 0

=0.05, C=0.05 -0.495424 24.879487 0.672546 -0.88321 -18.68798 -0.499501 75

=0.05, C=0.10 0.630008 27.354837 0.849183 -0.743998 -20.39371 -0.66003 103

=0.10, C=0.01 -0.731997 25.751983 0.073094 -0.086068 -21.23428 -0.328101 0

=0.10, C=0.05 -0.645959 24.642839 0.618584 -0.775922 -18.6353 -0.46836 75

=0.10, C=0.10 0.761374 26.69478 0.484053 -0.415487 -20.80062 -0.581004 97

Deviance Residual 27

Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama

= Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran

= Taksiran Parameter untuk Variabel Lama Sekolah

Tabel 4.10. di atas menampilkan ringkasan output yang memperlihatkan

banyaknya pengamatan yang terdeteksi sebagai outlier dan sekaligus

mendapatkan taksiran parameter yang robust. Hal ini merupakan tujuan utama

dari metode DOUW yaitu: mendeteksi outlier sekaligus mendapatkan taksiran

parameter regresi logistik biner yang robust. Sedangkan jika menggunakan
38

metode deviance residual, taksiran parameternya tidak ada, karena metode ini

hanya untuk mendeteksi outlier saja.

Taksiran parameter yang dihasilkan dengan menggunakan metode

DOUW, untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan

nilai yang tidak terlalu jauh berbeda dan tidak merubah tanda pada taksiran

parameternya, walaupun banyaknya outlier yang terdeteksi tidak sama. Seperti

yang telah dijelaskan pada pembahasan Tabel 4.8. sebelumnya, bahwa semakin

besar nilai c yang digunakan, maka semakin banyak pula pengamatan yang

terdeteksi sebagai outlier, begitu juga sebaliknya, semakin kecil nilai c yang

digunakan, maka semakin sedikit pula pengamatan yang terdeteksi sebagai

outlier. Berbeda dengan penggunaan nilai , semakin besar menggunakan nilai ,

maka semakin sedikit outlier yang terdeteksi dan semakin kecil nilai yang

digunakan, maka akan semakin banyak outlier yang terdeteksi. Secara garis besar,

penggunaan nilai c berbanding lurus dengan banyaknya outlier yang terdeteksi.

Sedangkan penggunaan nilai berbanding terbalik dengan banyaknya outlier

yang terdeteksi.

Dari Tabel 4.10. memperlihatkan bahwa taksiran parameter yang

dihasilkan dengan metode DOUW untuk nilai =0.01 dan c=0.01 adalah = -

2.228715, =28.561103, =0.745062, = -1.017507, = -20.60555, dan =

-0.501863, banyaknya pengamatan yang terdeteksi sebagai outlier sebanyak 19

pengamatan, yaitu: pengamatan nomor: 18, 25, 31, 75, 184, 213, 275, 374, 411,

501, 559, 646, 672, 711, 722, 731, 800, 891, dan 927. Sedangkan jumlah outlier

yang terdeteksi oleh metode devians residual sebanyak 27 pengamatan, yaitu
39

pengamatan nomor: 18, 25, 28, 31, 75, 135, 146, 184, 191, 213, 229, 275, 374,

411, 415, 501, 559, 646, 662, 672, 711, 722, 731, 733, 800, 891, dan 927. Jika

diperhatikan, nomor pengamatan yang terdeteksi sebagai outlier oleh metode

DOUW, maka akan terdeteksi juga oleh metode deviance residual, begitu juga

sebaliknya. Masing-masing banyaknya pengamatan yang terdeteksi sebagai

outlier beserta nomor pengamatan secara lengkap untuk masing-masing pasangan

dan c dapat dilihat pada Lampiran 6.

Pada Tabel 4.10. di atas, menunjukkan variabel Agama dan Status Tempat

Tinggal wanita bernilai positif, hal ini berarti bahwa orang yang beragana Islam

atau orang yang bertempat tinggal di perdesaan memiliki kecenderungan untuk

melangsungkan pernikahannya pada usia muda. Sedangkan variabel yang bernilai

negatif adalah variabel Status Bekerja, Status Migran, dan Lama Sekolah, hal ini

berarti bahwa, wanita yang bekerja atau berstatus migran atau semakin lama masa

pendidikannya, memiliki kecenderungan untuk menikah pada usia dewasa.

4.4. Pendeteksian Outlier untuk Data SUPAS 2005 Provinsi Jawa Barat

Menurut data SUPAS 2005, persentase wanita menikah muda di Provinsi

Jawa Barat sebesar 71,37 persen, merupakan persentase tertinggi dibandingkan

dengan provinsi lainnya di Indonesia. Ukuran sampel (n) pada data SUPAS 2005

untuk Provinsi Jawa Barat sebanyak 21.772 pengamatan, yang merupakan

penduduk wanita berumur 10 tahun keatas yang pernah menikah. Berikut ini

adalah ringkasan output hasil pendeteksian outlier sekaligus taksiran

parameternya.
40

Tabel 4.11. Taksiran Parameter () dan Banyaknya Outlier yang Terdeteksi oleh

Metode DOUW (n=21772, K=5, =0.05 & c=0.05) dan Deviance Residual, serta Nilai Odds Ratio

Metode DOUW Taksiran Parameter () Variabel Regressor Banyak

Outlier

Iterasi Awal 0.206886 0.483644 0.216507 -0.02973 0.175381 -0.08526

Iterasi Akhir 0.10830 2.796836 1.429871 -0.12015 1.406145 -0.44967 1.329

Deviance Residual 663

Odds Ratio 16.39 4.18 0.89 4.08 0.64

Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama

= Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran

= Taksiran Parameter untuk Variabel Lama Sekolah

Pada Tabel 4.11. di atas menunjukkan bahwa banyaknya outlier yang

terdeteksi menggunakan metode DOUW sebanyak 1.329 pengamatan, rincian

nomor pengamatan yang terdeteksi sebagai outlier dapat dilihat pada Lampiran 7.

Sedangkan jika menggunakan metode deviance residual terdeteksi sebanyak 663

pengamatan. Tabel 4.11 juga menunjukkan bahwa variabel Agama, Status Tempat

Tinggal, dan Status Migran bernilai positif, hal ini berarti bahwa wanita yang

beragama Islam atau bertempat tinggal di perdesaan atau berstatus migran

memiliki kecenderungan untuk melangsungkan pernikahannya pada usia muda.

Sedangkan variabel yang bernilai negatif adalah variabel Status Bekerja dan Lama

Sekolah, hal ini berarti bahwa, wanita yang bekerja atau semakin lama masa

pendidikan seorang wanita, memiliki kecenderungan untuk menikah pada usia

dewasa.
41

Sementara itu, diperoleh taksiran parameter untuk masing-masing variabel

regressor sebesar =0.10830, =2.796836, =1.429871, = -0.12015, =

1.406145, dan = -0.44967. Sehingga model regresi logistik biner dapat

dinyatakan sebagai berikut:

exp 0.10830 2.796836 1.429871 0.12015 1.406145 0.44967

1 exp 0.10830 2.796836 1.429871 0.12015 1.406145 0.44967

Dimana: X1 adalah Variabel Agama X2 adalah Variabel Status Tempat Tinggal X3 adalah Variabel Status Status Bekerja X4 adalah Variabel Status Status Migran X5 adalah Variabel Status Lama Sekolah

Selanjutnya untuk menginterpretasikan taksiran parameter dalam model

regresi logistik biner, digunakan Odds Ratio, yang diperoleh melalui exponensial

dari . Odds Ratio menggambarkan risiko kecenderungan suatu kategori tertentu

terhadap kategori lainnya (reference category) dalam satu variabel regressor atau

suatu nilai tertentu terhadap nilai lainnya dalam satu variabel tertentu. Odds ratio

untuk masing-masing variabel adalah sebagai berikut:

a. Variabel Agama sebesar 16.39, artinya wanita yang beragama Islam

memiliki kecenderungan menikah muda 16.39 kali dibandingkan dengan

wanita yang beragama non-Islam.

b. Variabel Status Tempat Tinggal sebesar 4.18, artinya wanita yang

bertempat tinggal di perdesaan memiliki kecenderungan menikah muda 4.18

kali dibandingkan dengan wanita yang bertempat tinggal di perkotaan.
42

c. Variabel Status Bekerja sebesar 0.89, artinya wanita yang bekerja memiliki

kecenderungan menikah muda 0.89 kali dibandingkan dengan wanita yang

tidak bekerja, atau orang yang tidak bekerja memiliki kecenderungan menikah

muda 1.12 kalinya dibandingkan dengan orang yang bekerja.

d. Variabel Status Migran sebesar 4.08, artinya wanita yang berstatus migran

memiliki kecenderungan menikah muda 4.08 kali dibandingkan dengan wanita

yang non migran.

e. Variabel Lama Sekolah 0.64, artinya wanita yang lama pendidikannya t

tahun memiliki kecenderungan menikah muda sebesar 0.64 kali dibandingkan

dengan wanita yang lama pendidikannya t-1 tahun. Oleh karena variabel lama

sekolah bersifat kontinu, untuk memudahkan dalam menginterpretasikan nilai

odds ratio-nya, maka interpretasi dilakukan untuk setiap 3 tahunan. Dari hasil

perhitungan, {exp(3(-0.44967)}, diperoleh nilai odds ratio untuk 3 tahunan

sebesar 0.26. Artinya, wanita yang lama sekolahnya 6 tahun (lulus SD)

memiliki kecenderungan menikah muda 0.16 kali dibandingkan dengan wanita

yang lama pendidikannya 3 tahun (berhenti di kelas 4 SD), atau wanita yang

sekolahnya berhenti di kelas 4 SD memiliki kecenderungan menikah muda

sebesar 3.85 kali dibandingkan dengan wanita yang lulus SD. Atau contoh

lainnya, wanita yang lulus SMP memiliki kecenderungan menikah muda

sebesar 3.85 kali dibandingkan dengan wanita yang lulus SMA. Walaupun

Odds Ratio untuk setiap 3 tahunan tingkat pendidikan sama, akan tetapi risiko

wanita menikah muda untuk masing-masing tingkatan pendidikan tidaklah

sama. Sebagai contoh, odds ratio wanita yang lulus SMP dengan yang lulus
43

SMA nilainya sama dengan odds ratio wanita yang lulus SMA dengan wanita

yang lulus D3 sama, akan tetapi risiko menikah muda wanita lulus D3 dengan

wanita yang lulus SMA tidak sama. Hal ini berlaku untuk setiap tingkatan

pendidikan.
44

BAB V

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Pada bab sebelumnya telah dijelaskan bahwa metode DOUW merupakan

suatu prosedur untuk mendeteksi outlier dalam arah y. Dalam metode DOUW,

ada empat hal yang harus dilengkapi yaitu: penentuan g1 yang optimal, jumlah

iterasi, pilihan (weight), dan pilihan level cut off (c). Berdasarkan hasil dan

pembahasan pada bab sebelumnya, maka dapat diambil beberapa kesimpulan

sebagai berikut:

1. Untuk nilai tertentu dan nilai c yang semakin mendekati 1, maka banyaknya

pengamatan yang terdeteksi sebagai outlier semakin banyak. Sedangkan

untuk nilai c tertentu dan nilai yang semakin mendekati 0, maka banyaknya

pengamatan yang terdeteksi sebagai outlier semakin sedikit.

2. Perubahan nilai taksiran parameter pada seluruh variabel regressor dari iterasi

awal ke iterasi akhir mengalami perubahan yang sangat signifikans. Dari hasil

ini memperlihatkan bahwa pengaruh dari keberadaan outlier terhadap taksiran

parameter sangat serius, khususnya pada regresi logistik biner, sehingga secara

otomatis akan berpengaruh terhadap model regresi logistik biner yang

dihasilkan yang akan menentukan kesimpulan akhir dari suatu permasalahan.

3. Taksiran parameter yang dihasilkan dengan menggunakan metode DOUW,

untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan nilai
45

yang tidak terlalu jauh berbeda dan tidak merubah tanda pada taksiran

parameternya, walaupun banyaknya outlier yang terdeteksi tidak sama.

5.2. Saran

1. Walaupun pemilihan pasangan konstanta dan c tidak merubah nilai taksiran

parameter regresi logistik biner secara signifikans, akan tetapi perlu dilakukan

kajian lebih dalam untuk membuat panduan yang konkrit dalam pemilihan

kedua nilai konstanta tersebut.

2. Sehubungan dengan proses komputasi yang cukup rumit, maka untuk

penelitian lebih lanjut, perlu kiranya dirancang prosedur yang lebih praktis

dalam proses komputasinya.
46

DAFTAR PUSTAKA

Agresti, Alan, (1990), Categorical Data Analysis, John Wiley & Sons, Inc. New

York. ______, (1997), Categorical Data Analysis, John Wiley & Sons, Inc. New York. Bogue O.J, (1969), Principle of Demography, John Wiley & Sons, Inc. New

York. Chen, Collin. Robust Regression and Outlier Detection with the ROBUSTREG

Procedure. Institute Inc., Cary, NC. Page 265-27. Chang, I., Tiao, G.C. dan Chen, C. (1988), Estimation of Time Series Parameters

in the Presence of Outliers, Technometrics, Vol. 30, hal. 193-204. Copas, J.B. 1988. Binary regression models for contaminated data.

Withdiscussion. Journal of the Royal Statistical Society. Series B (Methodological), 50(2):225.265.

Hadi, Ali S.,Rahmatullah Imon, A.H.M and Werner, Mark. (2009), Detection of

Outlier, John Wiley & Sons, Inc. WIREs Comp Stat 2009 1 5770. Hanum, Sri Handayani,(1997), Perkawinan Belia, PPK-UGM dan Fond

Fondation, Yogyakarta. Hosmer, D.W. dan Lemeshow (1989), Applied Logistic Regression, John Wiley,

New York. Midi, Habshah & Jaafar, Asmi (2007), The Residual Plot For A Non-Linear

Regression Model With The Presence Of Outliers And Heteroscedastic Errors, Jurnal Teknologi, 41(C) Dis. 2004: 1126 Universiti Teknologi Malaysia.

Neykov, N.M. & Muller, C.H. (2002). Breakdown Point and Computation of

Trimmed Likelihood Estimators in GLMs. In: R. Dutter et al., editors, Developments in robust statistics, Physica Verlag, Heidelberg.
47

Rousseeuw, P.J. & Leroy, A.M. (1987). Robust regression and outlier detection. New York: John Wiley & Sons. 329p.

Rousseeuw, P.J. & Van Driesen, K. 1999a. Computing LTS Regression for Large

Data Sets. Technical report, University of Antwerp. _________. 1999b. A Fast Algorithm for the Minimum Covariance Determinant

Estimator. Technometrics, 41(3):212. 223. Rousseeuw, P.J. & Christmann, A. (2003). Robustness against separation and

outliers in logistic regression. Computational Statistics & Data Analysis, 43(3):315-332, July 2003.

Sembiring, RK. (2003), Analisis Regresi, edisi kedua, ITB.Bandung. Siswono, Eka. (2000). Pergeseran Budaya Perkawinan di Jawa Barat : Suatu

Tinjauan Usia Kawin Pertama dalam Kasus Pekerja Perempuan di Botabek. Warta Demografi. LD-FEUI. Jakarta.

Soemartini (2007). Pencilan (Outlier). Jurusan Statistika Fakultas MIPA UNPAD,

Bandung. Tukey, JW. A. Survey of Sampling from Contaminated Distribution. In. Olkin.

Editor. Contributions to Probability and Statistic. Stanford. Stanford University Press, 1960.P.448-85.

Venter, JH & de la Rey, T (2007), Detects Outlier Using Weights in Logistic

Regression, Centre for Business Mathematics and Informatics (BMI), North-West University, Potchefstroom 2520, South Africa, page 127-160.

Warta Demografi. (2000). Perkawinan dalam Masyarakat yang sedang Berubah. LD-FEUI, Jakarta.
48

Lampiran 1 : Data SUPAS 2005 Kabupaten Sukabumi (n=967)

. . . . . . . . . . . . . . . . . . . . .
49

Lampiran 2 : Data SUPAS 2005 Provinsi Jawa Barat (n=21.772)

. . . . . . . . . . . . . . . . . . . . . . . .
50

Berikut ini adalah langkah-langkah pengolahan metode DOUW dengan

menggunakan Software SAS 9.2:

1. Simpan data SUPAS 2005 yang akan diolah pada suatu folder dalam format

Excel (.xls) atau SPSS (.sav).

2. Buka program SAS 9.2, lalu pada layar Editor masukkan syntax yang sudah

dibuat.

3. Kemudian, baca dengan PROC IMPORT OUT=WORK.(nama file baru).

Misalkan dalam penelitian ini adalah:

PROC IMPORT OUT=WORK.sukabumi DATA FILE="D:\KULIAH S-2\THESIS UJEL 2009-2010\UJEL BAHAN THESIS\RAW DATA SUPAS 2005\SUPAS UNTUK TESIS SUKABUMI SIAP OLAH.sav". DBMS=SAV REPLACE; RUN;

Struktur data pada SUPAS 2005 terdiri dari: JENIS_PERNIKAHAN untuk

variabel Y, X0 untuk mendapatkan nilai , AGAMA,

STATUS_TPTINGGAL, STATUS_BEKERJA, STATUS_MIGRAN, dan

LAMA_SEKOLAH untuk variabel X1 sampai dengan X5.

4. Pada syntax yang ada melalui PROC IML, masukkan nilai pilihan konstanta

epsilon () dan level cut off (c) yang dipilih. Misalnya: proc iml; eps=0.10; cut_off=0.10;

Lampiran 3 : Langkah-langkah Pengolahan Metode DOUW
51

Gunakan perintah USE WORK.(nama file baru) untuk membaca nama file

baru yang sudah dirubah dalam bentuk SAS, kemudian definisikan struktur

variabel yang ada pada data SUPAS 2005 untuk variabel Y dan X. Hal ini

dimaksudkan agar program dapat memisahkan variabel Y dan X pada file

baru. Misalnya:

use WORK.sukabumi; read all var {JENIS_PERNIKAHAN} into y; read all var {X0 AGAMA STATUS_TPTINGGAL STATUS_BEKERJA STATUS_MIGRAN LAMA_SEKOLAH} into X;

5. Klik RUN

6. Syntax dinyatakan sudah benar, jika pada layar Log tidak ada pesan error yang

berwarna merah.

7. Hasil outputnya bisa dilihat pada layar Output.

Selanjutnya, hasil output pada langkah-langkah pengolahan metode DOUW di

atas akan dibandingkan dengan metode konvensional (metode analisis devians

residual).

Lanjutan Lampiran 3
52

Berikut adalah langkah-langkah untuk mendapatkan nilai devians residual

pada seluruh pengamatan, Pengolahan bisa menggunakan Software SPSS,

Minitab, atau software statistik lainnya yang sudah umum.

1. Buka file data SUPAS 2005 yang sudah disimpan. Pada menu utama pilih

Open, klik Data, kemudian cari file yang akan diolah.

2. Pada menu utama pilih Analyze, klik Regression, klik Binary Logistic.

3. Masukkan variabel Dependent (Y) dan variabel Covariates (X), klik sub

menu Categorical, kemudian masukkan variabel X yang bersifat kategori, kill

Reference Category, pilih kategori mana yang akan dijadikan sebagai

reference category (klik Last jika nilai yang besar yang akan jadi reference

category, klik First jika nilai yang kecil yang jadi reference variabel, untuk

masing-masing variabel), klik Continue, klik sub menu Save, pada sub menu

Residual berikan ceklist Deviance, klik Continue, klik OK.

Lampiran 4 : Langkah-langkah Pengolahan Metode Analisis Deviance Residual
53

/****************************************************************/ /* SYNTAX UNTUK DETEKSI OUTLIER */ /* */ /* */ /****************************************************************/ options ls=80 nostimer nodate ps=60; PROC IMPORT OUT= WORK.sukabumi DATAFILE= "D:\KULIAH S-2\THESIS UJEL 2009-2010\UJEL BAHAN TH ESIS\RAW DATA SUPAS 2005\SUPAS UNTUK TESIS SUKABUMI SIAP OLAH.sav" DBMS=SAV REPLACE; RUN; proc iml; eps=0.9; /*ini nilai epsilon*/ cut_off=0.05; /* ini nilai cut off */ /* * Module to calculate Gradient;*/ start gradG (betaG) global (X,y,p_G,w_G); nr=nrow(X) ; nc=ncol(X) ; gG=j(1,nc,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaG[k]*X[n,k] ; end ; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])); ;end ; do k=1 to nc; do n=1 to nr; gG[k]=gG[k]+(y[n]-p_G[n])*w_G[n]*X[n,k]; end; end; return (gG); finish gradG; start hessG (betaG) global(X,p_G,w_G); nr=nrow(X) ; nc=ncol(X) ; hG=j(nc,nc,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaG[k]*X[n,k] ; end ; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc ; do l=1 to nc ; do n=1 to nr; hG[k,l]=hG[k,l]-p_G[n]*(1-p_G[n])*x[n,k]*x[n,l]*w_G[n] ; end ; end ; end ; return (hG); finish hessG; start f_TLR_G (betaG) global(X,y,LL_opt,w_G,D_G,nr,nc,p_G); * initializing; sum_LLG=0; D_G = J(nr,1,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; * Maximum likelihood;

Lampiran 5 : Syntax Metode DOUW
54

do n=1 to nr; do k=1 to nc; logit[n]=

logit[n]+betaG[k]*X[n,k]; end; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])); end; do n= 1 to nr; D_G [n] = (y[n]*log(max(1.0E-10,p_G[n]))+(1-y[n])*log(max(1.0E-10,1-p_G[n]))); sum_LLG = sum_LLG + w_G[n]*D_G[n]; end; LL_opt=sum_LLG; return (sum_LLG); finish f_TLR_G; use WORK.sukabumi; read all var {JENIS_PERNIKAHAN} into y; read all var {AGAMA STATUS_TPTINGGAL STATUS_BEKERJA STATUS_MIGRAN LAMA_SEKOLAH} into X; nr=nrow(X); nc=ncol(X); *calculate intitial values; y_initial = J(nr,1,0); beta_initial = J(nc,1,1); do i= 1 to nr; if y[i] < 0.5 then do; y_initial[i] = -1; end; else do; y_initial[i] = 1; end; end; rankx =round(trace(ginv(X)*X)); if rankx < nc then do; beta_initial = J(nc,1,0); end; else do; beta_initial = ginv(X`*X)*X`*y_initial; end; ns=50; best=5; count = j(ns,1,0); G_optimal_b =j(best,nc,0); G_optimal_W = j(nr,best,0); G_optimal_expD = j(nr,best,0); G_optimal_ll = j(best,1,-1.0E10);

Lanjutan Lampiran 5
55

/* Repeat Step 1 and Step 2 500(ns) times */ do s = 1 to ns; * ns - number of new beginnings; * Step 1 : construct an initial g-subset using method (b) i.e. starting from a random nc-subset; * Step 1a: starting with a nc-subset (method(B)); count_loop1=0; reason="false"; rc=0; g_constant=Round((nr+nc+1)/2);*tambahan; a=nc+count_loop1; do while (reason="false" & (a
56

expDG=exp(D_G); D_ordered = j(nr,1,0); rnk=rank(expDG); D_ordered[rnk]=expDG[]; w=j(nr,1,1); do i =1 to nr;if rnk[i] = min_LL then do; G_optimal_ll[min_index] = LL_opt; G_optimal_b[min_index,] = bopt_G; G_optimal_W[,min_index]=W_g[]; do kkk=1 to nr; G_optimal_expD[kkk,min_index]=exp(D_G[kkk]); end; end; *Step 3: for the 10 best results - carry out C-steps until convergence - keep the BEST solution!!!; BestG_optimal_b =j(nc,1,0); bestG_optimal_W = j(nr,1,0); bestG_optimal_expD = j(nr,1,0); bestG_optimal_ll = -1.0E10; do kkk = 1 to best; stop = "no"; count_loop3 = 0; * Do until the W converge; do while(stop="no" & count_loop3 < 100); count_loop3 = count_loop3+1; opt=J(1,11,.) ; opt[1]=1; *max; opt[2] = 4; w_G=G_optimal_W[,kkk]; call nlpnra( rc, bopt_G, "f_TLR_G", beta_initial,opt,,,,, "gradG", "hessG") ; beta_initial = bopt_G; W_old = W; D_ordered = j(nr,1,0); rnk=rank(D_G); D_ordered[rnk]=D_G[]; w=j(nr,1,1); do i =1 to nr;if rnk[i] = bestG_optimal_ll then do; bestG_optimal_ll = LL_opt; bestG_optimal_b = bopt_G; bestG_optimal_W=W_g; bestG_optimal_expD=exp(D_G); end; * end if sum_log_likelihood>ll; end; * end do list kkk=1 to best; end;

Lanjutan Lampiran 5
57

*Our own final step; *after the loop where the best beta has been obtained for the g; start gradF (betaF) global (X,y,p_F,w_F); nr=nrow(X) ; nc=ncol(X) ; gF=j(1,nc,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaF[k]*X[n,k] ; end ; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc; do n=1 to nr; gF[k]=gF[k]+(y[n]-p_F[n])*w_F[n]*X[n,k]; end; end; return (gF); finish gradF; start hessF (betaF) global(X,p_F,w_F,hF); nr=nrow(X) ; nc=ncol(X) ; hF=j(nc,nc,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaF[k]*X[n,k] ; end ; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc ; do l=1 to nc ; do n=1 to nr; hF[k,l]=hF[k,l]-p_F[n]*(1-p_F[n])*x[n,k]*x[n,l]*w_F[n] ; end ; end ; end ; return (hF); finish hessF; start f_TLR_F (betaF) global(X,y,LL_optF,w_F,D_F,nr,nc); * initializing; sum_log_likelihood=0; D_F = J(nr,1,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; * Maximum likelihood; do n=1 to nr; do k=1 to nc; logit[n]= logit[n]+betaF[k]*X[n,k]; end; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])); end; do i= 1 to nr; D_F [i] = (y[i]*log(max(1.0E-10,p_F[i]))+(1-y[i])*log(max(1.0E-10,1-p_F[i]))); sum_log_likelihood = sum_log_likelihood + w_F[i]*D_F[i]; end; LL_optF=sum_log_likelihood; return (sum_log_likelihood); finish f_TLR_F; w_now=bestG_optimal_W; count_loop5=0; expD = bestG_optimal_expD; stop = "no"; w_F=j(nr,1,1); logit_g=j(nr,1,0); p_g=j(nr,1,0); do ss=1 to nr;

Lanjutan Lampiran 5
58

do kkkk=1 to nc; logit_g[ss]= logit_g[ss]+bestG_optimal_b[kkkk]*X[ss,kkkk]; end; if -logit_g[ss] > 700 then p_g[ss]=0; else p_g[ss]=1/(1+exp(-logit_g[ss])); end; mat_outlier=J(nr,2,0); do obs=1 to nr; mat_outlier[obs,1]=obs; mat_outlier[obs,2]=p_g[obs,1]; end; print mat_outlier; count_out = 0; do i=1 to nr; if y[i]>0.5 & p_g[i] < cut_off then do ;w_F[i]=eps; count_out = count_out+1;end; if y[i] (1-cut_off) then do ;w_F[i]=eps; count_out = count_out+1;end; end; beta_initial_F =bestG_optimal_b; original=j(nr,1,1); original=w_f; count_loop5 = count_loop5+1; beta_initial_F =bestG_optimal_b; opt=J(1,11,.) ; opt[1]=1; *max; opt[2]=4 ; *detail output; call nlpnra( rc, bopt_F, "f_TLR_F", beta_initial_F,opt,,,,, "gradF", "hessF") ; w_old = w_F; expD=exp(D_F); w_F=j(nr,1,1); logit_f=j(nr,1,0); p_f=j(nr,1,0); do ss=1 to nr; do kkkk=1 to nc; logit_f[ss]= logit_f[ss]+bopt_F[kkkk]*X[ss,kkkk]; end; if -logit_f[ss] > 700 then p_f[ss]=0; else p_f[ss]=1/(1+exp(-logit_f[ss])); end; count_out = 0; do i=1 to nr; if y[i]>0.5 & p_f[i] < cut_off then do ; w_F[i]=eps; count_out = count_out+1; print i; end; if y[i] (1-cut_off) then do ;w_F[i]=eps; count_out = count_out+1; print i; end; end; print count_out;

Lanjutan Lampiran 5
59

F_optimal_b =j(nc,1,0); F_optimal_W_expD = j(nr,2,0); F_optimal_ll = -1.0E10; F_optimal_b = bopt_F; F_optimal_W_expD[,1] = w_F; do kkk=1 to nr; F_optimal_W_expD[kkk,2]=exp(D_F[kkk]); end; F_optimal_ll= LL_optF; w_final=w_F;

Lanjutan Lampiran 5
60

Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk Kabupaten Sukabumi (n=967) =0.01, C=0.01

=0.01, C=0.05

=0.01, C=0.10

=0.05, C=0.01

=0.05, C=0.05

=0.05, C=0.10

=0.10, C=0.01

=0.10, C=0.05

=0.10, C=0.10

18 1 1

NIHIL

18 1

NIHIL

18 1 25 18 18 25 18 25 18 31 24 24 28 24 28 24 75 25 25 31 25 31 25184 28 28 56 28 56 28213 31 31 75 31 75 31 275 56 56 77 56 77 56 374 75 75 132 75 132

Top Related

Laporan Unit LOGISTIK

Analisis Regresi Logistik Dengan Minitab

STK511 Analisis Statistika - stat.ipb.ac.id · Regresi Logistik ... 400 600 800 1,000 1,200 0 2,000 4,000 6,000 8,000 10,000 J ML N A S A B A H S A L D O 10. Analisis Korelasi & Regresi

SIMULASI PENDETEKSIAN GARIS LURUS PADA CITRA DIGITAL MENGGUNAKAN MATLAB 7.1

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR …digilib.its.ac.id/public/ITS-NonDegree-23456-Presentation-1469931.pdf · analisis regresi logistik . ordinal pada . faktor-faktor

PENERAPAN METODE REGRESI LOGISTIK PADA APLIKASI …... · An organization is a place where students learn leadership, teamwork, public speaking, discussion, and writing. Problems

perbandingan regresi komponen utama dengan regresi ridge pada

Diploma Pengurusan Logistik