pendeteksian outlier dalam regresi logistik binerdengan metode detects outliers using weights douw

Upload: lia-agustina

Post on 02-Mar-2016

106 views

Category:

Documents


4 download

TRANSCRIPT

  • PENDETEKSIAN OUTLIER DALAM REGRESI LOGISTIK BINER

    DENGAN METODE DETECTS OUTLIERS USING WEIGHTS (DOUW)

    Oleh: UJANG JAELANI

    140720090025

    TESIS Untuk memenuhi salah satu syarat ujian

    guna memperoleh gelar Magister Statistika Terapan. Program Studi Magister Statistika Terapan

    Bidang Kajian Utama Statistika Sosial

    PROGRAM PASCASARJANA UNIVERSITAS PADJADJARAN

    BANDUNG 2010

  • PENDETEKSIAN OUTLIER DALAM REGRESI LOGISTIK BINER

    DENGAN METODE DETECTS OUTLIERS USING WEIGHTS (DOUW)

    Oleh:

    UJANG JAELANI

    140720090025

    Untuk memenuhi salah satu syarat ujian

    guna memperoleh gelar Magister Statistika Terapan.

    Program Studi Magister Statistika Terapan

    Telah disetujui oleh Tim Pembimbing pada tanggal

    seperti tertera di bawah ini,

    Bandung, Agustus 2010

    Dr. Suwanda, M.S. Ketua Tim Pembimbing

    Dra. Hj. Anna Chadidjah, MT. Anggota Tim Pembimbing

  • iii

    PERNYATAAN

    Dengan ini saya menyatakan bahwa:

    1. Tesis ini, adalah asli dan belum pernah diajukan untuk mendapatkan gelar

    akademik (sarjana, magister, dan / atau doktor), baik di Universitas Padjadjaran

    maupun di perguruan tinggi lain.

    2. Tesis ini adalah murni gagasan, rumusan, dan penelitian saya sendiri, tanpa

    bantuan pihak lain, kecuali arahan Tim Pembimbing.

    3. Dalam Tesis ini tidak terdapat karya atau pendapat yang telah tertulis atau

    dipublikasikan orang lain, kecuali secara tertulis dengan jelas dicantumkan

    sebagai acuan dalam naskah dengan disebutkan nama pengarang dan

    dicantumkan dalam daftar pustaka.

    4. Pernyataan ini saya buat dengan sesungguhnya dan apabila di kemudian hari

    terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, saya bersedia

    menerima sanksi akademis berupa pencabutan gelar yang telah diperoleh karena

    karya ini, serta sanksi lainnya sesuai dengan norma yang berlaku di perguruan

    tinggi ini.

    Bandung, Agustus 2010

    Yang membuat pernyataan,

    Ujang Jaelani NPM. 140720090025

  • iv

    ABSTRACT

    Thesis Title : Outlier Detection in Binary Logistic Regression with the Detects Outliers Using Weights (DOUW) Method.

    Abstract

    DOUW method is an outlier detection procedure which also can produce robust parameter estimation in Binary Logistic Regression. In DOUW method, there are four things that must be completed, namely: determination of optimal g1, the number of iterations, the choice of (weight), and the choice of c (level of cut-off). Source data used is the result of Inter-Census Population Survey (SUPAS) in 2005 in Sukabumi Regency and West Java Province. Variables used are as follows: Response Variable (Y) is a type of Marriage and Regressor Variables(Xi) are Religion (X1), Residence Status (X2), Working Status (X3), Migrant Status (X4), and the Old School (X5). From the results of outlier detection, choice of mate value of and c can be concluded that for certain value and the value of c is getting closer to one the number of observations that are detected as outliers more and more. While for certain c value and the value of getting closer to 0 then the number of observations that are detected as outliers less.

    Whereas, if viewed from the estimated parameters produced, it can be concluded that changes in the value of the estimated parameters in the regressor variables, from the initial iteration to iteration end, changing the very significance. From these results demonstrate that the presence of outliers greatly affect the estimated parameters are obtained, especially on binary logistic regression. Estimated parameters produced by DOUW method, for the pair and c value whatever, basically get the value that is not too much different, although the number of outliers that are detected are not the same.

    Keywords : Binary Logistic Regression, Downweighting, Level of Cut Off, Outlier, Robust Parameter Estimation.

  • v

    ABSTRAK

    Judul Tesis : Pendeteksian Outlier dalam Regresi Logistik Biner dengan Metode Detects Outliers Using Weights (DOUW).

    Abstrak Metode DOUW merupakan suatu prosedur pendeteksian Outlier yang sekaligus dapat menghasilkan estimasi parameter robust pada Regresi Logistik Biner. Dalam metode DOUW, ada empat hal yang harus dilengkapi yaitu: penentuan g1 yang optimal, jumlah iterasi, pilihan (weight), dan pilihan level cut off (c). Sumber data yang digunakan adalah data hasil Survei Penduduk Antar Sensus (SUPAS) Tahun 2005 di Kabupaten Sukabumi dan Provinsi Jawa Barat. Variabel yang digunakan terdiri dari: Variabel Respon (Y) adalah Jenis Pernikahan dan Variabel Regressor (Xi) adalah Agama (X1), Status Tempat Tinggal (X2), Status Bekerja (X3), Status Migran (X4), dan Lama Sekolah (X5). Dari hasil pendeteksian outlier, pemilihan pasangan nilai dan c dapat disimpulkan, bahwa untuk nilai tertentu dan nilai c yang semakin mendekati 1, maka banyaknya pengamatan yang terdeteksi sebagai outlier semakin banyak. Sedangkan untuk nilai c tertentu dan nilai yang semakin mendekati 0, maka banyaknya pengamatan yang terdeteksi sebagai outlier semakin sedikit.

    Sedangkan jika dilihat dari estimasi parameter yang dihasilkan dapat disimpulkan, bahwa perubahan nilai estimasi parameter pada variabel regressor dari iterasi awal ke iterasi akhir mengalami perubahan yang sangat signifikans. Dari hasil ini memperlihatkan bahwa keberadaan outlier sangat mempengaruhi estimasi parameter yang diperoleh, khususnya pada regresi logistik biner. Estimasi parameter yang dihasilkan metode DOUW, untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan nilai yang tidak terlalu jauh berbeda, walaupun banyaknya outlier yang terdeteksi tidak sama. Kata Kunci : Regresi Logistik Biner, Downweighting, Level Cut Off,

    Outlier, Estimasi Parameter Robust.

  • vi

    KATA PENGANTAR

    Segala puji dan syukur diucapkan kehadirat Allah SWT atas segala

    rahmat, hidayah, dan karunia yang diberikan-Nya, sehingga penulis dapat

    menyelesaikan Tesis yang berjudul Pendeteksian Outlier dalam Regresi

    Logistik Biner dengan Metode Detects Outliers Using Weights (DOUW)

    dengan baik.

    Dengan terselesaikannya Tesis ini, penulis mengucapkan terima kasih

    yang sebesar-besarnya kepada :

    1. Orang tua dan Mertua tercinta yang telah memberikan doa dan dorongan.

    2. Istriku tercinta Saidah,S.Pd.I dan ketiga anakku tersayang Razan Muhammad

    Ihsan, si kembar yang lucu Rifqi Muhammad Habiburrahman dan Rizqi

    Muhammad Habiburrahim yang telah rela dan sabar memberikan dukungan

    kepada abinya untuk menyelesaikan studi ini.

    3. Bapak Dr. Suwanda, M.S. dan Ibu Dra. Hj. Anna Chadidjah, MT, selaku

    dosen pembimbing yang telah banyak meluangkan waktu, tenaga dan pikiran

    untuk membimbing, memberikan masukan, arahan dan koreksi serta diskusi

    yang berkualitas kepada penulis dalam proses pengerjaan Tesis ini.

    4. Bapak Dr. Choiril Maksum dan Ibu Dra. Hj. Enny Supartini, MS selaku

    dosen penguji yang telah meluangkan waktu dan tenaga untuk masukan dan

    saran dalam proses pengerjaan tesis ini.

    5. Seluruh dosen Pascasarjana Jurusan Statistika Terapan Universitas

    Padjadjaran, seluruh jajaran akademik, asisten laboratorium yang telah

    banyak membantu dalam masa perkuliahan.

  • vii

    6. Seluruh jajaran pimpinan Badan Pusat Statistik (BPS) di Pusat yang telah

    memberikan kesempatan kepada penulis untuk melanjutkan Program Studi

    Magister Statistika Terapan F-MIPA Universitas Padjadjaran Bandung.

    7. Kepala BPS Provinsi Jawa Barat Drs. H. Lukman Ismail, MA dan jajarannya

    yang telah merekomendasikan penulis untuk mengikuti Program Studi

    Magister Statistika Terapan F-MIPA di Universitas Padjadjaran Bandung.

    8. Seluruh teman-teman Pascasarjana Jurusan Statistika Terapan Universitas

    Padjadjaran Bandung, khususnya angkatan pertama program S2 kerjasama

    Badan Pusat Statistik dan Unpad untuk kebersamaannya selama ini.

    9. Pak Nurseto Wisnumurti (Pa Ocen) untuk diskusi, sharing, belajar bareng,

    dan transfer ilmunya khususnya kepada penulis, umumnya kepada penghuni

    kontrakan ST13

    10. Seluruh teman-teman kontrakan ST13: Pa Ocen, Mas Dede, Sami, Yanis,

    Eko, Ipung, Rio, Yudi, Kharis, Heru, Ucup, dan Budi, juga Ilham atas

    kebersamaan dan kekompakannya dalam menempuh studi ini, termasuk

    dalam bermain Futsal.

    11. Nasrul Wajdi untuk konsultasi program SAS dan semua pihak yang telah

    membantu penyelesaian tesis ini, yang tidak dapat disebutkan satu per satu.

    Penulis menyadari bahwa terdapat kekurangan dalam penulisan laporan

    ini, oleh karena itu kritik dan saran yang membangun sangat diharapkan. Akhir

    kata penulis berharap semoga apa yang telah ditulis ini dapat bermanfaat dan

    berguna bagi semua pihak.

    Bandung, Agustus 2010

    Penulis

  • viii

    DAFTAR ISI

    Halaman

    PENGESAHAN . ii

    PERNYATAAN . iii

    ABSTRACT ... iv

    ABSTRAK ..... v

    KATA PENGANTAR vi

    DAFTAR ISI .. viii

    DAFTAR TABEL .. x

    DAFTAR GAMBAR . xi

    DAFTAR LAMPIRAN .. xii

    BAB I PENDAHULUAN .. 1

    1.1. Latar Belakang . 1

    1.2. Identifikasi Masalah . 3

    1.3. Tujuan Penelitian . 3

    1.4. Manfaat Penelitian ... 4

    1.5.Sistematika Penulisan ... 4

    BAB II TINJAUAN PUSTAKA . 5

    2.1. Regresi Logistik Biner .. 5

    2.2. Beberapa Metode Penaksir Robust dalam Regresi Logistik

    Biner ..

    6

    2.2.1. Metode Trimming . 6

    2.2.2. Metode Maximum Estimated Likelihood (MEL)... 7

    2.2.3. Metode Weight Maximum Estimated Likelihood

    (WEMEL)

    8

    2.3 Deteksi Outlier dengan Metode Analisis Deviance Residual . 9

  • ix

    Halaman

    BAB III REGRESI LOGISTIK BINER ROBUST MELALUI METODE

    DOUW ..

    11

    3.1. Metode Detects Outliers Using Weights (DOUW) ... 11

    3.2. Algoritma ... 14

    3.3. Sumber Data .. 16

    3.4. Wanita Menikah Muda dan Faktor-faktor Penyebabnya ........... 16

    3.5. Variabel-variabel yang Digunakan .... 18

    BAB IV HASIL DAN PEMBAHASAN ........ 20

    4.1. Pendahuluan ... 20

    4.2. Deskripsi Data Hasil SUPAS 2005 . 21

    4.3. Pendeteksian Outlier untuk Data SUPAS 2005 Kabupaten

    Sukabumi ..

    31

    4.4. Pendeteksian Outlier untuk Data SUPAS 2005 Provinsi Jawa

    Barat ..

    39

    BAB V KESIMPULAN DAN SARAN ........ 44

    5.1. Kesimpulan 44

    5.2. Saran .. 45

    DAFTAR PUSTAKA 46

    LAMPIRAN ... 48

  • x

    DAFTAR TABEL

    Halaman

    Tabel 4.1. Persentase Wanita Menikah menurut Jenis Pernikahan dan Provinsi di Indonesia Tahun 2005 .....

    22

    Tabel 4.2 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Kabupaten/Kota di Provinsi Jawa Barat Tahun 2005 ...

    23

    Tabel 4.3 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Agama yang Dianut di Provinsi Jawa Barat Tahun 2005 .

    25 Tabel 4.4 Persentase Wanita menurut Menikah Jenis Pernikahan dan

    Status Tempat Tinggal di Provinsi Jawa Barat Tahun 2005 .

    27 Tabel 4.5 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Status Bekerja di Provinsi Jawa Barat Tahun 2005

    28 Tabel 4.6 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Status Migran di Provinsi Jawa Barat Tahun 2005 ....

    29 Tabel 4.7 Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama

    Sekolah di Provinsi Jawa Barat Tahun 2005

    30 Tabel 4.8 Banyaknya Pengamatan yang Terdeteksi sebagai Outlier dengan

    Metode DOUW dan Deviance Residual ........

    32 Tabel 4.9 Taksiran Parameter untuk masing-masing Nilai dan c

    (Untuk n=967 dan K=5) ..

    35 Tabel 4.10 Taksiran Parameter () untuk masing-masing Nilai dan c,

    serta Banyaknya Outlier yang Terdeteksi dengan Metode DOUW (Untuk n=967 dan K=5) dan Deviance Residual .

    37 Tabel 4.11 Taksiran Parameter dan Banyaknya Outlier yang Terdeteksi

    dengan Metode DOUW (n=21.772, K=5, =0.05, dan C=0.05) dan Deviance Residual, serta Nilai Odds Ratio

    40

  • xi

    DAFTAR GAMBAR

    Halaman

    Gambar 2.1 X dan Y Outlier .. 8 Gambar 3.1 Flow Chart Metode DOUW 15 Gambar 4.1 Persentase Wanita Menikah menurut Kabupaten/Kota di

    Provinsi Jawa Barat ...

    24 Gambar 4.2 Persentase Wanita Menikah Muda dan Dewasa di Provinsi Jawa

    Barat ...

    25 Gambar 4.3 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Agama di Provinsi Jawa Barat ...

    26 Gambar 4.4 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Status Tempat Tinggal di Provinsi Jawa Barat .................

    27 Gambar 4.5 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Status Bekerja Tinggal di Provinsi Jawa Barat ...

    28 Gambar 4.6 Persentase Wanita Menikah menurut Jenis Pernikahan dan

    Status Migran di Provinsi Jawa Barat .

    29 Gambar 4.7 Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama

    Sekolah di Provinsi Jawa Barat ..

    31 Gambar 4.8 Scatter Plot antara Observasi dengan Probabilita (G) Pada Data

    SUPAS 2005 Kabupaten Sukabumi (untuk n=967, K=5, =0.01, C=0.01) ..

    34

  • xii

    DAFTAR LAMPIRAN

    Halaman Lampiran 1 Data Supas 2005 Kabupaten Sukabumi (n=967) ..... 48 Lampiran 2 Data Supas 2005 Provinsi Jawa Barat (n=21.772) .. 49 Lampiran 3 Langkah-langkah Pengolahan Metode DOUW ... 50 Lampiran 4 Langkah-langkah Pengolahan Metode Analisis Deviance

    Residual ...

    52 Lampiran 5 Syntax Metode DOUW .. 53 Lampiran 6 Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk

    Kabupaten Sukabumi (n=967) .....

    60 Lampiran 7 Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk

    Provinsi Jawa Barat (n=21.772, =0.05 dan c=0.05) ..

    63 Lampiran 8 Output Syntax Metode DOUW untuk =0.01 dan c=0.01 65

  • 1

    BAB I

    PENDAHULUAN

    1.1.Latar Belakang

    Dalam proses pemilihan model persamaan Regresi Logistik Biner yang

    terbaik, terdapat suatu tahapan yang sangat penting dan cukup menentukan,

    yaitu tahapan diagnostik model. Dalam tahapan ini salah satu yang dilakukan

    adalah pendeteksian terhadap keberadaan satu atau sekelompok pengamatan yang

    tidak mengikuti pola pada umumnya, yang dikenal sebagai Outlier. Ferguson dan

    Barnet (dalam Soemartini, 2007) mendefinisikan outlier sebagai berikut:

    Ferguson, outlier adalah suatu data yang menyimpang dari sekumpulan data yang

    lain. Barnett, outlier adalah merupakan pengamatan yang tidak mengikuti

    sebagian besar pola dan terletak jauh dari pusat data, dan Sembiring (2003)

    berpendapat bahwa outlier adalah pengamatan yang jauh dari pusat data yang

    mungkin berpengaruh besar terhadap koefisien regresi.

    Keberadaan outlier dapat mempengaruhi kesimpulan akhir dari model

    persamaan Regresi Logistik Biner. Oleh karena begitu seriusnya permasalahan

    keberadaan dan efek yang ditimbulkan oleh outlier, maka pendeteksian outlier

    menjadi sangat penting. Dalam Regresi Logistik Biner, pengamatan dengan

    respon sukses tetapi probabilitasnya ditaksir rendah dan pengamatan dengan

    respon gagal tetapi probabilitasnya ditaksir tinggi, diklasifikasikan sebagai

    outlier (Venter & Rey, 2007). Dalam penelitian ini yang menjadi respon sukses

    adalah wanita menikah muda dan respon gagal adalah wanita menikah dewasa.

  • 2

    Pengamatan dikategorikan sebagai outlier, jika untuk wanita menikah muda

    probabilitasnya rendah, sedangkan untuk wanita menikah dewasa probabilitasnya

    tinggi.

    Apabila terdapat outlier, maka untuk medapatkan model regresi

    logistiknya digunakan model regresi logistik yang robust. Metode pertama untuk

    mendapatkan model regresi logistik biner robust adalah trimming yang

    diperkenalkan oleh Tukey (1960). Secara ringkas, trimming membagi

    pengamatan-pengamatan ke dalam beberapa sub set setelah pengamatannya

    diurutkan, yakni sub set pertama 5 persen pengamatan terendah, sub set kedua 5

    persen pengamatan tertinggi dan sisanya merupakan sub set pengamatan yang

    berada di tengah. Untuk sub set pengamatan 5 persen bawah dan 5 persen atas

    diberi bobot mendekati nol, sehingga sub set pengamatan tengah merupakan sub

    set yang bebas dari outlier. Selanjutnya, untuk menaksir parameter regresi pada

    sub set pada pengamatan yang berada di tengah digunakan Maximum Likelihood

    Estimator (MLE). Sedangkan untuk sub set pengamatan terendah dan tertinggi

    dihilangkan.

    Penggunaan trimming dalam regresi logistik biner umumnya dilakukan

    pada ruang regressor untuk menghilangkan overlap data, sehingga apabila tidak

    terjadi overlap, MLE tidak dijamin eksistensinya (Rousseeuw and Christmann,

    2001). Untuk mengatasi masalah eksistensi penaksir, diajukan Maximum

    Estimated Likelihood (MEL). Pada perkembangan selanjutnya, diajukan prosedur

    penaksir robust lainnya yang tidak melalui trimmed data yang disebut metode

    Weight Maximum Estimated Likelihood (WEMEL). WEMEL juga dapat

  • 3

    mendeteksi outlier dalam ruang regressor yang dikenal sebagai leverage. Dengan

    demikian WEMEL bukanlah metode pendeteksi outlier (outlier arah Y), oleh

    karena itu diperlukan suatu metode pendeteksi outlier pada arah Y yang sekaligus

    mendapatkan taksiran parameternya dalam regresi logistik biner. Metode

    konvensional yang biasa digunakan untuk mendeteksi outlier adalah dengan

    menghitung nilai deviance residual-nya. Akan tetapi metode konvensional ini

    ditujukan hanya untuk mendeteksi outlier, tidak untuk menaksir parameter.

    1.2.Identifikasi Masalah

    Berdasarkan latar belakang di atas, maka masalah dalam penelitian ini

    adalah bagaimana prosedur pendeteksian outlier sekaligus mendapatkan taksiran

    parameter robust pada Regresi Logistik Biner dengan metode Detects Outliers

    Using Weights (DOUW). Dalam hal ini akan diterapkan pada data hasil Survei

    Penduduk Antar Sensus (SUPAS) 2005, dengan variabel respon adalah wanita

    menikah muda (respon sukses) dan wanita menikah dewasa (respon gagal).

    1.3.Tujuan Penelitian

    Tujuan dari penelitian ini adalah mendeteksi outlier sekaligus

    mendapatkan taksiran parameter robust dalam Regresi Logistik Biner dengan

    metode Detects Outliers Using Weights (DOUW) pada data hasil Survei

    Penduduk Antar Sensus (SUPAS) 2005, dengan variabel respon adalah wanita

    menikah muda (respon sukses) dan wanita menikah dewasa (respon gagal).

  • 4

    1.4.Manfaat Penelitian

    Adapun manfaat pada penelitian ini adalah sebagai berikut:

    a. Bagi BPS, penelitian ini diharapkan mampu memberikan sumbangan yang

    berharga, sebagai metode alternatif yang akurat dalam pendeteksian Outlier,

    sekaligus mendapatkan taksiran parameter robust pada Regresi Logistik Biner.

    b. Bagi Penulis, penelitian ini dapat dijadikan modal awal untuk pengembangan

    lebih jauh dalam hal Pendeteksian Outlier pada Regresi Logistik Biner.

    1.5. Sistematika Penulisan

    Tulisan ini terdiri dari lima bab. Bab satu mengenai pendahuluan yang

    terdiri dari latar belakang, identifikasi masalah, tujuan penelitian, manfaat

    penelitian dan sistematika penulisan. Bab dua mengenai tinjauan pustaka. Bab tiga

    mengenai metodologi penelitian. Bab empat hasil dan pembahasan. Bab lima

    kesimpulan dan saran.

  • 5

    BAB II

    TINJAUAN PUSTAKA

    2.1.Regresi Logistik Biner

    Dalam regresi logistik biner variabel responsnya bersifat dikotonomi yang

    mempunyai nilai 1 untuk katgori sukses atau 0 untuk kategori gagal, dan

    variabel regressor sebanyak K, yaitu: X1, X2Xk. Misalkan XT = (1, X1,

    X2Xk) dengan T melambangkan transpose. Model regresi logistik biner dapat

    dirumuskan sebagai berikut :

    (2.1)

    dimana T = (o, 1.k) adalah vektor koefisien regresi logistik (Hosmer & Lemeshow, 1989). Andaikan terdapat n pengamatan, dimana pengamatan ke-i

    adalah (yi, XTi), dengan yi adalah nilai pengamatan Y dan XTi = (1, Xn,1,Xn,k)

    adalah vektor nilai yang diamati dari regressor sebanyak K. Dalam model regresi

    logistik, biner, variabel respon diekspresikan sebagai:

    (2.2)

    Dimana mempunyai salah satu kemungkinan dari dua nilai, yaitu:

    1 , jika y=1 dengan peluang dan

    , jika y=0 dengan peluang 1 .

    Sehingga mempunyai rataan nol dan varians 1 .

    Dengan mengasumsikan independensi ke-n pengamatan, log likelihood

    dinyatakan dengan :

  • 6

    (2.3)

    dimana: 1 log 1 .

    Untuk mendapatkan taksiran parameter dapat digunakan MLE dengan memaksimumkan Persamaan (2.3). Sebagaimana telah disebutkan dalam bagian

    pendahuluan, outlier bisa memperburuk model (2.1). Hal ini mendorong perlunya

    prosedur-prosedur regresi logistik biner robust.

    2.2.Beberapa Metode Penaksir Robust dalam Regresi Logistik Biner

    2.2.1. Metode Trimming

    Prosedur pertama yang akan dijelaskan adalah trimming, yaitu suatu

    prosedur dengan memisahkan himpunan bagian data yang diduga sebagai outlier.

    Kemudian himpunan bagian data sisanya digunakan untuk menaksir parameter

    dengan menggunakan MLE. Metode trimming dapat mengakibatkan tidak adanya

    overlap data antara respons dengan kategori sukses dan respon dengan kategori

    gagal (yaitu, xi yang bersangkutan dengan yi = 0 dapat dipisahkan oleh

    hyperplane dari xi yang bersangkutan dengan yi = 1), akibatnya taksiran parameter

    dengan menggunakan MLE tidak dijamin keberadaannya (non-existence).

    Walaupun taksiran parameter yang dihasilkan melalui trimming

    merupakan taksiran parameter robust, akan tetapi metode trimming tidak dapat

    mendeteksi outlier, baik dalam ruang regressor maupun dalam arah Y. Jadi

    trimming hanya merupakan metode yang digunakan untuk mendapatkan taksiran

  • 7

    parameter pada himpunan bagian data yang sudah dipisahkan dari

    kemungkinan adanya outlier.

    2.2.2. Metode Maximum Estimated Likelihood (MEL)

    Rousseuw dan Christmann (2003) memperkenalkan estimator MEL untuk

    mengatasi masalah non-existence. Prosedur MEL dapat dijelaskan sebagai

    berikut:

    Misalkan =0,01,

    , =max(, min(1-, )), o=/(1+),

    1=(1+)/(1+), dan mentransformasi yi ke =(1yi) o+yi1. Kemudian MEL ditetapkan dengan memilih yang memaksimumkan log

    likelihood taksiran,

    (2.4)

    dimana: , 1 log 1 , .

    Berbeda dengan MLE klasik, estimator MEL selalu ada (exist).

    Sama halnya dengan trimming, taksiran parameter yang dihasilkan melalui

    MEL juga merupakan taksiran parameter robust, akan tetapi MEL tidak dapat

    mendeteksi outlier, melainkan ditujukan untuk mengatasi masalah eksistensi

    taksiran parameter yang tidak dijamin oleh MLE, karena hilangnya overlap data

    oleh trimming.

  • 8

    2.2.3. Metode Weight Maximum Estimated Likelihood (WEMEL)

    Prosedur penaksir robust lainnya adalah WEMEL yang didefenisikan

    sebagai penetapan yang memaksimumkan log likelihood terboboti sebagai berikut:

    (2.5)

    Dalam hal ini pembobotan ditentukan oleh bagian data dalam ruang X

    menurut wi = M/max {RD2 (x*i), M}, dimana X*i = (xi-1,..xi,K)T dan RD2 (x*i)

    adalah jarak robust (RD) dan M adalah persentil ke-75 dari semua RD2 (X*i), i =

    1, ..,n. Dengan cara seperti ini, WEMEL berfungsi sebagai metode untuk

    mendeteksi leverage, sehingga WEMEL bukan merupakan prosedur untuk

    mendeteksi outlier dalam arah Y. Outlier dapat terjadi dalam ruang X dan dalam

    arah Y. Sebagai ilustrasi tentang keberadaan outlier dalam ruang X dan arah Y,

    dapat dilihat pada Gambar 2.1 sebagai berikut:

    Gambar 2.1: X dan Y outlier

  • 9

    Area abu-abu yang melibatkan sebagian besar pasangan-pasangan (x1, x2)

    bisa dianggap sebagai x-inliers, sementara yang berada di luar area ini adalah x-

    outlier, misalnya A, B, D, G, dan H. Untuk keperluan ilustrasi, ditambahkan dua

    kontur p(x,)= d dan p(x,)=1d (dengan d kecil). Pengamatan di luar kontur-kontur ini dengan nilai y yang tidak layak, dianggap sebagai y-outlier, khususnya

    yang jauh dari kontur, misalnya A dan G. Copas (1988) melakukan pengamatan

    dengan y=1 dan p mendekati 0 disebut uplier (misalnya A) dan pengamatan

    dengan y=0 tapi p mendekati 1 disebut downlier (misalnya G dan E). Uplier dan

    downlier dianggap sebagai bad leverage, dengan pengertian bahwa kemungkinan

    akan mempengaruhi koefisien regressi taksiran dengan arah yang sangat berbeda

    dari pengamatan-pengamatan lain. Sebaliknya pengamatan-pengamatan seperti

    titik B dan H bisa dinamakan good leverage, dalam arti bahwa walaupun kedua

    titik ini adalah outlying dalam x-space, nilai y-nya bisa cocok dengan apa yang

    diharapkan dari x-region dimana titik tersebut berada.

    Mengingat prosedur MEL dan WEMEL merupakan prosedur robust untuk

    penanggulangan leverage yang tidak wajar (x-outlier), untuk itu diperlukan

    metode pendeteksi outlier dalam arah Y, yang akan dijelaskan pada Bab 3.

    2.3.Deteksi Outlier dengan Metode Analisis Deviance Residual

    Residual diartikan sebagai ukuran kesesuain antara suatu pengamatan pada

    variabel respon dan nilai dugaannya. Residual antara pengamatan ke-i dirumuskan

    dengan , dimana adalah nilai respon 0 atau 1 dan adalah nilai

  • 10

    dugaannya. Deviance Residual pengamatan ke-i dari vektor respon dapat

    dinyatakan sebagai berikut:

    2

    2

    /

    (2.6)

    dimana adalah suatu tanda yang menyatakan positif jika

    dan negatif jika .

    Secara konvensional, nilai deviance residual dapat digunakan untuk

    mendeteksi apakah suatu pengamatan termasuk outlier atau bukan. Metode

    konvensional ini disebut sebagai metode analisis deviance residual. Dalam

    Metode analisis deviance residual, suatu pengamatan dinyatakan sebagai outlier

    apabila nilai mutlak deviance residual-nya lebih besar 2 (Agresti, 1997).

  • 11

    BAB III

    REGRESI LOGISTIK BINER ROBUST MELALUI METODE DOUW

    3.1.Metode Detects Outliers Using Weights (DOUW)

    Metode DOUW memiliki beberapa kesamaan dengan metode least

    trimmed squares (LTS) dari Rousseeuw dan Van Driessen (1999a,b) dalam

    regresi biasa. LTS dimulai dengan batas bawah g1, atas beberapa pengamatan

    yang bukan outlier (inlier). Kemudian dicari himpunan-bagian G dari pengamatan

    dengan ukuran #(G)=g1, yang mempunyai jumlah residu kuadrat terkecil diantara

    semua himpunan-bagian ukuran g1. G1 optimal yang ditemukan dengan cara ini

    akan dianggap paling mungkin bisa bebas dari outlier dan selanjutnya akan

    menghasilkan taksiran koefisien regressi yang paling sedikit dipengaruhi oleh

    kemungkinan-kemungkinan outlier. Taksiran koefisien regresi yang didapat

    dengan cara ini adalah taksiran LTS berdasarkan pada pengamatan g1. Ada

    kemungkinan bahwa pilihan g1 adalah pilihan yang konservatif dalam arti bisa

    ada pengamatan di luar G1 yang juga bukan outlier.

    Taksiran LTS dapat digunakan untuk menghitung residu pengamatan di

    luar G1 dan menggunakan residu-residu ini untuk memutuskan pengamatan-

    pengamatan manakah yang akan ditambahkan ke dalam G1 untuk mendapatkan

    himpunan-bagian G2 yang lebih besar, yang memuat g2, dimana g2 g1. Pengamatan-pengamatan yang bukan outlier menjadi dasar untuk perkiraan

    regresi trimmed pada G2. Optimasi LTS secara komputasi sulit dan jika dikerjakan

    secara eksak, membutuhkan beberapa langkah yang kompleks dengan jumlah

  • 12

    pengamatan yang besar dan secara praktis tidak layak, khususnya dengan jumlah

    pengamatan besar. Rousseuw dan Van Drissen (1999a,b) melakukan perhitungan

    dengan terlebih dahulu melakukan pemilihan awal G secara acak, dimana # (G) =

    g1, kemudian meningkatkan pilihan G secara iteratif sampai konvergen, dengan

    menggunakan prosedur yang disebut sebagai C-Steps. Prosedur ini diulang

    beberapa kali, solusi terbaik dipilih dan digunakan untuk mewakili G1 optimal

    yang dibutuhkan.

    Prosedur LTS cukup baik dalam regresi biasa, selanjutnya analogi untuk

    kasus Regresi Logistik Biner, dengan menggunakan trimmed likelihood sebagai

    pengganti trimmed least squares. Ini berarti bahwa harus dipilih himpunan bagian

    G yang memuat g1 pengamatan (bersama dengan ) yang memaksimumkan . Ini juga secara komputasi sulit tetapi sesuai dengan C-Steps yang

    sudah tersedia dari Neykoy & Muller (2002). Namun, ketika

    mengimplementasikan prosedur ini ditemukan bahwa G1 optimal cenderung

    terhenti diantara himpunan bagian-himpunan bagian tanpa adanya overlap,

    dimana melalui MLE yang overlap tidak muncul. Hal ini khususnya terjadi bila

    diawali dengan g1 konservatif yang jauh lebih kecil dari pada n. Penggantian MLE

    dengan MEL menghindari issu non-eksistensi tetapi tidak mengeliminir

    kemungkinan bahwa G1 optimal yang dipilih tidak layak. Untuk menghindari

    permasalahan ini digunakan pendekatan downweighting dari pendekatan

    trimming, dengan memisalkan 0 < < 1 dan untuk himpunan bagian tertentu G

    didapat log likelihood terboboti sebagai berikut :

    , (3.1)

  • 13

    Persamaan (3.1) adalah fungsi log likelihood tertimbang dengan wi = 1

    untuk i G dan wi = untuk i G. Pengamatan pada G diberi bobot sebesar 1 dan

    pengamatan di luar G dengan bobot sebesar Pengamatan yang bukan outlier

    harus berada dalam G dan pengamatan yang buruk dalam arti pembuatan

    kontribusi rendah harus berada di luar G agar nilai dari Persamaan (3.1) menjadi

    besar. Seperti dalam LTS untuk mengambil pengamatan yang baik dalam G,

    dicari himpunan bagian G dengan ukuran #(G) = g1 dan yang bersangkutan yang memaksimumkan l(,G) diantara semua himpunan-bagian yang berukuran g1 tertentu. Untuk setiap himpunan G, biasanya relatif mudah menghitung *(G) yang optimal dari l(,G) atas . Akan tetapi, optimasi l(, G) atas dan G secara komputasi sulit tetapi dapat dilaksanakan dengan bentuk prosedur yang lebih

    umum dari CSteps, sehingga diperoleh G1 optimal dengan estimator yang

    bersangkutan, *(G1). Selanjutnya menentukan kriteria yang dapat dipergunakan untuk

    mengidentifikasi outlier. Untuk ini, digunakan level cut-off c dengan 0 < c < 1,

    kemudian pengamatan ke-i dinyatakan sebagai outlier jika yi = 1 tetapi

    , atau jika yi = 0 tetapi , 1 . Alasannya di sini

    adalah jika yi = 1 dan , adalah kecil, ada kemungkinan bahwa

    pengamatan ke-i adalah uplier dan dengan demikian bobotnya harus diturunkan.

    Selanjutnya, jika yi = 0, dan , besar, ada kemungkinan bahwa

    pengamatan ke-i adalah downlier, maka bobotnya harus diturunkan. Setelah

    dilakukan penurunan bobot-bobot tersebut, maka diperoleh *(G2) yang memaksimumkan l(, G2).

  • 14

    3.2.Algoritma

    Ada beberapa hal yang harus dilengkapi dalam metode DOUW, yaitu:

    pilihan akhir g1, jumlah iterasi dalam C-Steps, pilihan dan pilihan cut-off c.

    Pilihan g1 dan jumlah iterasi dinyatakan dalam bentuk algoritma sebagai berikut:

    1. Pilih g1=max {[(n+K+1)/2], K+1} berupa bilangan bulat, dengan

    n=banyaknya pengamatan, K=banyaknya variabel regressor. Ini sesuai

    dengan saran Rousseuw & Van Driessen (1999a) untuk metoda FAST-LTS.

    2. Ulangi 50 kali untuk langkah-langkah berikut:

    2.1.Pilih himpunan-bagian awal H (1,.n) secara acak dengan #H = K+1.

    2.2.Hitung *(H), li(*(H)) dengan Persamaan (2.3) dan cari i sehingga l1(*(H)) ln(*(H)). Tetapkan G = (1,,g1).

    2.3. Lakukan langkah ke-2 dalam C-Steps, yang dimulai dengan G dan

    diakhiri dengan G.

    2.4. Simpan 5 hasil terbaik, dari segi nilai tertinggi (*(G), G). 2.5.Untuk setiap 5 hasil terbaik ini, ulangi iterasi C-Steps hingga konvergen

    (sampai 10-6).

    2.6. Simpan semua himpunan-bagian G1 yang terbaik, yaitu 5 himpunan

    bagian yang telah konvergen dari 50 kali proses iterasi tersebut.

    3. Tentukan G2={i:(yi=1 dan , ) atau (yi=0 dan

    , 1 )} dan kemudian hitung taksiran tertimbang terakhir

    *(G2) yang memaksimumkan li(*,G2). Outlier adalah pengamatan di luar G2.

    Selanjutnya, metode DOUW dalam bentuk flowchart sebagai berikut:

  • 15

    Gambar 3.1. Flowchart Metode DOUW

    Ya

    Tidak

    Untuk J = 1 sampai 50

    1. Pilih secara acak #H=K+1, dimana H (1,.n) 2. Hitung *(H), li(*(H) dan cari i sehingga l1(*(H)) ln(*(H)).

    Tetapkan G = (1,,g1). 3. Lakukan langkah ke-2 dalam C-Steps yang dimulai dengan G dan diakhiri

    dengan G 4. Simpan 5 hasil terbaik, dari nilai tertinggi *(G), G). 5. Untuk setiap 5 hasil terbaik ini, ulangi iterasi C-Steps hingga konvergen

    (sampai 10-6). 6. Simpan semua himpunan-bagian G1 yang terbaik, yaitu 5 himpunan bagian

    yang telah konvergen dari 50 kali proses iterasi tersebut.

    Mulai

    Tentukan g1: g1=max{[(N+K+1)/2], K+1}

    Berikutnya J

    G1 Konvergen

    {yi = 1 dan , } atau {yi = 0 dan

    , 1 }

    OUTLIER

    INLIER

    Selesai

    Hitung Taksiran Parameter

  • 16

    3.3.Sumber Data

    Sumber data yang digunakan dalam penelitian ini adalah data hasil Survei

    Penduduk Antar Sensus (SUPAS) Tahun 2005. SUPAS dilaksanakan diantara dua

    Sensus Penduduk (sensus yang dilakukan pada tahun yang berakhiran 0). Selama

    ini sudah dilaksanakan SUPAS tahun 1976, 1985, 1995, dan terakhir 2005.

    SUPAS Tahun 2005 dirancang khusus untuk mendapatkan data ststistik

    kependudukan yang dapat dibandingkan dengan hasil Sensus Penduduk 2000

    (SP2000). Data yang dikumpulkan meliputi: karakteristik demografi,

    ketenagakerjaan, dan sosial budaya. Karakteristik demografi yang dikumpulkan

    adalah mengenai fertilitas, mortalitas dan migrasi, serta riwayat kelahiran dan

    kematian anak dari wanita pernah kawin. Keterangan yang dihimpun dibidang

    ketenagakerjaan mencakup lapangan usaha, jenis pekerjaan, dan status pekerjaan.

    Data sosial budaya mencakup tingkat pendidikan, kondisi tempat tinggal, dan

    kegiatan penduduk lanjut usia (lansia). SUPAS 2005 juga mencakup pelaporan

    kejadian vital kelahiran, kematian, dan perpindahan.

    3.4.Wanita Menikah Muda dan Faktor-faktor Penyebabnya

    Pusat Studi Kependudukan UNPAD (dalam Warta Demografi, 2000)

    melakukan penelitian terhadap wanita usia 15-45 tahun di 12 desa pada 4

    kabupaten di Jawa Barat. Hasil penelitian tersebut menunjukkan bahwa rata-rata

    usia nikah pertama wanita adalah 16,5 tahun.

    Penentuan usia kawin muda dalam penelitian ini dibagi ke dalam dua

    kategori. Kategori pertama adalah wanita yang menikah pada usia 19 tahun ke

  • 17

    bawah, kategori kedua adalah wanita yang menikah pada usia di atas 19 tahun.

    Batasan usia nikah pertama untuk wanita didasarkan pada pendapat Bogue (1969)

    yang menyatakan bahwa jika pernikahan dilakukan pada usia 19 tahun disebut

    nikah muda, sedangkan jika pernikahan dilakukan pada usia 20 tahun disebut

    menikah dewasa.

    Dari temuan-temuan mengenai pernikahan pada usia muda di atas, faktor

    orang tua dalam kehidupan anak sangat berperan bahkan sangat menentukan

    kapan anaknya tersebut harus menikah (Siswono, 1990). Masih ada pandangan

    dalam masyarakat bahwa menstruasi pertama bagi seorang gadis merupakan tanda

    kedewasaan yang kemudian mendorong para orang tua untuk segera menikahkan

    anak gadisnya. Bahkan sering terjadi adanya pemalsuan usia bagi anak gadisnya,

    dengan tujuan agar anak gadisnya tersebut bisa segera dinikahkan (Hanum, 1997).

    Faktor-faktor lain selain faktor orang tua seperti disebutkan pada paragraf

    sebelumnya adalah: (1) rendahnya pendidikan, (2) kemiskinan, (3) isolasi daerah,

    (4) terbatasnya lapangan pekerjaan, dan (5) rendahnya mobilitas (Warta

    Demografi, 2000).

    Hasil penelitian Siswono (1999) menyatakan bahwa karakteristik individu

    yang berpengaruh pada wanita menikah muda terdiri dari: (1) tingkat pendidikan

    yang ditamatkan, (2) agama yang dianut, (3) status tempat tinggal, (4) status

    bekerja, dan (5) status migran. Faktor pendidikan berpengaruh terhadap usia

    pernikahan seseorang dan mampu meningkatkan usia pernikahan pertama bagi

    wanita. Sementara itu, wanita yang bekerja dan berstatus migran memiliki

  • 18

    kemungkinan menikah usia muda lebih kecil jika dibandingkan dengan yang tidak

    bekerja dan berstatus non migran.

    Kemungkinan-kemungkinan penyebab dari tingginya persentase wanita

    menikah muda di Provinsi Jawa Barat (71,37 persen) dapat ditampilkan dalam

    bentuk Model Regresi Logistik Biner. Analisis Regresi Logistik Biner digunakan

    karena merupakan sebuah metode yang optimal untuk analisis regresi dengan

    variabel respon biner. Dalam penelitian ini variabel respon yang dimaksud terdiri

    dari 2 (dua) kategori yaitu: wanita menikah muda (menikah usia 19 tahun ke

    bawah) dan wanita menikah dewasa (menikah usia di atas 19 tahun).

    3.5.Variabel-variabel yang Digunakan

    Dari gambaran data di atas, maka variabel-variabel yang digunakan dalam

    penelitian ini adalah :

    Variabel Respon (Y):

    Jenis Pernikahan, dikategorikan menjadi 2 kategori yaitu:

    1 : Menikah Muda (menikah umur 19 tahun)

    0 : Menikah Dewasa (menikah umur > 19 tahun)

    Variabel Regressor (X):

    X1 : Lama bersekolah (tahun)

    X2 : Agama yang dianut, dikategorikan menjadi 2 kategori yaitu:

    1 : Islam 0 : Non Islam

    X3 : Status Tempat Tinggal, dikategorikan menjadi 2 kategori yaitu:

    1 : Perdesaan 0 : Perkotaan

  • 19

    X4 : Status Bekerja, dikategorikan menjadi 2 kategori yaitu:

    1 : Bekerja 0 : Tidak Bekeja

    X5 : Status Migran, dikategorikan menjadi 2 kategori yaitu:

    1 : Migran 0 : Non Migran

  • 20

    BAB IV

    HASIL DAN PEMBAHASAN

    4.1.Pendahuluan

    Pada Bab ini akan ditampilkan deskripsi data hasil SUPAS 2005 yang

    ditampilkan dalam bentuk crosstabs antara jenis pernikahan (variabel respon)

    dengan variabel regressor yaitu: agama, status tempat tinggal, status bekerja,

    status migran dan lama sekolah. Selain itu juga, disajikan hasil pendeteksian

    outlier pada Regresi Logistik Biner dengan Metode DOUW untuk data SUPAS

    Tahun 2005 di Kabupaten Sukabumi dan Provinsi Jawa Barat, seperti tercantum

    dalam Lampiran 1 dan Lampiran 2. Pengolahan data dilakukan dengan

    menggunakan Program SAS 9.2, syntax dalam bahasa SAS dapat dilihat pada

    Lampiran 5).

    Pendeteksian outlier pada data Kabupaten Sukabumi ditampilkan dengan

    beberapa kemungkinan nilai weight ( dan level cut off (c). Nilai-nilai dan c

    yang digunakan adalah 0.01, 0.05 dan 0.10. Penggunaan beberapa nilai-nilai

    dan c dilakukan pada data Kabupaten Sukabumi karena proses komputasinya

    tidak memerlukan waktu yang lama, untuk satu kali proses run data memerlukan

    waktu sekitar 10 sampai dengan 15 menit. Selanjutnya dari output yang

    dihasilkan, bisa diperoleh gambaran pola sebagai akibat penggunaan pasangan

    nilai dan c, baik terhadap jumlah outlier yang terdeteksi maupun taksiran

    parameter yang diperoleh.

  • 21

    Sedangkan untuk pendeteksian outlier Provinsi Jawa Barat digunakan nilai

    = 0.05 dan c = 0.05. Penggunaan salah satu pasangan nilai dan c dalam proses

    pengolahan data pada Provinsi Jawa Barat merupakan salah satu contoh saja. Hal

    tersebut dilakukan karena untuk satu kali proses run data untuk Provinsi Jawa

    Barat memerlukan waktu yang cukup lama, sekitar 1 jam lebih untuk satu proses.

    4.2.Deskripsi Data Hasil SUPAS 2005

    Pada bagian ini akan disajikan ringkasan data yang berhubungan dengan

    wanita menikah muda dan faktor-faktor yang mempengaruhinya, yaitu: agama,

    status tempat tinggal, status bekerja, status migran dan lama sekolah. Pada Tabel

    4.1. di bawah, menunjukkan bahwa secara nasional persentase wanita menikah

    muda masih tinggi sebesar 61.9%. Provinsi yang memiliki persentase wanita

    menikah muda paling tinggi adalah Jawa Barat sebesar 71.4%. Sedangkan

    provinsi yang memiliki persentase wanita menikah mudanya paling rendah adalah

    Nusa Tenggara Timur sebesar 38.5%.

    Sungguh merupakan suatu phenomena yang cukup menarik untuk dikaji

    lebih dalam, bagi sebuah provinsi seperti Provinsi Jawa Barat, provinsi yang

    berbatasan langsung dengan ibu kota negara, atau sebagai sebuah provinsi

    penyangga ibu kota, ternyata persentase wanita menikah mudanya paling tinggi.

    Dari segi sarana dan prasarana pendidikan, Provinsi Jawa Barat juga merupakan

    provinsi dimana terletak beberapa perguruan tinggi ternama di Indonesia, sebut

    saja: ITB, Unpad, IPB, UI, dan perguruan tinggi lainnya yang tidak kalah

    kualitasnya. Tentunya hal ini merupakan suatu tantangan bagi pihak-pihak terkait

  • 22

    untuk segera merumuskan sebuah kebijakan stategis dan terobosan yang berani,

    khususnya dalam peningkatan usia menikah bagi masyarakat Provinsi Jawa Barat.

    Tabel 4.1. Persentase Wanita Menikah menurut Jenis Pernikahan dan Provinsi di Indonesia Tahun 2005

    No Provinsi Jenis Pernikahan

    Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Sumatera Utara 55.88 44.12 2 Sumatera Barat 46.98 53.02 3 Riau 46.99 53.01 4 Jambi 33.95 66.05 5 Sumatera Selatan 40.21 59.79 6 Bengkulu 35.63 64.37 7 Lampung 35.58 64.42 8 Bangka Belitung 43.28 56.72 9 Kepulauan Riau 60.90 39.10 10 DKI Jakarta 54.07 45.93 11 Jawa Barat 28.63 71.37 12 Jawa Tengah 34.76 65.24 13 DI Yogyakarta 53.90 46.10 14 Jawa Timur 31.53 68.47 15 Banten 33.64 66.36 16 Bali 56.50 43.50 17 Nusa Tenggara Barat 39.79 60.21 18 Nusa Tenggara Timur 61.46 38.54 19 Kalimantan Barat 44.71 55.29 20 Kalimantan Tengah 39.11 60.89 21 Kalimantan Selatan 34.22 65.78 22 Kalimantan Timur 45.33 54.67 23 Sulawesi Utara 59.98 40.02 24 Sulawesi Tengah 42.23 57.77 25 Sulawesi Selatan 44.53 55.47 26 Sulawesi Tenggara 39.02 60.98 27 Gorontalo 50.75 49.25 28 Maluku 59.78 40.22 29 Maluku Utara 48.92 51.08 30 Papua 43.07 56.93

    INDONESIA 38.09 61.91

    Sumber : SUPAS 2005, diolah.

  • 23

    Untuk meneliti lebih dalam mengenai tingginya persentase wanita

    menikah muda di Provinsi Jawa Barat, akan ditunjukkan keadaan wanita menikah

    muda menurut faktor-faktor yang mempengaruhinya. Tabel 4.2. menampilkan

    persentase wanita menikah menurut jenis pernikahan dirinci menurut

    kabupaten/kota.

    Tabel 4.2. Persentase Wanita Menikah menurut Jenis Pernikahan dan Kabupaten/Kota di Provinsi Jawa Barat Tahun 2005

    No Kabupaten/Kota Jenis Pernikahan

    Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Bogor 29.40 70.60 2 Sukabumi 16.78 83.22 3 Cianjur 15.37 84.63 4 Bandung 29.30 70.70 5 Garut 21.77 78.23 6 Tasikmalaya 20.42 79.58 7 Ciamis 21.31 78.69 8 Kuningan 27.39 72.61 9 Cirebon 26.10 73.90 10 Majalengka 20.18 79.82 11 Sumedang 17.08 82.92 12 Indramayu 18.89 81.11 13 Subang 22.33 77.67 14 Purwakarta 23.59 76.41 15 Karawang 23.08 76.92 16 Bekasi 30.61 69.39 17 Bogor 47.61 52.39 18 Sukabumi 36.78 63.22 19 Kota Bandung 50.89 49.11 20 Kota Cirebon 47.89 52.11 21 Kota Bekasi 53.24 46.76 22 Kota Depok 50.02 49.98 23 Kota Cimahi 51.97 48.03 24 Kota Tasikmalaya 34.68 65.32 25 Kota Banjar 28.99 71.01

    PROVINSI JAWA BARAT 28.63 71.37

    Sumber : SUPAS 2005, diolah.

  • 24

    Pada Tabel 4.2. di atas, memperlihatkan bahwa terdapat 4 kabupaten yang

    persentase wanita menikah muda di atas 80 persen, yakni: Sukabumi 83.22

    persen, Cianjur 84.63 persen, Sumedang 82.92 persen dan Indramayu 81.11

    persen. Sementara itu terdapat 4 kota yang memiliki persentase wanita menikah

    muda di bawah 50 persen, yakni: Bandung 49.11 persen, Bekasi 46.76 persen,

    Depok 49.98 persen dan Cimahi 48.03 persen.

    Secara ringkas, Kabupaten Cianjur merupakan kabupaten dengan

    persentase wanita menikah muda tertinggi di Provinsi Jawa Barat, sedangkan Kota

    Bekasi merupakan kota dengan persentase wanita menikah muda terendah.

    Dalam bentuk gambar visual dapat dilihat pada Gambar 4.1. berikut:

    Gambar 4.1. Persentase Wanita Menikah Muda menurut Kabupaten/Kota di Provinsi Jawa Barat

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    Bog

    orSu

    kabu

    mi

    Cia

    njur

    Ban

    dung

    Gar

    utTa

    sikm

    alay

    aC

    iam

    isK

    unin

    gan

    Cire

    bon

    Maj

    alen

    gka

    Sum

    edan

    gIn

    dram

    ayu

    Suba

    ngPu

    rwak

    arta

    Kar

    awan

    gB

    ekas

    iB

    ogor

    Suka

    bum

    iB

    andu

    ngC

    irebo

    nB

    ekas

    iD

    epok

    Cim

    ahi

    Tasi

    kmal

    aya

    Ban

    jar

    70.6

    83 85

    7178 80 79

    73 7480

    83 8178 76 77

    69

    52

    63

    4952

    4750 48

    6571

  • 25

    Sedangkan dalam Gambar 4.2. di bawah berikut ini menggambarkan

    persentase wanita menikah menurut jenis pernikahan:

    Gambar 4.2. Persentase Wanita Menikah Muda dan Dewasa di Provinsi Jawa Barat

    Selanjutnya, salah satu faktor yang mempengaruhi wanita menikah muda adalah

    agama. Tabel 4.2. di bawah menampilkan persentase wanita menikah menurut

    jenis pernikahan berdasarkan agama yang dianut.

    Tabel 4.3. Persentase Wanita Menikah menurut Jenis Pernikahan dan Agama yang Dianut di Provinsi Jawa Barat Tahun 2005

    No Agama Jenis Pernikahan

    Menikah Dewasa Menikah Muda

    (1) (2) (3) (4)

    1 Non Islam 77.13 22.87

    2 Islam 27.64 72.36

    Sumber : SUPAS 2005, diolah.

    71.37

    28.63

    Wanita Menikah Muda

    Wanita Menikah Dewasa

  • 26

    Dalam bentuk gambar, persentase wanita menikah menurut jenis pernikahan dan

    agama, seperti terlihat pada Gambar 4.3. berikut ini:

    Gambar 4.3. Persentase Wanita Menikah menurut Jenis Pernikahan dan Agama di Provinsi Jawa Barat

    Pada Tabel 4.3. memperlihatkan bahwa wanita yang beragama Islam

    memiliki persentase menikah muda jauh lebih tinggi (72.36%) jika dibanding

    dengan wanita non Islam (22.87%). Dari data tersebut dapat disimpulkan bahwa

    wanita yang beragama non Islam cenderung melakukan pernikahan pada usia

    dewasa, sebaliknya terjadi pada wanita yang beragama Islam cenderung menikah

    pada usia muda.

    Sementara itu, Tabel 4.4. di bawah memperlihatkan bahwa wanita yang

    tinggal di perdesaan cenderung melangsungkan pernikahan di usia muda.

    Sedangkan yang bertempat tinggal di perkotaan cenderung melangsungkan

    pernikahan pada usia dewasa.

    MenikahDewasa

    MenikahMuda

    0

    10

    20

    30

    40

    50

    60

    70

    80

    NonIslamIslam

  • 27

    Tabel 4.4. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Tempat Tinggal di Provinsi Jawa Barat Tahun 2005

    No Status Tempat Tinggal Jenis Pernikahan

    Menikah Dewasa Menikah Muda

    (1) (2) (3) (4)

    1 Perkotaan 77.13 22.87

    2 Perdesaan 27.64 72.36

    Sumber : SUPAS 2005, diolah.

    Persentase wanita menikah menurut jenis pernikahan dan status tempat

    tinggal dalam bentuk gambar adalah:

    Gambar 4.4. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Tempat Tinggal di Provinsi Jawa Barat

    Jika dilihat dari persentase jenis pernikahan dan status bekerja wanita

    dapat dilihat pada Tabel 4.5 di bawah ini:

    MenikahDewasa

    MenikahMuda

    0

    20

    40

    60

    80

    100

    PerkotaanPerdesaan

  • 28

    Tabel 4.5. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Bekerja di Provinsi Jawa Barat Tahun 2005

    No Status Bekerja Jenis Pernikahan

    Menikah Dewasa Menikah Muda

    (1) (2) (3) (4)

    1 Tidak Bekerja 28.60 71.40

    2 Bekerja 28.69 71.31

    Sumber : SUPAS 2005, diolah.

    Secara umum baik wanita bekerja maupun tidak bekerja, cenderung melakukan

    pernikahan pada usia muda. Akan tetapi wanita yang berstatus tidak bekerja

    memiliki kecenderungan menikah pada usia muda daripada wanita yang bekerja,

    walaupun perbedaannya sangat kecil. Dalam bentuk gambar dapat disajikan

    sebagai berikut:

    Gambar 4.5. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Bekerja Tinggal di Provinsi Jawa Barat

    0 20 40 60 80

    TidakBekerja

    Bekerja

    MenikahMuda

    MenikahDewasa

  • 29

    Selanjutnya, Tabel 4.6. menampilkan wanita menikah menurut jenis

    pernikahan dan status migran. Tabel 4.6 di bawah menunjukkan bahwa wanita

    yang berstatus migran cenderung melakukan pernikahan di usia muda dari pada

    wanita yang berstatus non migran. Baik wanita berstatus migran atau pun non

    migran, wanita cenderung menikah pada usia muda, hal ini terlihat dari persentase

    menikah muda untuk masing-masing, yaitu wanita berstatus non migran sebesar

    61.89 persen dan migran sebesar 71.39 persen.

    Tabel 4.6. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Migran di Provinsi Jawa Barat Tahun 2005

    No Status Migran Jenis Pernikahan

    Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 Non Migran 38.11 61.89

    2 Migran 28.61 71.39 Sumber : SUPAS 2005, diolah.

    Dalam bentuk visualisasi gambar dapat dilihat pada Gambar 4.6. berikut ini:

    Gambar 4.6. Persentase Wanita Menikah menurut Jenis Pernikahan dan Status Migran di Provinsi Jawa Barat

    0 20 40 6080

    NonMigran

    Migran

    MenikahMuda

    MenikahDewasa

  • 30

    Selanjutnya, persentase wanita menurut jenis pernikahan dan lama sekolah dapat

    dilhat pada Tabel 4.7. berikut ini:

    Tabel 4.7. Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama Sekolah di Provinsi Jawa Barat Tahun 2005

    No Lama Sekolah (Tahun) Jenis Pernikahan

    Menikah Dewasa Menikah Muda (1) (2) (3) (4) 1 0 13.67 86.33 2 1 11.90 88.10 3 2 11.66 88.34 4 3 15.19 84.81 5 4 11.77 88.23 6 5 13.36 86.64 7 6 19.55 80.45 8 7 27.71 72.29 9 8 29.01 70.99 10 9 31.98 68.02 11 10 39.34 60.66 12 11 42.40 57.60 13 12 69.72 30.28 14 13 87.91 12.09 15 14 81.78 18.22 16 15 89.69 10.31 17 16 91.66 8.34 18 17 83.72 16.28 19 > 19 100.00 0.00

    Sumber : SUPAS 2005, diolah.

    Dari Tabel 4.7. di atas terlihat bahwa wanita yang lama pendidikannya 6

    tahun (jika dikonversi hampir sama dengan lulus SD), persentase menikah

    mudanya di atas 80 persen, sementara itu wanita yang lama pendidikannya 9

  • 31

    tahun (lulus SMP), persentase menikah mudanya berada di sekitar 70 persen dan

    lama pendidikannya 12 tahun (lulus SMA), persentase menikah mudanya antara

    30-61 persen.

    Dari Tabel 4.7. di atas, terlihat dengan jelas adanya pola, bahwa semakin

    lama seseorang wanita menamatkan pendidikannya, maka semakin kecil

    persentase menikah mudanya. Artinya bahwa wanita yang berpendidikan lebih

    tinggi cenderung melangsungkan pernikahannya pada usia dewasa.

    Dalam bentuk gambar dapat dilihat pada Gambar 4.7. berikut:

    Gambar 4.7. Persentase Wanita Menikah menurut Jenis Pernikahan dan Lama Sekolah di Provinsi Jawa Barat

    4.3.Pendeteksian Outlier untuk Data SUPAS 2005 Kabupaten Sukabumi

    Menurut data SUPAS 2005, persentase wanita menikah muda di

    Kabupaten Sukabumi sebesar 83.22 persen. Ukuran sampel (n) pada data SUPAS

    0

    20

    40

    60

    80

    100

    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 >19

    MenikahMuda

    MenikahDewasa

    LamaSekolah(tahun)

  • 32

    2005 Kabupaten Sukabumi sebanyak 967 pengamatan, yang merupakan penduduk

    wanita berumur 10 tahun keatas yang pernah menikah. Jumlah variabel regressor

    (K) sebanyak 5, yaitu: Agama yang Dianut, Status Tempat tinggal, Status Bekeja,

    Status Migran dan Lama Sekolah, sedangkan variabel responnya adalah Jenis

    Pernikahan. Berikut ini adalah ringkasan output hasil pendeteksian outlier:

    Dengan mengacu pada langkah-langkah seperti yang tercantum pada

    Lampiran 3 dan 4, maka didapat hasil seperti tercantum pada Tabel 4.1 berikut ini:

    Tabel 4.8. Banyaknya Pengamatan yang Terdeteksi sebagai Outlier dengan Metode DOUW dan Deviance Residual

    Epsilon Level Cut Off (C)

    () 0.01 0.05 0.10

    (1) (2) (3) (4)

    0.01 19 97 108

    0.05 0 75 103

    0.10 0 75 97

    Deviance Residual 27

    Pada Tabel 4.8. ditunjukkan bahwa dengan menggunakan nilai = 0.01

    dan untuk nilai c = 0.01, 0.05 dan 0.10, dihasilkan banyaknya pengamatan yang

    terdeteksi sebagai outlier masing-masing sebanyak 19, 97, dan 108. Sementara,

    jika menggunakan nilai = 0.05 dan nilai c = 0.01, 0.05 dan 0.10, dihasilkan

    banyaknya pengamatan yang terdeteksi sebagai outlier masing-masing sebanyak

  • 33

    0, 75, dan 103. Sedangkan jika menggunakan nilai = 0.10 dan nilai c = 0.01,

    0.05 dan 0.10, dihasilkan banyaknya pengamatan yang terdeteksi sebagai outlier

    masing-masing sebanyak 0, 75, dan 97.

    Akan tetapi jika menggunakan nilai c = 0.01 dan nilai = 0.01, 0.05, dan

    0.10, banyaknya pengamatan yang terdeteksi sebagai outlier masing-masing

    sebanyak 19, 0, dan 0. Sementara, jika menggunakan nilai c = 0.05 dan nilai =

    0.01, 0.05 dan 0.10, banyaknya pengamatan yang terdeteksi sebagai outlier

    masing-masing sebanyak 97, 75, dan 75. Sedangkan jika menggunakan nilai c =

    0.10 dan nilai = 0.01, 0.05 dan 0.10, dihasilkan banyaknya pengamatan yang

    terdeteksi sebagai outlier masing-masing sebanyak 108, 103, dan 97. Sedangkan

    jika menggunakan deviance residual untuk masing-masing pengamatan, jumlah

    outlier yang terdeteksi sebanyak 27 pengamatan.

    Dari ringkasan Tabel 4.8. di atas memperlihatkan, bahwa untuk nilai

    tertentu dan nilai c yang semakin mendekati 1, maka banyaknya pengamatan yang

    terdeteksi sebagai outlier semakin banyak. Sedangkan untuk nilai c tertentu dan

    nilai yang semakin mendekati 0, maka banyaknya pengamatan yang terdeteksi

    sebagai outlier semakin sedikit.

    Sementara, jika pendeteksian outlier dengan cara menghitung deviance

    residual-nya, maka jumlah outlier yang terdeteksi sebanyak 27 pengamatan.

    Apabila dibandingkan antara metode deviance residual dengan metode DOUW,

    maka jumlah outlier yang terdeteksi oleh metode deviance residual hampir sama

    dengan metode DOUW untuk pasangan nilai = 0.01 dan nilai c antara 0.01-

  • 34

    0.05. Secara grafik, penjelasan untuk penggunaan pasangan nilai = 0.01 dan

    c=0.01 dapat dilihat pada Gambar 4.8. berikut:

    Gambar 4.8. Scatter Plot antara Observasi dengan Probabilitas (G) pada Data SUPAS 2005 Kabupaten Sukabumi

    (untuk n=967, K=5, =0.01, C=0.01)

    Pada Gambar 4.8. di atas, menggambarkan sebaran peluang masing-

    masing pengamatan untuk data SUPAS 2005 Kabupaten Sukabumi (n=967, K=5,

    =0.01, dan c=0.01). Tanda segitiga merupakan pengamatan yang terdeteksi

    sebagai outlier, sedangkan tanda bulat merupakan pengamatan yang bukan

    outlier (inlier). Pengamatan yang terdeteksi sebagai outlier sebanyak 19

    Inlier Outlier

  • 35

    pengamatan. Selanjutnya, untuk memperlihatkan taksiran parameter regresi

    logistik biner pada berbagai pasangan nilai dan c, dapat dilihat pada Tabel 4.9.

    berikut:

    Tabel 4.9. Taksiran Parameter untuk masing-masing Nilai dan c (untuk n=967 dan K=5)

    Metode DOUW Taksiran Parameter () Variabel Regressor

    Iterasi Awal -0.219096 1.463611 0.07805 -0.017111 -0.289625 -0.064513

    Itera

    si A

    khir

    =0.01, C=0.01 -2.228715 28.561103 0.745062 -1.017507 -20.60555 -0.501863

    =0.01, C=0.05 6.009056 27.946053 0.991507 -0.932734 -25.14176 -0.768705

    =0.01, C=0.10 1.569823 28.53216 1.304153 -1.677466 -20.35584 -0.865654

    =0.05, C=0.01 -1.693234 24.742933 0.081209 -0.08635 -19.11177 -0.345153

    =0.05, C=0.05 -0.495424 24.879487 0.672546 -0.88321 -18.68798 -0.499501

    =0.05, C=0.10 0.630008 27.354837 0.849183 -0.743998 -20.39371 -0.66003

    =0.10, C=0.01 -0.731997 25.751983 0.073094 -0.086068 -21.23428 -0.328101

    =0.10, C=0.05 -0.645959 24.642839 0.618584 -0.775922 -18.6353 -0.46836

    =0.10, C=0.10 0.761374 26.69478 0.484053 -0.415487 -20.80062 -0.581004

    Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama

    = Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran = Taksiran Parameter untuk Variabel Lama Sekolah

    Ringkasan output pada Tabel 4.9. memperlihatkan perubahan taksiran

    parameter regresi logistik biner yang dihasilkan dari iterasi pertama sampai iterasi

  • 36

    terakhir dengan metode DOUW. Taksiran parameter pada iterasi awal untuk

    setiap pasangan nilai dan c adalah =-0.219096, =1.463611, =0.07805,

    = -0.017111, = -0.289625, dan = -0.064513. Taksiran parameter pada

    iterasi awal maksudnya adalah taksiran parameter yang diperoleh dari data tanpa

    memperhatikan data tersebut ada atau tidaknya pengamatan yang merupakan

    outlier. Sedangkan taksiran parameter pada iterasi akhir adalah taksiran parameter

    yang dihasilkan setelah memperhatikan adanya outlier, sehingga taksiran

    parameter yang diperoleh pada iterasi akhir merupakan taksiran parameter yang

    robust.

    Apabila diperhatikan pada Tabel 4.9. di atas, maka terlihat bahwa

    perubahan nilai taksiran parameter pada seluruh variabel regressor dari iterasi

    awal ke iterasi akhir mengalami perubahan nilai yang sangat signifikans. Sebagai

    contoh, nilai taksiran parameter pada iterasi awal untuk =1.463611, berubah

    menjadi = 28.561103 pada iterasi akhir untuk =0.01 dan c=0.01. Bahkan

    untuk seluruh pasangan dan c berapa pun mengalami peningkatan yang sangat

    signifikans. Dari hasil ini memperlihatkan bahwa pengaruh dari keberadaan

    outlier sangat serius terhadap taksiran parameter, khususnya pada regresi logistik

    biner. Sehingga secara otomatis akan berpengaruh terhadap model regresi logistik

    biner yang dihasilkan dan tentunya akan menentukan kesimpulan akhir dari suatu

    permasalahan.

    Berikutnya, dari metode DOUW ini dapat ditunjukkan keberadaan outlier

    dan hasil taksiran parameternya untuk berbagai pasangan nilai dan c pada Tabel

    4.10. di bawah ini:

  • 37

    Tabel 4.10. Taksiran Parameter () untuk masing-masing Nilai dan c, serta Banyaknya Outlier yang Terdeteksi dengan Metode DOUW

    (Untuk n=967 dan K=5) dan Deviance Residual

    Metode DOUW Taksiran Parameter () Variabel Regressor Banyak

    Outlier

    =0.01, C=0.01 -2.228715 28.561103 0.745062 -1.017507 -20.60555 -0.501863 19

    =0.01, C=0.05 6.009056 27.946053 0.991507 -0.932734 -25.14176 -0.768705 97

    =0.01, C=0.10 1.569823 28.53216 1.304153 -1.677466 -20.35584 -0.865654 108

    =0.05, C=0.01 -1.693234 24.742933 0.081209 -0.08635 -19.11177 -0.345153 0

    =0.05, C=0.05 -0.495424 24.879487 0.672546 -0.88321 -18.68798 -0.499501 75

    =0.05, C=0.10 0.630008 27.354837 0.849183 -0.743998 -20.39371 -0.66003 103

    =0.10, C=0.01 -0.731997 25.751983 0.073094 -0.086068 -21.23428 -0.328101 0

    =0.10, C=0.05 -0.645959 24.642839 0.618584 -0.775922 -18.6353 -0.46836 75

    =0.10, C=0.10 0.761374 26.69478 0.484053 -0.415487 -20.80062 -0.581004 97

    Deviance Residual 27

    Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama

    = Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran

    = Taksiran Parameter untuk Variabel Lama Sekolah

    Tabel 4.10. di atas menampilkan ringkasan output yang memperlihatkan

    banyaknya pengamatan yang terdeteksi sebagai outlier dan sekaligus

    mendapatkan taksiran parameter yang robust. Hal ini merupakan tujuan utama

    dari metode DOUW yaitu: mendeteksi outlier sekaligus mendapatkan taksiran

    parameter regresi logistik biner yang robust. Sedangkan jika menggunakan

  • 38

    metode deviance residual, taksiran parameternya tidak ada, karena metode ini

    hanya untuk mendeteksi outlier saja.

    Taksiran parameter yang dihasilkan dengan menggunakan metode

    DOUW, untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan

    nilai yang tidak terlalu jauh berbeda dan tidak merubah tanda pada taksiran

    parameternya, walaupun banyaknya outlier yang terdeteksi tidak sama. Seperti

    yang telah dijelaskan pada pembahasan Tabel 4.8. sebelumnya, bahwa semakin

    besar nilai c yang digunakan, maka semakin banyak pula pengamatan yang

    terdeteksi sebagai outlier, begitu juga sebaliknya, semakin kecil nilai c yang

    digunakan, maka semakin sedikit pula pengamatan yang terdeteksi sebagai

    outlier. Berbeda dengan penggunaan nilai , semakin besar menggunakan nilai ,

    maka semakin sedikit outlier yang terdeteksi dan semakin kecil nilai yang

    digunakan, maka akan semakin banyak outlier yang terdeteksi. Secara garis besar,

    penggunaan nilai c berbanding lurus dengan banyaknya outlier yang terdeteksi.

    Sedangkan penggunaan nilai berbanding terbalik dengan banyaknya outlier

    yang terdeteksi.

    Dari Tabel 4.10. memperlihatkan bahwa taksiran parameter yang

    dihasilkan dengan metode DOUW untuk nilai =0.01 dan c=0.01 adalah = -

    2.228715, =28.561103, =0.745062, = -1.017507, = -20.60555, dan =

    -0.501863, banyaknya pengamatan yang terdeteksi sebagai outlier sebanyak 19

    pengamatan, yaitu: pengamatan nomor: 18, 25, 31, 75, 184, 213, 275, 374, 411,

    501, 559, 646, 672, 711, 722, 731, 800, 891, dan 927. Sedangkan jumlah outlier

    yang terdeteksi oleh metode devians residual sebanyak 27 pengamatan, yaitu

  • 39

    pengamatan nomor: 18, 25, 28, 31, 75, 135, 146, 184, 191, 213, 229, 275, 374,

    411, 415, 501, 559, 646, 662, 672, 711, 722, 731, 733, 800, 891, dan 927. Jika

    diperhatikan, nomor pengamatan yang terdeteksi sebagai outlier oleh metode

    DOUW, maka akan terdeteksi juga oleh metode deviance residual, begitu juga

    sebaliknya. Masing-masing banyaknya pengamatan yang terdeteksi sebagai

    outlier beserta nomor pengamatan secara lengkap untuk masing-masing pasangan

    dan c dapat dilihat pada Lampiran 6.

    Pada Tabel 4.10. di atas, menunjukkan variabel Agama dan Status Tempat

    Tinggal wanita bernilai positif, hal ini berarti bahwa orang yang beragana Islam

    atau orang yang bertempat tinggal di perdesaan memiliki kecenderungan untuk

    melangsungkan pernikahannya pada usia muda. Sedangkan variabel yang bernilai

    negatif adalah variabel Status Bekerja, Status Migran, dan Lama Sekolah, hal ini

    berarti bahwa, wanita yang bekerja atau berstatus migran atau semakin lama masa

    pendidikannya, memiliki kecenderungan untuk menikah pada usia dewasa.

    4.4. Pendeteksian Outlier untuk Data SUPAS 2005 Provinsi Jawa Barat

    Menurut data SUPAS 2005, persentase wanita menikah muda di Provinsi

    Jawa Barat sebesar 71,37 persen, merupakan persentase tertinggi dibandingkan

    dengan provinsi lainnya di Indonesia. Ukuran sampel (n) pada data SUPAS 2005

    untuk Provinsi Jawa Barat sebanyak 21.772 pengamatan, yang merupakan

    penduduk wanita berumur 10 tahun keatas yang pernah menikah. Berikut ini

    adalah ringkasan output hasil pendeteksian outlier sekaligus taksiran

    parameternya.

  • 40

    Tabel 4.11. Taksiran Parameter () dan Banyaknya Outlier yang Terdeteksi oleh

    Metode DOUW (n=21772, K=5, =0.05 & c=0.05) dan Deviance Residual, serta Nilai Odds Ratio

    Metode DOUW Taksiran Parameter () Variabel Regressor Banyak

    Outlier

    Iterasi Awal 0.206886 0.483644 0.216507 -0.02973 0.175381 -0.08526

    Iterasi Akhir 0.10830 2.796836 1.429871 -0.12015 1.406145 -0.44967 1.329

    Deviance Residual 663

    Odds Ratio 16.39 4.18 0.89 4.08 0.64

    Keterangan : = Konstanta = Taksiran Parameter untuk Variabel Agama

    = Taksiran Parameter untuk Variabel Status Tempat Tinggal = Taksiran Parameter untuk Variabel Status Bekerja = Taksiran Parameter untuk Variabel Status Migran

    = Taksiran Parameter untuk Variabel Lama Sekolah

    Pada Tabel 4.11. di atas menunjukkan bahwa banyaknya outlier yang

    terdeteksi menggunakan metode DOUW sebanyak 1.329 pengamatan, rincian

    nomor pengamatan yang terdeteksi sebagai outlier dapat dilihat pada Lampiran 7.

    Sedangkan jika menggunakan metode deviance residual terdeteksi sebanyak 663

    pengamatan. Tabel 4.11 juga menunjukkan bahwa variabel Agama, Status Tempat

    Tinggal, dan Status Migran bernilai positif, hal ini berarti bahwa wanita yang

    beragama Islam atau bertempat tinggal di perdesaan atau berstatus migran

    memiliki kecenderungan untuk melangsungkan pernikahannya pada usia muda.

    Sedangkan variabel yang bernilai negatif adalah variabel Status Bekerja dan Lama

    Sekolah, hal ini berarti bahwa, wanita yang bekerja atau semakin lama masa

    pendidikan seorang wanita, memiliki kecenderungan untuk menikah pada usia

    dewasa.

  • 41

    Sementara itu, diperoleh taksiran parameter untuk masing-masing variabel

    regressor sebesar =0.10830, =2.796836, =1.429871, = -0.12015, =

    1.406145, dan = -0.44967. Sehingga model regresi logistik biner dapat

    dinyatakan sebagai berikut:

    exp 0.10830 2.796836 1.429871 0.12015 1.406145 0.44967

    1 exp 0.10830 2.796836 1.429871 0.12015 1.406145 0.44967

    Dimana: X1 adalah Variabel Agama X2 adalah Variabel Status Tempat Tinggal X3 adalah Variabel Status Status Bekerja X4 adalah Variabel Status Status Migran X5 adalah Variabel Status Lama Sekolah

    Selanjutnya untuk menginterpretasikan taksiran parameter dalam model

    regresi logistik biner, digunakan Odds Ratio, yang diperoleh melalui exponensial

    dari . Odds Ratio menggambarkan risiko kecenderungan suatu kategori tertentu

    terhadap kategori lainnya (reference category) dalam satu variabel regressor atau

    suatu nilai tertentu terhadap nilai lainnya dalam satu variabel tertentu. Odds ratio

    untuk masing-masing variabel adalah sebagai berikut:

    a. Variabel Agama sebesar 16.39, artinya wanita yang beragama Islam

    memiliki kecenderungan menikah muda 16.39 kali dibandingkan dengan

    wanita yang beragama non-Islam.

    b. Variabel Status Tempat Tinggal sebesar 4.18, artinya wanita yang

    bertempat tinggal di perdesaan memiliki kecenderungan menikah muda 4.18

    kali dibandingkan dengan wanita yang bertempat tinggal di perkotaan.

  • 42

    c. Variabel Status Bekerja sebesar 0.89, artinya wanita yang bekerja memiliki

    kecenderungan menikah muda 0.89 kali dibandingkan dengan wanita yang

    tidak bekerja, atau orang yang tidak bekerja memiliki kecenderungan menikah

    muda 1.12 kalinya dibandingkan dengan orang yang bekerja.

    d. Variabel Status Migran sebesar 4.08, artinya wanita yang berstatus migran

    memiliki kecenderungan menikah muda 4.08 kali dibandingkan dengan wanita

    yang non migran.

    e. Variabel Lama Sekolah 0.64, artinya wanita yang lama pendidikannya t

    tahun memiliki kecenderungan menikah muda sebesar 0.64 kali dibandingkan

    dengan wanita yang lama pendidikannya t-1 tahun. Oleh karena variabel lama

    sekolah bersifat kontinu, untuk memudahkan dalam menginterpretasikan nilai

    odds ratio-nya, maka interpretasi dilakukan untuk setiap 3 tahunan. Dari hasil

    perhitungan, {exp(3(-0.44967)}, diperoleh nilai odds ratio untuk 3 tahunan

    sebesar 0.26. Artinya, wanita yang lama sekolahnya 6 tahun (lulus SD)

    memiliki kecenderungan menikah muda 0.16 kali dibandingkan dengan wanita

    yang lama pendidikannya 3 tahun (berhenti di kelas 4 SD), atau wanita yang

    sekolahnya berhenti di kelas 4 SD memiliki kecenderungan menikah muda

    sebesar 3.85 kali dibandingkan dengan wanita yang lulus SD. Atau contoh

    lainnya, wanita yang lulus SMP memiliki kecenderungan menikah muda

    sebesar 3.85 kali dibandingkan dengan wanita yang lulus SMA. Walaupun

    Odds Ratio untuk setiap 3 tahunan tingkat pendidikan sama, akan tetapi risiko

    wanita menikah muda untuk masing-masing tingkatan pendidikan tidaklah

    sama. Sebagai contoh, odds ratio wanita yang lulus SMP dengan yang lulus

  • 43

    SMA nilainya sama dengan odds ratio wanita yang lulus SMA dengan wanita

    yang lulus D3 sama, akan tetapi risiko menikah muda wanita lulus D3 dengan

    wanita yang lulus SMA tidak sama. Hal ini berlaku untuk setiap tingkatan

    pendidikan.

  • 44

    BAB V

    KESIMPULAN DAN SARAN

    5.1. Kesimpulan

    Pada bab sebelumnya telah dijelaskan bahwa metode DOUW merupakan

    suatu prosedur untuk mendeteksi outlier dalam arah y. Dalam metode DOUW,

    ada empat hal yang harus dilengkapi yaitu: penentuan g1 yang optimal, jumlah

    iterasi, pilihan (weight), dan pilihan level cut off (c). Berdasarkan hasil dan

    pembahasan pada bab sebelumnya, maka dapat diambil beberapa kesimpulan

    sebagai berikut:

    1. Untuk nilai tertentu dan nilai c yang semakin mendekati 1, maka banyaknya

    pengamatan yang terdeteksi sebagai outlier semakin banyak. Sedangkan

    untuk nilai c tertentu dan nilai yang semakin mendekati 0, maka banyaknya

    pengamatan yang terdeteksi sebagai outlier semakin sedikit.

    2. Perubahan nilai taksiran parameter pada seluruh variabel regressor dari iterasi

    awal ke iterasi akhir mengalami perubahan yang sangat signifikans. Dari hasil

    ini memperlihatkan bahwa pengaruh dari keberadaan outlier terhadap taksiran

    parameter sangat serius, khususnya pada regresi logistik biner, sehingga secara

    otomatis akan berpengaruh terhadap model regresi logistik biner yang

    dihasilkan yang akan menentukan kesimpulan akhir dari suatu permasalahan.

    3. Taksiran parameter yang dihasilkan dengan menggunakan metode DOUW,

    untuk nilai pasangan dan c berapa pun pada dasarnya menghasilkan nilai

  • 45

    yang tidak terlalu jauh berbeda dan tidak merubah tanda pada taksiran

    parameternya, walaupun banyaknya outlier yang terdeteksi tidak sama.

    5.2. Saran

    1. Walaupun pemilihan pasangan konstanta dan c tidak merubah nilai taksiran

    parameter regresi logistik biner secara signifikans, akan tetapi perlu dilakukan

    kajian lebih dalam untuk membuat panduan yang konkrit dalam pemilihan

    kedua nilai konstanta tersebut.

    2. Sehubungan dengan proses komputasi yang cukup rumit, maka untuk

    penelitian lebih lanjut, perlu kiranya dirancang prosedur yang lebih praktis

    dalam proses komputasinya.

  • 46

    DAFTAR PUSTAKA

    Agresti, Alan, (1990), Categorical Data Analysis, John Wiley & Sons, Inc. New

    York. ______, (1997), Categorical Data Analysis, John Wiley & Sons, Inc. New York. Bogue O.J, (1969), Principle of Demography, John Wiley & Sons, Inc. New

    York. Chen, Collin. Robust Regression and Outlier Detection with the ROBUSTREG

    Procedure. Institute Inc., Cary, NC. Page 265-27. Chang, I., Tiao, G.C. dan Chen, C. (1988), Estimation of Time Series Parameters

    in the Presence of Outliers, Technometrics, Vol. 30, hal. 193-204. Copas, J.B. 1988. Binary regression models for contaminated data.

    Withdiscussion. Journal of the Royal Statistical Society. Series B (Methodological), 50(2):225.265.

    Hadi, Ali S.,Rahmatullah Imon, A.H.M and Werner, Mark. (2009), Detection of

    Outlier, John Wiley & Sons, Inc. WIREs Comp Stat 2009 1 5770. Hanum, Sri Handayani,(1997), Perkawinan Belia, PPK-UGM dan Fond

    Fondation, Yogyakarta. Hosmer, D.W. dan Lemeshow (1989), Applied Logistic Regression, John Wiley,

    New York. Midi, Habshah & Jaafar, Asmi (2007), The Residual Plot For A Non-Linear

    Regression Model With The Presence Of Outliers And Heteroscedastic Errors, Jurnal Teknologi, 41(C) Dis. 2004: 1126 Universiti Teknologi Malaysia.

    Neykov, N.M. & Muller, C.H. (2002). Breakdown Point and Computation of

    Trimmed Likelihood Estimators in GLMs. In: R. Dutter et al., editors, Developments in robust statistics, Physica Verlag, Heidelberg.

  • 47

    Rousseeuw, P.J. & Leroy, A.M. (1987). Robust regression and outlier detection. New York: John Wiley & Sons. 329p.

    Rousseeuw, P.J. & Van Driesen, K. 1999a. Computing LTS Regression for Large

    Data Sets. Technical report, University of Antwerp. _________. 1999b. A Fast Algorithm for the Minimum Covariance Determinant

    Estimator. Technometrics, 41(3):212. 223. Rousseeuw, P.J. & Christmann, A. (2003). Robustness against separation and

    outliers in logistic regression. Computational Statistics & Data Analysis, 43(3):315-332, July 2003.

    Sembiring, RK. (2003), Analisis Regresi, edisi kedua, ITB.Bandung. Siswono, Eka. (2000). Pergeseran Budaya Perkawinan di Jawa Barat : Suatu

    Tinjauan Usia Kawin Pertama dalam Kasus Pekerja Perempuan di Botabek. Warta Demografi. LD-FEUI. Jakarta.

    Soemartini (2007). Pencilan (Outlier). Jurusan Statistika Fakultas MIPA UNPAD,

    Bandung. Tukey, JW. A. Survey of Sampling from Contaminated Distribution. In. Olkin.

    Editor. Contributions to Probability and Statistic. Stanford. Stanford University Press, 1960.P.448-85.

    Venter, JH & de la Rey, T (2007), Detects Outlier Using Weights in Logistic

    Regression, Centre for Business Mathematics and Informatics (BMI), North-West University, Potchefstroom 2520, South Africa, page 127-160.

    Warta Demografi. (2000). Perkawinan dalam Masyarakat yang sedang Berubah. LD-FEUI, Jakarta.

  • 48

    Lampiran 1 : Data SUPAS 2005 Kabupaten Sukabumi (n=967)

    . . . . . . . . . . . . . . . . . . . . .

  • 49

    Lampiran 2 : Data SUPAS 2005 Provinsi Jawa Barat (n=21.772)

    . . . . . . . . . . . . . . . . . . . . . . . .

  • 50

    Berikut ini adalah langkah-langkah pengolahan metode DOUW dengan

    menggunakan Software SAS 9.2:

    1. Simpan data SUPAS 2005 yang akan diolah pada suatu folder dalam format

    Excel (.xls) atau SPSS (.sav).

    2. Buka program SAS 9.2, lalu pada layar Editor masukkan syntax yang sudah

    dibuat.

    3. Kemudian, baca dengan PROC IMPORT OUT=WORK.(nama file baru).

    Misalkan dalam penelitian ini adalah:

    PROC IMPORT OUT=WORK.sukabumi DATA FILE="D:\KULIAH S-2\THESIS UJEL 2009-2010\UJEL BAHAN THESIS\RAW DATA SUPAS 2005\SUPAS UNTUK TESIS SUKABUMI SIAP OLAH.sav". DBMS=SAV REPLACE; RUN;

    Struktur data pada SUPAS 2005 terdiri dari: JENIS_PERNIKAHAN untuk

    variabel Y, X0 untuk mendapatkan nilai , AGAMA,

    STATUS_TPTINGGAL, STATUS_BEKERJA, STATUS_MIGRAN, dan

    LAMA_SEKOLAH untuk variabel X1 sampai dengan X5.

    4. Pada syntax yang ada melalui PROC IML, masukkan nilai pilihan konstanta

    epsilon () dan level cut off (c) yang dipilih. Misalnya: proc iml; eps=0.10; cut_off=0.10;

    Lampiran 3 : Langkah-langkah Pengolahan Metode DOUW

  • 51

    Gunakan perintah USE WORK.(nama file baru) untuk membaca nama file

    baru yang sudah dirubah dalam bentuk SAS, kemudian definisikan struktur

    variabel yang ada pada data SUPAS 2005 untuk variabel Y dan X. Hal ini

    dimaksudkan agar program dapat memisahkan variabel Y dan X pada file

    baru. Misalnya:

    use WORK.sukabumi; read all var {JENIS_PERNIKAHAN} into y; read all var {X0 AGAMA STATUS_TPTINGGAL STATUS_BEKERJA STATUS_MIGRAN LAMA_SEKOLAH} into X;

    5. Klik RUN

    6. Syntax dinyatakan sudah benar, jika pada layar Log tidak ada pesan error yang

    berwarna merah.

    7. Hasil outputnya bisa dilihat pada layar Output.

    Selanjutnya, hasil output pada langkah-langkah pengolahan metode DOUW di

    atas akan dibandingkan dengan metode konvensional (metode analisis devians

    residual).

    Lanjutan Lampiran 3

  • 52

    Berikut adalah langkah-langkah untuk mendapatkan nilai devians residual

    pada seluruh pengamatan, Pengolahan bisa menggunakan Software SPSS,

    Minitab, atau software statistik lainnya yang sudah umum.

    1. Buka file data SUPAS 2005 yang sudah disimpan. Pada menu utama pilih

    Open, klik Data, kemudian cari file yang akan diolah.

    2. Pada menu utama pilih Analyze, klik Regression, klik Binary Logistic.

    3. Masukkan variabel Dependent (Y) dan variabel Covariates (X), klik sub

    menu Categorical, kemudian masukkan variabel X yang bersifat kategori, kill

    Reference Category, pilih kategori mana yang akan dijadikan sebagai

    reference category (klik Last jika nilai yang besar yang akan jadi reference

    category, klik First jika nilai yang kecil yang jadi reference variabel, untuk

    masing-masing variabel), klik Continue, klik sub menu Save, pada sub menu

    Residual berikan ceklist Deviance, klik Continue, klik OK.

    Lampiran 4 : Langkah-langkah Pengolahan Metode Analisis Deviance Residual

  • 53

    /****************************************************************/ /* SYNTAX UNTUK DETEKSI OUTLIER */ /* */ /* */ /****************************************************************/ options ls=80 nostimer nodate ps=60; PROC IMPORT OUT= WORK.sukabumi DATAFILE= "D:\KULIAH S-2\THESIS UJEL 2009-2010\UJEL BAHAN TH ESIS\RAW DATA SUPAS 2005\SUPAS UNTUK TESIS SUKABUMI SIAP OLAH.sav" DBMS=SAV REPLACE; RUN; proc iml; eps=0.9; /*ini nilai epsilon*/ cut_off=0.05; /* ini nilai cut off */ /* * Module to calculate Gradient;*/ start gradG (betaG) global (X,y,p_G,w_G); nr=nrow(X) ; nc=ncol(X) ; gG=j(1,nc,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaG[k]*X[n,k] ; end ; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])); ;end ; do k=1 to nc; do n=1 to nr; gG[k]=gG[k]+(y[n]-p_G[n])*w_G[n]*X[n,k]; end; end; return (gG); finish gradG; start hessG (betaG) global(X,p_G,w_G); nr=nrow(X) ; nc=ncol(X) ; hG=j(nc,nc,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaG[k]*X[n,k] ; end ; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc ; do l=1 to nc ; do n=1 to nr; hG[k,l]=hG[k,l]-p_G[n]*(1-p_G[n])*x[n,k]*x[n,l]*w_G[n] ; end ; end ; end ; return (hG); finish hessG; start f_TLR_G (betaG) global(X,y,LL_opt,w_G,D_G,nr,nc,p_G); * initializing; sum_LLG=0; D_G = J(nr,1,0); logit=J(nr,1,0) ; p_G=J(nr,1,0) ; * Maximum likelihood;

    Lampiran 5 : Syntax Metode DOUW

  • 54

    do n=1 to nr; do k=1 to nc; logit[n]=

    logit[n]+betaG[k]*X[n,k]; end; if (-logit[n])>700 then p_G[n] = 0; else p_G[n]=1/(1+exp(-logit[n])); end; do n= 1 to nr; D_G [n] = (y[n]*log(max(1.0E-10,p_G[n]))+(1-y[n])*log(max(1.0E-10,1-p_G[n]))); sum_LLG = sum_LLG + w_G[n]*D_G[n]; end; LL_opt=sum_LLG; return (sum_LLG); finish f_TLR_G; use WORK.sukabumi; read all var {JENIS_PERNIKAHAN} into y; read all var {AGAMA STATUS_TPTINGGAL STATUS_BEKERJA STATUS_MIGRAN LAMA_SEKOLAH} into X; nr=nrow(X); nc=ncol(X); *calculate intitial values; y_initial = J(nr,1,0); beta_initial = J(nc,1,1); do i= 1 to nr; if y[i] < 0.5 then do; y_initial[i] = -1; end; else do; y_initial[i] = 1; end; end; rankx =round(trace(ginv(X)*X)); if rankx < nc then do; beta_initial = J(nc,1,0); end; else do; beta_initial = ginv(X`*X)*X`*y_initial; end; ns=50; best=5; count = j(ns,1,0); G_optimal_b =j(best,nc,0); G_optimal_W = j(nr,best,0); G_optimal_expD = j(nr,best,0); G_optimal_ll = j(best,1,-1.0E10);

    Lanjutan Lampiran 5

  • 55

    /* Repeat Step 1 and Step 2 500(ns) times */ do s = 1 to ns; * ns - number of new beginnings; * Step 1 : construct an initial g-subset using method (b) i.e. starting from a random nc-subset; * Step 1a: starting with a nc-subset (method(B)); count_loop1=0; reason="false"; rc=0; g_constant=Round((nr+nc+1)/2);*tambahan; a=nc+count_loop1; do while (reason="false" & (a

  • 56

    expDG=exp(D_G); D_ordered = j(nr,1,0); rnk=rank(expDG); D_ordered[rnk]=expDG[]; w=j(nr,1,1); do i =1 to nr;if rnk[i] = min_LL then do; G_optimal_ll[min_index] = LL_opt; G_optimal_b[min_index,] = bopt_G; G_optimal_W[,min_index]=W_g[]; do kkk=1 to nr; G_optimal_expD[kkk,min_index]=exp(D_G[kkk]); end; end; *Step 3: for the 10 best results - carry out C-steps until convergence - keep the BEST solution!!!; BestG_optimal_b =j(nc,1,0); bestG_optimal_W = j(nr,1,0); bestG_optimal_expD = j(nr,1,0); bestG_optimal_ll = -1.0E10; do kkk = 1 to best; stop = "no"; count_loop3 = 0; * Do until the W converge; do while(stop="no" & count_loop3 < 100); count_loop3 = count_loop3+1; opt=J(1,11,.) ; opt[1]=1; *max; opt[2] = 4; w_G=G_optimal_W[,kkk]; call nlpnra( rc, bopt_G, "f_TLR_G", beta_initial,opt,,,,, "gradG", "hessG") ; beta_initial = bopt_G; W_old = W; D_ordered = j(nr,1,0); rnk=rank(D_G); D_ordered[rnk]=D_G[]; w=j(nr,1,1); do i =1 to nr;if rnk[i] = bestG_optimal_ll then do; bestG_optimal_ll = LL_opt; bestG_optimal_b = bopt_G; bestG_optimal_W=W_g; bestG_optimal_expD=exp(D_G); end; * end if sum_log_likelihood>ll; end; * end do list kkk=1 to best; end;

    Lanjutan Lampiran 5

  • 57

    *Our own final step; *after the loop where the best beta has been obtained for the g; start gradF (betaF) global (X,y,p_F,w_F); nr=nrow(X) ; nc=ncol(X) ; gF=j(1,nc,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaF[k]*X[n,k] ; end ; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc; do n=1 to nr; gF[k]=gF[k]+(y[n]-p_F[n])*w_F[n]*X[n,k]; end; end; return (gF); finish gradF; start hessF (betaF) global(X,p_F,w_F,hF); nr=nrow(X) ; nc=ncol(X) ; hF=j(nc,nc,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; do n=1 to nr ; do k=1 to nc ; logit[n]= logit[n]+betaF[k]*X[n,k] ; end ; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])) ;end ; do k=1 to nc ; do l=1 to nc ; do n=1 to nr; hF[k,l]=hF[k,l]-p_F[n]*(1-p_F[n])*x[n,k]*x[n,l]*w_F[n] ; end ; end ; end ; return (hF); finish hessF; start f_TLR_F (betaF) global(X,y,LL_optF,w_F,D_F,nr,nc); * initializing; sum_log_likelihood=0; D_F = J(nr,1,0); logit=J(nr,1,0) ; p_F=J(nr,1,0) ; * Maximum likelihood; do n=1 to nr; do k=1 to nc; logit[n]= logit[n]+betaF[k]*X[n,k]; end; if (-logit[n])>700 then p_F[n] = 0; else p_F[n]=1/(1+exp(-logit[n])); end; do i= 1 to nr; D_F [i] = (y[i]*log(max(1.0E-10,p_F[i]))+(1-y[i])*log(max(1.0E-10,1-p_F[i]))); sum_log_likelihood = sum_log_likelihood + w_F[i]*D_F[i]; end; LL_optF=sum_log_likelihood; return (sum_log_likelihood); finish f_TLR_F; w_now=bestG_optimal_W; count_loop5=0; expD = bestG_optimal_expD; stop = "no"; w_F=j(nr,1,1); logit_g=j(nr,1,0); p_g=j(nr,1,0); do ss=1 to nr;

    Lanjutan Lampiran 5

  • 58

    do kkkk=1 to nc; logit_g[ss]= logit_g[ss]+bestG_optimal_b[kkkk]*X[ss,kkkk]; end; if -logit_g[ss] > 700 then p_g[ss]=0; else p_g[ss]=1/(1+exp(-logit_g[ss])); end; mat_outlier=J(nr,2,0); do obs=1 to nr; mat_outlier[obs,1]=obs; mat_outlier[obs,2]=p_g[obs,1]; end; print mat_outlier; count_out = 0; do i=1 to nr; if y[i]>0.5 & p_g[i] < cut_off then do ;w_F[i]=eps; count_out = count_out+1;end; if y[i] (1-cut_off) then do ;w_F[i]=eps; count_out = count_out+1;end; end; beta_initial_F =bestG_optimal_b; original=j(nr,1,1); original=w_f; count_loop5 = count_loop5+1; beta_initial_F =bestG_optimal_b; opt=J(1,11,.) ; opt[1]=1; *max; opt[2]=4 ; *detail output; call nlpnra( rc, bopt_F, "f_TLR_F", beta_initial_F,opt,,,,, "gradF", "hessF") ; w_old = w_F; expD=exp(D_F); w_F=j(nr,1,1); logit_f=j(nr,1,0); p_f=j(nr,1,0); do ss=1 to nr; do kkkk=1 to nc; logit_f[ss]= logit_f[ss]+bopt_F[kkkk]*X[ss,kkkk]; end; if -logit_f[ss] > 700 then p_f[ss]=0; else p_f[ss]=1/(1+exp(-logit_f[ss])); end; count_out = 0; do i=1 to nr; if y[i]>0.5 & p_f[i] < cut_off then do ; w_F[i]=eps; count_out = count_out+1; print i; end; if y[i] (1-cut_off) then do ;w_F[i]=eps; count_out = count_out+1; print i; end; end; print count_out;

    Lanjutan Lampiran 5

  • 59

    F_optimal_b =j(nc,1,0); F_optimal_W_expD = j(nr,2,0); F_optimal_ll = -1.0E10; F_optimal_b = bopt_F; F_optimal_W_expD[,1] = w_F; do kkk=1 to nr; F_optimal_W_expD[kkk,2]=exp(D_F[kkk]); end; F_optimal_ll= LL_optF; w_final=w_F;

    Lanjutan Lampiran 5

  • 60

    Nomor Pengamatan yang Terdeteksi sebagai Outlier untuk Kabupaten Sukabumi (n=967) =0.01, C=0.01

    =0.01, C=0.05

    =0.01, C=0.10

    =0.05, C=0.01

    =0.05, C=0.05

    =0.05, C=0.10

    =0.10, C=0.01

    =0.10, C=0.05

    =0.10, C=0.10

    18 1 1

    NIHIL

    18 1

    NIHIL

    18 1 25 18 18 25 18 25 18 31 24 24 28 24 28 24 75 25 25 31 25 31 25184 28 28 56 28 56 28213 31 31 75 31 75 31 275 56 56 77 56 77 56 374 75 75 132 75 132