latn

Upload: alparselan

Post on 14-Jul-2015

111 views

Category:

Documents


9 download

TRANSCRIPT

METODE LATENT CLASS CLUSTERUNTUK VARIABEL INDIKATOR BERTIPE CAMPURAN DALAM RANGKA PENGELOMPOKAN DESA Oleh: ERNI HANIFAH 140720090028TESIS Untuk memenuhi salah satu syarat ujian guna memperoleh gelar Magister Statistika Terapan Program Studi Statistika Terapan Konsentrasi Statistika Sosial PROGRAM PASCASARJANA UNIVERSITAS PADJADJARAN BANDUNG2010METODE LATENT CLASS CLUSTERUNTUK VARIABEL INDIKATOR BERTIPE CAMPURAN DALAM RANGKA PENGELOMPOKAN DESA Oleh: ERNI HANIFAH 140720090028Untuk memenuhi salah satu syarat ujian guna memperoleh gelar Magister Statistika Terapan Program Studi Statistika TerapanTelah disetujui oleh Tim Pembimbing pada tanggal Seperti tertera di bawah ini Bandung,Agustus 2010 Gandhi Pawitan, Ph.D.Ketua Tim Pembimbing Gatot Riwi Setyanto, Drs, MSi.Anggota Tim Pembimbingii

PERNYATAAN Dengan ini saya menyatakan bahwa: 1. Karyatulissaya,tesisiniadalahaslidanbelumpernahdiajukanuntuk mendapatkangelarakademik(sarjana,magister,dan/ataudoktor)baikdi Universitas Padjadjaran maupun di perguruan tinggi lain. 2. Karya tulis ini adalahmurni gagasan, rumusan dan penelitian saya sendiri, tanpa bantuan pihak lain, kecuali arahan Tim Pembimbing. 3. Dalam karya tulis ini tidak terdapat karya atau pendapat yang telah ditulis ataudipublikasikanoranglain,kecualisecaratertulisdenganjelas dicantumkansebagaiacuandalamnaskahdengandisebutkannama pengarang dan dicantumkan dalam daftar pustaka. 4. Pernyataaninisayabuatdengansesungguhnyadanapabiladikemudian hariterdapatpenyimpangandanketidakbenarandalampernyataanini, makasayabersediamenerimasanksiakademikberupapencabutangelar yangtelahdiperolehkarenakaryaini,sertasanksilainnyasesuaidengan norma yang berlaku di perguruan tinggi ini. Bandung,Agustus 2010. Yang membuat pernyataan, (Erni Hanifah) NPM. 140720090028 iii

ABSTRAK Judul Tesis : Metode Latent Class Cluster Untuk Variabel IndikatorBertipe Campuran Dalam Rangka Pengelompokan DesaTertinggalKata Kunci :Latent Class Cluster, indikator campuran, desa tertinggal. AbstrakLatentclassclusterdigunakandalambidangsosialuntukmengelompokkan individuatauobjekkedalamkelas/kelompokyangberbedaberdasarkanrespons suatusetindikatoryangteramati(variabelmanifest).Dalampenentuandesa tertinggal,kemajuanatauketertinggalansuatudesatidakdapatdiukursecara langsung(disebutlatenvariabel),namunmelaluisejumlahindikator.Variabel indikatoryangdigunakanuntukmenentukanketertinggalandesamempunyai skalapengukuranyangbermacam-macam(campurankategoridankontinu). Metodeuntukmengelompokkanobjekbilamanavariabelnyabertipekombinasi campuran (diskrit dan kontinu) dan melibatkan suatu variabel laten dalam rangka pengelompokandesa,yaitudenganlatentclassclusteruntukvariabelindikator bertipecampuran.Modeldiestimasimenggunakanmaximum likelihooddengan algoritmaEM. Hasilnya, dengan menggunakan metode ini diperoleh 4 kelompok desa.AbstractLatentclassclusterareusedinsocialsciencesforclassifyingindividualsor objectsintodistinctgroup/classesbasedonresponsestoasetofobserved indicators(manifestvariables).Indeterminingtheunderdevelopedvillages,the progress or backwardness of a village can not be measured directly (called latent variables),butthroughanumberofindicators.Indicatorvariablesusedto determine the underdeveloped villages has a variety scale of measurement (mixed category and continuous). Amethodisusedtoclassifytheobjectwhenthevariableshavecombinationsof type(discreteandcontinuous)andinvolvesalatentvariableinthecontextof villagesgrouping,namelythelatentclassclusterformixed-typeindicator variables.ModelsareestimatedusingmaximumlikelihoodwithEMalgorithm. The result, using this method is obtained four categories of villages. iv

KATA PENGANTAR Alhamdulillahirobbilaalamiin,pujidansyukurpenulispanjatkanke hadirat Allah SWT yang telah melimpahkan rahmat, taufik dan hidayah-Nya. Atas ijin dan kehendakNyalah penulis dapat menyelesaikan tesis yang berjudul Metode LatentClassClusterUntukVariabelIndikatorBertipeCampuranDalam Rangka Pengelompokan Desa. Proses penyusunan tesis ini tidak terlepas dari adanya bantuan, saran, dan doronganyangdiberikankepadapenulis.Olehkarenaitupadakesempatanini penulis mengucapkan terima kasih dan penghargaan setinggi-tingginya kepada: 1. BapakGandhiPawitan,Ph.D.selakuKetuaTimPembimbingdanBapak GatotRiwiSetyanto,Drs.,MSi.SelakuAnggotaTimPembimbingyang telahmeluangkanwaktudanpikiranuntukmemberikanbimbingan, arahan, koreksi dan saran dalam penulisan tesis ini. 2. BapakDr.HamonanganRitonga,M.ScdanIbuHj.AnnaChadidjah, Dra.,M.TselakuTimPengujiyangtelahmemberikansarandankoreksi dalam penyempurnaan tesis ini. 3. BapakSeptiadiPadmadisastra,Ph.DselakuKetuaProgramMagister Statistika Terapan Universitas Padjadjaran beserta staf pengajar yang telah memberikanilmudanpengalamannyaselamapenulismenyelesaikan studi.4. Pimpinan Badan Pusat Statistik (BPS) yang telah memberikan kesempatan kepadapenulisuntukmengikutipendidikanS2padaProgramMagister Statistika Terapan Universitas Padjadjaran. 5. SuamikutercintaPanularDinuSatomodanputrikutersayangAnnisa SekarPratiwiatasdoa,dukungan,kesabarandankasihsayangyang membuat penulis selalu mempunyai semangat. 6. Ayahanda,Ibunda,kakak,adik,sertakeluargabesartercintadiSalatiga danYogyakartayangsenantiasamemberikandukungandandoakepada penulis.v

7. Rekan-rekanseperjuanganangkatan2009ProgramProgramMagister StatistikaTerapanUniversitasPadjadjaranyangtelahmemberikan dukungan dan bantuan selama mengikuti studi. Jugakepadasemuapihakyangyangtelahmembantupenulisantesisiniyang tidak dapat disebutkan satu per satu. Semoga tesis ini dapat memberikan manfaat bagi semua pihak, khususnya bagi dunia perstatistikan. Bandung,Agustus 2010 Penulis vi

DAFTAR ISI HalamanLEMBAR PENGESAHAN ............................................................................... iPERNYATAAN ................................................................................................. iiABSTRAK/ABSTRACT..................................................................................... iiiKATA PENGANTAR ....................................................................................... ivDAFTAR ISI....................................................................................................... viDAFTAR TABEL............................................................................................... viiiDAFTAR GAMBAR ......................................................................................... ixDAFTAR LAMPIRAN....................................................................................... xBAB IPENDAHULUAN ........................................................................... 11.1Latar Belakang ........11.2Identifikasi Masalah ........41.3Tujuan Penelitian ........51.4Manfaat Penelitian ......51.5Batasan Masalah Penelitian ........5BAB IIKAJIAN PUSTAKA ...................................................................... 62.1Metode Penentuan Desa Tertinggal 2005 ...62.2Cluster Analysis ..........122.3Latent Class Analysis .........122.3.1Latent Class Cluster ..........132.3.2Model Latent Class Cluster untuk Indikator Kategori ..................................................................... 152.3.3Model Latent Class Cluster untuk Variabel Respon yang Kontinu .........162.3.4Uji Kecocokan Model .......................................................17vii

BAB IIILATENT CLASS CLUSTER UNTUK VARIABEL INDIKATORBERTIPE CAMPURAN...................................... 253.1Latent Class Cluster untuk Variabel Indikator Bertipe Campuran ...............................................................................253.2Penentuan Banyak Kelas .............333.3Klasifikasi Objek ....................................................................333.4Pemilihan Model .....................................................................353.5Estimasi Kesalahan Pengklasifikasian ....................................383.6Local Dependensi ...................................................................39BAB IVHASIL DAN PEMBAHASAN ......................................................414.1Variabel Yang Akan Digunakan .............................................414.1.1Variabel Latent Ketertinggalan Desa ..........................424.1.2Variabel Indikator Ketertinggalan Desa ......................424.2Eksplorasi Data .......................................................................444.3Pemilihan Model Latent Class Cluster ...................................514.4Bivariate Residual Untuk Model Terpilih ..............................574.5Output Parameter Latent Class Cluster ..................................584.6Mengklasifikasikan Desa Ke Dalam Cluster ..........................634.7Estimasi Kesalahan Pengklasifikasian ....................................65BAB VKESIMPULAN DAN SARAN .....................................................675.1Kesimpulan .............................................................................675.2Saran .......................................................................................69DAFTAR PUSTAKA......................................................................................70BIOGRAFI PENULIS .................................................................................................. 72LAMPIRAN ......................................................................................................73viii

DAFTAR TABEL HalamanTabel 4.1DaftarVariabelyangAkanDigunakanDalam PengelompokanDesaMenggunakanLatentClassClusteruntuk Variabel Indikator Campuran .....................................45Tabel 4.2Statistik Deskriptif untuk Variabel Kontinu ...........................48 Tabel 4.3Statistik Deskriptif untuk Variabel Kategori ...........................49 Tabel 4.4Alternatif Awal Model yang Terbentuk dari Pengolahan Data PotensiDesaDalamRangkaMengelompokkanDesa Menggunakan Model Latent Class Cluster............................... 55Tabel 4.5AlternatifModelyangTerbentukdariPengolahanData PotensiDesaDalamRangkaMengelompokkanDesa Menggunakan Model Latent Class Cluster............................... 57Tabel 4.6BivariateResidualsuntukModel5(Modeldengan4Cluster dan 2 Direct effect) .............................................................57Tabel 4.7NilaiEstimasiProbabilitasKelasLaten ,Model4-Kelas, Pengelompokan Desa ......................................................... 59Tabel 4.8NilaiEstimasiProbabilitasBersyaratVariabelManifestpada KelasLaten,untukVariabelNominaldanVariabelOrdinal ,sertaNilaiEstimasiRata-RatadanVarians untuk Variabel Kontinu Model 4-Kelas, Pengelompokan Desa .................................................................................60Tabel 4.9Hasil Pengelompokan Desa Model 4 Cluster ........................64 Tabel 4.10Classification Table untuk Model 4-Cluster ...........................65 ix

DAFTAR GAMBAR HalamanGambar 2.1Kerangka Pikir Penentuan Desa Tertinggal 2002..................... 7 Gambar 2.2Alur penghitungan Indeks Komposit Desa ...... 11 Gambar 4.1Alur Pemilihan Model Latent Class Cluster .........................52 x

DAFTAR LAMPIRAN HalamanLampiran 1.Pemilihan 23 Variabel .......................................................73 Lampiran 2.Langkah-langkah Pemilihan Model Latent Class Cluster...75 Lampiran 3.Hasil Pengelompokan Desa Model 4 Cluster.....................87 1

BAB I PENDAHULUAN1.1. Latar Belakang Isu kemiskinan merupakan fokus perhatian pembangunan di hampir semua negara.DiIndonesiamasalahkemiskinanmerupakansalahsatupermasalahan utamapemerintahyangdiprioritaskandalammenyusunstrategipembangunan. Upaya penanggulangan kemiskinan tentunya akan menjadi agenda penting dalam jangkawaktuyanglama.Pemerintahsecaraterusmenerusmelakukanberbagai upayauntukmengentaskankemiskinan.Olehkarenaituadakebutuhanyang mendesak mengenai data tentang kemiskinan di Indonesia. Berkaitandenganupayapengentasankemiskinan,BadanPusatStatistik (BPS)berperandalammenyediakandatatentangkemiskinan,antaralaindengan melakukan penghitungan desa tertinggal pada tahun 1993, 1994 dan 1995 sebagai proksiidentifikasidaerahkantong-kantongkemiskinan.Padawaktuitu identifikasidesatertinggaldilakukandalamrangkaalokasidanaInpresDesa Tertinggal tahun anggaran 1994/1995, 1995/1996 dan tahun anggaran 1996/1997. (Badan Pusat Statistik, 2005) Penentuandesatertinggalseringkalidilakukandalamrangkatargetingpenyaluranbantuanpemerintah.Kebijakanyangbiasanyadiambiladalah penyaluran dana bantuan untuk pembangunan desa tertinggal dengan maksud agar desatersebutdapatberkembangsepertidesayangtidaktertinggal. 2

Untukitupenetapanstatusdesatertinggaldiharapkandapatmenjadimanifestasi suatu ukuran yang mengidentifikasikan daerah kantong-kantong kemiskinan. Desatertinggaladalahdesa-desayangkondisinyasecaraekonomirelatif tertinggaldibandingkandesa-desalainnya.Kemajuanatauketertinggalansuatu desadicerminkanolehindikatorutama,yaitutinggirendahnyarata-rata pengeluaran per kapita penduduk desa. Beberapa faktor diduga menjadi penyebab kemajuanatauketertinggalansuatudesa,yaitu1)faktoralam/lingkungan,2) faktorkelembagaan,3)faktorsarana/prasaranadanakses,serta4)faktorsosial ekonomi penduduk. (Badan Pusat Statistik, 2005) Padatahun2003BPSkembalimelakukanpenentuandesa-desatertinggal denganmembuatindekskompositketertinggalandesaberdasarkanpadadata PotensiDesaSensusPertanian(Podes-ST)2003.Penentuandesatertinggalini menggunakan dua sumber data, yaitu Podes-ST 2003 dan Survei Sosial Ekonomi Nasional (Susenas) 2002, dengan menggunakan 45 variabel.MelaluidataPODESST03diperolehinformasipentingtentangkondisi suatudesasepertipotensialamnya,potensikependudukandanketenagakerjaan, kondisiperumahandanlingkungandidesa,fasilitaspendidikanyangtersediadi desa, kondisi politik dan keamanan di desa, dan potensi desa lainnya. Sedangkan daridataSUSENAS2002dapatdiketahuitingkatkesejahteraanpendudukdari segi konsumsi. Untukpenentuanketertinggalandesa,penelitiandiawalidengan menyeleksivariabel-variabelyangdidugamenjadifaktorpenentuketertinggalan desa.Metodepenelitianyangdigunakandiantaranyaadalahujivaliditas,metode 3

stepwisediscriminantanalysis,ujikolinieritas,sertapengukurantingkat reliabilitas.KemudiandilakukanUjiTukeysebagaipedomanreklasifikasidan rescoringkondisidesa.Selanjutnyadihitungindekskomposityang menggambarkan kondisi tiap-tiap desa. Dalampenentuanindekskompositketertinggalandesa,tampakbahwa kemajuanatauketertinggalandesatidakbisadiukursecaralangsung (unobservable)ataudisebutdenganlaten.Sedangkanvariabel-variabelpenentu ketertinggalan desa sebagai variabel observed yang diambil dari data PODES ST-2003memilikiskalapengukuranyangberanekaragam,baikberskalanominal, ordinal, inteval maupun rasio.Sementaraitureklasifkasidanrescoringkondisidesamembuatvariabelkategoridankontinumenjadivariabelkategori.Reklasifikasidanrescoringkondisidesamerupakansuatutransformasidarivariabelyangdiamati. Transformasibisamenyebabkanhilangnyabeberapainformasidarivariabel tersebut.Sehinggabisasajamenimbulkanketidaktepatanjikadilakukan klasifikasi.Halinidisebabkankarenaadainformasiyanghilangdengan perubahan dari variabel kontinu menjadi variabel kategori. MenurutMoustaki(2006),transformasidarivariabelyangdiamatipada sekelompokdataadakemungkinanakanmemberikanpolahasilyangserupa dengandatayangtidakditransformasi.Tetapidalamkasusdimanatransformasi akan menyebabkan hilangnya beberapa informasi tidak terjadi jika dalam analisis digunakan tingkat pengukuran yang asli untuk setiap variabel. 4

Selainitu,denganindekskomposithanyadapatdibandingkan ketertinggalansuatudesadengandesalainnyatanpamengetahuisuatudesa termasukdalamkategoridesatertinggalatautidaktertinggal.Indekskomposit tidaksecaraspesifikmengkategorikansuatudesasebagaidesatertinggalatau tidaktertinggal.Untukdapatmengkategorikansuatudesatergolongkedalam desa tertinggal ataupun desa yang tidak tertinggal, diperlukan suatu metode untuk mengelompokkan desa berdasarkan ketertinggalan desa. BPSsebagaiinstansiyangbertugasmengumpulkan,mengolahdan menyajikandata,tentunyamemerlukanberbagaimetodeanalisisyangdapat menghasilkandatayangtepatdanakurat.Sehinggaperludicarisuatumetode pengelompokanobjekdimanavariabelnyamemilikitipecampuran(diskritdan kontinu) dan melibatkan suatu variabel laten.1.2. Identifikasi Masalah Indeks komposit tidak secara spesifik mengkategorikan suatu desa sebagai desatertinggalatautidaktertinggal.Untukdapatmengkategorikansuatudesa tergolong ke dalam desa tertinggal ataupun desa yang tidak tertinggal, diperlukan suatu metode untuk mengelompokkan desa berdasarkan ketertinggalan desa. Dalam penentuan desa tertinggal, kemajuan atau ketertinggalan suatu desa tidakdapatdiukursecaralangsung,namunmelaluisejumlahindikator(disebut variabellaten).Sementaraituvariabelindikatoryangdigunakanuntuk menentukanketertinggalandesamempunyaiskalapengukuranyangbermacam-macam(campurandiskritdankontinu).Reklasifikasidanrescoringdimana 5

variabelindikatorkontinudirubahmenjadivariabelindikatorkategorimembuat variabelkontinutidakdibedakan,dapatmenyebabkanadanyainformasiyang hilang dari data, sehingga dapat menimbulkan ketidaktepatan dalam analisis. Dengandemikiandapatdirumuskansuatupermasalahanbagaimana metodeuntukmengelompokkanobjekbilamanavariabelnyabertipecampuran (diskritdankontinu)danmelibatkansuatuvariabellatendalamrangka pengelompokan desa. 1.3. Tujuan Penelitian Adapuntujuanyangingindicapaipadapenelitianiniadalahmenentukan klasifikasidesaberikutkarakteristiknyadenganmenggunakanlatentclass analysis.1.4. Manfaat Penelitian Manfaat yang ingin dicapai dari hasil penelitian ini adalah: a. Mengembangkanwawasananalisisstatistikkhususnyalatentclass analysis untuk variabel indikator bertipe campuran. b. SebagaibahanmasukanmetodealternatifbagiBPSdalammembuat pengklasifikasian desa.1.5. Batasan Masalah Penelitian Dalampenelitianinimasalahdibatasipadapengelompokandesadi PropinsiSulawesiTengahpadatahun2003,menggunakandataPotensiDesa Sensus Pertanian (Podes-ST) 2003. 6

BAB II KAJIAN PUSTAKA Metodestatistikuntukpengelompokanobservasidikenaldengannama analisiskelompok.Analisiskelompokadalahanalisisstatistikyangbertujuan untukmengelompokkanobservasisedemikianhinggaobservasiyangberada dalam kelompok yang sama mempunyai sifat yang relatif homogen daripada data yangberadadalamkelompokyangberbeda,(KaufmandanRousseeuw(1990); Everitt (1993)).Analisiskelompokdapatdibedakanmenjadi2,yaitumetode interdependensi,dimanapengelompokandibentukhanyaolehvariabel dependennyasaja,danmetodedependensi,dimanapengelompokandibentuk karenaadanyahubunganantaravariabeldependendenganvariabel independennya.Analisiskelompokdenganmetodeinterdependensidiantaranya cluster analysis dan latent class analysis.Padababiniakandipaparkancriticalreviewtentangbeberapametode statistik yang dapat digunakan dalam pengelompokan diantaranya cluster analysisdan latentclassanalysissertadipaparkanmetodeyangdigunakanolehBPS dalam penentuan desa tertinggal 2005, yaitu indeks komposit ketertinggalan desa. 2.1 Metode Penentuan Desa Tertinggal 2005Penentuandesatertinggalseringkalidilakukandalamrangkatargetingpenyaluranbantuanpemerintah.Kebijakanyangbiasanyadiambiladalah7

penyaluran dana bantuan untuk pembangunan desa tertinggal dengan maksud agar desatersebutdapatberkembangsepertidesayangtidaktertinggal.Untukitu penetapanstatusdesatertinggaldiharapkandapatmenjadimanifestasisuatu ukuranyangmengidentifikasikandaerahkantong-kantongkemiskinan.(BPS, 2005)Desatertinggaladalahdesa-desayangkondisinyarelatiftertinggaldari desa-desalainnya.Kemajuanatauketertinggalansuatudesadicerminkanoleh indikator utama, yaitu tinggi rendahnya rata-rata pengeluaran per kapita penduduk desa.Beberapafaktordidugamenjadipenyebabkemajuanatauketertinggalan suatudesa,yaitu1)faktoralam/lingkungan,2)faktorkelembagaan,3)faktor sarana/prasaranadanakses,serta4)faktorsosialekonomipenduduk,seperti digambarkan pada kerangka pikir (Gambar 1). Gambar 2.1. Kerangka Pikir Penentuan Desa Tertinggal 2002 Kemudiankeempatfaktortersebutselanjutnyadijabarkanberdasarkan variabel-variabelyangadadalamdataPODESST03,yangtelahdiidentifikasi mencakup 45 variabel sebagai berikut: Desa tertinggal = Desa kantong kemiskinan Indikator Utama : Rendahnya rata-rata pengeluaran per kapita penduduk desa Faktor alam /Ling kunganFaktorKelemba gaanFaktorsarana/prasarana dan akses Faktorsosialekonomi penduduk8

a. Faktor Alam/ Lingkungan : X1: Rata-rata kedalaman sumber air tanah (sumur) X2: Kepadatan penduduk per km2X3:Keadaansebagianbesarsaluranpembuanganlimbahcair/air kotorX4: Desa/kelurahan rawan bencana gempa bumi X5: Letak desa terhadap hutan b. Faktor Kelembagaan: X6:Klasifikasidesa,yangterdiridariswadaya,swakaryadan swasembada. c. Faktor Sarana/ Prasarana dan Akses: X7:Jarakdarikantorkelurahankekantorkecamatanyang membawahi X8:Jarakdarikantorkelurahankekantorkabupatenyang membawahi X9:Jarakdarikantorkelurahankeibukotakabupaten/kotalain yang terdekatX10: Ketersediaan penerangan jalan utama X11: Ketersediaan sarana pendidikan X12: Ketersediaan sarana kesehatan X13: Ketersediaan tenaga kesehatanX14: Jenis permukaan jalan antar desa X15: Ketersediaan jalan yang dapat dilalui kendaraan roda empat X16: Ketersediaan Telepon umum koin/ kartu X17: Ketersediaan Wartel/ kiospon/ warpostel/ warparpostel X18: Ketersediaan Warung internet X19: Keberadaan Kantor Pos/ Pos Pembantu/ rumah posX20: Keberadaan Kelompok PertokoanX21: Keberadaan Bangunan Pasar Permanen/ Semi Permanen X22: Keberadaan Supermarket/ Pasar Swalayan/ Toserba X23: Keberadaan Bank X24: Penduduk memperoleh fasilitas perkreditan X25: Keberadaan Koperasi Non KUD lainnya d. Faktor Sosial Ekonomi Penduduk: X26: Persentase keluarga pertanian X27: Sumber penghasilan utama sebagian besar penduduk 9

X28: Persentase keluarga pengguna listrikX29: Bahan bakar yang digunakan sebagian besar keluarga X30: Tempat buang sampah sebagian besar keluargaX31: Tempat buang air besar sebagian besar keluarga X32: Persentase keluarga tinggal di bantaran/ tepi sungaiX33: Persentase keluarga yang tinggal di bawah tegangan tinggiX34: Persentase keluarga tinggal di pemukiman kumuhX35:Persentasekeluargayangtinggaldilokasirawanbencana tanah longsor X36:Persentasekeluargayangtinggaldilokasirawanbencana banjirX37:PersentasekeluargayangtinggaldilokasirawanbencanalainnyaX38: Persentase keluarga yang tinggal di kawasan hutan lindung X39: Persentase keluarga tinggal di lahan kritisX40: Keberadaan kasus busung lapar balitaX41: Keberadaan kasus busung lapar selain balita X42: Sumber air minum/ memasakX43: Sumber air untuk mandi/ cuciX44: Persentasekeluarga pengguna Televisi X45: Keberadaan pelanggan surat kabar Penetapanstatussuatudesa,apakahtermasukdesatertinggalataudesa tidaktertinggal,dilakukanmelaluipembangunansuatumodelyang menggambarkan tingkat kemajuan/ketertinggalan desa. Untuk membangun model desatertinggaldiperlukanduasumberdatayaitudataPODESST03dandata SUSENAS 2002.Pembentukanmodeldesatertinggal2005dilakukanmelaluibeberapa tahapseleksi,yaitu:UjivaliditasdenganmenggunakanSpearmanrank correlationcoefficient,ujisinifikansipengaruhvariabelXsecarabersama-sama terhadapvariabelYdenganmenggunakanProsedurStepwiseDiscriminant Analysis.SelanjutnyakepadaseluruhvariabelXyangvaliddansignifikans berpengaruhterhadapvariabelYdilakukanujicolinearityuntukmendeteksi adanyakorelasiyangkuatdiantaravariabelbebasXtersebut.Jikaterdapat 10

sepasang variabel X yang saling berkorelasi tinggi maka dilakukan eliminasi salah satuvariabelXyaitudenganmempertahankanvariabelXyangsecarasubtantif diperkirakan lebih berpengaruh terhadap Y. Selanjutnya jika ada variabel bebas X yang secara normatif diyakini merupakan penentu ketertinggalan desa tetapi tidak lolosseleksimakavariabelnormatiftersebuttetapdipertahankansebagaisalah satuukuranketertinggalandesameskipunhasilujisecarastatistiktidaknyata. Selanjutnyaditelitiseberapabesarkekuatanmodeltersebutuntukdigunakan sebagai ukuran ketertinggalan desa menggunakan uji reliabilitas ukuran. Uji Tukey dilakukan sebagai pedoman reklasifikasi dan rescoring kondisi desa. Rescoring kondisi desa dibedakan antara desa-desa Jawa-Bali dan desa-desa luarJawa-Bali.Pertimbangannyaadalahkondisisosialekonomimaupun infrastruktur di kedua wilayah tersebut relatif berbeda.Besarnya skor kondisi desa ditentukan oleh besarnya rata-rata pengeluaran perkapitapendudukdesayaitusemakintinggirata-ratapengeluaraanperkapita pendudukdesamakaskorkondisinyajugasemakinbagus.Karenaindeks kompositdesanantinyadisusundaripenjumlahanskortiap-tiapvariabelmaka desa-desa tertinggal adalah desa-desa yang memiliki indeks komposit rendah. 11

Penghitunganindekskompositdesadilakukanuntukdesaperkotaandan pedesaan sebagaimana digambarkan pada Gambar 2.2 berikut: Gambar 2.2 Alur Penghitungan Indeks Komposit Desa Berdasarkan model desa tertinggal dan skor kondisi desa yang dihasilkan, dengan menggunakandataPODESST03selanjutnyadihitungindekskomposityang menggambarkankondisitiap-tiapdesa.Mengingatjumlahvariabelpembentuk indeksantaradesaperkotaanmungkinberbedadengandesapedesaan,untuk keterbandinganantarwilayah,indekskomposittersebutselanjutnyaditimbang denganjumlahvariabelpembentukindeks.Sejalandenganotonomidaerah, penyajian indeks komposit ini selanjutnya diurutkan per kabupaten/kota. Dariuraiandiatas,tampakbahwadalamidentifikasidanpenentuandesa tertinggal2005,BPSbelummelakukanpengelompokandesatertinggal,hanya Data PODES ST03 Model Desa Tertinggal 2002(untuk Desa dengan Status Perdesaan)IndeksKomposit Desa (Kota)Indeks Komposit Desa (Desa) Indeks Komposit Diurutkan per Kabupaten/ Kota Model Desa Tertinggal 2002(untuk Desa dengan Status Perkotaan)12

sebatasmenentukanindekskompositketertinggalandesa,dandenganadanya reklasifikasi,variabelindikatorkontinudirubahmenjadivariabelindikator kategori sehingga variabel indikator kontinu tersebut tidak dibedakan. 2.2 Cluster Analysis Teknikpengelompokanyangdidasarkanpadakemiripanobyekadalah ClusterAnalysis.MenurutSharma(1996),clusteranalysisadalahsuatuteknik yang digunakan untuk menggabungkan observasi ke dalam kelompok sedemikian rupasehinggamasing-masingkelompokhomogenataumempunyaikarakteristik tertentudanobservasipadasuatukelompokberbedadariobservasipada kelompoklain.Clusteranalysisdidasarkanpadakemiripanobjekdengan menggunakan alat ukur jarak, sehingga individu yang dikelompokkan dalam satu kelompok adalah individu yang jaraknya berdekatan. Secara umum ada dua teknik didalamclusteranalysis,yaituteknikpengelompokanberhirarkidanteknik pengelompokan non hirarki contohnya K-Means Clustering.Cluster Analysis merupakan teknik pengelompokan yang didasarkan pada kemiripanobyekyangbersifatnonprobabilistik.Sedangkanteknik pengelompokanyangdidasarkanmodelstatistikayangbersifatprobabilistik dikenal dengan nama model latent class (LC). 2.3 Latent Class Analysis LatentClass(LC)analisisdiperkenalkanpadatahun1950olehLazarfeld (dalamVermuntdanMagidson,2003),sebagaisuatualatuntukmembangun tipologi (pengklasteran) berdasarkan pada variabel dikotomus yang diamati. Pada 13

tahun1968,LazarfelddanHenry(dalamVermuntdanMagidson,2004) memperkenalkanmodelLCsebagaisuatucarauntukmemformulasikanvariabel laten dari survey dengan item dikotomus. IdeyangmendasariLatentClass(LC)Analysissangatsederhana,yaitu beberapaparameterdarimodelstatistikyangdipostulatkanberbedapadasub groupyangtidakteramati(laten).Subgroup-subgroupinimembentukkategori dari variabel latent kategorik. Diluar ilmu sosial, model LC sering mengarah pada finitemixturemodels.ModelLCdanfinitemixturemodeldipahamiterutama sebagai alat untuk menganalisis data kategorik (Vermunt dan Magidson, 2003).LCmodelmengasumsikanbahwavariabellatenadalahkategorik (VermuntdanMagidson,2004).LCmodeltidaktergantungpadaasumsi pemodelantradisionalyangseringdilanggardalampraktek(misalnya:hubungan linear,distribusinormal,homogenitas).Dengandemikianakanlebihsedikitbias yang berhubungan dengan data yang tidak sesuai dengan asumsi model. (Vermunt dan Magidson, 2002). 2.3.1 Latent Class Cluster Modellatentclassclusterdigunakandalamilmu-ilmusosialuntuk mengklasifikasikanindividuatauobjekkedalamkelompok/kelasyangberbeda berdasarkanpadaresponuntuksekumpulanindikatoryangdiamati.Tujuandari analisis latentclassclusteradalahpertamauntukmengidentifikasijumlahkelas yangdibutuhkan untukmenjelaskanhubunganantaravariabel-variabelyang 14

diamatidankeduauntukmengalokasikanresponden/ objekkedalamkelas laten. (Moustaki dan Papageorgiou, 2004) Latent class cluster memiliki banyak kesamaan dengan metode klasifikasi untukdatamultivariatsepertianalisiscluster.Perbedaanutamadengan teknik tersebutdiatasadalahbahwalatentclassclusteradalahpendekatan berbasis modelyangmemberikankemungkinanuntukmengujikesesuaian antara model secara statistik. Sedangkan analisis cluster yang berdasarkan ukuran jarak dan kesamaan menjadi terbatas digunakan. Padaprinsipnya,LatentClass(LC)ClusterAnalysistidakjauhberbeda dengan K-MeansClusterAnalysis,yaitumengelompokkansejumlahobjekyang terdekatdenganpusatkelompoknyasehinggajaraksetiapindividukepusat kelompok dalam satu kelompok adalah minimum. Perbedaannya adalah, jika pada K-Means Cluster digunakan pendekatan jarak untuk menyatakan kedekatan objek padapusatnyasedangkanpadaLCClustering,untukmenyatakanbahwasatu objekdekatdenganpusatnyadidasarkanpadaprobabilitaspengelompokkan posterioryangdiestimasimelaluimetodemaximumlikelihood(ML)(Magidson dan Vermunt, 2002). Perbedaan penting yang lain antara teknik cluster analysis dan latent class clusteradalahbahwalatentclassclustermerupakansuatupendekatan berdasarkan model. Ini berarti bahwa model statistik dipostulatkan untuk populasi dimana data sampel didapatkan (Vermunt dan Magidson, 2002). 15

2.3.2 Model Latent Class Cluster untuk Indikator Kategori Menurut Vermunt dan Magidson (2005) model latent class cluster dengan tiga indikator kategori (T = 3) adalah sebagai berikut: dimana indikator , dandiasumsikansalingindependenuntukmasukkedalam kelas tertentu. Kendala independen bersyarat ini seringkali mengarah pada asumsi local independence.PenelitianyangdilakukanolehMansur(2009)menggunakanlatentclass clusterpadasubjekpenerimaBantuanLangsungTunai(BLT)rumahtangga miskinmenggunakanindikatorberskalaordinal.Hasilpengklasteran menghasilkanmodel3clusterdenganinterpretasisubjekpenerimaBLTdapat diklasifikasikanmenjadirumahtanggasangatmiskin,miskindanrumahtangga hampir miskin. 16

2.3.3 Model Latent Class Cluster untuk Variabel Respon yang Kontinu MenurutVermuntdanMagidson(2002dan2004),analisislatentclasssebagai suatu alat untuk analisis cluster dengan indikator kontinu mengasumsikan variabel-variabelkontinutersebutberdistribusinormaldidalamkelaslaten. Bentukmodellatentclassuntukvariabelkontinudimanamasing-masingkelas latenmempunyaisekelompokmeans,variansdancovariansadalahsebagai berikut: menggambarkan distribusi dari random variable x, yang tergantung pada suatukelompokparameteryangtidakdiketahui,. Distribusidarixini merupakandistribusisuatukelasdenganrata-ratatertimbang,dimanaproporsi kelas laten sebagai penimbang. adalah probabilitas untuk berada di dalam kelas laten t. adalahdistribusidarixdidalamkelaslatentdiberikanbeberapa parameteryangtidakdiketahui, uan .Dengan melambangkanvektor denganrata-ratakelastertentu,danadalahmatriksvarianskovarianskelas tertentu. MenurutVermuntdanMagidson(2004),dalamlatentclassclusteruntuk variabelindikatorkontinu,tidaklahpentinguntukmengasumsikanlocalindependence diantara indikator.17

2.3.4 Uji Kecocokan Model Ujikecocokanmodeluntuksebuahmodellatentclassclusterdilakukan melalui pengujian hipotesis yang dapat dirumuskan sebagai berikut:H0: model cocok dengan data H1: model tidak cocok dengan data Adapun statistik uji yang digunakan adalah: 1. Statistik Pearson Chi Squared ()Statistik Pearson Chi Squared () adalah sebagai berikut: dengan adalahjumlahobservasipadaselke-(i,j)danadalah frekuensiyangdiharapkan .StatistikPearson Chi Squared mempunyai nilai minimum 0, ketika . Untuk ukuran sampel yang tetap, perbedaan dan yang besar akan menghasilkan nilai yang lebih besar dan semakin kuat menolak hipotesis nol.Statistik mendekati distribusi chi squared untuk ukuran sampel yangbesar,denganderajatbebassamadenganperbedaanantarajumlah parameter pada hipotesis alternatif dan hipotesis nol. 18

2. Statistik Rasio Likelihood (Metoderasiolikelihoodmenentukannilaiparameteryang memaksimumkan fungsi likelihood di bawah asumsi bahwa H0 benar. Ini juga menentukan nilai bahwa memaksimumkannya dibawah kondisi yang lebihumumbahwaH0mungkinbenaratautidakbenar.Ujiini berdasarkan pada rasio dari maximum likelihood, yaitu: ketika paiametei memenuhi B uibawah BUjistatistikuntukujirasiolikelihoodsamadengan-2log(),disebut denganStatistikRasioLikelihood(yangdapatdituliskansebagai berikut: dimanaNmenunjukkanukuransampeltotal,adalahjumlahobservasi padapolaresponke-i, adalahprobabilitaspolaresponke-i, sehingga adalah estimasi jumlah observasi pada pola respon ke-i.Seperti pada , mempunyai nilai minimum 0, ketika (dimana disini dan )dansemakinbesarnilaiL2,semakin ada bukti untuk menolak hipotesis nol. Jumlahderajatkebebasan(df)adalahjumlahseldalamtabelfrekuensi minussatu(ataudapatdirumuskansebagai ),dikurangi 19

jumlahparameterindependen.Secarakeseluruhan,dapatdituliskan dengan: DenganCadalahbanyaknyakelaslaten,adalahbanyaknyakategori pada variabel indikator ke-l . SelainmenggunakanStatistikPearsonChiSquaredataustatistikrasio likelihood,untukmemilihmodelyangterbaikbisadigunakankriteriastatistik, diantaranya Bayesian Information Criteria (BIC). Bayesian Information Criteria (BIC) adalah sebuah kriteria statistik untuk memilihmodel.NilaiBICmencerminkanpeningkatannilaijumlahkuadrat residual dan jumlah parameter dari model yang digunakan. Variasi yang tidak bisa dijelaskanolehmodelmengakibatkanpeningkatanBIC. Model dengan nilaiBIC yanglebihkecildipilihsebagaimodelyangterbaik,karenanilaiBICyanglebih kecilmenunjukkanbahwamodelyangdihasilkanlebihbisamenjelaskanvariasi dari data. Ada beberapa formula BIC yang sering digunakan, diantaranya: ln Dengan N adalah jumlah observasi, df adalah jumlah derajat bebas, dan adalah statistik rasio likelihood.BIC yang dihitung berdasarkan log likelihood dirumuskan sebagai berikut: ln 20

denganLLadalahnilaimaksimumfungsilog likelihooddarisuatumodelyang diestimasi, N adalah jumlah observasi, dan M adalah jumlah parameter. Untuk memilih model yang terbaik pada latent class cluster untuk variabel kontinu,StatistikPearsonChiSquared()danStatistikRasioLikelihood(tidakdapatdigunakan.Ketikamodellatentclassdigunakanuntukvariabel kontinu, maka tabel frekuensi pola respon menjadi langka karena jumlah total sel dalamhasiltabelfrekuensimultiarahakanbesarsecararelatifterhadapukuran sampel,menghasilkanbanyakselkosong.MenurutVermuntdanMagidson (2004),dalamsituasiyangmelibatkandatayanglangka,distribusichisquaretidakdigunakanuntukmenghitungp-valuekarenaL2tidakterestimasidengan baik.Dalammodellatentclassclusteruntukvariabelindikatorkontinu,untuk memilihmodelyangterbaikhanyadapatdigunakanmodelselectioncriteriasepertiAIC(AkaikeInformationCriteria)danBICyangdirumuskansebagai berikut:AIC = -2 [max L] + 2m(2.8)BIC = -2 [max L] + 2m log(n) (2.9) dengan m adalah jumlah parameter model. Selaindapatdigunakanuntukmengevaluasikecocokanmodel,AICdan BIC juga dapat digunakan untuk membandingkan model. Model dengan nilai AIC atau BIC terkecil diambil menjadi yang terbaik. 21

Latent class clustering sebagai suatu metode pengklasifikasian objek yang menggunakanmodelstatistikmempunyaibeberapakelebihansebagaiberikut (Vermunt dan Magidson, 2002): 1. Kriteriapemilihanclusterlebihjelasdanpendekatannyamemasukkan pengujian statistik yang kuat.2. Latentclassclusteringsangatfleksibeluntukbentukdistribusiyang sederhanaatauyangrumit,dapatdigunakanuntukvariabelobserveddi dalam cluster.Sepertididalammodelstatistik,pembatasandapatditerapkanpada parameter untuk mendapatkan model yang lebih sederhana, dan pengujian formal dapat digunakan untuk mengecek validitasnya.3. Tidakadakeputusanyangharusdibuattentangpenskalaanvariabel observed.Sebagaicontoh,ketikabekerjadengandistribusinormaldenganvarians yangtidakdiketahui,hasilnyaakansamadenganketikavariabelnya dinormalkan.Inisangatberbedadenganmetodeclusternonhirarkikal standar, seperti K-Means, dimana penskalaan selalu dilakukan.4. Adakriteriayanglebihformaluntukmembuatkeputusantentangjumlah klaster.Hidayat(2009)membandingkanperformahasilklasifikasimenggunakan LatentclassclusterdanK-meansclusteringmenggunakandatasimulasi. Hasilnya, latentclassclustermempunyaibeberapakelebihandibandingkanK-22

means cluster yaitu pada latent class cluster ada patokan yang jelas berapa banyak kelompokyangakandibentuk(menggunakannilaiBIC,AICdanCAIC),dapat diaplikasikanpadadatadenganberbagaiskalapengukuran,tidakmemerlukan standarisasivariabel,tidakmemerlukananalisislanjutankarenakarakteristik objekdalamsatukelompokdapatdilihatdariestimasiparameternyasecara langsung.Dalampengklasifikasianseringkalijenisvariabeltidakselalusama. Metode-metodepengelompokanobjekyangtelahdipaparkandiatastidakbisa digunakanuntukmemecahkanpermasalahanpengelompokandesadengan menggunakan variabel yang bertipe campuran (diskrit dan kontinu).Pemodelanlatenmencobauntukmengekstrakvariabellaten(tidak teramati), dari pengukuran pada variabel manifest (teramati) yang terkait. Metode untukmencocokkanmodelvariabellatenpadadatamanifestsecarakategoris adalahanalisislatentraitdanlaten classsedangkanuntuksecarakontinuadalah analisis faktor dan analisis laten profil.Beberapapenelititelahmenempatkan modellatenclasskedalam kerangkalog-linier,salahsatunyaVermuntdanMagisdon(2000) yang mengharuskansemuavariabeladalahberasaldari kategori.Latentclassclusterdalambentukyanglebihklasiktelahdibahasuntukclusteringvariabelbiner, nominalataumetrikdiBartholomewdanKnott(1999) danuntukclusteringdengandatacampurandiEveritt(1988),EverittdanMerette(1990)dalam Moustaki (2004) dan Moustaki (1996). 23

Everitt(1988)danEverittdanMarette(1990)dalamMoustaki(1996) telahmelakukanpenelitiandenganmasalahclusteringdatacampuran.Mereka menggunakankeduametode,yaitumetodemaximum likelihoodyang mengasumsikanbahwavariabelkategoriyangdiamatidihasilkanolehvariabel underlyingkontinudanmetodeclusteringhirarkitradisionalseperticomplete linkage, group avarege dan metode Ward's. Dengan menggunakan hasil simulasi, merekamenemukanbahwametodeclusteringhirarkimemilikikinerjayang kurangmemuaskandibandingkandenganmetodamaximum likelihood.Namun estimasimodeldenganmaximum likelihoodmembutuhkanevaluasiintegral multidimensi dan terbatas hanya satu atau dua variabel kategori. Dalammenggunakanlatentclassclusteruntukmenganalisishubungan antarasekelompokvariabelmanifestcampuranmenggunakansatuataulebih variabellaten,Moustaki(1996)menggunakanalgoritmaEMyangsecara komputasi sangat efisien. Kelompok variabel manifest berisi item metrik (kontinu atau diskrit) dan biner. Perumusan latent class cluster yang dilakukan oleh Moustaki (1996) tidak mengasumsikanbahwavariabelbinerdihasilkanolehunderlyingvariabeltetapi menganalisisvariabelyangdiamatisebagaimanaadanya.Sehinggametode tersebuttidakmelibatkanintegrasinumerikdanmempercepatprosedurestimasi serta dapat melibatkan sejumlah besar variabel observed biner dan kontinu untuk dianalisa. Penelitian yang dilakukan Moustaki dan Papageorgiou (2004) memperluas latenclassclusteruntukvariabelcampuranbinerdanmetrikdengan 24

mengakomodasisemuajenisdata(termasukordinaldannominal)dan menggunakannyadalamArchaeometryuntukmengklasifikasikan penemuan/objectsarkeologimenjadikelompok-kelompokyangdibahas. Model yang diusulkan dihitung menggunakan full maximum like-lihood dengan algoritma EM. Metodeyangdisajikanditerapkanuntukvariabeldengankategoricampuran (nominal dan ordinal) dan variabel metrik.Modelyangdisajikanditerapkanuntukduasetdatadaripenelitian arkeologi(TerracotadanCanSora)danhasilnyamenunjukkanbahwateknik clusteringberdasarkanmodeluntukvariabelcampurandapatsangatberguna untukmembangunkelompok-kelompokyanghomogendariobjek. Metodeyang diusulkanmenghindaripenggunaanukurankesamaandanjarakyangarbiter khususnyapadavariabelindikatorcampuransertapilihanyangarbiteruntuk jumlah kelompok. DengancaraberpikirsepertiMoustaki(2004),makadalampenelitianini akandigunakanmetodeuntukpengelompokandesatertinggaldengan menggunakan latent class cluster untuk variabel indikator bertipe campuran. 25

BAB III LATENT CLASS CLUSTER UNTUK VARIABEL INDIKATORBERTIPE CAMPURAN Latentclassclusterdigunakandalamilmu-ilmusosialuntuk mengklasifikasikanindividuatauobjekkedalamkelompok/kelasyangberbeda berdasarkanpadaresponuntuksekumpulanindikatoryangdiamati. Latentclass cluster untuk variabel campuran biner dan metrik diperluas untuk mengakomodasi semua jenis data (termasuk ordinal dan nominal). Model yang diusulkan dihitung menggunakanmaximumlikelihooddenganalgoritmaEM. (Moustakidan Papageorgiou, 2005).Padababiniakandiuraikanmetodelatentclassclusteruntukvariabel indikator bertipe campuran. 3.1 Latent Class Cluster Untuk Variabel Indikator Bertipe Campuran Modelkelaslaten yangdigunakanolehMoustakidanPapageorgiou (2005) adalah sebagai berikut: Misalkan(x1,x2,,xp)menunjukkanvektordaripvariabelmanifest dimanamasing-masing variabelmemilikidistribusibersyaratdalamkeluarga eksponensialsepertiBernoulli, Poisson,Multinomial,Normal.VariabelXdapat memiliki jenis yang sama, baik diskrit atau kontinu ataupun kombinasi dari kedua jenis tersebut. Misalkan xih menjadi nilai elemen sample/objek ke h untuk variabel 26

ke i, (h = 1, 2, n). Baris vektor disebut sebagai pola respon dari objek ke h. Variabelkategoridapatberupanominalatauordinal. Dalamlatentclass cluster,diasumsikanbahwafactorspaceterdiridariKkelas. Untuk masing-masingkelasjadaprobabilitasyangbersesuaian,. Halinimengarahpada probabilitas priorkarenamemberikanprobabilitasprioruntukmengamatidata x. Distribusibersamadarivariabel-variabelyangdiamatiadalahprobabilitas campuran: Dengan adalah fungsi distribusi dari variabel manifest, yang dapat berupa variabel biner, ordinal, nominal dan kontinu. Untukvariabelbineryangmengambilnilai-nilai0dan1makadistribusi Bernoulli adalah sebagai berikut: di mana menunjukkan probabilitas bahwa sebuah obyek yang termasuk dalam kelasjakanmemiliki karakteristikdinotasikandenganvariabelke- .Untukvariabelnominal,dalamkasuspolytomousvariabelindikatordigantikanoleh sebuahfungsiindikatorvektor-nilaidenganelemenkes 27

didefinisikan sebagai: 1 jika respon jatuh dalam kategori s, untuk s=1, , ci,dan untuk lainnya, dimana ci menunjukkan jumlah kategori variabel ke-i dan .Pola respon dari objek ditulis sebagai sebagai dimensi . Probabilitasrespontunggal()darikasusbinerdigantidengansatuset fungsi dimana .Distribusidiasumsikan multinomial: , (3.3) dimana adalah probabilitas bahwa sebuah objek yang berada di kelas j akan masuk kategori s untuk variabel ke-i.Untukvariabelordinal,variabelindikatordidefinisikansepertipada kasus nominal. Kategori urutan (order) memiliki probabilitas yang merupakanfungsikelaslatenj. Untukmenjagaurutandarivariabel,probabilitaskumulatifdarirespondimodelkansepertidibawahinidan memasukkan kategori s sebagai . dimana j = 1,,K dan s = 1,, mi.UntukvariabelmanifestXidistribusibersyaratdariadalah multinomial yang diberikan oleh 28

di mana jika objek yang dipilih secara acak termasuk ke dalam kategori s dari variable ke I dan untuk sebaliknya. Untukvariabelkontinu,makadistribusinyaadalahnormal,sebagai berikut: , (3.5) dimanaadalahparameterlokasivariabelkontinudikelasjdan adalah varians dari variabel ke i.Sementara itu, untuk mengklasifikasikan suatu objek ke dalam suatu kelas, ataudengankatalainsuatuelemenmilikkelasjjikadiketahuixadalah probabilitas posterior yang merupakan distribusi bersyarat, , dapat ditulis sebagai berikut: (3.6)Untukmengestimasiparametermodelvariabellatenadaduapendekatan. Pertamaadalahpendekatanunderlyingvariabelyangmemperlakukansemua variabelyangdiamatisebagaivariabelkontinudenganmengasumsikanbahwa yangmendasarisetiapvariabelkategoriyangdiamatiadavariabelkontinuyang 29

tidakteramati.Kedua,pendekatanfungsiresponyangdimulaidengan mendefinisikan untuk setiap individu dalam sampel, probabilitas merespon secara positifkesuatuvariabeldiberikanposisiindividupadaruangfaktorlaten. (Moustaki 1996) Penaksiranparameterpadalatentclassuntukvariabelindikatordengan tipecampuraninidigunakanmetodemaximumlikelihooddenganalgoritmaEM. Metodemaximumlikelihooddidasarkanolehideuntukmendapatkan estimatoryangmemaksimumkanfungsilikelihoodnya.Fungsilikelihoodmerupakanfungsidariparameter .JikaX1,X2,...,Xnsampelrandom yangdiambildaripopulasidengankepadatanpeluang f)makafungsi likelihood ) didefinisikan sebagai: Untukmendapatkanestimator,yaitu,perludicarisuatunilai yang memaksimumkan ).MenurutMoustaki(1996),karenasemuainformasiyangdimilikidalam haliniadalahdalamobservevariable,prosedurestimasididasarkanpada memaksimalkanlog likelihooddaridistribusimarginalobservevariable. Log-likelihood untuk suatu sampel acak berukuran n adalah: log 30

log Dimanavariabelyangdiamatidiasumsikanindependenbersyaratjikadiketahui masing-masing kelas j. Dengan dapatberupavariabelmanifestyangbertipebiner,nominal, ordinal, maupun kontinu, seperti pada Persamaan (3.2), (3.3), (3.4) dan (3.5) maka diperoleh persamaan sebagai berikut: DenganBadalahbanyaknyavariabelmanifestyangbertipebiner,Nadalah banyaknya variabelmanifestyang bertipe nominal, O adalah banyaknya variabel manifestyangbertipeordinaldanQadalahbanyaknyavariabelmanifestyang bertipe kontinu. Sehinggaprobabilitascampurandistribusibersamadarivariabel-variabel yangdiamati,yangdirumuskanpadaPersamaan(3.1)dapatdituliskansebagai berikut:31

Cara untuk mendapatkan nilai maksimum suatu fungsi yang paling sering digunakanadalahdenganderivatif.Tetapidenganmetodederivatifterkadang tidakbisamendapatkannilaioptimumsuatufungsilikelihood,sehingga penggunaanmetodeyanglainperludigunakanuntukmenyelesaikannya. Misalnya dengan analisis numerik (iteratif).Algoritma EM (Expectation Maximization) adalah sebuah prosedur iteratif untukmenghitungestimasiMaximum likelihoodparametermodelyang mengandungdatatersembunyiatauhilang.TiapiterasidalamalgoritmaEM terdiri daridua proses: E-Step dan M-step.Dalam tahapekspektasiatauE-Step, datahilangdiestimasiberdasarkandatayangdiobservasidariestimasiparameter modelyangtelahada.DalamtahapM-Step,fungsilikelihooddimaksimumkan dibawah asumsi bahwa data hilang telah diketahui. ParameterlatentclassclusterdihasilkandenganmemaksimalkanLog-likelihoodpadaPersamaan(3.7)denganmenggunakanalgoritmaEMdibawah kendalabahwa: .UntukkasusNominalditambahkankendala dan untuk kasus ordinal ditambahkan kendala .Persamaanmaximum likelihooddiperolehdariturunanparsialdari log-likelihood pada persamaan (3.7) terhadap parameternya, yaitu sebagai berikut: 32

Estimasi probabilitas prior kelas: x Estimasi probabilitas bersyarat bahwa pada kelas j untuk variabel biner: x Estimasiprobabilitasbersyaratbahwa padakelasjuntukvariabel nominal: x Taksirankumulatifprobabilitasbersyaratyangdengan padakelasjuntuk variabel ordinal: xEstimasi parameter untuk variabel metrik:berarti untuk j kelas: xdan varians pada setiap kelas: 33

x x Estimasi probabilitas posterior diperkirakan oleh AlgoritmaEMbekerjadimulaidenganmemilihnilaiawaluntuk probabilitas posterior , sehingga dengan menggunakan Persamaan (3.10) sampaidenganPersamaan(3.15),didapatkansebuahpendekatanpertamauntuk parametermodel.KemudiandenganmenggunakanPersamaan(3.16)diperoleh perkiraanbaruuntuk .SelanjutnyadigunakankembaliPersamaan (3.10) sampaidenganpersamaan(3.15)sehinggadiperolehpendekatankeduauntuk parameter model. Demikian seterusnya sampai tercapai konvergensi. 3. 2. Penentuan Banyak Kelas Latenclassclustermerupakansuatumetodepengklasifikasianobjek dimanabanyaknyakelasbelumdiketahui.MenurutMoustaki(2004),penentuan banyakkelasdilakukanbersama-samadenganpenentuanparametermodelyang diinginkan untuk menghindari refitting model yang terlalu sering. 3. 3. Klasifikasi Objek Klasifikasifinaldariobjekkedalamkelasolehmodeldidasarkan pada estimasiprobabilitasposterior.Sebuahobjeklebihmungkinmenjadi anggota kelas j dari kelas k jika .34

Dengan seperti pada Persamaan (3.16) sebagai berikut:

Dengan seperti pada Persamaan (3.8) dan seperti pada Persamaan (3.9) dengan menggunakan nilai estimasi dari masing-masing parameter

adalahestimasimaximum likelihooduntuk.Darisinidiperoleh informasitentangseberapabaikdapatdiprediksitermasukkekelaslatenyang manauntuknilai-nilaixyangdiamati.Suatudesadimasukkankedalamkelas laten dengan probabilitas klasifikasi laten tertinggi.

35

3.4. Pemilihan Model Pemilihan model dalam latent class cluster sebenarnya didasarkan kepada dua hal, yang pertama menyangkut keputusan tentang jumlah cluster, yang kedua menyangkut bentuk model, diberikan jumlah cluster.Bentukmodelpadajumlahclustertertentudapatdiujidengan menggunakanujirasiolikelihoodstandarantaramodelnested,misalnya,antara modeldenganmatrikskovariansitidakterbatasdanmodeldenganmatriks kovariansiterbatas.UjiWalddapatdigunakanuntukmenilaimasing-masing signifikansi syarat tertentu yang disertakan atau dikecualikan.MenurutVermuntdanMagidson(2004),dalamAnalisisLatentClass,variabelyangtidakmenunjukkanperbedaanyangsignifikansdiatarakelasdapat dihilangkandarimodel.Signifikansidarisekelompokparameterdapatdiuji dengan menggunakan statistik Wald. Uji Wald adalah suatu uji chi square, dengan jumlah derajat bebas sama dengan jumlah constrain.MenurutAgresti(2002),StatistikWalduntukmengujihipotesisnol , dengan standard error SE dari yang tidak nol, dirumuskan sebagai berikut:Statistik Walu Sedangkanpadamultivariat,Walduntukmenguji adalahsebagai berikut:36

yangmananonnullcovarians,dinyatakan berdasarkanpadalog-likelihood . Distribusi multivariat normal asymptotik untuk mengimplikasikan distribusi asymptotikchisquareuntuk.Derajatbebasnyaadalahjumlah parameter yang berbeda pada .Untuk masing-masing indikator, statistik Wald menguji estimasi parameter yangberhubungandenganindikatoradalahsamadengannol.Misalnyauntuk menguji apakah akan menghilangkan suatu variabel, misal variabel A dari model denganK-kelas,hipotesisnoladalahdistribusidiantaraIkategoridariAadalah identikdidalammasing-masingkelasj.UjiiniberdistribusiasymptotikChi squaredenganderajatbebas(I-1)*(K-1),dimanaIadalahjumlahkategoripada variabel nominal. Dalammemilihmodel,perludiperhatikanprinsipparsimoni,yaitu kesederhanaan.Modelyangbaikadalahmodeldenganjumlahparameteryang lebihsedikit.Banyaknyaparametersejalandenganjumlahkelaslaten.Model denganjumlahkelaslatenyangbesarakanmenyulitkandalaminterpretasidan analisis.Disampingitujugaperludiperhatikanperformadariklasifikasi,yang dapat dilihat dari classification error. Model yang baik mempunyai classification error yang kecil. MenurutMoustaki dan Papageorgiou (2005), ada tiga cara untuk melihat goodnessoffitdarimodellatentclass,yaitudenganmempertimbangkanukuran 37

goodnessoffitsecarakeseluruhan,menyelidikikinerjamodeldalammargin dengan order yang lebih rendah, dan penggunaan kriteria informasi. Salahsatucaramengukurkecocokanmodeladalahdengan mempertimbangkanukurangoodnessoffitsecarakeseluruhan. Untukmodel denganresponkategori, ChikuadratPearsonatauujirasiolog-likelihooddapat digunakanuntukmembandingkan frekuensiobservasipolaresponobyekdengan frekuensi yang diharapkan dengan model yang fit. Namun, ketika jumlah variabel manifestmeningkat, tabelfrekuensi polaresponmenjadilangkadanmembuatp-value dan uji rasio log-likelihood yang diperoleh tidak valid. Uji rasio log-likelihood tidak bisa digunakan untuk membandingkan model denganjumlah kelas yang berbeda karena uji bersyarat tidak mengikuti distribusi . Olehkarenaitu,alternatifnyaadalahdenganmenggunakankriteriaseleksi modelsepertiAICatau BIC. Sclove(1987)dalamMoustakidanPapageorgiou (2005)memberikantinjauanterhadapbeberapakriteriaseleksimodelyang digunakandalam analisismultivariatsepertiyangdikemukakanolehAkaike, Schwarz dan Kashap. Kriteria ini memperhitungkan nilai dari log-likelihood pada solusi maximum likelihooddanjumlahparameteryangdiestimasi. Untuk pemilihanmodel,digunakankriteriaAICdanBICsepertipadaPersamaan(2.8) dan(2.9).ModeldengannilaiAICatauBIC terkecildiambilmenjadiyang terbaik. MenurutVermuntdanMagidson(2004),kriteriainformasisepertiAIC, danBICinidapatdigunakansebagaipendekatanalternatifuntukmengevaluasi 38

kecocokanmodeldalamkasusdatalangka,dandapatdigunakanuntuk membandingkan model.Untukmemutuskankebaikanmodelmenjadilebihsulit ketikamodelnya adalahmodelcampuran. MenurutMoustaki(1996)untukmodelcampuran statistikrasiolikelihoodmaupunPearson()tidaksatupundapatlangsung diterapkan. Dalam kasus tersebut, kita bisa melihat goodness of fit secara terpisah untukmodelbagiankategoridanmodelbagianmetrik. Atau,kriteriapemilihan model dapatdigunakanuntukmemilihdiantarabeberapamodeldenganjumlah kelas yang berbeda. 3.5. Estimasi Kesalahan Pengklasifikasian MetodelainuntukmengevaluasimodelLCclusterdidasarkanpada ketidakpastian klasifikasi atau, dengan kata lain, seberapa baik pemisahan cluster. Diantaranya dengan perkiraan kesalahan pengklasifikasian. Probabilitasposterior()digunakanuntukmenghitungperkiraan proporsi classificationerror(E).Proporsiclassificationerrordidefinisikan sebagai: dengan adalah banyaknya desa yang mempunyai respon ke i.Tabelklasifikasimentabulasisilangmodalassignmentdanprobabilistikclassyangberisijumlahprobabilitasposteriorkeanggotaankelasjuntukkasus-kasus yang dialokasikan untuk modal kelas j. Oleh karena itu, elemen diagonal (j 39

=j)adalahjumlahklasifikasiyangbenarperkelaslatendanunsur-unsurselain diagonal(jj)adalahjumlahmisklasifikasiyangsesuai.Daritabelklasifikasi, selaindapatdilihatberapabanyakkasusyangmisklasifikasi(sepertiyang ditunjukkanolehproporsiclassificationerrorE),jugadapatdideteksijenis misklasifikasiyangpalingumum.Jikaentritertentu(j,j)denganjjadalah besar, ini berarti bahwa laten kelas j dan j tidak dipisahkan dengan baik.Sementara itu, total baris dari tabel klasifikasi merupakan estimasi ukuran kelas,sedangkantotalkolommenunjukkandistribusikelaslatenyangdiperoleh dengan class assignment.3.6. Local Dependensi AsumsilokalindependensiadalahasumsidasarpadamodelLatentClassstandar. Ketidakcocokan model Latent Class disebabkan oleh pelanggaran asumsi ini.MenurutVermuntdanMagidson(2005),jikaditemuiadanyalocaldependency, carauntukmelanjutkanadalahmenambahjumlahkelassampai didapatkanmodeldengankecocokanyangdapatditerima.Sebuahstrategi alternatifuntukmendapatkanmodelyangcocokadalahuntukmengendurkan asumsilokalindependensidenganmemungkinkanhubunganantaraindikator-indikator,sepertidenganmelibatkandirecteffectkedalammodel.BivariateResidualdapatdigunakanuntukmendeteksipasanganobservedvariableyang manayanglebihkuatberhubungandaripadayangdapatdijelaskanolehmodel yang dirumuskan. Selain kedua hal diatas, menurut Vermunt dan Magidson (2004), alternatif lainuntukmengatasilocaldependencyadalahdenganmenghilangkansatuatau 40

lebih indikator. Hal ini dapat dilakukan ketika ada 2 variabel yang menyebabkan adanya beberapa local dependency, atau ketika banyak variabel yang redundant.70

DAFTAR PUSTAKA Agresti,Alan.2002.CategoricalDataAnalysis,SecondEdition.NewJersey, John Willey & Sons, Inc. BadanPusatStatistik.2005.IdentifikasidanPenentuanDesaTertinggal2002.Jakarta: Badan Pusat Statistik. Celeux,G.,Biernacki,C.,&Govaert,G.(1997).ChoosingModelsinModel-BasedClusteringandDiscriminantAnalysis.TechnicalReport.Rhone-Alpes: INRIA. Dimulyo,Saparno(2009). PenggunaanGeographicallyWeightedRegression-KriginguntukKlasifikasiDesaTertinggal,SeminarNasionalAplikasi Teknologi Informasi 2009, Yogyakarta, 20 Juni 2009, hlm 71-77. Fraley,C.andRaftery,A.E.(2002).ModelBasedClustering,Discriminant Analysis,andDensityEstimation.JournaloftheAmericanStatistical Association, Vol.97, pp 611-631. Everitt, B.S. (1993). Cluster Analysis. London: Edward Arnold. Kaufman,L.DanRouseeuw,P.J.(1990).FindingGroupinData:An Introduction to Cluster Analysis. New York: John Wiley and Sons, Inc. Hidayat, Yayat (2009), Perbandingan Teknik Klasifikasi Latent Class Cluster dan K-Means, Tesis, Universitas Padjadjaran, Bandung. Mansur,AsepArifin(2009),AnalisisLatentClassClusterdalam Pengklasifikasian Subjek PenerimaBLT, Tesis, Universitas Padjadjaran, Bandung.Moustaki,Irini.(1996).ALatentTraitandaLatentClassModelforMixed Observed Variables. Journal of Mathematical and Statistical Psychology,Vol. 49, pp 313-334. Moustaki, I. and Papageorgiou, I. (2005) Latent class models for mixed outcomes withapplicationsinArchaeometry.ComputationalStatisticsandData Analysis, Vol. 48(3), 659-675 Sharma, Subhash (1996). Applied Multivariate Techniques. New York: John Willey and Sons, Inc. 71

Vermunt,JeroenK.danMagidson,Jay(2002).LatentClassClusterAnalysis, dalamAppliedLatentClassAnalysis,editedbyHagenaars,J.A.dan McCutcheon, A.L., Cambridge University Press.--------------.(2002).LatentClassModelsforClustering:AComparisonwithK-Means. CanadianJournalofMarketingResearch,Volume20(2002) 36-43.--------------.(2002).AnontechnicalIntroductiontoLatentClassModels.StatisticalInnovationWhitePaper#1, (http//www.statisticalinnovation.com). --------------.(2003).LatentClassAnalysis,artikeldalamEncyclopediaSocial Science Research Method. Sage Publication. --------------.(2004).LatentClassModels,dalamTheSageHandbookof Quantitative Methodology for The Social Sciences Chapter 10, 175-198, Thousand Oaks: Sage Publication. -------------.(2005).TecnicalGuideforLatentGold4.0:BasicandAdvance. Belmont Massachusetts: Statistical Innovation Inc. 72

BIOGRAFI PENULIS PenulislahirdiKabupatenSemarang,JawaTengahpadatanggal27 Oktober1982daripasanganMuhIrsamdanWiji.Merupakananakkeduadari tiga bersaudara. PenulismenamatkanSekolahDasardiSDNegeriSalatigaVIpadatahun 1994,SekolahMenengahPertamaNegeriIISalatigapadatahun1997,Sekolah MenengahUmumNegeriISalatigapadatahun2000.Kemudianpenulis melanjutkanpendidikandiSekolahTinggiIlmuStatistikdanluluspadatahun 2004.Tahun 2004 penulis diangkat sebagai Calon Pegawai Negeri Sipil (CPNS) danditempatkandiBadanPusatStatistik(BPS)KabupatenMinahasa,Sulawesi Utara. Tahun 2005 menjadi Pegawai Negeri Sipil (PNS), tahun 2007 ditempatkan diBPSKotaTomohon,SulawesiUtara,tahun2008pindahkeBPSKabupaten Tolitoli,SulawesiTengahdanmasihbekerjadiBPSKabupatenTolitolisampai dengan saat ini. Januari2008menikahdenganPanularDinuSatomodandikaruniai seorang putri, Annisa Sekar Pratiwi. Tahun 2009, penulis melanjutkan pendidikan S2diProgranMagisterStatistikaUniversitasPadjadjaranBandung.