pengembangan algoritma cat swarm optimization cso untuk klasifikasi

Upload: leositorus

Post on 27-Feb-2018

233 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    1/18

    PENGEMBANGAN ALGORITMA CAT SWARM OPTIMIZATION(CSO) UNTUK

    KLASIFIKASI

    Nalendra Dhanasaputra, Budi Santosa

    Jurusan Teknik Industri

    Institut Teknologi Sepuluh Nopember (ITS) SurabayaKampus ITS Sukolilo Surabaya 60111

    Email:[email protected]; [email protected]

    AbstrakBaru-baru ini ditemukan satu algoritma baru dalam teknik optimasi yang meniru perilaku hewan.

    Algoritma baru ini diusulkan oleh Shu Chuan Chu (2006) dan diberi nama Cat Swarm Optimization (CSO).

    Algoritma ini memiliki sejumlah kelebihan dalam menyelesaikan permasalahan-permasalahan optimasi

    dibandingkan dengan teknik-teknik yang terdahulu seperti Particle Swarm Optimization (PSO) dan PSO with

    Weighting Factor. Dalam penelitian ini, CSO diterapkan dalam data mining, khususnya untuk kasus klasifikasi.

    Teknik klasifikasi yang digunakan dalam penelitian ini adalah dengan pendekatan Multiple

    Regression Linear Model (MRLM). Dalam klasifikasi menggunakan pendekatan MRLM, CSO diterapkan untuk

    mengestimasi koefisien dari MRLM. Algoritma CSO dapat menghasilkan klasifikasi yang lebih baik dalam hal

    jumlah iterasi yang dibutuhkan untuk mencapai titik optimal dan memiliki tingkat akurasi yang lebih baikdibanding metode yang ada sebelumnya.

    Kata kunci:Cat Swarm Optimization, Klasifikasi,Multiple Regression Linear Model.

    AbstractRecently found a new algorithm optimization technique that mimics animal behavior. This new

    algorithm is proposed by Shu Chuan Chu (2006) and given the name Cat Swarm Optimization (CSO). This

    algorithm has a number of advantages in solving the problems of optimization techniques with tools such as

    Particle Swarm Optimization (PSO) and PSO with Weighting Factor.

    In this research, CSO is applied in data mining, particularly in the case of classification.

    Classification technique used in this research is Multiple Linear Regression Model (MRLM) approach. In the

    classification MRLM approach, CSO is applied to estimate coefficients of MRLM. With the CSO developed

    algorithm, which can produce better classification in terms of the number of iterations required to reach the

    optimal point and have a better level of accuracy than the previous method.

    Keywords: Cat Swarm Optimization, Classification,Multiple Regression Linear Model.

    1. Pendahuluan

    Baru-baru ini ditemukan satu

    algoritma baru dalam teknik optimasi yang

    meniru perilaku hewan. Algoritma baru ini

    diusulkan oleh Shu Chuan Chu (2006) dan

    diberi nama Cat Swarm Optimization (CSO).Algoritma ini memiliki sejumlah kelebihan

    dalam menyelesaikan permasalahan-

    permasalahan optimasi dibandingkan dengan

    teknik-teknik yang terdahulu seperti Particle

    Swarm Optimization (PSO) dan PSO with

    Weighting Factor. Selama ini, algoritma

    tersebut masih digunakan untuk unconstrained

    minimization problem dan belum pernah

    diaplikasikan di bidang lain. Akan menjadi

    sesuatu yang baru dan menarik jika penerapan

    CSO bisa diterapkan dalam data mining,

    khususnya untuk kasus klasifikasi.

    Konsep data miningsemakin populer

    sebagai alat manajemen informasi dimana

    diharapkan dapat mengungkap struktur

    pengetahuan yang bisa menuntun pengambilan

    keputusan. Jika jumlah atribut meningkat dan

    juga jumlah data bertambah banyak maka tugas

    pengambilan keputusan ini tidak bisa dilakukan

    secara manual atau sangat sulit dilakukan secara

    manual. Sehingga, alasan ongkos dan akurasimenjadi penting sehingga kita perlu

    mengembangkan metoda supervised learning

    ini dan menjalankannya lewat program

    komputer (Santosa,2006). Dengan

    dikembangkannya algoritma CSO, diharapkan

    dapat menghasilkan klasifikasi yang lebih cepat

    dan memiliki tingkat akurasi yang lebih baik

    dibanding metode yang ada sebelumnya.

    Klasifikasi bertujuan menempatkan

    data baru ke dalam kelas yang telah tersedia

    sebelumnya. Misalnya, sebuah bank ingin

    memprediksi apakah nasabah yang ingin

    meminjam uang patut untuk diberikan pinjaman.

    Pihak bank bisa memutuskan akan memberi

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    2/18

    pinjaman dengan melihat data-data yang

    dimiliki oleh nasabah, seperti data gaji,

    pengeluaran, lokasi tempat tinggal, jenis

    pekerjaan, umur nasabah, dan sebagainya.

    Dalam data mining, data-data tersebut

    dinamakan variabel.

    Permasalahan yang dihadapi dalam

    penelitian ini adalah bagaimana

    mengembangkan algoritma Cat Swarm

    Optimization sehingga dapat digunakan dalam

    kasus klasifikasi. Kemudian, untuk

    mengevaluasi hasilnya akan digunakan

    pendekatan lain sebagai pembanding.

    Dalam penelitian ini performansi

    algoritma CSO akan dilihat apakah dapat

    memberikan hasil yang baik untuk kasus

    klasifikasi seperti halnya performansi algoritmaCSO yang diterapkan pada kasus unconstrained

    minimization problem.

    Penelitian ini menggunakan data nyata

    yang telah umum digunakan dalam penelitian-

    penelitian seperti data Iris, data Breast Cancer,

    dan lain-lain.

    Laporan Tugas Akhir ini terdiri atas

    enam bab dengan sistematika penulisan sebagai

    berikut. Pendahuluan berisi tentang hal-hal yang

    mendasari dilakukannya penelitian serta

    pengidentifikasian masalah penelitian. Tinjauanpustaka menguraikan teori, temuan, dan bahan

    penelitian lain yang diperoleh dari acuan.

    Tinjauan pustaka akan menjadi landasan untuk

    melakukan kegiatan penelitian tugas akhir. Bab

    pengembangan model menguraikan metodologi

    penelitian yang dilakukan serta tahapan

    pengembangan model Cat Swarm Optimization

    untuk klasifikasi dua kelas. Pada bab pengujian

    model akan ditampilkan uji coba contoh

    numerik, data pengujian, serta bagaimana

    pengujian model dilakukan sesuai dengan

    kerangka penelitian yang telah dibuat. Babanalisis dan pembahasan akan dilakukan analisis

    terhadap hasil uji coba model. Analisis berisi

    uraian mengenai bagaimana model yang

    dikembangkan dapat memberikan perbaikan

    ataupun kelebihan terhadap model klasifikasi

    yang telah ada sebelumnya. Bab terakhir adalah

    kesimpulan dan sara yang berisi tentang

    kesimpulan hasil penelitian dan saran-saran

    yang berkaitan dengan penelitian selanjutnya.

    2. Tinjauan pustaka

    Tinjauan pustaka menguraikan teori,temuan, dan bahan penelitian lain yang

    diperoleh dari acuan yang akan dijadikan

    landasan untuk melakukan kegiatan penelitian

    tugas akhir.

    2.1Heuristic

    Mengutip dari situs

    whatis.techtarget.com, heuristic sebagai kata

    sifat adalah proses menggali pengetahuan atauhasil yang diinginkan dengan terkaan cerdas,

    bukan dengan mengikuti formula yang tetap.

    Heuristic memiliki 2 kegunaan:

    1. Menjelaskan pendekatan untuk belajardengan mencoba tanpa perlu memiliki

    hipotesis atau cara pembuktian bahwa hasil

    yang diperoleh akan menerima ataupun

    menolak hipotesis. Dengan kata lain,

    pembelajaran secara trial and error.

    2. Menyinggung pada penggunaanpengetahuan umum yang diperoleh melalui

    pengalaman. Misalnya pemain catur

    menggunakan pendekatan heuristic .

    Sebagai kata benda, heuristic adalah aturan

    spesifik atau argumen yang diturunkan dari

    pengalaman.

    2.2 Data Mining

    Pengenalan pola adalah suatu disiplin

    ilmu yang mempelajari bagaimana kita

    mengelompokkan obyek ke berbagai kelas dan

    bagaimana dari data bisa kita temukan

    kecenderungannya. Data mining adalah

    kegiatan yang meliputi pengumpulan,

    pemakaian data historis untuk menemukan

    keteraturan, pola atau hubungan dalam set data

    berukuran besar (Santosa, 2006).

    Beberapa alasan pentingnya menggunakan data

    mining, diantaranya adalah:

    Jumlah data yang sangat besar, dimana daridata tersebut dapat diperoleh informasi yang

    dapat dipergunakan untuk menemukan pola

    tersembunyi. Dan pattern ini dapat

    digunakan dalam menentukan strategi

    bisnis. Persaingan yang semakin meningkat.

    Perusahaan menghadapi global competition,

    dimana kunci suksesnya adalah dengan

    mempertahankan existing customer dan

    meningkatkan value-nya.

    Teknologi yang semakin berkembang,sehingga algoritma data mining digunakan

    dalam suatu program komputer sehingga

    perhitungannya menjadi lebih cepat dan

    akurat, serta dapat digunakan pada data

    yang kompleks sekalipun.

    Menurut Olson (2008), classificationadalah metode yang dibuat untuk mempelajari

    fungsi-fungsi yang memetakan tiap item data ke

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    3/18

    3

    dalam kelas yang telah ditentukan. Dengan

    adanya set kelas, jumlah atribut, dan set

    pembelajaran (learning set), metode klasifikasi

    dapat secara otomatis memprediksi kelas dari

    data baru yang belum terklasifikasi.

    Hal mendasar yang membedakan

    antara teknik klasifikasi dengan teknik

    klastering. Teknik klastering bertujuan

    mengelompokkan data yang belum memiliki

    label menjadi sejumlah K kelompok. Teknik

    klastering akan mengelompokkan data

    berdasarkan kemiripan. Semakin mirip satu data

    dengan yang lain, maka akan dijadikan satu

    klaster atau kelompok. Sedangkan teknik

    klasifikasi bertujuan menempatkan data baru ke

    dalam kelas yang telah tersedia sebelumnya.

    Gambar 2. 1 Klasifikasi Dua Set Obyek Dari Dua Kelas

    (sumber: Santosa, 2006)

    Klasifikasi dua kelas dapat dilihat

    seperti pada gambar 2.1. Misalkan kita memiliki

    set data training (x, y) yang terdiri dua kelas,

    yaitu +1 dan -1. Tujuan dari klasifikasi dua

    kelas yaitu menemukan suatu fungsi keputusan

    f(x) yang secara akurat memprediksi kelas dari

    data test (x, y) yang berasal dari fungsi distribusi

    yang sama dengan data untuk training.

    Contoh kasus klasifikasi multi kelas

    adalah pada klasifikasi suku daerah. Misalnya

    kita ingin melakukan klasifikasi terhadapmahasiswa baru menurut suku daerahnya.

    Diumpamakan ada empat suku daerah, yaitu

    Jawa, Batak, Bali, dan Ambon. Kita akan

    mengklasifikasi mahasiswa baru berdasarkan

    ciri-ciri fisik dan non fisik yang dimiliki

    masing-masing mahasiswa, seperti bentuk

    rambut, warna rambut, bentuk rahang, bentuk

    hidung, bentuk bibir, warna kulit, dan dialek

    bahasa.

    Empat suku daerah yang dimisalkan di

    atas dinamakan label atau kelas data. Ciri-ciri

    fisik dan non-fisik yang dimiliki disebut atributdata. Dengan menggunakan Teknik klastering,

    kita mampu memprediksi apakah mahasiswa

    baru termasuk dalam suku Jawa, Batak, Bali,

    atau Ambon. Untuk melakukan hal tersebut,

    diperlukan pembelajaran terhadap data-data

    yang telah terkumpul sebelumnya. Misalnya

    sebelumnya kita memiliki 200 buah data cirri-

    ciri mahasiswa beserta labelnya. Hasil

    pembelajaran ini adalah sebuah fungsi pemisah

    yang akan mampu memasukkan data baru ke

    dalam kelas yang seharusnya.

    2.3 Particle Swarm Optimization

    Particle Swarm optimization (PSO)

    adalah algoritma swarm intelligence yang

    berdasarkan populasi. PSO ditemukan oleh

    Kennedy dan Eberhart pada 1995. Ide dasar

    PSO adalah meniru perilaku individu dari

    kawanan ikan atau sekelompok burung camar

    yang terbang bersama-sama dalam mencari

    makanan atau sarang. PSO memiliki

    kemampuan dalam mencapai titik global

    maupun optimal. Karena kemudahan dalam

    penerapan kode dan performa yang konsisten,

    PSO terbukti merupakan algoritma yang baik

    dan efektif untuk permasalahan optimasi.

    Algoritma PSO diawali dengan

    inisialisasi sekelompok parikel. Posisi dari tiap

    individu, atau disebut partikel, direpresentasikan

    dengan vektor berukuran m-dimensi. Kemudian

    posisi tiap partikel dievalusi dengan fitness

    function yang telah ditentukan sebelumnya.Kecepatan tiap partikel berubah-ubah

    tergantung posisinya. Dalam PSO terdapat

    pertukaran informasi antar partikel. Pertukaran

    informasi ini tampak dalam persamaan

    kecepatan berikut.

    ( ) ( ) ))(())((1 2221 tsprandctsprandctvtv igiiii ++=+

    (pers. 1)

    Tiap partikel akan merubah kecepatan

    terbangnya dengan mempertimbangkan posisi

    terbaik yang pernah dilaluinya. Ini ditunjukkandengan pi, yang berarti best position partikel i.

    Selain itu, kecepatan juga dipengaruhi oleh

    posisi terbaik diantara seluruh partikel. Ini

    dinotasikan dengan pg, yang berarti global best

    position. Vi adalah kecepatan original yang

    dimiliki masing-masing partikel. Sedangkan si

    adalah posisi partikel pada saat sekarang. c1dan

    c2 adalah koefisien percepatan. Umumnya

    masing-masing bernilai 2. Rand1 dan rand2

    adalah bilangan random.

    Langkah-langkah algoritma PSO

    originaladalah sebagai berikut:

    langkah 1. Inisialisasi: tentukan jumlahpopulasi

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    4/18

    langkah 2. Bangkitkan populasi secara acaklangkah 3. Bangkitkan kecepatan awal.langkah 4. Evaluasi fitness functionlangkah 5. Simpan partikel yang memiliki

    nilai fitness function paling optimal

    langkah 6. Selama terminating conditionbelum terpenuhi, lakukan langkah

    6-10.

    langkah 7. Hitung kecepatan tiap partikellangkah 8. Hitung posisi baru tiap partikellangkah 9. Evaluasi fitness function yang barulangkah 10. Update solusi optimallangkah 11. Update partikel terbaiklangkah 12. Partikel terbaik adalah yang

    menjadi solusi.

    2.3 Cat Swarm Optimization

    Menurut Shu (2006), computational

    intelligence adalah riset penelitian yang marak

    dibicarakan belakangan ini di bidang optimasi

    dan telah ditemukan beberapa algoritma. Yang

    termasuk computational intelligence

    diantaranya adalah Genetic Algorithm (GA),Ant

    Colony Optimization (ACO), Particle Swarm

    Optimization (PSO), dan Simulated Annealing

    (SA). GA dan SA merupakan kelompok area

    evolutionary algorithm, sedangkan ACO dan

    PSO berada di bawah naungan swarm

    intelligence. Algoritma yang diusulkan oleh Shu

    (2006), yaitu Cat Swarm Optimization, adalahjuga merupakan algoritma yang berada di bawah

    bagian swarm intelligence. Evolutionary

    algorithm (EA) adalah algoritma optimasi

    metaheuristic yang berdasar pada populasi

    secara umum. EA menggunakan mekanisme-

    mekanisme yang diinspirasi oleh evolusi

    biologis: reproduksi, mutasi, rekombinasi, dan

    seleksi (wikipedia, 2009). Sedangkan swarm

    intelligence adalah teknik kecerdasan buatan

    yang berdasarkan pada studi dari perilaku

    sekelompok sistem yang tersebar dan

    terorganisir (Wilamowsk, Bodgan M., 2008).Menurut Liu dan Kevin M. Passino (2000),

    swarm intelligenceadalah kecerdasan kolektif

    yang muncul dari sekelompok agent atau

    individu mahluk hidup. Contoh dari swarm

    intelligence yang ada di alam adalah koloni

    semut, kawanan burung, penggembalaan, dan

    kawanan ikan. Dari contoh-contoh tersebut,

    setiap kawanan tidak memiliki kontrol terpusat

    yang mengendalikan mereka. Namun, interaksi

    lokal antar agent di dalamnya seringkali

    mengarah pada kemunculan perilaku global.

    Cat Swarm Optimization adalahalgoritma yang diusulkan oleh Shu-Chuan Chu

    dan Pei-Wei Tsai pada tahun 2006, yang didapat

    melalui pengamatan terhadap perilaku

    sekumpulan kucing. Dalam ACO semut

    digunakan sebagai agent, dan jalur yang dilalui

    oleh semut-semut tersebut adalah set solusinya.

    Dalam PSO, posisi-posisi dari kawanan burung

    digunakan untuk menggambarkan set solusinya.

    Sedangkan, dalam CSO, sekumpulan kucing

    dan model perilakunya digunakan untuk

    menyelesaikan permasalahan optimasi.

    2.3.1 Algoritma CSO

    Chu et al. (2006) membagi algortima

    CSO ke dalam dua sub model yang berdasar

    dari dua perilaku utama kucing. Yaitu seeking

    mode dan tracing mode. Untuk lebih

    jelasnya langkah-langkah algoritma CSO seperti

    yang disampaikan Chu et al. (2006) dalam

    penelitiannya akan dijabarkan dalam sub bab

    berikutnya.2.3.2 Set Solusi dalam Model

    Bagaimanapun bentuk algortima

    optimasi, set solusi (hasil) harus ditampilkan

    dalam suatu cara tertentu. Misalnya dalam Ant

    Colony Optimization (ACO) semut

    disimulasikan sebagai agen, dan jalur yang

    dibentuk oleh semut menunjukkan set solusinya.

    Dalam CSO, digunakan kucing dan model

    perilaku kucing untuk menyelesaikan

    permasalahan optimasi. Dengan kata lain kucing

    digunakan untuk menggambarkan set solusi.

    Tahap pertama dalam CSO adalah menentukanberapa banyak kucing akan digunakan dalam

    iterasi, kemudian menggunakan kucing dalam

    CSO untuk menyelesaikan permasalahan. Setiap

    kucing masing-masing memiliki posisi yang

    tersusun dalam dimensi D, kecepatan untuk

    setiap dimensi, nilai kecocokan yang

    menunjukkan penyesuaian kucing dengan fungsi

    kecocokan, dan bendera untuk mengetahui

    apakah kucing berada dalam seeking modeatau

    tracing mode. Solusi akhir adalah posisi terbaik

    dari salah satu kucing. CSO akan menyimpan

    solusi terbaik hingga akhir iterasi.

    Seeking Mode

    Sub model ini digunakan untuk

    memodelkan situasi kucing ketika dalam

    keadaan beristirahat, melihat sekeliling dan

    mencari posisi berikutnya untuk bergerak.

    Dalam seeking mode, didefinisikan empat faktor

    penting: seeking memory pool (SMP), seeking

    range of the selected dimension (SRD) atau

    mencari rentang dimensi terpilih, counts of

    dimension to change (CDC) atau menghitung

    dimensi yang akan berubah, dan self-position

    considering (SPC) atau mempertimbangkan

    posisi.

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    5/18

    5

    SMP digunakan untuk mendefinisikan

    ukuran memori pencarian untuk masing-masing

    kucing, yang mengindikasikan titik-titik yang

    telah dicoba oleh kucing. Kucing tersebut

    kemudian akan memilih titik dari kelompok

    memori berdasarkan aturan yang akan

    dijelaskan kemudian. SRD menyatakan rentang

    perpindahan dalam dimensi terpilih. Dalam

    seeking mode, jika suatu dimensi diputuskan

    berpindah, selisih antara nilai baru dengan yang

    lama tidak boleh melebihi suatu rentang, yaitu

    rentang yang didefinisikan oleh SRD. CDC

    memperlihatkan berapa besar dimensi yang

    akan berubah. Keseluruhan faktor inilah yang

    memegang peran penting dalam seeking mode.

    SPC merupakan variabel Boolean

    (bernilai benar atau salah), untuk memutuskan

    apakah suatu titik, yang pernah menjadi posisikucing, akan menjadi kandidat posisi untuk

    bergerak. Bagaimanapun nilai SPC, entah benar

    ataupun salah, nilai SMP tidak akan

    terpengaruh. Langkah-langkah seeking mode

    dapat dideskripsikan dalam 5 tahap.

    Langkah 1: Bangkitkan j tiruan dari posisi saat

    ini kucingk, di mana j = SMP. Jika nilai SPC

    benar, maka j = (SMP1), kemudian

    pertahankan posisi saat ini sebagai salah satu

    kandidat.

    Langkah 2: Untuk setiap tiruan, disesuaikan

    dengan CDC, tambahkan atau kurangkan SRDpersen dari nilai saat ini secara acak dan

    gantikan nilai yang sebelumnya.

    Langkah 3: Hitung nilai kecocokan (FS)

    untuk semua titik kandidat.

    Langkah 4: Jika semua FS tidak benar-

    benar sama, hitung probabilitas terpilih masing-

    masing titik kandidat dengan menggunakan

    (pers.2), sebaliknya atur probabilitas terpilih

    untuk semua titik sama dengan 1.

    Langkah 5: secara acak pilih titik untuk

    bergerak dari titik-titik kandidat, dan pindahkan

    posisi kucingk.

    minmax FSFS

    FSFSp

    bi

    i

    = , dimana 0 < i

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    6/18

    Langkah 3: Hitung nilai kecocokan masing-

    masing kucing dengan memasukkan nilai posisi

    kucing ke dalam fungsi kecocokan, yang

    menunjukkan kriteria tujuan, dan simpan kucing

    terbaik dalam memori. Perlu diingat bahwa

    yang perlu disimpan adalah posisi kucing

    terbaik ( bestx ) karena kucing terbaik sejauh ini

    mewakili solusi terbaik.

    Langkah 4: Pindahkan kucing sesuai

    benderanya, jika kucingk berada dalam seeking

    mode, perlakukan sesuai proses seeking mode,

    sebaliknya perlakukan sesuai tracing mode.

    Proses masing-masing telah dijelaskan

    sebelumnya.

    Langkah 5: Pilih lagi sejumlah kucing dan

    masukkan dalam tracing mode sesuai MR,

    sisanya masukkan ke dalam seeking mode.

    Langkah 6: Perhatikan terminatingcondition-nya. Jika telah memuaskan, hentikan

    program. Sebaliknya ulangi langkah 3 hingga 5.

    Gambaran algoritma Cat Swarm

    Optimization pada kasus unconstrained

    minimizationproblem dapat dilihat pada urutan

    gambar 2.2 di halaman berikut. Misal untuk

    menyelesaikan permasalahan unconstrained

    minimization digunakan populasi berukuran 5

    kucing. Mixture Ratio yang digunakan adalah

    20%. SMP berukuran 3, yang berarti digunakan

    3 kucing tiruan.

    2.5Multiple Regression Linear Model

    Multiple Regression Linear Model

    (MRLM) adalah pengembangan dari regresi

    linear yang menyertakan lebih dari 1 variabel

    prediksi. MRLM berusaha memodelkan

    hubungan antara dua atau lebih variabel bebas

    dan sebuah variabel respon dengan cara

    mencocokkan persamaan linear. Setiap nilai

    variabel bebas X dihubungkan dengan nilaivariabel tak bebas Y. Populasi dari sejumlah P

    variabel bebas X didefinisikan sebagai berikut:

    ppxcxcxcxccY +++++= ...3322110

    (pers. 5)

    Dalam penelitian ini, x1, x2,,xp

    merepresentasikan atribut set data dan Y adalah

    kelas atau label dari data terkait.

    Langkah-langkah klasifikasi dengan

    pendekatan MRLM adalah sebagai berikut

    (Satapathy,2008):1. Set data disajikan dalam matriks seperti

    tampak berikut ini.

    Gambar 2. 2 Bagan Cat Swarm Optimization(sumber: Chu, 2006)

    nnm

    m

    m

    nn y

    y

    y

    x

    x

    x

    x

    x

    x

    x

    x

    x

    ..

    ...

    .

    ...

    ...

    ..

    2

    1

    2

    1

    2

    22

    12

    1

    21

    11

    2. Hubungan antara variabel bebas dan takbebas pada data di atas diekspresikan dalam

    MRLM seperti berikut.

    ++++=

    ++++=

    ++++=

    nmmnnn

    mm

    mm

    xcxcxccy

    xcxcxccy

    xcxcxccy

    ...

    ...

    ...

    ...

    22110

    222221102

    112211101

    3. Fitness function yang digunakan adalahmeminimasi banyaknya error yang terjadi

    antara nilai yang diestimasi dengan label

    aslinya.

    )...sgn( 22110 mmii xcxcxccyd ++++=

    ==n

    i id

    1 (pers.6)

    2.6 Ukuran PerformansiMetode untuk mengukur perfomansi

    model adalah dengan menggunakan Training

    Setdan Test Set seperti dijelaskan oleh (Olson,

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    7/18

    7

    2008), (Bramer, 2007), dan (Santosa, 2006).

    Untuk metode train and test ini, data dipisah

    menjadi 2 bagian yang masing-masing disebut

    training setdan test set. Training setdigunakan

    untuk membangun fungsi pemisah. Fungsi

    pemisah ini ini kemudian digunakan untuk

    memprediksi klasifikasi pada test set. Jika

    terdapat sejumlah N data yang diuji, dan sebesar

    C data yang benar, maka keakurasian prediksi

    dari fungsi pemisah tersebut adalah

    NCp /= (pers.7)

    Gambar 2. 3 Train and Test (Sumber: Santosa, 2006)

    3. Pengembangan Model

    Bab ini menguraikan metodologi

    penelitian dan pengembangan metode klasifikasi

    CSO dengan pendekatan MRLM.

    3.1.

    Metodologi Penelitian

    Metodologi penelitian pengembangan

    model dilakukan dengan empat tahapan utama,

    yaitu tahap awal, tahap pengembangan model,

    tahap analisa, serta tahap penarikan kesimpulan.

    3.1.1. Tahap AwalDalam tahap ini peneliti melakukan

    upaya identifikasi permasalahan yang terjadi

    pada objek penelitian melalui observasi yang

    dilakukan serta kemudian melakukan

    perumusan masalah tersebut.

    Identifikasi PermasalahanPada langkah ini dilakukan proses

    identifikasi atas perkembangan teknik baru

    dalam kasus optimasi. Observasi awal objek

    penelitian secara langsung dilakukan untuk

    mengetahui kondisi yang terjadi serta

    permasalahan yang kiranya dapat dicarikan

    alaternatif pemecahannya melalui penelitian

    yang akan dilakukan sesuai dengan tema dan

    batasan penelitian.

    Perumusan Masalah dan Penetapan Tujuan

    PenelitianSetelah melakukan identifikasi

    permasalahan melalui observasi awal langkah

    selanjutnya adalah merumuskan permasalahan

    yang terjadi di objek penelitian serta

    menetapkan tujuan yang ingin dicapai dalam

    penelitian yang akan dilakukan. Penetapan

    tujuan dilakukan agar penelitian yang dilakukan

    memiliki arah yang jelas.

    Studi PustakaLangkah ini merupakan tahap

    pendalaman materi tentang permasalahan yang

    akan diangkat, guna mendukung pelaksanaan

    penelitian dengan memberikan wawasan yang

    cukup seputar metode CSO untuk optimasi,

    metode klasifikasi, dan metode klasifikasi

    dengan teknik-teknik heuristik.

    Observasi dan Analisa Algoritma CSO

    Bersamaan dengan tahapan studi

    pustaka dan literatur maka juga dilakukan

    observasi lanjutan untuk mendapatkanpenjelasan secara lebih mendalam melalui

    analisa algoritma CSO.

    3.1.2. Tahap Pengembangan ModelMerupakan tahap dilakukan

    pengembangan model untuk klasifikasi.

    Algoritma Cat Swarm Optimization yang

    selama ini digunakan untuk menemukan solusi

    kasus optimasi akan dikembangkan,

    dimodifikasi, diberi penyesuaian sehingga bisa

    digunakan dalam kasus klasifikasi.

    Pengumpulan dan Pengolahan DataDalam pengembangan model untuk

    penelitian Tugas Akhir ini, diperlukan sejumlah

    set data yang berfungsi untuk pembelajaran

    maupun pengujian validasi dari model yang

    dikembangkan. Data yang digunakan adalah

    data yang sudah umum digunakan dalam kasus

    Data mining, seperti data Iris, data Breast

    Cancer, dan sebagainya.

    Pengolahan data yang dilakukan

    adalah data pre-processing dan data cleaning.

    Setelah data terkumpul, data perlu diseleksi dan

    dibersihkan. Mungkin juga terdapat sejumlah

    variabel dari data yang dilakukan transformasi

    menjadi bentuk yang diinginkan.

    Pengembangan Model

    Setelah data terkumpul dan diolah,

    maka dilanjutkan dengan pengembangan model.

    Model CSO yang asal mulanya digunakan

    untuk menyelesaikan atau mencari nilai optimal,

    dikembangkan sehingga bisa digunakan dalam

    kasus klasifikasi. Model CSO klasifikasi dalam

    penelitian ini menggunakan pendekatan MRLM.

    Untuk mengembangkan model digunakansoftware MATLAB 7.0.4. Jumlah keseluruhan

    model yang dibangun dalam penelitian ini

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    8/18

    sebanyak 4 buah model klasifikasi, yaitu PSO-

    MRLM, CSO-MRLM No Modification, CSO-

    MRLM with inertia, dan CSO-MRLM steady

    flag.

    Validasi Model CSO

    Tahap ini merupakan tahap evaluasimodel, dimana model diuji apakah model telah

    mampu memberikan hasil klasifikasi yang

    sesuai dengan label aslinya. Model yang valid

    adalah model yang mampu menghasilkan

    akurasi yang baik.

    Perbandingan dengan Metode Lain

    Setelah model selesai dikembangkan,

    model diterapkan untuk set data baru. Hasil

    klasifikasi ini nanti akan dianalisa. Performansi

    diukur dari tingkat akurasi dan kecepatan

    komputasi. Performansi dari model CSO untukklasifikasi kemudian dibandingkan dengan

    metode lain. Metode lain yang digunakan

    sebagai pembanding adalah model PSO

    klasifikasi dengan pendekatan MRLM.

    3.1.3. Tahap AnalisisPada tahap ini, hasil yang diperoleh

    dari implementasi model dan dari perbandingan

    dengan metode lain akan dianalisa secara

    mendalam sehingga dapat diambil kesimpulan

    di akhir penelitian ini. Pada tahap ini dilakukan

    analisis dan perbandingan antara PSOklasifikasi dan CSO klasifikasi secara

    keseluruhan serta perbandingan modifikasi antar

    CSO klasifikasi.

    3.1.4. Tahap Penarikan KesimpulanKesimpulan dan saran diberikan

    setelah tahap analisa dilakukan. Kesimpulan

    yang diberikan merupakan intisari dari

    penelitian yang dilakukan, mengenai

    perbandingan Teknik klasifikasi dengan CSO

    dan teknik klasifikasi pembanding. Saran yang

    akan diberikan adalah saran untuk peneliti yangakan melakukan penelitian lebih lanjut

    menggunakan Cat Swarm Optimization.

    3.2.

    Pengembangan Model

    Dalam sub bab ini akan dipaparkan

    pengembangan model maupun modifikasi dari

    algoritma CSO. CSO dikembangkan dengan

    menggunakan pendekatan Multiple Regression

    Linear Model.

    3.2.1. CSO pendekatan MRLMPenjelasan dari pengembangan model

    yang dilakukan dalam penelitian ini dapatdilihat dari flow chart maupun dari langkah-

    langkah algoritma berikut.

    langkah 1.Bangkitkan sejumlah N kucing.Setiap kucing merepresentasikan set

    solusi awal, yaitu nilai-nilai

    koefisian persamaan MRLM. Jika

    data training berjumlah ntraining,

    maka ukuran matriks kucing

    memiliki dimensi sebesar N x

    ntraining.

    langkah 2.Inisialisasi posisi kucing, kecepatan,dan bendera kucing. Kucing berada

    pada bendera seeking sesuai rasio

    MR yang telah ditentukan

    sebelumnya.

    langkah 3.Hitung fungsi tujuan CSO MRLM,yaitu

    )...sgn( 22110 mmii xcxcxccyd ++++=

    ==n

    i id

    1 (pers.7)

    langkah 4.Perbaharui kucing sesuaibenderanya.

    langkah 4.1. Untuk kucing dengan benderaseeking, bangkitkan tiruan

    sebanyak SMP yang telah

    ditetapkan. Jika SPC bernilai

    benar, maka pertahankan posisi

    saat ini sebagai salah satu

    kandidat.

    langkah 4.2. Untuk setiap tiruan, tambahkanatau kurangkan sebesar SRD

    persen dari nilai saat ini.

    langkah 4.3. Hitung nilai kecocokan untuksemua titik kandidat seperti pada

    langkah 3.

    langkah 4.4. Jika nilai kecocokan tidak benar-benar sama, hitung probabilitas

    terpilihnya masing-masing

    kandidat.

    langkah 4.5. Secara acak pilih titik untukbergerak dari titik-titik kandidat,

    lal pindahkan posisi kucing.

    langkah 4.6. Untuk kucing dalam benderatracing, perbarui kecepatan.

    )( ,,11,, dkdbestdkdk xxcrvv +=

    , dimana d = 1,2,...,M (pers.8)

    langkah 4.7. Perbarui posisi kucing.langkah 5. Pilih lagi sejumlah kucing dan

    masukkan dalam tracing mode

    sesuai MR, sisanya masukkan ke

    dalam seeking mode.

    langkah 6. Perhatikan terminating condition-

    nya. Jika telah memuaskan,hentikan program. Sebaliknya

    ulangi langkah 3 hingga 5.

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    9/18

    9

    Terminating yang digunakan

    berupa maksimum jumlah

    misclassification(%).

    Gambar 3. 1 Algoritma CSO Klasifikasi

    langkah 7. Kucing yang terpilih adalah kucingyang memiliki koefisien MRLMoptimal.

    langkah 8. Klasifikasi data testing denganmenggunakan persamaan MRLM

    optimal yang telah didapat. Kalikan

    matriks data testing dengan

    persamaan MRLM (pers.9).

    Kemudian cocokkan hasil data

    testing dengan label testing. Hitung

    jumlah titik yang tidak sama

    dengan label aslinya.

    3

    2

    1

    211

    22221

    11211

    .........c

    c

    c

    xxx

    xxx

    xxx

    nmnn

    m

    m

    (pers.9)

    3.2.2. Modifikasi CSOSepuluh set data diuji dengan empat

    metode yang masing-masing dinamakan PSO-

    MRLM, CSO-MRLM No Modification, CSO-

    MRLM with inertia, dan CSO-MRLM steadyflag. PSO-MRLM digunakan sebagai

    pembanding performa CSO-MRLM. Sedangkan

    tiga buah variasi CSO-MRLM ditampilkan

    dalam penelitian ini untuk melihat mana yang

    paling baik diantara modifikasi CSO. CSO-

    MRLM No Modificationadalah algoritma CSO

    tanpa modifikasi. Pada CSO-MRLM with

    inertia, modifikasi dilakukan yaitu dengan tidak

    melakukan perubahan bendera seeking dan

    tracing. Kucing yang sejak awal memiliki

    bendera seekingakan terus berada pada bendera

    seeking hingga titik optimal ditemukan.

    Demikian halnya pada kucing yang sejak awal

    memiliki bendera tracing. Selain itu, pada CSO-

    MRLM with inertia ini juga ditambahkan

    modifikasi berupa nilai inersia w yang nilainya

    berubah secara acak. Sehingga persamaan

    update kecepatan menjadi (pers. 10). Modifikasi

    pada CSOsf hampir sama dengan Csi, hanya

    saja pada CSOsf diberikan nilai inersia w yangkonstan, yaitu 1.

    )( ,,11,, dkdbestdkdk xxcrvwv += ,

    dimana d = 1,2,...,M (pers.10)

    4. Pengujian Model

    Model yang telah dibuat kemudian

    diuji kemampuannya dengan set data sederhana

    sebelum digunakan dengan set data set yang

    lebih besar. Set data sederhana yang digunakan

    adalah data permasalahan AND, yang

    digunakan sebagai validasi dan juga sebagai

    contoh perhitungan. Set data yang lebih besar

    diantaranya adalah data iris, breast cancer,

    Wisconsin Diagnostic Breast Cancer (WDBC),

    pima, credit approval, spline, Habermans

    Survival, hepatitis, sonar, dan ionosphere.

    Sepuluh set data yang telah disebutkan

    digunakan untuk melihat kinerja CSO

    klasifikasi dan perbandingannya dengan PSO

    klasifikasi.

    4.1.

    Deskripsi Data UjiData yang digunakan dalam penelitian

    ini adalah set data kasus nyatayang telah umum

    digunakan dalam kasus Data mining. Dalam

    sub-bab ini akan dijelaskan karakteristik dari set

    data yang digunakan.

    4.1.1. Data permasalahan ANDProblem AND adalah klasifikasi dua

    kelas dengan empat data. Kelas pertama

    ditunjukkan dengan 1, sedangkan kelas kedua

    ditunjukkan dengan -1.

    Tabel 4. 1 Permasalahan AND

    X1 X2 Y

    1 1 1

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    10/18

    -1 1 -1

    1 -1 -1

    -1 -1 -1

    4.1.2. Data IrisData iris asli memiliki tiga kelas jenis

    bunga dengan total data sebanyak 150. Untukuji klasifikasi pada penelitian ini, data yang

    digunakan dibatasi sebanyak dua kelas, karena

    itu dilakukan penghapusan data dari kelas

    ketiga. Data iris yang yang tersisa dapat

    dijelaskan sebagai berikut:

    Jumlah data : 100 Jumlah atribut : 5 Penyesuaian : Penghapusan kelas ketiga

    4.1.3. Data Breast Cancer

    Data Breast Cancer digunakan untukmemprediksi diagnosis kanker payudara, apakah

    jinak atau ganas. Data Breast Cancer asli

    memiliki 699 data dimana terdapat beberapa

    data yang masih memiliki missing value.

    Sebelum diproses, dilakukanpreprocessing data

    berupa data cleaning yaitu menghapus data-data

    yang masih memiliki missing value. DataBreast

    Canceryang akan diuji dapat dijelaskan sebagai

    berikut:

    Jumlah data : 683 Jumlah atribut : 10

    Penyesuaian : Penghapusan data denganmissing value

    4.1.4. Data Wisconsin Diagnostic BreastCancer (WDBC)

    Data WDBC berbeda dengan data

    Breast Cancer, meskipun sama-sama

    memprediksi diagnosis kanker payudara. Data

    WDBC memiliki 569 data dengan jumlah

    atribut yang lebih banyak daripada data Breast

    Cancer. Seluruh atribut data telah merupakan

    data numerik, sehingga tidak perlu dilakukan

    penyesuaian. Data WDBC yang akan diuji dapat

    dijelaskan sebagai berikut:

    Jumlah data : 569 Jumlah atribut : 31 Penyesuaian : tidak ada

    4.1.5. Data PimaData Pima digunakan untuk

    memprediksi diagnosis apakah pasien

    menunjukkan tanda-tanda diabetes atau tidak,

    jika merujuk pada kriteria World Health

    Organization (WHO). Data WDBC memiliki768 data dengan seluruh atribut data telah

    merupakan data numerik, sehingga tidak perlu

    dilakukan penyesuaian. Data Pima yang akan

    diuji dapat dijelaskan sebagai berikut:

    Jumlah data : 768 Jumlah atribut : 9 Penyesuaian : tidak ada

    4.1.6. Data Credit ApprovalData Credit Approval asli terdiri dari

    690 data dengan 16 atribut yang terdiri dari

    beragam jenis data, yaitu data kontinu dan

    nominal. Data nominal diubah ke dalam bentuk

    numeris agar dapat diolah pada pengujian data.

    Data ini memiliki range yang beragam antar

    atribut. Setelah data yang mengandung missing

    value dihapus, data Credit Approval dapat

    dijelaskan sebagai berikut.

    Jumlah data : 653

    Jumlah atribut : 16 Penyesuaian : Penghapusan data dengan

    missing value,

    pengubahan data

    kategorial menjadi

    numeris

    4.1.7. Data SpliceData Splice asli terdiri dari 3.175 data.

    Karena data masih mengandung kelas yang

    tidak termasuk ke dalam dua kelas yang telah

    ditentukan, dilakukan penghapusan data untuk

    data dengan kelas selain +1 dan -1. Kegiatanpreprocessing berikutnya yaitu mengubah jenis

    data dari kategorial menjadi numeris. Data yang

    akan diuji setelah preprocessing dapat

    dijelaskan sebagai berikut:

    Jumlah data : 1527 Jumlah atribut : 61 Penyesuaian : Penghapusan data dengan

    missing value,

    penghapusan data dari

    kelas ketiga, pengubahan

    data kategorial menjadinumeris

    4.1.8. DataHabermans SurvivalData Habermans Survival digunakan

    untuk memprediksi apakah seorang pasien yang

    telah menjalani operasi kanker payudara akan

    bertahan hidup atau tidak. Kelas +1 berarti

    seorang pasien mampu bertahan hidup lebih dari

    lima tahun, sedangkan kelas -1 menandakan

    pasien akan meninggal dalam kurun waktu

    kurang dari lima tahun. Data Habermans

    Survival dapat dijelaskan sebagai berikut. Jumlah data : 306 Jumlah atribut : 4

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    11/18

    11

    Penyesuaian : tidak ada

    4.1.9. DataHepatitisData Hepatitis digunakan untuk

    memprediksi apakah seorang pasien hepatitis

    akan meninggal atau selamat berdasarkan

    atribut yang dimilikinya seperti usia, jenis

    kelamin, ada tidaknya varises, dan lainnya.

    Dataset Hepatitis asli terdiri atas 155 data,

    namun masih terdapat missing valueyang perlu

    dihilangkan untuk memudahkan pengolahan

    data. Setelah missing value dihapus, data yang

    tersisa adalah sebagai berikut.

    Jumlah data : 80 Jumlah atribut : 20 Penyesuaian : Penghapusan data dengan

    missing value,

    pengubahan datakategorial menjadi

    numeris

    4.1.10. Data SonarData Sonar digunakan untuk

    memprediksi apakah pantulan dari sinyal sonar

    berasal dari partikel batu atau besi.

    Jumlah data : 206 Jumlah atribut : 60 Penyesuaian : Penghapusan data dengan

    missing value,

    pengubahan data

    kategorial menjadi

    numeris

    4.1.11. DataIonosphereData Ionosphere digunakan untuk

    memprediksi apakah lapisan ionosfer baik atau

    buruk berdasarkan elektron-elektron di ionosfer.

    DatasetIonosphere asli terdiri atas 351 data,

    namun masih terdapat missing valueyang perlu

    dihilangkan untuk memudahkan pengolahan

    data. Setelah missing value dihapus, data yangtersisa adalah sebagai berikut.

    Jumlah data : 122 Jumlah atribut : 35 Penyesuaian : Penghapusan data dengan

    missing value,

    pengubahan data

    kategorial menjadi

    numeris

    4.2.

    Pengujian permasalahan AND

    Set data permasalahan AND adalah

    data sederhana yang terdiri atas dua atribut.Gambaran yang lebih jelas mengenai data

    permasalahan AND dapat dilihat pada tabel dan

    gambar berikut ini diikuti dengan langkah-

    langkah penyelesaian menggunakan CSO

    klasifikasi.

    Gambar 4. 1 Ilustrasi Permasalahan AND (sumber:

    Santosa,2006)

    Pendekatan MRLM membutuhkan

    adanya tambahan variabel pada kolom yang

    paling awal. Variabel ini digunakan sebagai

    pengali agar persamaan MRLM memiliki

    konstanta c0. Sehingga tabel permasalahan AND

    menjadi seperti pada tabel berikut.

    Tabel 4. 2 Permasalahan AND dengan MRLM

    X0 X1 X2 Y

    1 1 1 1

    1 -1 1 -1

    1 1 -1 -1

    1 -1 -1 -1

    langkah 1.Bangkitkan N=5 kucing. Setiapkucing merepresentasikan set solusi.

    Ukuran matriks kucing memiliki

    dimensi 5 x 3.

    langkah 2.Inisialisasi posisi kucing,

    =

    9057.15713.21121.0

    3745.38520.38547.0

    3355.23483.01509.2

    9235.00968.26010.3

    x

    kecepatan,

    =

    9057.15713.21121.0

    3745.38520.38547.0

    3355.23483.01509.2

    9235.00968.26010.3

    v

    dan bendera kucing,

    Ntrac = round(N*MR) = 1

    Nseek = N Ntrac = 4

    langkah 3.Hitung fungsi tujuan CSO MRLM,

    )...sgn( 22110 mmii xcxcxccyd ++++=

    ==n

    i id

    1

    untuk tiap x:

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    12/18

    hreg(i) = dttrn * x(i,:)'hreg(i) =

    6.62132.4277

    4.77440.5808

    Hlabel(i) = sign(hreg)

    Hlabel(i) =

    1

    1

    1

    1

    Abs(d(i)) =3

    1

    1

    1

    1

    1

    1

    1

    1

    =

    Sehingga didapat fitness function d,

    yaitu

    d =

    3

    12

    2

    3

    langkah 4. Perbaharui kucing sesuaibenderanya. Untuk tiap x(i)

    lakukan langkah 4.1 langkah 4.7:langkah 4.1.Untuk kucing dengan bendera

    seeking, bangkitkan tiruan

    sebanyak SMP (3 kucing tiruan).

    SPC = 0, maka posisi awal tidak

    menjadi kandidat.

    langkah 4.2.Untuk setiap tiruan, tambahkanatau kurangkan sebesar SRD

    persen dari nilai saat ini.

    xseekcop =

    -1.5056 -2.7962 -1.5056

    -0.2438 -0.4527 -0.2438

    1.6348 1.6348 1.6348

    langkah 4.3.Hitung nilai kecocokan untuksemua titik kandidat seperti pada

    langkah 3.

    FScopy =

    2

    1

    2

    langkah 4.4.Jika nilai kecocokan tidak benar-benar sama, hitung probabilitas

    terpilihnya masing-masingkandidat. Selain itu, hitung

    probabilitas masing-masing kucing

    tiruan.

    cumprob =

    0.4000

    0.6000

    1.0000

    langkah 4.5.Secara acak pilih titik untukbergerak dari titik-titik kandidat,

    lalu pindahkan posisi kucing.

    Hasilnya adalah:

    xseek =

    -2.7962 -0.4527 1.6348

    0.5983 -2.6964 2.3622

    -0.1458 3.3426 2.4774

    2.1913 -0.5751 -1.8129

    langkah 4.6.Untuk kucing dalam benderatracing, perbarui kecepatan.

    vel =

    -7.2825 4.9180 5.1445langkah 4.7.Perbarui posisi kucing.xtrac =

    -1.3990 7.0147 5.9235

    langkah 5. Pilih lagi kucing dan masukkandalam tracing mode sesuai MR,

    sisanya masukkan ke dalam

    seeking mode.

    langkah 6. Perhatikan terminating condition-nya. Jika telah memuaskan,

    hentikan program. Sebaliknya

    ulangi langkah 3 hingga 5.

    Terminating yang digunakanberupa maksimum jumlah

    misclassification (%). Dalam

    permasalahan AND, batas mis-

    classification adalah nol persen.

    Setelah dihitung fitness function,

    ternyata terminating condition

    terpenuhi.

    langkah 7. Kucing yang terpilih adalah kucingyang memiliki koefisien MRLM

    optimal, yaitu:

    x(i) =

    -1.3990 7.0147 5.9235langkah 8. Setelah diperoleh solusi optimal,

    klasifikasi data testing dengan

    menggunakan persamaan MRLM

    optimal yang telah didapat. Kalikan

    matriks data testing dengan

    persamaan MRLM. Kemudian

    cocokkan hasil data testing dengan

    label testing. Hitung jumlah titik

    yang tidak sama dengan label

    aslinya.hregtst = dttrn * x(i,:)'

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    13/18

    13

    hregtst=

    9235.5

    0147.7

    339.1

    9057.15713.21121.0

    3745.38520.38547.0

    3355.23483.01509.2

    9235.00968.26010.3

    hregtst =

    3372.14

    3077.0

    4902.25392.11

    Hlabeltst =

    1

    1

    1

    1

    Semua label telah terklasifikasi

    dengan tepat.

    4.3.Pengujian 10 Set Data

    Sepuluh set data diuji dengan empat

    metode yang masing-masing dinamakan PSO-

    MRLM, CSO-MRLM No Modification, CSO-

    MRLM with inertia, dan CSO-MRLM steady

    flag. Dalam sub bab ini, nama masing-masing

    model disingkat untuk alasan penyajian tabel.

    PSO-MRLM disingkat menjadi PSO, CSO-

    MRLM No Modification disingkat menjadi

    CSOnm, CSO-MRLM with inertia disingkat

    menjadi CSOi, dan CSO-MRLM steady flag

    disingkat menjadi CSOsf.

    4.3.1.

    Data Iris

    Pengujian dilakukan dengan data

    training sebanyak 70 yang dipilih secara

    acak, dan data testing sebanyak 30 yang

    diambil dari data selain data training. Hasil

    rata-rata banyaknya iterasi, waktu

    komputasi, dan misklasifikasi dari sepuluh

    kali percobaan untuk tiap metode

    ditunjukkan pada Tabel 4.2. Adapun nilai

    minimum untuk waktu komputasi dan

    kesalahan klasifikasi tiap metode diperjelas

    dengan huruf bercetak tebal.

    Tabel 4. 3 Klasifikasi Data Iris

    Metode IterasiWaktu(detik) Misklasifikasi

    PSO 2.2 0.02 0%

    CSOn

    m 1.7 0.02 0%

    CSOi 1.5 0.01 0%

    CSOsf 0.9 0.02 0%

    4.3.2.

    Data Breast CancerPengujian dilakukan dengan data

    training sebanyak 70 persen dari total data

    dan dipilih secara acak, dan data testing

    diambil dari data selain data training. Hasil

    rata-rata banyaknya iterasi, waktu

    komputasi, dan misklasifikasi dari sepuluh

    kali percobaan untuk tiap metode

    ditunjukkan pada tabel 4.3. Adapun nilai

    minimum untuk waktu komputasi dan

    kesalahan klasifikasi tiap metode diperjelas

    dengan huruf bercetak tebal.

    Tabel 4. 4 Klasifikiasi Data Breast Cancer

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 356 5.76 5.57%

    CSOn

    m 198 5.17 7.20%

    CSOi

    1334.

    6 33.67 5.30%

    CSOsf 41.2 1.09 3.84%

    4.3.3. Data Wisconsin Diagnostic Breast

    Cancer (WDBC)

    Pengujian dilakukan dengan data

    training sebanyak 398 yang dipilih secaraacak, dan data testing sebanyak 171yang

    diambil dari data selain data training. Hasil

    rata-rata banyaknya iterasi, waktu

    komputasi, dan misklasifikasi dari sepuluh

    kali percobaan untuk tiap metode

    ditunjukkan pada tabel 4.4. Adapun nilai

    minimum untuk waktu komputasi dan

    kesalahan klasifikasi tiap metode diperjelas

    dengan huruf bercetak tebal.

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    14/18

    Tabel 4. 5 Klasifikasi Data WDBC

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 22.02 68.16 9.30%

    CSOn

    m 26.34 70.20 8.89%

    CSOi 30.23 64.74 8.83%

    CSOsf 23.45 65.79 9.01%

    4.3.4. Data Pima

    Pengujian dilakukan dengan data

    training sebanyak 538 yang dipilih secara

    acak, dan data testing sebanyak 230 yang

    diambil dari data selain data training. Hasil

    rata-rata banyaknya iterasi, waktu

    komputasi, dan misklasifikasi dari sepuluh

    kali percobaan untuk tiap metode

    ditunjukkan pada tabel 4.5. Adapun nilai

    minimum untuk waktu komputasi dan

    kesalahan klasifikasi tiap metode diperjelasdengan huruf bercetak tebal.

    Tabel 4. 6 Klasifikasi Data Pima

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 4.6 0.05 35.70%

    CSOn

    m 2.9 0.07 35.04%

    CSOi 3.7 0.08 35.26%

    CSOsf 4.2 0.10 35.74%

    4.3.5.

    Data Credit Approval

    Pengujian dilakukan dengan data

    training sebanyak 457 yang dipilih secara

    acak, dan data testing sebanyak 196 yang

    diambil dari data selain data training. Hasilrata-rata banyaknya iterasi, waktu

    komputasi, dan misklasifikasi dari sepuluh

    kali percobaan untuk tiap metode

    ditunjukkan pada tabel 4.6. Adapun nilai

    minimum untuk waktu komputasi dan

    kesalahan klasifikasi tiap metode diperjelas

    dengan huruf bercetak tebal.

    Tabel 4. 7 Klasifikasi Data Credit Approval

    Metode Iterasi Waktu (detik) Misklasifikasi

    PSO 110.5 1.05 26.25%

    CSOn

    m 61.88 1.26 25.06%

    CSOi

    503.8

    8 8.90 23.53%

    CSOsf

    133.1

    3 2.70 27.04%

    4.3.6. Data Splice

    Pengujian dilakukan dengan data training

    sebanyak 1069 yang dipilih secara acak, dan

    data testing sebanyak 458 yang diambil dari

    data selain data training. Hasil dari sepuluh kalipercobaan untuk tiap metode ditunjukkan pada

    tabel 4.7 Adapun nilai minimum untuk waktu

    komputasi dan kesalahan klasifikasi tiap metode

    diperjelas dengan huruf bercetak tebal.

    Tabel 4. 8 Klasifikasi Data Splice

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 899,5 11,11 8,1%

    CSOn

    m

    2596,

    9

    130,38 8,9%

    CSOi 627,5 25,31 9,3%

    CSOsf 521 26,13 9,3%

    4.3.7. DataHabermans Survival

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    15/18

    15

    Pengujian dilakukan dengan data training

    sebanyak 204 yang dipilih secara acak, dan data

    testing sebanyak 102 yang diambil dari data

    selain data training. Hasil dari sepuluh kali

    percobaan untuk tiap metode ditunjukkan pada

    tabel 4.8 Adapun nilai minimum untuk waktu

    komputasi dan kesalahan klasifikasi tiap metode

    diperjelas dengan huruf bercetak tebal.

    Tabel 4. 9 Klasifikasi Data Habermans Survival

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 7,7 0,07 11,76%

    CSOn

    m 12,3 0,18 11,72%

    CSOi 6,4 0,08 11,34%

    CSOsf 7,6 0,11 11,90%

    4.3.8. Data Hepatitis

    Pengujian dilakukan dengan data training

    sebanyak 60 yang dipilih secara acak, dan data

    testing sebanyak 20 yang diambil dari data

    selain data training. Hasil dari sepuluh kali

    percobaan untuk tiap metode ditunjukkan pada

    tabel 4.9 Adapun nilai minimum untuk waktu

    komputasi dan kesalahan klasifikasi tiap metode

    diperjelas dengan huruf bercetak tebal.

    Tabel 4. 10 Klasifikasi Data Hepatitis

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 61,8 0,58 21,5%

    CSOn

    m 317,6 3,87 22,0%

    CSOi 659,1 7,13 21,5%

    CSOsf 363,9 4,36 21,5%

    4.3.9.

    Data Sonar

    Pengujian dilakukan dengan data training

    sebanyak 146 yang dipilih secara acak, dan data

    testing sebanyak 60 yang diambil dari data

    selain data training. Hasil dari sepuluh kali

    percobaan untuk tiap metode ditunjukkan pada

    tabel 4.10 Adapun nilai minimum untuk waktu

    komputasi dan kesalahan klasifikasi tiap metode

    diperjelas dengan huruf bercetak tebal.

    Tabel 4. 11 Klasifikasi Data Sonar

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    16/18

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 1376,9 16,74 28,5%

    CSOnm 440,9 7,89 25,2%

    CSOi 673,6 10,14 31,3%

    CSOsf 2345,8 41,76 32,5%

    4.3.10.

    DataIonosphere

    Pengujian dilakukan dengan data training

    sebanyak 85 yang dipilih secara acak, dan data

    testing sebanyak 37 yang diambil dari data

    selain data training. Hasil dari sepuluh kali

    percobaan untuk tiap metode ditunjukkan pada

    tabel 4.15. Adapun nilai minimum untuk waktu

    komputasi dan kesalahan klasifikasi tiap metode

    diperjelas dengan huruf bercetak tebal.

    Tabel 4. 12 Klasifikasi Data Ionosphere

    Metode Iterasi

    Waktu

    (detik) Misklasifikasi

    PSO 113,9 1,18 25,68%

    CSOn

    m 37 0,51 28,11%

    CSOi

    2910,

    7 35,05 26,49%

    CSOsf 133,1 1,79 27,03%

    5. Analisis Dan Pembahasan5.1. Analisis Performansi Keseluruhan

    Model CSODari 10 set data yang dilakukan uji

    klasifikasi, 9 diantaranya dilakukan dengan baik

    oleh CSO regresi. Diantara 3 macam variasi

    CSO regresi, CSO-MRLM steady flagmemiliki

    performa yang paling baik dalam hal jumlah

    iterasi yang dibutuhkan untuk mencapai titik

    optimal. Hal ini sesuai dengan jurnal yang

    ditulis oleh Chu et al, bahwa kelebihan dari

    CSO adalah CSO hanya membutuhkan iterasi

    yang lebih sedikit dibandingkan PSO maupunPSO with Weighting Factor.

    Ditinjau dari banyaknya

    misklasifikasi, CSO-MRLM with inertia

    menghasilkan misklasifikasi paling kecil.

    Banyaknya misklasifikasi dipengaruhi oleh

    kemampuan model dalam mencari titik optimal.

    CSO-MRLM with inertiamengalami modifikasi

    dalam mencari titik optimal. Dalam update

    kecepatan di CSO-MRLM with inertia, penulis

    menambahkan nilai inersia w yang nilainya acak

    antara 0 hingga 1. Dengan nilai inersia yang

    acak, kucing dapat bergerak dengan halus yaitu

    manakala nilai inersia bernilai kecil.

    Tabel 5. 1 Rata-rata Iterasi 10 Set Data

    Nilai inersia w yang semakin kecil

    akan memberikan dampak pada perpindahahan

    posisi yang lebih halus. Kecepatan akan lebih

    dipengaruhi oleh pertukaran informasi dengan

    kucing yang memiliki posisi terbaik (xbest).

    Kucing akan semakin memperdalam pencarian

    solusi optimalnya. Dalam beberapa jurnal, halini disebut eksploitasi. Sedangkan nilai w yang

    mendekati 1 akan berdampak pada pencarian

    titik solusi baru. Perilaku ini disebut eksplorasi.

    5.2.

    Analisis Performansi Dan

    Karakteristik DataModel CSO-MRLM steady flag

    (CSOf) digunakan untuk analisis performansi

    dan karakteristik data. Model ini digunakan

    karena memberikan hasil yang paling baik

    diantara 3 model CSO klasifikasi yang ditelitipada penelitian ini. Hal tersebut merujuk pada

    tabel 5.1 dimana CSOf memiliki rata-rata

    jumlah iterasi yang paling sedikit diantara

    model lainnya.

    Performa model klasifikasi berbeda-

    beda untuk kesepuluh set data yang diuji.

    Masing-masing set data memiliki karakteristik

    yang berbeda, meliputi jumlah data, jumlah

    atribut, maupun nilai atribut. Karakteristik tiap

    set data telah dijelaskan pada sub bab 4.1. Di

    bawah ini akan disajikan secara ringkas

    kesepuluh set data yang diuji.

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    17/18

    17

    Tabel 5. 2 Jumlah Data & Atribut 10 Set Data

    No. Set data Jumlah

    Data

    Jumlah

    Atribut

    1 iris 100 4

    2 breast cancer 683 9

    3 WDBC 569 30

    4 pima 768 8

    5 credit approval 653 15

    6 spline 1527 60

    7 Habermans Survival 306 3

    8 hepatitis 80 19

    9 sonar 206 60

    10 ionosphere 122 34

    Hubungan antara banyak iterasi yang

    dibutuhkan dengan jumlah data dapat dilihat

    pada gambar 5.1. Pada gambar grafik tersebut

    terlihat bahwa jumlah data tidak banyakmempengaruhi jumlah iterasi yang dibutuhkan

    algoritma CSO untuk men-training data.

    Misalnya pada gambar 5.1 grafik melonjak naik

    pada data yang memiliki jumlah data 206 lalu

    turun kembali pada data berjumlah 306. Set data

    yang memiliki jumlah data sebesar 206 adalah

    data Sonar. Set Data sonar memiliki jumlah

    atribut yang relatif besar. Kenaikan grafik juga

    terjadi pada set data berjumlah 1527 data, yaitu

    data splice. Data splice memiliki jumlah atribut

    yang juga besar, yaitu 60 atribut.

    Gambar 5. 1 Grafik Jumlah Data Dengan Iterasi

    Hubungan antara banyak iterasi dengan

    jumlah atribut disajikan pada gambar 5.2.

    Semakin banyak jumlah atribut berdampak pada

    semakin banyak iterasi yang dibutuhkan untuk

    men-trainingdata.

    Pada gambar 5.2. terlihat bahwa grafik

    tidak berbanding lurus. Pada data berjumlah

    atribut 9 model PSO membutuhkan iterasi yang

    banyak. Namun pada data berjumlah atribut 15,

    grafik model PSO kembali menurun. Hal yang

    serupa juga terjadi pada CSOsf saat model

    diterapkan pada set data berjumlah atribut 19.

    Grafik mengalami kenaikan, namun kembali

    menurun pada set data berjumlah atribut 30.

    Hubungan antara jumlah atribut dengan

    jumlah kebutuhan iterasi yang tidak berbanding

    lurus mengindikasikan bahwa ada faktor lain

    yang lebih mempengaruhi performa model

    dalam melakukan klasifikasi. Selain jumlah

    atribut dan jumlah data terdapat karakteristik

    lain yang dimiliki oleh set data, yaitu

    kemampuan data untuk dipisahkan secara linear.

    Data yang memiliki jumlah atribut banyak

    memiliki dimensi yang tinggi. Data seperti itu

    sulit untuk dilihat apakah linearly separable

    atau tidak. Karakteristik inilah yang tidak

    mampu diselesaikan dengan baik oleh

    pendekatan Multiple Regression Linear Model

    (MRLM) dalam penelitian ini.

    Gambar 5. 2 Grafik Jumlah Atribut Dengan Iterasi

    6. Kesimpulan dan Saran

    6.1. KesimpulanAdapun kesimpulan yang dapat

    diambil dari penelitian ini adalah sebagai

    berikut:

    1. Dalam penelitian ini telah berhasildikembangkan Cat Swarm Optimization

    untuk kasus klasifikasi dua kelas.2. CSO klasifikasi yang digunakan dalam

    penelitian ini menggunakan pendekatan

    Multiple Regression Linear Model

    (MRLM).

    3. Pada pengujian 10 set data, antara laindata iris, breast cancer, Wisconsin

    Diagnostic Breast Cancer (WDBC),

    pima, credit approval, spline,

    Habermans Survival, hepatitis, sonar,

    dan ionosphere, model CSO klasifikasi

    memiliki performa yang lebih baik

    dibandingkan PSO klasifikasi.4. CSO klasifikasi pada model CSOsf

    memiliki performa yang lebih baik

  • 7/25/2019 Pengembangan Algoritma Cat Swarm Optimization Cso Untuk Klasifikasi

    18/18

    dibandingkan PSO klasifikasi ditinjau

    dari banyaknya jumlah iterasi yang

    dibutuhkan untuk melatih data training

    hingga tercapai persentase

    misklasifikasi yang kecil.

    5. Algoritma CSOsf yang diterapkan padapermasalahan klasifikasi memiliki

    performansi yang unggul seperti halnya

    pada saat diterapkan dalam

    permasalahan unconstrained

    minimization problem.

    6.2. SaranPenelitian selanjutnya bisa dilakukan

    untuk kasus klasifikasi multi kelas serta dengan

    pendekatan lain yang mampu memberikan

    jumlah misklasifikasi yang lebih kecil.

    7. Daftar Pustaka

    Bramer, Max.2007. Principles of Data

    Mining.London: Springer-Verlag

    Chu, Shu-Chuan, Pei-Wei Tsai & Jeng-Shyang

    Pan.2006. Computational intelligence

    based on the behavior of cats.

    International Journal of innovative

    Computing, Information and Control.

    Chu, Shu-Chuan, Pei-Wei Tsai & Jeng-Shyang

    Pan.2006. Cat Swarm Optimization.

    Proceedings of the 9th Pacific Rim

    International Conference on ArtificialIntelligence LNAI 4099

    Gwern, M2Ys4U, Sinebot, et

    al.2009.Evolutionary Algorithm.

    http://en.wikipedia.org/wiki/Evolution

    ary_algorithm

    Holden, Nicholas & Alex A. Freitas.2008.A

    Hybrid PSO/ACO Algorithm for

    Discovering Classification Rules in

    Data Mining.Unitede Kingdom:

    University of Kent.

    Liu, Yang and Kevin M. Passino.2000. Swarm

    intelligence: Literature Overview.Department of Electrical Engineering:

    The Ohio State University.

    TechTarget.2008.Heuristics.

    Olson, David L.& Dursun Delen

    2008.Advanced Data

    MiningTechniques. USA: Springer-

    Verlag Berlin Heidelberg

    Santosa, Budi.2006. Data Mining Teknik

    Pengenalan Pola: Teori dan Aplikasi.

    Yogyakarta: Graha Ilmu

    StatSoft, Inc.2008. Data Mining

    Techniques.

    Veeramachaneni, Kalyan, Weizhong Yan, Kai

    Goebel, Lisa Osadciw.2006.

    Improving Classifier Fusion Using

    Particle Swarm Optimization.USA:

    Syracuse University

    Wilamowski, Bodgan M.2008. Swarm

    intelligence. Power point slide show

    of Neural Networks Lecture.