analisis diskriminan diskrit untuk ... nasional matematika dan pendidikan matematika 2010 kelompok...

Click here to load reader

Post on 01-May-2018

230 views

Category:

Documents

12 download

Embed Size (px)

TRANSCRIPT

  • SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010

    Kelompok Matematika

    Terapan

    880

    ANALISIS DISKRIMINAN DISKRIT UNTUK MENGELOMPOKKAN KOMPONEN

    Bernik Maskun

    Jurusan Statistika FMIPA UNPAD

    [email protected]

    Abstrak Untuk mengelompokkan hasil pengukuran yang diukur dengan p buah variabel dimana penilaian setiap variabel dilakukan dengan pengkategorian yang bersifat biner maka banyak susunan yang mungkin terjadi adalah 2p . Dari sampel yang diperoleh, terlebih dahulu sampel dibagi dalam dua bagian yaitu Analysis Sample sebagai sampel untuk membuat aturan pengklasifikasian dan Holdout Sample sebagai sampel untuk menguji ketepatan kalsifikasi dari aturan klasifikasi. Hair dkk (1988) mengusulkan ukuran sampel untuk sampel analysis adalah 75% dari sampel yang ada. Dari Sampel Analysis selanjutnya dikategorikan atas dua kelompok sampel yaitu kelompok yang baik dan kelompok tidak baik (perlu perbaikan) yang selanjutnya dilakukan pengujian hipotesis kesamaan proporsi dengan statistik uji berbentuk

    yang berdistribusi Chi kuadrat dengan dk =2p-1 Jika hasil pengujian bersifat signifikan, selanjutnya lakukan Klasifikasi dengan aturan

    1 2,D D D

    Dimana : 1 jika 1 2( ) ( )g x g x ; 2 jika 1 2 ; ( )i

    iN xg

    N

    Peluang kesalahan pengklasifikasian dari Sampel analysis dapat di hitung (i) Actual Error Rate (AER) :

    2 1 3 1

    1 1 2 2 2( ) ( ) ... ( ) ( ) ( ) ... ( ) ... ( )N N N

    nD D D D D D

    p D g x g x g x g x g x g x

    (ii) Apparent Error Rate (APER) : APER dihitung dengan terlebih dahulu nilai Ni diurutkan dari nilai terbesar Ni(k) hingga terkecil Ni(1) kemudian gunakan rumus :

    1(1) 1(2) 1( 1) ( 1)1( ) ( ) ( ) ... ( ) ( )k n k

    xp D N x N x N x N x

    N

    Kata kunci : Chi-Kuadrat, AER, APER

  • SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010

    Kelompok Matematika

    Terapan

    881

    1. PENDAHULUAN

    Dalam perindusrian terutama yang menghasilkan produk yang

    memerlukan ketelitian/presisis yang tinggi seperti komponen AIR BRAKE

    SYSTEM (sistem pengereman kereta api) yang merupakan hasil produk dari PT.

    PINDAD (Persero) Bandung untuk memenuhi pesanan khusus dari PT. KAI,

    maka produk yang dihasilkan harus memenuhi standar yang telah ditentukan.

    Untuk itu perlu dilakukan pengujian terhadap komponen-komponen Air Brake

    yang dihasilkan antara lain dengan mengandalkan uji fungsi (tidak diuji secara

    keseluruhan) yaitu pengujian yang dikerjakan oleh para pekerja dengan cara

    mencelupkan komponen yang diproduk kedalam air untuk mengetahui bocor atau

    tidak. Selama kurun waktu Mei 2007 sampai dengan Januari 2009 terdapat fakta

    terjadinya kebocoran dari produk yang dihasilkan untuk memenuhi pemesanan

    PT. KAI sebagai berikut :

    Tabel 1.1

    Jumlah Kebocoran Air Brake System

    Produk PT. PINDAD

    Waktu Sampel Pemeriksaan

    Baik % Bocor %

    Mei 2007 100 73 73,00 27 27,00

    Agustus 2007 60 40 67,00 20 33,00

    November 2007 500 370 74,00 130 26,00

    Juli 2008 510 360 70,59 150 29,41

    Januari 2009 336 248 73,80 88 26,20

    Terlihat dalam tabel di atas, produk yang mengalami kerusakan

    (kebocoran) dari waktu ke waktu cenderung meningkat. Tentunya jika hal ini

    terus menerus berlangsung tidak menutup terjadinya penangguhan pemesanan

    yang mengakibatkan dapat merugikan kedua belah pihak.

    Untuk menentukan apakah produk yang dihasilkan memenuhi standar atau

    tidak, tentukan dapat dilakukan dengan cara mengklasifikasikan berdasarkan uji

    yang telah dilakukan untuk setiap komponen produk. Dalam mengklasifikasikan

  • SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010

    Kelompok Matematika

    Terapan

    882

    hasil produknya, PT. PINDAD menggunakan 5 komponen dominan dari Air

    Brake System yang harus diperiksa, dimana untuk tiap komponen dikategorikan

    dalam data kualitatif berskala nominal (bocor atau tidak bocor).

    Berdasarkan data kualitatif untuk ke lima komponen tersebut, dapat

    ditentukan komponen mana yang paling dominan untuk membedakan klasifikasi

    satu kelompok dengan kelompok lainnya serta besar peluang kesalahan

    pengklasifikasiannya.

    2. TINJAUAN PUSTAKA

    2.1 Pengelompokkan berdasarkan satu variabel prediktor

    Pada saat kita dihadapkan pada persoalan pengelompokan dengan

    memperhatikan satu variabel prediktor, maka univariate classification dapat

    digunakan dengan tujuan : (i) untuk menaksir besarnya pengaruh variabel

    pengelompokkan ketika terdapat dua kelompok yang sudah tersedia sebelumnya,

    dan (ii) untuk menetapkan nilai pemisah variabel respon yang baik untuk

    menentukan standar agar unit sampel dapat dibagi ke dalam dua kelompok untuk

    mengidentifikasikan objek dengan tepat.

    a. Pengelompokkan berdasarkan dua atau lebih variabel prediktor Dalam mulivariate pengelompokan dapat dilakukan dengan beberapa

    merode, diantaranya Analisis Diskriminan. Analisis ini merupakan suatu teknik

    analisis statistika untuk mengelompokkan setiap objek ke dalam dua kelompok

    atau lebih berdasarkan kriteria sejumlah variabel bebas (interval atau rasio dan

    bersifat kuantitatif) sedangkan variabel tidak bebasnya merupakan kategori (non-

    metrik, nominal atau ordinal yang bersifat kualitatif) (Hair, 1998). Untuk

    melakukan analisis diskriminan, langkah pertama yang harus dilakukan adalah

    melakukan pengujian hipotesis apak terdapat perbedaan antara kedua kelompok

    populasi yang telah diketahui. Apabila terdapat perbedaan antara kedua kelompok

    maka analisis diskriminan dapat dilakukan, jika tidak terdapat perbedaan maka

    analisis diskriminan tidak perlu dilakukan.

    Hipotesis statistiknya berbentuk :

  • SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010

    Kelompok Matematika

    Terapan

    883

    1 2:oH Melawan

    1 1 2:H Statitik uji nya adalah :

    yang berdistribusi Chi kuadrat dengan dk =2p-1

    Menentukan Aturan Klasifikasi

    Untuk menentukan aturan klasifikasi ; jika banyaknya individu yang

    berasal dari populasi i pada X = x merupakan variabel acak binom Ni(x), i =

    1,2, sehingga banyaknya individu yang terambil menjadi sampel dari dua populasi

    1 1 dan 2 2 ( )N N x merupakan variabel acak Binom dengan

    1 2 .

    Peluang prior ditaksir oleh iiNN

    dan taksiran untuk peluang susunan

    adalah iii

    Sehingga taksiran untuk diskriminan adalah :

    ( )ii

    N xgN

    2.2.2 Menghitung peluang kesalahan Klasifikasi

    Setelah proses klasifikasi, selajutnya dapat diketahui seberapa tepat aturan

    klasifikasi yang telah ditentukan tersebut dengan menghitung nilai error rate yaitu

    proporsi kesalahan kalasifikasi dari Holdout Sample. Jika Nilai eror rate kecil

    maka ketepatan klasifikasi semakin tinggi.

    Jika klasifikasi yang dihasilkan dari sampel telah dihitung, dapat pula dihitung

    dua buah kesalahan klasifikasi yaitu

    (i) Actual Error Rate (AER)

  • SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010

    Kelompok Matematika

    Terapan

    884

    2 1 3 1

    1 1 2 2 2( ) ( ) ... ( ) ( ) ( ) ... ( ) ... ( )N N N

    nD D D D D D

    p D g x g x g x g x g x g x

    dan

    (ii) Apparent Error Rate (APER)

    1(1) 1(2) 1( 1) ( 1)1( ) ( ) ( ) ... ( ) ( )k n k

    xp D N x N x N x N x

    N

    2.2.3 Menentukan Variabel Diskriminator dan Subset variabel Terbaik Untuk menentukan variabel diskriminator dan subset variabel terbaik dalam

    analisis diskriminan diskrit dua kelompok dapat digunakan Statistik Kullback

    Divergence.

    Variabel Diskriminan terbaik dilakukan dengan langkah langkah sebagai berikut :

    (1) Hitung nilai j j dengan rumus :

    1 1 2 1 2 1 2 21 2

    1 21 1 2 2 1 2

    log logj j j j j j j jj j j j

    w w w Nw w w w NwJ N N

    N N N NN w w N w w

    (2) tentukan nilai j yang maximum :

    j = max j dengan 1 =j = p

    (3) Uji signifikan Z1 Melawan

    Statistik ujinya adalah j dengan kriteria tolak Ho jika j >

    dengan dk = 1

    3. APLIKASI

    Dalam mengkategorikan apakah setiap produk ISOLATING COCK L I

    dalam hal ini Air Brake yang dihasilkan oleh PT PINDAD Persero termasuk

  • SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010

    Kelompok Matematika

    Terapan

    885

    kategori yang baik atau harus ada perbaikan telah dilakukan pemeriksaan atas 5

    komponen : Housing (X1), Flens (X2), Ventilasi (X3), Penutup(X4), dan Segmen

    (X5). Masing-masing komponen dinilai atas kriteria bocor (skor 1) atau baik (

    skor 0). Dari 336 sampel acak, telah dikelompokkan atas 32 kelompok

    berdasarkan 5 komponen pemeriksaan sebagai berikut :

    Tabel 3.2

    Data Hasil Pemeriksaan Lima Komponen ISOLATING COCK L I/Air Brake Kelompok Komponen Kelompok Jumlah Hasil Pengujian

    X1 X2 X3 X4 X5 Baik Jelek

    1 0 0 0 0 0 47 0 47 2 1 0 0 0 0 7 2 9 3 0 1 0 0 0 6 0 6 4 0 0 1 0 2 2 14 16 5 0 0 0 1 0 1 45 46 6 0 0 0 0 1 1 5 6 7 1 1 0 0 0 2 1 3 8 1 0 1 0 0 4 12 16 9 1 0 0 1 0 1 13 14 10 1 0 0 0 1 2 2 4 11 0 1 1 0 0 2 5 7 12 0 1 0 1 0 6 4 10 13 0 1 0 0 1 0 1 1 14 0 0 1 1 0 6 21 27 15 0 0 1 0 1 1 4 5 16 0 0 0 1 1 2 8 10 17 1 1 1 0 0 5 1 6 18 1 1 0 1 0 1 3 4 19 1 1 0 0 1 4 2 6 20 1 0 1 1 0 7 6 13 21 1 0 1 0 1 2 2 4 22 1 0 0 1 1 4 2 6 23 0 1 1 1 0 1 20 21 24 0 1 1 0 1 3 5 8 25 0 1 0