pengenalan pola - universitas brawijayapada teori keputusan bayes, kita perhatikan tiga langkah...

30
Pengenalan Pola PTIIK - 2014 Klasifikasi Teori Keputusan Bayes

Upload: others

Post on 28-May-2020

17 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Pengenalan Pola

PTIIK - 2014

Klasifikasi – Teori Keputusan Bayes

Page 2: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Course Contents

Teori Keputusan Bayes 1

Fase Training 2

Fase Testing 3

Latihan 4

Page 3: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Prosedur Keputusan Bayes

Prosedur pengenalan pola dan pengambilan keputusan

X : semua data observasi menggunakan sensors dan instruments

yang tersedia

x : merupakan himpunana fitur yang dipilih dari komponen X, atau

fungsi linier dari X.

w : adalah inner belief/perception tentang subject dari class.

α : adalah aksi yang kita ambil untuk x.

Dari prosedur tersebut didapatkan definisi dari 3 ruang vektor sebagai

berikut:

subjects Features x

Observables X

Action a

Inner belief w

},...,,{,classindex

vector),...,,(

α,,

k21

C

d21

αCd

wwww

w

adalah

adalahxxxx

x

Page 4: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Contoh Kasus

Klasifikasi Ikan X=I adalah citra ikan,

x =(brightness, length, fin#, ….)

w merupakan tingkat kepercayaan

kita bahwa tipe ikan adalah

c={“sea bass”, “salmon”,

“trout”, …}

α merupakan keputusan tipe ikan,

pada kasus ini c= a

a ={“sea bass”, “salmon”,

“trout”, …}

Diagnosis Medis

X= semua hasil test medis, citra hasil scan

x =(blood pressure, glucose level, cough, x-

ray….)

w merupakan tipe sakit yang diderita

c={“Flu”, “cold”, “TB”, “pneumonia”, “lung

cancer”…}

a merupakan keputusan untuk penanganan

yang diberikan pada pasien,

a ={“Tylenol”, “Hospitalize”, …}

Page 5: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fokus Metode

Pada teori keputusan Bayes, kita perhatikan tiga langkah

terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih sebelumnya.

subjects Features x

Observables X

Decision a

Inner belief w

control sensors

selecting Informative

features

statistical inference

risk/cost minimization

Page 6: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Keputusan Bayes Keputusan akan dibuat ketika semua distribusi dari probabilitas dari

data diketahui, Sehingga keputusan akan menjadi optimal ketika

distribusi data diketahui.

Untuk kasus dua kelas yang terdefinisi : w1 dan w2 ,

Probabilitas Prior untuk data observasi baru yang belum diketahui

didefiniskan dengan:

P(w1) : probabilitas observasi data baru menjadi milik dari class 1

P(w2) : probabilitas observasi data baru menjadi milik dari class 2

P(w1 ) + P(w2 ) = 1

• Probabilitas tersebut mencerminkan pengetahuan sebelumnya.

• Aturan keputusan untuk object baru :

Object akan diklasifikasikan sebagai class 1 Jika P(w1 ) > P(w2 )

Page 7: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Teori Keputusan Bayes

Tingkat kepercayaan terhadap class w dihitung menggunakan

aturan Bayes :

Tingkat resiko dihitung dengan :

Features x

Decision a(x)

Inner belief p(w|x)

statistical Inference

risk/cost minimization

Two probability tables:

a). Prior p(w)

b). Likelihood p(x|w)

A risk/cost function

(is a two-way table)

l(a | w)

)(

)()|()|(

xp

pxpxp

www

k

xxR1j

jjii )|)p(|()|( wwala

Page 8: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Keputusan Bayes

Kita mendefiniskan fitur untuk setiap object dengan :

P(x| w1) & P(x| w2) : class-specific density

Aturan Bayes:

Page 9: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Aturan Keputusan

Aturan keputudsan merupakan fungsi mapping function

dari ruang fitur ke himpunan aksi yang akan diambil

Keputusan yang acak (random) tidak optimal

Keputusan yang dibuat berdasarkan fungsi yang

meminimalkan resiko / average cost

Fungsi tersebut akan minimal ketika keputusan yang kita

ambil dibuat untuk meminimalkan cost / resiko untuk

setiap instance x

aa d:)(x

dx)()|)(( xpxxRR a

k

j

jj xpxRx1

)|()|(minarg)|(minarg)( wwalaaaa

Page 10: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Bayessian Error Pada kasus khusus, seperti klasifikasi ikan, aksi yang

diambil adalah klasifikasi yang diasumsikan eror : 0/1

Resiko klasifikasi x ke class αi adalah,

jiji

jiji

if

if

wawal

wawal

1)|(

0)|(

)|(1)|p()|( iji

ij

xpxxR awaaw

Page 11: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Contoh Dataset (Ikan Salmon & Sea Bass) :

(Misal hanya menggunakan 1 fitur, yaitu “Width”) menggunakan

konsep Risk/ Cost.

No (Width) sebagai Fitur 1 Kelas

1 9 Salmon

2 11 Sea Bass

3 9 Sea Bass

4 12 Salmon

.

.

.

.

.

M 15 Sea Bass

Page 12: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Contoh Dataset (Smurf or Troll) :

(Misal hanya menggunakan 1 fitur, yaitu “Height”) menggunakan

konsep univariate normal distribution.

Jika Height = 2” , tentukan kelas Creaturenya !

Height Creature

2.70” Smurf

2.52” Smurf

2.57” Smurf

2.22” Smurf

3.16” Troll

3.58” Troll

3.16” Troll

Page 13: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Contoh Dataset (Smurf or Troll) :Langkah-langkah penyelesaian :

1. Menghitung STD dari trolls dan smurfs.

Page 14: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Contoh Dataset (Smurf or Troll) :

2. Menghitung Prob. Likelihood dari trolls dan smurfs.

Page 15: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Contoh Dataset (Smurf or Troll) :

3. Menghitung Prob. Prior dari trolls dan smurfs.

4. Sehingga didapatkan Prob. Posterior berikut :

dan

Jika P(smurf | 2”) > P(troll | 2”) maka Height = 2” masuk kelas Smurf.

Dan sebaliknya.

Page 16: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Jika fiturnya lebih dari satu, maka gunakan :

Teori Peluang Biasa :

Contoh :

Fitur(R,T,D) : rash (R), temperature (T), dizzy(D).

Kelas(C) : 1 atau 0. (Terdapat 40 data training)

Fase Training :

(Meringkas data training sesuai dengan

frekuensi)

Page 17: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Testing

Fase Testing :

Data uji x1 = (1 1 1) x2 = (1 0 0) x3 = (0 1 0)

Klasifikasi didasarkan pada

penghitungan probabilitas

posterior. Misalkan :

Jika P(C = 1 | X) > 0.5 maka C = 1

Jika tidak, maka C = 0.

Page 18: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Distribusi Normal multivariate No (Width) sebagai Fitur ke-1 (Lightness) Sebagai Fitur ke-2 Kelas

1 9 8.4 Salmon

2 11 9.7 Sea Bass

3 9 2.6 Sea Bass

4 12 10.1 Salmon

.

.

.

.

.

M 15 7.2 Sea Bass

Page 19: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Distribusi Normal multivariate (Data Kontinyu) :

Contoh :

Jika diketahui “Curvatur Chip Ring = 2.81” dan “Diameter Chip

Ring = 5.46” maka, Kelas Quality Control Result-nya masuk ?

(Selesaikan menggunakan teorema keputusan bayesian)

Curvature Diameter Quality Control Result

2.95 6.63 Passed

2.53 7.79 Passed

3.57 5.65 Passed

3.57 5.45 Passed

3.16 4.46 Not passed

2.58 6.22 Not passed

2.16 3.52 Not passed

Page 20: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Distribusi Normal multivariate (Data Kontinyu) :

Fase Training :

X = features (variables independent)

Y = Kelas/ Group (variables dependent)

2. Memisahkan x berdasarkan group : 1. Labeling Dataset :

Page 21: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Distribusi Normal multivariate (Data Kontinyu) :

Fase Training :

X = features (variables independent)

Y = Kelas/ Group (variables dependent)

4. Hitung (Mean Corrected) :

(xi minus mean global)

3. Hitung μi = mean features dari

group i dan μ = mean global

 

x i0

Page 22: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Distribusi Normal multivariate (Data Kontinyu) :

Fase Training :

5. Hitung matrik Kovarian group i

Page 23: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Training

Distribusi Normal multivariate (Data Kontinyu) :

Fase Training :

Sehingga didapat nilai p(2.81,5.46 | Passed) dan p(2.81,5.46 | Not_passed)

6. Hitung Likelihood dari Curvatur = 2.81” dan “Diameter = 5.46” :

7. Probabilitas Prior : p(Passed) = 4/7 dan p(Not_passed) = 3/7

Page 24: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Fase Data Testing

Distribusi Normal multivariate (Data Kontinyu) :

Fase Testing:

Jika p(Passed | 2.81,5.46) > p(Not_passed | 2.81,5.46) , maka

Curvatur = 2.81” dan “Diameter = 5.46” masuk kelas “Passed”. Dan

sebaliknya.

Jadi Prob. Posterior Curvatur = 2.81” dan “Diameter = 5.46” adalah sbb :

)46.5,81.2(

)()|46.5,81.2()46.5,81.2|(

p

PassedpPassedpPassedp

p(Not _ passed | 2.81,5.46) =p(2.81,5.46 |Not _ passed)p(Not _Passed)

p(2.81,5.46)

Page 25: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Latihan 1

Perhatikan grafik distribusi pada proses klasifikasi ikan Sea Bass (ω2) dan ikan Salmon (ω1). A1 :

Memberikan hasil keputusan bahwa ikan yang diuji coba adalah termasuk kelas ikan Sea Bass.

A2 : Memberikan hasil keputusan bahwa ikan yang diuji coba adalah termasuk kelas ikan Salmon.

Probabilitas Prior ikan Sea Bass dan Salmon masing-masing P(ω2) = 2/3 dan P(ω1) = 1/3.

Biaya/Cost jika hasil klasifikasinya adalah ikan salmon, tapi sebenarnya ikan tersebut adalah ikan

sea bass sebesar λ(A2 | ω2) = $2, dan Biaya jika hasil klasifikasinya adalah ikan sea bass laut,

tapi sebenarnya ikan tersebut adalah salmon sebesar λ(A1 | ω1) = $1.

Tentukan hasil keputusan klasifikasi jika input x = 13, dimana probabilitas likelihoodnya masing-

masing P(x | ω1) = 0,28 dan P(x | ω2) = 0,17 dengan pertimbangan Cost/ Resiko yang ada !

Penyelesaian :

Diketahui :

ω1 Kelas Salmon

ω2 Kelas Sea Bass

A1 Decide Input is Sea Bass

A2 Decide Input is Salmon

λ(A2 | ω2) = $2 dan λ(A1 | ω1) = $1

)(0)|(

)(0)|(

berbedayangkelaspadamengarahAjikabiayasatuanA

samayangkelaspadamengarahAjikabiayasatuanA

jiji

jiji

wwl

wwl

Page 26: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Jawab :

Latihan 1 (Cont.)

)()()()(

)3/2)(17,0(

2211 wwww PxPPxP

)(

)()()(

22

2xP

PxPxP

www

5521,02063,0

1139,0

1139,00924,0

1139,0

))3/2)(17,0(())3/1)(28,0((

)3/2)(17,0(

)(

)()()(

11

1xP

PxPxP

www

)()()()(

)3/1)(28,0(

2211 wwww PxPPxP

4479,02063,0

0924,0

1139,00924,0

0924,0

))3/2)(17,0(())3/1)(28,0((

)3/1)(28,0(

(Menghitung Probabilitas Posterior ) (Menghitung Risk/Cost)

)2(

)()()(2

1

kelasbanyaknyamenyatakan

xPAxAR j

j

jii

wwl

)()()()()( 2221122 xPAxPAxAR wwlwwl

))5521,0)(2(($))4479,0)(0(($

1042,1$1042,1$0$

)()()()()( 2211111 xPAxPAxAR wwlwwl

))5521,0)(0(($))4479,0)(1(($

4479,0$0$4479,0$

Melihat nilai biaya resiko dari

R(A1 | x) < R(A2 | x) , maka x = 13

masuk kelas Sea Bass.

)(minarg)( xARx ia

Keputusan dilihat dari nilai :

Page 27: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Latihan 2

Perhatikan Dataset berikut :

Jika Height = 2.90”, Tentukan kelas Creaturenya !

Page 28: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Tugas

Buatlah aplikasi pengenalan pola dari data UCI yang

kalian kumpulkan sebelumnya

Minimal menggunakan MS Excel (direkomendasikan

menggunakan bahasa pemrograman tertentu, baik desktop-

based maupun web-based)

metode yang digunakan untuk mengenali pola adalah Teori

Keputusan Bayes

Ketentuan Data yang digunakan:

25 data training untuk setiap kelas

10 data testing untuk setiap kelas

Gunakan hanya 3 fitur terbesar berdasarkan perhitungan nilai

eigen value yang didapatkan dari tugas sebelumnya

Page 29: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

Munculkan keluaran sesuai dengan tahapan-tahapan

penyelesaian dalam klasifikasi menggunakan Teori

Keputusan Bayes

Sheet1 / Form1 Data

Sheet2 / Form2 Mean, Varians, Likelihood, Prior, Posterior,

dan Hasil Klasifikasi

Page 30: Pengenalan Pola - Universitas BrawijayaPada teori keputusan Bayes, kita perhatikan tiga langkah terakhir yang mengasumsikan bahwa observasi telah dilakukan dan fitur telah dipilih

[email protected]

081 331 834 734 / 088 160 127 40