iii - clustering-1...k - means clustering nsebuah algoritma untuk mengelompokkan data, berdasar pada...

48
+ PEMODELAN SISTEM NI KETUT DEWI ARI JAYANTI, ST., M.KOM Murthy, DNP et al; Mathematical Modeling : A Tool For Problem Solving In Engineering, Physical, Biological and Social Sciences” Togar M. Simatupang, Pemodelan Sistem; Nindita Klaten, 1995. Askin; Analysis and Modelling of Manufacturing Systems”, 1993.

Upload: others

Post on 06-Aug-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

PEMODELAN SISTEMNI KETUT DEWI ARI JAYANTI, ST., M.KOM

Murthy, DNP et al; Mathematical Modeling : A Tool For Problem Solving In Engineering, Physical, Biological and Social Sciences”

Togar M. Simatupang, Pemodelan Sistem; Nindita Klaten, 1995. Askin; Analysis and Modelling of Manufacturing Systems”, 1993.

Page 2: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

CLUSTERING

Page 3: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ILUSTRASI CLUSTERING

Page 4: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ILUSTRASI CLUSTERING cont’d

Page 5: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ILUSTRASI CLUSTERING cont’d

Page 6: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ILUSTRASI CLUSTERING cont’d

Page 7: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLUSTER

Page 8: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLUSTERING

Page 9: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLASSIFICATION vs CLUSTERING

Page 10: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLASSIFICATION

Page 11: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLASSIFICATION

Page 12: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLUSTERING

Page 13: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+CLUSTERING

Page 14: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+KARAKTERISTIK CLUSTERING

Page 15: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+PARTITIONING CLUSTERING

Page 16: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+HIERARCHICAL CLUSTERING

Page 17: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+OVERLAPPING CLUSTERING

Page 18: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+HYBRID

Page 19: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ALGORITMA CLUSTERING

Page 20: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ALGORITMA CLUSTERING

Page 21: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+K - MEANS CLUSTERING

J. Macqueen (1967)

J. A. Hartigan dan M. A. Wong (1975)

Page 22: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

Tentukan berapa banyak cluster yang ingin dibentuk ?

Nilai K = jumlah cluster

Ex. K = 5

Page 23: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

Tentukan titik pusat cluster (centroid) awal secara acak

Page 24: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

Setiap dataset akan menemukan centroid terdekatnya yaitu dengan menghitung jarak setiap data ke masing-masing centroid menggunakan rumus korelasi antar dua objek.

Ex. Euclidean DistanceKesamaan Cosine

Page 25: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

Setiap centroid akan menemukan centroid baru.

Page 26: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

Centroid berpindah.

Hal ini akan terus berulang sampai terminated.

Page 27: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 28: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 29: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 30: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 31: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 32: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 33: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 34: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 35: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

DONE

Page 36: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+K - MEANS CLUSTERING

n Sebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group).

n K merupakan bilangan integer positive.

n Pengelompokkan dilakukan dengan meminimalisasi jumlah jarak setiap data ke cluster nya.

Page 37: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

Page 38: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

EXAMPLE

Page 39: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

EUCLIDEAN DISTANCE

Page 40: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+Example

OBJECT DATA Weight Index Ph

Medicine A 1 1

Medicine B 2 1

Medicine C4 3

Medicine D5 4

n K = 2

Page 41: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

Page 42: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ Tentukan Centroid

Dinyatakan centroid awal : Medicine A dan Medicine B.

C1 = (1,1) ; C2 = (2,1)

Page 43: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ Tentukan Jarak Object terhadap Centroid

Euclidean Distance

p1(x1, y1) ; p2(x2, y2)

D = √ (x1 – x2)2 + (y1 – y2)2

A B C D

1 2 4 5 X

1 1 3 4 Y

Ex. : Jarak Medicine B (2,1) terhadap centroid pertama C1 = (1,1)

C1 = (1,1) ; √ (2 – 1)2 + (1 – 1)2 = 1 , jarak terhadap centroid kedua C2 = (2,1)

C2 = (2,1) ; √ (2 – 2)2 + (1 – 1)2 = 0

Page 44: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ A B C D

0 1 3,61 5 C1

1 0 2,83 4,24 C2

D0 =

A B C D

1 0 0 0 G1

0 1 1 1 G2

1 = True

0 = False

G0 =

Page 45: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+Tentukan centroid baru

èBerdasar pada keanggotaan group (cluster)

G1 memiliki 1 member : medicine A

G2 memiliki 3 member : medicine B, medicine C, medicine D

Centroid baru merupakan rata2 koordinat dari membershipnya

C2 = 2 + 4 + 5 , 1 + 3 + 4 ,3 3

=11 8

33

Page 46: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan
Page 47: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+

NEXT....

Page 48: III - Clustering-1...K - MEANS CLUSTERING nSebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group). nK merupakan

+ 4. Lakukan Clustering dengan algoritma K-Means Clustering dan Eucludian Distance terhadap data berikut .

Dimana nilai K = 2 dan centroid awal Person #3 (35, 65) Person #7 (34, 48)

OBJECT DATA Age Weight

Person #1 25 50

Person #2 26 48

Person #3 35 65

Person #4 67 60

Person #5 55 65

Person #6 53 60

Person #7 34 48

Person #8 48 50