analisis cluster
Post on 30-Oct-2015
430 Views
Preview:
TRANSCRIPT
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 1/30
Laporan Praktikum Analisis Multivariat
“Analisis Kluster”
Disusun untuk memenuhi praktikum Analisis Multivariat
oleh:
Nama : Suprianto NIM : 0910950069
Asisten : 1. Danny Prasetyo Hartanto
2. Aris Wicaksono
Tanggal : 8 Mei 2012
LABORATORIUM STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PEGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2012
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 2/30
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 3/30
BAB I
TINJAUAN PUSTAKA
1.1 Analisis Cluster (Cluster Analysis) .Analisis Cluster adalah teknik yang digunakan untuk
mengidentifikasi objek atau individu yang serupa denganmemperhatikan beberapa kriteria (Kuncoro, 2003:242).
Analisis cluster yaitu analisis untuk mengelompokkanelemen yang mirip sebagai objek penelitian menjadikelompok (cluster) yang berbeda dan mutually exclusive
(Supranto, 2004:26).Analisis cluster termasuk dalam analisis statistik
multivariat metode interdependen. Sebagai alat analisisinterdependen maka tujuan analisis cluster tidak untuk menghubungkan ataupun membedakan dengansampel/variabel lain. Analisis cluster merupakan salah satualat analisis yang berguna sebagai peringkas data. Dalammeringkas data ini dapat dilakukan dengan jalan
mengelompokkan objek-objek berdasarkan kesamaankarakteristik tertentu di antara objek-objek yang hendak diteliti (Tim Penelitian dan Pengembangan, 2005:120).
Analisis cluster adalah suatu alat untuk mengelompokkansejumlah n obyek berdasarkan p variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek – obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil dibandingkan keragaman antar kelompok.
Obyek dapat berupa barang, jasa, tumbuhan, binatang danorang (responden, konsumen, atau yang lainnya). Obyek tersebut akan diklasifikasikan ke dalam satu atau lebihcluster (kelompok) sehingga obyek – obyek yang beradadalam satu cluster akan mempunyai kemiripan ataukesamaan karakter.
Jika terdapat n obyek dan p variat, maka observasi xij
dengan i = 1, 2,…, n dan j = 1, 2, …, p, dapat digambarkansebagai berikut:
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 4/30
Var 1 Var 2 … Var j … Var p
Obyek 1 x11
x12
… x1j … x
1p
Obyek 2 x21
x22
… x2j
… x2p
: : : : : : :
Obyek i xi1
xi2
: xij
: xip
: : : : : : :
Obyek n xn1
xn2
: xnj
: xnp
Adapun ciri-ciri cluster adalah:1. Homogenitas (kesamaan) yang tinggi antar anggota dalam
satu cluster (within-cluster ).2. Heterogenitas (perbedaan) yang tinggi antar cluster yang
satu dengan cluster yang lainnya (between-cluster ).Analisis cluster mempunyai beberapa istilah penting,
antara lain:1. Skedul aglomerasi (agalomeration schedule), ialah
jadwal yang memberikan informasi tentang objek ataukasus yang akan dikelompokkan pada setiap tahap padasuatu proses analisis cluster yang hierarkis.
2. Rata-rata cluster (cluster centroid ), ialah nilai rata-ratavariabel dari semua objek atau observasi dalam cluster tertentu.
3. Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam cluster nonhierarki.
4. Keanggotaan cluster (cluster membership), ialahkeanggotaan yang menunjukkan cluster untuk setiap
objek yang menjadi anggotanya.5. Dendogram, disebut juga grafik pohon, output SPSSyang memvisualisasikan hasil analisis cluster yangdilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang digabung bersama. Posisigaris pada pada skala menunjukkan jarak untuk manacluster digabung. Dendogram harus dibaca dari kiri kekanan.
6. Distances between cluster centers, ialah jarak yangmenunjukkan bagaimana terpisahnya pasangan individucluster (Supranto, 2004:146).
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 5/30
1.2 Tujuan Analisis Cluster
Setelah mengelompokkan n buah obyek pengamatankedalam m kelompok berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah untuk
mendapatkan kelompok obyek yang memiliki nilai relatif sama. Sehingga kelak dalam interpretasi, obyek-obyek yang berada pada satu cluster memiliki peluang yang cukup tinggiakan muncul bersamaan pada satu individu.
1.3 Konsep Dasar dalam Analisis Cluster
Analisis cluster merupakan suatu kelas teknik,dipergunakan untuk mengklasifikasi obyek atau kasus ke
dalam kelompok yang relatif homogen, yang disebut cluster.Obyek dalam setiap kelompok cenderung mirip satu samalain dan berbeda jauh (tidak sama) dengan obyek dari cluster lainnya (Supranto, 2004:142).
Pengelompokkan dilakukan berdasarkan kemiripan( similarity) antar obyek. Kemiripan diperoleh denganmeminimalkan jarak antar obyek dalam kelompok (within-
cluster ) dan memaksimalkan jarak antar kelompok (between-
cluster ).1.4 Proses Analisis Cluster
Untuk melakukan analisis cluster ada beberapa prosesyang harus dilakukan . Proses analisis cluster tersebutmeliputi :1. Menentukan ukuran ketakmiripan antar dua objek.
Sesuai prinsip daftar cluster yaitu mengelompokkanobjek yang mempunyai kemiripan, maka proses pertama
adalah mengukur seberapa jauh ada kesamaan antar objek.Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek tertentu lebih miripdibandingkan dengan obyek lain, akan menghilangkankebingungan dan mempermudah proses formal dalam pengclusteran. Salah satu yang jelas bisa menjadi ukuranketakmiripan adalah fungsi jarak antara objek a dan b,yang biasa dinotasikan dengan d(a,b).
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 6/30
Sifat – sifat ukuran ketakmiripan adalah :1) d(a.b) ≥ 0
2) d(a,a) = 03) d(a,b) = d(b,a)
4) (a,b) meningkat seiring semakin tidak miripkedua objek a dan b.
5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).
Jarak yang paling umum digunakan adalah jarak euclidean. Ukuran jarak atau ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d
ih. Nilai d
ih
diperoleh melalui perhitungan jarak kuadrat Euclidean
sebagai berikut ∑
dimana:d
ih= jarak kuadrat Euclidean antar obyek ke-i dengan
obyek ke-h. p = jumlah variabel cluster.
xij
= nilai atau data dari obyek ke-i pada variabel ke-j.
xhj
= nilai atau data dari obyek ke-h pada variabel ke-j
(Everitt, 1993).2. Membuat Cluster
Proses cluster atau pengelompokan data bisadilakukan dengan dua metode:a. Metode Hirarki
Metode ini memulai pengelompokan dengan dua ataulebih objek yang mempunyai kesamaan paling dekat.
Kemudiaan operasi diteruskan ke objek lain yangmempunyai kedekatan kedua. Demikian seterusnyasehingga cluster akan membentuk semacam ‘pohon’
dimana ada hirarki (tingkatan) yang jelas antar objek,dari yang paling mirip sampai paling tidak mirip.Metode yang digunakan untuk proses Clustering secarahirarki adalah Single Linkage (Pauatan Tunggal).Metode ini akan mengelompokan dua objek yang
mempunyai jarak terdekat dahulu. Jadi padasetiaptahapan, banyaknya cluster berkurang satu.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 7/30
Secara formal, dua buah cluster Br dan B
s, jarak antara
Br dan B
smisalkan h(B
r ,B
s) didefinisikan sebagai :
h(Br ,B
s) = min{d(x
i,x
j); x
ianggota B
r , x
janggota
Bs}Hasil berupa single linkage clustering dapat disajikandalam bentuk suatu dendogram atau diagram pohon.Cabang-cabang pohon menunjukkan cluster/kelompok.Cabang-cabang tersebut bertemu bersama-sama(menggabung) pada simpul yang posisinya sepanjangsuatu sumbu jarak (kemiripan) menunjukkan tingkatdimana penggabungan terjadi.
b. Metode Non-hirarkiMetode ini dimulai dengan proses penentuan jumlah
cluster terlebih dahulu. Metode Non-hirarki yangdigunakan adalah k-means. Metode k-means digunakansebagai alternatif metode cluster untuk data denganukuran yang besar karena memiliki kecepatan yang lebihtinggi dibandingkan metode hirarki.
Mac Queen menyarankan bahwa penggunaan k-
means untuk menjelaskan algoritma dalam penentuansuatu objek ke dalam cluster tertentu berdasarkan rataanterdekat. Proses Pengelusteran dengan metode k-means
adalah :1) Menetukan besarnya k, yaitu banyaknya cluter dan
menentukan centroid di tiap cluster.2) Menghitung jarak tiap objek dengan setiap centroid .
3) Menghitung kembali rataan (centroid ) untuk cluster yang baru terbentuk.4) Mengulangi langkah 2 sampai tidak ada lagi
pemindahan objek antar cluster (Sartono, 2003:230).
3. Setelah cluster terbentuk, baik dengan metode hirarkimaupun non hirarki, langkah selanjutnya melakukan
interpretasi terhadap cluster yang terbentuk,yang padaintinya memberi nama spesifik untuk menggambar isicluster tersebut.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 8/30
4. Melakukan validasi cluster.Untuk menguji validasi cluster digunakan uji parsial F.Hipotesis:
H0: variabel i bukan variabel pembeda dalam
pengclusteran.H
1: variabel i merupakan variabel pembeda dalam
pengclusteranTaraf signifikansi α
Statistik uji
Kriteria Uji :Tolak H0 jika F > F
α, k -1,n-k
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 9/30
BAB II
METODOLOGI
2.1 Sumber Data
Data yang digunakan untuk analisis kluster adalah Data Dataindikator kesejahteraan beberapa negara. Data ini di peroleh dari
contoh data SPSS world95.sav.
2.2 Tahapan Analisis
2.2.1 Standarisasi dan Analisis Komponen Utama1. Masukkan data ke SPSS 16.
2. Kemudian lakukan transformasi (standarisasi) Klik Analyze Descriptive Statistics DescriptivesSeperti di bawah ini :
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 10/30
3. Akan muncul kotak dialog seperti di bawah ini, masukkansemua variable kedalam kolom Variable(s), kemudiancentang Save standardized values as variables. Lalu klik OK.
4. Maka akan muncul hasilnya, seperti di bawah ini
5. Menghitung korelasi pearson. Analyze Correlate Bivariate.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 11/30
6. Akan muncul kotak dialog seperti di bawah ini, masukkansemua variable Zscore ke kolom Variables. Lalu klik OK .
7. Selanjutnya, melakukan Analisis Komponen karena adavariabel-variabel yang berkorelasi.
Klik Analyze Data Reduction Factor.
8. Dan akan muncul kotak dialog seperti dibawah ini :
Masukkan variabel Zscore ke dalam kotak variables, karenanilai standar deviasi antar variabel besar.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 12/30
9. Pilih Extraction,maka akan muncul kotak dialog, seperti di bawah ini.
Selanjutnya centang Covariance matrix karena data yangdigunakan adalah variabel standardized . Dan number of
factor diisi 7 atau sesuai banyaknya variabel. lalu Continue.
10. Pilih Scores, maka akan muncul kotak dialog, seperti di bawah ini, setelah itu centang Save as
variables Regression, dan centang juga Display factor score coefficient matrix. Lalu continue.
11. Klik OK . Maka akan muncul hasil seperti berikut ini :
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 13/30
2.2.2 Analisis Cluster Hierarchy1. Klik Analyze Classify Hierarchical cluster
2. Dan akan muncul kotak dialog seperti dibawah ini :
Masukkan variabel Country ke dalam kotak Label Cases By,dan juga masukkan Komponen utama yang terbentuk ( REGR
Factor Score) ke dalamVariable(s).
3. PilihStatistics, maka akan muncul kotak dialog, seperti di
bawah ini.
Selanjutnya centang Aglomeration schedule dan Proximitymatrix. Pada Cluster membership pilih none. lalu Continue.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 14/30
4. Pilih Plots,akan muncul kotak dialog seperti di bawah ini
Selanjutnya centang Dendogram dan icicle pilih none laluContinue.
5. Pilih Methods, akan muncul kotak dialog seperti di bawah ini
setelah itu pada Cluster Method pilih Between-Group
linkage dan pada Measure pilih Euclidean Distance. Lalucontinue.
6. Pilih Save, maka akan muncul kotak dialog seperti di bawahini
setelah itu pada Cluster Membership pilih None. Lalu
continue.
7. Klik OK.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 15/30
2.2.3 Penentuan Jumlah Cluster1. Copy tabel Aglomeration Schedule pada Output SPSS ke
Microsoft Excel
2. Selanjutnya cari selisih dari stage-stage secara berurutan dariniai Coefficiens. Kemudian cari nilai stage terkecil dari
selisih terbesar untuk menentukan jumlah kluster denganrumus:Jumlah Cluster = banyaknya Objek -stage terkecil dari
selisih terbesar
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 16/30
3. Untuk melihat iterasi sampai terbentuk jumlah kluster dengan mengurutkan mulai dari stage 1 dengan anggotaCluster 1 dan Cluster 2 dan stage selanjutnya dengan melihatnext stage. Dan seterusnya sampai diperoleh iterasi sampai
akhir (diberi warna hijau).
2.2.4 menentukan Anggota Kluster1. Klik Analyze Classify Hierarchical cluster
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 17/30
2. Dan akan muncul kotak dialog seperti dibawah ini :
Masukkan variabel Country ke dalam kotak Label Cases By,dan juga variabel awal yang lain ke Variable(s).
3. PilihStatistics, maka akan muncul kotak dialog, seperti di bawah ini.
Selanjutnya centang Aglomeration schedule dan Proximity
matrix. Pada Cluster membership pilih single solution dan pada Number of cluster isi dengan 3. lalu Continue.
4. Pilih Plots, maka akan muncul kotak dialog, seperti di bawahini.
Selanjutnya centang Dendogram dan icicle pilih all cluster lalu Continue.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 18/30
5. Pilih Methods, maka akan muncul kotak dialog seperti di bawah ini
setelah itu pada Cluster Method pilih Between-Group
linkage dan pada Measure pilih Euclidean Distance. Lalucontinue.
6. Pilih Save, akan muncul kotak dialog seperti di bawah ini
Setelah itu Pada Cluster membership pilih single solutiondan pada Number of cluster isi dengan 3. lalu Continue.
7. Klik OK.Dan akan muncul sebagai berikut
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 19/30
2.2.5 Menentukan Karakteristik Tiap Kluster1. Klik Data Select CaseSeperti di bawah ini :
2. Lalu akan muncul kotak dialog seperti di bawah ini dan Pilih If Cinditional issatisfied If…
3. Masukkan average linkage pada dialog dan tuliskan
CLU3_1=1 pada dialog dan klik continue
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 20/30
4. Klik OK dan akan muncul sebagai berikut.
5. Cari nilai mean, Klik Analyze Descriptive Statistics Descriptives
6. Akan muncul kotak dialog seperti di bawah ini, masukkansemua variable ke dalam kolom Variable(s), kemudian. Laluklik OK.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 21/30
7. Pilih Optios pilih Mean. Klik Continue
8. Klik OK
9. Lakukan dengan cara yang sama untuk CLU3_1=2 danCLU3_1=3
10. Kemudian dari mean ketiga kluster tersebut dicari meanterbesar tiap-tiap kriteria dan mean terbesar tersebutmerupakan karakteristik dari kluster dengan mean terbesar itu sendiri.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 22/30
BAB III
HASIL DAN PEMBAHASAN
3.1 Data dan Kasus
Data indikator kesejahteraan beberapa negara.
COUNTRY
DE
NSITY
UR BA
N
LIFEEXPF
LIFEEXPM
LITER ACY
BABYMOR T
GDP _ CAP
Afghanistan 25 18 44 45 29 168 205
Bangladesh 800 16 53 53 35 106 202
Cambodia 55 12 52 50 35 112 260
China 124 26 69 67 78 52 377
Hong Kong 5494 94 80 75 77 5.8 14641
India 283 26 59 58 52 79 275
Indonesia 102 29 65 61 77 68 681
Japan 330 77 82 76 99 4.4 19860
Malaysia 58 43 72 66 78 25.6 2995
N. Korea 189 60 73 67 99 27.7 1000
Pakistan 143 32 58 57 35 101 406
Philippines 221 43 68 63 90 51 867
S. Korea 447 72 74 68 96 21.7 6627
Singapore 4456 100 79 73 88 5.7 14990
Taiwan 582 71 78 72 91 5.1 7055
Thailand 115 22 72 65 93 37 1800
Vietnam 218 20 68 63 88 46 230
Sumber data : Contoh data SPSS world95.sav
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 23/30
Keterangan variabel :
Variabel Penjelasan
Density Banyaknya penduduk per km persegi
Urban Persentase penduduk yang tinggal di perkotaan
Lifeexpf Harapan hidup penduduk perempuan (tahun)
Ligeexpm Harapan hidup penduduk laki-laki (tahun)
Literacy Persentase penduduk yang bisa baca-tulis
Babymort Banyaknya kematian bayi per 1000 kelahiran
Gdp_cap Penghasilan penduduk per kapita pertahun (US$)
Tujuan penelitian:
1. Mengetahui banyaknya kelompok yang terbentuk 2. Mengidentifikasi indikator kesejahteraan dari kelompok tersebut
3.2 Output dan Interpretasi Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
DENSITY 17 25 5494 802.47 1594.105
URBAN17 12 100 44.76 28.556
LIFEEXPF 17 44 82 67.41 10.886
LIFEEXPM 17 45 76 63.47 8.726
LITERACY 17 29 99 72.94 25.168
BABYMORT 17 4 168 53.88 46.441
GDP_CAP 17 202 19860 4263.00 6291.046
Valid N (listwise) 17
Dari tabel di atas dapat dilihat bahwa variabel-variabel
tersebut memiliki keragamana yang besar sehingga harus distandarisasi.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 24/30
Dari tabel Correlation di atas dapat diketahui ada variabel-variabel yang berkorelasi maka harus dilakukan analisiskomponen utama.
Total Variance Explained
Component
Initial Eigenvaluesa
Extraction Sums of SquaredLoadings
Total% of
VarianceCumulative
% Total% of
VarianceCumulative
%
Raw 15.317 75.959 75.959 5.317 75.959 75.959
2 1.171 16.727 92.686 1.171 16.727 92.686
3 .292 4.173 96.859 .292 4.173 96.859
4 .116 1.662 98.521 .116 1.662 98.521
5 .081 1.161 99.682 .081 1.161 99.682
6 .020 .279 99.961 .020 .279 99.961
7 .003 .039 100.000 .003 .039 100.000
Rescaled
15.317 75.959 75.959 5.317 75.959 75.959
2 1.171 16.727 92.686 1.171 16.727 92.686
3 .292 4.173 96.859 .292 4.173 96.859
4 .116 1.662 98.521 .116 1.662 98.521
5 .081 1.161 99.682 .081 1.161 99.682
6 .020 .279 99.961 .020 .279 99.961
7 .003 .039 100.000 .003 .039 100.000
Extraction Method: Principal Component Analysis.
a. When analyzing a covariance matrix, the initial eigenvalues are the sameacross the raw and rescaled solution.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 25/30
Dari tabel di atas terbentuk 2 komponen utama dengankeragaman kumulatif sebesar 92,686%. Dan untuk selanjutnya 2komponen utama ini yang akan digunakan untuk analisiskluster.
Agglomeration Schedule
Stage
Cluster CombinedCoefficient
s
Stage Cluster First Appears
NextStageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 4 12 .177 0 0 4
2 13 15 .257 0 0 12
3 10 16 .370 0 0 6
4 4 17 .399 1 0 6
5 3 11 .421 0 0 8
6 4 10 .476 4 3 9
7 7 9 .614 0 0 9
8 2 3 .676 0 5 10
9 4 7 .687 6 7 12
10 2 6 .833 8 0 13
11 5 14 .953 0 0 15
12 4 13 1.297 9 2 14
13 1 2 1.409 0 10 14
14 1 4 2.175 13 12 15
15 1 5 3.194 14 11 16
16 1 8 3.925 15 0 0
Tabel di atas digunakan untuk menentukan jumlahcluster yang terbentuk. Dari cari selisih dari stage-stage
secara berurutan dari niai Coefficiens. Kemudian cari nilai stageterkecil dari selisih terbesar untuk menentukan jumlah kluster
dengan rumus:Jumlah Cluster = banyaknya Objek - stage terkecil dari
selisih terbesar Dengan bantuan excel didapatkan selisih terbesar yaitu
selisih antara stage 14 dan 15 yaitu sebesar 1,01844133. Dannilai yang koeficeient terkecil yaitu stage 14 sehinggadiperolehJumlah Cluster = 17 – 14 = 3 cluster.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 26/30
Agglomeration Schedule
Stage
Cluster CombinedCoefficient
s
Stage Cluster First Appears
NextStageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 4 12 .177 0 0 4 2 13 15 .257 0 0 12
3 10 16 .370 0 0 6
4 4 17 .399 1 0 6
5 3 11 .421 0 0 8
6 4 10 .476 4 3 9
7 7 9 .614 0 0 9
8 2 3 .676 0 5 10
9 4 7 .687 6 7 12
10 2 6 .833 8 0 13
11 5 14 .953 0 0 15
12 4 13 1.297 9 2 14
13 1 2 1.409 0 10 14
14 1 4 2.175 13 12 15
15 1 5 3.194 14 11 16
16 1 8 3.925 15 0 0
Baris yang di warna kuning merupakan banyaknya iterasisampai diperoleh 3 cluster. Yaitu sebanyak 8 iterasi.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 27/30
1. Anggota Cluster Cluster Membership
Case 3 Clusters
1:Afghanistan 1
2:Bangladesh 1
3:Cambodia 1
4:China 1
5:Hong Kong 2
6:India 1
7:Indonesia 1
8:Japan 3
9:Malaysia 1
10:N. Korea 111:Pakistan 1
12:Philippines 1
13:S. Korea 1
14:Singapore 2
15:Taiwan 1
16:Thailand 1
17:Vietnam 1
Dari tabel di atas diperoleh bahwa terdapat 3 cluster denganrincian:Cluster 1 : Afghanistan, Bangladesh, Cambodia, China, India,
Indonesia, Malaysia, N. Korea, Pakistan, Philippines,S. Korea, Taiwan, Thailand, dan vietnam.
Cluster 2 : Hongkong dan Singapore.Cluster 3 : Japan.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 28/30
2. Karakteristik Cluster
Cluster 1 Cluster 2 Cluster 3
MaxDescriptive Statistics Descriptive Statistics Descriptive Statistics
N Mean N Mean N Mea
n
DENSITY14
240,1429 DENSITY
2 4975DENSITY
1 3304975
URBAN14
35URBAN
2 97URBAN
1 7797
LIFEEXPF
14
64,64286
LIFEEXPF
2 79,5LIFEEXPF
1 8282
LIFEEXPM
14
61,07143
LIFEEXPM
2 74LIFEEXPM
1 7676
LITERACY
14
69,71429
LITERACY
2 82,5LITERACY
1 9999
BABYMORT 14 64,29286 BABYMORT 2 5,75 BABYMORT 1 4,4 64,29286
GDP_CAP
14
1641,429
GDP_CAP
214815
,5GDP_CAP
119860 19860
Valid N(listwise)
14
Valid N(listwise)
2Valid N(listwise)
1
Dari tabel di atas dapat diketahui bahwa karakteristik dari tiap-tiap kluster yaituCluster 1 : Banyaknya kematian bayi per 1000 kelahiran yang
tinggi.
Cluster 2 : Banyaknya penduduk per km persegi dan Persentase penduduk yang tinggal di perkotaan yang tinggi.
Cluster3 :Harapan hidup penduduk perempuan (tahun), Harapanhidup penduduk laki-laki (tahun), Persentase
penduduk yang bisa baca-tulis, dan Penghasilan penduduk per kapita pertahun (US$) yang tinggi.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 29/30
BAB IV
KESIMPULAN DAN SARAN
4.1 Kesimpulan
Data kesejahteraan dari berbagai negara dengan 7 indikator kesejahteraan diperoleh 3 cluster.Cluster 1 terdiri dari negara-negara Afghanistan, Bangladesh, Cambodia, China, India,Indonesia, Malaysia, N. Korea, Pakistan, Philippines, S. Korea,Taiwan, Thailand, dan vietnam dengan karakteristik Banyaknyakematian bayi per 1000 kelahiran yang tinggi. Sehingga cluster 1 dapat digolongkan ke negara-negara dengan kesejahteraanrendah.
Cluster 2 terdiri dari Hongkong dan Singapore dengan
karakteristik Banyaknya penduduk per km persegi danPersentase penduduk yang tinggal di perkotaan yang tinggi.Sehingga cluster 2 dapat digolongkan ke negara-negara dengankesejahteraan sedang.
Cluster 3 hanya terdiri dari Japan dengan karakteristik Harapan hidup penduduk perempuan (tahun), Harapan hidup
penduduk laki-laki (tahun), Persentase penduduk yang bisa baca-tulis, dan Penghasilan penduduk per kapita pertahun (US$)
yang tinggi.Sehingga cluster 3 dapat digolongkan ke negara-negara dengan kesejahteraan tinggi.
4.2 SaranPerlu adanya penambahan indikator kesejahteraan dan juga
jumlah negara ditambah lebih banyak lagi.
7/16/2019 Analisis Cluster
http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 30/30
DAFTAR PUSTAKA
Everitt, B.S. 1993. Cluster Analysis. Third Edition. Halsted Pressan Imprint of John Wiley and Sons Inc. New York
Kuncoro, M . 2003. Metode Riset Untuk Bisnis dan Ekonomi.Jakarta: ErlanggaSartono, B dkk. 2003. Analisis Peubah Ganda.Bogor: IPBSupranto, J. 2000. Teknik Sampling Untuk Survei dan
Eksperimen, Edisi Baru. Jakarta: PT. Rineka Cipta---------. 2004. Analisis Multivariat: Arti dan Interprestasi.
Jakarta: PT. Rineka CiptaTim Penelitian dan Pengembangan, Wahana Komputer. 2005.
Pengembangan Analisis Multivariate dengan SPSS 12,Edisi Pertama. Jakarta: Salemba
top related