analisis gerombol

28
BAB I PENDAHULUAN Prinsip Dasar Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang diamati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain . Oleh karena itu, homogenitas yang tinggi antar anggota dalam gerombol dan heterogenitas (perbedaan) yang tinggi antar gerombol yang satu dengan yang lainnya merupakan dua hal yang harus dimiliki sebuah gerombol . Penggerombolan ini memberikan manfaat, antara lain untuk eksplorasi data, reduksi data, dan pelapisan data. Eksplorasi data dilakukan untuk memperoleh gambaran tentang informasi yang ada dalam himpunan data tersebut sampai pada pembangkitan hipotesis untuk struktur populasinya. Reduksi data akan dapat mewakili seluruh anggota gerombol dengan suatu ringkasan gerombol tertentu, sedangkan pelapisan data akan berguna dalam penarikan sampel atau penggolongan tipe objek

Upload: yosep-permana

Post on 03-Jan-2016

334 views

Category:

Documents


0 download

DESCRIPTION

Analisis gerombol mantap bana

TRANSCRIPT

Page 1: ANALISIS GEROMBOL

BAB I

PENDAHULUAN

Prinsip Dasar

Analisis gerombol adalah analisis statistik peubah ganda yang digunakan

apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek

tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang

diamati sehingga individu atau objek yang terletak dalam satu gerombol memiliki

kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak

dalam gerombol lain . Oleh karena itu, homogenitas yang tinggi antar anggota

dalam gerombol dan heterogenitas (perbedaan) yang tinggi antar gerombol yang

satu dengan yang lainnya merupakan dua hal yang harus dimiliki sebuah

gerombol .

Penggerombolan ini memberikan manfaat, antara lain untuk eksplorasi

data, reduksi data, dan pelapisan data. Eksplorasi data dilakukan untuk

memperoleh gambaran tentang informasi yang ada dalam himpunan data tersebut

sampai pada pembangkitan hipotesis untuk struktur populasinya. Reduksi data

akan dapat mewakili seluruh anggota gerombol dengan suatu ringkasan gerombol

tertentu, sedangkan pelapisan data akan berguna dalam penarikan sampel atau

penggolongan tipe objek

Analisis gerombol telah dipergunakan dalam pemasaran, seperti

pembentukan segmen berdasarkan data demografi, psychographic profiles,

mengenali test market cities, menentukan pasar yang mirip di berbagai negara dan

mencari kelompok yang mirip dari pembaca majalah untuk membantu di dalam

pemilihan media/majalah .

Statistik yang berkaitan dengan analisis gerombol

Sebelum membahas statistik yang berkaitan dengan analisis gerombol, perlu

disebutkan bahwa kebayakan metode penggerombolan merupakan prosedur yang

relatif sederhana yang tidak didukung dengan suatu penelaran statistik yang

ekstensif. Sebagian besar metode penggerombolan heuristics berdasarkan pada

Page 2: ANALISIS GEROMBOL

algoritma (algorithm). Jadi, analisis gerombol sangat kontras apabila

dibandingkan dengan analisis varian, regresi berganda, analisis diskriminan dan

analisis faktor yang didasarkan pada penalaran statistika yang sangat ekstensif.

Walaupun banyak metode penggerombolan yang mempunyai sifat/ciri statistik

yang penting, kesederhanaan metode ini perlu dipahami (dikenali). Statistik dan

konsep yang diuraikan dibawah ini berkaitan dengan analisis gerombol.

1. Skedul aglomerasi (aglomeration schedule), ialah skedul yang

memberikan informasi tentang objek atau kasus yang akan digabung

(dikelompokkan, dimasukkan dalam gerombol) pada setiap tahap, pada

suatu proses penggerombolan yang hierarki.

2. Rata-rata gerombol (cluster centroid) ialah nilai rata-rata variabel

dari semua objek atau kasus dalam suatu gerombol tertentu.

3. Pusat gerombol (cluster centers) ialah titik awal dimulainya

pengelompokan di dalam penggerombolan non hierarki (non-hierarchil

clustering). Gerombol dibangun/dibentuk disekitar titik-titik ini atau benih

(seeds).

4. Keanggotaan gerombol (cluster membership) ialah keanggotaan

yang menunjukkan gerombol, untuk mana setiap objek atau kasus menjadi

anggotanya (misalnya objek tertentu menjadi anggota gerombol 1 atau

gerombol 2, dan lain sebgainya).

5. Dendogram, juga disebut grafik pohon (tree graph), suatu alat

grafis untuk menyajikan (display) hasil penggerombolan. Garis vertikal atau

tegak mewakili gerombol yang digabung bersama. Posisi garis pada skala

menunjukkan jarak (distance) untuk mana gerombol digabung. Dendogram

harus dibaca dari kiri ke kanan.

6. Jarak antara pusat gerombol (distances between cluster centres)

ialah jarak yang menunjukkan bagaimana terpisahnya pasangan individu

gerombol. Gerombol yang terpisahkan jauh (widely separated) sangat

berbeda, dan memang itu yang diinginkan.

Page 3: ANALISIS GEROMBOL

7. Diagram icicle ialah panyajian berupa grafis dari hasil

penggerombolan disebut demikian karena bentuknya menyerupai suatu

deretan es yang tergantung pada mulut gua (the cares of a house). Kolom

menunjukkan objek/kasus yang akan dikelompokkan dan baris menunjukkan

banyaknya gerombol.

8. Matriks koefisien kemiripan/jarak (similarity/distance coefficient

matrix) ialah matriks bagian bawah, berupa matriks segitiga menurut

pasangan jarak antara objek atau kasus.

Page 4: ANALISIS GEROMBOL

BAB II

LANDASAN TEORI

A. Analisis Gerombol

Beberapa hal yang perlu diperhatikan dalam penggerombolan diantaranya

ukuran kemiripan objek, metode penggerombolan, dan metode perbaikan jarak.

Ukuran Ketakmiripan Objek

Pengelompokan yang dilakukan, didasarkan pada ukuran kemiripan atau

ketakmiripan. Ukuran kemiripan merupakan suatu nilai yang mengukur kemiripan

suatu objek, sedangkan ukuran ketakmiripan merupakan suatu nilai yang

mengukur ketakmiripan suatu objek. Langkah awal dalam analisis gerombol

adalah menentukan ukuran ketakmiripan antar satuan pengamatan yang akan

digerombolkan. Ukuran ketakmiripan antar unit pengamatan dalam analisis

gerombol ditentukan berdasarkan ukuran jarak antara pasangan objek. Semakin

kecil jarak antar objek berarti semakin besar kemiripan antar objek tersebut

dibandingkan dengan pasangan objek dengan jarak yang lebih besar. Ada

beberapa jarak yang biasa digunakan dalam analisis gerombol, di antaranya :

1. Jarak Euclid

Jarak Euclid digunakan bila peubah-peubah yang digunakan tidak

berkorelasi dan memiliki satuan yang sama. Misalkan adalah vektor

pengamatan untuk objek ke-i, = dan adalah vektor

pengamatan untuk objek ke-j, = . Jarak Euclid antara

dan , dilambangkan dengan d( , ) dinyatakan dalam bentuk :

.

dengan : = jarak antar objek pengamatan ke-i dan ke-j

Page 5: ANALISIS GEROMBOL

Jika terjadi korelasi antar peubah, maka dilakukan transformasi terhadap

data awal dengan menggunakan Analisis Komponen Utama. Peubah-

peubah baru yang dihasilkan dari Analisis Komponen Utama merupakan

kombinasi linier dari peubah-peubah asal dan saling bebas linier (tidak

berkorelasi).

Jika satuan peubah yang digunakan tidak sama, maka sebelum dilakukan

perhitungan jarak, perlu dilakukan transformasi data awal ke dalam bentuk

baku. Pembakuan dilakukan dengan menggunakan rumus .

2. Jarak Mahalonobis

Jika peubah yang diamati berkorelasi, perlu dilakukan transformasi dengan

menggunakan Analisis Komponen Utama. Apabila transformasi tidak

dilakukan, maka jarak mahalonobis dapat digunakan.

Misalkan S adalah matriks ragam peragam dapat dituliskan sebagai

berikut:

dengan : = nilai rata-rata peubah ke-i

Misalkan adalah vektor pengamatan untuk objek ke-i, =

dan adalah vektor pengamatan untuk objek ke-j, =

. Jarak Mahalonubis antara dan , dilambangkan

dengan d( , ) dirumuskan sebagai berikut :

dengan : = jarak antar objek pengamatan ke-i dan ke-i`

S = Matriks ragam peragam contoh

3. Jarak Euclid Kuadrat

Jarak Euclid Kuadrat digunakan bila metode yang digunakan adalah

metode Ward (Ward`s Method) . Jarak ini merupakan variasi dari jarak

Page 6: ANALISIS GEROMBOL

euclid. Misalkan adalah vektor pengamatan untuk objek ke-i, =

dan adalah vektor pengamatan untuk objek ke-j, =

. Jarak Euclid antara dan , dilambangkan dengan d(

, ) dinyatakan dalam bentuk :

dengan : = jarak antar objek pengamatan ke-i dan ke-j

B. Metode Penggerombolan

Dalam analisis gerombol terdapat dua metode pengelompokan, yaitu

metode berhirarki dan metode tak berhirarki. Metode tak berhirarki umumnya

digunakan jika banyak objek pengamatannya besar dan banyaknya gerombol

ditentukan sebelumnya. Metode tak berhierarki yang terkenal adalah K-rataan.

Metode berhirarki pada umumnya digunakan jika jumlah objek

pengamatannya tidak begitu besar dan jumlah gerombol yang diinginkan tidak

diketahui sebelumnya. Metode berhirarki dapat dilakukan dengan dua cara, yaitu

Agglomerative Hierarchical Methods (metode berhirarki penggabungan) dan

Divisive Hierarchical Methods (metode berhirarki pembagian).

Pada metode berhirarki penggabungan, n objek dikelompokkan ke dalam n

gerombol, yang masing-masing terdiri dari satu objek. Selanjutnya gerombol yang

jaraknya berdekatan digabung menjadi satu gerombol. Demikian seterusnya

sampai seluruh objek digabung dalam satu gerombol. Pada metode berhirarki

pembagian, seluruh objek dianggap berada pada satu gerombol. Selanjutnya objek

yang jaraknya terjauh membentuk suatu gerombol sendiri. Demikian seterusnya,

sampai terbentuk gerombol-gerombol yang masing-masing terdiri dari satu objek.

Algoritma metode gerombol berhirarki adalah sebagai berikut :

1. Dimulai dengan N gerombol, setiap gerombol berisi satu objek.

2. Tentukan matriks jarak antara objek . Penentuan jarak antar objek,

dengan menggunkan rumus .

Page 7: ANALISIS GEROMBOL

3. Cari gerombol dengan jarak paling dekat. Misalkan gerombol dengan jarak

terdekat adalah gerombol A dan B dengan jarak .

4. Gabungkan gerombol A dan B. Beri label baru yang dibentuk gerombol

(AB). Perbaiki jarak gerombol A dan B dengan gerombol lainnya dengan

cara :

a. Menghilangkan baris dan kolom yang terhubung ke gerombol A dan

B.

b. Menambahkan sebuah baris dan kolom yang akan menunjukkan jarak

antara gerombol (AB) dan gerombol-gerombol lainnya.

5. Ulangi langkah 2 dan 3 hingga seluruh objek tergabung dalam satu

gerombol.

a. Metode Perbaikan Jarak Dalam Penggerombolan

Setiap terbentuknya satu gerombol baru, dilakukan perbaikan jarak antara

gerombol baru dengan gerombol yang sudah ada. Metode perbaikan jarak yang

dipakai adalah metode Ward’s Minimum Variance (Ward’s). Terdapat beberapa

metode perbaikan jarak dalam penggerombolan, antara lain :

1. Metode Pautan Tunggal ( Single Linkage atau Nearest Neighbour method )

Misalkan objek A digabung dengan objek B di dalam suatu gerombol

(AB). Ukuran jarak antara gerombol (AB) dan gerombol lainnya, misalkan C

adalah :

dengan : = jarak antara gerombol A dan gerombol C

= jarak antara gerombol B dan gerombol C

= jarak antara gerombol (AB) dan gerombol C

2. Metode Pautan Lengkap (Complete Linkage atau Furthest Neighbour

method)

Misalkan objek A digabung dengan objek B di dalam suatu gerombol

(AB).

Ukuran jarak antara gerombol (AB) dan gerombol lainnya, misalkan C adalah :

Page 8: ANALISIS GEROMBOL

dengan : = jarak antara gerombol A dan gerombol C

= jarak antara gerombol B dan gerombol C

= jarak antara gerombol (AB) dan gerombol C

3. Metode Pautan Rataan ( Average Linkage )

Pautan rataan memperlakukan jarak antara dua gerombol sebagai rataan

jarak setiap anggota gerombol dengan gerombol lainnya, Misalnya A dan B

digabungkan untuk membuat gerombol (AB).

Ukuran jarak antara gerombol (AB) dan gerombol lainnya, misalkan C adalah :

dengan : = jarak antara gerombol A dan gerombol C

= jarak antara gerombol B dan gerombol C

= jarak antara gerombol (AB) dan gerombol C

= banyak objek dalam gerombol (AB)

4. Metode Sentroid

Metode ini digunakan dengan mempertimbangkan hubungan sebelumnya

antara semua objek yang terlibat dalam perbaikan jarak. Misalkan objek A dan B

digabung di dalam suatu gerombol (AB). Ukuran jarak antara gerombol (AB) dan

gerombol lainnya, misalkan C adalah :

dengan : = jarak antara gerombol A dan gerombol C

= jarak antara gerombol B dan gerombol C

= jarak antara gerombol (AB) dan gerombol C

= jarak antara gerombol A dan gerombol B

= banyak objek dalam gerombol A

Page 9: ANALISIS GEROMBOL

= banyak objek dalam gerombol B

5. Metode Ward’s Minimum Variance ( Ward’s )

Ward mengajukan suatu metode pembentukan cluster yang didasari oleh

hilangnya informasi akibat penggabungan objek menjadi gerombol. Hal ini diukur

dengan jumlah total dari deviasi kuadrat pada mean cluster untuk setiap observasi.

Metode ini berbeda dari metode lainnya karena metode ini menggunakan

pendekatan Analisis of Variance (ANOVA) untuk mengevaluasi jarak-jarak

diantara gerombol.

Singkatnya, metode ini mencoba untuk meminimumkan Sum of Squares

(SS) dari dua gerombol yang dapat digabung pada tiap-tiap langkah. Secara

umum, metode ini sangat efisien.

Ukuran jarak antara gerombol (AB) dan gerombol lainnya, misalkan C

adalah:

dengan : = jarak kuadrat antara gerombol A dan gerombol C

= jarak kuadrat antara gerombol B dan gerombol C

= jarak kuadarat antara gerombol (AB) dan gerombol C

= jarak kuadarat antara gerombol A dan gerombol B

= jumlah objek dalam gerombol A

= jumlah objek dalam gerombol B

= jumlah objek dalam gerombol C

b. Analisis Komponen Utama

Beberapa manfaat AKU digunakan pada analisis gerombol

1. Identifikasi peubah baru yang mendasari data

peubah ganda.

2. Mengurangi banyaknya dimensi himpunan peubah

yang biasanya terdiri atas peubah yang banyak dan saling berkorelasi

Page 10: ANALISIS GEROMBOL

menjadi peubah baru yang tidak berkorelasi dengan mempertahankan

sebanyak mungkin keragaman dalam himpunan data tersebut.

3. menghilangkan peubah-peubah asal yang

mempunyai sumbangan informasi yang relatif kecil.

AKU baik digunakan apabila terdapat multikolinieritas antara peubah asal.

Multikolinieritas adalah terjadinya korelasi yang cukup tinggi antara peubah-

peubah asal. Dalam AKU peubah-peubah ditransformasi menjadi

peubah-peubah baru yaitu dengan syarat-syarat sebagai berikut :

1. Peubah-peubah baru masing-masing merupakan kombinasi

linier dari peubah , dimana :

Peubah Yi dinamakan sebagai skor komponen utama ke-i dan ai dinamakan

sebagai komponen utama ke-i.

Secara umum bentuk komponen utama ke-i (Yi) dari p peubah yang diamati

adalah:

ai`X

dengan

Yi = peubah acak hasil transformasi

X = vektor peubah acak

Xi = peubah acak asal

2. Komponen utama yang dihasilkan tidak saling berkorelasi

3. Peubah-peubah baru tertata menurut keragaman,artinya:

Page 11: ANALISIS GEROMBOL

Andai terdapat n buah amatan untuk p peubah bebas yaitu dengan j = 1,2,….,p

dengan vector rataan , matriks kovarian dan matriks korelasi. Komponen utama

didefenisikan sebagai kombinasi linier dari peubah asal yang dinyatakan dalam

bentuk

Dengan

K =

Dan A adalah matriks vector eigen yang diperoleh dari matriks korelasi yaitu

A =

Sedangkan X adalah matriks peubah asal

X =

Sehingga komponen utama dinyatakn dengan

Dan didapatkan

dimana i = 1,2,….,p

Peranan komponen utama dapat diukur dari persentase keragaman total yang

mampu diterangkan oleh komponen utama tersebut sebagaimana rumusnya pada

persamaan berikut :

dimana : = peranan komponen utama ke-i

Page 12: ANALISIS GEROMBOL

= akar karakteristik ke-i

Analisis komponen utama sangat bergantung pada data asal yang

digunakan. Jika peubah asal memiliki satuan yang sama dan ragam yang homogen

maka AKU didasarkan pada akar karakteristik dan vektor karakteristik yang

didapat dari matriks ragam . Sedangkan jika peubah asal tidak memiliki satuan

yang sama maka peubah asal perlu ditransformasi terlebih dahulu kedalam peubah

baku sebagai berikut :

dimana :

= nilai pengamatan dari peubah asal ke-i

= Rata-rata peubah ke-i

= Ragam dari peubah

Komponen utama dari peubah yang telah dibakukan dapat diperoleh dari

matriks korelasi peubah asalnya.

Dalam prakteknya matriks skor komponen utama diperoleh dari

penguraian nilai singular (The singular value decompotition) dari matriks data

. Dengan penguraian nilai singular, matriks dapat diuraikan menjadi :

Dengan L adalah matriks diagonal (r x r) yang unsur diagonal utamanya adalah

akar dari akar ciri tak nol dari matriks XTX.

Bentuk umum matriks L adalah :

dan > > … >

Apxr adalah matriks-matriks yang unsur-unsur kolom ke-r nya merupakan vektor

karakteristik dari XTX yang bersesuaian dengan .

Page 13: ANALISIS GEROMBOL

Matriks U dapat diperoleh dengan rumus :

U = X A L-1

Setelah diperoleh matriks A maka bisa didapatkan nilai skor komponen utama

dengan menggunakan persamaan :

Y=AX

Page 14: ANALISIS GEROMBOL

BAB III

APLIKASI

Permasalahan:

Mengelompokkan SMA-SMA di Pesisir Selatan menggunakan Analisis Gerombol

Data hasil pengamatan terhadap SMA_SMA di Pesisir Selatan

Nama SekolahSiswa

Jumlah NEM Persentase KelulusanSMAN 1 KOTO XI TARUSAN 1103 16,68 62,09SMAN 2 KOTO XI TARUSAN 604 17,08 64,15SMAN 1 BAYANG 706 20,64 100SMAN 2 BAYANG 644 14,86 38,88SMAN 1 PAINAN 655 22,08 100SMAN 2 PAINAN 895 20,31 98,8SMAN 1 BATANG KAPAS 997 17,72 95,45SMAN 2 BATANG KAPAS 388 17,28 86,21SMAN 1 SUTERA 932 20,07 94,32SMAN 1 LENGAYANG 835 20,86 91,5SMAN 1 RANAH PESISIR 911 20,22 97,5SMAN 1 LINGGO SARI BAGANTI

598 20,07 98,61

SMAN 1 PANCUNG SOAL 775 18,22 100SMAN 1 BASA IV BALAI 648 16,41 56,1SMAN 1 LUNANG SILAUT 345 17,71 92,89

Pada tabel di atas dapat dilihat jumlah siswa terbanyak (X1) terdapat di

SMAN 1 KOTO XI TARUSAN. Sedangkan SMAN 2 BATANG KAPAS dan

SMAN 1 LUNANG SILAUT adalah SMA yang memiliki siswa paling sedikit.

Dari tabel dapat dilihat bahwa rata-rata jumlah NEM/UAN (X2) tertinggi

diperoleh oleh SMAN 1 PAINAN dengan persentase kelulusan (X3) 100%,

Page 15: ANALISIS GEROMBOL

sedangkan SMAN 2 BAYANG adalah SMA dengan rata-rata jumlah NEM/UAN

terendah dan persentase kelulusan paling sedikit.

Proses pengelompokkan dengan ANALISIS GEROMBOL:

Berdasarkan data diatas kita memiliki data dengan satuan berbeda. Oleh

karena itu, kita harus menggunakan metode berhierarki pada penggerombolan.

Sebelum melakukan metode ini, terlebih dahulu dilakukan pembakuan data

dengan menggunakan rumus:

Dengan menggunakan rumus diatas, diperoleh data sebagai berikut:

Nama SekolahSiswa

Jumlah NEM Persentase KelulusanSMAN 1 KOTO XI TARUSAN 5,14846 8,0987 3,15253SMAN 2 KOTO XI TARUSAN 2,81929 8,293 3,25713SMAN 1 BAYANG 3,29539 10,0215 5,07736SMAN 2 BAYANG 3,00599 7,2151 1,97408SMAN 1 PAINAN 3,05734 10,7206 5,07736SMAN 2 PAINAN 4,17758 9,8612 5,01643SMAN 1 BATANG KAPAS 4,65369 8,6037 4,84634SMAN 2 BATANG KAPAS 1,81106 8,3901 4,37719SMAN 1 SUTERA 4,35029 9,7447 4,78896SMAN 1 LENGAYANG 3,89752 10,1283 4,64578SMAN 1 RANAH PESISIR 4,25227 9,8175 4,95042SMAN 1 LINGGO SARI BAGANTI

2,79128 9,7447 5,00678

SMAN 1 PANCUNG SOAL 3,61746 8,8465 5,07736SMAN 1 BASA IV BALAI 3,02466 7,9676 2,8484SMAN 1 LUNANG SILAUT 1,61035 8,5988 4,71636

Page 16: ANALISIS GEROMBOL

Setelah dilakukan pembakuan data, akan dilakukan uji korelasi untuk

melihat apakah data tersebut bersifat multikolinearitas. Dengan diketahui data

tersebut bersifat multikolinearitas antar peubah acak. Maka dilakukan analisis

komponen utama terhadap data yang telah dibakukan dengan tujuan untuk

memperoleh data yang tidak saling berkorelasi dengan tidak mengubah data asal.

Correlations: x1; x2; x3

x1 x2

x2 0,181 x3 0,072 0,815

Selanjutnya digunakan analsis gerombol dengan metode hierarki. Dalam

hal ini, digunakan software minitab untuk menemukan analisis gerombol tersebut.

Principal Component Analysis: x1; x2; x3

Eigenanalysis of the Correlation Matrix

Eigenvalue 1,8527 0,9698 0,1775Proportion 0,618 0,323 0,059Cumulative 0,618 0,941 1,000

Variable PC1 PC2 PC3x1 0,206 0,974 0,096x2 0,699 -0,078 -0,711x3 0,685 -0,213 0,696

Dengan menngunakan minitab kita dapat melakukan penggerombolan terhadap

data diatas, yaitu menggeinai sekolah - sekolah yang ada di pesisir selatan.

Page 17: ANALISIS GEROMBOL

Cluster Analysis of Observations: x1; x2; x3

Euclidean Distance, Single LinkageAmalgamation Steps

Number Number of obs. of Similarity Distance Clusters New in newStep clusters level level joined cluster cluster 1 14 97,6754 0,10884 6 11 6 2 2 13 95,6765 0,20243 6 9 6 3 3 12 90,4752 0,44596 8 15 8 2 4 11 88,5548 0,53587 6 10 6 4 5 10 88,0104 0,56136 2 14 2 2 6 9 87,6246 0,57942 3 12 3 2 7 8 84,2266 0,73852 3 5 3 3 8 7 84,0137 0,74848 3 6 3 7 9 6 76,7392 1,08908 7 13 7 2 10 5 75,3589 1,15371 2 4 2 3 11 4 75,2110 1,16063 3 7 3 9 12 3 67,7464 1,51013 2 8 2 5 13 2 64,3118 1,67094 2 3 2 14 14 1 60,7984 1,83543 1 2 1 15

Final PartitionNumber of clusters: 1

Within Average Maximum cluster distance distance Number of sum of from from observations squares centroid centroidCluster1 15 41,9998 1,58550 3,02188

Hasil minitab diatas adalh hasil minitab 14 yang menggambarkan tetang tahapan

pengelompokkan yang dilakukan. Dan dapat kita dapatkan dendogram nya

sebagai berikut;

Page 18: ANALISIS GEROMBOL

Dari dendogram di atas kita dapat melihat bahwa pembagian sekolah – sekolah

tingkat atas di pesisir selatan dapat dikelompokkan menjadi empat kelompok.

Pemotongan dilakukan pada jarak 73,87. Gerombol pertama terdiri dari SMAN 1

KOTO XI Tarusan. Gerombol II terdiri dari SMAN 2 KOTO XI Tarusan,SMAN

1 BASA IV BALAI,SMAN2 BAYANG, GEROMBOL III terdiri dari SMAN 2

BATANG KAPAS, SMAN 1 LUNANG SILAUT. GEROMBOL IV terdiri dari

SMAN 1 BAYANG, SMAN 1 LINGGO SARI BAGANTI,SMAN 1

PAINAN,SMAN 2 PAINAN,SMAN 1 RANAH PESISIR,SMAN 1 SUTERA,

SMAN 1 BATANG KAPAS,SMAN 1 PANCUNG SOAL, SMAN 1

LENGAYANG

Page 19: ANALISIS GEROMBOL

DAFTAR PUSTAKA

Iriawan, nur dan septin puji astuti. 2006. Mengolah Data Statistik Dengan Mudah

Mengunakan Minitab 14. Andi Yogyakarta.

Sartono, B.F.M. Affendi, U.D.Syafitri, I.M. Sumertajaya, dan Y. Angraeni. 2003.

Analisis Peubah Ganda. IPB. Bogor.

Sharma, subhash. 1996. Applied multivariate techniques. John wiley and son.

Supranto, J. 2004. Analisis Multivariat, Arti, dan Interpretasi. PT. Rineka Cipta.

Jakarta.

Page 20: ANALISIS GEROMBOL