7 metode kuantitatif (pca)

30
Princilple Compone nts Analysis (PCA) , Oleh Asbar 1 Ada dua tujuan dasar dari PCA dan FA, yakni: 1. Tujuan Dasar 1. Ortogonalisasi Variabel: mentransformasikan suatu struktur data dengan variabel- variabel yang saling berkorelasi menjadi struktur data baru dengan variabel-variabel baru (yang disebut sebagai Komponen Utama atau Faktor) yang tidak saling berkorelasi. 2. Penyederhanaan Variabel: banyaknya variabel baru yang dihasilkan, jauh lebih sedikit dari pada variabel asalnya, tapi total kandungan informasinya (total ragamnya) relatif tidak berubah. 2. Manfaat Pokok Ada dua manfaat pokok dari PCA dan FA, yakni : 1. Asumsi dasar yang membolehkan penggunaan Analisis Regresi Berganda (pendugaan parameter struktur hubungan linier antara satu variabel tujuan dengan lebih dari satu variabel penjelas), atau Analisis Fungsi Diskriminan (pendugaan parameter struktur hubungan linier antara satu variabel pengelompokan dengan lebih dari satu variabel penjelas perbedaan antar kelompok), adalah tidak terjadinya apa yang disebut dengan multicollinearity (fenomena saling berkorelasi antar variabel penjelas). Dengan demikian, PCA dan FA dapat membantu kita dalam menyelesaikan permasalahan multicollinearity ini.

Upload: naal-al-ghazali

Post on 20-Oct-2015

149 views

Category:

Documents


12 download

TRANSCRIPT

Page 1: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

1

Ada dua tujuan dasar dari PCA dan FA, yakni:1. Tujuan Dasar

1. Ortogonalisasi Variabel: mentransformasikan suatu struktur data dengan variabel-variabel yang saling berkorelasi menjadi struktur data baru dengan variabel-variabel baru (yang disebut sebagai Komponen Utama atau Faktor) yang tidak saling berkorelasi.

2. Penyederhanaan Variabel: banyaknya variabel baru yang dihasilkan, jauh lebih sedikit dari pada variabel asalnya, tapi total kandungan informasinya (total ragamnya) relatif tidak berubah. 2. Manfaat Pokok

Ada dua manfaat pokok dari PCA dan FA, yakni :1. Asumsi dasar yang membolehkan penggunaan

Analisis Regresi Berganda (pendugaan parameter struktur hubungan linier antara satu variabel tujuan dengan lebih dari satu variabel penjelas), atau Analisis Fungsi Diskriminan (pendugaan parameter struktur hubungan linier antara satu variabel pengelompokan dengan lebih dari satu variabel penjelas perbedaan antar kelompok), adalah tidak terjadinya apa yang disebut dengan multicollinearity (fenomena saling berkorelasi antar variabel penjelas). Dengan demikian, PCA dan FA dapat membantu kita dalam menyelesaikan permasalahan multicollinearity ini.

Page 2: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

2

2. Dengan dapat menyajikan data dengan struktur yang jauh lebih sederhana tanpa kehilangan esensi informasi yang terkandung didalamnya, maka kita akan lebih mudah memahami, mengkomunikasikan, dan menetapkan prioritas penanganan terhadap hal-hal yang lebih pokok dari struktur permasalahan yang kita hadapi. Dengan demikian efisiensi dan efektifitas penanganan permasalahan dapat lebih ditingkatkan

3. Format Data Dasar

Format data dasar yang kita akan analisis dengan PCA atau FA adalah seperti disajikan pada Tabel 1. Struktur data dasar pada tabel ini mengilustrasikan hasil pengukuran (dalam skala kuantitatif, yakni: skala interval atau skala ratio/kardinal) terhadap p buah variabel dari n buah kasus (sampel, individu, dsb.) yang diteliti.

Variabel Asal

X1 X2 ... Xj ... Xp

Kasus

1 x11 x12 ... x1j ... x1p

2 x21 x22 ... x2j ... x2p

... ... ... ... ... ... ...

i xi1 xi2 ... xij ... xip

... ... ... ... ... ... ...

n xn1 xn2 ... xnj ... xnp

Rataan μ1 μ2 ... μj ... μj

Simpangan Baku s1 s2 ... sj ... sj

Page 3: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

3

4. Standarisasi Variabel Asal

Sebelum kita melakukan analisis PCA atau FA, kita perlu menstandarisasikan masing-masing variabel pada Tabel 1 tersebut. Artinya, kita transformasikan masing-masing variabel Xj (j=1,2,...,p) yang memiliki nilai rataan masing-masing sama dengan μj dan simpangan baku masing-masing sama dengan sj, menjadi variabel baku Yj (j=1,2,...,p) yang memiliki nilai rataan masing-masing sama dengan nol dan simpangan baku dan ragam masing-masing sama dengan satu. Secara matematis hubungan antara data untuk variabel asal (xij) dengan data untuk variabel yang telah distandarisasikan (yij) dapat ditulis sebagai berikut: j

jijij s

xy

j

jijij s

xy

Tujuan dasar dari penstandarisasian variabel ini adalah menghilangkan variasi data antar variabel yang diakibatkan oleh hal-hal yang tidak esensial, seperti: 1. Hanya karena perbedaan titik nol

pengukuran yang digunakan untuk masing-masing variabel, seperti perbedaan data pengukuran temperatur titik beku air antara metode Fahrenheit dengan metode Celcius (0C=32F), dan

2. Hanya karena perbedaan sistem penskalaan yang digunakan untuk masing-masing variabel, seperti perbedaan data pengukuran temperatur titik didih air antara metode Celcius dengan metode Reaumur (100C=80R, padahal 0C=0R).

Setelah distandarisasikan, maka kita memperoleh data seperti pada Tabel 2 berikut.

Page 4: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

4

Tabel 2: Struktur Data Setelah Semua Variabel Distandarisasikan

Variabel Baku

Y1 Y2 ... Yj ... Yp

Kasus

1 y11 y12 ... y1j ... y1p

2 y21 y22 ... y2j ... y2p

... ... ... ... ... ... ...

i yi1 yi2 ... yij ... yip

... ... ... ... ... ... ...

n yn1 yn2 ... ynj ... ynp

Rataan 0 0 ... 0 ... 0

Ragam 1 1 ... 1 ... 1

Kalau sekiranya perbedaan variasi data antar variabel dalam Tabel 1 persis seperti perbedaan variasi data antar ketiga metode pengukuran temperatur (Celcius vs. Fahrenheit vs. Reaumur), maka setelah distandarisasikan akan ditunjukkan dalam Tabel 2 bahwa antar variabel tersebut tidak ada perbedaan sama sekali.

Karakteristik penting lainnya dari variabel-variabel yang telah distandarisasikan adalah:

1. Perkalian vektor antar dua variabel yang berbeda adalah sama dengan koefisien korelasi antar kedua variabel tersebut.

Page 5: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

5

'

'

'2

'1

21 jj

nj

j

j

njjj r

y

yy

yyy

j'jYY '

'

'2

'1

21 jj

nj

j

j

njjj r

y

yy

yyy

j'jYY

2. Perkalian matriks antar variabel adalah sama dengan matriks koefisien korelasi antar variabel tersebut.

RYY

1

1

1

21

221

112

21

22221

11211

21

22212

12111

pp

p

p

npnn

p

p

nppp

n

n

rr

rr

rr

yyy

yyy

yyy

yyy

yyy

yyy

RYY

1

1

1

21

221

112

21

22221

11211

21

22212

12111

pp

p

p

npnn

p

p

nppp

n

n

rr

rr

rr

yyy

yyy

yyy

yyy

yyy

yyy

5. Ortogonalisasi Variabel

Selanjutnya, baik dalam PCA maupun FA, kita melakukan ortogonalisasi terhadap variabel-variabel pada Tabel 2 tersebut. Artinya, kita mentransformasikan masing-masing variabel Yj (j=1,2,...,p) yang memiliki karakteristik: 1. Satu sama lain saling berkorelasi dengan

koefisien korelasi sebesar rjj’ 0,2. Nilai rataan masing-masing sama dengan nol,

dan3. Nilai ragam masing-masing sama dengan satu,

menjadi variabel baru Z (=1,2,...,qp) yang memiliki karakteristik:

1. Satu sama lain tidak saling berkorelasi, yakni: r’ = 0,

2. Nilai rataan masing-masing tetap sama dengan nol, dan

3. Nilai ragam masing-masing Z sama dengan 0, dimana = p.

Page 6: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

6

Struktur data baru yang dihasilkan setelah proses ortogonalisasi, baik dengan menggunakan PCA maupun FA, dapat disajikan seperti dalam Tabel 3 berikut.

Tabel 3: Struktur Data Setelah Diortogonalisasikan

Variabel Baru Ortogonal

Z1 Z2 ... Z ... Zqp

Kasus

1 z11 z12 ... z1 ... z1q

2 z21 z22 ... z2 ... z2q

... ... ... ... ... ... ...

i zi1 zi2 ... zi ... ziq

... ... ... ... ... ... ...

n zn1 zn2 ... zn ... znq

Rataan 0 0 ... 0 ... 0

Ragam 1 2 ... ... q

Secara matematis hubungan antara data pada Tabel 3 dengan data pada Tabel 2 adalah sebagai berikut:

p

jijji ybz

1

Page 7: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

7

Secara perkalian matriks Persamaan (4) dapat ditulis sebagai berikut:

αα YbZ αα YbZ dimana:

n

n

z

z

z

zzz

2

1

21ααZZ

n

n

z

z

z

zzz

2

1

21ααZZ

12

1

21

p

p

b

b

b

bbb

ααbb 12

1

21

p

p

b

b

b

bbb

ααbb

6. Standarisasi Variabel Baru Ortogonal

Selanjutnya, baik dalam PCA maupun FA, kita melakukan standarisasi terhadap variabel-variabel ortogonal pada Tabel 2 tersebut. Artinya, kita mentransformasikan masing-masing variabel Z (=1,2,...,qp) yang memiliki karakteristik: 1. Satu sama lain tidak saling berkorelasi, yakni: r’ = 0,2. Nilai rataan masing-masing tetap sama dengan nol, dan3. Nilai ragam masing-masing Z sama dengan 0,

dimana = p.

Page 8: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

8

menjadi variabel baru F (=1,2,...,qp) yang disebut Faktor atau Komponen Utama, yang memiliki karakteristik:1. Satu sama lain tetap tidak saling berkorelasi, yakni:

r’ = 0,2. Nilai rataan masing-masing tetap sama dengan nol,

dan3. Nilai ragam masing-masing F sama dengan satu. Struktur data baru yang dihasilkan setelah proses

standarisasi ini, dapat disajikan seperti dalam Tabel 4. Secara matematis hubungan antara data pada Tabel 4 dengan data pada Tabel 3 adalah sebagai berikut:

ii zf 1

ii zf 1

Secara perkalian matriks Persamaan (8) dapat ditulis sebagai berikut:

α

αα

bYZF

1

α

αα

bYZF

1

Tabel 4: Struktur Data Setelah Diortogonalisasikan dan Distandarisasikan

Variabel Baru Ortogonal Baku (Faktor, Komponen Utama)

F1 F2 ... F ... Fqp

Kasus

1 f11 f12 ... f1 ... f1q

2 f21 f22 ... f2 ... f2q

... ... ... ... ... ... ...

i fi1 fi2 ... fi ... fiq

... ... ... ... ... ... ...

n fn1 fn2 ... fn ... fnq

Rataan 0 0 ... 0 ... 0

Ragam 1 1 ... 1 ... 1

Page 9: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

9

7. Beberapa Istilah Penting

Berikut ini akan disajikan beberapa istilah penting yang dikenal baik dalam PCA maupun FA, antara lain:

1. Vektor b disebut Eigenvector untuk Faktor atau

Komponen Utama ke-2. Elemen-elemen vektor disebut sebagai Factor

Score Coefficients untuk Faktor atau Komponen

Utama ke-

3. Nilai adalah Explained Variance atau Eigenvalue

(akar ciri) untuk Faktor atau Komponen Utama ke-

4. Elemen-elemen dari vektor F disebut sebagai

Factor Scores untuk Faktor atau Komponen Utama

ke-5. Elemen-elemen dari vektor disebut Factor

Loadings untuk Faktor atau Komponen Utama ke-,

yang tiada lain merupakan koefisien korelasi antara

variabel-variabel asal (Xj: j=1,2,...,p) dengan Faktor

atau Komponen Utama ke- (rj).

6. Dengan memperhatikan pengertian pada butir (2)

dan butir (5), maka dapat disimpulkan bahwa Factor

Loadings (L) adalah sama dengan Factor Score

Coefficients (C) kali Eigenvalue untuk Faktor atau

Komponen Utamanya (). Secara matematis dapat

ditunjukkan sebagai berikut:

αb

αb

Page 10: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

10

αα

α

α

α

α

αα

αα

CLb

b

C

L

bL

bC

αα

α

α

α

α

αα

αα

CLb

b

C

L

bL

bC

Dengan menggunakan definisi pada Persamaan (5), (6), (7), (9), dan (10), kaitan antara Factor Loadings dengan korelasi seperti pada butir (5) di atas, dapat ditunjukkan dengan penurunan rumus matematis sebagai berikut:

αααααααα

αα

ααα

bbZZbYbYbb

bb

YbYZYFY

j

j

r

r

:diperoleh maka ,1dengan kalikan

αααααααα

αα

ααα

bbZZbYbYbb

bb

YbYZYFY

j

j

r

r

:diperoleh maka ,1dengan kalikan

8. Penyederhanaan Jumlah Variabel

Sesuai dengan tujuan dasar kedua dari analisis PCA maupun FA adalah penyederhanaan jumlah variabel. Artinya, variabel-variabel baru yang dihasilkan dari proses analisis (Faktor atau Komponen Utama) jumlahnya harus lebih sedikit dari jumlah variabel asalnya. Di atas telah disebutkan bahwa dari sebanyak p buah variabel asal Xj (j=1,2,...,p) akan dihasilkan sebanyak q buah (qp) variabel baru (Faktor atau Komponen Utama) F (=1,2,...,q). Ada beberapa cara menetapkan berapa besarnya q, antara lain dengan cara seleksi sebagai berikut: Dengan mengurutkan masing-masing Faktor atau Komponen Utama (F) yang dihasilkan dari yang memiliki eigenvalue () tertinggi hingga terendah, maka:

Page 11: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

11

1. Pilihlah Faktor-faktor atau Komponen-komponen Utama yang memiliki 1, artinya pilihlah Faktor atau Komponen Utama yang memiliki kandungan informasi (ragam) setara dengan informasi yang terkandung dalam satu variabel asal.

2. Secara bertahap buanglah Faktor atau Komponen Utama (setiap langkah membuang satu Faktor atau Komponen Utama) selama perbedaan eigenvalue antar dua Faktor atau Komponen Utama yang berdekatan tidak begitu signifikan: Jika (-(-1))<1 maka buanglah F.

3. Pilihlah Faktor-faktor atau Komponen-komponen Utama yang paling tidak memiliki koefisien korelasi nyata dengan minimal satu variabel asal. Dalam hal ini sering digunakan kriteria: Jika untuk j=1,2,...,p ada nilai |rj|0.7 maka pilihlah F. Hal ini dimaksudkan agar setiap Faktor atau Komponen Utama yang terpilih paling tidak memiliki satu penciri dominan dari variabel asalnya

Salahsatu atau kombinasi dari ketiga cara seleksi Faktor atau Komponen Utama di atas dapat digunakan.

Page 12: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

12

9. Algoritma Ortogonalisasi PCA

Secara sederhana, algoritma ortogonalisasi dengan PCA adalah mencari variabel baru Z, yang merupakan kombinasi linear dari variabel-variabel baku Y seperti pada Persamaan (5), yang ragamnya paling tinggi. Artinya, informasi yang terkandung dalam variabel-variabel Y semaksimal mungkin terserap dalam variabel baru Z tersebut. Karena Z=Yb, maka yang dicari sesungguhnya adalah vektor koefisien pembobot b. Karena banyak sekali kemungkinan vektor b yang dapat memaksimumkan ragam Z, maka kita batasi hanya vektor b yang bersifat baku, yakni b’b=1.

Secara matematis, algoritma PCA ini dapat ditulis sebagai permasalahan optimisasi sebagai berikut:

1'..

'max

bb

YbY'bZZ

ts 1'..

'max

bb

YbY'bZZ

ts

Fungsi Lagrange dari permasalahan optimisasi ini adalah:

Syarat perlu untuk mendapatkan solusi, adalah:

1''' bbYbYb L 1''' bbYbYb L

02'2

bYbYb

L02'2

bYbYb

L

Jadi diperoleh persamaan eigen sebagai berikut:

bRbbYbY atau' bRbbYbY atau'

Page 13: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

13

Dengan demikian tiada lain adalah eigenvalue dari matriks korelasi antar variabel asal. Vektor b adalah eigenvector dari matriks korelasi antar variabel asal, untuk eigenvaluenya yang sama dengan . Dengan menggunakan Metode Yacobi, maka penyelesaian persamaan eigen ini akan menghasilkan eigenvalue dan eigen vector masing-masing sebanyak dimensi R (jumlah variabel asal yang dianalisis).

10. Perbedaan Konsep Dasar antara PCA dengan FA

Secara sederhana, perbedaan pokok antara PCA dengan FA dapat dilihat pada ilustrasi yang disajikan pada Gambar 1 dan Gambar 2. Gambar 1 mengilustrasikan konsep dasar PCA, yakni: pentransformasian variabel-variabel yang dapat diukur (observable) yang satu sama lain saling berkorelasi (multicollinearity) kedalam variabel-variabel yang tak dapat diukur (unobservable) yang satu sama lain tidak saling berkorelasi (orthogonal) yang disebut komponen utama.

Page 14: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

14

Y1 Y2

F1 F2

r12>0

c21c11 c12 c22

Obs

erva

ble

Uno

bser

vabl

e

Hubungan korelasiArah transformasi

Gambar 1: Ilustrasi Konsep Dasar PCA

Y1 Y2

F1 F2

r12>0

l12l11 l21 l22

Obs

erva

ble

Uno

bser

vabl

e

Hubungan korelasiArah hubungan sebab-akibat

1 2

e2e1

Gambar 2: Ilustrasi Konsep Dasar FA

Page 15: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

15

Gambar 2. mengilustrasikan konsep dasar FA, yakni: adanya fenomena saling berkorelasi antar variabel yang diukur adalah disebabkan oleh adanya variabel-variabel orthogonal yang sama-sama mempengaruhi variabel-variabel terukur tersebut (common factors). Variasi data dari variabel-variabel terukur ditentukan oleh dua jenis faktor yakni: common factors (faktor-faktor yang menentukan variasinya data dari banyak variabel) dan specific factors (faktor yang secara spesifik hanya menentukan variasinya data dari variabel tertentu). Struktur hubungan korelasi yang tinggi antar variabel dikarenakan adanya pengaruh common factors yang sangat tinggi. Sebaliknya, struktur hubungan korelasi yang tidak begitu tinggi antar variabel dikarenakan adanya pengaruh specific factors yang sangat tinggi (pengaruh common factors-nya rendah).

Notasi yang digunakan pada Gambar 1 dan Gambar 2, adalah:

Y1 dan Y2 : Observable Variable yang telah distandardisasikan (masing-masing diset nilai rata-ratanya sama dengan nol, dan ragamnya sama dengan satu)

F1 dan F2 : Unobservable Principal Components atau Unobservable Common Factors yang bersifat baku dan ortogonal (masing-masing nilai rata-ratanya sama dengan nol, dan ragamnya sama dengan satu; koefisien korelasi antar keduanya sama dengan nol)

1 dan 2 : Unobservable Specific Factors yang bersifat baku dan ortogonal

Page 16: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

16

c11 dan c12: Masing-masing merupakan koefisien pembobot untuk variabel Y1 dan Y2 dalam membangun/menduga Principal Component Scores (atau Common Factor Scores) F1; atau disebut juga sebagai Score Coefficients untuk Principal Component (atau Common Factor) F1

c21 dan c22: Masing-masing merupakan koefisien pembobot untuk variabel Y1 dan Y2 dalam membangun/menduga Principal Component Scores (atau Common Factor Scores) F2; atau disebut juga sebagai Score Coefficients untuk Principal Component (atau Common Factor) F2

l11 dan l12 : Masing-masing merupakan koefisien pembobot untuk Principal Components (atau Common Factors) F1 dan F2 dalam merekonstruksi variabel Y1; atau disebut juga sebagai Principal Component Loadings (atau Factor Loadings) untuk variabel Y1

l21 dan l22 : Masing-masing merupakan koefisien pembobot untuk Principal Components (atau Common Factors) F1 dan F2 dalam merekonstruksi variabel Y2; atau disebut juga sebagai Principal Component Loadings (atau Factor Loadings) untuk variabel Y2

E1 : Koefisien pembobot untuk Specific Factor 1 dalam merekonstruksi variabel Y1

E2 : Koefisien pembobot untuk Specific Factor 2 dalam merekonstruksi variabel Y2

Page 17: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

17

Dari Gambar 1, dapat ditulis hubungan matematis sebagai berikut :

2221212

2121111

YcYcF

YcYcF

2221212

2121111

YcYcF

YcYcF

Secara

matriks, dapat ditulis:

2

1

2221

1211

2

1

Y

Y

cc

cc

F

F

2

1

2221

1211

2

1

Y

Y

cc

cc

F

F

CYF CYF atau

Dari Gambar 2, dapat ditulis hubungan matematis sebagai berikut:

222221212

112121111

eFlFlY

eFlFlY

222221212

112121111

eFlFlY

eFlFlY

Secara

matriks, dapat ditulis:

2

1

2

1

2

1

2221

1211

2

1

0

0

e

e

F

F

ll

ll

Y

Y

2

1

2

1

2

1

2221

1211

2

1

0

0

e

e

F

F

ll

ll

Y

Y

ELFY ELFY atau

Karena L adalah matriks ortogonal, yakni inversenya sama dengan transposenya, maka berlaku pengalian berikut:

FYL

ELLFLYL

FYL

ELLFLYL

Dengan membandingkan Persamaan (18) dengan Persamaan (22), maka dapat ditarik kesimpulan bahwa untuk data yang sama, maka berlaku hubungan C=L’. Dengan demikian, dapat disimpulkan bahwa:

Page 18: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

18

1. Untuk data yang sama, PCA maupun FA memberikan hasil yang sama

2. Antara PCA dengan FA hanya berbeda dalam hal pendekatannya, yakni: PCA menyusun kombinasi linier baku dari observable variables, sedangkan FA mengasumsikan bahwa variasi data dari observable variables ditentukan oleh Common Factors dan Specific Factors

3. Matriks dari Factor Loadings sama dengan tranpose dari matriks Principal Component Score Coefficients.

4. Karena dengan pendekatan Factor Analysis diasumsikan bahwa variasi data dari observable variables ditentukan oleh Common Factors dan Specific Factors, maka dapat dalam analisisnya juga melakukan pendugaan terhadap parameter Communality yang menunjukkan sejauh mana besarnya peranan common factors dalam menentukan variasi data dari observable variables. Nilai Communality yang semakin besar dari suatu variabel menunjukkan bahwa variabel tersebut mengukur karakteristik umum dari populasi yang diteliti. Sebaliknya, Nilai Communality yang semakin kecil dari suatu variabel menunjukkan bahwa variabel tersebut mengukur karakteristik yang khas untuk individu-individu tertentu dalam populasi yang diteliti.

5. Nilai Communality ini dapat diturunkan dengan cara mengkuadratkan ruas kiri dan ruas kanan dari Persamaan (19). Dengan demikian, maka diperoleh:

222

221

22

22

22

222

221

222222122121222122

22

22

222

21

221

22

212

211

21

21

21

212

211

121121111121121121

21

22

212

21

211

21

11

'2'2'2dan

11

'2'2'2

lleRell

FelFelFFlleFlFlY

lleRell

FelFelFFlleFlFlY

222

221

22

22

22

222

221

222222122121222122

22

22

222

21

221

22

212

211

21

21

21

212

211

121121111121121121

21

22

212

21

211

21

11

'2'2'2dan

11

'2'2'2

lleRell

FelFelFFlleFlFlY

lleRell

FelFelFFlleFlFlY

Page 19: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

19

1. PermasalahanMenarik kesimpulan yang tepat dari suatu matriks data yang terdiri dari 5 individu (baris) dan dua variabel (kolom) merupakan suatu hal yang relatif mudah. Akan tetapi menarik kesimpulan dari suatu matriks data yang terdiri dari 1000 individu (baris) dan 50 variabel (kolom) merupakan suatu hal yang sangat rumit.

Untuk itu, metode analisis faktorial (Analisis Komponen Utama) memungkinkan suatu representasi yang lebih mudah dibaca atau diinterpretasikan pada struktur data demikian dengan hanya menarik informasi esensial.

2. Tujuan

Tujuan utama menggunakan analisis komponen utama dalam suatu matriks data berukuran cukup besar diantaranya adalah :

a. Mengekstraksi informasi esensial yang terdapat dalam suatu tabel/matriks data yang besar.

b. Menghasilkan suatu representasi grafik yang memudahkan interpretasi.

c. Mempelajari suatu tabel/matriks data dari sudut pandangan kemiripan antara individu atau hubungan antara variabel.

Page 20: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

20

3. Bentuk Data

Seperti telah disebutkan di awal bagian ini, bentuk data yang umumnya dianalisis dengan menggunakan analisis komponen utama adalah :

a. Tabel/matriks data yang terdiri dari n individu (baris) dan p variabel (kolom).

b. Variabel harus metrik.

Agar tabel/matriks data mempunyai bentuk yang homogen, sehingga variasi dari suatu unit dapat diinterpretasikan dengan cara yang identik untuk setiap variabel. Hal ini akan mudah apabila kita bekerja pada tabel/matriks data yang dipusatkan dan direduksi (rata-rata dari setiap variabel dibawa ke nol melalui pengurangan, sedangkan simpangan baku dibawa ke satu satuan dengan membagi setiap nilai ragam/varians asal).

4. Metode

Langkah-langkah yang diperlukan dalam analisis komponen utama atau Principal Components Analysis (PCA) adalah sebagai berikut :

Page 21: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

21

a. Satu individu dapat dijelaskan dengan baik oleh nilai-nilai yang diperoleh dari p variabel. Hal yang sama, satu variabel didefinisikan oleh n nilai yang berkaitan dengan distribusi individunya. Dengan demikian. Dengan demikian, suatu individu dapat diidentifikasi oleh satu titik dari satu ruang geometrik berdimensi p, sedangkan satu variabel direpresentasikan oleh satu titik dari satu ruang berdimensi n. Semua individu (atau variabel) akhirnya membentuk suatu kumpulan titik-titik yang dapat disebut sebagai awan titik-titik. Sebagaiman diketahui, sulit untuk mempunyai suatu visi yang tepat dari suatu ruang berdimensi 100 misalnya, maka PCA memungkinkan adanya suatu reduksi terhadap dimensi dari ruang-ruang ini agar dapat lebih mudah dibaca dengan kehilangan informasi sesedikit mungkin. Karena itu, metode ini bertujuan mendeterminasi sumbu-sumbu optimum tempat diproyaksikannya individu-individu dan / atau variabel-variabel.

b. Sumbu-sumbu faktorial (komponen-komponen utama) yang diperoleh merepresentasikan kombinasi linier dari variabel-variabel asal. Sumbu-sumbu ini berkorelasi nihil antara mereka, dan dapat disusun berdasarkan hierarki sebagai berikut :

• Faktor utama menjelaskan dengan lebih baik variabilitas data asal/inisial.

• Faktor/sumbu kedua menjelaskan dengan lebih baik variabilitas residu yang tidak terambil/tergambarkan pada faktor utama

Page 22: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

22

c. Untuk menemukan informasi yang lengkap, perlu diperhatikan semua sumbu yang jumlahnya sama dengan jumlah variabel. Manfaat dari PCA adalah dapat mengasosiasikan pada sumbu faktorial yang berbeda. Pada setiap sumbu diasosiasikan suatu fraksi informasi yang terdapat dalam tebel/matriks data asal. Bagian informasi ini disebut juga jumlah inersi atau bagian varians/ragam yang dijelaskan. Disamping itu, setiap sumbu dapat diinterpretasikan sebagai korelasi dengan variabel-variabel asal.

d. Secara umum informasi yang diberikan dari hasil PCA adalah sebagai berikut :

Dari sudut pandang variabel :

• Matriks korelasi antar semua variabel;

• Akar ciri dari setiap sumbu faktorial : berkaitan dengan jumlah inersi dari setiap sumbu;

• Vektor ciri yang menjelaskan koefisien variabel (pemusatan dan pereduksian) dalam persamaan linier yang mendeterminasikan sumbu-sumbu utama);

• Korelasi antara variabel dan sumbu yang dapat menginterpretasikan sumbu utama;

• Grafik bidang (Sumbu1/Sumbu 2, Sumbu/Sumbu 3, …) yang menvisualisasikan variabel terhadap sumbu (grafik bidang). Dapat digambarkan pada setiap grafik, lingkaran korelasi (=1), semakin dekat pada lingkaran korelasi semakin besar perannya terhadap sumbu. Korelasi terhadap sumbu = kosinus sudut antara sumbu dan garis lurus yang melewatipusat gravitasi dan titik variabel.

Page 23: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

23

Dengan demikian kita tidak menginterpretasikan posisi suatu variabel terhadap jarak dari pusat gravitasi tetapi sudut yang dibentuk oleh garis lurus dgn sumbu atau dengan variabel lain apabila variabel ini memberikan kontribusi yang besar (dekat dng lingkaran korelasi)

Dua sudut pandang indivedu :Koordinat individu pada setiap sumbu;

Kualitas representasi titik-individu dalam setiap grafik bidang (kontribusi relatif)

Grafik bidang yang memperlihatkan kemiripan (kedekatan) antara titik-individu.

Teladan 1 :

Hasil analisis komponen utama terhadap matriks data tentang kondisi fisik perairan pada 20 stasiun. Parameter yang diukur terdiri atas 6 variabel uji, yaitu : kecepatan arus (AR), kecerahan (CE), kandungan pasir dalam substrat ((PA), kandungan debu dalam substrat (DE), kandungan liat dalam substrat (LI) dan kandungan C-organik dalam substrat (CO).

Tujuan Analisis : untuk mengkaji hubungan antara variabel fisik perairan, dan mendeterminasi apakan terdapat pengelompokan stasiun berdasarkan variabel fisik perairan.

Hasil Analisis Komponen Utama Dimaksudkan sebagai berikut :

Page 24: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

24

Hasil analisis Komponen dengan menggunakan Program STATITCF, akan memunculkan nilai tengah masing-masing variabel dan simpangan bakunya, matriks korelasi variabel.

Tahapan 1.

• Jumlah observasi : 20

• Jumlah variabel : 6• Jumlah variabel aktif yg dianalisis : 6• Jumlah sumbu yang diminta : 3• Jumlah variabel suplemen : 0

STATISTIK DASAR

Variabel Nilai Tengah Simpangan Baku

PA 2.200 0.8718

CO 2.250 0.6225

AR 2.250 0.7665

CE 2.300 0.7810

DE 1.950 0.7399

LI 2.000 0.7071

KORELASI

PA CO AR CE DE LI

PACOARCEDELI

1.0000.276

-0.2990.2790.248

-0.081

1.0000.079

-0.257-0.0810.227

1.0000.042

-0.3310.000

1.0000.199

-0.2721.0000.096 1.000

Page 25: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

25

Tahap 2

Sumbu 1 Sumbu 2 Sumbu 3

Baris 1 1.0912 0.7521 0.5956

Baris 2 32.1 % 22.2 % 17.6 %

DIAGONALISASI

Baris 1 : Akar ciri (ragam pada sumbu utama)

Baris 2 : Kontribusi pada variabel total (persentase yang dijelaskan yang dijelaskan oleh sumbu utama)

Vektor ciri (Koefisien variabel dalam fungsi linier sumbu utama)Variabel Sumbu 1 Sumbu 2 Sumbu 3

PA 0.7001 -0.1509 0.5274

CO 0.0192 -0.3781 0.5132

AR -0.4130 0.3468 0.4798

CE 0.3871 0.6443 0.0325

DE 0.4183 -0.1343 -0.4747

LI -0.1187 -0.5300 -0.0425

Dari ke tiga sumbu utama pertama sudah mampu menjelaskan keseluruhan informasi sebesar 72 %, masih ada 28 % ragam yang dijelaskan oleh sumbu-sumbu lain. Beberapa pakar memberikan patokan untuk memilih sumbu tdk lebih dari 3, dan dasar presentase informasi untuk dipresentasikan (misalnya 70 %) sudah cukup bagus.

Page 26: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

26

Tahap 3

Interpretasi hasil PCA dilakukan secara berbeda untuk variabel dan individu. Koordinat variabel untuk setiap sumbu adalah = korelasi antara variabel dan sumbu.

Semakin kuat korelasi (negatif atau positif), maka semakin dekat variabel tersebut pada sumbu.

Dapat juga kita menginterpretasi hubungan antara variabel dengan memperhatikan sudut yang terbentuk antaranya.

VARIABEL

Kolom 1 : Korelasi antara variabel dan sumbu utama (R)

Kolom 2 : Koevisien determinasi (R2)

Variable

Komponen Utama

Sumbu 1 Sumbu 2 Sumbu 3

Kolom 1 Kolom 2 Kolom 1 Kolom 2 Kolom 1 Kolom 2

PA 0.8389 0.7037 0.1501 0.0225 0.4669 0.2180

CO 0.0323 0.0010 0.5268 0.2775 0.6362 0.4048

AR 0.5626 0.3168 0.3924 0.1540 0.4831 0.2334

CE 0.5178 0.2681 0.7154 0.5118 0.0321 0.0010

DE 0.5905 0.3487 0.1574 0.0248 0.4951 0.2451

LI 0.1753 0.0307 0.6500 0.4225 0.0464 0.0022

Page 27: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

27

Tahapan 4

Hasil yang diperoleh dikhususkan pada kajian individu. Selain koordinat dari setiap titik-individu pada sumbu-sumbu (disebut Komponen Utama). Program analisis juga memunculkan kosinus kuadrat (kontribusi relatif) yang berguna untuk mengevaluasi kualitas representasi titik pada sumbu tertentu.

INDIVIDUKolom 1 : Koordinat individu pada sumbu utamaKolom 2 : Kosinus kuadrat

INDIVIDUSumbu 1 Sumbu 2 Sumbu 3

Kolom 1 Kolom 2 Kolom 1 Kolom 2 Kolom 1 Kolom 2

01 -1.5491

02 -0.9502

03 1.3429

04 -1.6682

05 -0.2295

06 0.5763

07 1.8692

08 -0.6234

09 1.5311

10 0.0011

11 0.6686

12 1.6682

13 0.5891

14 0.9816

15 -0.5426

16 0.3497

17 -0.5810

18 0.2690

19 0.3008

20 -0.0868

Page 28: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

28

Hasil Analisis Kualitas Air di Wilayah Pesisir Kabupaten Sinjai ada Bulan September 2004 s/d Januari 2005

Stasiun

Parameter Kualitas Air

Suhu Sal pH Kekr TSS DO BOD COD NH3 NO3 PO4

I 30.00 34.33 7.50 10.33 247.34 5.76 0.747 44.19 0.001 0.51 0.217

II 30.33 35.67 7.45 16.17 197.16 5.65 0.373 40.91 0.002 0.70 0.287

III 30.33 35.17 7.40 15.37 201.82 5.76 0.640 35.04 0.002 0.10 0.134

IV 29.33 35.67 7.63 20.67 268.73 5.87 1.173 40.08 0.001 0.58 0.141

V 30.00 35.00 7.51 8.00 205.35 5.60 0.587 34.93 0.001 0.03 0.090

VI 29.33 35.50 7.53 3.67 193.56 5.71 0.480 18.37 0.001 0.01 0.122

VII 30.33 35.00 8.10 11.67 251.62 6.50 1.707 43.25 0.001 1.00 0.147

VIII 29.00 35.67 7.93 4.00 220.34 5.53 1.903 38.03 0.001 0.04 0.154

IX 29.17 37.00 7.90 16.30 209.07 5.42 1.370 42.13 0.001 0.24 0.128

X 29.33 36.33 7.79 52.33 233.72 5.76 1.067 32.16 0.002 0.46 0.128

XI 30.00 35.67 8.08 72.67 225.69 5.43 0.747 39.36 0.001 0.77 0.128

XII 29.67 34.33 8.07 10.00 202.62 6.46 1.487 34.99 0.001 0.07 0.147

Contoh Soal :

Page 29: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

29

JAWABAN .

Hasil Analisis Pca Kualitas Air Di Perairan Pesisir Sinjai

Means and standard deviations of the variables:

Parameter  Means Standard deviations

Suhu 29.736 0.469

Sal 35.444 0.728

pH 7.743 0.256

Kekr 20.097 19.998

TSS 221.419 23.285

DO 5.787 0.336

BOD 1.023 0.484

COD 36.954 6.652

NH3 0.001 0.000

NO3 0.376 0.324

PO4 0.152 0.050

Page 30: 7 Metode Kuantitatif (Pca)

Princilple Components Analysis (PCA), Oleh Asbar

30

Biplot (axes F1 and F2: 55.44 %)

XII

XI

X IXVIII

VII

VI

V

IV

III

II

ISuhu

SAL

pH

KEK

TSSDO

BOD

COD

NH3

NO3

PO4

-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5

-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5

-- axis F1 (30.35 %) -->

Mangrove

Sungai

Tambak

Perairan Pantai

Variabel kualitas air berdasarkan stasiun