7 metode kuantitatif (pca)
Post on 20-Oct-2015
149 Views
Preview:
TRANSCRIPT
Princilple Components Analysis (PCA), Oleh Asbar
1
Ada dua tujuan dasar dari PCA dan FA, yakni:1. Tujuan Dasar
1. Ortogonalisasi Variabel: mentransformasikan suatu struktur data dengan variabel-variabel yang saling berkorelasi menjadi struktur data baru dengan variabel-variabel baru (yang disebut sebagai Komponen Utama atau Faktor) yang tidak saling berkorelasi.
2. Penyederhanaan Variabel: banyaknya variabel baru yang dihasilkan, jauh lebih sedikit dari pada variabel asalnya, tapi total kandungan informasinya (total ragamnya) relatif tidak berubah. 2. Manfaat Pokok
Ada dua manfaat pokok dari PCA dan FA, yakni :1. Asumsi dasar yang membolehkan penggunaan
Analisis Regresi Berganda (pendugaan parameter struktur hubungan linier antara satu variabel tujuan dengan lebih dari satu variabel penjelas), atau Analisis Fungsi Diskriminan (pendugaan parameter struktur hubungan linier antara satu variabel pengelompokan dengan lebih dari satu variabel penjelas perbedaan antar kelompok), adalah tidak terjadinya apa yang disebut dengan multicollinearity (fenomena saling berkorelasi antar variabel penjelas). Dengan demikian, PCA dan FA dapat membantu kita dalam menyelesaikan permasalahan multicollinearity ini.
Princilple Components Analysis (PCA), Oleh Asbar
2
2. Dengan dapat menyajikan data dengan struktur yang jauh lebih sederhana tanpa kehilangan esensi informasi yang terkandung didalamnya, maka kita akan lebih mudah memahami, mengkomunikasikan, dan menetapkan prioritas penanganan terhadap hal-hal yang lebih pokok dari struktur permasalahan yang kita hadapi. Dengan demikian efisiensi dan efektifitas penanganan permasalahan dapat lebih ditingkatkan
3. Format Data Dasar
Format data dasar yang kita akan analisis dengan PCA atau FA adalah seperti disajikan pada Tabel 1. Struktur data dasar pada tabel ini mengilustrasikan hasil pengukuran (dalam skala kuantitatif, yakni: skala interval atau skala ratio/kardinal) terhadap p buah variabel dari n buah kasus (sampel, individu, dsb.) yang diteliti.
Variabel Asal
X1 X2 ... Xj ... Xp
Kasus
1 x11 x12 ... x1j ... x1p
2 x21 x22 ... x2j ... x2p
... ... ... ... ... ... ...
i xi1 xi2 ... xij ... xip
... ... ... ... ... ... ...
n xn1 xn2 ... xnj ... xnp
Rataan μ1 μ2 ... μj ... μj
Simpangan Baku s1 s2 ... sj ... sj
Princilple Components Analysis (PCA), Oleh Asbar
3
4. Standarisasi Variabel Asal
Sebelum kita melakukan analisis PCA atau FA, kita perlu menstandarisasikan masing-masing variabel pada Tabel 1 tersebut. Artinya, kita transformasikan masing-masing variabel Xj (j=1,2,...,p) yang memiliki nilai rataan masing-masing sama dengan μj dan simpangan baku masing-masing sama dengan sj, menjadi variabel baku Yj (j=1,2,...,p) yang memiliki nilai rataan masing-masing sama dengan nol dan simpangan baku dan ragam masing-masing sama dengan satu. Secara matematis hubungan antara data untuk variabel asal (xij) dengan data untuk variabel yang telah distandarisasikan (yij) dapat ditulis sebagai berikut: j
jijij s
xy
j
jijij s
xy
Tujuan dasar dari penstandarisasian variabel ini adalah menghilangkan variasi data antar variabel yang diakibatkan oleh hal-hal yang tidak esensial, seperti: 1. Hanya karena perbedaan titik nol
pengukuran yang digunakan untuk masing-masing variabel, seperti perbedaan data pengukuran temperatur titik beku air antara metode Fahrenheit dengan metode Celcius (0C=32F), dan
2. Hanya karena perbedaan sistem penskalaan yang digunakan untuk masing-masing variabel, seperti perbedaan data pengukuran temperatur titik didih air antara metode Celcius dengan metode Reaumur (100C=80R, padahal 0C=0R).
Setelah distandarisasikan, maka kita memperoleh data seperti pada Tabel 2 berikut.
Princilple Components Analysis (PCA), Oleh Asbar
4
Tabel 2: Struktur Data Setelah Semua Variabel Distandarisasikan
Variabel Baku
Y1 Y2 ... Yj ... Yp
Kasus
1 y11 y12 ... y1j ... y1p
2 y21 y22 ... y2j ... y2p
... ... ... ... ... ... ...
i yi1 yi2 ... yij ... yip
... ... ... ... ... ... ...
n yn1 yn2 ... ynj ... ynp
Rataan 0 0 ... 0 ... 0
Ragam 1 1 ... 1 ... 1
Kalau sekiranya perbedaan variasi data antar variabel dalam Tabel 1 persis seperti perbedaan variasi data antar ketiga metode pengukuran temperatur (Celcius vs. Fahrenheit vs. Reaumur), maka setelah distandarisasikan akan ditunjukkan dalam Tabel 2 bahwa antar variabel tersebut tidak ada perbedaan sama sekali.
Karakteristik penting lainnya dari variabel-variabel yang telah distandarisasikan adalah:
1. Perkalian vektor antar dua variabel yang berbeda adalah sama dengan koefisien korelasi antar kedua variabel tersebut.
Princilple Components Analysis (PCA), Oleh Asbar
5
'
'
'2
'1
21 jj
nj
j
j
njjj r
y
yy
yyy
j'jYY '
'
'2
'1
21 jj
nj
j
j
njjj r
y
yy
yyy
j'jYY
2. Perkalian matriks antar variabel adalah sama dengan matriks koefisien korelasi antar variabel tersebut.
RYY
1
1
1
21
221
112
21
22221
11211
21
22212
12111
pp
p
p
npnn
p
p
nppp
n
n
rr
rr
rr
yyy
yyy
yyy
yyy
yyy
yyy
RYY
1
1
1
21
221
112
21
22221
11211
21
22212
12111
pp
p
p
npnn
p
p
nppp
n
n
rr
rr
rr
yyy
yyy
yyy
yyy
yyy
yyy
5. Ortogonalisasi Variabel
Selanjutnya, baik dalam PCA maupun FA, kita melakukan ortogonalisasi terhadap variabel-variabel pada Tabel 2 tersebut. Artinya, kita mentransformasikan masing-masing variabel Yj (j=1,2,...,p) yang memiliki karakteristik: 1. Satu sama lain saling berkorelasi dengan
koefisien korelasi sebesar rjj’ 0,2. Nilai rataan masing-masing sama dengan nol,
dan3. Nilai ragam masing-masing sama dengan satu,
menjadi variabel baru Z (=1,2,...,qp) yang memiliki karakteristik:
1. Satu sama lain tidak saling berkorelasi, yakni: r’ = 0,
2. Nilai rataan masing-masing tetap sama dengan nol, dan
3. Nilai ragam masing-masing Z sama dengan 0, dimana = p.
Princilple Components Analysis (PCA), Oleh Asbar
6
Struktur data baru yang dihasilkan setelah proses ortogonalisasi, baik dengan menggunakan PCA maupun FA, dapat disajikan seperti dalam Tabel 3 berikut.
Tabel 3: Struktur Data Setelah Diortogonalisasikan
Variabel Baru Ortogonal
Z1 Z2 ... Z ... Zqp
Kasus
1 z11 z12 ... z1 ... z1q
2 z21 z22 ... z2 ... z2q
... ... ... ... ... ... ...
i zi1 zi2 ... zi ... ziq
... ... ... ... ... ... ...
n zn1 zn2 ... zn ... znq
Rataan 0 0 ... 0 ... 0
Ragam 1 2 ... ... q
Secara matematis hubungan antara data pada Tabel 3 dengan data pada Tabel 2 adalah sebagai berikut:
p
jijji ybz
1
Princilple Components Analysis (PCA), Oleh Asbar
7
Secara perkalian matriks Persamaan (4) dapat ditulis sebagai berikut:
αα YbZ αα YbZ dimana:
n
n
z
z
z
zzz
2
1
21ααZZ
n
n
z
z
z
zzz
2
1
21ααZZ
12
1
21
p
p
b
b
b
bbb
ααbb 12
1
21
p
p
b
b
b
bbb
ααbb
6. Standarisasi Variabel Baru Ortogonal
Selanjutnya, baik dalam PCA maupun FA, kita melakukan standarisasi terhadap variabel-variabel ortogonal pada Tabel 2 tersebut. Artinya, kita mentransformasikan masing-masing variabel Z (=1,2,...,qp) yang memiliki karakteristik: 1. Satu sama lain tidak saling berkorelasi, yakni: r’ = 0,2. Nilai rataan masing-masing tetap sama dengan nol, dan3. Nilai ragam masing-masing Z sama dengan 0,
dimana = p.
Princilple Components Analysis (PCA), Oleh Asbar
8
menjadi variabel baru F (=1,2,...,qp) yang disebut Faktor atau Komponen Utama, yang memiliki karakteristik:1. Satu sama lain tetap tidak saling berkorelasi, yakni:
r’ = 0,2. Nilai rataan masing-masing tetap sama dengan nol,
dan3. Nilai ragam masing-masing F sama dengan satu. Struktur data baru yang dihasilkan setelah proses
standarisasi ini, dapat disajikan seperti dalam Tabel 4. Secara matematis hubungan antara data pada Tabel 4 dengan data pada Tabel 3 adalah sebagai berikut:
ii zf 1
ii zf 1
Secara perkalian matriks Persamaan (8) dapat ditulis sebagai berikut:
α
αα
bYZF
1
α
αα
bYZF
1
Tabel 4: Struktur Data Setelah Diortogonalisasikan dan Distandarisasikan
Variabel Baru Ortogonal Baku (Faktor, Komponen Utama)
F1 F2 ... F ... Fqp
Kasus
1 f11 f12 ... f1 ... f1q
2 f21 f22 ... f2 ... f2q
... ... ... ... ... ... ...
i fi1 fi2 ... fi ... fiq
... ... ... ... ... ... ...
n fn1 fn2 ... fn ... fnq
Rataan 0 0 ... 0 ... 0
Ragam 1 1 ... 1 ... 1
Princilple Components Analysis (PCA), Oleh Asbar
9
7. Beberapa Istilah Penting
Berikut ini akan disajikan beberapa istilah penting yang dikenal baik dalam PCA maupun FA, antara lain:
1. Vektor b disebut Eigenvector untuk Faktor atau
Komponen Utama ke-2. Elemen-elemen vektor disebut sebagai Factor
Score Coefficients untuk Faktor atau Komponen
Utama ke-
3. Nilai adalah Explained Variance atau Eigenvalue
(akar ciri) untuk Faktor atau Komponen Utama ke-
4. Elemen-elemen dari vektor F disebut sebagai
Factor Scores untuk Faktor atau Komponen Utama
ke-5. Elemen-elemen dari vektor disebut Factor
Loadings untuk Faktor atau Komponen Utama ke-,
yang tiada lain merupakan koefisien korelasi antara
variabel-variabel asal (Xj: j=1,2,...,p) dengan Faktor
atau Komponen Utama ke- (rj).
6. Dengan memperhatikan pengertian pada butir (2)
dan butir (5), maka dapat disimpulkan bahwa Factor
Loadings (L) adalah sama dengan Factor Score
Coefficients (C) kali Eigenvalue untuk Faktor atau
Komponen Utamanya (). Secara matematis dapat
ditunjukkan sebagai berikut:
αb
αb
Princilple Components Analysis (PCA), Oleh Asbar
10
αα
α
α
α
α
αα
αα
CLb
b
C
L
bL
bC
αα
α
α
α
α
αα
αα
CLb
b
C
L
bL
bC
Dengan menggunakan definisi pada Persamaan (5), (6), (7), (9), dan (10), kaitan antara Factor Loadings dengan korelasi seperti pada butir (5) di atas, dapat ditunjukkan dengan penurunan rumus matematis sebagai berikut:
αααααααα
αα
ααα
bbZZbYbYbb
bb
YbYZYFY
j
j
r
r
:diperoleh maka ,1dengan kalikan
αααααααα
αα
ααα
bbZZbYbYbb
bb
YbYZYFY
j
j
r
r
:diperoleh maka ,1dengan kalikan
8. Penyederhanaan Jumlah Variabel
Sesuai dengan tujuan dasar kedua dari analisis PCA maupun FA adalah penyederhanaan jumlah variabel. Artinya, variabel-variabel baru yang dihasilkan dari proses analisis (Faktor atau Komponen Utama) jumlahnya harus lebih sedikit dari jumlah variabel asalnya. Di atas telah disebutkan bahwa dari sebanyak p buah variabel asal Xj (j=1,2,...,p) akan dihasilkan sebanyak q buah (qp) variabel baru (Faktor atau Komponen Utama) F (=1,2,...,q). Ada beberapa cara menetapkan berapa besarnya q, antara lain dengan cara seleksi sebagai berikut: Dengan mengurutkan masing-masing Faktor atau Komponen Utama (F) yang dihasilkan dari yang memiliki eigenvalue () tertinggi hingga terendah, maka:
Princilple Components Analysis (PCA), Oleh Asbar
11
1. Pilihlah Faktor-faktor atau Komponen-komponen Utama yang memiliki 1, artinya pilihlah Faktor atau Komponen Utama yang memiliki kandungan informasi (ragam) setara dengan informasi yang terkandung dalam satu variabel asal.
2. Secara bertahap buanglah Faktor atau Komponen Utama (setiap langkah membuang satu Faktor atau Komponen Utama) selama perbedaan eigenvalue antar dua Faktor atau Komponen Utama yang berdekatan tidak begitu signifikan: Jika (-(-1))<1 maka buanglah F.
3. Pilihlah Faktor-faktor atau Komponen-komponen Utama yang paling tidak memiliki koefisien korelasi nyata dengan minimal satu variabel asal. Dalam hal ini sering digunakan kriteria: Jika untuk j=1,2,...,p ada nilai |rj|0.7 maka pilihlah F. Hal ini dimaksudkan agar setiap Faktor atau Komponen Utama yang terpilih paling tidak memiliki satu penciri dominan dari variabel asalnya
Salahsatu atau kombinasi dari ketiga cara seleksi Faktor atau Komponen Utama di atas dapat digunakan.
Princilple Components Analysis (PCA), Oleh Asbar
12
9. Algoritma Ortogonalisasi PCA
Secara sederhana, algoritma ortogonalisasi dengan PCA adalah mencari variabel baru Z, yang merupakan kombinasi linear dari variabel-variabel baku Y seperti pada Persamaan (5), yang ragamnya paling tinggi. Artinya, informasi yang terkandung dalam variabel-variabel Y semaksimal mungkin terserap dalam variabel baru Z tersebut. Karena Z=Yb, maka yang dicari sesungguhnya adalah vektor koefisien pembobot b. Karena banyak sekali kemungkinan vektor b yang dapat memaksimumkan ragam Z, maka kita batasi hanya vektor b yang bersifat baku, yakni b’b=1.
Secara matematis, algoritma PCA ini dapat ditulis sebagai permasalahan optimisasi sebagai berikut:
1'..
'max
bb
YbY'bZZ
ts 1'..
'max
bb
YbY'bZZ
ts
Fungsi Lagrange dari permasalahan optimisasi ini adalah:
Syarat perlu untuk mendapatkan solusi, adalah:
1''' bbYbYb L 1''' bbYbYb L
02'2
bYbYb
L02'2
bYbYb
L
Jadi diperoleh persamaan eigen sebagai berikut:
bRbbYbY atau' bRbbYbY atau'
Princilple Components Analysis (PCA), Oleh Asbar
13
Dengan demikian tiada lain adalah eigenvalue dari matriks korelasi antar variabel asal. Vektor b adalah eigenvector dari matriks korelasi antar variabel asal, untuk eigenvaluenya yang sama dengan . Dengan menggunakan Metode Yacobi, maka penyelesaian persamaan eigen ini akan menghasilkan eigenvalue dan eigen vector masing-masing sebanyak dimensi R (jumlah variabel asal yang dianalisis).
10. Perbedaan Konsep Dasar antara PCA dengan FA
Secara sederhana, perbedaan pokok antara PCA dengan FA dapat dilihat pada ilustrasi yang disajikan pada Gambar 1 dan Gambar 2. Gambar 1 mengilustrasikan konsep dasar PCA, yakni: pentransformasian variabel-variabel yang dapat diukur (observable) yang satu sama lain saling berkorelasi (multicollinearity) kedalam variabel-variabel yang tak dapat diukur (unobservable) yang satu sama lain tidak saling berkorelasi (orthogonal) yang disebut komponen utama.
Princilple Components Analysis (PCA), Oleh Asbar
14
Y1 Y2
F1 F2
r12>0
c21c11 c12 c22
Obs
erva
ble
Uno
bser
vabl
e
Hubungan korelasiArah transformasi
Gambar 1: Ilustrasi Konsep Dasar PCA
Y1 Y2
F1 F2
r12>0
l12l11 l21 l22
Obs
erva
ble
Uno
bser
vabl
e
Hubungan korelasiArah hubungan sebab-akibat
1 2
e2e1
Gambar 2: Ilustrasi Konsep Dasar FA
Princilple Components Analysis (PCA), Oleh Asbar
15
Gambar 2. mengilustrasikan konsep dasar FA, yakni: adanya fenomena saling berkorelasi antar variabel yang diukur adalah disebabkan oleh adanya variabel-variabel orthogonal yang sama-sama mempengaruhi variabel-variabel terukur tersebut (common factors). Variasi data dari variabel-variabel terukur ditentukan oleh dua jenis faktor yakni: common factors (faktor-faktor yang menentukan variasinya data dari banyak variabel) dan specific factors (faktor yang secara spesifik hanya menentukan variasinya data dari variabel tertentu). Struktur hubungan korelasi yang tinggi antar variabel dikarenakan adanya pengaruh common factors yang sangat tinggi. Sebaliknya, struktur hubungan korelasi yang tidak begitu tinggi antar variabel dikarenakan adanya pengaruh specific factors yang sangat tinggi (pengaruh common factors-nya rendah).
Notasi yang digunakan pada Gambar 1 dan Gambar 2, adalah:
Y1 dan Y2 : Observable Variable yang telah distandardisasikan (masing-masing diset nilai rata-ratanya sama dengan nol, dan ragamnya sama dengan satu)
F1 dan F2 : Unobservable Principal Components atau Unobservable Common Factors yang bersifat baku dan ortogonal (masing-masing nilai rata-ratanya sama dengan nol, dan ragamnya sama dengan satu; koefisien korelasi antar keduanya sama dengan nol)
1 dan 2 : Unobservable Specific Factors yang bersifat baku dan ortogonal
Princilple Components Analysis (PCA), Oleh Asbar
16
c11 dan c12: Masing-masing merupakan koefisien pembobot untuk variabel Y1 dan Y2 dalam membangun/menduga Principal Component Scores (atau Common Factor Scores) F1; atau disebut juga sebagai Score Coefficients untuk Principal Component (atau Common Factor) F1
c21 dan c22: Masing-masing merupakan koefisien pembobot untuk variabel Y1 dan Y2 dalam membangun/menduga Principal Component Scores (atau Common Factor Scores) F2; atau disebut juga sebagai Score Coefficients untuk Principal Component (atau Common Factor) F2
l11 dan l12 : Masing-masing merupakan koefisien pembobot untuk Principal Components (atau Common Factors) F1 dan F2 dalam merekonstruksi variabel Y1; atau disebut juga sebagai Principal Component Loadings (atau Factor Loadings) untuk variabel Y1
l21 dan l22 : Masing-masing merupakan koefisien pembobot untuk Principal Components (atau Common Factors) F1 dan F2 dalam merekonstruksi variabel Y2; atau disebut juga sebagai Principal Component Loadings (atau Factor Loadings) untuk variabel Y2
E1 : Koefisien pembobot untuk Specific Factor 1 dalam merekonstruksi variabel Y1
E2 : Koefisien pembobot untuk Specific Factor 2 dalam merekonstruksi variabel Y2
Princilple Components Analysis (PCA), Oleh Asbar
17
Dari Gambar 1, dapat ditulis hubungan matematis sebagai berikut :
2221212
2121111
YcYcF
YcYcF
2221212
2121111
YcYcF
YcYcF
Secara
matriks, dapat ditulis:
2
1
2221
1211
2
1
Y
Y
cc
cc
F
F
2
1
2221
1211
2
1
Y
Y
cc
cc
F
F
CYF CYF atau
Dari Gambar 2, dapat ditulis hubungan matematis sebagai berikut:
222221212
112121111
eFlFlY
eFlFlY
222221212
112121111
eFlFlY
eFlFlY
Secara
matriks, dapat ditulis:
2
1
2
1
2
1
2221
1211
2
1
0
0
e
e
F
F
ll
ll
Y
Y
2
1
2
1
2
1
2221
1211
2
1
0
0
e
e
F
F
ll
ll
Y
Y
ELFY ELFY atau
Karena L adalah matriks ortogonal, yakni inversenya sama dengan transposenya, maka berlaku pengalian berikut:
FYL
ELLFLYL
FYL
ELLFLYL
Dengan membandingkan Persamaan (18) dengan Persamaan (22), maka dapat ditarik kesimpulan bahwa untuk data yang sama, maka berlaku hubungan C=L’. Dengan demikian, dapat disimpulkan bahwa:
Princilple Components Analysis (PCA), Oleh Asbar
18
1. Untuk data yang sama, PCA maupun FA memberikan hasil yang sama
2. Antara PCA dengan FA hanya berbeda dalam hal pendekatannya, yakni: PCA menyusun kombinasi linier baku dari observable variables, sedangkan FA mengasumsikan bahwa variasi data dari observable variables ditentukan oleh Common Factors dan Specific Factors
3. Matriks dari Factor Loadings sama dengan tranpose dari matriks Principal Component Score Coefficients.
4. Karena dengan pendekatan Factor Analysis diasumsikan bahwa variasi data dari observable variables ditentukan oleh Common Factors dan Specific Factors, maka dapat dalam analisisnya juga melakukan pendugaan terhadap parameter Communality yang menunjukkan sejauh mana besarnya peranan common factors dalam menentukan variasi data dari observable variables. Nilai Communality yang semakin besar dari suatu variabel menunjukkan bahwa variabel tersebut mengukur karakteristik umum dari populasi yang diteliti. Sebaliknya, Nilai Communality yang semakin kecil dari suatu variabel menunjukkan bahwa variabel tersebut mengukur karakteristik yang khas untuk individu-individu tertentu dalam populasi yang diteliti.
5. Nilai Communality ini dapat diturunkan dengan cara mengkuadratkan ruas kiri dan ruas kanan dari Persamaan (19). Dengan demikian, maka diperoleh:
222
221
22
22
22
222
221
222222122121222122
22
22
222
21
221
22
212
211
21
21
21
212
211
121121111121121121
21
22
212
21
211
21
11
'2'2'2dan
11
'2'2'2
lleRell
FelFelFFlleFlFlY
lleRell
FelFelFFlleFlFlY
222
221
22
22
22
222
221
222222122121222122
22
22
222
21
221
22
212
211
21
21
21
212
211
121121111121121121
21
22
212
21
211
21
11
'2'2'2dan
11
'2'2'2
lleRell
FelFelFFlleFlFlY
lleRell
FelFelFFlleFlFlY
Princilple Components Analysis (PCA), Oleh Asbar
19
1. PermasalahanMenarik kesimpulan yang tepat dari suatu matriks data yang terdiri dari 5 individu (baris) dan dua variabel (kolom) merupakan suatu hal yang relatif mudah. Akan tetapi menarik kesimpulan dari suatu matriks data yang terdiri dari 1000 individu (baris) dan 50 variabel (kolom) merupakan suatu hal yang sangat rumit.
Untuk itu, metode analisis faktorial (Analisis Komponen Utama) memungkinkan suatu representasi yang lebih mudah dibaca atau diinterpretasikan pada struktur data demikian dengan hanya menarik informasi esensial.
2. Tujuan
Tujuan utama menggunakan analisis komponen utama dalam suatu matriks data berukuran cukup besar diantaranya adalah :
a. Mengekstraksi informasi esensial yang terdapat dalam suatu tabel/matriks data yang besar.
b. Menghasilkan suatu representasi grafik yang memudahkan interpretasi.
c. Mempelajari suatu tabel/matriks data dari sudut pandangan kemiripan antara individu atau hubungan antara variabel.
Princilple Components Analysis (PCA), Oleh Asbar
20
3. Bentuk Data
Seperti telah disebutkan di awal bagian ini, bentuk data yang umumnya dianalisis dengan menggunakan analisis komponen utama adalah :
a. Tabel/matriks data yang terdiri dari n individu (baris) dan p variabel (kolom).
b. Variabel harus metrik.
Agar tabel/matriks data mempunyai bentuk yang homogen, sehingga variasi dari suatu unit dapat diinterpretasikan dengan cara yang identik untuk setiap variabel. Hal ini akan mudah apabila kita bekerja pada tabel/matriks data yang dipusatkan dan direduksi (rata-rata dari setiap variabel dibawa ke nol melalui pengurangan, sedangkan simpangan baku dibawa ke satu satuan dengan membagi setiap nilai ragam/varians asal).
4. Metode
Langkah-langkah yang diperlukan dalam analisis komponen utama atau Principal Components Analysis (PCA) adalah sebagai berikut :
Princilple Components Analysis (PCA), Oleh Asbar
21
a. Satu individu dapat dijelaskan dengan baik oleh nilai-nilai yang diperoleh dari p variabel. Hal yang sama, satu variabel didefinisikan oleh n nilai yang berkaitan dengan distribusi individunya. Dengan demikian. Dengan demikian, suatu individu dapat diidentifikasi oleh satu titik dari satu ruang geometrik berdimensi p, sedangkan satu variabel direpresentasikan oleh satu titik dari satu ruang berdimensi n. Semua individu (atau variabel) akhirnya membentuk suatu kumpulan titik-titik yang dapat disebut sebagai awan titik-titik. Sebagaiman diketahui, sulit untuk mempunyai suatu visi yang tepat dari suatu ruang berdimensi 100 misalnya, maka PCA memungkinkan adanya suatu reduksi terhadap dimensi dari ruang-ruang ini agar dapat lebih mudah dibaca dengan kehilangan informasi sesedikit mungkin. Karena itu, metode ini bertujuan mendeterminasi sumbu-sumbu optimum tempat diproyaksikannya individu-individu dan / atau variabel-variabel.
b. Sumbu-sumbu faktorial (komponen-komponen utama) yang diperoleh merepresentasikan kombinasi linier dari variabel-variabel asal. Sumbu-sumbu ini berkorelasi nihil antara mereka, dan dapat disusun berdasarkan hierarki sebagai berikut :
• Faktor utama menjelaskan dengan lebih baik variabilitas data asal/inisial.
• Faktor/sumbu kedua menjelaskan dengan lebih baik variabilitas residu yang tidak terambil/tergambarkan pada faktor utama
Princilple Components Analysis (PCA), Oleh Asbar
22
c. Untuk menemukan informasi yang lengkap, perlu diperhatikan semua sumbu yang jumlahnya sama dengan jumlah variabel. Manfaat dari PCA adalah dapat mengasosiasikan pada sumbu faktorial yang berbeda. Pada setiap sumbu diasosiasikan suatu fraksi informasi yang terdapat dalam tebel/matriks data asal. Bagian informasi ini disebut juga jumlah inersi atau bagian varians/ragam yang dijelaskan. Disamping itu, setiap sumbu dapat diinterpretasikan sebagai korelasi dengan variabel-variabel asal.
d. Secara umum informasi yang diberikan dari hasil PCA adalah sebagai berikut :
Dari sudut pandang variabel :
• Matriks korelasi antar semua variabel;
• Akar ciri dari setiap sumbu faktorial : berkaitan dengan jumlah inersi dari setiap sumbu;
• Vektor ciri yang menjelaskan koefisien variabel (pemusatan dan pereduksian) dalam persamaan linier yang mendeterminasikan sumbu-sumbu utama);
• Korelasi antara variabel dan sumbu yang dapat menginterpretasikan sumbu utama;
• Grafik bidang (Sumbu1/Sumbu 2, Sumbu/Sumbu 3, …) yang menvisualisasikan variabel terhadap sumbu (grafik bidang). Dapat digambarkan pada setiap grafik, lingkaran korelasi (=1), semakin dekat pada lingkaran korelasi semakin besar perannya terhadap sumbu. Korelasi terhadap sumbu = kosinus sudut antara sumbu dan garis lurus yang melewatipusat gravitasi dan titik variabel.
Princilple Components Analysis (PCA), Oleh Asbar
23
Dengan demikian kita tidak menginterpretasikan posisi suatu variabel terhadap jarak dari pusat gravitasi tetapi sudut yang dibentuk oleh garis lurus dgn sumbu atau dengan variabel lain apabila variabel ini memberikan kontribusi yang besar (dekat dng lingkaran korelasi)
Dua sudut pandang indivedu :Koordinat individu pada setiap sumbu;
Kualitas representasi titik-individu dalam setiap grafik bidang (kontribusi relatif)
Grafik bidang yang memperlihatkan kemiripan (kedekatan) antara titik-individu.
Teladan 1 :
Hasil analisis komponen utama terhadap matriks data tentang kondisi fisik perairan pada 20 stasiun. Parameter yang diukur terdiri atas 6 variabel uji, yaitu : kecepatan arus (AR), kecerahan (CE), kandungan pasir dalam substrat ((PA), kandungan debu dalam substrat (DE), kandungan liat dalam substrat (LI) dan kandungan C-organik dalam substrat (CO).
Tujuan Analisis : untuk mengkaji hubungan antara variabel fisik perairan, dan mendeterminasi apakan terdapat pengelompokan stasiun berdasarkan variabel fisik perairan.
Hasil Analisis Komponen Utama Dimaksudkan sebagai berikut :
Princilple Components Analysis (PCA), Oleh Asbar
24
Hasil analisis Komponen dengan menggunakan Program STATITCF, akan memunculkan nilai tengah masing-masing variabel dan simpangan bakunya, matriks korelasi variabel.
Tahapan 1.
• Jumlah observasi : 20
• Jumlah variabel : 6• Jumlah variabel aktif yg dianalisis : 6• Jumlah sumbu yang diminta : 3• Jumlah variabel suplemen : 0
STATISTIK DASAR
Variabel Nilai Tengah Simpangan Baku
PA 2.200 0.8718
CO 2.250 0.6225
AR 2.250 0.7665
CE 2.300 0.7810
DE 1.950 0.7399
LI 2.000 0.7071
KORELASI
PA CO AR CE DE LI
PACOARCEDELI
1.0000.276
-0.2990.2790.248
-0.081
1.0000.079
-0.257-0.0810.227
1.0000.042
-0.3310.000
1.0000.199
-0.2721.0000.096 1.000
Princilple Components Analysis (PCA), Oleh Asbar
25
Tahap 2
Sumbu 1 Sumbu 2 Sumbu 3
Baris 1 1.0912 0.7521 0.5956
Baris 2 32.1 % 22.2 % 17.6 %
DIAGONALISASI
Baris 1 : Akar ciri (ragam pada sumbu utama)
Baris 2 : Kontribusi pada variabel total (persentase yang dijelaskan yang dijelaskan oleh sumbu utama)
Vektor ciri (Koefisien variabel dalam fungsi linier sumbu utama)Variabel Sumbu 1 Sumbu 2 Sumbu 3
PA 0.7001 -0.1509 0.5274
CO 0.0192 -0.3781 0.5132
AR -0.4130 0.3468 0.4798
CE 0.3871 0.6443 0.0325
DE 0.4183 -0.1343 -0.4747
LI -0.1187 -0.5300 -0.0425
Dari ke tiga sumbu utama pertama sudah mampu menjelaskan keseluruhan informasi sebesar 72 %, masih ada 28 % ragam yang dijelaskan oleh sumbu-sumbu lain. Beberapa pakar memberikan patokan untuk memilih sumbu tdk lebih dari 3, dan dasar presentase informasi untuk dipresentasikan (misalnya 70 %) sudah cukup bagus.
Princilple Components Analysis (PCA), Oleh Asbar
26
Tahap 3
Interpretasi hasil PCA dilakukan secara berbeda untuk variabel dan individu. Koordinat variabel untuk setiap sumbu adalah = korelasi antara variabel dan sumbu.
Semakin kuat korelasi (negatif atau positif), maka semakin dekat variabel tersebut pada sumbu.
Dapat juga kita menginterpretasi hubungan antara variabel dengan memperhatikan sudut yang terbentuk antaranya.
VARIABEL
Kolom 1 : Korelasi antara variabel dan sumbu utama (R)
Kolom 2 : Koevisien determinasi (R2)
Variable
Komponen Utama
Sumbu 1 Sumbu 2 Sumbu 3
Kolom 1 Kolom 2 Kolom 1 Kolom 2 Kolom 1 Kolom 2
PA 0.8389 0.7037 0.1501 0.0225 0.4669 0.2180
CO 0.0323 0.0010 0.5268 0.2775 0.6362 0.4048
AR 0.5626 0.3168 0.3924 0.1540 0.4831 0.2334
CE 0.5178 0.2681 0.7154 0.5118 0.0321 0.0010
DE 0.5905 0.3487 0.1574 0.0248 0.4951 0.2451
LI 0.1753 0.0307 0.6500 0.4225 0.0464 0.0022
Princilple Components Analysis (PCA), Oleh Asbar
27
Tahapan 4
Hasil yang diperoleh dikhususkan pada kajian individu. Selain koordinat dari setiap titik-individu pada sumbu-sumbu (disebut Komponen Utama). Program analisis juga memunculkan kosinus kuadrat (kontribusi relatif) yang berguna untuk mengevaluasi kualitas representasi titik pada sumbu tertentu.
INDIVIDUKolom 1 : Koordinat individu pada sumbu utamaKolom 2 : Kosinus kuadrat
INDIVIDUSumbu 1 Sumbu 2 Sumbu 3
Kolom 1 Kolom 2 Kolom 1 Kolom 2 Kolom 1 Kolom 2
01 -1.5491
02 -0.9502
03 1.3429
04 -1.6682
05 -0.2295
06 0.5763
07 1.8692
08 -0.6234
09 1.5311
10 0.0011
11 0.6686
12 1.6682
13 0.5891
14 0.9816
15 -0.5426
16 0.3497
17 -0.5810
18 0.2690
19 0.3008
20 -0.0868
Princilple Components Analysis (PCA), Oleh Asbar
28
Hasil Analisis Kualitas Air di Wilayah Pesisir Kabupaten Sinjai ada Bulan September 2004 s/d Januari 2005
Stasiun
Parameter Kualitas Air
Suhu Sal pH Kekr TSS DO BOD COD NH3 NO3 PO4
I 30.00 34.33 7.50 10.33 247.34 5.76 0.747 44.19 0.001 0.51 0.217
II 30.33 35.67 7.45 16.17 197.16 5.65 0.373 40.91 0.002 0.70 0.287
III 30.33 35.17 7.40 15.37 201.82 5.76 0.640 35.04 0.002 0.10 0.134
IV 29.33 35.67 7.63 20.67 268.73 5.87 1.173 40.08 0.001 0.58 0.141
V 30.00 35.00 7.51 8.00 205.35 5.60 0.587 34.93 0.001 0.03 0.090
VI 29.33 35.50 7.53 3.67 193.56 5.71 0.480 18.37 0.001 0.01 0.122
VII 30.33 35.00 8.10 11.67 251.62 6.50 1.707 43.25 0.001 1.00 0.147
VIII 29.00 35.67 7.93 4.00 220.34 5.53 1.903 38.03 0.001 0.04 0.154
IX 29.17 37.00 7.90 16.30 209.07 5.42 1.370 42.13 0.001 0.24 0.128
X 29.33 36.33 7.79 52.33 233.72 5.76 1.067 32.16 0.002 0.46 0.128
XI 30.00 35.67 8.08 72.67 225.69 5.43 0.747 39.36 0.001 0.77 0.128
XII 29.67 34.33 8.07 10.00 202.62 6.46 1.487 34.99 0.001 0.07 0.147
Contoh Soal :
Princilple Components Analysis (PCA), Oleh Asbar
29
JAWABAN .
Hasil Analisis Pca Kualitas Air Di Perairan Pesisir Sinjai
Means and standard deviations of the variables:
Parameter Means Standard deviations
Suhu 29.736 0.469
Sal 35.444 0.728
pH 7.743 0.256
Kekr 20.097 19.998
TSS 221.419 23.285
DO 5.787 0.336
BOD 1.023 0.484
COD 36.954 6.652
NH3 0.001 0.000
NO3 0.376 0.324
PO4 0.152 0.050
Princilple Components Analysis (PCA), Oleh Asbar
30
Biplot (axes F1 and F2: 55.44 %)
XII
XI
X IXVIII
VII
VI
V
IV
III
II
ISuhu
SAL
pH
KEK
TSSDO
BOD
COD
NH3
NO3
PO4
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5
-- axis F1 (30.35 %) -->
Mangrove
Sungai
Tambak
Perairan Pantai
Variabel kualitas air berdasarkan stasiun
top related