6. analisis komponen utama.pdf
Post on 15-Sep-2015
48 Views
Preview:
TRANSCRIPT
-
ANALISIS PEUBAH GANDA
ANALISIS KOMPONEN UTAMA
LOGO
Hazmira Yozza
Jurusan Matematika FMIPA Universitas Andalas
-
www.themegallery.com
Analisis Komponen Utama
Karl Pearson (1901) Memperkenalkan AKU Belum memberikan metode prak-
tis perhitungan untuk kasus
Suatu analisis statistika yang berguna untuk mereduksi p peubah menjadi r peubah
baru yang disebut Komponen Utama(r p) dengan tetap mempertahankan
besarnya keragaman dari peubah asal
Hotelling (1933) Memberikan metode perhitungan
praktis dalam menentukan KU
Company Logo
tis perhitungan untuk kasus dengan lebih dari dua peubah
praktis dalam menentukan KU Dalam prakteknya, masih
terbatas untuk sedikit peubah
Perkembangan Komputer Memungkinkan perhitungan untuk kasus banyak peubah
-
www.themegallery.com
Input Data
Dilakukan pengamatan/pengukuran p peubah (X1, X2, , Xp)
terhadap n objek pengamatan
Diperoleh data :
Objek X1 X2 Xp
1 x x x
Company Logo
1 x11 x21 xp1
2 x12 x22 xp2
3 x13 x23 xp3
: : : :
n x1n x2n xpn
-
www.themegallery.com
X1, X2, , Xp Y1, Y2, , YrAKU
1. Y1, Y2, , Yr adalah kombinasi linier dari peubah asal
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yr = ar1X1 + ar2 X2 + +arp Xp = arTX
2. Y , Y , , Y tidak saling berkorelasi
Y = A X
Company Logo
2. Y1, Y2, , Yr tidak saling berkorelasi
3. Y1, Y2, , Yr tertata menurut pentingnya
Var(Y1) Var(Y2) Var(Yr) 0
diharapkan k KU pertama (k sekecil mungkin) sudah mampu menjelaskansebahagian besar keragaman data
0),cov(0),( ==jiji
YYYYcorr
-
www.themegallery.com
Catatan :
AKU tidak selalu berhasil dalam mereduksi banyaknya peubah
AKU tidak bermanfaat bila peubah-peubah yang dianalisis tidak saling berkorelasi. Dalam hal ini, KU yang dihasilkan akan sama dengan peubah asal, tapi terurut berdasarkan pentingnya peubah tersebut (atau terurut berdasarkan keragamannya)
Company Logo
tersebut (atau terurut berdasarkan keragamannya)
Hasil terbaik adalah jika terdapat korelasi yang tinggi antar peubah Pembentukan matriks korelasi mrp analisis pendahuluan pada AKU
-
www.themegallery.com
Pembentukan Komponen Utama Pertama
Komponen Utama Pertama
Peubah Asal
X = [X1, X2, , Xp]
dengan = Var(X) (matriks ragam peragam dari X)
Company Logo
Komponen Utama Pertama
Y1 = a11X1 + a12 X2 + +a1p Xp= a1TX
diinginkan Y1 dengan Var (Y1) maksimum
Var(Y1) = Var(a
1TX) = a
1T Var(X) a
1= a
1T a
1
Kendala a1T a
1 = 1
-
www.themegallery.com
Pembentukan Komponen Utama Pertama
Masalah : menentukan a sehingga diperoleh :
Max a1T a
1
Kendala a1T a
1 = 1
Max f(a1 )=a1T a1 (a1
T a1 1)
Agar f maksimum, maka :
Company Logo
Agar f maksimum, maka :
dan
(2)
(1)
0=
1a
f
( ) 0)1(1
=
1
T
11
T
1
1
aaaaa
0)(
22
0022
1
1
1
=
=
=+
1
11
11
aI
aa
aa
0=
f
( ) 0)1(1
=
1
T
11
T
1aaaa
1
01
1
1
=
=+
1
1
aa
aa
T
T
-
www.themegallery.com
Pembentukan Komponen Utama Pertama
Persamaan (1)
10)( =
1aI
1 : akar karakteristik dari
a1: vektor karakteristik
padanannya
Persamaan (1)
0)(1=
1aI
Company Logo
1
11
111
1
10)(
=
=
=
=
=
1
11
11
1
aa
Iaaaa
Iaa
aI
T
TT
11=
1aaT
(kalikan dengan a1T)
(dari (2) diketahui )
Fs yang akan
dimaksimumkan
Agar maksimum,
maka 1
1 : akar karakteristik
terbesar dari
a1: vektor karakteristik
padanannya
-
www.themegallery.com
Pembentukan Komponen Utama Kedua
KU Kedua Y2 = a21X1 + a22 X2 ++ a2p Xp= a2TX
Syarat :
Y2 memiliki keragaman terbesar kedua setelah Y1
Var(Y2) = Var(a2TX) = a2
T Var(X) a2= a2T a2
Y tidak berkorelasi dengan Y
a2T a2 = 1
Company Logo
Y2 tidak berkorelasi dengan Y1
0
0)(
0),(),(),(
12
12
121212
=
=
===
aa
aXa
XaXa
T
T
TT
Var
CovCorr CovYYYY
-
www.themegallery.com
Pembentukan Komponen Utama Kedua
012=aa
T
Dari Persamaan (1)
11
11
aaaa
aa
TT
122
1
=
=
Company Logo
Jika maka
(a2 dan a1 saling orthogonal)
1
11
aa
aaaa
T
21
122
=
=
012=aa
T
0
0
2
221
=
==
1
11
aa
aaaa
T
TT
-
www.themegallery.com
Pembentukan Komponen Utama Kedua
Masalah : menentukan a2sehingga diperoleh :
Max a2T a
2
Kendala a2T a
2= 1
a2T a
1= 0
Company Logo
0
2
=
a
f
Masalah : menentukan a2, 2 dan sehingga diperoleh :
Max f(a2,,)=a2
T a2 2(a2
T a2 1)- a
2T a
1
Agar f maksimum, maka :
; dan0=
f0=
f
-
www.themegallery.com
Pembentukan Komponen Utama Kedua
0
2
=
a
f
( ) 0)1(1222222
2
=
aaaaaa
a
TTT
0
2
=
f
0122=+ aa
T(3)
( ) 0)1(1222222
2
=
aaaaaaTTT
(4)022 222 = 1aaa
Company Logo
0=
f
002112== aaaa
TT
( ) 0)1(1222222=
aaaaaaTTT
(5)
Kalikan (3) dengan a1T
0 1
;
(6)
022222
=1
T
1
T
1
T
1aaaaaa
022=aa
T
10
22== aaaa
T
1
T
1
0=
(6) Subs ke (3) : (7)0)(02222222== aIaa
-
www.themegallery.com
Pembentukan Komponen Utama Kedua
Persamaan (7)
220)( = aI
2 : akar karakteristik dari
a2: vektor karakteristik
padanannya
Persamaan (7)
0)(22= aI
Company Logo
2
222
22222
222
220)(
=
=
=
=
=
aa
Iaaaa
Iaa
aI
T
TT
122=aa
T
(kalikan dengan a2T)
(dengan mensubst (6) ke (4) didapat :
Fs yang akan
dimaksimumkan
Agar maksimum, maka :
2 : akar karakteristik ke-2 terbesar dari
a2: vektor karakteristik padanannya
-
www.themegallery.com
Pembentukan KU berikutnya
Dilakukan dengan pendekatan yang sama dengan Pembentukan komponen utama 1 dan 2
Company Logo
Didapat bahwa :
i : akar karakteristik ke-i terbesar dari
ai: vektor karakteristik padanannya
-
www.themegallery.com
Langkah-langkah dalam AKU
Tentukan a1, a2, ,ar yang merupakan vektor karakteristik yang berpadanan dengan akar karakteristik tak nol dari matriks ragam peragam , 1, 2, , r (1 2 r 0
Tentukan matrisk . Karena data yang dimiliki adalah data contoh, maka matriks ini diduga dari matriks ragam peragam contoh S
Company Logo
Tentukan Komponen Utama :
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yr = ap1X1 + ap2 X2 + +app Xp = arTX
Ortonormalkan vektor a1, a2, ,ar
Orthogonalkan dengan POGS
Normalkan dengan membagi setiap unsur dengan norm-nya
-
www.themegallery.com
Keragaman Total KU
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yr = ap1X1 + ap2 X2 + +app Xp = arTXc
Xa
a
Xa
Xa
T
T
1
T
T
1
=
=
Y
Y
MMM222
1atau
Company Logo
aXaTT
rr
rY
MMM
Bila dinyatakan maka : [ ]r21aaaA ,,, L=
XAYT
=
AA
AXA
XAY
T
T
T
=
=
=
)(
)()(
Var
VarVar
=
r
L
MOMM
L
L
00
00
00
)( 2
1
YVar
-
www.themegallery.com
Keragaman Total KU
)(Y trace keragaman Total ==r
i
==
r
L
MOMM
L
L
00
00
00
)( 2
1
Y VarMisal
Company Logo
)(1
Y trace keragaman Total ===i
i
X
AAAATT
keragaman total
Vartrace
tracetrace)trace(
=
==
==
=
p
i
iX
1
)()(
)()(
-
www.themegallery.com
Bila Var(Yi) = i, maka dapat dikatakan bahwa :
KU Yi mampu menerangkan dari total
keragaman seluruh komponen utama
KU Yi mampu menerangkan dari total
keragaman data asal
=
r
i
ii
1
=
r
i
ii
1
Dg demikian, k KU pertama, Y1, Y2, , Yk mampu
Keragaman Total KU
Company Logo
Dg demikian, k KU pertama, Y1, Y2, , Yk mampu
menerangkan dari total keragaman data asal==
r
i
i
k
i
i
11
Bila nilai ini sudah cukup besar, maka cukup digunakan
k KU saja.
-
www.themegallery.com
Berapa besar k????????
Pilih KU dengan akar karakteristik lebih besar dari 1 (hanya jika menggunakan matriks korelasi)
Pilih k KU sehingga
Scree plot
%80
11
>==
r
i
i
k
i
i
Company Logo
Scree plot
i
i
1 2 3 4
2 KU
curam
landai
-
www.themegallery.com
Peubah berbeda satuan atau keragaman sangat berbeda
Peubah yang memiliki keragaman lebih besar dianggap
lebih penting dibanding yang lain
Pada kondisi ini, peubah dibakukan dulu sehingga setiap
peubah memiliki nilai tengah 0 dan ragam 1
jij
ijs
XXZ
= Jd semua peubah sama pentingnya
Company Logo
Matriks S menjadi matriks korelasi R
Penurunan matematis sama shg prosedur analisis sama
aidan
iyang diperoleh berbeda
Total keragaman Y = total keragaman Z = p = # peubah
j
ijs
=
1
1
1
21
221
112
L
MOMM
L
L
pp
p
p
rr
rr
rr
-
www.themegallery.com
Skor komponen
)( xXAT =Y
Skor komponen untuk objek ke-m
Skor komponen
Company Logo
)( xxAm
T=
my
-
www.themegallery.com
Beberapa catatan
1. Dugaan KU
diduga dari S, sehingga yang didapat dalam analisis adalah dan
Tidak ada asumsi tentang X, sehingga sifat dari penduga tidak dapat diturunkan
AKU dipandang sebagai suatu teksik statistika
r ,...,
1 raa ,...,
1
Company Logo
AKU dipandang sebagai suatu teksik statistika yang tidak didasarkan pada suatu model apapun, shg KU yang diperoleh tetap dipandang sebagai KU, bukan hanya sekedar dugaan
-
www.themegallery.com
Beberapa catatan
2. Akar karakteristik 0
Terjadi jika terdapat keterkaitan linier antara peubah (jarang terjadi)
KU yang dihasilkan tidak digunakan
3. Akar karakteristik kecil
Company Logo
3. Akar karakteristik kecil
Terjadi jika terdapat korelasi yang cukup erat antar peubah.
KU nya dapat diabaikan
-
www.themegallery.com
Output AKU
1. Diinterpretasikan langsung
2. Sebagai input bagi analisis statistika lainnya
Analisis Regresi (jk terjadi multikolonier antara
peubah)
Analisis gerombol untuk mengelompokkan objek
Analisis diskriminan
Company Logo
Analisis diskriminan
-
www.themegallery.com
Langkah-langkah dalam AKU
Tentukan 1, 2, , r dan a1, a2, ,ar yang merupakan akar dari matriks S (atau matriks R) dimana 1 2 r 0 dan a1, a2, ,ar saling orthogonal
Tentukan matrisk ragam peragam S (dan/atau matriks korelasi R) dari data
Periksa (dari matriks korelasinya) apakah peubah perlu ditransformasi dengan AKU
Tentukan banyaknya KU yang dapat diambil
Company Logo
Tentukan Komponen Utama :
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yk = ak1X1 + ak2 X2 + +akp Xp = akTX
Tentukan banyaknya KU yang dapat diambil
Periksa apakah KU yang dihasilkan memiliki interpretasi yang berarti
Hitung skor komponen, bila ingin melalukan analisis lanjutan
-
www.themegallery.com
Contoh Penerapan AKU
Dilakukan pengukuran morfologi tubuh terhadap 49 ekor burung betet . Peubah yang diukur adalah :
X1 = Total panjang burung X2 = bentangan sayap
X3 = Panjang paruh dan kepala X4 = Panjang tulang sayap atas
X5 = Panjang keel of sternum (tulang tempat melekatnya otot untuk terbang)
Diperoleh data :
Company Logo
Diperoleh data :
Objek X1 X2 X3 X4 X5
1 156 245 31.6 18.5 20.5
2 154 240 30.4 17.9 19.6
3 153 240 31.0 18.4 20.6
: : : : : :
49 164 248 32.3 18.8 20.9
-
www.themegallery.com
Ragam Peragam
X1 X2 X3 X4 X5
X1 13.2527
X2 8.7985 25.6828
X3 1.9221 1.8886 0.6316
X4 1.3306 1.6394 0.3443 0.3184
X5 2.1922 2.2745 0.4147 0.3394 0.9828
Company Logo
Nilainya relatif lebih besar jika dibanding-
kan dengan ragam peubah-peubah lain
Terdapat kecendrungan bahwa dua peubah
(X1 dan X2) akan mendominasi pemben-
tukan KU
Bakukan Data
.
Matriks ragam
peragam (Z) adalah
matriks korelasi dari
X
j
jij
ijs
XXZ
=
MTB>Cova X1-X5 m1
-
www.themegallery.com
Data Baku
Objek Z1 Z2 Z3 Z4 Z5
Objek X1 X2 X3 X4 X5
1 156 245 31.6 18.5 20.5
2 154 240 30.4 17.9 19.6
3 153 240 31.0 18.4 20.6
: : : : : :
49 164 248 32.3 18.8 20.9
Rata2 157.98 241.33 31.46 18.47 20.83
Stdev 3.65 5.07 0.79 0.56 0.99
26176.007.5
33.241240
2
223
23
=
=
=
s
XXZ
Company Logo
1 -0.54172 0.72486 0.17718 0.05425 -0.32937
2 -1.08902 -0.26176 -1.33272 -1.00904 -1.23720
3 -1.36267-0.26176
-0.57777 -0.1229 -0.22850
:
49 1.64750 1.31683 1.05796 0.5858950.074108
6
MTB>Center x1-x5 c6-c10
-
www.themegallery.com
Matriks Korelasi
X1 X2 X3 X4 X5
X1 1.00000
X2 0.73496 1.00000
X3 0.66181 0.67374 1.00000
X4 0.64528 0.76851 0.76319 1.00000
Company Logo
X4 0.64528 0.76851 0.76319 1.00000
X5 0.60512 0.52901 0.52627 0.60665 1.00000
Korelasi antar peubah cukup besar
AKU akan berguna dalam mereduksi data
Untuk selanjutnya, AKU dilakukan dengan menggunakan matriks ini
MTB>Corr x1-x5 m2
-
www.themegallery.com
Penentuan Akar dan Vektor Karakteristik
KU i Z1 Z2 Z3 Z4 Z5 % %kum
Y1 3.61598 0.452 0.462 0.451 0.471 0.397 72.3% 72.3%
Y2 0.53150 0.051 -0.300 -0.325 -0.185 0.876 10.6% 82.9%
Y3 0.38642 0.690 0.341 -0.454 -0.411 -0.178 7.7% 90.7%
Y4 0.30157 -0.420 0.548 -0.606 0.388 0.069 6.0% 96.7%
Y5 0.16453 0.374 -0.530 -0.343 0.652 -0.192 3.2% 100%
a1T
Company Logo
MTB>Eigen m2 c11 m3 (lakukan analisis eigen untuk matriks m2, akar
karakteristik di c11, vektor karakteristik di m3)
54321Z.Z.Z.Z.Z.Y 39704710451046204520
1++++=
54321287601850325030000510 Z.Z.Z.Z.Z.Y +=
54321317804110454034106900 Z.Z.Z.Z.Z.Y +=
54321406903880606054804200 Z.Z.Z.Z.Z.Y +++=
54321519206520343053003740 Z.-Z. Z.-Z.-Z. Y +=
-
www.themegallery.com
Berapa KU
1. Berdasarkan nilai akar karakteristik
Hanya Y1 yang akar karakteristiknya lebih dari 1
Diambil hanya KU-1, Y1
2. Berdasarkan % keragam yang dijelaskan KU
Company Logo
Y1, Y2, , Y5 mampu menjelaskan sebesar masing-masing
72.3%, 10.6%, 7.7%, 6.0% dan 3.2% dari total keragaman
data asal
Bila 72.3% dianggap cukup besar, gunakan anya Y1
Bila tidak, gunakan juga Y2. Y1 dan Y2 mampu menjelaskan
86.9% dari total keragaman data (sudah cukup besar)
-
www.themegallery.com
4
3
2
E
i
g
e
n
v
a
l
u
e
Scree Plot of X1, ..., X5
Berapa KU
3. Berdasarkan scree plotcuram
landai
Company Logo
54321
1
0
Component Number
E
Diambil 1 KU, Y1
-
www.themegallery.com
54321Z.Z.Z.Z.Z.Y 39704710451046204520
1++++=
54321287601850325030000510 Z.Z.Z.Z.Z.Y +=
54321317804110454034106900 Z.Z.Z.Z.Z.Y +=
54321406903880606054804200 Z.Z.Z.Z.Z.Y +++=
19206520343053003740 Z.-Z. Z.-Z.-Z. Y +=
Company Logo
54321519206520343053003740 Z.-Z. Z.-Z.-Z. Y +=
-
www.themegallery.com
Skor Komponen
Objek Y1 Y2 Y3 Y4 Y5
1 0.06429 -0.600837 -0.171233 0.515826 0.548790
2 -2.18031 -0.442301 0.400070 0.645460 0.231077
3 -1.14557 0.01925 -0.676127 0.716298 0.208871
:
49 2.13422 -0.697546 0.851168 -0.380029 0.077126
Company Logo
49 2.13422 -0.697546 0.851168 -0.380029 0.077126
064.0
)329.0(3970)054.0(4710)177.0(4510)725.0(4620)542.0(4520
3970471045104620452011
=
++++=
++++=
.....
Z.Z.Z.Z.Z.Y5141312111
-
www.themegallery.com
Plot antara Y1 dan Y2
3
2
1
Survivors
Non-survivors
Company Logo
43210-1-2-3-4-5
0
-1
-2
Y1
Y
2
-
www.themegallery.com
Stat>Multivariate>Principle ComponentsIsikan nama peubah atau kolom tempat
menyimpan peubah
Isikan banyak KU yang akan
AKU dengan Minitab
Company Logo
Isikan banyak KU yang akan
dihitung skornya(max sama
dengan banyak peubah asal)
Pilih (hanya salah satu)
matriks yang digunakan
sebagai dasar analisis
(default : matriks korelasi)
Option untuk membuat grafik Option untuk menyimpan
hasil perhitungan
-
www.themegallery.com
Menampilkan scree plot
Menampilkan diagram
pencar antara skor KU-1
dan skor KU-2
Company Logo
Menampilkan plot
loading untuk KU-1 dan
KU-2
Hasil analisis biplot
-
www.themegallery.com
Isikan kolom-kolom untuk menyimpan
koefisien (vektor karakteristik) (banyak
kolom harus sama dengan banyaknya
peubah asal)Isikan kolom-kolom
untuk menyimpan skor
komponen (banyak
kolom harus sama
dengan banyaknya KU)
Company Logo
Diperlukan jika output
AKU akan dianalisis
lebih lanjut
Isikan kolom (hanya 1
kolom) untuk menyimpan
akar karakteristik
top related