6. analisis komponen utama.pdf

38
ANALISIS PEUBAH GANDA ANALISIS KOMPONEN UTAMA LOGO Hazmira Yozza Jurusan Matematika FMIPA Universitas Andalas

Upload: zetil-hikmah

Post on 15-Sep-2015

44 views

Category:

Documents


4 download

TRANSCRIPT

  • ANALISIS PEUBAH GANDA

    ANALISIS KOMPONEN UTAMA

    LOGO

    Hazmira Yozza

    Jurusan Matematika FMIPA Universitas Andalas

  • www.themegallery.com

    Analisis Komponen Utama

    Karl Pearson (1901) Memperkenalkan AKU Belum memberikan metode prak-

    tis perhitungan untuk kasus

    Suatu analisis statistika yang berguna untuk mereduksi p peubah menjadi r peubah

    baru yang disebut Komponen Utama(r p) dengan tetap mempertahankan

    besarnya keragaman dari peubah asal

    Hotelling (1933) Memberikan metode perhitungan

    praktis dalam menentukan KU

    Company Logo

    tis perhitungan untuk kasus dengan lebih dari dua peubah

    praktis dalam menentukan KU Dalam prakteknya, masih

    terbatas untuk sedikit peubah

    Perkembangan Komputer Memungkinkan perhitungan untuk kasus banyak peubah

  • www.themegallery.com

    Input Data

    Dilakukan pengamatan/pengukuran p peubah (X1, X2, , Xp)

    terhadap n objek pengamatan

    Diperoleh data :

    Objek X1 X2 Xp

    1 x x x

    Company Logo

    1 x11 x21 xp1

    2 x12 x22 xp2

    3 x13 x23 xp3

    : : : :

    n x1n x2n xpn

  • www.themegallery.com

    X1, X2, , Xp Y1, Y2, , YrAKU

    1. Y1, Y2, , Yr adalah kombinasi linier dari peubah asal

    Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX

    :

    Yr = ar1X1 + ar2 X2 + +arp Xp = arTX

    2. Y , Y , , Y tidak saling berkorelasi

    Y = A X

    Company Logo

    2. Y1, Y2, , Yr tidak saling berkorelasi

    3. Y1, Y2, , Yr tertata menurut pentingnya

    Var(Y1) Var(Y2) Var(Yr) 0

    diharapkan k KU pertama (k sekecil mungkin) sudah mampu menjelaskansebahagian besar keragaman data

    0),cov(0),( ==jiji

    YYYYcorr

  • www.themegallery.com

    Catatan :

    AKU tidak selalu berhasil dalam mereduksi banyaknya peubah

    AKU tidak bermanfaat bila peubah-peubah yang dianalisis tidak saling berkorelasi. Dalam hal ini, KU yang dihasilkan akan sama dengan peubah asal, tapi terurut berdasarkan pentingnya peubah tersebut (atau terurut berdasarkan keragamannya)

    Company Logo

    tersebut (atau terurut berdasarkan keragamannya)

    Hasil terbaik adalah jika terdapat korelasi yang tinggi antar peubah Pembentukan matriks korelasi mrp analisis pendahuluan pada AKU

  • www.themegallery.com

    Pembentukan Komponen Utama Pertama

    Komponen Utama Pertama

    Peubah Asal

    X = [X1, X2, , Xp]

    dengan = Var(X) (matriks ragam peragam dari X)

    Company Logo

    Komponen Utama Pertama

    Y1 = a11X1 + a12 X2 + +a1p Xp= a1TX

    diinginkan Y1 dengan Var (Y1) maksimum

    Var(Y1) = Var(a

    1TX) = a

    1T Var(X) a

    1= a

    1T a

    1

    Kendala a1T a

    1 = 1

  • www.themegallery.com

    Pembentukan Komponen Utama Pertama

    Masalah : menentukan a sehingga diperoleh :

    Max a1T a

    1

    Kendala a1T a

    1 = 1

    Max f(a1 )=a1T a1 (a1

    T a1 1)

    Agar f maksimum, maka :

    Company Logo

    Agar f maksimum, maka :

    dan

    (2)

    (1)

    0=

    1a

    f

    ( ) 0)1(1

    =

    1

    T

    11

    T

    1

    1

    aaaaa

    0)(

    22

    0022

    1

    1

    1

    =

    =

    =+

    1

    11

    11

    aI

    aa

    aa

    0=

    f

    ( ) 0)1(1

    =

    1

    T

    11

    T

    1aaaa

    1

    01

    1

    1

    =

    =+

    1

    1

    aa

    aa

    T

    T

  • www.themegallery.com

    Pembentukan Komponen Utama Pertama

    Persamaan (1)

    10)( =

    1aI

    1 : akar karakteristik dari

    a1: vektor karakteristik

    padanannya

    Persamaan (1)

    0)(1=

    1aI

    Company Logo

    1

    11

    111

    1

    10)(

    =

    =

    =

    =

    =

    1

    11

    11

    1

    aa

    Iaaaa

    Iaa

    aI

    T

    TT

    11=

    1aaT

    (kalikan dengan a1T)

    (dari (2) diketahui )

    Fs yang akan

    dimaksimumkan

    Agar maksimum,

    maka 1

    1 : akar karakteristik

    terbesar dari

    a1: vektor karakteristik

    padanannya

  • www.themegallery.com

    Pembentukan Komponen Utama Kedua

    KU Kedua Y2 = a21X1 + a22 X2 ++ a2p Xp= a2TX

    Syarat :

    Y2 memiliki keragaman terbesar kedua setelah Y1

    Var(Y2) = Var(a2TX) = a2

    T Var(X) a2= a2T a2

    Y tidak berkorelasi dengan Y

    a2T a2 = 1

    Company Logo

    Y2 tidak berkorelasi dengan Y1

    0

    0)(

    0),(),(),(

    12

    12

    121212

    =

    =

    ===

    aa

    aXa

    XaXa

    T

    T

    TT

    Var

    CovCorr CovYYYY

  • www.themegallery.com

    Pembentukan Komponen Utama Kedua

    012=aa

    T

    Dari Persamaan (1)

    11

    11

    aaaa

    aa

    TT

    122

    1

    =

    =

    Company Logo

    Jika maka

    (a2 dan a1 saling orthogonal)

    1

    11

    aa

    aaaa

    T

    21

    122

    =

    =

    012=aa

    T

    0

    0

    2

    221

    =

    ==

    1

    11

    aa

    aaaa

    T

    TT

  • www.themegallery.com

    Pembentukan Komponen Utama Kedua

    Masalah : menentukan a2sehingga diperoleh :

    Max a2T a

    2

    Kendala a2T a

    2= 1

    a2T a

    1= 0

    Company Logo

    0

    2

    =

    a

    f

    Masalah : menentukan a2, 2 dan sehingga diperoleh :

    Max f(a2,,)=a2

    T a2 2(a2

    T a2 1)- a

    2T a

    1

    Agar f maksimum, maka :

    ; dan0=

    f0=

    f

  • www.themegallery.com

    Pembentukan Komponen Utama Kedua

    0

    2

    =

    a

    f

    ( ) 0)1(1222222

    2

    =

    aaaaaa

    a

    TTT

    0

    2

    =

    f

    0122=+ aa

    T(3)

    ( ) 0)1(1222222

    2

    =

    aaaaaaTTT

    (4)022 222 = 1aaa

    Company Logo

    0=

    f

    002112== aaaa

    TT

    ( ) 0)1(1222222=

    aaaaaaTTT

    (5)

    Kalikan (3) dengan a1T

    0 1

    ;

    (6)

    022222

    =1

    T

    1

    T

    1

    T

    1aaaaaa

    022=aa

    T

    10

    22== aaaa

    T

    1

    T

    1

    0=

    (6) Subs ke (3) : (7)0)(02222222== aIaa

  • www.themegallery.com

    Pembentukan Komponen Utama Kedua

    Persamaan (7)

    220)( = aI

    2 : akar karakteristik dari

    a2: vektor karakteristik

    padanannya

    Persamaan (7)

    0)(22= aI

    Company Logo

    2

    222

    22222

    222

    220)(

    =

    =

    =

    =

    =

    aa

    Iaaaa

    Iaa

    aI

    T

    TT

    122=aa

    T

    (kalikan dengan a2T)

    (dengan mensubst (6) ke (4) didapat :

    Fs yang akan

    dimaksimumkan

    Agar maksimum, maka :

    2 : akar karakteristik ke-2 terbesar dari

    a2: vektor karakteristik padanannya

  • www.themegallery.com

    Pembentukan KU berikutnya

    Dilakukan dengan pendekatan yang sama dengan Pembentukan komponen utama 1 dan 2

    Company Logo

    Didapat bahwa :

    i : akar karakteristik ke-i terbesar dari

    ai: vektor karakteristik padanannya

  • www.themegallery.com

    Langkah-langkah dalam AKU

    Tentukan a1, a2, ,ar yang merupakan vektor karakteristik yang berpadanan dengan akar karakteristik tak nol dari matriks ragam peragam , 1, 2, , r (1 2 r 0

    Tentukan matrisk . Karena data yang dimiliki adalah data contoh, maka matriks ini diduga dari matriks ragam peragam contoh S

    Company Logo

    Tentukan Komponen Utama :

    Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX

    :

    Yr = ap1X1 + ap2 X2 + +app Xp = arTX

    Ortonormalkan vektor a1, a2, ,ar

    Orthogonalkan dengan POGS

    Normalkan dengan membagi setiap unsur dengan norm-nya

  • www.themegallery.com

    Keragaman Total KU

    Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX

    :

    Yr = ap1X1 + ap2 X2 + +app Xp = arTXc

    Xa

    a

    Xa

    Xa

    T

    T

    1

    T

    T

    1

    =

    =

    Y

    Y

    MMM222

    1atau

    Company Logo

    aXaTT

    rr

    rY

    MMM

    Bila dinyatakan maka : [ ]r21aaaA ,,, L=

    XAYT

    =

    AA

    AXA

    XAY

    T

    T

    T

    =

    =

    =

    )(

    )()(

    Var

    VarVar

    =

    r

    L

    MOMM

    L

    L

    00

    00

    00

    )( 2

    1

    YVar

  • www.themegallery.com

    Keragaman Total KU

    )(Y trace keragaman Total ==r

    i

    ==

    r

    L

    MOMM

    L

    L

    00

    00

    00

    )( 2

    1

    Y VarMisal

    Company Logo

    )(1

    Y trace keragaman Total ===i

    i

    X

    AAAATT

    keragaman total

    Vartrace

    tracetrace)trace(

    =

    ==

    ==

    =

    p

    i

    iX

    1

    )()(

    )()(

  • www.themegallery.com

    Bila Var(Yi) = i, maka dapat dikatakan bahwa :

    KU Yi mampu menerangkan dari total

    keragaman seluruh komponen utama

    KU Yi mampu menerangkan dari total

    keragaman data asal

    =

    r

    i

    ii

    1

    =

    r

    i

    ii

    1

    Dg demikian, k KU pertama, Y1, Y2, , Yk mampu

    Keragaman Total KU

    Company Logo

    Dg demikian, k KU pertama, Y1, Y2, , Yk mampu

    menerangkan dari total keragaman data asal==

    r

    i

    i

    k

    i

    i

    11

    Bila nilai ini sudah cukup besar, maka cukup digunakan

    k KU saja.

  • www.themegallery.com

    Berapa besar k????????

    Pilih KU dengan akar karakteristik lebih besar dari 1 (hanya jika menggunakan matriks korelasi)

    Pilih k KU sehingga

    Scree plot

    %80

    11

    >==

    r

    i

    i

    k

    i

    i

    Company Logo

    Scree plot

    i

    i

    1 2 3 4

    2 KU

    curam

    landai

  • www.themegallery.com

    Peubah berbeda satuan atau keragaman sangat berbeda

    Peubah yang memiliki keragaman lebih besar dianggap

    lebih penting dibanding yang lain

    Pada kondisi ini, peubah dibakukan dulu sehingga setiap

    peubah memiliki nilai tengah 0 dan ragam 1

    jij

    ijs

    XXZ

    = Jd semua peubah sama pentingnya

    Company Logo

    Matriks S menjadi matriks korelasi R

    Penurunan matematis sama shg prosedur analisis sama

    aidan

    iyang diperoleh berbeda

    Total keragaman Y = total keragaman Z = p = # peubah

    j

    ijs

    =

    1

    1

    1

    21

    221

    112

    L

    MOMM

    L

    L

    pp

    p

    p

    rr

    rr

    rr

  • www.themegallery.com

    Skor komponen

    )( xXAT =Y

    Skor komponen untuk objek ke-m

    Skor komponen

    Company Logo

    )( xxAm

    T=

    my

  • www.themegallery.com

    Beberapa catatan

    1. Dugaan KU

    diduga dari S, sehingga yang didapat dalam analisis adalah dan

    Tidak ada asumsi tentang X, sehingga sifat dari penduga tidak dapat diturunkan

    AKU dipandang sebagai suatu teksik statistika

    r ,...,

    1 raa ,...,

    1

    Company Logo

    AKU dipandang sebagai suatu teksik statistika yang tidak didasarkan pada suatu model apapun, shg KU yang diperoleh tetap dipandang sebagai KU, bukan hanya sekedar dugaan

  • www.themegallery.com

    Beberapa catatan

    2. Akar karakteristik 0

    Terjadi jika terdapat keterkaitan linier antara peubah (jarang terjadi)

    KU yang dihasilkan tidak digunakan

    3. Akar karakteristik kecil

    Company Logo

    3. Akar karakteristik kecil

    Terjadi jika terdapat korelasi yang cukup erat antar peubah.

    KU nya dapat diabaikan

  • www.themegallery.com

    Output AKU

    1. Diinterpretasikan langsung

    2. Sebagai input bagi analisis statistika lainnya

    Analisis Regresi (jk terjadi multikolonier antara

    peubah)

    Analisis gerombol untuk mengelompokkan objek

    Analisis diskriminan

    Company Logo

    Analisis diskriminan

  • www.themegallery.com

    Langkah-langkah dalam AKU

    Tentukan 1, 2, , r dan a1, a2, ,ar yang merupakan akar dari matriks S (atau matriks R) dimana 1 2 r 0 dan a1, a2, ,ar saling orthogonal

    Tentukan matrisk ragam peragam S (dan/atau matriks korelasi R) dari data

    Periksa (dari matriks korelasinya) apakah peubah perlu ditransformasi dengan AKU

    Tentukan banyaknya KU yang dapat diambil

    Company Logo

    Tentukan Komponen Utama :

    Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX

    :

    Yk = ak1X1 + ak2 X2 + +akp Xp = akTX

    Tentukan banyaknya KU yang dapat diambil

    Periksa apakah KU yang dihasilkan memiliki interpretasi yang berarti

    Hitung skor komponen, bila ingin melalukan analisis lanjutan

  • www.themegallery.com

    Contoh Penerapan AKU

    Dilakukan pengukuran morfologi tubuh terhadap 49 ekor burung betet . Peubah yang diukur adalah :

    X1 = Total panjang burung X2 = bentangan sayap

    X3 = Panjang paruh dan kepala X4 = Panjang tulang sayap atas

    X5 = Panjang keel of sternum (tulang tempat melekatnya otot untuk terbang)

    Diperoleh data :

    Company Logo

    Diperoleh data :

    Objek X1 X2 X3 X4 X5

    1 156 245 31.6 18.5 20.5

    2 154 240 30.4 17.9 19.6

    3 153 240 31.0 18.4 20.6

    : : : : : :

    49 164 248 32.3 18.8 20.9

  • www.themegallery.com

    Ragam Peragam

    X1 X2 X3 X4 X5

    X1 13.2527

    X2 8.7985 25.6828

    X3 1.9221 1.8886 0.6316

    X4 1.3306 1.6394 0.3443 0.3184

    X5 2.1922 2.2745 0.4147 0.3394 0.9828

    Company Logo

    Nilainya relatif lebih besar jika dibanding-

    kan dengan ragam peubah-peubah lain

    Terdapat kecendrungan bahwa dua peubah

    (X1 dan X2) akan mendominasi pemben-

    tukan KU

    Bakukan Data

    .

    Matriks ragam

    peragam (Z) adalah

    matriks korelasi dari

    X

    j

    jij

    ijs

    XXZ

    =

    MTB>Cova X1-X5 m1

  • www.themegallery.com

    Data Baku

    Objek Z1 Z2 Z3 Z4 Z5

    Objek X1 X2 X3 X4 X5

    1 156 245 31.6 18.5 20.5

    2 154 240 30.4 17.9 19.6

    3 153 240 31.0 18.4 20.6

    : : : : : :

    49 164 248 32.3 18.8 20.9

    Rata2 157.98 241.33 31.46 18.47 20.83

    Stdev 3.65 5.07 0.79 0.56 0.99

    26176.007.5

    33.241240

    2

    223

    23

    =

    =

    =

    s

    XXZ

    Company Logo

    1 -0.54172 0.72486 0.17718 0.05425 -0.32937

    2 -1.08902 -0.26176 -1.33272 -1.00904 -1.23720

    3 -1.36267-0.26176

    -0.57777 -0.1229 -0.22850

    :

    49 1.64750 1.31683 1.05796 0.5858950.074108

    6

    MTB>Center x1-x5 c6-c10

  • www.themegallery.com

    Matriks Korelasi

    X1 X2 X3 X4 X5

    X1 1.00000

    X2 0.73496 1.00000

    X3 0.66181 0.67374 1.00000

    X4 0.64528 0.76851 0.76319 1.00000

    Company Logo

    X4 0.64528 0.76851 0.76319 1.00000

    X5 0.60512 0.52901 0.52627 0.60665 1.00000

    Korelasi antar peubah cukup besar

    AKU akan berguna dalam mereduksi data

    Untuk selanjutnya, AKU dilakukan dengan menggunakan matriks ini

    MTB>Corr x1-x5 m2

  • www.themegallery.com

    Penentuan Akar dan Vektor Karakteristik

    KU i Z1 Z2 Z3 Z4 Z5 % %kum

    Y1 3.61598 0.452 0.462 0.451 0.471 0.397 72.3% 72.3%

    Y2 0.53150 0.051 -0.300 -0.325 -0.185 0.876 10.6% 82.9%

    Y3 0.38642 0.690 0.341 -0.454 -0.411 -0.178 7.7% 90.7%

    Y4 0.30157 -0.420 0.548 -0.606 0.388 0.069 6.0% 96.7%

    Y5 0.16453 0.374 -0.530 -0.343 0.652 -0.192 3.2% 100%

    a1T

    Company Logo

    MTB>Eigen m2 c11 m3 (lakukan analisis eigen untuk matriks m2, akar

    karakteristik di c11, vektor karakteristik di m3)

    54321Z.Z.Z.Z.Z.Y 39704710451046204520

    1++++=

    54321287601850325030000510 Z.Z.Z.Z.Z.Y +=

    54321317804110454034106900 Z.Z.Z.Z.Z.Y +=

    54321406903880606054804200 Z.Z.Z.Z.Z.Y +++=

    54321519206520343053003740 Z.-Z. Z.-Z.-Z. Y +=

  • www.themegallery.com

    Berapa KU

    1. Berdasarkan nilai akar karakteristik

    Hanya Y1 yang akar karakteristiknya lebih dari 1

    Diambil hanya KU-1, Y1

    2. Berdasarkan % keragam yang dijelaskan KU

    Company Logo

    Y1, Y2, , Y5 mampu menjelaskan sebesar masing-masing

    72.3%, 10.6%, 7.7%, 6.0% dan 3.2% dari total keragaman

    data asal

    Bila 72.3% dianggap cukup besar, gunakan anya Y1

    Bila tidak, gunakan juga Y2. Y1 dan Y2 mampu menjelaskan

    86.9% dari total keragaman data (sudah cukup besar)

  • www.themegallery.com

    4

    3

    2

    E

    i

    g

    e

    n

    v

    a

    l

    u

    e

    Scree Plot of X1, ..., X5

    Berapa KU

    3. Berdasarkan scree plotcuram

    landai

    Company Logo

    54321

    1

    0

    Component Number

    E

    Diambil 1 KU, Y1

  • www.themegallery.com

    54321Z.Z.Z.Z.Z.Y 39704710451046204520

    1++++=

    54321287601850325030000510 Z.Z.Z.Z.Z.Y +=

    54321317804110454034106900 Z.Z.Z.Z.Z.Y +=

    54321406903880606054804200 Z.Z.Z.Z.Z.Y +++=

    19206520343053003740 Z.-Z. Z.-Z.-Z. Y +=

    Company Logo

    54321519206520343053003740 Z.-Z. Z.-Z.-Z. Y +=

  • www.themegallery.com

    Skor Komponen

    Objek Y1 Y2 Y3 Y4 Y5

    1 0.06429 -0.600837 -0.171233 0.515826 0.548790

    2 -2.18031 -0.442301 0.400070 0.645460 0.231077

    3 -1.14557 0.01925 -0.676127 0.716298 0.208871

    :

    49 2.13422 -0.697546 0.851168 -0.380029 0.077126

    Company Logo

    49 2.13422 -0.697546 0.851168 -0.380029 0.077126

    064.0

    )329.0(3970)054.0(4710)177.0(4510)725.0(4620)542.0(4520

    3970471045104620452011

    =

    ++++=

    ++++=

    .....

    Z.Z.Z.Z.Z.Y5141312111

  • www.themegallery.com

    Plot antara Y1 dan Y2

    3

    2

    1

    Survivors

    Non-survivors

    Company Logo

    43210-1-2-3-4-5

    0

    -1

    -2

    Y1

    Y

    2

  • www.themegallery.com

    Stat>Multivariate>Principle ComponentsIsikan nama peubah atau kolom tempat

    menyimpan peubah

    Isikan banyak KU yang akan

    AKU dengan Minitab

    Company Logo

    Isikan banyak KU yang akan

    dihitung skornya(max sama

    dengan banyak peubah asal)

    Pilih (hanya salah satu)

    matriks yang digunakan

    sebagai dasar analisis

    (default : matriks korelasi)

    Option untuk membuat grafik Option untuk menyimpan

    hasil perhitungan

  • www.themegallery.com

    Menampilkan scree plot

    Menampilkan diagram

    pencar antara skor KU-1

    dan skor KU-2

    Company Logo

    Menampilkan plot

    loading untuk KU-1 dan

    KU-2

    Hasil analisis biplot

  • www.themegallery.com

    Isikan kolom-kolom untuk menyimpan

    koefisien (vektor karakteristik) (banyak

    kolom harus sama dengan banyaknya

    peubah asal)Isikan kolom-kolom

    untuk menyimpan skor

    komponen (banyak

    kolom harus sama

    dengan banyaknya KU)

    Company Logo

    Diperlukan jika output

    AKU akan dianalisis

    lebih lanjut

    Isikan kolom (hanya 1

    kolom) untuk menyimpan

    akar karakteristik