analisis regresi ridge

33
ANALISIS REGRESI RIDGE REGRESION 1. FARA ARIESTIA 3125080165 2. PUTRI WULANTRI 3125081760 3. PUTRIRINDI M 3125081766

Upload: fara-ariestia

Post on 06-Aug-2015

343 views

Category:

Documents


26 download

DESCRIPTION

analisis regresi

TRANSCRIPT

Page 1: analisis regresi ridge

ANALISIS REGRESI

RIDGE REGRESION

1. FARA ARIESTIA 31250801652. PUTRI WULANTRI 31250817603. PUTRIRINDI M 3125081766

Page 2: analisis regresi ridge

REGRESI RIDGE UNTUK MENGATASI MASALAH MULTIKOLINEARITAS

JUDUL SKRIPSI

Page 3: analisis regresi ridge

RUMUSAN MASALAH ???

Bagaimana mengatasi masalah multikolinearitas dengan Regresi

Ridge??

Page 4: analisis regresi ridge

PENDAHULUAN

Page 5: analisis regresi ridge

Model statistika merupakan suatu model

matematis yang meliputi variabel bebas dan

tidak bebas. Salah satu dari model statistika yang

sering digunakan dalam pemecahan suatu

permasalahan adalah Model Regresi Linier. Model

regresi linier adalah suatu model yang digunakan

untuk menganalisis hubungan antar variabel.

Page 6: analisis regresi ridge

Regresi Linier dibagi menjadi dua, yaitu Regresi Linier Sederhana (satu variabel

bebas) dan Regresi Linier Berganda (dua atau lebih variabel bebas).

Satu dari asumsi model regresi linier adalah bahwa tidak terdapat

multikolinearitas diantara variabel regressor yang termasuk dalam model. Multikolinearitas terjadi apabila terdapat

hubungan atau korelasi diantara beberapa atau seluruh variabel regressor.

Page 7: analisis regresi ridge

Salah satu cara untuk mendapatkan koefisien regresi pada persamaan regresi linier berganda adalah

Metode kuadrat terkecil : menghasilkan penaksir terbaik (tak bias dan bervarians minimum) jika saja tidak ada korelasi antar variabel regressor.

Metode ridge regression : nilai variabel regressornya ditransformasikan dahulu melalui prosedur centering and rescaling. Kemudian pada diagonal utama matriks korelasi variabel regressor ditambahkan Ridge Parameter dimana nilainya antara 0 dan 1

Page 8: analisis regresi ridge

PEMBAHASAN

Page 9: analisis regresi ridge

Regresi Linear Berganda Model regresi linear berganda yang

melibatkan p buah variable bebas adalah:

Asumsi-asumsi dalam analisis regresi linear meliputi:a. Galat saling bebas dengan dan variansi konstanta dimana b. Variabel bebas (X) diasumsikan bersifat tetapc. untuk setiap

PPXXXY ...22110

niE i ,...,2,1,0)( 2,0 Ni

0,cov ji ji

Page 10: analisis regresi ridge

Model regresi berganda dalam notasi matriks:

Dengan :

XY

1n x berukuran galat acak vektor

bebas tak variabeldari

amatan nilai-nilaimerupakan elemennya-elemen yang 1n x berukuran vektor Y

1)(pn x berukuran yangrancangan matriks X

regresi )(koefisienparameter

berupa elemennya-elemen yang 1 x 1)(pberukuran yang vektor

Page 11: analisis regresi ridge

Multikolinearitas pada Regresi Berganda

Multikolinearitas merupakan hubungan linear yang sempurna diantara beberapa atau semua variable bebas dari model regresi.

Masalah multikolinearitas akan membuat ragam dari penduga kofisien regresi menjadi besar, akibatnya selang kepercayaan dari parameter yang diduga menjadi lebar sehungga mengakibatkan pengujian hipotesis memeuhi signifikansi kofisien regresi cenderun menerima H0 yang berarti koefisin regresi tidak berbeda nyata dengan nol.

Page 12: analisis regresi ridge

Beberapa metode untuk mengidentifikasi adanya maslah multikolinearitas, diantaranya:

a. Menentukan matriks korelasi dari semua variabel bebas.

b. VIFc. Akar ciri dari X’X

Page 13: analisis regresi ridge

Regresi Ridge

Pada dasarnya untuk mendapatkan estimasi parameter regresi ridge adalah dengan memberikan kendala linear yang tepat pada metode kuadrat terkecil.

Estimasi Parameter dengan Regresi Ridge

Pada regresi linear berganda diberkan model umum : XY

Page 14: analisis regresi ridge

Nilai Harapan Estimator Ridge

Hal ini mengakibatkan bahwa adalah taksiran bias dari .

Variansi Estimaor Ridge

ZRE ˆ

p

i i

i

ii

p

i i

k

kk

trRVar

12

2

1

2

112

11

''' ˆ

kIXXXXkIXX

Page 15: analisis regresi ridge

Rata-rata Kuadrat Galat (Mean Square Error) dari Estimator Ridge

)()(ˆ21 kkMSE R

Rk var)(1

0k jika 0dengan sama ke ˆdar jarak kuadrat

atau dari bias )(

R

R2

k

Page 16: analisis regresi ridge

Prosedur Penentuan Nilai k

Ridge Trace Ridge trace adalah plot antara koefisien regresi Ridge dengan nilai-nilai k. Untuk nilai k yang berbeda dimana k [0,1] akan dapat ditentukan nilai . Ridge trace merupakan suatu metode untuk menunjukkan pengaruh dua dimensi dari non orthogonal

Langkah Penentuan Nilai k Dengan Metode Iteratif  Penentuan nilai k yang tepat dengan menggunakan iterasi yang diperoleh dengan meminimumkan rata-rata kuadrat galat residual.

Page 17: analisis regresi ridge

STUDI KASUS

ANALISIS REGRESI RIDGE

Page 18: analisis regresi ridge

Aplikasi Regresi Ridge

Contoh Kasus : Data yang digunakan adalah data sekunder mengenai tingkat kepuasan supervisor sebuah perusahaan yang dipengaruhi oleh beberapa factor. Akan dicari model regresi ganda untuk memprediksi keterkaitan hubungan antar variabelnya. Datanya sebagai berikut :

Page 19: analisis regresi ridge

Dengan menggunakan software NCSS 2000 dapat dicari koefisien penduga Ridge, nilai k, dan perbandingan nilai korelasi antara Metode Kuadart Terkecil dan Regresi Ridge,

Bagaimana outputnya ???

Page 20: analisis regresi ridge

menunjukkan bagaimana penyebaran dan pemusatan variabel bebas dan tak bebas tersebut.

Tabel statistik deskriptif

StandardVariable Count Mean Deviation Min MaxX1 35 7.174286 1.781332 3.8 10X2 35 10.00286 2.482229 5.3 14X3 35 10.65429 2.532535 5.7 14X4 35 7.125714 1.636234 4.6 9.9X5 35 15.06 3.280351 10.2 20Y 35 16.20572 1.122482 12.6 17.9

Page 21: analisis regresi ridge
Page 22: analisis regresi ridge

Tabel Matriks Korelasi

menunjukkan korelasi antar variabel satu dengan yang lain. Korelasi yang tinggi diihat dari nilai |r|semakin besar.

terdapat korelasi yang tinggi antara variabel X1 dan X2, X1 dan X3, X2 dan X3, serta X4 dan X5.

X1 X2 X3 X4 X5 YX1 1.000000 0.999306 0.995470 -0.080998 -0.048048 0.598604X2 0.999306 1.000000 0.995646 -0.073159 -0.040838 0.599047X3 0.995470 0.995646 1.000000 -0.085307 -0.052128 0.591077X4 -0.080998 -0.073159 -0.085307 1.000000 0.995582 -0.043960X5 -0.048048 -0.040838 -0.052128 0.995582 1.000000 -0.009761Y 0.598604 0.599047 0.591077 -0.043960 -0.009761 1.000000

Page 23: analisis regresi ridge

Tabel Multikolinearitas kuadrat Terkecil

Pada tabel diatas nilai VIF > 10, maka dapat dikategorikan kelima variabel bebas terkait multikolinearitas.

Indpnden Variance R-Squared Variabel Inflation Vs Other X's

ToleranceX1 793.9328 0.9987 0.0013X2 844.0058 0.9988 0.0012X3 120.1540 0.9917 0.0083X4 136.7096 0.9927 0.0073X5 134.9242 0.9926 0.0074

Page 24: analisis regresi ridge

Tabel Nilai Eigen dan Korelasi

Pada tabel diatas, nilai eigen merupakan variansi sebenarnya dari variabel bebas.

Nilai eigen yang mendekati 0 menunjukkan adanya masalah multikolinearitas. Angka kondisi antara 100 dan 1000 juga menunjukkan masalah serupaAngka kondisi yang melebih 1000 menunjukkan masalah mulikolinearitas yang serius.

Incremental Cumulative

ConditionNo. Eigen value Percent Percent Number1 3.017755 60.36 60.36 1.002 1.972057 39.44 99.80 1.533 0.005714 0.11 99.91 528.154 0.003847 0.08 99.99 784.385 0.000627 0.01 100.00 4810.15

Page 25: analisis regresi ridge

menunjukkan vector eigen yang bersesuaian dengan nilai eigen dari korelasi antara variabel-variabel bebasnya.

No. Eigenvalue X1 X2 X3 X4 X51 3.017755 -0.571046 -0.570547 -0.570649 0.115548 0.0969012 1.972057 0.085984 0.091327 0.082834 0.696901 0.7012383 0.005714 -0.412749 -0.391752 0.801633 -0.126410 0.1325664 0.003847 -0.141833 0.009820 0.155088 0.692316 -0.6902425 0.000627 -0.689953 0.715939 -0.028814 -0.075481 0.069776

Page 26: analisis regresi ridge

Tabel diatas menampilkan nilai koefisien regresi Ridge dalam k yang presisinya dibandingkan dengan nilai k yang diiterasikan

sehingga diperoleh nilai k = 0.361093

Page 27: analisis regresi ridge

dapat dilihat nilai VIF yang dihasilkan menjadi lebih kecil atau VIF < 10

sehingga dengan menggunakan nilai k yang sesuai dapat menghilangkan pengaruh multikolinearitas yang ada.

Page 28: analisis regresi ridge

menunjukkan perbandingan antara penyelesaian regresi dengan regresi Ridge dan OLS ( Metode Kuadrat Terkecil).

Regular Regular Stand'zed Stand'zed Ridge L.S.Indep. Ridge L.S. Ridge L.S. Standard StandardVar. Coeff's Coeff's Coeff's Coeff's Error ErrorIntercept 13.72804 13.49537X1 0.1156222 -0.4759508 0.1835 -0.7553 3.039132E-02 2.56655X2 8.345649E-02 0.9542688 0.1846 2.1102 2 .170739E-02 1.899038X3 7.304389E-02 -0.3669116 0.1648 -0.8278 2 .319735E-02 0.7022901X4 -1.370527E-02 -1.428679 -0.0200 -2.0826 0.0463255 1.159463X5 8.817396E-03 0.7084383 0.0258 2.0703 2 .317429E-02

0.5745493

R-Squared 0.3184 0.3940Sigma 1.0034 0.9461

Page 29: analisis regresi ridge

Hasil diatas adalah penyelesaian regresi Ridge secara terperinci,

sehingga didapat persamaan regresi :

510.817386.84370525.1

310.304388.7210.345647.811156222.072804.13ˆ

3

22

XX

XXXY

Stand'zedIndependent Regression Standard RegressionVariable Coefficient Error Coefficient VIFIntercept 13.72804X1 0.1156222 3.039132E-02 0.1835 0.0990X2 8.345649E-02 2.170739E-02 0.1846 0.0980X3 7.304389E-02 2.319735E-02 0.1648 0.1166X4 -1.370527E-02 0.0463255 -0.0200 0.1940X5 8.817396E-03 2.317429E-02 0.0258 0.1952

Page 30: analisis regresi ridge

Tabel ANOVA untuk menguji keberartian koefisien regresi Ridge yang telah diperoleh. Pengujian akan dilakukan dengan taraf kepercayaan 95%.

Tabel ANOVA untuk k = 0.361093Sum of Mean Prob

Source DF Squares Square F-Ratio LevelIntercept 1 9191.881 9191.881Model 5 13.64115 2.728231 2.7098 0.039709Error 29 29.1977 1.006817Total(Adjusted) 34 42.83886 1.259966

Mean of Dependent 16.20572Root Mean Square Error 1.003403R-Squared 0.3184Coefficient of Variation 6.191661E-02

Page 31: analisis regresi ridge

1. Perumusan Hipotesis H0 = koefisien regresi Ridge yang diperoleh tidak

berarti. Hi = koefisien regresi Ridge yang diperoleh

berarti.

3. Kriteria pengujian Tolak H0 jika F hitung > F tabel

Karena F hitung (2.7089) > F tabel (F0.05(5,29) = 2.55)

4.Kesimpulan yang didapat : dengan taraf kepercayaan 95% maka tolak H0 artinya koefisien reresi

Ridge yang diperoleh berarti, sehingga signifikan.

2. F hitung = 2.7089

Page 32: analisis regresi ridge

KESIMPULAN

Langkah-langkah dalam menyelesaikan masalah multikolinearitas dengan Regresi Ridge :

Menentukan estimasi dari regresi ridge dengan menambah kendala k untuk mengatasi besarnya keragaman.

Menentukan nilai k dengan dua prosedur yaitu Ridge Trace dan iterasi.

 Penduga regresi Ridge dipakai sebagai kriteria yang lebih baik dari penduga kuadrat terkecil (OLS).

Page 33: analisis regresi ridge

SELESAI

Terima Kasih