bab xvi regresi linier berganda - elearning.gunadarma.ac.id · proses perhitungan regresi berganda...

11
BabXVI Regresi LinierBerganda KAT A KUNCI statistik F adalah statistik yang digunakan untuk menguji hipotesa yang nilai sebenarnya dari tiap koefisien pada persamaan regresi adalah O. regresi berganda adalah metode statistik untuk menganalisa hjubungan antara beberapa variabel indepdnen dan satu variabel dependen. statistik t adalah statistik yang digunakan untuk menguji hipotesa yang nilai sebenarnya dari satu koefisien khusus adalah O. BEBERAPA VARIABEL INDEPENDEN Pada beberapa kenyataan akan ada lebih dari satu varibel independen yang mempengaruhi variabel dependen yang Anda inginkan. Pada kasus ini kita perlu menggunakan teknik yang disebut regresi berganda. Pad a bab 15 telah kita bicarakan keadaan dimana pendapatan adalah varibel yang hanya mempengaruhi permintaan pizza. Keadaan demikian kelihatannya sangat tidak realistik. Pad a teori ekonomi banyak variabel yang berbeda yang dapat mempengaruhi permintaan. Pada tambahan pendapatan, satu dari variabel yang diharap penting adalah harga barang. Kita akan menyelidiki pengaruh pendapatan dan harga pada kuantitas buku statistik yang diminta.195 CONTOH PENGGUNAAN REGRESI BERGANDA Misalnya kita mempunyai pengamatan tentang jumlah buku statistik yang terjual, harga buku tersebut, dan pendapatan perkapita di 15 kota dalam beberapa periode. Kita anggap y mewakili variabel independen dim ana kuantitas buku statistik terjual. Kita mempunyai dua variabel indepdnen: Ximewakili harga dan x2 mewakili pendapatan. 242

Upload: dolien

Post on 03-Mar-2019

277 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

BabXVI RegresiLinierBerganda

KAT A KUNCI

statistik F adalah statistik yang digunakan untuk menguji hipotesa yang nilai sebenarnya daritiap koefisien pada persamaan regresi adalah O.

regresi berganda adalah metode statistik untuk menganalisa hjubungan antara beberapavariabel indepdnen dan satu variabel dependen.

statistik t adalah statistik yang digunakan untuk menguji hipotesa yang nilai sebenarnya darisatu koefisien khusus adalah O.

BEBERAPA VARIABEL INDEPENDEN

Pada beberapa kenyataan akan ada lebih dari satu varibel independen yangmempengaruhi variabel dependen yang Anda inginkan. Pada kasus ini kita perlumenggunakan teknik yang disebut regresi berganda. Pada bab 15 telah kita bicarakankeadaan dimana pendapatan adalah varibel yang hanya mempengaruhi permintaanpizza. Keadaan demikian kelihatannya sangat tidak realistik. Pad a teori ekonomibanyak variabel yang berbeda yang dapat mempengaruhi permintaan. Pada tambahanpendapatan, satu dari variabel yang diharap penting adalah harga barang. Kita akanmenyelidiki pengaruh pendapatan dan harga pada kuantitas buku statistik yangdiminta.195

CONTOH PENGGUNAAN REGRESI BERGANDA

Misalnya kita mempunyai pengamatan tentang jumlah buku statistik yangterjual, harga buku tersebut, dan pendapatan perkapita di 15 kota dalam beberapaperiode. Kita anggap y mewakili variabel independen dim ana kuantitas bukustatistik terjual. Kita mempunyai dua variabel indepdnen: Ximewakili harga dan x2mewakili pendapatan.

242

Page 2: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

Kita asumsikan hubungan y, Xidan X2ditunjukkan oleh persamaan ini:

dimana Yimewakili nilai variabel dependen ke-i, dan Xijmewakili nilai variabel independenkei-i. Kita memerlukan dua buah huruf yang ditulis agak ke bawah (il, i2, ...) karena kita harusmenggunakan satu huruf tersebut untuk nomer pengamatan dan huruf yang lain untuk angkavariabel. Untuk pengamatan di atas adalah XIIadalah 10, X21adalah 9, XI2adalah 20, X22adalah21 dan seterusnya.

Nilai sebenarnya dari BI, B2, B3 tidak diketahui, tetapi kita akan mencoba untukmengestimasinya. BI mewakili pengaruh XIterhadap y, jika x2 konstan. Demikian juga B2mewakili x2mewakili pengaruh x2terhadap y, jika XIkonstan. Jika XInaik sebesar 1dan yanglain konstan, maka y akan sebesar BI' Bila kita bentuk model seperti cara ini kita asumsukanpengaruh XIdan x2terhadap y adalah merupakan tambahan. Hal ini berartijumlah Xlterhadapy adalah merupakan tambahan. hal ini berarti jumlah XI yang mempengaruhi y tidaktergantung pada tingkat x2' dan sebaliknya. Kita mengharapkan B2 akan positif, karenabanyak buku yang akan dibeli bila pendapatan lebih tinggi, tetapi Bl akan negatif, karenasedikit buku yang akan diminta bila harga lebih tinggi. B3dikenal dengan istilah konstan padamodel. Hal ini analog dengan intercept y pada model regresi linier sederhana.

Sekali lagi, e adalah variabel random yang disebut istilah error yang mewakili pengaruhdari semua faktor yang memungkinkan disamping harga dan pendapatan yang dapatmempengaruhi permintaan buku statistik. Harapan nilai e adalah 0 adalah 0 dan variance e

243

--

Kota y(buku yang diminta) x1(barga) xz(Pendapatan)

1 166 10 20

2 180 9 21

3 73 10 .12

4 81 14 16

5 229 8 24

6 182 15 24

7 233 6 23

8 102 10 159 190 7 20

10 150 10 19

11 221 11 25

12 137 15 21

13 173 8 19

14 150 12 2015 92 10 14

Page 3: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

adalah (J2,yang tidak diketahui. Kita akan mengasumsikan bahwa e berdistribusi normal.

DUAPERBEDAAN ANTARAREGRESISEDERHANADANREGRESIBERGANDA

Pada prinsipnya, kita akan melanjutkan secara tepat seperti yang telah kita lakukandengan regresi linier sederhana, dimana hanya ada satu variabel independen. Kita akanmenghitung nilai B1, B2, B3 yang meminimkan jumlah error kuadrat antara nilai yangdiprediksi oleh persamaan dan nilai sebenarnya. Ada dua pokok perbedaan antara regresilinier sederhana dan regresi berganda:

· Kita tidak dapat menggambarkan hubungan. Secara nyata, jika hanya ada dua variabelindependen, kita berusaha menggambar pandangan tiga dimensi dengan Xldan x2padasumbu horisontal, y pada sumbu vertikal dan satu titik yang menghubungan tiappengamatan. Tujuan kita adalah mengetahui bidang yang meminimkan jumlah errorkuadratdarideviasivertikalantaratiappengamatandanbidangtersebut.Menggambarkanhal ini adalah sangat sulit. Jika ada lebih dari dmi variabel indepdnen, adalah tidakmungkinmenggambarkandiagram. (Ahlimatematikmasih memikirkantiappengamatandan tujuan regresi berganda pada kasus ini untuk menemukan sesuatu yang disebuthyperplane yagn sesuai dengan semua pengamatan).· Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapihal itu tidak mengkhawatirkan karena dapat dilakukan oleh komputer. Pada buku initidak akan dijelaskan bagaimana bentuk perhitungan regresi berganda. Memahamiperhitungan itu membutuhkan pengetahuan tentang matriks perkalian dan matriksinversi. Pada keadaan nyata dimana Anda perlu membuat perhitungan regresi berganda,Anda akan bekerja dengan paket statistik komputer.Pada sisa bab kita akan membicarakan bagaimana menginterpretai hasil analisa regresi.

YANG HARUS DIINGA T

1. Pada regresi berganda diasumsikan bahwa nilai sebenarnya hubungan antara variabel

dependen y dan m - 1 variabel independen Xl' X2,..., Xm_lditunjukkan oleh persamaan ini

y =Blxl + B2x2+ ...+ Bm_1xm_1+ Bm+e

dimana e adalah variabel random normal dengan rata-rata 0 dan variance (J2yang tidakdiketahui. .

2. Jika Anda mempunyai daftar pengamatan tiap variabel, maka program regresi komputer

akan menghitung nilai estimasi tiap koefisien B1, B2, ..., Bm'

HASIL REGRESI BERGANDA

Sekali kita memasukkan angka ke komputer dan memerintahkan untuk melakukanperhitungan, kita akan ditunjukkan dengan hasil seperti ini:

y = -7,738xi+ 12,286x2 - 2,k765

Persamaan ini menunjukkan nilai estimasi untuk koefisien. Angka khusus ini adalahuntuk contoh penjualan buku statistik. Hal pertama kita dapat mempelajari dari hasil yangmembuktikan apa yang kita harapkan: koefisien untuk Xladalah negatif, artinya harga yang

244

Page 4: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

-- -- - _. ~,;,;:_:;:'-""";;:.~:_;;:;:::;:;:::-.._:',:ooc.,.:.:_.:.:.,.:.:, ,,-_

lebih tinggi mengakibatkan penjualan lebih rendah. Koefisien X2 adalah positif, artinya

pendapatan yang lebih tinggi mengakibatkan penjualan yang lebih tinggi. Kita dapatmenggunakan koefisien nilai estimasi untuk memprediksi nilai y (mengenai pembicaraanempat hal penting pada bab 15).Contoh, jika kita telah mengetahui kota dimana pendapatanrata-ratanya 20 dan harga buku statistikadalah 6,makakita akanmemprediksi kuantitas bukustatistik yang diminta menjadi

(-7,738 x 6) + (12,286 x 20) - 2,765 = 196,5

Pada umumnya, kita gunakan bl mewakili estimasi komputer dari koefisien B\, b2untukmewakili estimasi komputer dari koefisien B2dan seterusnya. Kita akan memperhatikandimana ada m-l variabel independent. Pada kasus ini kita mempunyai koefisien m untukmengestimasi (menghitung istilah konstan). Hasil regresi komputer akan terlihat sepertiberikut:

dimana bmadalah estimasi komputer istilah konstan.

NILAI R2

Komputer juga akan memberi nilai R2 pada regresi. R2 disebut koefisien determinasiberganda. Pada kasus ini nilai R2 adalah 0,9957. Penafsiran nilai R2 hampir sarna denganpenafsiran nilai r pada regresi linier sederhana: R2 mengukur persen variasi variabeldependen yang dapat dijelaskan oleh regresi. Nilai R2 akan selalu diantara 0 dan 1.

Untuk menghitung R2 pertarna kita akan menghitung beberapajumlah kuadrat statistikyang berbeda (lihat bab 14, dimana kita menghitung jumlah kuadrat statistik sebagai bagiananalisa variance). Jumlah kuadrat total (TIS) adalah jumlah kuadrat nilai y sekitar y:

TSS = L (y;_ Y)2

Kembali kita menggunakan L untuk rata-rata Li =I' Ingat TSS adalah sarna sepertikuantitas yang disebut SErt pada regresi linier sederhana. Kita akan menggunakan yi untukmewakili nilai y regresi yang diprediksi untuk pengamatan ke-i.

.. A A A A

Y.=b\x.

1+b 2x.2 +...+b I

X. I +bI 1 1 m- I,m- m

Untuk tiap pengamatan kita dapat menghitung perbedaan antara nilai y yang diprediksioleh garis regresi dan nilai rata-rata y. Selanjutnya kita dapat menjumlahkan semua kuadratdari deviasi dan menyebutnya dengan jumlah kuadrat regresi (RGRSS) :

RGRSS = L (Yi - Y)2

Kemudian kita dapat menghitung residual tiap pengamatan, dimana perbedaan antaranilai y sebenamya dan nilai yang sesuai dari garis regresi:

(residual.)=Y. - ..y .1 I I

Jumlah kuadrat semua residual disebut jumlah kuadrat error (ERRS) :

245

Page 5: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

-- -

ERRS = L (Yi- yY

Kuantitas ini analogdengankuantitas yang disebut SEgarispada regresi linier sederhana.Dengan membentuk macarn perhitungan yang sarna yang terbentuk pada bab 14, dapat

kita lihat

TSS =RGRSS + ERSS

Dapat kita pikirkan TSS mewakili variasi total nilai y. RGRSS adalah jumlah variasi iniyang dapat dijelaskan oleh regresi, dan ERSS adalah jumlah variasi tersisa yang tidak dapatdijelaskan oleh regresi. Jika regresi sesuai dengan data, maka nilai RGRSS akan lebih besardaripada nilai ERSS. Dapat kita hitung R2 dari formula berikut:

ERSSR2 =1-

TSS

=RGRSS

TSS

Pada contoh buku statistik kita dapatkan:

246

Kota Y1 XI Xz Y1 (Yj -Y) (YI-yi)2 yi -Y (yi -y)2

1 166 10 20 165,579 0,421 0,177 8,73 76,2652 180 9 21 185,603 -5,6034 31,397 22,733 516,7893 73 10 12 67,291 5,709 32,597 -84,2567 7100,9274 81 14 16 85,484 -4,484 20,106 -76,267 5816,6555 229 8 24 230,199 -11,199 1,439 . 71,733 5145,6236 182 15 24 176,035 5,965 35,582 24,733 611,7217 233 6 23 233,389 -0,389 0,151 75,733 5735,4878 102 10 15 104,149 -2,149 4,618 -55,267 3054,4419 190 7 20 188,793 1,207 1,457 32,733 1071,449

10 150 10 19 153,293 -3,293 10,846 -7,267 52,80911 221 11 25 219,272 1,728 2,985 63,733 4061,89512 137 15 21 139,177 . -2,177 4,738 -20,267 410,75113 173 8 19 168,769 4,231 17,902 15,733 247,52714 150 12 20 150,104 -0,104 0,011 -7,267 52,80915 92 10 14 91,863 0,137 0,019 -65,267 4259,781

total 164,025 38214,922

Page 6: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

Dari tabel tersebut dapat kita lihat ERSS = 164,025 dan TSS = 38214,922.Dengandemikian dapat kita hitung

RGRSS = TSS - ERSS = 38050,909

(Catat: Ada perbedaan yang sedikit pada beberapa perhitungan regresi ini karena beberapahasil tengah yang telah dipenuhi). Kemudian dapat kita hitung:

38050,909=0,996

38214,933

Estimasi persamaan regresi sesuai dengan titik-titik ini. Ada yang perlu diperhatikan saatmenafsirkannilai R2regresi berganda. Selalumungkinmenaikkan nilaiR2denganmenambahvariabel independen pada regresi, maupun mempunyai sesuatu yang dilakukan denganvariabel dependen atau tidak. Untuk hasil regresi agar dapat dipercaya angka pengamatanharns lebih besar secara signiflkan daripada angka koefisien yang Anda estimasi. Dengandemikian, disarankan untuk menghitung R2yang disesuaikan (adjusted R2):

(adjusted R2) = 1 _ (1 - R2) (n - 1)n-m

Adjusted R2 tidak akan selalu meningkat jika Anda menambah variabellain karenamenaikkan nilai m.

ST A TISTIK F

Misalnya ada beberapa orang yang tidak percaya adanya hubungan antara variabeldependen dan variabel independen pada regresi Anda. Orang tersebut membuat hipotesa nolsebagai berikut:

Ho: BI = B2 = ...Bm_1= 0

Orang tersebut berpikir bahwa koefisien nilai sebenarnya untuk semua m-1 variabelindependen adalah no1.Untuk menguji hipotesa tersebut Anda dapat menghitung statistikberikut:

RGRSS

m-1F=

ERSSn-m

247

Page 7: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

---

Statistik ini disebut statistik F regresi. Jika hipotesa nol adalah benar, maka akanmempunyai distribusi F dengan df m - 1pada pembilang, dan df n - m pada penyebut. (Ingatbahwa n adalah banyakpengamatan dan m - 1banyakvariabel independen). Jika hipotesa noladalah salah, makakita mengharapkan RGRSS lebihbesar daripada ERSS, sehinggastatistikF akan lebih besar daripada jika hipotesa nol benar. Pada kasus kita, nilai statistik F adalah1392 yang lebih besar dari 3,9 (95 persen nilai kritis untuk distribusi F dengan df 2 dan 12).Dengan demikian kita dapat menolak hipotesa nol dengan pasti.

Hasil ini dapat diringkas pada tabel analisa variance (NOVA) (lihat bab 14):

Kita sebut ERSS/(n - m) error kuadrat rata-rata (MSE) dan akan kita gunakan sebagaiestimator dari variance (32yang tidak diketahui. Pada kasus ini MSE = 13,669.

KOEFISIEN UJIINDIVIDUAL

Kini kita akan mulai dengan analisa statistik koefisien individual. langkahnya hampirsarna dengan langkah pada regresi sederhana. Pada bab 15 diketahui bahwa m (estimatorkuadrat terkecil slope pada garis regresi) berdistribusi normal yang rata-ratanya sama dengannilai slope sebenarnya dan variancenya sarna dengan (32dibagi dengan lambang yang sulityang tergantung pada x. Kita dapat menemukan hasil analog pada kasus regresi berganda.

Misalnya BI mewakili nilai sebenarnya koefisien ke - i yang tidak diketahui dan b1mewakili estimator kuadrat terkecil dari koefisien tersebut. Maka bl berdistribusi normalyang rata-ratanya sarna nilai BI sebenarnya dan variancenya sarna dengan S2dibagi denganlambang yang sulit yang tergantung pada x. Sekali lagi akankita gunakan MSE untukmengestimasi S2,tetapi pada buku ini tidak akan dijelaskan lambang yang sulit yangtergantung pada x. Untungnya, program regresi komputer akan selalu memasukan estimasioutput standar deviasi tiap koefisien. Kita sebut dengan standar error s(b):

s(1,.)= IYar<b.)I V I

Nilai standar error sering ditunjukkan di bawah koefisien:

y = - 7,738xl + 12,286x2- 2,765(0,364) (0,257) (6,39)

248

Variasi Jumlah Kuadrat Degree of Kuadrat Rasio FFreedom Rata-rata

Regresi 38.050,909 2 19.025,455 1.391,98Error 164,025 12 13,669

total 38.214,922 14

Page 8: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

Nilai standar error yang lebih kecil menunjukkan estimasi koefisien lebih dapatdipercaya.

Seperti yang telah Anda harapkan, kuantitas (bi-B)fs(b) berdistribusi t dengan df n - m.Dengan demikian, kita dapat menghitung confidence interval untuk Bj:

bi :t as(b)

dimana Pr (-a < t < a) =CLCL adalah confidence level

t adalah variabel random yang mempunyai distribusi t dengan df n - m

Kitajuga dapat menguji tes hipotesa bahwa Bi =O. Jika Bi = 0, maka Xitidak mempunyaipengaruh pada y. Jika hipotesa benar, maka kuantitas b/s(b) akan berdistribusi t dengan dfn -m. Kuantitas inidisebutstatistik t untukkoefisien ke-i. Nilai statistik t sering dihitungolehprogram regresi komputer. (Jika tidak, Anda dapat menghitungnya dengan mudah seklaiAnda mengetahui bi dan s(b). Untuk contoh buku statistik, kita mempunyai:

Nilai kritis 95 persen untuk distribusi t dengan df 15 - 3 = 12 adalah 2,179. Statistikt untuk harga dan pendapatan berada di luar nilai tersebut, sehingga kita dapat menolakhipotesa yang mengatakan koefisien harga atau pendapatan adalah nol. Bagaimanapunjuga, kita tidak daapt menolak hipotesa yang nilai sebenarnya dari konstan sama dengannol.

YANG HARUS DIINGA T

Komputer akan menghitung, pada tambahan untuk mengestimasi B!, B2, ..., Bm'berikutfit:

· Nilai R2 pada regresi (nilai yang mendekati1 berartinilai estimasioleh persamaanregresimendekatinilaiy sebenarnya).· Statistik F pada regresi (digunakan untuk menguji hipotesa yang koefisien semuavariabel independen adalah nol).· Standar error pada tiap koefisien.· Statistikt paa tiap koefisien(digunakanuntukmengujihipotesayangnilai koefisiensebenarnya adalah 0).

249

-- -

Variabel Koefisien Standar error Statistik t

Harga -7,738 0,364 -21,3Pendapatan 12,286 0,257 47,8Konstan -2,765 6,39 -0,43

Page 9: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

-- -

-.

ANAL/SA LANJUT MODEL REGRESI

Akan disebutkan beberapa topik yang berlaku pada analisa regresi. Beberapa topiktersebut sama dengan regresi berganda dan regresi sederhana, tetapi ada beberapa hal khususyang timbul hanya dengan regresi berganda.

· Residual. Sekali Anda telah menghitung residual regresi, Anda dapat membuat analisavisual yang baru saja kita lakukan pada bab lalu. Anda boleh membuat beberapa diagrampenyebaran yang membandingkan residual dengan variabel independen. Pada tiap kasusseharusnya tidak ada contoh nyata. Jika Anda mempunyai data time series, dapat jugamembantu membuat daerah residual dengan waktu. Ini dapat juga membantu menentukandaerah resdual yang bertentangan variabel independen yang lain yang tidak termasukdalam model. Jika residual kelihatan berhubungan dengan variabel tersebut, maka Andaseharusnya memasukkannya dalam model.· Transformasi. Model non linier dapat ditransformasikan menjadi linier dengan caramenggunakan logaritma atau beberapa macam transformasi lainnya. Contoh, jika

maka Anda dapat meletakkan logarimta di kedua sisi:

dan Anda dapat mengestimasi nilai bo' bl' b2dan b3dengan regresi linier biasa.· Korelasi bersambung. Pada model regresi kita telah mengasumsikan bahwa semuaerroradalah independen. Misalnya kita mempunyai pengamatan time series dimana nilaipositif untuk satu periode lebih mungkin diikuti dengan nilai positif untuk periodeselanjutnya. keadaan ini disebut dengan korelasi bersambung atau autokorelasi.Estimator kuadrat terkecil kurang dapat dipercaya pada keadaan ini. Program regresikomputer secara normalakan menghitung nilai statistik yang disebut statistik Durbin-Watson. Nilai kecil dari statistik ini menunjukkan keberadaan satu tipe khusus korelasibersambung. (Seberapakecil?Jikakomputer tidak memberitahukan kepada Anda, Andaperlu melihat pada tabel Durbin-Watson). Pada kasus korelasi bersambung hasil regresidapat lebih dipercaya dengan mencoba menemukan varibel independen yang lain untukmenambah pada model atau membentuk transformasi yang meliputi perbedaan antaranilai-nilai variabel berturut-turut.

· Multikolinearitas. Bila dua atau lebih variabel independen cukup dekat korelasinya,maka timbulproblemmultikolinearitas.Jika semuavaribel independentidakberkorelasi,maka model regresi Anda masih dapat secara akurat mengestimasi koefisien variabelpada model bahkanjika beberapa variabel independen telahhilang. Bagaimanapunjuga,kofisien kurang dapat dipercaya dalam mengestimasijika beberapa variabel independenberkorelasisangat tinggi.Padakasusekstrimdimanadua variabelindependenberkorelasisecara sempuma, adalah tidak mungkin untuk menghitung estimator kuadrat terkecil.Juga statistiktuntukkoefisien individualtidakdapatdipercayabila adamultikolinearitas.

250

Page 10: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

-------.--.---. - -. -. - - -- ...-

-

Biladua variabelindependencukuptinggikorelasinya,adalahtidakmungkinmemisahkanpengaruh independennya.Contoh,misalnyaAnda mencobamenyelidikipengaruhpendapatandan pendidikan terhadappermintaan produk Anda. Andatelah mengumpulkaninformasi darisarnpelbesar alat-alat rumah tangga. Anda mungkin ingin menemukan orang-orang denganpendapatan lebih cenderung mempunyai pendidikan tinggi, sehingga dua variabel cukuptinggi korelasinya. peraturan menyatakan bahwa problem multikolinearitas timbul jikakoefisien korelasi antara dua variabellebih besar daripada 0,7. Jika Anda mengaarnti orang-orang yang pendapatannya tinggi cenderung membeli produkAnda lebih banyak, Anda tidaktahu apakah mereka begitu karena mereka mempunyai pendapatan yang lebih tinggi ataupendidikan yang lebih tinggi.

Berikut ini adalah contoh yang harnpir sarna. Misalnya Anda mempunyai pengamatanreaksi kimia khusus yang terjadi lebih cepat ditempat hangat atau terang daripada di tempatdingin atau gelap. Bagaimanapun juga Anda tidak dapat mengatakan apakah hangat danterang mempercepat reaksi ataut idak, karena dua variabel independen (suhu dan jumlahterang) berkorelasi pada pengarnatan Anda, cara yang paling baik untuk memecahkanproblem akan mencapai pengamatan reaksi -ditempatpanas gelap dan dingin terang.

Analog dengan hal ini, pemecahan yang paling baik pada pendapatan/pendidikan akanmencapai pengarnatan orang-orang dengan pendapatan tinggi/pendidikan rendah danpendidikan tinggi/pendapatan rendah. Bagaimanapun juga mungkin sulit menemukan or-ang-orang tersebut.Andamungkin tidakmempunyaipilihanterbaikdaripada menghilangkanpendidikan atau variabel pendapatan dari regresi dan mengingat bahwa koefisien variabellainnya menunjukkan kombinasi pengaruh dua variabel.

· Variabeldummy (variabelboneka).Banyakfaktoryang mempengaruhivaribeldependenbukan faktor kuantitatif yang dapat ditunjukkan oleh angka. Misalnya, anggap Andamenyelidiki perilaku konsumsi antara tahun 1930 sampai 1950. Anda mengharapkanperilaku konsumen akan berbeda secara signifikan selama Perang Dunia II dibandingsebelum dan sesudah perang. Untuk mempertimbangkan pengaruhnya, Anda dapatmembuat variabel buatan yang akan bernilai 1 selama tiap tahun perang dan bernilai 0selarna tiap tahun lainnya. Macarn variabel ini disebut varia bel dummy atau variabelindikator. Koefisien variael dummy Perang Dunia II menunjukkan berapa banyakpengaruhperangmempunyainilaikonstanpada regresi.Variabeldummydapatditunakandalam beberapa keadaan berbeda dengan regresi.

· Persamaan simulateous. Analisa regresi digunakan untuk membuat model ekonomiyang mencoba memprediksi kegiatan ekonomi. Cabang ekonomi yang melibatkananalisa tersebut disebut ekonometri. Model ekonometri memerlukan analisa regresiditerapkan pada banyak persarnaan yang berbeda. Cara menerapkan regresi padakeadaan ini disebut analisa persamaan simultaneous.

YANG HARUS DIINGAT

1. Menganalisa regresi residual membantu penentuan apakah persarnaanregresi bergandakhusus adalah tepat.

251

Page 11: Bab XVI Regresi Linier Berganda - elearning.gunadarma.ac.id · Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapi Tetapi hal itu tidak mengkhawatirkan

----

2. Logaritma sering digunakan untuk mengubah model nonlinier menjadi linier.3. Problem korelasi bersambung timbul bila error tidak independen, untuk semua

pengamatan. .

4. Problem multikolinearitas timbul bila dua atau lebih variabel independen salingberkorelasi.

5. Penggunaan variabel dummy yang selalu mempunyai nilai 0 atau 1 memungkinkanmemasukkan faktor nonkuantitatif pada persamaan regresi.

6. Pembuatan model ekonometri memerlukan aplikasi metode regresi untuk beberapapersamaan yang hams benar secara simulton.

252