bab xvi regresi linier berganda - · pdf fileproses perhitungan regresi berganda lebih sulit...

Click here to load reader

Post on 03-Mar-2019

249 views

Category:

Documents

2 download

Embed Size (px)

TRANSCRIPT

BabXVI RegresiLinierBerganda

KAT A KUNCI

statistik F adalah statistik yang digunakan untuk menguji hipotesa yang nilai sebenarnya daritiap koefisien pada persamaan regresi adalah O.

regresi berganda adalah metode statistik untuk menganalisa hjubungan antara beberapavariabel indepdnen dan satu variabel dependen.

statistik t adalah statistik yang digunakan untuk menguji hipotesa yang nilai sebenarnya darisatu koefisien khusus adalah O.

BEBERAPA VARIABEL INDEPENDEN

Pada beberapa kenyataan akan ada lebih dari satu varibel independen yangmempengaruhi variabel dependen yang Anda inginkan. Pada kasus ini kita perlumenggunakan teknik yang disebut regresi berganda. Pada bab 15 telah kita bicarakankeadaan dimana pendapatan adalah varibel yang hanya mempengaruhi permintaanpizza. Keadaan demikian kelihatannya sangat tidak realistik. Pad a teori ekonomibanyak variabel yang berbeda yang dapat mempengaruhi permintaan. Pada tambahanpendapatan, satu dari variabel yang diharap penting adalah harga barang. Kita akanmenyelidiki pengaruh pendapatan dan harga pada kuantitas buku statistik yangdiminta.195

CONTOH PENGGUNAAN REGRESI BERGANDA

Misalnya kita mempunyai pengamatan tentang jumlah buku statistik yangterjual, harga buku tersebut, dan pendapatan perkapita di 15 kota dalam beberapaperiode. Kita anggap y mewakili variabel independen dim ana kuantitas bukustatistik terjual. Kita mempunyai dua variabel indepdnen: Ximewakili harga dan x2mewakili pendapatan.

242

Kita asumsikan hubungan y, Xidan X2ditunjukkan oleh persamaan ini:

dimana Yimewakili nilai variabel dependen ke-i, dan Xijmewakili nilai variabel independenkei-i. Kita memerlukan dua buah huruf yang ditulis agak ke bawah (il, i2, ...) karena kita harusmenggunakan satu huruf tersebut untuk nomer pengamatan dan huruf yang lain untuk angkavariabel. Untuk pengamatan di atas adalah XIIadalah 10, X21adalah 9, XI2adalah 20, X22adalah21 dan seterusnya.

Nilai sebenarnya dari BI, B2, B3 tidak diketahui, tetapi kita akan mencoba untukmengestimasinya. BI mewakili pengaruh XIterhadap y, jika x2 konstan. Demikian juga B2mewakili x2mewakili pengaruh x2terhadap y, jika XIkonstan. Jika XInaik sebesar 1dan yanglain konstan, maka y akan sebesar BI' Bila kita bentuk model seperti cara ini kita asumsukanpengaruh XIdan x2terhadap y adalah merupakan tambahan. Hal ini berartijumlah Xlterhadapy adalah merupakan tambahan. hal ini berarti jumlah XI yang mempengaruhi y tidaktergantung pada tingkat x2' dan sebaliknya. Kita mengharapkan B2 akan positif, karenabanyak buku yang akan dibeli bila pendapatan lebih tinggi, tetapi Bl akan negatif, karenasedikit buku yang akan diminta bila harga lebih tinggi. B3dikenal dengan istilah konstan padamodel. Hal ini analog dengan intercept y pada model regresi linier sederhana.

Sekali lagi, e adalah variabel random yang disebut istilah error yang mewakili pengaruhdari semua faktor yang memungkinkan disamping harga dan pendapatan yang dapatmempengaruhi permintaan buku statistik. Harapan nilai e adalah 0 adalah 0 dan variance e

243

--

Kota y(buku yang diminta) x1(barga) xz(Pendapatan)

1 166 10 20

2 180 9 21

3 73 10 .12

4 81 14 16

5 229 8 24

6 182 15 24

7 233 6 23

8 102 10 159 190 7 20

10 150 10 19

11 221 11 25

12 137 15 21

13 173 8 19

14 150 12 2015 92 10 14

adalah (J2,yang tidak diketahui. Kita akan mengasumsikan bahwa e berdistribusi normal.

DUAPERBEDAAN ANTARAREGRESISEDERHANADANREGRESIBERGANDA

Pada prinsipnya, kita akan melanjutkan secara tepat seperti yang telah kita lakukandengan regresi linier sederhana, dimana hanya ada satu variabel independen. Kita akanmenghitung nilai B1, B2, B3 yang meminimkan jumlah error kuadrat antara nilai yangdiprediksi oleh persamaan dan nilai sebenarnya. Ada dua pokok perbedaan antara regresilinier sederhana dan regresi berganda:

Kita tidak dapat menggambarkan hubungan. Secara nyata, jika hanya ada dua variabelindependen, kita berusaha menggambar pandangan tiga dimensi dengan Xldan x2padasumbu horisontal, y pada sumbu vertikal dan satu titik yang menghubungan tiappengamatan. Tujuan kita adalah mengetahui bidang yang meminimkan jumlah errorkuadratdarideviasivertikalantaratiappengamatandanbidangtersebut.Menggambarkanhal ini adalah sangat sulit. Jika ada lebih dari dmi variabel indepdnen, adalah tidakmungkinmenggambarkandiagram. (Ahlimatematikmasih memikirkantiappengamatandan tujuan regresi berganda pada kasus ini untuk menemukan sesuatu yang disebuthyperplane yagn sesuai dengan semua pengamatan). Proses perhitungan regresi berganda lebih sulit daripada regresi linier sederhana. Tetapihal itu tidak mengkhawatirkan karena dapat dilakukan oleh komputer. Pada buku initidak akan dijelaskan bagaimana bentuk perhitungan regresi berganda. Memahamiperhitungan itu membutuhkan pengetahuan tentang matriks perkalian dan matriksinversi. Pada keadaan nyata dimana Anda perlu membuat perhitungan regresi berganda,Anda akan bekerja dengan paket statistik komputer.Pada sisa bab kita akan membicarakan bagaimana menginterpretai hasil analisa regresi.

YANG HARUS DIINGA T

1. Pada regresi berganda diasumsikan bahwa nilai sebenarnya hubungan antara variabel

dependen y dan m - 1 variabel independen Xl' X2,..., Xm_lditunjukkan oleh persamaan ini

y =Blxl + B2x2+ ...+ Bm_1xm_1+ Bm+edimana e adalah variabel random normal dengan rata-rata 0 dan variance (J2yang tidakdiketahui. .

2. Jika Anda mempunyai daftar pengamatan tiap variabel, maka program regresi komputer

akan menghitung nilai estimasi tiap koefisien B1, B2, ..., Bm'

HASIL REGRESI BERGANDA

Sekali kita memasukkan angka ke komputer dan memerintahkan untuk melakukanperhitungan, kita akan ditunjukkan dengan hasil seperti ini:

y = -7,738xi+ 12,286x2 - 2,k765

Persamaan ini menunjukkan nilai estimasi untuk koefisien. Angka khusus ini adalahuntuk contoh penjualan buku statistik. Hal pertama kita dapat mempelajari dari hasil yangmembuktikan apa yang kita harapkan: koefisien untuk Xladalah negatif, artinya harga yang

244

-- -- - _. ~,;,;:_:;:'-""";;:.~:_;;:;:::;:;:::-.._:',:ooc.,.:.:_.:.:.,.:.:, ,,-_

lebih tinggi mengakibatkan penjualan lebih rendah. Koefisien X2 adalah positif, artinya

pendapatan yang lebih tinggi mengakibatkan penjualan yang lebih tinggi. Kita dapatmenggunakan koefisien nilai estimasi untuk memprediksi nilai y (mengenai pembicaraanempat hal penting pada bab 15).Contoh, jika kita telah mengetahui kota dimana pendapatanrata-ratanya 20 dan harga buku statistikadalah 6,makakita akanmemprediksi kuantitas bukustatistik yang diminta menjadi

(-7,738 x 6) + (12,286 x 20) - 2,765 = 196,5

Pada umumnya, kita gunakan bl mewakili estimasi komputer dari koefisien B\, b2untukmewakili estimasi komputer dari koefisien B2dan seterusnya. Kita akan memperhatikandimana ada m-l variabel independent. Pada kasus ini kita mempunyai koefisien m untukmengestimasi (menghitung istilah konstan). Hasil regresi komputer akan terlihat sepertiberikut:

dimana bmadalah estimasi komputer istilah konstan.

NILAI R2

Komputer juga akan memberi nilai R2 pada regresi. R2 disebut koefisien determinasiberganda. Pada kasus ini nilai R2 adalah 0,9957. Penafsiran nilai R2 hampir sarna denganpenafsiran nilai r pada regresi linier sederhana: R2 mengukur persen variasi variabeldependen yang dapat dijelaskan oleh regresi. Nilai R2 akan selalu diantara 0 dan 1.

Untuk menghitung R2 pertarna kita akan menghitung beberapajumlah kuadrat statistikyang berbeda (lihat bab 14, dimana kita menghitung jumlah kuadrat statistik sebagai bagiananalisa variance). Jumlah kuadrat total (TIS) adalah jumlah kuadrat nilai y sekitar y:

TSS = L (y;_ Y)2

Kembali kita menggunakan L untuk rata-rata Li =I' Ingat TSS adalah sarna sepertikuantitas yang disebut SErt pada regresi linier sederhana. Kita akan menggunakan yi untukmewakili nilai y regresi yang diprediksi untuk pengamatan ke-i.

.. A A A AY.=b \x.1 +b 2x.2 +...+b IX. I +bI 1 1 m- I,m- m

Untuk tiap pengamatan kita dapat menghitung perbedaan antara nilai y yang diprediksioleh garis regresi dan nilai rata-rata y. Selanjutnya kita dapat menjumlahkan semua kuadratdari deviasi dan menyebutnya dengan jumlah kuadrat regresi (RGRSS) :

RGRSS = L (Yi - Y)2

Kemudian kita dapat menghitung residual tiap pengamatan, dimana perbedaan antaranilai y sebenamya dan nilai yang sesuai dari garis regresi:

(residual.)=Y. - ..y .1 I IJumlah kuadrat semua residual disebut jumlah kuadrat error (ERRS) :

245

-- -

ERRS = L (Yi- yY

Kuantitas ini analogdengankuantitas yang disebut SEgarispada regresi linier sederhana.Dengan membentuk macarn perhitungan yang sarna yang terbentuk pada bab 14, dapat

kita lihat

TSS =RGRSS + ERSSDapat kita pikirkan TSS mewakili variasi total nilai y. RGRSS adalah jumlah variasi ini

yang dapat dijelaskan oleh regresi, dan ERSS adalah jumlah variasi tersisa yang tidak dapatdijelaskan oleh regresi. Jika regresi sesuai dengan data, maka nilai RGRSS akan lebih besardaripada nilai ERSS. Dapat kita hitung R2 dari formula berikut:

ERSSR2 =1-

TSS

=RGRSSTSS

Pada contoh buku statistik kita dapatkan:

246

Kota Y1 XI Xz Y1 (Yj -Y) (YI-yi)2 yi -Y (yi -y)2

1 166 10 20 165,579 0,421 0,177 8,73 76,2652 180 9 21 185,603 -5,6034 31,397 22,733 516,7893 73 10 12 67,291 5,709 32,597 -84,2567 7100,9274 81 14 16 85,484 -4,484 20,106 -76,267 5816,6555 229 8 24 230,199 -11,199 1,439 . 71,733 5145,6236 182 15 24 176,035 5,965 35,582 24,733 611,7217 233 6 23 233,389 -0,389 0,151 75,733 5735,4878 102 10 15 104,149 -2,149 4,618 -55,267 3054,4419 190 7 20 188,793 1,207 1,4