bab vi - web viewsebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum...

42
BAB VI ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA 6.0. Tujuan Pembelajaran: Mahasiswa Mampu: 1. Menghitung dan menginterpretasikan korelasi sederhana antara dua variabel 2. Mengetahui hubungan dua variabel yang tidak linier 3. Menentukan korelasi dan mengujinya 4. Menghitung dan menginterpretasikan persamaan regresi linier sederhana 5. Mengetahui asumsi yang digunakan dalam analisa regresi 6. Menentukan Model Regresi yang Layak 7. Menghitung dan Menginterpretasikan Interval Keyakinan untuk Koefisien Regresi 8. Mengetahui bahwa analisis regresi dapat digunakan sebagai alat prediksi 9. Mengetahui bagaimana menerapkan kasus nyata yang berhubungan dengan analisis regresi secara benar

Upload: dangdat

Post on 30-Jan-2018

222 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

BAB VI

ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

6.0. Tujuan Pembelajaran:

Mahasiswa Mampu:

1. Menghitung dan menginterpretasikan korelasi sederhana antara dua variabel

2. Mengetahui hubungan dua variabel yang tidak linier

3. Menentukan korelasi dan mengujinya

4. Menghitung dan menginterpretasikan persamaan regresi linier sederhana

5. Mengetahui asumsi yang digunakan dalam analisa regresi

6. Menentukan Model Regresi yang Layak

7. Menghitung dan Menginterpretasikan Interval Keyakinan untuk Koefisien

Regresi

8. Mengetahui bahwa analisis regresi dapat digunakan sebagai alat prediksi

9. Mengetahui bagaimana menerapkan kasus nyata yang berhubungan dengan

analisis regresi secara benar

Page 2: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

6.1. Scatter Plot

Sebelum menentukan bentuk hubungan dengan analisis regreis linier atau

sebelum mengukur keeratan hubungan antara dua variabel, harus dilihat apakah

variabel-variabel tersebut mempunyai hubungan linier atau tidak dengan

menggunakan scatter plot seperti yang dibawah ini:

Grafik 1.Scatter Plot (Diagram Pencar)

Dalam scatter plot diatas ada empat kriteria,yaitu:

Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan

positif, maka kedua variabel dinyatakan memiliki hubungan linier positif

Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan

negatif, maka kedua variabel dinyatakan memiliki hubungan linier negatif

Bila titik-titik menggerombol tidak mengikuti garis lurus, maka kedua variabel

dinyatakan tidak memiliki hubungan yang linier

Page 3: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Bila titik-titik memencar atau membentuk suatu garis lurus mengikuti sebuah

pola yang acak atau tidak ada pola, maka kedua variabel dinyatakan tidak

memilki hubungan.

  6.2. Analisis Korelasi

Analisis korelasi digunakan untuk mengukur kekuatan hubungan linier antara dua

variabel. Koefisien korelasi populasi ρ (rho) adalah ukuran kekuatan hubungan

linier antara dua variabel dalam populasi sedangkan koefisien korelasi sampel r

adalah estimasi dari ρ dan digunakan untuk mengukur kekuatan hubungan linier

dalam sampel observasi. Untuk selanjutnya r disebut Koefisien Korelasi Pearson

Product Momernt.

6.2.1. Korelasi Pearson (Product Moment)

Korelasi pearson sering juga disebut sebagai korelasi produk-momen atau

korelasi saja. Korelasi pearson termasuk ke dalam statistika parametrik. Besarnya

koefisien menggambarkan seberapa erat hubungan linear antara dua variabel,

bukan hubungan sebab akibat. Variabel yang terlibat dua-duanya bertipe numerik

(interval atau rasio), dan menyebar normal jika ingin pengujian terhadapnya sah.

Berikut ini pedoman menentukan kuat tidaknya korelasi antara dua variabel

menurut Walpole :

Tabel 1.

Interval Koefisien Tingkat Hubungan

0.00 – 0.199

0.20 – 0.399

0.40 – 0.599

0.60 – 0.799

0.80 – 1.000

Sangat rendah

Rendah

Cukup

Kuat

Sangat Kuat

Page 4: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Menurut Sarwono (2006) Batas-batas nilai koefisien korelasi diinterpretasikan

sebagai berikut:

Tabel 2.

Interval Hubungan Tingkat Hubungan

0 Tidak ada korelasi antara dua

variabel

>0 – 0,25 Korelasi sangat lemah

>0,25 – 0,5 Korelasi cukup

>0,5 – 0,75 Korelasi  kuat

>0,75 – 0,99 Korelasi  sangat kuat

1 Korelasi sempurna

Hasil dari analisis korelasi menunjukkan kekuatan atau kelemahan dari suatu

hubungan.Nilai koefisien korelasi ini akan berada pada kisaran -1 sampai dengan

+1. Koefisien korelasi minus menunjukkan hubungan yang terbalik, dimana

pengaruh yang terjadi adalah pengaruh negatif. Dalam pengaruh yang negatif ini

kenaikan suatu variabel akan menyebabkan penurunan suatu variabel yang lain,

sedangkan penurunan suatu variabel akan menyebabkan kenaikan variabel yang

lain.

Koefisien korelasi positif menunjukkan hubungan yang searah dari dua variabel,

dimana kenaikan suatu variabel akan menyebabkan kenaikan variabel yang lain

dan sebaliknya penurunan suatu variabel akan menyebabkan penurunan variabel

yang lain.

Page 5: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Koefisien korelasi sebesar nol menunjukkan tidak adanya hubungan antara dua

variabel, dengan kata lain kenaikan atau penurunan suatu variabel tidak

mempengaruhi variabel yang lain, jadi berapapun perubahan harga pada suatu

variabel tidak akan mempengaruhi variabel yang lain karena nilainya yang tetap.

Terdapat bermacam-macam analisis korelasi yang dapat digunakan untuk

mengukur hubungan asosiatif dari suatu variabel. Korelasi yang akan digunakan

tergantung pada jenis data yang akan dianalisis. Korelasi berdasarkan tingkatan

data dapat dilihat pada tabel berikut ini:

Tabel.3 Korelasi Berdasarkan Tingkatan Data

Tipe / Tingkat DataTeknik Korelasi yang

Digunakan

Nominal Koefisien Kontingensi

OrdinalSpearman Rank

Kendal Tau

Interval dan rasio

Pearson / Produk Momen

Korelasi Ganda

Korelasi Parsial.

Koefisien korelasi pearson diformulasikan sebagai berikut:

Atau:

r= ∑ (x− x )( y− y )

√ [∑ (x− x )2 ][∑ ( y− y )2 ]

r=n∑ xy−∑ x∑ y

√ [n(∑ x2)−(∑ x )2 ][ n(∑ y2)−(∑ y )2 ]

Page 6: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Atau: r=b√ Sxx

Syy=

Sxy

√Sxx Syy

dimana:

r = Koefisien Korelasi Sampel

n = Ukuran Sampel

x = Nilai dari Variabel Independen

y = Nilai Variabel dependen

Dari persaamaan korelasi yang terakhir tersebut dapat dilihat adanya hubungan

antara b dan r. r digunakan untuk mengukur hubungan linier antara x dan y,

sedangkan b mengukur perubahan dalam y akibat perubahan setiap unit x.

Dalam kasus dimanai r1 = 0,3 dan r2 = 0,6 hanya berarti bahwa terdapat korelasi

positif dimana r2 lebih kuat daripada r1. Adalah salah jika menyimpulkan bahwa r2

mengindikasikan hubungan linier dua kali lebih baik dibandingkan dengan r1.

6.2.2.Koefisien Determinansi

Koefisien determinansi adalah salah satu alat analisis yang dapat digunakan untuk

mengetahui lebih jauh hubungan antar variabel. Koefisien determinansi

disimbolkan dalam R2 yang menyatakan proporsi variansi keseluruhan dalam nilai

variabel dependen yang dapat diterangkan oleh hubungan linier dengan variabel

independen atau menunjukkan proporsi total variasi dalam nilai variabel

dependen yang dapat dijelaskan oleh hubungan linier dengan nilai variabel

independen. Nilai koefisien determinansi ini berkisar :0 ≤ R2≤ 1

R2 juga dapat digunakan untuk mempertimbangkan sebuah model regresi. Jika R2

suatu model besar belum tentu model tersebut adalah model yang baik, tetapi jika

MSE model kecil maka model teresbut adalah model regresi yang terbaik.

Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan

penafsirannya jika 0.994 sehingga R2 = 0.989 atau 98.9% adalah pengaruh

variabel bebas terhadap perubahan variabel terikat adalah 98,9%, sedangkan

sisanya sebesar 1,1% dipengaruhi oleh variabel lain selain variabel bebas X.

Page 7: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Koefisien determinasi banyak digunakan dalam penjelasan tambahan untuk hasil

perhitungan koefisien regresi.

6.2.3. Korelasi Ganda

Korelasi ganda adalah korelasi yang menunjukkan arah dan kuatnya hubungan

antara dua atau lebih variabel terikat secara bersama-sama dengan variabel yang

lain (variabel bebas). Contohnya: hubungan antara kesejahteraan pegawai,

hubungan dengan pemimpin, dan pengawasan dengan efektivitas kerja.

Korelasi berganda merupakan korelasi dari beberapa variabel bebas secara

serentak dengan variabel terikat. Misalkan ada k variabel bebas,

dan satu variabel terikat Y dalam suatu persamaan regresi linear maka besarnya

korelasi bergandanya adalah :

r y, x1 ,… , xn=

a1∑ x1 y+a2∑ x2 y+…+ak∑ xk y

∑ y2

dengan

∑ x1 y=∑ X 1Y−∑ X1∑ Y

n

∑ xk y=∑ Xk Y −∑ Xk∑ Y

n

∑ y2=∑ Y 2−(∑Y )2

n

6.2.4. Korelasi Parsial

Korelasi parsial adalah korelasi yang menunjukkan arah dan kuatnya hubungan

atau pengaruh antara dua variabel atau lebih (variabel bebas dan terikat) setelah

Page 8: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

satu variabel yang diduga dapat mempengaruhi hubungan variabel tersebut

dikendalikan untuk dibuat tetap keberadaannya.

Persamaan korelasi antara x1 dengan y, bila variabel x1 dikendalikan atau korelasi

antara x1 dengan y bila x2 tetap yaitu :

r y, x1 , x2=r y x1

−(r¿¿ y x2× rx1 x2

)

√ (1−r x1 x2

2 )(1−r y x2

2 )¿

Dimana :

r y, x1 , x2= korelasi antara x1 dengan x2 secara bersama-sama dengan variabel y

r y x1= korelasi product moment antara x1 dengan y

r y x2 = korelasi product moment antara x2 dengan y

r x1 x2 = korelasi product moment antara x1 dengan x2

6.3. Uji Hipotesis Korelasi

Pengujian hipotesis korelasi bertujuan untuk mengetahui apakah terdapat

hubungan antara dua variabel tertentu.

Perumusan hipotesis untuk korelasi adalah sebagai berikut:

H0: Tidak ada hubungan linier yang signifikan antara dua variabel

H1: Ada hubungan linier yang signifikan antara dua variabel

Atau H0 : ρ = 0

H1 : ρ ≠ 0

Statistik uji:

Statistik uji menggunakan uji-T, yakni dengan menggunakan rumus sebagai

berikut:

t hitung=r √n−2√1−r2 atau

t tabel= t( α

2;df )

dimana df =n−2

t hitung=b

S

S xx

=√SSRS

Page 9: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Kriteria uji

Tolak H0 jika thitung > ttabel atau thitung < -ttabel

Kesimpulan

Sementara untuk menguji hipotesis koefisien korelasi dengan menggunakan

koefisien korelasi taksiran (ρ0 ¿, dapat digunakan hipotesis sebagai berikut:

H 0 : ρ=ρ0 dimana ρ0 ≠ 0

H 1: ρ≠ ρ0

Statistik uji:

zhitung=√n−3

2ln [ (1+r )

(1−r )(1−ρ0 )(1+ρ0 ) ]

z tabel=zα (uji satu sisi) atau z tabel=z α2 (uji dua sisi)

Kriteria uji:

Tolak H0 jika zhitung > ztabel atau zhitung < -ztabel

Kesimpulan

6.4.Analisis Regresi

Dalam kehidupan sehari-hari, seringkali dijumpai kasus yang berhubungan dengan dua

variabel atau lebih. Hubungan tersebut dapat berupa hubungan kausal atau hubungan

fungsional. Hubungan kausal misalnya : hubungan antara panas dengan tingkat muai

panjang, sedangkan hubungan fungsional contohnya: hubungan antara kepemimpinan

dengan tingkat kepuasan kerja pegawai.

Secara umum terdapat dua macam hubungan antara dua variabel atau lebih, yaitu :

Keeratan hubungan dapat diketahui dengan analisis korelasi (bukan hubungan sebab-

akibat)

Page 10: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Bentuk hubungan dapat diketahui dengan analisis regresi

6.4.1. Sejarah Regresi

Sejarah Regresi dimulai ketika Sir Francis Galton (1822-1911) yang membandingkan

tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton menunjukkan bahwa

tinggi anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur

(regressed) mendekati nilai populasi. Dengan kata lain, anak laki- laki dari ayah yang

badannya sangat tinggi, cenderung lebih pendek dari ayahnya. Sedangkan anak laki-laki

dari ayah yang badannya sangat pendek cenderung lebih tinggi dari ayahnya. Sekarang

istilah regresi diterapkan pada semua peramalan.

6.4.2. Definisi Regresi

Regresi merupakan salah satu metoda dalam analisis statistika yang digunakan untuk

menganalisis dan memodelkan secara matematis hubungan diantara dua variabel atau

lebih. Pada analisis regresi ini dikenal adanya variabel dependen (variabel tak

bebas/variabel tergantung/Unknown Variable/Response Variable) dan variabel

independen (variabel bebas/ Explanatory Variable/Regressor Variable/Predictor

Variabls/). Regresi dipakai untuk mengukur besarnya pengaruh perubahan pada

variabel dependen yang diakibatkan perubahan pada variabel independen.

Menurut Gujarati (2006) analisis regresi merupakan suatu kajian terhadap hubungan

satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel)

dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama

disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai

variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi

linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan

dikenakan kepada variabel tergantung. Saat ini, analisis regresi banyak digunakan untuk

menelaah hubungan dua variabel atau lebih dan menentukan pola hubungan yang

modelnya belum diketahui, sehingga regresi secara aplikatif lebih bersifat eksploratif.

6.4.3. Asumsi

Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb:

Page 11: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Error (ε) independen secara statistik

Distribusi probabilitas dari Error berdistribusi Normal

Distribusi probabilitas dari Error(*) mempunyai variansi yang konstan

Ada hubungan linier antara kedua variabel

Catatan (*):

Residual adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan

sebenarnya apabila data yang digunakan adalah data sampel.

Error adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan yang

sebenarnya apabila data yang digunakan adalah data populasi.

Persamaan keduanya : merupakan selisih antara nilai duga (predicted value) dengan

pengamatan sebenarnya.

Perbedaan keduanya: residual dari data sampel, error dari data populasi.

6.4.5. Analisis Regresi Linier Sederhana

Regresi linier sederhana ini bertujuan untuk mempelajari hubungan antara dua variabel

yaitu satu variabel bebas/variabel independen (X) dan variabel terikat/variabel dependen

(Y). Bentuk umum dari pesamaan regresi linier sederhana dari populasi adalah:

Persamaan garis regresi sampel memberikan estimasi garis regresi populasi sebagai

berikut:

Keterangan :

y i = nilai estimasi dari variabel bebas. Ŷ juga merupakan variabel terikat (dependen

variable)

a = konstanta yang merupan nilai estimasi y jika nilai x=0 (intercept)

b = koefisien regresi/gradient garis regresi (slope)

x = variabel bebas (independent variable)

y=α+βx+ε

y i=a+bx

Page 12: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

6.4.5.1. Metode Kuadarat Terkecil (Least-Squares Method)

Metode untuk menaksir α dan β sehingga jumlah kuadrat dari deviasi simpangan antara

observassi-observasin dan garis regresi menjadi minimum:

SSE=L=∑i=1

n

e i2=∑

i=1

¿¿¿¿

Dimana ε adalah nilai sisaan/galat/error yang merupakan penyimpangan model regresi

dari nilai yang sebenaranya.

Gambar VI.2 Grafik Regresi Linier dengan Nilai ε

Dengan cara mendeferensialkan persamaan di atas terhadap α dan kemudian terhadap β,

kemudian menyamakan hasil pendeferensilan itu dengan nol, maka:

∂ L∂ a

=−2∑i=1

n

(Y i−a−b (x i−x¿))=0¿

Page 13: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

∂ L∂b

=−2∑i=1

n

(Y i−a−b (x i−x¿))(x i−x)=0¿

Penyederhanaan dua persamaan tersebut di atas menghasilkan persamaan normal

kuadrat terkecil sebagai berikut:

na+b∑i=1

n

xi=∑i=1

n

y i

dan

∑i=1

n

x i y i=a∑i=1

n

x i+b∑i=1

n

x i2

Dari persamaan di atas, maka diperoleh persamaan:

atau b=Sxy

Sxx atau

atau

b=∑ ( x− x )( y− y )

∑ ( x− x )2

b=n∑ xy−∑ x∑ y

n∑ x2−(∑ x )2

Page 14: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Dari persamaan di atas disubstitusi, maka diperoleh persamaan untuk menentukan nilai

a: a = ∑i=1

n

y i

n−b

∑i=1

n

x i

n

atau:

a = y – bx

Dimana:

y = rata – rata yi

x = rata – rata xi

6.4.5.2. Partisi dari Varians Total

Estimasi parameter σ 2 menghasilkan variansi yang disebabkan karena kesalahan model

dan variansi yang disebabkan karena kesalahan eksperimen. Dekomposisi varians dapat

dijabarkan sebagai berikut:

SST = SSR + SSE

Keterangan:

SST = Sum of Square Total / Jumlah Kuadrat Total =Syy

SSR = Sum of Square Regression / Jumlah Kuadrat Regresi = bSxy

SSE = Sum of Square Eror / Jumlah Kuadrat Eror = Syy−¿ bSxy

Page 15: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Dimana : Sxx=∑ x i2−n x2

Syy=∑ y i2−n y2

Sxy=∑ x i yi−n x y

6.4.5.3. Estimasi dari σ 2

Sum of Square Error (SSE) merupakan variansi yang menggambarkan penyimpangan

dari nilai–nilai observasi di sekitar garis regresi sampel. Nilai SSE (Se) atau yang biasa

disebut MSE (Mean Squared Error) adalah estimasi dari σ 2 dan diestimasi dengan

persamaan berikut:

Se = S = √∑ ( y− y )2

n−2 =√ SSE

n−2 =√ S yy−b Sxy

n−2

Standar Error Koefisien Regresi

Jika diambil sampel x dan y dari populasi, maka masing–masing sampel tersebut

memiliki gradien/slope (b) sendiri. Gradien sampel tersebut akan bervariasi disekitar

nilai koefisien regresi tersebut. Maka perlu diketahui variasi koefisien regresi tersebut

dengan persamaan berikut:

sb=s

√Sxx=

√∑ ( x− x )2=

√∑ x2−(∑ x )2

n

Page 16: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

6.4.5.3. Standar Error untuk y bila nilai x diketahui

Jika nilai x dimasukkan berulang–ulang pada persamaan regresi, maka nilai rata–rata

yang diperoleh tidak akan sama, yang artinya nilai y bervariasi. Sehingga nilai standar

error y dapat ditentukan dengan persamaan berikut (bila x diketahui):

Sy = Se (√( 1n+

( x0−x )2

Sxx))

6.4.6.Uji Parsial Parameter Regresi

Digunakan untuk menguji apakah parameter β berarti pada model secara parsial.

Tahapan uji yang dilakukan:

Hipotesis:

H0 : β = 0

H1 : β ≠ 0

Statistik Uji:

t=b−β0

s /√Sxx

=b−β0

Sb

Pengambilan Keputusan:

Tolak H0 jika thitung > t a/2(df= n-2) pada selang kepercayaan α

Kesimpulan

6.4.7. Uji Intersep Model Regresi

Tahapan uji yang dilakukan:

Hipotesis:

H0 : α = 0

Page 17: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

H1 : α ≠ 0

Statistik Uji:

t= a−α

s √∑ x i

n Sxx

Pengambilan Keputusan

Tolak H0 jika thitung > t a/2(db= n-2) pada selang kepercayaan α

Kesimpulan

6.4.8. Selang Kepercayaan

Selang Kepercayaan untuk α:

Selang Kepercayaan untuk β:

6.4.9.Prediksi

Estimasi selang keyakinan untuk Rata-rata y, diberikan pada saat xp

Estimasi selang keyakinan untuk Nilai individual y diberikan pada saat xp

a±tα /2

S√∑ x 2i

√nSxx

b±tα /2 sb

y±tα /2 sε√ 1n+

( x p− x )2

∑ ( x− x )2

y±tα /2 sε√1+ 1n+

( x p− x )2

∑ ( x− x )2

Page 18: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

6.5. Pemilihan Model Regresi

Penentuan model regresi linier sederhana ditekankan pada konsep linieritasnya

dengan asumsi awal bahwa hubungan tersebut linier diparamater regresinya.

Pemilihan variabel independen yang kurang tepat dapat menimbulkan bias dalam

estimasinya.

Tahapan uji yang dilakukan:

Hipotesis

H0 : β = 0

H1 : β ≠ 0

Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan

adalah 0,01 atau 0,05

Tabel VI.1 Analysis of Variance

Sumber

Variansi SS df MS Fhitung

Regresi SSR 1 MSR = SSR/1 MSR/s2

Error SSE n – S2 = SSE/n-2

Total SST n –

Pengambilan Keputusan

Tolak H0 jika Fhitung > Ftabel(1 , n-2) pada selang kepercayaan (level of significance) α

Kesimpulan

6.5.1 Pendekatan Analisis Varians (Anova)

Untuk menguji kelayakan dari suatu model regresi digunakan pendekatan analisis

varians.Analisis varians adaah suatu prosedur membagi variansi total variabel dependen

menjadi dua komponen, yaitu: variansi model sistematik dan variansi error.

Page 19: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

6.6. Analisis Residual

Analisis residual dapat dilakukan dengan:

a. Pengujian Unequal variances: Varians pada setiap nilai x harus identik, yaitudengan

melakukan plot e i dengan y, apabila terdapat pola-pola tertentu berarti varians tidak

identik sehingga perlu distabilkan dengan transformasi.

b. Pengujian Non normal error,yaitu dengan:

Stem and leaf

Histogram

Dot diagram

Plot normal (Normal Probability Plot)

c. Jika terdapat extreme skewness (kemiringan yang ekstrim) pada data, maka tidak

berdistribusi normal.

d. Pengujian Correlated Error (independent), yaitu dengan melihat plot e i dengan time

order (i). Jika ada pola tertentu, maka terjadilah dependent residual dimana

penyebabnya dapat karena kesalahan eksperimen atau kesalahan dalam

pembentukan model atau karena variabel prediktor yang diabaikan.

e. Pengecekan Ouliers residual yaitu dengan cara plot residual dalam batas pengujian

±3σ (plot ei dengan y).Apabila residual terletak di luar batas 3σ atau nilainya lebih

besar dari 3σ, maka ada indikasi outlier.

Page 20: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

6.7. Pengujian Linieritas Regresi:untuk data dengan observasi berulang

Pada beberapa percobaan untuk mendapatkan hasil yang akurat seringkali dilakukan

pengulangan observasi untuk setiap nilai x, sehingga perlu dilakukan pengujian apakah

model yang dihasilkan sudah memenuhi atau tidak. Untuk menggambarkan kondisi

tersebut diatas dilakukan pengujian kecocokan model dengan pendekatan Lack Of Fit.

6.7.1. Pengujian Lack Of Fit

Sum of squared error terdiri atas dua komponen, yaitu variasi random yang

muncul antar nilai y untuk setiap nilai x (pure experimental error) dan komponen yang

dikenal dengan istilah Lack Of Fit (LoF), untuk mengukur ketepatan model.

Prosedur Pengujian:

Hipotesis

H0 : Tidak ada LoF

H1 : Ada LoF Model Linier tidak sesuai

Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan

adalah 0,01 atau 0,05

Hitung Pure Error sum of square (SSpe)

SSpe=∑i=1

k

∑i=1

n

¿¿¿¿ dengan df = n – k

Tabel VI.2 Analysis of Variance

Sumber

Variansi SS df MS Fhitung

Regresi SSR 1 MSR = SSR/1 MSR/s2

Error: SSE n –

2

S2 = SSE(/n-2)

Lof SSE - SSpe k - 2 (SSE – SSpe¿/(k−2)

Page 21: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Pure error SSE−SSpeS2(k−2)

SSpe n - k S2= SSpe /(n-k)

Total SST n

Pengambilan Keputusan

Tolak H0 jika Fhitung > Ftabel(k-2 , n-k) pada selang kepercayaan (level of significance) α

Kesimpulan

Contoh 1

nilai 9 mahasiswa dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir

semester (y) sebagai berikut :

n 1 2 3 4 5 6 7 8 9

xi 7 50 7 72 81 9 96 9 67

yi 8 66 7 34 47 8 99 9 68

a. Tentukan persamaan garis regresi linear.

b. Tentukan nilai ujian akhir seorang murid yang mendapat nilai 85 pada ujian tengah

semester.

Jawab :

persamaan regresi linear

n 1 2 3 4 5 6 7 8 9 Σxi 77 50 71 72 81 94 96 99 67 707yi 82 66 78 34 47 85 99 99 68 658xiyi 6314 3300 5538 2448 3807 7990 9504 9801 4556 53258xi

2 5929 2500 5041 5184 6561 8836 9216 9801 4489 57557

Page 22: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Sehingga b = (9 ) (53.258 )−(707 )(658)

(9 ) (57.557 )−(707)2 = 0,777142

dan

a = 658−(0,777142 )(707)

9 = 12,06232

jadi, persamaan regresi linear adalah

y = 12,06232 + 0,777142x

x = 85

y = 12,06232 + (0,777142)(85) = 78,11936

Contoh 2

Lakukan uji regresi dengan pendekatan ANOVA pada :

x 3,4 2,8 2,5 3,7 3,2 3,1 2,9 3 2,2 2,4 2,7y 25 20 18 25 21 22 30 22 10 20 17

Jawab :

Σx = 31,9 Σy = 230 Σ xiyi = 675,5

Σ xi2 = 94,49 Σ yi

2 = 4866

x = 2,9 y = 20,9091

b = 0,777142

a = 12,06232

Sxx = Σ xi2 – n(x)2 = 1,98

Sxy = Σ xiyi – n(x y)= 8,4997

Syy = Σ yi2 – n(y)2 = 56,9049

SSR = b2 Sxx = 36,4894

SSE = Syy – SSR = 20,4155

Hipotesis

H0 : β = 0

H1 : β ≠ 0

α = 0.05

Page 23: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

Tabel Anaysis of Variance

KomponenRe

gresi

SS d M Fhitung

Regresi 36,4

9

1 36, 16,08

2

7

6

Error 20,4

2

9 2,2

Total 56,9

0

4

9

1

Pengambilan Keputusan

F tabel = F(0.05;1,9) = 5,12

Karena Fhitung > Ftabel maka Ho ditolak

Kesimpulan:Model Regresi linier sesuai

Contoh 3

Berikut adalah data jumlah biaya promosi (x) dan jumlah penjualan (y) pada perusahaan

ABC.

Tahu

nJumlah Biaya Promosi x) Jumlah Penjualan (y)

2005 22 30

2006 36 38

Page 24: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

2007 31 35

2008 32 37

2009 31 34

2010 32 38

Tentukanlah apakah terdapat hubungan antara biaya promosi dengan penjualan

menggunakan uji korelasi Spearman Rank dan tingkat kesalahan 1%!

Jawab:

Tahun

Jumlah

Biaya

Promos

i (x)

Jumlah

Penjuala

n (y)

Range

x

Range

yd i=R ( x )−R ( y) d i

2005 22 30 1 1 0 0

2006 36 38 6 5.5 0.5 0.25

2007 31 35 2.5 3 -0.5 0.25

2008 32 37 4.5 4 0.5 0.25

2009 31 34 2.5 2 0.5 0.25

2010 32 38 4.5 5.5 -1 1

∑ 2

r s=1− 6 (2)6(62−1)

=1− 12210

=1−0 , 057=0 , 943

Uji Hipotesis:

Page 25: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

H0 : Tidak ada hubungan yang signifikan antara variabel biaya promosi dengan variabel

penjualan

H1 : Ada hubungan yang signifikan antara variabel biaya promosi dengan variabel

penjualan.

Statistika uji:

t hitung=r √n−21−r 2 =

(0 ,943 )√6−21−(0 , 943 )2

= 1 ,8860 ,11075

=17 , 03

t tabel= t( 0 ,01

2 ;4)=4 ,604

Kriteria uji: Karena thitung > ttabel maka tolak H0

Kesimpulan: Karena tolak H0 maka terima H1 yakni ada hubungan yang signifikan antara

variabel biaya promosi dengan variabel penjualan

LATIHAN SOAL:

1. Data berikut menyatakan IQ=X untuk kelompok anak berumur tertentu dan hasil ujian

prestasi pengetahuan umum (Y).

Xi Yi Xi Yi Yi Yi

114

110

113

137

116

132

90

121

107

29

41

48

73

55

80

40

75

43

13

14

13

14

12

71

68

69

66

39

78

49

59

66

96

89

105

125

107

97

134

106

99

45

32

50

57

59

48

55

45

47

Page 26: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

120

125

92

64

53

31

13

10

12

11

12

95

10

67

46

47

98

117

100

59

47

49

a. Gambar diagram pencarnya.

b. Tentukn regresi linear Y atas X lalu gambarkan.

c. Jelaskan arti koefisien arah yang didapat.

d. Berapa rata-rata prestasi anak dapat diharapkan jika IQ nya 120?

e. Tentukan interval kepercayaan 95% untuk rata-rata prestasi anak dengan IQ=120.

Jelaskan artinya!

f. Tentukan interval kepercayaan 95% untuk seorang anak dengan IQ=120. Jelaskan

artinya!

g. Tentukan interval kepercayaan 95% untuk perubahan rata-rata prestasi jika IQ berubah

dengan satu unit.

h. Perlukah diambil model berbentuk lain?

i. Asumsi apakah yang harus diambil untuk menyelesaikan pertanyaan-pertanyaan diatas?

2. Dari tabel berikut ini:

X (oC) Y (gram)

0 8 6 8

Page 27: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

15 12 10 14

30 25 21 24

45 31 33 28

60 44 39 42

75 48 51 44

Carilah persamaan garis regresi

Gambarkan garis tersebut pada diagram pencar

Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.

3. Lakukan uji model regresi pada soal no.1.

4. Berikut adalah data banyaknya modal (dalam juta rupiah) dan keuntungan yang diperoleh

(dalam juta rupiah) yang dihasilkan dalam waktu 10 bulan.

Modal (x) 189 204 192 214 218 178 189 167 180 194

Keuntungan

(y)

10 15 13 17 19 14 13 11 13 15

a. Hitunglah koefisien korelasi Pearson dan determinasi berdasarkan data di atas dan ujiah!

b. Tentukan apakah pernyataan bahwa koefisien korelasi antara jumlah karyawan dan

keuntungan tidak lebih dari 0,7 adalah benar! Gunakan tingkat kesalahan 5%!

5. Hitunglah koefisien korelasi kondisi temperatur (x) dan kepuasan pekerja (y) serta

apakah

ada hubungan yang signifikan antara keduanya dengan menggunakan teknik korelasi

Page 28: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

pearson!

nKondisi temperatur

(x)

KepuasanKerja

(y)

1 8 20

2 12 20

3 10 17

4 7 18

5 8 19

6 7 20

7 12 18

8 10 19

9 12 16

19 17

110 16

112 17

112 18

112 12

Page 29: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

112 17

6. Dibawah ini diberikan data yang secara acak diambil dari populasi normal bervariabel

dua (X dan Y).

X Y X Y X Y

15

13

10

11

16

12

9

12

4

8

10

10

99

11

13

97

74

98

20.

69

8

11

17

20

12

18

16

13

18

11

56

75

137

163

84

149

140

137

170

109

17

6

8

5

3

6

14

5

15

16

153

73

95

26

24

50

96

35

132

141

Page 30: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

I.1.1 Regresi Linier BergandaAnalisis regresi linier berganda digunakan untuk menganalisis hubungan antara variabel

bebas (x) dan variabel terikat (y). Namun pada regresi linier berganda ini, variabel bebas (x)

yang digunakan lebih dari dari satu. Bentuk persamaan umum untuk model regresi linier

berganda:

y= a + b1 x1+b2 x2+……+bn xn

Keterangan:

y = nilai dari variabel terikat

a = konstata nilai estimasi y jika nilai x=0 (intercept)

b i = koefisien regresi gradient garis regresi (slope)

xn = variabel bebas

I.1.1.1 Metode Kuadarat Terkecil (Least-Squares Method)Untuk setiap pengamatan {( x1 i , x2 i; y i ) ; i=1 , 2 ,…, n¿ } akan memenuhi persamaan:

y= a + b1 x1+b2 x2+……+bn xn+e i

Dengan menggunakan metode kuadrat terkecil, maka diperoleh persamaan:

e i= y- a - b1 x1−b2 x2−……−bn xn

Dengan syarat meminimasikan nilai a, b1, dan b2 penurunannya, maka diperoleh persamaan:

∑ yi = an + b1∑i=1

n

x i1 + b1∑i=1

n

x i2

∑i=1

n

x1 i y i = a∑i=1

n

x1 i + b1∑i=1

n

x i 12 + b2∑

i=1

n

x i1 x i 2

∑i=1

n

x2 i yi = a∑i=1

n

x2 i + b2∑i=1

n

x i 22 + b1∑

i=1

n

x i1 x2 i

Asumsi yang digunakan dalam analisis regresi linier berganda antara lain:

a. Setiap nilai error berdistribusi normal dengan rata–rata 0 dan dan varians σ2

b. Bersifat homoskedastisitas

Page 31: BAB VI -    Web viewSebelum menentukan bentuk hubungan dengan analisis regreis linier atau sebelum mengukur keeratan hubungan antara dua variabel,

c. Kovarian error = 0, tidak terjadi autokorelasi

d. Tidak terdapat multikolinieritas, artinya tidak terdapat hubungan linier yang sempurna

diantara variabel–variabel bebas.

Latihan soal

1. Dari tabel berikut ini:

X (oC) Y (gram)

0 8 6 815 12 10 1430 25 21 2445 31 33 2860 44 39 4275 48 51 44

a. Carilah persamaan garis regresi

b. Gambarkan garis tersebut pada diagram pencar

c. Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.

2. Lakukan uji model regresi pada soal no.1.