analisis regresi

Post on 23-Oct-2015

40 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

public

TRANSCRIPT

Analisis Regresi

Dr. Ir. Tatang Sopandi., MP

• Analisis regresi digunakan untuk:– Memprediksi nilai variabel dependen

berdasarkan pada nilai variabel independent

– Menjelaskan akibat (impact) perubahan suatu variabel independen terhadao vriabal dependen

Variabel dependen: variabel tidak bebas

Variabel independen: variabel bebas yang digunakan untuk menjelaskan variabel dependen

ILUSTRASI

Perbedaan mendasar antara korelasi dan regresi ?

• Korelasi hanya menunjukkan sekedar hubungan.

• Dalam korelasi variabel tidak ada istilah tergantung dan variabel bebas.

• Regresi menunjukkan hubungan pengaruh.

• Dalam regresi terdapat istilah tergantung dan variabel bebas.

Istilah dan notasi variabel dalam regresi ?

Y• Varaibel tergantung

(Dependent Variable)• Variabel yang dijelaskan

(Explained Variable)• Variabel yang diramalkan

(Predictand)• Variabel yang diregresi

(Regressand)• Variabel Tanggapan

(Response)

X• Varaibel bebas (Independent

Variable)• Variabel yang menjelaskan

(Explanatory Variable)• Variabel peramal (Predictor)• Variabel yang meregresi

(Regressor)• Variabel perangsang atau

kendali (Stimulus or control variable)

Model Regresi linear sederhana

• Hanya satu variabel independen (x)

• Hubungan antara variabel (x) dan (y) digambarkan dengan fungsi linear

• Perubahan dalam variabel (y) diasumsikan disebabkan oleh perubahan variabel (x)

Jenis model regresi

Hubungan linear positif

Hubungan Linear negatif

Hubungan bukan Linear

Tidak berhubungan

εxββy 10 Komponen Linear

Regresi linear populasi

Model regresi populasi:

Intersep population y

Koefisien kemiringan populasi

Galat acak atau sisaVariabel

Dependen

Variabel independen

Komponen galat acak

Asumsi regresi linear • Nilai galat (ε) secara statistik independen

• Nilai galat terdistribusi normal untuk setiap nilai x

• Distribusi probabilitas dari galat adalah normal

• Distrobusi probabilitas dari galat mempunyai variasi konstan

• Hubungan antara variabel x dan y adalah linear

Regresi Linear Populasi

Galat acak untuk nilai x

y

x

Nilai pengamatan y

pada xi

Nilai prediksi y pada xi

εxββy 10

xi

Slope = β1

Intercept = β0

εi

xbby 10i

Estimasi Model Regresi

Estimasi intercep regresi

Estimasi slope regresi

Nilai estimasi y

Variabel Independen

Galat acak individual ei mempunyai nilai rata-rata 0

Persamaan Regresi

Persamaan Regresi linier Sederhana:

Y = a + bX + Y = Nilai yang diramalkan

a = Konstansta

b = Koefesien regresi

X = Variabel bebas

= Nilai Residu

22 )()(

))(()(

XXn

YXXYnb

n

XbYa

)(

Kriteria kuadrat terkecil (Least Squares)

• b0 dan b1 diperoleh dengan mendapatkan nilai b0 dan b1 yang meminimalkan jumlah kuadart sisa

210

22

x))b(b(y

)y(ye

Persamaan kuadrat terkecil

• Formulai untuk b1 dan b0 adalah :

Persamaan aljabar:

n

xx

n

yxxy

b 22

1 )(

21 )(

))((

xx

yyxxb

xbyb 10

dan

• b0 diestimasi dari nilai rata-rata y

ketika nilai x sama dengan nol

• b1 diestimasi dari perubahan rata-

rata nilai y karena perubahan satu unit x

Interpretasi Slop dan Intersep

Contoh Persamaan Regresi

Y X XY X2 Y2

64 20 1280 400 4096

61 16 976 256 3721

84 34 2856 1156 7056

70 23 1610 529 4900

88 27 2376 729 7744

92 32 2944 1024 8464

72 18 1296 324 5184

77 22 1694 484 5929

608 192 15032 4902 47094

22 )()(

))(()(

XXn

YXXYnb

497,1)192()4902(8

)609)(192()15032(82

b

082,408

)192(497,1)608(

a

n

XbYa

)(

Y= 40,082 + 1,497X+e

Koefesien DeterminasiKoefesien determinasi:

2

22

)(

)ˆ(1

YY

YYR 743,0

)886(

)497,227(12 R

Koefesien Determinasi Disesuaikan (adjusted)

1

)1( 22

PN

RPRRadj 70,0

118

)743,01(1743,0

adjR

Kesalahan Baku Estimasi

Digunakan untuk mengukur tingkat kesalahan dari model regresi yang dibentuk.

kn

YYSe

2)ˆ(1576,6

28

)467,227(

Se

Koefisien galat baku Regresi

Digunakan untuk mengukur besarnya tingkat kesalahan dari koefesien regresi:

n

XX

SeSb

2

2 )(359,0

8)192(

)4902(

1576,621

Sb

Uji FUji F digunakan untuk uji ketepatan model, apakah nilai prediksi mampu menggambarkan kondisi sesungguhnya:

Ho: Diterima jika F hitung F tabel

Ha: Diterima jika F hitung > F tabel

)/(1

)1/(2

2

knR

kRF

367,17)28/(743,01

)12/(743,0

F

Karena F hitung (17,367) > dari F tabel (5,99) maka persamaan regresi dinyatakan Baik (good of fit).

Uji tDigunakan untuk mengatahui pengaruh variabel bebas terhadap variabel tergantung.Ho: Diterima jika t hitung t tabel

Ha: Diterima jika t hitung > t tabel

Sbj

bjThitung 167,4

359,0

497,1hitungt

Karena t hitung (4,167) > dari t tabel (1,943) maka Ha diterima ada pengaruh iklan terhadap penjualan.

Contoh data

Harga rumah $1000s(y)

Luas (x)

245 1400

312 1600

279 1700

308 1875

199 1100

219 1550

405 2350

324 2450

319 1425

255 1700

Regression Using Excel

• Tools / Data Analysis / Regression

Excel Output

Regression Statistics

Multiple R 0.76211

R Square 0.58082

Adjusted R Square 0.52842

Standard Error 41.33032

Observations 10

ANOVA  df SS MS F

Significance F

Regression 1 18934.934818934.934

811.084

8 0.01039

Residual 8 13665.5652 1708.1957

Total 9 32600.5000      

 Coefficien

ts Standard Error t StatP-

value Lower 95%Upper 95%

Intercept 98.24833 58.03348 1.692960.1289

2 -35.57720232.0738

6

Square Feet 0.10977 0.03297 3.329380.0103

9 0.03374 0.18580

The regression equation is:

feet) (square 0.10977 98.24833 price house

0

50

100

150

200

250

300

350

400

450

0 500 1000 1500 2000 2500 3000

Square Feet

Ho

use

Pri

ce (

$100

0s)

Presentasi grafik

(luas) 0.10977 98.24833rumah harga

Slope = 0.10977

Intercept = 98.248

Koefisien Determinasi, R2

kuadratjumlah 2

total

ratregresiJumlahkuad

SST

SSRR

R2 = koefisien determinasi r = koefiseien korelasi sederhana

22 rR

Estimasi Galat baku

1 kn

SSEs

WhereSSE = jumlah kuadrat galat baku n = ukuran (jumlah) sampel

k = jumlah variabel independen

Excel Printout for House Prices:

At 95% level of confidence, the confidence interval for the slope is (0.0337, 0.1858)

1b/21 stb

 Coefficient

sStandard

Error t Stat P-value Lower 95%Upper 95%

Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386

Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

d.f. = n - 2

top related