statistik bisnis :: regresi linier sederhana

21
REGRESI LINIER SEDERHANA Dr. Ir. H. Tjiptogoro Dinarjo, MM PROGRAM PASCASARJANA UNIVERSITAS ISLAM AS-SYAFI’IYAH 2011 1

Upload: andreas-jiman

Post on 19-Jan-2016

196 views

Category:

Documents


6 download

DESCRIPTION

in Bahasa Indonesia only:: about Simple Regession

TRANSCRIPT

Page 1: Statistik Bisnis :: Regresi Linier Sederhana

1

REGRESI

LINIER SEDERHANA

Dr. Ir. H. Tjiptogoro Dinarjo, MM

PROGRAM PASCASARJANA

UNIVERSITAS ISLAM AS-SYAFI’IYAH

2011

Page 2: Statistik Bisnis :: Regresi Linier Sederhana

2

Least Squares Method.Populasi Mahasiswa dan penjualan perkuartal untuk 10 restoran

Restoranti

Populasi MahasiswaXi

Penjualan per KuartalYi

12345678910

2688121620202226

5810588118117137157169149202

Page 3: Statistik Bisnis :: Regresi Linier Sederhana

3

PerhitunganŶi = b0+ b1X

• Yi = perhitungan perolehan penjualan kuartalan restoran ke i.

• b0 = bilangan konstanta (intercept) regresi garis hasil perhitungan.

• b1 = sudut (slope) garis regresi hasil perhitungan.

• Xi = jumlah mahasiswa untuk restoran ke i

Rumus penting.

• Least Square Criterion: min Σ (Yi – Ŷi)2

• Slope b1 = {Σ (Xi – X4 ) (Yi - Y)}/Σ(Xi-X4 )2

• Intercept b0 = Y – b1X4

• X4 = (Σxi)/n

• Y= (Σ Yi)/n

Note:Yi : Nilai pengamatan dari dependent variable untuk ke i pengamatan.

Ŷi : Nilai perhitungan dari dependent variable untuk ke i pengamatan.

Y : Nilai mean dari dependent variableXi : Nilai dari independent variable untuk ke i pengamatan.

X4 : Nilai mean dari independent variable untuk ke i pengamatan.n : Total angka pengamatan.

Page 4: Statistik Bisnis :: Regresi Linier Sederhana

4

Jumlah sampel 10 restoran atau n = 10

• X4 = (Σxi)/n = 140/ 10 = 14

• Y= (ΣYi)/n = 1300/10 =130

b1 = {Σ (Xi – X4 ) (Yi - Y)}/Σ(Xi-X4 )2

= 2840/568 = 5

b0 = Y – b1X4 = 130 – 5x14 = 60

Maka persamaan regresi : Ŷ = 60 + 5X

Dengan persamaan ini dapat memperkirakan berapa penjualan yang dapat terjadi sesuai dengan jumlah Mahasiswa yang ditentukan jumlahnya. Jika jumlah Mahasiswa misalkan 16000 orang maka penjualan diperkirakan akan mencapai Ŷ

= 60 + 5x16 = 140

Restoran i

Xi Yi Xi - X. Yi - Y (Xi - X.) (Yi - Y ) (Xi - X.)2

123456789

10

2688

121620202226

140Σxi

58105

88118117137157169149202

1300ΣYi

-12-8-6-6-22668

12

-72-25-42-12-13

727391972

864200252

722614

162234152864

2840Σ(Xi - X4 ) (Yi - Y )

144643636

44

363664

144568

Σ(Xi - X4 )2

Page 5: Statistik Bisnis :: Regresi Linier Sederhana

5

Welcome to Minitab, press F1 for help. Regression Analysis: Quarterly versus Student

The regression equation isQuarterly = 60,0 + 5,00 Student

Predictor Coef SE Coef T PConstant 60,000 9,226 6,50 0,000Student 5,0000 0,5803 8,62 0,000

S = 13,8293 R-Sq = 90,3% R-Sq(adj) = 89,1%

Analysis of Variance

Source DF SS MS F PRegression 1 14200 14200 74,25 0,000Residual Error 8 1530 191Total 9 15730

Page 6: Statistik Bisnis :: Regresi Linier Sederhana

6

Page 7: Statistik Bisnis :: Regresi Linier Sederhana

7

Page 8: Statistik Bisnis :: Regresi Linier Sederhana

8

Latihan Soal

Seorang Manager mengumpulkan data pengalaman dan kemampuan menjual dari10 orang Sales dengan data sebagai berikut:

1. Gambarkan scatter diagram dengan pengalaman sebagai variabel bebas.

2. Hitung persamaan regresinya dapat menggunakan prediksi penjualan berdasarkan pengalaman tenaga sales.

3. Berapa prediksi kemampuan penjualan dari tenaga sales dengan pengalaman 9 tahun?

Tenaga Sales Pengalaman(Th)

Hasil Penjualan Rp 000.000,-

123456789

10

134468

10101113

809792

102103111119123117136

Page 9: Statistik Bisnis :: Regresi Linier Sederhana

9

Page 10: Statistik Bisnis :: Regresi Linier Sederhana

10

Page 11: Statistik Bisnis :: Regresi Linier Sederhana

11

Regression Analysis: Annual sales versus Pengalaman

The regression equation isAnnual sales = 80,0 + 4,00 Pengalaman

Predictor Coef SE Coef T PConstant 80,000 3,075 26,01 0,000Pengalaman 4,0000 0,3868 10,34 0,000

S = 4,60977 R-Sq = 93,0% R-Sq(adj) = 92,2%

Analysis of Variance

Source DF SS MS F PRegression 1 2272,0 2272,0 106,92 0,000Residual Error 8 170,0 21,3Total 9 2442,0

Page 12: Statistik Bisnis :: Regresi Linier Sederhana

12

Coeffisient Determination.

Koefisien determinasi adalah alat ukur the goodness of fit atas estimasi persamaan regresi.

1. Sum Of Squares Due to Error (SSE)

SSE = Σ (Yi – Ŷi)2

SSE adalah mengukur kesalahan penggunaan estimasi persamaan regresi untuk menghitung nilai variabel terikat dari sampel. Contoh x1 = 2 dan Y1 = 58, dengan menggunakan persamaan regresi kita peroleh Ŷ1 = 60 + 5x(2) = 70. Error atau kesalahan perhitungan Y1 – Ŷ1 = 58 – 70 = -12. kesalahan kuadratis menjadi (-12)2 = 144. SSE = 1530 sebagai ukuran kesalahan estimasi dg menggunakan persamaan regresi Ŷ = 60 + 5X untuk memprediksi penjualan. SSE= jumlah kuadratis perbedaan nilai data penjualan restoran ke i terhadap nilai persamaan garis ke i.

Restorant

iXi: Populasi Mahasiswa

(1000)

Yi :Penjualan Perkuartal

Rp 0.000.000

Prediksi Penjualan

Ŷi = 60 + 5Xi

Error (Kesalahan)Yi – Ŷi

Kesalahan (Error)

Kuadratis

123456789

10

2688

121620202226

58105

88118117137157169149202

7090

100100120140160160170190

-1215

-1218-3-3-39

-2112

144225144324

999

81441144

SSE = 1530

Page 13: Statistik Bisnis :: Regresi Linier Sederhana

13

2. Total Sum Of Squares (SST)

SST = Σ (Yi – Ŷ)2

SST adalah menggunakan nilai rata-rata (mean) hasil penjualan kuartalan untuk 10 sampel: Ŷ = Σ Yi /n = 1300/10 = 130 dan angka ini yaitu Ŷ = 130 untuk menghitung jumlah kuadratis deviasi yang terjadi pada sampel atau disebut SST. SST= jumlah kuadratis nilai perbedaan data penjualan restoran ke i terhadap rata-rata penjualan 10 restoran.

3. Sum Of Square Due To Regression (SSR)

SSR = Σ (Ŷi – Ŷ)2

Hubungan SST, SSR dan SSE: SST = SSR + SSE

Restoranti

Xi = Populasi Mahasiswa

(000)

Yi = Penjualan Perkuartal(0.000.000)

DeviationYi – Ŷ

Kuadrat Deviasi(Yi – Ŷ)2

123456789

10

2688

121620202226

58105

88118117137157169149202

-72-25-42-12-13

727391972

5.184625

1.764144169

49729

1.521361

5.184SST= 15.730

Page 14: Statistik Bisnis :: Regresi Linier Sederhana

14

100

50

25

200

125

75

2 4 6 8 10 12 14 16 18 20 22 24 26

Y

X

Y10 - Ȳ

Ŷ10 - Ȳ

Y10 - Ŷ

Populasi Mahasiswa (000)

Pe

nju

ala

n K

ua

rta

lan

(R

p0

.00

0.0

00

,-)

Y = Ȳ = 130

Ŷ = 60 + 5X

DEVIASI TENTANG GARIS REGRESI ESTIMASI DAN GARIS Y = Ȳ

Page 15: Statistik Bisnis :: Regresi Linier Sederhana

15

4. Koefisien Determinasi.

r2 = SSR/SST

dari data contoh restoran

r2 = SSR/SST = 14.200/15.730 = 0,9027

Dengan kata lain 90,27% variabilitas penjualan dapat dijelaskan terdapat hubungan linier antara jumlah populasi mahasiswa dengan penjualan dengan menggunakan persamaan regresai Ŷ = 60 + 5X.

5. Test Signifikan.

a. Mean Square Error (Estimate of σ2)

s2 = MSE = SSE/ n-2

n – 2 = degrees of freedom.

SSE pada kasus restoran SSE = 1530

s2 = MSE = SSE/ n-2 = 1530/(10-2) = 191,25

Standard error of estimate = s = √MSE = √191,25 = 13,829

Page 16: Statistik Bisnis :: Regresi Linier Sederhana

16

b. t test

Estimate Standard Deviastion of b1

Sb1 = S/√Σ(Xi - X4 )2

S = 13,829

Σ(Xi - X4 )2 = 568

Sb1 = 13,829/√568 = 0,5803

b1 = 5

t = b1/ sb1 = 5/ 0,5803 = 8,62

t tabel dengan degrees of freedom n – 2 = 10 – 2 = 8, dengan tingkat signifikan α = 0,01 maka diperoleh t = 3,355 dengan luas area diatas ekor ½ α = 0,01/2 = 0,005. Karena test menggunakan distribusi normal 2 ekor maka p value dengan t = 8,62 harus memiliki luas p kurang dari 2(0,005) = 0,01. Dari hasil perhitungan MINITAB p-value = 0.000. Karena p-value < α = 0,01 maka H0 ditolak dan disimpulkan β1 tidak sama dengan 0 pada persamaan regresi Y = β0 + β1X +ε

Kesimpulan: t Test untuk signifikan pada regresi linier sederhana

H0 : β1 = 0

Ha : β1 ≠ 0

Test Statistik t = b1/Sb1

Aturan Penolakan:

p-value approach: Tolak H0 bila p- value ≤ α Critical value approach: Tolak H0 bila t≤ -tα/2 atau bila t ≥ tα/2

Dimana tα/2 berdasarkan t distribusi dengan n – 2 degrees of freedom

Page 17: Statistik Bisnis :: Regresi Linier Sederhana

17

c. Confidence Interval untuk β1

Bentuk confidence interval untuk β1 sebagai berikut:

b1 ± tα/2Sb1

b1 adalah angka koefisien faktor hasil perhitungan

sedangkan tα/2Sb1 adalah margin kesalahan

Koefisien confidence dihubungkan dengan interval 1 – α, dan tα/2 adalah nilai t yang dihasilkan pada daerah α/2 pada ekor distribusi t dengan degree of freedom n – 2.

Contoh: nilat t yang terkait dengan α = 0,01 dengan degree of freedom n – 2 = 10 – 2 = 8. dari tabel t0,005 = 3,355. Dengan demikian 99% confidence interval atas perhitungan β1 adalah:

b1 ± tα/2Sb1 = 5 ± 3,355(0,5803) = 5 ± 1,95

= 3,05 atau 6,95

Kesimpulan: Hipotesis H0: β1 = 0

Ha: β1 ≠ 0

Dengan menggunakan t test unutuk test signifikan dengan interval tingkat kepercayaan 99% diperoleh interval β1 dengan nilai antara 3,05 sd 6,95, hal ini berarti β1 = 0 tidak dalam interval tersebut maka H0 ditolak

Page 18: Statistik Bisnis :: Regresi Linier Sederhana

18

d. F test.

Pada regresi dengan satu variabel bebas F test hasilnya sama dengan t test, bila t test mengindikasikan β1 ≠ 0 dan hubungan signifikan maka Ftest akan menghasilkan kesimpulan yang sama. Tetapi pada variabel bebas lebih dari satu hanya F test yang menghasilkan hasil test secara keseluruhan terdapat hubungan yang signifikan.

Mean square due to regression atau disebut juga mean square regression disingkat MSR

MSR = SSR/ Regression degree of freedom.

Regression degree of freedom adalah sama dengan jumlah variabel bebas. Mengingat regresi sederhana jumlah variabel bebas 1, maka

MSR = SSR/1 = SSR

F = MSR/MSE

Pada kasus restoran maka F = 14.200/191,25 = 74,25

Lihat tabel F.

Cara mencari tabel F tsb:• Lihat kolom Denominator Degrees of Freedom kebawah adalah angka n –

2, dimana n adalah jumlaf sampel.• Lihat kolom Area Upper Tail kebawah adalah angka luas area diatas ekor

yang mencerminkan angka dari α• Pada angka degree of freedom n – 2 lihat kekanan pada angka α kemudian

lihat angka numerator degree of freedom yang sama dengan banyaknya variabel bebas, untuk regresi linier atau sederhana dengan variabel bebas 1 maka lihat pada angka 1 disitu tertera 11,26 inilah nilai F = 11,26

Page 19: Statistik Bisnis :: Regresi Linier Sederhana

19

Kesimpulan F test.

F Test untuk test signifikan regresi linier sederhana

Hipotesis H0: β1 = 0

Ha: β1 ≠ 0

Test statistik

f = MSR/MSE

Aturan penolakan:

p-value approach: Tolak H0 bila p-value ≤ α

Critical value approach: Tolak Ho bila F ≥ Fα

Dengan catatan: Fα sama dengan F distribusi dimana degree of freedom sama dengan 1

pada kolom numerator. Dan n – 2 pada kolom denominator

Tabel ANOVA Untuk Regresi Linier Sederhana

Source of Variance

Sum of Squares Degree of Freedom

Mean Square F P-value

Regression SSR 1 MSR = SSR/1 F = MSR/MSE p-value

Error SSE n - 2 MSE = SSE/ (n – 2)

Total SST n - 1

Source of Variance

Sum of Squares Degree of Freedom

Mean Square F P-value

Regression SSR 1 MSR = SSR/1 F = MSR/MSE p-value

Error SSE n - 2 MSE = SSE/ (n – 2)

Total SST n - 1

Page 20: Statistik Bisnis :: Regresi Linier Sederhana

20

Soal latihan no 1.

Berikut ini data mengenai berat badan dan tinggi badan dari 5 orang perenang.

a. Buat scatter diagram dengan tinggi badan sebagai variabel bebas.

b. Apakah scatter diagram tersebut mengindikasikan adanya hubungan tinggi badan seseorang dengan berat badannya?

c. Coba buat perkiraan garis lurus yang mencerminkan adanya hubungan tinggi badan dengan berat badan perenang tsb.

d. Buat persamaan regresi dengan menghitung nilai b0 dan b1.

e. Jika perenang tinggi 63 inchies berapa perkiraan berat badan yang bersangkutan.

Sampel Tinggi(inchies)

Berat Badan(pounds)

12345

6864626566

132108102115128

Page 21: Statistik Bisnis :: Regresi Linier Sederhana

21

Soal latihan No 2

Dari hasil survey terhadap Guru Pengajar Matematika pada 10 Kelas III IPA SMU unggulan di Kota A diperoleh data (fiktif) sebagai berikut.

a. Buat scatter diagram dengan pengalaman sebagai variabel bebas.

b. Buat bentuk persamaan regresi yang dapat digunakan memprediksi hubungan pengalaman mengajar Guru matematika dengan prestasi belajar matematika untuk murid SMU untuk menghasilkan nilai diatas 7

c. Menggunakan persamaan regresi tersebut untuk memprediksi % pelajar /klas bernilai diatas 7 untuk pelajaran matematika dengan Guru yang berpengalaman mengajar matematika selama 5 th

Guru(Sampel)

Pengalaman Mengajar Matematika

(Th)

% Pelajar/ Kelas Bernilai Ujian

Diatas 7

123456789

10

134468

10101113

30304035404560706070