statistik (bab 11)

54
1 Regressi Mudah dan Analisis Korelasi

Upload: noor-izzahtul-aisyah

Post on 03-Jul-2015

319 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Statistik (Bab 11)

1

Regressi Mudah dan Analisis Korelasi

Page 2: Statistik (Bab 11)

2

Objektif PembelajaranObjektif PembelajaranObjektif PembelajaranObjektif Pembelajaran

Mengira persamaan garisan regressi mudah dari data sampel, dan mentafsir kecerunan dan pintasan persamaan tersebut.

Memahami kegunaan analisis residual didalam menguji andaian disebalik analisis regressi dan didalam menguji kepadanan garisan regressi terhadap data.

Mengira ralat piawai penganggar dan mentafsir maknanya.

Mengira pangkali keofisien dan tafsirannya. Ujian hipotesis berkaitan kecerunan model regressi

dan mentafsir keputusannya. Menganggar nilai Y mnggunakan model regressi. Mengira keofisien korelasi dan mentafsirkannya.

Page 3: Statistik (Bab 11)

3

Korelasi dan RegressiKorelasi dan Regressi

Korelasi adalah ukuran darjah hubungkait diantara dua angkubah.

Analisis Regressi ialah proses membentuk model matematik atau fungsi yang boleh digunakan untuk meramal atau menentukan satu angkubah melalui angkubah lain.

Page 4: Statistik (Bab 11)

4

Analisis Regressi MudahAnalisis Regressi Mudah

Regressi linear bivariate (dua angkubah) -- model regressi yang asasAngkubah sandar, abgkubah yang

hendak diramal, biasanya dipanggil YAngkubah bebas, angkubah peramal

atau penerang, biasanya ditandakan sebagai X

Page 5: Statistik (Bab 11)

5

Data Hubungan Data Hubungan Bilangan Bilangan

Pekerja dan Pekerja dan Bilangan Katil Bilangan Katil

HospitalHospital

Bilangan Katil

Bilangan Pekerja

23 6929 9529 10235 11842 12646 12550 13854 17864 15666 18476 17678 225

Page 6: Statistik (Bab 11)

6

Lakaran Lakaran ““ScatterScatter”” Data Data

0

50

100

150

200

250

0 20 40 60 80 100

Bilangan Katil

Bila

ng

an

Pe

ke

rja

Page 7: Statistik (Bab 11)

7

Model RegressiModel Regressi

� Model Regressi Berkebarangkalian (Probabilistic)Model Regressi Berkebarangkalian (Probabilistic)

Y = Y = ββ 00 + + ββ 11X + X + εε

� β β 00 dan dan ββ 11 adalah parameter populasi adalah parameter populasi

� β β 00 dan dan ββ 11 adalah dianggarkan oleh sampel statistik b adalah dianggarkan oleh sampel statistik b00 dan b dan b11

� Model Regressi Berketentuan (Deterministic)Model Regressi Berketentuan (Deterministic)

Y = Y = ββ 00 + + ββ 11XX

Page 8: Statistik (Bab 11)

8

Rersamaan Garisan Regressi MudahRersamaan Garisan Regressi Mudah

Y bagiramalan nilai = Ysampelkecerunan =

sampelpintasan = :dimana

XY

bb

bb

1

0

10+=

Page 9: Statistik (Bab 11)

9

Analisis Kuasadua TerkecilAnalisis Kuasadua Terkecil

( )( )( )

( )( )

n

n

YXXY

n

YXnXYYYXX

XXXXXXb 2

22221

∑−

−=

−=

−−=

∑∑∑∑∑

∑ −∑

n

X

n

YXY bbb 110

∑∑ −=−=

Page 10: Statistik (Bab 11)

10

( ) ( ) ( )( )

( )SS X X Y Y XY

X Y

n

SSn

SS

SS

XY

XX

XY

XX

X X X X

b

= − − = −

= = −∑

=

∑ ∑ ∑ ∑

−∑ ∑2 2

2

1

0 1 1b b bY XY

n

X

n= − = −∑ ∑

Analisis Kuasadua TerkecilAnalisis Kuasadua Terkecil

Page 11: Statistik (Bab 11)

11

Bilangan Katil (X)

Bilangan Pekerja (Y) X2 XY

23 69 529 158729 95 841 275529 102 841 295835 118 1225 413042 126 1764 529246 125 2116 575050 138 2500 690054 178 2916 961264 156 4096 998466 184 4356 1214476 176 5776 1337678 225 6084 17550

ΣX= 592 ΣY= 1692 ΣX2= 3304 ΣXY= 92038

Page 12: Statistik (Bab 11)

12

( )( ) 8566.00

12

)(592)(1692 - 92038

n

YX - XY SS XY =

=

= ∑∑∑

( ) 3838.67

12

(592) - 33044

n

X - X SS

22

2XX ==

= ∑∑

2.232 67.3838

00.8566

SS

SS b

XX

XY1 ===

30.888 12

592 (2.232) -

12

1692

n

X b -

n

Y b 10 =

=

= ∑∑

2.232X 30.888 Y +=

Page 13: Statistik (Bab 11)

13

Graf Garisan RegressiGraf Garisan Regressi

30.888

2.232X 30.888 Y +=

Page 14: Statistik (Bab 11)

14

Analisis ResidualAnalisis Residual

Page 15: Statistik (Bab 11)

15

Bilangan Katil (X)

Bilangan Pekerja (Y)

Nilai Ramalan Residuals

23 69 82.24 -13.2429 95 95.63 -0.6329 102 95.63 6.3735 118 109.02 8.9842 126 124.64 1.3646 125 133.56 -8.5650 138 142.49 -4.4954 178 151.41 26.5964 156 173.73 -17.7366 184 178.19 5.8176 176 200.51 -24.5178 225 204.97 20.03

0.00

Analisis ResidualAnalisis Residual

)Y( )YY( −

=−∑ )YY(

Page 16: Statistik (Bab 11)

16

Geraf Excel Residual Contoh Geraf Excel Residual Contoh Kakitangan Hospital Kakitangan Hospital

-30

-20

-10

0

10

20

30

0 20 40 60 80 100

Bilangan Katil (X)

Res

idu

als

Page 17: Statistik (Bab 11)

17

Plot Residual Tidak LinearPlot Residual Tidak Linear

0 X

Page 18: Statistik (Bab 11)

18

Ralat Varian Tidak Konstant Ralat Varian Tidak Konstant

0 X

0 X

Page 19: Statistik (Bab 11)

19

Ralat Tidak BebasRalat Tidak Bebas

0 X 0 X

Page 20: Statistik (Bab 11)

20

Plot Residual yang BaikPlot Residual yang Baik

0 X

Page 21: Statistik (Bab 11)

21

Ralat Piawai PenganggaranRalat Piawai Penganggaran

Page 22: Statistik (Bab 11)

22

Ralat Piawai PenganggaranRalat Piawai Penganggaran

( )

2

10

2

−=

−−=

=

∑∑∑∑ −

n

SSE

XYY

SSE

S

bbY

YY

e

Jumlah Kuasadua Ralat

Ralat Piawai Penganggaran

Page 23: Statistik (Bab 11)

23

Bilangan Katil (X)

Bilangan Pekerja (Y)

Residual

23 69 -13.24 175.2229 95 -0.63 0.3929 102 6.37 40.6335 118 8.98 80.7342 126 1.36 1.8646 125 -8.56 73.3050 138 -4.49 20.1454 178 26.59 706.8364 156 -17.73 314.3166 184 5.81 33.7476 176 -24.51 600.5878 225 20.03 401.21

2448.94

Menentukan SSEMenentukan SSE

)YY( −

=−== ∑ 2)YY(SSEKuasaduaRalat Jumlah

2)YY( −

Page 24: Statistik (Bab 11)

24

( )94.2448

SSE YY2

=

= ∑ −

Jumlah Ralat Kuasadua

694.15

10

94.2448

2n

SSE Se

=

=

−=

Ralat Piawai Penganggar

Page 25: Statistik (Bab 11)

25

Pengkali PenentuanPengkali Penentuan

Page 26: Statistik (Bab 11)

26

Pengkali PenentuanPengkali Penentuan

( ) ( )

( )

SSn

SS lained iation un lained iation

SS SSR SSE

SSR

SS

SSE

SSSSR

SSSSE

SSSSE

n

YY

YY

YY

YY YY

YY

YY

Y Y YY

r

YY

= = −∑

= += +

= +

=

= −

= −

−∑

−∑ ∑

2 2

2

2

2

2

1

1

1

exp var exp var

0 12≤ ≤r

Page 27: Statistik (Bab 11)

27

88.6% daripada variabiliti bilangan pekerja dihospital boleh diramalkan

oleh bilangan katil yang terdapat dihospital tersebut

SSE = 2448.6

( ) 25164

12

1692 - 260136

n

Y - Y SS

22

2YY === ∑∑

0.886

21564

2448.6 - 1

SS

SSE - 1 r

YY

2

=

=

=

Page 28: Statistik (Bab 11)

28

Ujian Hipotesis untuk Kecerunan Ujian Hipotesis untuk Kecerunan Model RegressiModel Regressi

Page 29: Statistik (Bab 11)

29

Ujian Hipotesis untuk Kecerunan Ujian Hipotesis untuk Kecerunan Model RegressiModel Regressi

( )

2

skan dihipotesi yang k

2

:dimana

1

2

2

11

−=

=

∑−=

−=

=

−=

ndf

ecerunan

nSS

n

SSE

SS

t

XX

S

SS

Sb

XX

e

XX

eb

b

β

βH

H

01

11

0

0

:

:

ββ

=

H

H

01

11

0

0

:

:

ββ

>

H

H

01

11

0

0

:

:

ββ

<

Page 30: Statistik (Bab 11)

30

ContohContoh

Langkah 1: Hipotesis

Ho: β1 = 0

Ha: β1 ≠ 0

Langkah 2: Nilai α

α = 0.01

Langkah 3: Ujian Statistik

( )

2ndfskan dihipotesi yang ecerunank

nSS

2n

SSESS

:dimana

t

1

2

2XX

e

XX

eb

b

11

XX

S

SSS

b

−==

∑−=

−=

=

−=

β∑

β

Page 31: Statistik (Bab 11)

31

Langkah 4: Peraturan Keputusan

Tolak Ho jika nilai t > 2.228 atau t < -2.228

Page 32: Statistik (Bab 11)

32

Langkah 5: Data

2.232X 30.888 Y += Kecerunan sampel ialah b1 = 2.232

Se = 15.65

ΣX = 592 ΣX2 = 33044 n = 12.

Page 33: Statistik (Bab 11)

33

Langkah 5: Nilai Ujian Statistik

( )( )

3838.667 12

592 - 33044

n

X - X SS

2

2

2XX

==

= ∑∑

15.65 10

86.2448

2 -n

SSE S e ===

0.2526 3838.667

15.65

SS

S S

XX

eb ===

8.8361 0.2526

0 - 2.232

S

- b t

b

11 ==β

=

Langkah 6: Kesimpulan

Nilai t yang dikira dari kecerunan sampel adalah lebih besar dari tc =

2.228, maka hipotesis nul dimana kecerunan populasi sifar adalah ditolak. Model regressi linear ini menambah signifikan lebih maklumat ramalan kepada model (bukan regressi).Y

Page 34: Statistik (Bab 11)

34

Ujian Hipotesis untuk Ujian Hipotesis untuk Menguji Keseluruhan Model Menguji Keseluruhan Model

Page 35: Statistik (Bab 11)

35

Keoffisien regressi adalah kecerunan garisan regressi, ujian F bagi signifikan keseluruhan adalah menguji perkara yang

sama sebagaimana ujian t di dalam regressi mudah.

Nilai F adalah dikira secara langsung sebagai

MS

MS

dfSS

df

SS

F err

reg

err

err

reg

reg

=

=

dimana dfreg = k

dferr = n – k – 1, dan

k = bilangan angkubah bebas

Page 36: Statistik (Bab 11)

36

ContohContoh

Langkah 1: Hipotesis

Ho: β1 = 0

Ha: β1 ≠ 0

Langkah 2: Nilai α

α = 0.05

Langkah 3: Ujian Statistik

MS

MS

df

SS

df

SS

F

err

reg

err

err

reg

reg

=

=

Page 37: Statistik (Bab 11)

37

Langkah 4: Peraturan Keputusan

0.025 2

F0.025,1,9 = 6.94

0.144

6.94

1

F

1 F

6.94 F

0.025,1,101,10,975.0

0.025,1,10

=

=

=

=

0.144 F 1,9,975.0 =

Tolak Ho jika F < 6.94 atau F > 0.144

Page 38: Statistik (Bab 11)

38

Langkah 5: Data

ANOVAdf SS MS F Significance F

Regression 1 19115.06 19115.06 78.05 0.00

Residual 10 2448.94 244.89

Page 39: Statistik (Bab 11)

39

78.05 89.244

19115.06

MS

MS

df

SS

df

SS

F

err

reg

err

err

reg

reg

===

=

Langkah 5: Nilai Ujian Statistik

Langkah 6: Kesimpulan

Oleh kerana nilai F > Fc maka kita boleh menolak Ho

Page 40: Statistik (Bab 11)

40

PenganggaranPenganggaran

Page 41: Statistik (Bab 11)

41

Penganggaran TitikPenganggaran Titik

Anggaran peramalan titik boleh dibuat dengan mengambil nilai X yang tertentu, menggantikan nilai X ke dalam persamaan regressi, dan menyelesaikan untuk X. Sebagai contoh, jika bilangan katil yang adalah ialah 100 unit, apakah bilangan kakitangan yang diperlukan? Persamaan regressi bagi contoh ini ialah,

254.088 2.232(100) 30.888 Y

maka 100, Xuntuk

2.232X 30.888 Y

=+=

=

+=

Page 42: Statistik (Bab 11)

42

Selangan Keyakinan untuk Selangan Keyakinan untuk Menganggarkan Min Bersyarat Y: Menganggarkan Min Bersyarat Y: µµ Y|XY|X

( )XX

20

2-n/2, SS

X - X

n

1 Se t Y +± α

( ) ( )

==

=

∑∑∑ n

X - X X - X SS

tertentuX nilai X :dimana

2

22XX

o

Page 43: Statistik (Bab 11)

43

Untuk X0 = 100, maka nilai ialah = 254.088. Selang

keyakinan yang dikira untuk nilai purata Y, E(Y100), ialahY

284.33 )E(Y 223.85

30.240 254.088 667.3838

)33.49100(

12

1.65)(2.228)(15 254.088

100

2

≤≤

±=−+±

Oleh itu, kenyataan boleh dibuat dengan kenyakinan 95% bahawa nilai purata Y untuk X = 100 ialah di antara

223.85 hingga 284.33.

Page 44: Statistik (Bab 11)

44

Selang Peramalan untuk Menganggar Nilai Y Selang Peramalan untuk Menganggar Nilai Y untuk nilai X yang Diberiuntuk nilai X yang Diberi

( )

( )∑

∑−

=

++±−α

n=SS

tertentuX nilai :dimana

SS0

n

11Y

XX

X

XXSt

2

2XX

0

XX

2

e2n,2

Page 45: Statistik (Bab 11)

45

ContohContoh

Selang keyakinan 95% boleh dikira untuk menganggar nilai tunggal Y untuk X = 100.

15.65 S 49.33 X

3838.667 SS 2.228 t

e

XX0.025,10

==

==

( )XX

20

2-n/2, SS

X - X

n

1 1 Se t Y ++± α

46.154 254.088 3838.667

49.33)(100

12

1 1.65)(2.228)(15 254.088

2

±=−++±

207.934 ≤ Y ≤ 300.242

Page 46: Statistik (Bab 11)

46

Ukuran PersatuanUkuran Persatuan

Page 47: Statistik (Bab 11)

47

Pengkali KorelasiPengkali Korelasi

( ) ( )( ) ( )

( ) ( )( ) ( )

( ) ( )

rSSXY

SSX SSY

X X Y Y

XYX Y

n

n n

X X Y Y

XX

YY

=

=− −

=−

−∑

−∑

∑− −∑∑

∑ ∑ ∑

∑ ∑

2 2

2

2

2

2

− ≤ ≤1 1r

Page 48: Statistik (Bab 11)

48

Lima Darjah KorelasiLima Darjah Korelasi

Korelasi negatif yang kuat (r=-0.933)

Korelasi negatif yang sederhana (r=-0.674)

Korelasi positif yang sederhana (r=0.518)

Korelasi positif yang kuat (r=0.909)

Tiada korelasi (r=0)

Page 49: Statistik (Bab 11)

49

Contoh Pengiraan Contoh Pengiraan rr

DayInterest

X

FuturesIndex

Y1 7.43 221 55.205 48,841 1,642.032 7.48 222 55.950 49,284 1,660.563 8.00 226 64.000 51,076 1,808.004 7.75 225 60.063 50,625 1,743.755 7.60 224 57.760 50,176 1,702.406 7.63 223 58.217 49,729 1,701.497 7.68 223 58.982 49,729 1,712.648 7.67 226 58.829 51,076 1,733.429 7.59 226 57.608 51,076 1,715.34

10 8.07 235 65.125 55,225 1,896.4511 8.03 233 64.481 54,289 1,870.9912 8.00 241 64.000 58,081 1,928.00

Summations 92.93 2,725 720.220 619,207 21,115.07

X2 Y2 XY

Page 50: Statistik (Bab 11)

50

Formula Pengiraan r Formula Pengiraan r

( ) ( )

( ) ( )

( ) ( ) ( )

( ) ( ) ( ) ( )

r

XX

YY

XYX Y

n

n n

=−

−∑

−∑

=−

=

∑ ∑ ∑

∑ ∑2

2

2

2

2 2

211150792 93 2725

12

720 2212

619 20712

92 93 2725

815

, ..

. ,.

.

Page 51: Statistik (Bab 11)

51

Plot Plot ““ScatterScatter”” dan Matrik Korelasi dan Matrik Korelasi

220

225

230

235

240

245

7.40 7.60 7.80 8.00 8.20

Interest

Fu

ture

s In

dex

Interest Futures Index

Interest 1

Futures Index 0.815254 1

Page 52: Statistik (Bab 11)

52

KovarianKovarian

( )( )( )( )

XY

X Y

XY

X Y

N

XYX Y

NN

SS

N

2σµ µ

=− −

=−

=

∑ ∑∑

Page 53: Statistik (Bab 11)

53

Matrik Kovarian dan Statistik Matrik Kovarian dan Statistik PerihalanPerihalan

Interest Futures IndexInterest 0.050408Futures Index 1.11053 36.81060606

Interest Futures Index

Mean 7.74416667 Mean 227.08Standard Error 0.06481276 Standard Error 1.7514Median 7.675 Median 225.5Mode 8 Mode 226Standard Deviation 0.224518 Standard Deviation 6.0672Sample Variance 0.05040833 Sample Variance 36.811Kurtosis -1.4077097 Kurtosis 1.2427Skewness 0.3197374 Skewness 1.3988Range 0.64 Range 20Minimum 7.43 Minimum 221Maximum 8.07 Maximum 241Sum 92.93 Sum 2725Count 12 Count 12Confidence Level(95.0%) 0.14265201 Confidence Level(95.0%) 3.8549

Page 54: Statistik (Bab 11)

54