statistika - analisis regresi dan korelasi
TRANSCRIPT
ANALISIS REGRESI DAN KORELASI
I KETUT GORDE YASE MASLABORATORIUM BIOMETRIKA
FAKULTAS PETERNAKAN UNIV. DIPONEGORO
PENDAHULUANHasil suatu penelitian yang datanya terdiri
dari dua atau lebih variabel, perlu dicari untuk mengetahui ba-gaimana hubungan antara variabel-variabel tersebut.
Pada analisis regresi dibedakan dua jenis variabel, yak-ni variabel bebas (independent variable) dan variabel tak bebas (dependent variable) atau variabel respons. Penentuan variabel tsb. tidak mudah dilakukan, perlu studi yg cermat, diskusi yg seksama, kewajaran masa-lah yg dihadapi dan pengalaman. Variabel yg mudah di dapat atau tersedia sering digolongkan kedalam varia-bel bebas. Umumnya var. bebas dinyatakan dengan Xi [X1, X2, X3, ..., Xk (k ≥ 1)] dan var. tak bebas dinyatakan dengan Y
Pengertian Regresi, Regresi Linear sederhana dan Regresi Linear Berganda serta Bentuk-bentuk yang lain
Regresi adl teknik statistika untuk memodelkan hubu-ngan antara var.respons (yg dipengaruhi) dan var.pre-dictor (yg mempengaruhi).
Regresi Linear Sederhana
Regresi Linear Berganda
Regresi Linear yg lain
Catatan : βi=parameter regresi
XY 10
kk XXXXY ...3322110
2233
222
2110 ... kk XXXXY
Hubungan Fungsional antar VariabelDalam analisis statistika kesimpulan selalu
dibuat ter-hadap populasi. Dalam analisis regresi hubungan fung sional yang diperoleh berdasarkan sampel, diharapkan berlaku terhadap populasi.
Hubungan fungsional ini dinyatakan dalam persama-an matematis, dimana untuk populasi adl. sbb. :
untuk model regresi linier sederhana,
dinyatakan sbb.
dan berdasarkan sampelnya dinyatakan sbb.
),...,,,...,,( 2121 mkXXXfY
XY 21
bXaY ^
Metode Tangan Bebas (Free Hand Method)Metode ini adalah metode kira-kira
berdasarkan dia-gram pencar dalam menentukan bentuk hubungan antara variabel bebas dan tak bebas
0.5 1 1.5 2 2.5 3 3.50
1
2
3
4
5
6
Hubungan antara Variabel X dan Y
Y-Values
Metode Kuadrat Terkecil : Regresi LinierMetode ini digunakan karena metode tangan
bebas tidak meyakinkan dalam menentukan bentuk hubung an antara var. yg diamati.
Rumus (1) :
dan
Jika terlebih dahulu dihitung koefisien b , maka koe-fisien a dapat ditentukan atas formulasi :
22
2
)())(())((
XXnXYXXY
a
22 )(
))((XXn
YXXYnb
XbYa
Contoh :
Berikut adalah data yg menggambarkan hasil pengama tan mengenai jumlah orang yg datang (X) dan jumlah orang yg berbelanja (Y) selama 30 hari.Pengunjung
(Xi)Berbelanja
(Yi)Pengunjung
(Xi)Berbelanja
(Yi)
343834403040403435393332424042
323631382935333032363131363736
424132343637363739403334363738
383730303033323435363232343234
Satuan2 yg dibutuhkan agar rumus dapat digunakanN0. Xi Yi XiYi Xi² N0. Xi Yi XiYi Xi²
123456789101112131415
343834403040403435393332424042
323631382935333032363131363736
1088136810541520870140013201020112014041023992151214801470
11561444115616009001600160011561225152110891024176416001764
161718192021222324252627282930
424132343637363739403334363738
383730303033323435363232343234
15961517960102010801221115212581365144010561088122411841292
176416811024115612961369129613691521160010891156129613691444
Setelah dijumlahkan, diperoleh :∑X = 1105 ; ∑Y = 1001 ; ∑XY = 37094 dan ∑X² = 41029Dari rumus (1) diperoleh harga-harga a dan b ;
sbb. :
dengan demikian persamaan regresi linier Y atas X :
Koef.regresi b dinamakan koefisien arah d/p pers.re-gresi linier dan menyatakan perubahan rata2 var (Y) utk setiap perubahan var (X) sebesar satu unit.
68,0)1105()41029(30)1001)(1105()37094(30
24,8)1105()41029(30
)37094)(1105()41029)(1001(
2
2
b
a
XY 68,024,8^
LanjutanPerubahan Y merupakan pertambahan jika b bertanda
positip dan penurunan atau pengurangan jika bertanda negatif. Utk contoh diatas b=0,68 bertanda + ; sehingga dapat dikatakan bahwa jika X (pengunjung) bertambah dengan seorang, maka rata-rata pembeli (Y) bertambah dengan 0,68 orang.
Regresi yg didapat digunakan utk keperluan ramalan jika harga variabel bebas diketahui. Mis jika X=30, maka dengan memasukkan kedalam pers.regresi diatas, dipe roleh Ŷ = 8,24 + 0,68(30) = 28,6 ; artinya rata-rata ada 28,6 orang pembeli utk setiap 30 orang pengunjung.
Jika harga X yg dimasukkan kedalam pers, terletak di-dalam daerah X, prosesnya disebut interpolasi dan jika diluar daerah pengamatan X disebut ekstrapolasi.
Berbagai Variansi dalam Regresi LinierVariansi utk kekeliruan standard dari pada
taksiran
atau
dimana : sY² dan sX² adl. masing2 utk variansi variabel
Y dan X Variansi untuk koefisien regresi b
Variansi untuk koefisien regresi a
)(21
)2/()(
2222.
2^
22.
XYXY
XY
sbsnns
nYYss
22.
2 )(/ XXss XYb
})(
1{ 2
22.
2
XXX
nss XYa
ContohUntuk contoh pada slide 7 diatas : n = 30 dan koef. b = 0,68, dimana nilai2 :
maka dengan yg dimuat dalam file 10, diperoleh :
dan
variansi ramalan rata-rata Y utk X yg diketahui ; variansi ra malan individu Y utk X yg diketahui, dapat dilihat pada bu- ku Metode Statistika (Sudjana, 1975)
2,328)(.....86,6..,32,11..,8,36 222 XXdanssX YX
688,1)}32,11()68,0(86,6{230130 22
.
XYs
0214,7}2,328)8,36(
301{688,1
0051,02,328/688,12
2
2
a
b
s
s
INTERVAL KONFIDENSI SEHUBUNGAN DENGAN REGRESI LINEAR
Jika koef.konfidensi diambil α, maka interval taksiran untuk θ1, ditentukan oleh :
Sejalan dengan hal tsb, maka interval taksiran untuk θ2, ditentukan oleh :
Selesaikan mencari interval konfidensi tsb. dengan da-ta yang ada di file sebelumnya.
stasta a 2/)1(12/)1(
bb sbstb 2/)1(22/)1(
TEST HIPOTESIS SEHUBUNGAN REGRESI LINIERAda dua metode test hipotesis sehubungan
regresi lini er, yakni : (1).Test indefendensi (Y) terhadap (X) ; dengan
t-test de ngan rumus : t-test = (b – θ20)/sb Perumusan hipotesis : H0 : θ2 = θ20 dan H1 : θ2 ≠ θ20 atau : H1 : θ2 < θ20 atau
H1 : θ2 > θ20 Contoh :
Analisa Korelasi
Pendahuluan :Untuk data hasil pengamatan yang terdiri
dari banyak variabel, perlu diketahui berapa kuat hubungan antar variabel tsb. terjadi. Dengan kata lain perlu ditentukan derajat hubungan atau derajat asosiasi antar varia-bel.
Studi yang membahas tentang derajat hu-bungan antar variabel tsb dikenal dengan nama analisa korelasi dan ukuran yang dipakai untuk mengetahui derajat hubungan tsb, terutama untuk data kuanti tatip, dinamakan koefisien korelasi
Korelasi dalam Regresi LinearJika garis regresi yang terbaik untuk
sekumpulan data berbentuk linear, maka derajat hubungannya dinyata-kan dengan ( r ) dan disebut koefisien korelasi dan di-rumuskan sebagai berikut :
Pangkat kuadrat dari koefisien korelasi (r²) disebut ko efisien determinasi atau koeffisien penentuan, karena 100 r² % dari pada variasi yang terjadi dalam varianel Y dapat dijelaskan oleh karena adanya regresi linear Y atas X
2
22
)()()(
YYYYYY
r
Lanjutan ...Bentuk lain dari rumus ( r ) :
atau :
dimana kekeliruan standar taksiran dihitung atas dasar formulasi berikut.
atau
})(}{)({
))((2222 YYnXXn
YXXYnr
2
2.1Y
XY
SS
r
)2/()( 22.
nYYS XY )()2()1( 2222
. XYXY SbSnnS
Contoh :Perhatikan data yang termuat dalam slide 7.
didapat harga-harga : ∑X = 1.105 ; ∑Y = 1.001 ; ∑XY = 37.094 ; ∑X² = 41.029 ; ∑Y² = 33.599 dan n = 30. Dari contoh tsb. nilai koefisien korelasi ( r ) :
Dari hasil ini didapat korelasi positip antara banyak pengunjung (X ) dan yang berbelanja (Y). Berarti me-ningkatnya jumlah yang datang meningkat juga orang yang belanja. Nilai r² = (0,8758)² = 0,7670 atau 76,70% Ini berarti meningkatnya atau menurunnya jumlah pembeli 76,7% dapat dijelaskan oleh hubungan linear Y = 8,24 +0,68X
8758,0)1001()33599(30}{)1105()41029(30{
)1001)(1105()37094(3022
r