makalah statistik

Upload: zakhrofa-aleiya-amrousi-ii

Post on 01-Mar-2016

27 views

Category:

Documents


0 download

DESCRIPTION

statistika

TRANSCRIPT

STATISTIKKORELASI DAN REGRESI

Disusun Oleh:Fathoni Ahmad3334122566Imay Lukitasari3334120879Mizwar Purnama R3334120929M. Victoryan Nadezul3334120264Rivaldo Ramadhana3334121637 Vanessa Intan Z. N3334120261

FAKULTAS TEKNIKUNIVERSITAS SULTAN AGENG TIRTAYASACILEGON BANTEN2013KATA PENGANTARPuji syukur kehadirat Tuhan Yang Maha Esa kami ucapkan atas pengetahuan dan ilmu yang telah di anugerahkan sehingga tugas Makalah " Korelasi dan Regresi " ini dapat terselesaikan dengan baik.Dalam penyelesaian karya mahasiswa ini, penulis banyak mengalami kesulitan terutama disebabkan akan kurangnya pengetahuan. Namun, berkat bimbingan dari berbagai pihak akhirnya makalah karya mahasiswa ini dapat terselesaikan walaupun masih terdapat kekurangan didalamnya. Karena itu, sepantasnya jika penulis mengucapkan terima kasih kepada semua pihak yang telah membantu dalam proses pengerjaan tugas makalah ini.Dengan selesainya tugas makalah " Korelasi dan Regresi " ini kami mengharapkan akan dapat memberikan pengetahuan tambahan tentang " Korelasi dan Regresi " dimasa yang akan datang, dan juga sebagai bahan referensi bagi mereka yang membutuhkan informasi tentang " Korelasi dan Regresi ".Dan kami sadar bahwa makalah " Korelasi dan Regresi " ini masih jauh dari sempurna. Dan oleh karena itu kami mengharapkan masukan berupa saran dan kritik yang bersifat membangun demi kesempurnaan makalah " Korelasi dan Regresi " ini dimasa yang akan datang.

Cilegon, Desember 2013

Penulis

BAB IKORELASIKorelasimerupakan kuantifikasi atas hubungan suatu variabel. Korelasi tidak menjelaskan hubungan sebab -akibat dan tidak menjelaskan pengaruh variabel bebas (independen) terhadap variabel terikat (dependen). Dalam hal ini akan dibahas Korelasi atau asosiasi (hubungan antara variable-variabel) yang diminati. Di sini akan disoroti dua aspek untuk analisis korelasi, yaitu apakah data sampel yang ada menyediakan bukti cukup bahwa ada kaitan antara variabel-variabel dalam populasi asal sampel. Dan yang kedua, jika ada hubungan, seberapa kuat hubungan antar variabel tersebut. Keeratan hubungan itu dinyatakan dengan nama koefisien korelasi (atau dapat disebut korelasi saja).Dalam SPSS, pembahasan tentang korelasi ditempatkan pada menu CORRELATE, yang mempunyai submenu:

1. BIVARIATEPembahasan mengenai besar hubungan antara dua (bi) variabel.a. KOEFISIEN KORELASI BIVARIATE/PRODUCT MOMENT PEARSONMengukur keeratan hubungan di antara hasil-hasil pengamatan dari populasi yang mempunyai dua varian (bivariate). Perhitungan ini mensyaratkan bahwa populasi asal sampel mempunyai dua varian dan berdistribusi normal. Korelasi Pearson banyak digunakan untuk mengukur korelasi data interval atau rasio.b. KORELASI PERINGKAT SPEARMAN (RANK-SPEARMAN) DAN KENDALLLebih mengukur keeratan hubungan antara peringkat-peringkat dibandingkan hasil pengamatan itu sendiri (seperti pada korelasi Pearson). Perhitungan korelasi ini dapat digunakan untuk menghitung koefisien korelasi pada data ordinal dan penggunaan asosiasi pada statistik non parametrik.c. PARTIALPembahasan mengenai hubungan linier antara dua variabel dengan melakukan kontrol terhadap satu atau lebih variabel tambahan (disebut variabel kontrol).

1. KORELASI BIVARIATEKasus:Ingin diketahui apakah ada korelasi (hubungan) di antara variabel-variabel berikut:jumlah pelanggaran lalu lintas, jumlah kendaraan roda empat (mobil), kendaraan roda dua (sepeda motor), jumlah polisi serta jumlah penduduk. Untuk itu diambil data mengenai variabel-variabel di atas pada sejumlah daerah pada waktu tertentu dengan hasil sebagai berikut.

DaerahTilangMobilMotorPolisi1172495929221825758962315267699694262506306552412771763625*69549719126685478*25769246913*63437101412568229111015970027121216253069Perhatikan ada beberapa data yang diberi tanda *. Hal ini menunjukkan datatersebut missing atau tidak diketahui/tersedia.

2. UJI KORELASI SPEARMAN DAN KENDALLJika uji korelasi bivariat Pearson yang telah dibahas di depan digunakan untuk mengetahui korelasi untuk data kuantitatif (skala interval atau rasio) maka korelasi rank Spearman dan Kendall dapat digunakan untuk pengukuran korelasi pada statistik non parametrik (data dapat original).

2Kasus:Seorang Manajer Personalia ingin mengetahui apakah ada hubungan anta ra Prestasi Kerja seorang dengan tingkat kecerdasan(diukur dengan IQ) dan Motivasi Kerja pekerja yang bersangkutan. Untuk ini, diambil 13 orang Pekerja dan seorang supervisor diminta memberi penilaian pada setiap pekerja tersebut tentang Prestasi Kerja dan Motivasi kerjanya.Berikut adalah hasilnya.PekerjaPrestasiIQMotivasi1861128728710284389928649411293593102856981129078597848899288990102861094112871191102911287928313889485

Prestasi Kerja dan Motivasi Kerja dinilai dalam range 0 (jelek sekali) sampai 100 (baik sekali). Sedang IQ didapat dari test kecerdasan saat pekerja melamar ke perusahaan.

33. KORELASI PARSIAL (PARTIAL CORRELATION)Pembahasan korelasi parsial berhubungan dengan perlunya mempertimbangkan pengaruh atau efek dari variabel lain dalam menghitung korelasi antara dua variabel. Oleh karena itu, dapat dikatakan korelasi parsial mengukur korelasi antar dua variabel dengan mengeluarkan pengaruh dari satu atau beberapa variabel (disebutvariabel kontrol).Sebagai contoh akan diulang kasus pada pembahasan korelasi Spearman dan Kendall, yaitu antara prestasi kerja, motivasi kerja dan tingkat IQ seorang pekerja sebagai berikut:Akan dihitung korelasi parsial antara variabel prestasi dengan motivasi, denganvaraibel kontrol adalah IQ.

4BAB IIREGRESIREGRESI SEDERHANAAnalisis regresi digunakan untuk tujuan peramalan, dimana dalam model tersebut ada sebuah variabel dependen (tergantung) dan variabel independen (bebas). Sebagai contoh ada tiga variabel, yaitu Penjualan, Biaya Promosi Penjualan dan Biaya Iklan. Dalam praktek, akan dibahas bagaimana bagaimana hubungan antara Biaya Promosi Penjualan dan Biaya Iklan terhadap Penjualan. Di sini berarti ada variabel dependen yaitu Penjualan, sedangkan variabel independennya adalah Biaya Promosi Penjualan dan Biaya Iklan. Metode Korelasi akan membahas keeratan hubungan, dalam hal ini keeratan hubungan antara Biaya Promosi Penjualan dan Biaya Iklan terhadap Penjualan. Sedang metode Regresi akan membahas prediksi (peramalan), dalam hal ini apakah Penjualan di masa mendatang dapat diramalkan jika Biaya Promosi Penjualan dan Biaya Iklan diketahui. Regresi sederhana jika hanya ada satu variabel independen.Kasus:PT STEAK dalam beberapa bulan gencar mempromosikan masakan steak dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data mengenai Penjualan dan Biaya promosi yang dikeluarkan di 17 daerah di IndonesiaAkan dilakukan analisis regresi untuk mengetahui hubungan di antara variable Penjualan dengan Biaya Promosi.

REGRESI BERGANDAJika pada regresi sederhana hanya ada satu variabel dependen (Y) dan satu variabel independen (X), maka pada kasus regresi berganda, terdapat satu variable dependen dan lebih dari satu variabel independen. Dalam praktek bisnis, regresi berganda justru lebih banyak digunakan, selain karena banyaknya variabel dalam bisnis yang perlu dianalisis bersama, juga pada banyak kasus regresi berganda lebih relevan digunakan. Dalam banyak kasus yang menggunakan regresi berganda, pada umumnya jumlah variabel dependen berkisar dua sampai empat variabel. Walaupun secara teoritis dapat digunakan banyak variabel bebas, namun penggunaan lebih dari tujuh variabel independen dianggap akan tidak efektif. Sama seperti pada pembahasan regresi sederhana, pembahasan regresi bergandadengan SPSS dapat dilakukan dengan menu REGRESSION. Pembahasan akan memuat dua contoh, pertama adalah dengan dua variabel bebas, dan kemudian dengan banyak variabel bebas. Sedangkan kasus yang ditampilkan tetap sama, yaitu PT STEAK, hanya di sini dilakukan penambahan variabel dan pemasukan input data yang baru.

1. UJI REGRESI BERGANDA DENGAN DUA VARIABEL INDEPENDENKasus:PT STEAK dalam beberapa bulan gencar mempromosikan masakan steak dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data mengenai Penjualan, Biaya promosi dan Luas Outlet yang dikeluarkan di 17 daerah di IndonesiaAkan dilakukan analisis regresi untuk mengetahui hubungan diantara variable Penjualan dengan Biaya Promosi dan Luas Outlet.

2. UJI REGRESI BERGANDA DENGAN BANYAK VARIABEL BEBASPada bagian ini akan ditampilkan uji regresi ganda dengan banyak variabel bebas. Untuk itu, tetap dipakai kasus terdahulu (regresi ganda denan empat variabel), hanya di sini akan ditambah 3 variabel lagi, hingga semua berjumlah tujuh variabel. SPSS menyediakan berbagai metode perhitungan regresi ganda dengan banyak variabel, seperi Backward Elimination, Forward Elimination dan Stepwise Method. Dalam kasus akan dibahas penggunaan ketiga kasus tersebut.Kasus:

6PT STEAK dalam beberapa bulan gencar mempromosikan masakan steak dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data mengenai Penjualan dan Biaya promosi yang dikeluarkan di 17 daerah di IndonesiaSedangkan tambahan ketiga variabel yang baru adalah:a. Laju penduduk suatu Daerah dengan % tiap tahun.b. Jumlah Kompetitor (pesaing), dengan satuan Kompetitor.c. Pendapatan rata-rata penduduk suatu daerah, dengan satuan Juta Rupiah pertahun.

MULTIKOLINEARITASmultikolinearitasadalah kondisi terdapatnya hubungan linier atau korelasi yang tinggi antara masing-masing variabel independen dalam model regresi.Multikolinearitasbiasanya terjadi ketika sebagian besar variabel yang digunakan saling terkait dalam suatu model regresi. Oleh karena itu masalahmultikolinearitastidak terjadi pada regresi linier sederhana yang hanya melibatkan satu variabel independen.Indikasi terdapat masalahmultikolinearitasdapat kita lihat dari kasus-kasus sebagai berikut:1.Nilai R2yang tinggi (signifikan), namun nilai standarerrordan tingkat signifikansi masing-masing variabel sangat rendah.2.Perubahan kecil sekalipun pada data akan menyebabkan perubahan signifikan pada variabel yang diamati.3.Nilai koefisien variabel tidak sesuai dengan hipotesis, misalnya variabel yang seharusnya memiliki pengaruh positif (nilai koefisien positif), ditunjukkan dengan nilai negatif.

7Memang belum ada kriteria yang jelas dalam mendeteksi masalahmultikolinearitasdalammodel regresi linier. Selain itu hubungan korelasi yang tinggi belum tentu berimplikasi terhadap masalahmultikolinearitas. Tetapi kita dapat melihat indikasi multikolinearitas dengantolerance value(TOL),eigenvalue, dan yang paling umum digunakan adalahvarians inflation factor(VIF).Pengertian lain, Multikolinearitas adalahadanya hubungan linier yang sempurna/ pasti diantara beberapa/ semua variabel yang menjelaskan dari model regresi.Contohmultikolinearitas misalnya:Y=a+b1X1+b2X2+eY=konsumsi, X1=pendapatan dan X2=kekayaan. Semakin besar pendapatan, maka kekayaan juga semakin besar/meningkat (mempunyai kolinearitas yang tinggi). Oleh karena itu, terjadi multikolinearitas.Penyebab multikolinearitasdalam model regresi, antara lain:1. Kesalahan teoritis dalam pembentukan model fungsi regresi yang dipergunakan/ memasukkan variabel bebas yang hampir sama, bahkan sama.2. Terlampau kecilnya jumlah pengamatan yang akan dianalisis dengan model regresi.Ternyata multikolinearitas juga mempunyaikonsekuensiatau efek di dalam model regresi, antara lain1. Walaupun koefisien regresi dari variabel X dapat ditentukan (determinate), tetapi kesalahan standarnya akan cenderung semakin besar dengan meningkatnya tingkat korelasi antara peningkatan variabel bebas.2. Karena besarnya kesalahan standar, selang keyakinan untuk parameter populasi yang relevan cenderung untuk lebih besar.3. Dalam kasus multikolinearitas yang tinggi, data sampel mungkin sesuai dengan sekelompok hipotesis yang berbeda-beda. Jadi probabilitas untuk menerima hipotesis yang salah akan meningkat.4. Selama multikolinearitas tidak sempurna, penaksiran koefisien regresi adalah mungkin tetapi taksiran dan kesalahan standarnya menjadi sangat sensitif terhadap perubahan dalam data.5. Jika multikolinearitas tinggi, seseorang mungkin memperoleh R2yang tinggi, tetapi tidak satu pun atau sangat sedikit koefisien yang ditaksir yang penting secara statistik.

8 Cara mendeteksi MultikolinearitasAda beberapa metode deteksi multikolinearitas, antara lain:1. Kolinearitas seringkali diduga jika R2cukup tinggi (antara 0,7-1) dan jika koefisien korelasi sederhana (korelasi derajat nol) juga tinggi, tetapi tak satu pun/ sedikit sekali koefisien regresi parsial yang signifikan secara individu. Di pihak lain, uji F menolak H0yang mengatakan bahwa secara stimulan seluruh koefisien regresi parsialnya adalah nol.2. Meskipun korelasi derajat nol yang tinggi mungkin mengusulkan kolinearitas, tidak perlu bahwa mereka tinggi berarti mempunyai kolinearitas dalam kasus spesifik. Untuk meletakkan persoalan agar secara teknik, korelasi derajat nol yang tinggi merupakan kondisi yang cukup tapi tidak perlau adanya kolinearitas karena hal ini dapat terjadi meskipun melalui korelasi derajat nol atau sederhana relaif rendah.

9LAMPIRANOperasi menggunakan SPSS SAMPEL DATA

a) Analisa Regresi dan Korelasi secara software SPSS Korelasi pearson

Dari tabel diperoleh korelasi menurut pearson antara X dan Y adalah 0.229, ini berarti hubungan korelasi lemah

Korelasi partial

Korelasi ganda

Regresi Sederhana

Koefisien determinasi merupakan cara mengukur kemampuan model dalam variasi variabel, dari tabel koefisien variabel yaitu 0.229 artinya 22.9%.

11 Uji Anova

Dari uji ANOVA nilai F yang didapat F yaitu 0.442 dengan probalitas 0.525, karena nilai sig > 0.05 maka regresi tidak dapat digunakan untuk memprediksi nilai SKS atau variabel IPK tidak dapat menerangkan variabel SKS Koefisien

Pada uji statistik T dapat diperoleh suatu kesimpulan bahwa koefisien SKS memiliki nilai sig pada 0.003 yang menunjukkan variabel SKS mampu menjelaskan nilai IPKY = 3,043 + 0,31X

12 Grafik Regresi Sederhana

Semakin kecil nilai SEE maka bulatan akan semakin mendekati garis lurus dan model regresi semakin tepat dalam memprediksi variabel tetap

Regresi Ganda

b) Analisa Regresi dan Korelasi Secara Perhitungan Manual 13Sampel Data secara perhitungan manual

Perhitungan Regresi sederhana secara manual B

=

= 0,03

A =

=

= 3,055

Maka persamaan regresi sederhana, yaitu : y = 3,055 + 0,03 x

Perhitungan Regresi dan Kolerasi Ganda secara manual

14Nilai b1,b2 didapatkan dari eliminasi persamaan :- Y = an + b1 X1 + b2 X2 X1Y = a X1 + b1 X12 + b2 X1X2 X2Y = a X2 + b1 X1X2 + b2 X22Dengan b1 = 0,025b2 = 0,0082Maka Hasil dari perhitungan :

= 0,348 (hasil sesuai dengan SPSS)

Perhitungan Korelasi Pearson secara manual

= 0,2289= 0,229

Jadi nilai korelasi pearson secara manual dan secara SPSS adalah sama

152