bab 2 landasan teori 2.1 teori umum 2.1.1 regresi...

8
BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi Logistik Analisis Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan variabel-variabel yang lain. Variabel “penyebab” disebut dengan bermacam-macam istilah, di antaranya seperti variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel “terkena akibat” dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak. Analisis Regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini. Adapun Regresi Logistik (kadang disebut model logistik atau model logit) merupakan salah satu bagian dari Analisis Regresi, yang digunakan untuk memprediksi probabilitas kejadian suatu peristiwa, dengan mencocokkan data pada fungsi logit kurva logistik. Metode ini merupakan model linear umum yang digunakan untuk regresi

Upload: lamque

Post on 06-Feb-2018

222 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

BAB 2

LANDASAN TEORI

2.1 Teori Umum

2.1.1 Regresi Logistik

Analisis Regresi dalam statistika adalah salah satu metode untuk

menentukan hubungan sebab-akibat antara satu variabel dengan

variabel-variabel yang lain. Variabel “penyebab” disebut dengan

bermacam-macam istilah, di antaranya seperti variabel penjelas,

variabel eksplanatorik, variabel independen, atau secara bebas,

variabel X (karena seringkali digambarkan dalam grafik sebagai

absis, atau sumbu X). Variabel “terkena akibat” dikenal sebagai

variabel yang dipengaruhi, variabel dependen, variabel terikat, atau

variabel Y. Kedua variabel ini dapat merupakan variabel acak

(random), namun variabel yang dipengaruhi harus selalu variabel

acak. Analisis Regresi adalah salah satu analisis yang paling populer

dan luas pemakaiannya. Hampir semua bidang ilmu yang

memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis

ini.

Adapun Regresi Logistik (kadang disebut model logistik atau

model logit) merupakan salah satu bagian dari Analisis Regresi, yang

digunakan untuk memprediksi probabilitas kejadian suatu peristiwa,

dengan mencocokkan data pada fungsi logit kurva logistik. Metode

ini merupakan model linear umum yang digunakan untuk regresi

Page 2: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

binomial. Seperti analisis regresi pada umumnya, metode ini

menggunakan beberapa variabel bebas, baik numerik maupun

kategori. Misalnya, probabilitas bahwa orang yang menderita

serangan jantung pada waktu tertentu dapat diprediksi dari informasi

usia, jenis kelamin, dan indeks massa tubuh. Regresi Logistik juga

digunakan secara luas pada bidang kedokteran, ilmu sosial, dan

bahkan pada bidang pemasaran, seperti prediksi kecenderungan

pelanggan untuk membeli suatu produk atau berhenti berlangganan.

Regresi Logistik tidak memerlukan asumsi normalitas,

heteroskedastisitas, dan autokorelasi, dikarenakan variabel terikat

yang terdapat pada Regresi Logistik merupakan variabel dummy (0

dan 1), sehingga residualnya, tidak memerlukan ketiga pengujian

tersebut. Untuk asumsi multikolinearitas, karena hanya melibatkan

variabel-variabel bebas, maka masih perlu untuk dilakukan

pengujian. Untuk pengujian multikolinearitas ini dapat digunakan uji

kebaikan suai (goodness of fit test), yang kemudian dilanjutkan

dengan pengujian hipotesis (uji 2χ ), guna melihat variabel-variabel

bebas mana saja yang signifikan, sehingga dapat tetap digunakan

dalam penelitian. Selanjutnya, di antara variabel-variabel bebas yang

signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak

terdapat variabel-variabel bebas yang saling memiliki korelasi yang

tinggi, maka dapat disimpulkan bahwa tidak terdapat gangguan

multikolinearitas pada model penelitian (David W. Hosmer, 2011).

Page 3: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

Persamaan logit bagi Regresi Logistik :

0 1 1 2 2 3 3( )g x x x xβ β β β= + + + (2.1)

Persamaan untuk menentukan nilai peluang dari persamaan logit :

(2.2)

Keterangan :

• ( )xπ adalah peluang memperoleh pekerjaan bagi seorang

mahasiswa lulusan baru, jika diketahui IPK, jenis kelamin,

dan usianya.

• ( )g x adalah nilai estimasi logit.

• β0, β1, β2, dan β3 berturut-turut adalah nilai koefisien untuk

variabel-variabel konstan, IPK, jenis kelamin, dan usia, yang

diperoleh menggunakan metode Maximum Likelihood

Estimation.

Statistik W untuk uji signifikansi parameter Regresi Logistik :

(2.3)

Wilayah kritis :

(2.4)

Keterangan :

• βi adalah nilai koefisien regresi logistik untuk variabel

ke-i.

• SEi adalah nilai standard error untuk variabel ke-i.

( )

( )( )1

g x

g x

exe

π =+

ii

i

WSEβ

=

2,i kW αχ>

Page 4: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

• k adalah banyaknya variabel bebas yang digunakan.

• α adalah taraf nyata.

Rumus untuk menentukan odds ratio :

1 1

2 2

(1 )(1 )

p pp p

−−

(2.5)

Keterangan :

• p1 adalah peluang kejadian pada kelompok pertama.

• p2 adalah peluang kejadian pada kelompok ke-2.

2.1.2 Bahasa R

R adalah bahasa pemrograman dan perangkat lunak untuk analisis

statistika dan grafik. R dibuat oleh Ross Ihaka dan Robert Gentleman

di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh

R Development Core Team. Bahasa R kini menjadi standar de facto

di antara statistikawan untuk pengembangan perangkat lunak

statistika, serta digunakan secara luas untuk pengembangan

perangkat lunak statistika dan analisis data. R merupakan bagian dari

proyek GNU. Kode sumbernya tersedia secara bebas di bawah lisensi

publik umum GNU, dan versi biner prekompilasinya tersedia untuk

berbagai sistem operasi. R menggunakan antarmuka baris perintah,

meski beberapa antarmuka pengguna grafik juga tersedia. R

menyediakan berbagai teknik statistika (pemodelan linear dan

nonlinear, uji statistik klasik, analisis deret waktu, klasifikasi,

klasterisasi, dan sebagainya) serta grafik (Ross Ihaka, 1993). Berikut

Page 5: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

merupakan contoh sintaks untuk memperoleh nilai-nilai koefisien

regresi logistik dengan menggunakan Bahasa R :

Logit <- glm(Y~X1+X2+X3, family = binomial

(link="logit"))

summary(logit)

Keterangan :

• logit merupakan variabel yang digunakan untuk menampung

hasil perhitungan.

• glm merupakan singkatan dari Generalized Linear Models,

yaitu sintaks yang digunakan untuk memperoleh model linear

yang tergeneralisasi.

summary merupakan sintaks yang digunakan untuk

menampilkan nilai-nilai dari koefisien yang telah

diperoleh.

2.1.3 Bahasa C

Bahasa pemrograman C merupakan salah satu bahasa

pemrograman komputer. Dibuat pada tahun 1972 oleh Dennis Ritchie

untuk sistem operasi Unix di Bell Telephone Laboratories. Meskipun

C dibuat untuk memprogram sistem dan jaringan komputer, namun

bahasa ini juga sering digunakan dalam mengembangkan software

aplikasi. C juga banyak dipakai oleh berbagai jenis platform sistem

operasi dan arsitektur komputer. C secara luar biasa telah

Page 6: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

mempengaruhi bahasa-bahasa populer lainnya, terutama C++ yang

merupakan ekstensi dari C (Agung Sudrajat Supriatna, 2008).

Adapun Visual C++ adalah sebuah produk Integrated Development

Environment (IDE) untuk bahasa pemrograman C dan C++, yang

dikembangkan oleh Microsoft. Visual C++ merupakan salah satu

bagian dari paket Microsoft Visual Studio. Dengan menggunakan

Visual C++, pengguna dimungkinkan untuk merancang berbagai

jenis program aplikasi, seperti dalam bentuk form atau console.

Berikut merupakan contoh penggalan sintaks sederhana Bahasa C

untuk menampilkan tulisan “Hello World”.

printf(“Hello World”);

2.2 Teori Pendukung

2.2.1 Peluang

Peluang atau kebolehjadian atau dikenal juga sebagai probabilitas

adalah cara untuk mengungkapkan pengetahuan atau kepercayaan

bahwa suatu kejadian akan berlaku atau telah terjadi. Konsep ini

telah dirumuskan dengan lebih ketat dalam matematika, dan

kemudian digunakan secara lebih luas, tidak hanya dalam

matematika atau statistika, tetapi juga keuangan, sains, dan filsafat

(Sheldon Ross, 2009).

Page 7: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

2.2.2 Sarjana

Sarjana (dari bahasa Sansekerta) adalah gelar akademik yang

diberikan kepada lulusan program pendidikan sarjana (S-1). Untuk

mendapatkan gelar sarjana, secara normatif dibutuhkan waktu selama

4 (empat) sampai 6 (enam) tahun, tetapi ada juga yang

menyelesaikannya dalam 2 (dua) tahun ataupun lebih dari 6 (enam)

tahun. Hal tersebut tergantung dari kebijakan dari perguruan tinggi

yang bersangkutan. Karya ilmiah yang diwajibkan dan merupakan

persyaratan untuk memperolah gelar sarjana dinamakan dengan

skripsi. Para sarjana adalah lulusan akademi atau perguruan tinggi,

yang menempuh jenjang studi berdasarkan spesifikasi jurusannya

masing-masing (Irvan Andi Wiranata, 2009).

2.2.3 Pekerjaan

Pekerjaan dalam arti luas adalah aktivitas utama yang

dilakukan oleh manusia. Dalam arti sempit, istilah pekerjaan

digunakan untuk suatu tugas atau kegiatan yang menghasilkan uang

bagi seseorang. Dalam pembicaraan sehari-hari, istilah ini sering

dianggap sinonim dengan profesi (Cookey Pratama, 2009).

Page 8: BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Regresi …library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00563-STIF Bab 2.pdf · 2.1.1 Regresi Logistik ... nonlinear, uji statistik

2.3 Kerangka Pemikiran

Gambar 2.1 Kerangka Pemikiran

Sesuai dengan yang ditunjukkan oleh Gambar 2.1, terdapat tiga buah

input pada penelitian ini, yaitu IPK, jenis kelamin, dan usia dari mahasiswa

lulusan baru. Ketiga input tersebut kemudian akan diproses sedemikian rupa

menggunakan Regresi Logistik, sehingga akan menghasilkan sebuah nilai, yang

merupakan besaran peluang bagi seorang mahasiswa lulusan baru untuk dapat

memperoleh pekerjaan.