bab 2 landasan teori 2.1 teori umum 2.1.1 regresi...
TRANSCRIPT
BAB 2
LANDASAN TEORI
2.1 Teori Umum
2.1.1 Regresi Logistik
Analisis Regresi dalam statistika adalah salah satu metode untuk
menentukan hubungan sebab-akibat antara satu variabel dengan
variabel-variabel yang lain. Variabel “penyebab” disebut dengan
bermacam-macam istilah, di antaranya seperti variabel penjelas,
variabel eksplanatorik, variabel independen, atau secara bebas,
variabel X (karena seringkali digambarkan dalam grafik sebagai
absis, atau sumbu X). Variabel “terkena akibat” dikenal sebagai
variabel yang dipengaruhi, variabel dependen, variabel terikat, atau
variabel Y. Kedua variabel ini dapat merupakan variabel acak
(random), namun variabel yang dipengaruhi harus selalu variabel
acak. Analisis Regresi adalah salah satu analisis yang paling populer
dan luas pemakaiannya. Hampir semua bidang ilmu yang
memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis
ini.
Adapun Regresi Logistik (kadang disebut model logistik atau
model logit) merupakan salah satu bagian dari Analisis Regresi, yang
digunakan untuk memprediksi probabilitas kejadian suatu peristiwa,
dengan mencocokkan data pada fungsi logit kurva logistik. Metode
ini merupakan model linear umum yang digunakan untuk regresi
binomial. Seperti analisis regresi pada umumnya, metode ini
menggunakan beberapa variabel bebas, baik numerik maupun
kategori. Misalnya, probabilitas bahwa orang yang menderita
serangan jantung pada waktu tertentu dapat diprediksi dari informasi
usia, jenis kelamin, dan indeks massa tubuh. Regresi Logistik juga
digunakan secara luas pada bidang kedokteran, ilmu sosial, dan
bahkan pada bidang pemasaran, seperti prediksi kecenderungan
pelanggan untuk membeli suatu produk atau berhenti berlangganan.
Regresi Logistik tidak memerlukan asumsi normalitas,
heteroskedastisitas, dan autokorelasi, dikarenakan variabel terikat
yang terdapat pada Regresi Logistik merupakan variabel dummy (0
dan 1), sehingga residualnya, tidak memerlukan ketiga pengujian
tersebut. Untuk asumsi multikolinearitas, karena hanya melibatkan
variabel-variabel bebas, maka masih perlu untuk dilakukan
pengujian. Untuk pengujian multikolinearitas ini dapat digunakan uji
kebaikan suai (goodness of fit test), yang kemudian dilanjutkan
dengan pengujian hipotesis (uji 2χ ), guna melihat variabel-variabel
bebas mana saja yang signifikan, sehingga dapat tetap digunakan
dalam penelitian. Selanjutnya, di antara variabel-variabel bebas yang
signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak
terdapat variabel-variabel bebas yang saling memiliki korelasi yang
tinggi, maka dapat disimpulkan bahwa tidak terdapat gangguan
multikolinearitas pada model penelitian (David W. Hosmer, 2011).
Persamaan logit bagi Regresi Logistik :
0 1 1 2 2 3 3( )g x x x xβ β β β= + + + (2.1)
Persamaan untuk menentukan nilai peluang dari persamaan logit :
(2.2)
Keterangan :
• ( )xπ adalah peluang memperoleh pekerjaan bagi seorang
mahasiswa lulusan baru, jika diketahui IPK, jenis kelamin,
dan usianya.
• ( )g x adalah nilai estimasi logit.
• β0, β1, β2, dan β3 berturut-turut adalah nilai koefisien untuk
variabel-variabel konstan, IPK, jenis kelamin, dan usia, yang
diperoleh menggunakan metode Maximum Likelihood
Estimation.
Statistik W untuk uji signifikansi parameter Regresi Logistik :
(2.3)
Wilayah kritis :
(2.4)
Keterangan :
• βi adalah nilai koefisien regresi logistik untuk variabel
ke-i.
• SEi adalah nilai standard error untuk variabel ke-i.
( )
( )( )1
g x
g x
exe
π =+
ii
i
WSEβ
=
2,i kW αχ>
• k adalah banyaknya variabel bebas yang digunakan.
• α adalah taraf nyata.
Rumus untuk menentukan odds ratio :
1 1
2 2
(1 )(1 )
p pp p
−−
(2.5)
Keterangan :
• p1 adalah peluang kejadian pada kelompok pertama.
• p2 adalah peluang kejadian pada kelompok ke-2.
2.1.2 Bahasa R
R adalah bahasa pemrograman dan perangkat lunak untuk analisis
statistika dan grafik. R dibuat oleh Ross Ihaka dan Robert Gentleman
di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh
R Development Core Team. Bahasa R kini menjadi standar de facto
di antara statistikawan untuk pengembangan perangkat lunak
statistika, serta digunakan secara luas untuk pengembangan
perangkat lunak statistika dan analisis data. R merupakan bagian dari
proyek GNU. Kode sumbernya tersedia secara bebas di bawah lisensi
publik umum GNU, dan versi biner prekompilasinya tersedia untuk
berbagai sistem operasi. R menggunakan antarmuka baris perintah,
meski beberapa antarmuka pengguna grafik juga tersedia. R
menyediakan berbagai teknik statistika (pemodelan linear dan
nonlinear, uji statistik klasik, analisis deret waktu, klasifikasi,
klasterisasi, dan sebagainya) serta grafik (Ross Ihaka, 1993). Berikut
merupakan contoh sintaks untuk memperoleh nilai-nilai koefisien
regresi logistik dengan menggunakan Bahasa R :
Logit <- glm(Y~X1+X2+X3, family = binomial
(link="logit"))
summary(logit)
Keterangan :
• logit merupakan variabel yang digunakan untuk menampung
hasil perhitungan.
• glm merupakan singkatan dari Generalized Linear Models,
yaitu sintaks yang digunakan untuk memperoleh model linear
yang tergeneralisasi.
summary merupakan sintaks yang digunakan untuk
menampilkan nilai-nilai dari koefisien yang telah
diperoleh.
2.1.3 Bahasa C
Bahasa pemrograman C merupakan salah satu bahasa
pemrograman komputer. Dibuat pada tahun 1972 oleh Dennis Ritchie
untuk sistem operasi Unix di Bell Telephone Laboratories. Meskipun
C dibuat untuk memprogram sistem dan jaringan komputer, namun
bahasa ini juga sering digunakan dalam mengembangkan software
aplikasi. C juga banyak dipakai oleh berbagai jenis platform sistem
operasi dan arsitektur komputer. C secara luar biasa telah
mempengaruhi bahasa-bahasa populer lainnya, terutama C++ yang
merupakan ekstensi dari C (Agung Sudrajat Supriatna, 2008).
Adapun Visual C++ adalah sebuah produk Integrated Development
Environment (IDE) untuk bahasa pemrograman C dan C++, yang
dikembangkan oleh Microsoft. Visual C++ merupakan salah satu
bagian dari paket Microsoft Visual Studio. Dengan menggunakan
Visual C++, pengguna dimungkinkan untuk merancang berbagai
jenis program aplikasi, seperti dalam bentuk form atau console.
Berikut merupakan contoh penggalan sintaks sederhana Bahasa C
untuk menampilkan tulisan “Hello World”.
printf(“Hello World”);
2.2 Teori Pendukung
2.2.1 Peluang
Peluang atau kebolehjadian atau dikenal juga sebagai probabilitas
adalah cara untuk mengungkapkan pengetahuan atau kepercayaan
bahwa suatu kejadian akan berlaku atau telah terjadi. Konsep ini
telah dirumuskan dengan lebih ketat dalam matematika, dan
kemudian digunakan secara lebih luas, tidak hanya dalam
matematika atau statistika, tetapi juga keuangan, sains, dan filsafat
(Sheldon Ross, 2009).
2.2.2 Sarjana
Sarjana (dari bahasa Sansekerta) adalah gelar akademik yang
diberikan kepada lulusan program pendidikan sarjana (S-1). Untuk
mendapatkan gelar sarjana, secara normatif dibutuhkan waktu selama
4 (empat) sampai 6 (enam) tahun, tetapi ada juga yang
menyelesaikannya dalam 2 (dua) tahun ataupun lebih dari 6 (enam)
tahun. Hal tersebut tergantung dari kebijakan dari perguruan tinggi
yang bersangkutan. Karya ilmiah yang diwajibkan dan merupakan
persyaratan untuk memperolah gelar sarjana dinamakan dengan
skripsi. Para sarjana adalah lulusan akademi atau perguruan tinggi,
yang menempuh jenjang studi berdasarkan spesifikasi jurusannya
masing-masing (Irvan Andi Wiranata, 2009).
2.2.3 Pekerjaan
Pekerjaan dalam arti luas adalah aktivitas utama yang
dilakukan oleh manusia. Dalam arti sempit, istilah pekerjaan
digunakan untuk suatu tugas atau kegiatan yang menghasilkan uang
bagi seseorang. Dalam pembicaraan sehari-hari, istilah ini sering
dianggap sinonim dengan profesi (Cookey Pratama, 2009).
2.3 Kerangka Pemikiran
Gambar 2.1 Kerangka Pemikiran
Sesuai dengan yang ditunjukkan oleh Gambar 2.1, terdapat tiga buah
input pada penelitian ini, yaitu IPK, jenis kelamin, dan usia dari mahasiswa
lulusan baru. Ketiga input tersebut kemudian akan diproses sedemikian rupa
menggunakan Regresi Logistik, sehingga akan menghasilkan sebuah nilai, yang
merupakan besaran peluang bagi seorang mahasiswa lulusan baru untuk dapat
memperoleh pekerjaan.