pelatihan komputasi dengan stata · pdf file3 analisis deskriptif 15 ... cross section....

31
Pelatihan Komputasi dengan Stata Benedict J. Yappy 1 Departemen Ilmu Ekonomi Universitas Indonesia 1 [email protected] penyusun. 1 Pendahuluan Dokumen ini adalah bahan yang digunakan dalam pelatihan penggunaan Stata untuk melakukan analisis ekonometrika sederhana. Modul ini mencakup deskripsi ringkas fungsi yang akan digunakan dalam software, perintah yang digunakan, serta contoh hasil yang diperoleh (bilamana perlu). Dalam paragraf uraian, perin- tah/command Stata dapat dikenali dengan format ini, dengan ringkasan perintah baru ditulis di sebelah kanan dan bagian perintah yang diubah sesuai penggu- naan dicetak miring. Contoh output Stata dapat dikenali seperti startscreen Stata berikut: Bagi pengguna, perintah help berguna untuk melihat bagaimana suatu com- mand digunakan, dan opsi perintah apa saja yang tersedia, terutama bila fungsi yang ingin digunakan sudah diketahui. Caranya adalah mengetik help command help (yep, it includes help help!). Informasi lebih lengkap terkait perintah yang diperkenalkan dalam modul dapat diakses dengan perintah ini. Modul ini mencakup seluruh silabus pelatihan yang hendak disampaikan. De- ngan kata lain, pembaca dapat menguasai materi yang disampaikan dalam pelati- han dengan membaca dan mereplikasi langkah yang ada dalam modul ini. Pembaca dipersilahkan mengakses materi di http://benconomy.wordpress.com/tutoring, tanpa mengubah isinya. Powered by L A T E X2 ε with X Ǝ L A T E X using T E Xstudio and Stata. 1

Upload: dinhtuong

Post on 06-Feb-2018

284 views

Category:

Documents


12 download

TRANSCRIPT

Page 1: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

Pelatihan Komputasi dengan StataBenedict J. Yappy1

Departemen Ilmu EkonomiUniversitas Indonesia

1 [email protected] – penyusun.‡

1 PendahuluanDokumen ini adalah bahan yang digunakan dalam pelatihan penggunaan Statauntuk melakukan analisis ekonometrika sederhana. Modul ini mencakup deskripsiringkas fungsi yang akan digunakan dalam software, perintah yang digunakan,serta contoh hasil yang diperoleh (bilamana perlu). Dalam paragraf uraian, perin-tah/command Stata dapat dikenali dengan format ini, dengan ringkasan perintahbaru ditulis di sebelah kanan dan bagian perintah yang diubah sesuai penggu-naan dicetak miring. Contoh output Stata dapat dikenali seperti startscreen Stataberikut:

Bagi pengguna, perintah help berguna untuk melihat bagaimana suatu com-mand digunakan, dan opsi perintah apa saja yang tersedia, terutama bila fungsiyang ingin digunakan sudah diketahui. Caranya adalah mengetik help command help(yep, it includes help help!). Informasi lebih lengkap terkait perintah yangdiperkenalkan dalam modul dapat diakses dengan perintah ini.

Modul ini mencakup seluruh silabus pelatihan yang hendak disampaikan. De-ngan kata lain, pembaca dapat menguasai materi yang disampaikan dalam pelati-han dengan membaca dan mereplikasi langkah yang ada dalam modul ini. Pembacadipersilahkan mengakses materi di http://benconomy.wordpress.com/tutoring,tanpa mengubah isinya.

‡Powered by LATEX 2ε with XƎLATEX using TEXstudio and Stata.

1

Page 2: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

Daftar Isi

Daftar Isi1 Pendahuluan 1

2 Manajemen Data 42.1 Penggunaan Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.1.1 Bekerja dengan Stata . . . . . . . . . . . . . . . . . . . . . . 42.1.2 Working Directory . . . . . . . . . . . . . . . . . . . . . . . 42.1.3 Sumber Data . . . . . . . . . . . . . . . . . . . . . . . . . . 52.1.4 Menyimpan Dataset, Perintah dan Output Stata . . . . . . 5

2.2 Bekerja dengan Data . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2.1 Manajemen variabel . . . . . . . . . . . . . . . . . . . . . . 72.2.2 Perintah generate . . . . . . . . . . . . . . . . . . . . . . . 72.2.3 Perintah drop . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2.4 Struktur Data . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2.5 Bekerja dengan timevar . . . . . . . . . . . . . . . . . . . . 82.2.6 Peubah untuk varlist . . . . . . . . . . . . . . . . . . . . 92.2.7 Label . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.2.8 Perintah encode dan recode . . . . . . . . . . . . . . . . . 112.2.9 Perintah reshape . . . . . . . . . . . . . . . . . . . . . . . . 112.2.10 Operator if, in dan by . . . . . . . . . . . . . . . . . . . . 142.2.11 Perintah count dan list . . . . . . . . . . . . . . . . . . . 14

3 Analisis Deskriptif 153.1 Statistik deskriptif . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4 Analisis Regresi OLS 204.1 Review . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4.1.1 Metode OLS . . . . . . . . . . . . . . . . . . . . . . . . . . 204.1.2 Asumsi OLS . . . . . . . . . . . . . . . . . . . . . . . . . . 224.1.3 Pengujian Hipotesis . . . . . . . . . . . . . . . . . . . . . . 23

4.2 Regresi OLS dengan Stata . . . . . . . . . . . . . . . . . . . . . . . 244.3 Penanganan Pelanggaran Asumsi . . . . . . . . . . . . . . . . . . . 25

4.3.1 Heteroskedasitas . . . . . . . . . . . . . . . . . . . . . . . . 254.3.2 Autokorelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . 264.3.3 Multikolinearitas . . . . . . . . . . . . . . . . . . . . . . . . 27

4.4 Instrumental Variables . . . . . . . . . . . . . . . . . . . . . . . . . 284.5 Specification Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294.6 Setelah estimasi… . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.6.1 Perintah predict . . . . . . . . . . . . . . . . . . . . . . . . 30

benconomy.wordpress.com 2

Page 3: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

Daftar Isi

4.6.2 Perintah estimates . . . . . . . . . . . . . . . . . . . . . . 30

benconomy.wordpress.com 3

Page 4: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

2 Manajemen Data2.1 Penggunaan Stata2.1.1 Bekerja dengan Stata

Stata adalah sebuah program statistik yang dapat dikatakan sangat lengkap darisegi kemampuan fungsi statistik yang dapat ditanganinya, yang menjadikan Statasalah satu program paling populer yang digunakan oleh peneliti-peneliti dari berba-gai kalangan. Secara garis besar, cara bekerja dalam Stata adalah melalui commandline, di mana perintah diketikkan ke dalam panel command (dapat diaktifkan de-ngan shortcut Ctrl+1). Walau demikian, Stata memiliki cukup banyak dialog boxuntuk banyak perintahnya, yang menambah fleksibilitas program Stata.

Bila berada dalam panel command, kita dapat scroll command-command se-belumnya dengan Page-up/down, untuk memudahkan mengulangi perintah yangpernah dipanggil. Opsi untuk masing-masing perintah biasanya ditambahkan sete-lah tanda koma , (hanya ada satu tanda koma diperbolehkan untuk setiap perin- ,tah).

Selain panel Command, terdapat juga beberapa panel lain:

1. Results (Ctrl+2) yang melaporkan hasil dari perintah yang dijalankan.

2. Review (Ctrl+3) yang mendaftarkan perintah-perintah yang telah dijalankansebelumnya.

3. Variables (Ctrl+4) yang mendaftarkan variabel-variabel yang sedang ada da-lam dataset/memory.

4. Properties (Ctrl+5) yang memberi keterangan tentang variabel yang dipilih.

2.1.2 Working Directory

Di sebelah kiri bawah tampilan window Stata, akan dituliskan working directoryStata. Working directory adalah folder di mana Stata “bekerja”, yaitu tempatdi mana Stata akan menyimpan atau mengakses file secara default. Ada baiknyaworking directory di set ke directory di mana dataset dan file lain terkait peker-jaan tersebut disimpan. Seperti di banyak program lain, untuk mengubah workingdirectory, ketikkan cd new_path ke dalam panel command. File yang ada dalam cdworking directory dapat langsung diakses menggunakan file_name (contohnyadataset.dta), sedangkan yang berada di luar working directory hanya dapat diak-ses menggunakan file path lengkap (contohnya ”D:\Data\Dataset.dta”). Dengankata lain, memindahkan file-file yang digunakan dalam Stata ke dalam workingdirectory akan membantu untuk mengakses file-file tersebut nanntinya.

benconomy.wordpress.com 4

Page 5: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

Penggunaan nama file dalam Stata perlu menggunakan tanda petik ”. . .” untuknama file yang mengandung karakter spasi.

2.1.3 Sumber Data

Data yang akan dianalisis menggunakan Stata dapat berasal dari tiga sumber:

1. File database Stata yang telah disimpan sebelumnya, yang memiliki exten-sion .dta. Cara membuka dapat dengan menggunakan command line use usefile_name.dta dialog box (File > Open ; Ctrl+O).

2. Copy-paste dari program database lain, seperti Microsoft Excel. Pertama,copy data dari program lain tersebut. Kembali di Stata, ketik edit di editpanel Command untuk membuka data editor.. Data dapat langsung di-paste(Ctrl+V) ke Stata. Untuk menampilkan dataset tanpa melakukan edit (danmencegah edit yang tidak disengaja), gunakan perintah browse. browseBila data yang di-copy termasuk nama varibel di baris pertama, pilih “Treatfirst row as variable names”. Bila hanya data yang di-copy, pilih “Treat firstrow as data” — Stata akan memberi nama untuk masing-masing variabel(var1, var2, dst). Data yang di-copy dapat berupa data dengan banyak va-riabel sekaligus (multi-column) maupun satu per satu — variabel baru dapatditambahkan melalui copy-paste.

3. Membuka file database yang dibuat di program lain. Cara paling mudahmelakukan impor database adalah dengan menggunakan opsi di dalam File >Import.

Selain menggunakan database yang telah ada seperti dalam ketiga sumber diatas, Stata juga menyediakan file-file contoh database .dta yang siap digunakandalam setiap instalasi Stata. Untuk melihat daftar file tersebut, ketik sysuse dir sysusedalam panel command, dimana file yang ingin dibuka dapat digunakan dengan pe-rintah sysuse file_name.Stata juga dapat membuka file .dta di internet secara langsung dengan menggu-nakan perintah webuse URL. webuse

2.1.4 Menyimpan Dataset, Perintah dan Output Stata

Dataset Hasil data yang sudah diolah dengan Stata dapat disimpan denganperintah save file_name. Bila nama file dataset yang hendak disimpan sudah saveada, kita perlu menambahkan opsi replace ke dalam perintah (save file_name,replace). Fungsi Save dan Save As seperti di program lain dapat diakses denganshortcut Ctrl+S dan Ctrl+Shift+S.

benconomy.wordpress.com 5

Page 6: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

Perintah dan do-file “History” perintah-perintah yang dijalankan dalam satusesi Stata akan dimasukkan dalam panel Review. Kita dapat menyeleksi perintahyang kita inginkan dari panel Review dan mengeditnya dalam do-file editor diStata.

Do-file adalah file text standar dengan extension .do (dapat dibuka/diedit dalamtext editor seperti Notepad). File .do ini menjadi daftar perintah yang dapat di-jalankan atau diedit oleh Stata. Untuk menjalankan do-file yang sudah disimpan,gunakan perintah do file_name untuk menjalankan do-file seperti biasa, dan pe- do | runrintah run file_name untuk menjalankan tanpa laporan dalam panel Results.Untuk mengedit do-file yang telah disimpan sebelumnya, gunakan perintah doedit doeditfile_name.

Menyimpan daftar perintah yang dijalankan oleh Stata sangat penting untukmemastikan bahwa perintah yang diberikan tercatat, sehinnga dapat dipertang-gungjawabkan dan direplikasi. Penyimpanan daftar perintah tersebut dengan mu-dah dilakukan dengan do-file Stata. Selain itu, eksekusi do maupun run akanberhenti bila terdapat kesalahan dalam data/command, sehingga sangat bergunauntuk melakukan hal-hal yang sifatnya berulang.

Output (Results) dalam panel Results dapat disimpan dengan memulai log-file.smcl. Detail perintah untuk manajemen log-file sebagai berikut: log

• log using file_name: Menyimpan log ke dalam file dengan menggunakanfile_name.smcl. Log ini dapat dibuka oleh Stata.

• log off: Menghentikan penyimpanan log secara sementara.

• log on: Melanjutkan kembali penyimpanan log yang sudah di off sebelum-nya.

• log close: Menyelesaikan penyimpanan log.

Selain dengan menyimpan log, output stata dapat dicopy-paste ke program lain.Untuk meng-copy, highlight area output yang akan di-copy, dan klik kanan. Copybiasa (Ctrl+C) akan menghasilkan teks, copy as table akan menghasilkan tabeldengan karakter tabulator (untuk program spreadsheet seperti Excel), dan copypicture menghasilkan gambar dan mempertahankan tampilan dalam Stata.

2.2 Bekerja dengan DataSebagai program statistik, Stata memiliki kemampuan operasi variabel yang cukupluas dan menyeluruh. Pada bagian ini diuraikan bagaimana cara bekerja denganvariabel yang paling umum dipakai. Opsi yang tersedia di Stata lebih luas dari

benconomy.wordpress.com 6

Page 7: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

uraian dalam modul ini, sehingga dianjurkan untuk melihat help untuk masing-masing perintah.

2.2.1 Manajemen variabel

Jenis Variabel Pada dasarnya terdapat dua jenis variabel di Stata, yaitu string(dapat bernilai huruf) dan variabel numerik. Data string tidak dapat digunakandalam perintah perhitungan/statistik dalam Stata. Terdapat beberapa jenis varia-bel numerik.* Untuk mengubah format penyimpanan variabel, gunakan perintahrecast type varlist dimana type adalah tipe variabel. Variabel string tidak da- recastpat diubah menjadi angka. Untuk melihat daftar dan jenis variabel dalam datasetyang dibuka, gunakan perintah describe. describe

Order Urutan variabel yang ada dalam Stata dapat diubah dengan menggunakanperintah order varlist, di mana variabel varlist tersebut akan dipindahkan men- orderjadi variabel pertama. Tambahkan opsi last untuk memindahkan ke variabel ter-akhir; before(varname) dan after(varname) untuk memindahkan sebelum atausetelah varname.

2.2.2 Perintah generate

Seperti namanya, perintah generate varname=expression berguna untuk men- generateciptakan variabel baru. Expression yang dimaksud dapat berupa operasi hitung, va-riabel lain ataupun pembuatan angka random oleh Stata. Operasi yang didukungdapat dilihat dalam menu help functions. Beberapa ekspresi yang umum digu-nakan yaitu +, -, /, *, exp() dan log(). Bila variabel yang diciptakan digunakanuntuk menggantikan (overwrite) variabel yang sudah ada, maka perintah replace replacedapat digunakan untuk menggantikan generate.

Selain perintah generate, Stata juga memiliki perintah egen. Perintah egen egendapat melakukan semua operasi yang dapat dilakukan oleh generate, ditambahbeberapa fungsi lainnya, seperti mengisi dengan pola, statistik variabel, dan lainnya(lihat di help egen).

2.2.3 Perintah drop

Perintah drop varlist berguna untuk membuang variabel-variabel (varlist) yang dropdiinginkan. ‘Lawan’ dari perintah drop adalah keep varlist, di mana variabel-

keepvariabel lain selain varlist akan dibuang.*Perbedaan jenis variabel dapat mempengaruhi derajat keakurasian, namun berguna untuk

menghemat tempat penyimpanan dan waktu kalkulasi (dibahas dalam help data_type).

benconomy.wordpress.com 7

Page 8: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

2.2.4 Struktur Data

Terdapat tiga jenis cara penanganan dataset (umum) oleh Stata:

1. Cross section. Struktur data ini adalah struktur data yang dasar di Stata.Tidak ada unsur waktu dalam variabel ini. Untuk kembali ke struktur dataCross Section, setting tsset atau xtreg perlu di-clear dengan menambahkanopsi clear ke perintah tsset atau xtset.

2. Time Series. Struktur data time series mengikuti satu sampel dalam be-berapa periode waktu. Untuk menyatakan struktur data sebagai time se-ries, digunakan perintah tsset timevar, unitoptions. timevar di Stata tssetbernilai 0 untuk (awal) tahun 1960, dan dihitung ke depan atau belakangsebesar unitoptions (clocktime, daily, weekly, monthly, quarterly, halfyearly,yearly, generic). Bila perubahan tidak berjalan sebesar 1 unit, tambahkanopsi delta(#).

3. Panel. Struktur data panel mengikuti lebih dari satu sampel selama lebih darisatu periode. Untuk menyatakan data sebagai data panel, gunakan perintahxtset panelvar timevar, unitoptions. Panelvar adalah ID untuk masing- xtsetmasing unit sampel yang diobservasi.

2.2.5 Bekerja dengan timevar

Seperti yang ditulis di atas, timevar yang digunakan untuk identifikasi waktu harusberada dalam format numerik, dengan spesifikasi SIF (Stata internal form) berupaberapa unit setelah (sebelum) tahun 1 Januari 1960 00:00.00. Format ini tidakselalu mudah untuk diperoleh, karena data yang diperoleh berada dalam formatHRF (human readable form). Untuk mengubahnya ke dalam format SIF yangdapat di-tsset, kita dapat menggunakan perhitungan manual untuk selisih dariawal tahun 1960 tersebut, namun cara ini dapat dikatakan tidak praktis. Statamenyediakan konversi antar SIF dan HRF sebagai berikut.

1. Pastikan variabel waktu HRF (tiwevar_str) telah memiliki format pena-maan dan frekuensi yang konsisten. Contohnya, untuk data kuartal, dataharus konsisten suati format (seperti 1960Q1, 1960Q2 dst dan tidak berubahmenjadi 1970M3, 1970M6 dst).

2. Pelajari format data waktu untuk membentuk mask yang akan dikenali Stata.Stata akan menggunakan tanda baca (. , - ␣) untuk memisahkan antar kom-ponen waktu, Stata tidak mengenali elemen lain selain waktu (unsur terse-but tidak diikutkan dalam mask dengan karakter #. Beberapa contoh untuktanggal 16 Oktober 1992:

benconomy.wordpress.com 8

Page 9: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

• Oct 16, 1992 akan memiliki mask MDY• Friday, Oct 16, 1992 akan memiliki mask #MDY• 16 Oct 1992 akan memiliki mask DMY• 161092 akan memiliki mask DM19Y (19Y untuk 2 digit pertama angka

tahun, untuk format tahun 2 digit)• 1992W42 akan memiliki mask YW (mingguan)• 1992M10 akan memiliki mask YM (bulanan)• 1992Q3 akan memiliki mask YQ (kuartalan)• 1992S2 akan memiliki mask YH (semesteran)

3. Ciptakan variabel baru timevar untuk konversi ke dalam bentuk SIF. Formatperintahnya adalah generate timevar = function(timevar_str,mask).Variabel baru timevar sudah dapat digunakan untuk tsset. Supaya varia-bel waktu tersebut tampil dalam format yang dapat dibaca, perlu dilakukanformat dengan perintah format timevar %fmt. Aplikasinya: formatgenerate timevar = date(timevar_str, "DMY"), format timevar %tddan tsset timevar, daily) untuk data hariangenerate timevar = weekly(timevar_str, "YW"), format timevar %twdan tsset timevar, weekly) untuk data mingguangenerate timevar = monthly(timevar_str, "YM"), format timevar %tmdan tsset timevar, monthly) untuk data bulanangenerate timevar = quarterly(timevar_str, "YQ"), format timevar%tq dan tsset timevar, quarterly) untuk data kuartalangenerate timevar = halfyearly(timevar_str, "YH"), format timevar%th dan tsset timevar, halfyearly) untuk data semesteran

2.2.6 Peubah untuk varlist

Wildcards Sebagian besar perintah Stata lainnya juga dapat menggunakan wild-card untuk varlist. Beberapa wildcard tersebut:

• * — digunakan sebagai substitusi satu atau lebih karakter. Contohnya, Ind*akan masuk untuk Indonesia dan India; *Inc akan masuk untuk Stata Incdan Microsoft Inc.

• ? — digunakan untuk substitusi satu karakter. Contohnya, p?p? akan masukuntuk papa maupun popo.

benconomy.wordpress.com 9

Page 10: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

• — digunakan sebagai substitusi di tengah. Contohnya, pan~an akan masukuntuk panduan dan panutan.

• _all — digunakan sebagai substitusi untuk semua variabel.

Operator Terdapat dua jenis operator dalam operasi variabel Stata, yaitu opera-tor jenis data dan operator waktu (kedua jenis operator ini dapat dikombinasikan).Operator-operator ini ditambahkan dengan tanda titik sebelum nama variabel (con-tohnya, Li.varname). Berikut adalah uraian operator tersebut.

• i — Operator ini menyatakan bahwa variabel diperlakukan sebagai variabelfaktor/kualitatif. Penggunaan operator ini memudahkan pekerjaan, karenatidak perlu lagi menciptatkan dummy untuk variabel-variabel kualitatif.

• c — Operator ini menyatakan bahwa variabel diperlakukan sebagai variabelcontinuous, yaitu berisi nilai.

• # — Operator ini adalah perintah untuk membuat interaksi antar variabel.Contohnya, var1#var2.

• L — Operator ini berguna untuk mengambil mengambil nilai sebelumnya(lag) dari variabel. Lag dapat dispesifikasikan dengan angka (L3) ataupunkombinasi huruf (LLL).

• F — Operator ini berguna untuk mengambil mengambil nilai berikutnya(forward) dari variabel. Forward dapat dispesifikasikan dengan angka (F3)ataupun kombinasi huruf (FFF).

• D — Operator ini berguna untuk perubahan nilai (difference) dari variabel.Difference orde lebih tinggi dapat dispesifikasikan dengan angka (D2) ataupunkombinasi huruf (DD).

2.2.7 Label

Label dalam Stata berguna untuk membantu pengguna. Contohnya, nama va-riabel dalam Stata tidak dapat mengandung karakter spasi. Berikut ini dibahaspenggunaan label yang ada dalam stata. labellabel data "label" memberikan keterangan label untuk keseluruhan dataset.label variable varname "label" memberikan keterangan label untuk suatuvariabel, yang muncul dalam panel variabel maupun perintah describe.label define labelname # "label" mendefinisikan sebuah label untuk memberilabel keterangan untuk masing-masing nilai angka (#), yang dapat digunakan un-tuk variabel numerik. Fitur ini berguna terutama untuk variabel kualitatif. Satu

benconomy.wordpress.com 10

Page 11: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

angka # mendapat satu label, sehingga ulangi bagian # "label" untuk masing-masing label dalam sate set labelname.Tambahkan salah satu dari opsi add (hanya menambah label baru), modify (me-ngubah label yang sudah ada), dan replace (mendefinisikan ulang labelname) bilalabelname sudah ada sebelumnya.label values varlist "labelname" meng-assign sate set value label (labelname)yang sudah ada (di-define)ke suatu variabel (varlist).label dir memperlihatkan daftar value label yang ada.label list varname memperlihatkan daftar value label beserta nilai-nilai danlabel keterangan masing-masing.

2.2.8 Perintah encode dan recode

Stata tidak dapat melakukan perhitungan statistik untuk variabel dengan formatstring, sehingga variabel kualitatif (seperti nama negara) perlu dikonversi men-jadi numerik (diberi nomor ID). Untuk melakukannya, terdapat command encode encodevarname, generate newvar. Selain menciptakan angka-angka untuk masing-masing string, perintah encode juga membuat dan meng-assign value label denganlabelname yang sama dengan newvar. Untuk mengubah angka yang sudah ada,digunakan perintah recode varname, generate newvar . Ilustrasi dari perintah- recodeperintah tersebut adalah sebagai berikut:negara_str negara_num benuaData teks

encode

No Label

recode

No LabelIndonesia 1 Indonesia 1 AsiaChina 2 China 1 AsiaJepang 3 Jepang 1 AsiaKorea 4 Korea 1 AsiaInggris 5 Inggris 2 EropaJerman 6 Jerman 2 EropaPrancis 7 Prancis 2 EropaAmerika Serikat 8 Amerika Serikat 3 Amerika

Untuk transformasi di atas, kedua perintah yang digunakan adalah:encode negara_str, generate(negara_num)recode negara_num (1 2 3 4 = 1 "Asia") (5/7 = 2 "Eropa")

(8 = 3 "Amerika"), generate (benua)

2.2.9 Perintah reshape

Dataset yang diperoleh untuk analisis dapat berbentuk “long” ataupun “wide”.Untuk mengilustrasikannya, berikut adalah beberapa bentuk yang berbeda untukdataset yang sama.

benconomy.wordpress.com 11

Page 12: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

country time variable dataChina 1997 gdp 7.90E+12China 1997 investment 2.60E+12China 1997 savings 3.30E+12China 1998 gdp 8.40E+12China 1998 investment 2.90E+12China 1998 savings 3.40E+12China 1999 gdp 9.00E+12China 1999 investment 3.10E+12China 1999 savings 3.40E+12

Indonesia 1997 gdp 6.30E+14Indonesia 1997 investment 1.80E+14Indonesia 1997 savings 1.80E+14Indonesia 1998 gdp 9.60E+14Indonesia 1998 investment 2.40E+14Indonesia 1998 savings 2.10E+14Indonesia 1999 gdp 1.10E+15Indonesia 1999 investment 2.20E+14Indonesia 1999 savings 1.50E+14

UK 1997 gdp 8.40E+11UK 1997 investment 1.40E+11UK 1997 savings 1.40E+11UK 1998 gdp 8.80E+11UK 1998 investment 1.60E+11UK 1998 savings 1.50E+11UK 1999 gdp 9.30E+11UK 1999 investment 1.60E+11UK 1999 savings 1.40E+11

Country, time, variable (long)

coun

try

varia

ble

data97

data98

data99

China

gdp

7.9e+12

8.4e+12

9.0e+12

China

investment

2.6e+12

2.9e+12

3.1e+12

China

saving

s3.3e+12

3.4e+12

3.4e+12

Indo

nesia

gdp

6.3e+14

9.6e+14

1.1e+15

Indo

nesia

investment

1.8e+14

2.4e+14

2.2e+14

Indo

nesia

saving

s1.8e+14

2.1e+14

1.5e+14

UK

gdp

8.4e+11

8.8e+11

9.3e+11

UK

investment

1.4e+11

1.6e+11

1.6e+11

UK

saving

s1.4e+11

1.5e+11

1.4e+11

Coun

try,v

ariab

le(lo

ng),tim

e(w

ide)

coun

try

time

gdp

investment

saving

sChina

1997

7.9e+12

2.6e+12

3.3e+12

China

1998

8.4e+12

2.9e+12

3.4e+12

China

1999

9.0e+12

3.1e+12

3.4e+12

Indo

nesia

1997

6.3e+14

1.8e+14

1.8e+14

Indo

nesia

1998

9.6e+14

2.4e+14

2.1e+14

Indo

nesia

1999

1.1e+15

2.2e+14

1.5e+14

UK

1997

8.4e+11

1.4e+11

1.4e+11

UK

1998

8.8e+11

1.6e+11

1.5e+11

UK

1999

9.3e+11

1.6e+11

1.4e+11

Coun

try,tim

e(lo

ng),varia

ble(w

ide)

Untuk melakukan konversi antar ketiga bentuk tersebut, digunakan perintah

benconomy.wordpress.com 12

Page 13: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

reshape. Sebelumnya, beberapa hal perlu diketahui terlebih dahulu. Pertama, di-mensi sekarang dari dataset (apakah wide atau long). Kedua bagaimana datasetakan dibentuk (dimensi wide dan long yang diinginkan). Ketiga, memastikanbahwa dataset memenuhi syarat untuk dilakukan reshape: (1) Terdapat stubnamesyang menghubungkan data-data wide j, yang dalam contoh di atas adalah awalandata (data97, data98, dst). (2) Tidak terdapat lebih dari satu nilai untuk satukolom xij. Sintaks dan penjelasan perintah reshape adalah sebagai berikut:reshape wide|long stubname, i(i_var) j(j_var) string reshape

• wide|long — Bentuk yang dituju setelah melakukan perintah, apakah wideatau long. Perlu diketahui bahwa dapat dilakukan beberapa perintah reshape,untuk menyesuaikan dengan struktur data.Dalam contoh tadi, reshape wide dapat dilakukan sekali lagi untuk membuatcountry, variable dan/atau time semuanya sebagai variabel wide (j).

• stubnames — Nama variabel (untuk reshape long) atau bagian umum darinama variabel (reshape wide). Penambahan memberikan informasi di mananama variabel baru ditempatkan.Contoh dalam dataset tadi, (data) dapat digunakan untuk data97, data 98dst. Reshape tidak dapat digunakan tanpa stubnames, contohnya untuk va-riabel gdp, investment dst (rename menjadi datagdp, datainvestment).

• i(i_var) — Variabel-variabel yang berada dalam bentuk long, yang mengi-dentifikasikan observasi secara unik.

• j(j_var) — Variabel lama yang akan di-expand (reshape wide), atau variabelbaru yang akan diciptakan sebagai identifier (reshape long).Berikut opsi j untuk contoh tadi. Untuk reshape long, berikan nama variabelbaru (country, time, atau variable). Untuk reshape wide, berikan nama variabellama yang akan di expand (country, time, atau variable).

• string — Tambahkan opsi string bila j_var berisi huruf.Dalam contoh tadi, tambahkan opsi string bila j_var adalah country atauvariable yang adalah data string. Jangan tambahkan opsi string bila j_varadalah time yang adalah data numerik. Perhatikan, untuk reshape wide, isivariabel yang akan dikonversi menjadi long adalah karakter huruf atau _(tidak boleh mengandung karakter non-huruf seperti spasi dan titik).

Perubahan dataset oleh perintah reshape dapat di “undo”: Setelah reshape long,perintah reshape wide (tanpa argumen/opsi) akan mengembalikan dataset sepertisebelum reshape long tadi dilakukan; demikian juga sebaliknya. Periksa kembalidataset setelah reshape untuk memastikan dataset seperti yang diinginkan, sebelummelakukan kalkulasi statistik atau save dataset.

benconomy.wordpress.com 13

Page 14: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

2 Manajemen Data

2.2.10 Operator if, in dan by

Akhiran if expression berguna untuk membuat Stata melakukan perintah ifhanya pada observasi yang memenuhi kriteria (expression) yang dibuat dalam if.Berbagai operator dapat digunakan untuk expression, seperti >, >=, <, <= dan== (gunakan dua (bukan satu!) tanda sama dengan). if dapat digunakan padasebagian besar perintah Stata. Tambahkan if expression pada akhir perintah yangdiinginkan.

Akhiran in obsno —Berguna untuk membuant Stata melakukan perintah hanya ifpada nomor observasi yang dispesifikasikan (obsno). Nomor observasi 1 2 3 4 jugadapat dinyatakan dengan 1/4 dan 1 2/4. in dapat digunakan pada sebagian besarperintah Stata. Tambahkan in obsno pada akhir perintah yang diinginkan.

Awalan by (varlist): — Berguna untuk membuat Stata melakukan perin- bytah secara berkelompok (berulang) dengan variabel dalam varlist. by memerlukandataset untuk diurutkan (sort) sesuai dengan varlist (sort varlist). Tambahkan sortby(varlist): sebelum mengetikkan perintah yang diinginkan.

Awalan bysort digunakan dengan cara yang sama dengan awalan by. Perbe- bysortdaannya, bysort termasuk perintah sort, sehingga dataset akan diurutkan sesuaidengan varlist terlebih dahulu.

2.2.11 Perintah count dan list

Perintah count berguna untuk menghitung dan menampilkan jumlah observasi countyang memenuhi kriteria. Kriteria yang dimaksud dapat dispesifikasikan denganoperator if, in ataupun by. Eksekusi count sangat cepat dibandingkan dengan pe-rintah statistik lainnya, sehingga perintah ini biasanya digunakan untuk mengeceksuatu dataset (terutama dengan menggunakan do-file).

Perintah list varlist berguna untuk menampilkan nama variabel dalam varlist listdan nilai-nilainya. Perintah list sering digunakan dengan operator if, in atau by.Samaseperti count, eksekusi perintah list sangat cepat dan biasanya digunakan untukmengecek suatu dataset. Di samping itu, penggunaan list biasanya dapat mende-teksi kesalahan data secara lebih mudah dibandingkan edit ataupun browse.

benconomy.wordpress.com 14

Page 15: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

3 Analisis Deskriptif

3 Analisis Deskriptif3.1 Statistik deskriptifTabel statistik deskriptif membantu menampilkan isi dari variabel secara ringkasdengan berbagai statistik. Semua tabel statistik berikut dapat digunakan denganopsi if, in maupun by.

Perintah summarize varlist berguna untuk menampilkan statistik deskriptifseperti mean (rata-rata), median, dan data terkecil (min) dan terbesar (max) untuk summarizesuatu variabel secara keseluruhan. Bila tidak terdapat varlist, perintah ini akanmenampilkan statistik deskriptif untuk seluruh variabel. Tambahkan opsi detailuntuk mendapatkan statistik deskriptif yang lebih detail.

Perintah tabulate varname1 varname2 berguna untuk membuat tabulasi (per- tabulatehitungan seberapa banyak suatu variabel muncul) dalam satu atau lebih variabel.Bila hanya satu variabel yang ditabulasi, maka cukup menggunakan varname1.Tambahkan varname2 bila menggunakan tabulasi dua variabel. Beberapa opsi yangtersedia untuk tabulasi dua variabel adalah column, row dan cell yang membuattabulasi menampilkan frekuensi relatif (persentasi) dari nilai suatu nilai diband-ingkan masing-masing keseluruhan kolom, baris dan total.

Perintah table “menggabungkan” kekuatan dari summarize dan tabulate, dimana tabulasi (maksimal 4) statistik deskriptif dapat ditampilkan untuk dua ataulebih variabel. Sintaks perintah table adalah sebagai berikut:table varname(s), contents(clist) table

varnames adalah variabel-variabel yang akan ditabulasi. Variabel pertama akanmenjadi variabel yang ditampilkan sebagai baris (i); sedangkan variabel keduamenjadi variabel kolom j. Variabel ketiga dan seterusnya akan menjadi super-kolom (kolom dalam kolom).

clist adalah jenis statistik yang akan ditampilkan untuk masing-masing nilai.clist dapat menampilkan freq (frekuensi) ataupun statistik lainnya: mean, sd,max, min, median, sum (spesifikasikan variabel yang hendak dideskripsikansetelah opsi ini).

by(varlist) Penambahan opsi ini akan membuat super-row (baris dalam baris)dengan variabel varlist (maksimum 4 level).

benconomy.wordpress.com 15

Page 16: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

3 Analisis Deskriptif

3.2 GrafikStata memiliki kemampuan grafis yang cukup komprehensif. Selain melalui pe-rintah, menu untuk grafik tersedia dalam menu Graphics dengan dialog box yangcukup membantu proses pembuatan grafik yang diinginkan. Untuk memudahkan,perintah grafik akan diperkenalkan menggunakan contoh.

Perintah histogram varname berguna untuk membuat diagram batang. Tam- histogrambahkan opsi normal untuk menambahkan grafik distribusi normal. Contoh perin-tah yang dapat dijalankan:sysuse citytemphistogram tempjulyhistogram tempjuly, normalDalam kedua contoh tersebut, Stata akan menampilkan jumlah dan lebar diagrambatang secara otomatis. Untuk mengubah jumlah tersebut, gunakan opsi bin(#)dan width(arg1#). Untuk diagram batang tampilan jumlah frekuensi dan persen-tase, tambahkan opsi frequency dan percentage. Bila ingin menggunakan satudiagram batang untuk setiap nilai, tambahkan opsi discrete.

Perintah twoway (plot) berguna untuk membuat grafik antar variabel. Bila twowaylebih dari satu plot, tanda kurung () untuk menandai masing-masing plot. Elemendefinisi (plot) adalah sebagai berikut:

jenis plot — Dua pilihan yang sering digunakan adalah scatter, dan line. Selainplot data langsung, dapat juga ditambahkan plot trend/regresi, yaitu lfit(linear fit) qfit (quadratic fit). Pilihan lfitci dan qfitci menampilkanconfidence interval yang dapat diset dengan tambahan opsi grafis level(#).Perlu diperhatikan bahwa jenis plot tertentu dapat memiliki sintaks yangberbeda dengan yang dibahas di sini (contohnya rarea).

varlist y—Dapat terdapat lebih dari satu variabel y untuk satu definisi plot (diplotmasing-masing).

varname x — Hanya terdapat satu variabel x untuk satu definisi plot.

opsi—Plot dapat menggunakan beberapa skala ymaupun x, yang dispesifikasikandengan yaxis(#) dan xaxis(#). Terdapat banyak opsi lain yang tergantungpada jenis plot. Contohnya, kita dapat menspesifikasikan jenis marker untukscatter (lihat help marker_options) dan garis (lihat help line_options)untuk line.

Perintah histogram dan twoway yang diperkenalkan di atas adalah “singkatan”dari perintah graph Stata, di mana sintaks lengkap adalah graph twoway. Khususscatter dan line, sintaks twoway dapat dihilangkan (contohnya, line varname).

benconomy.wordpress.com 16

Page 17: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

3 Analisis Deskriptif

Hasil dari perintah grafik Stata dapat disimpan ke dalam file grafis untuk digu-nakan dalam program lainnya. Perintah untuk mengekspor grafik yang sedangterbuka tersebut adalah graph export filename.ext. .ext diperlukan untukmenspesifikasikan tipe file yang diekspor, seperti .pdf, .wmf, .eps dan .png.

Berikut adalah beberapa contoh perintah penggunaan grafik twoway denganmenggunakan dataset bawaan Stata.

sysuse autotwoway scatter price mpg

05,

000

10,0

0015

,000

Pric

e

10 20 30 40Mileage (mpg)

twoway (scatter price mpg) (lfit price mpg)

05,

000

10,0

0015

,000

10 20 30 40Mileage (mpg)

Price Fitted values

benconomy.wordpress.com 17

Page 18: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

3 Analisis Deskriptif

twoway (scatter mpg weight) (scatter price weight, yaxis(2))

05,

000

10,0

0015

,000

Pric

e

1020

3040

Mile

age

(mpg

)

2,000 3,000 4,000 5,000Weight (lbs.)

Mileage (mpg) Price

sysuse sp500twoway line close date

1000

1100

1200

1300

1400

Clo

sing

pric

e

01jan2001 01apr2001 01jul2001 01oct2001 01jan2002Date

twoway line close date, yscale(log)

1000

1100

1200

1300

1400

Clo

sing

pric

e

01jan2001 01apr2001 01jul2001 01oct2001 01jan2002Date

benconomy.wordpress.com 18

Page 19: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

3 Analisis Deskriptif

twoway (rarea open close date in 1/30) (connected volume date in1/60,yaxis (2))

10,0

0015

,000

20,0

00V

olum

e (t

hous

ands

)

1280

1300

1320

1340

1360

1380

Ope

ning

pric

e/C

losi

ng p

rice

01jan2001 01feb2001 01mar2001 01apr2001Date

Opening price/Closing price Volume (thousands)

twoway (qfitci close date, level(90)) (line close date)

1000

1100

1200

1300

1400

15000 15100 15200 15300 15400Date

90% CI Fitted valuesClosing price

sysuse citytemphistogram tempjuly, normal

0.0

5.1

.15

Den

sity

60 70 80 90 100Average July temperature

benconomy.wordpress.com 19

Page 20: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

4 Analisis Regresi OLS4.1 Review4.1.1 Metode OLS

Metode regresi OLS (Ordinary Least Squares) adalah salah satu pendekatan untukmelakukan estimasi parameter yang menentukan nilai variabel independen. OLStermasuk keluarga estimasi “method of moments”, di mana salah satu ‘momen’ darisampel digunakan untuk mengestimasi parameter populasi. Metode regresi dimulaidari mengspesifikasikan fungsi regresi populasi;

yi = β0 + β1xi + εi (1)

dengan asumsiE(ε) = E (y − β0 − β1x) = 0 (2)

dan asumsi yang mengikutinya;

Cov(x, ε) = E(xε) = E [x (y − β0 − β1x)] = 0 (3)

Dalam pendekatan method of moments, kita menggunakan nilai (rata-rata)sampel untuk mengestimasi nilai populasi, sehingga persamaan (2) dan (3) menjadi:

n−1

n∑i=1

(yi − β0 − β1xi) = 0 (4)

dann−1

n∑i=1

[xi (yi − β0 − β1xi)] = 0 (5)

Dengan menggunakan sifat operator∑

dan memindahkan ruas, persamaan (4)dapat ditulis ulang menjadi:

β0 = y − β1x (6)Dengan memindahkan (6) ke persamaan (5) dan menghilangkan n−1 yang tidakmempengaruhi hasilnya, kita dapat memperoleh:

n−1

n∑i=1

[xi

(yi −

(y − β1x

)+ β1xi

)]= 0 (7)

Atur ulang persamaan tersebut, kita memperoleh:n∑

i=1

xi (yi − y) = β1

n∑i=1

xi (xi − x)

benconomy.wordpress.com 20

Page 21: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

Dengan menyusun ulang†;

β1 =

n∑i=1

xi (yi − y)

n∑i=1

xi (xi − x)

=

n∑i=1

(xi − x) (yi − y)

n∑i=1

(xi − x)2=

Cov(x, y)Var(x) (8)

Dalam kasus multivariabel, maka lebih dari satu variabel independen masukdalam persamaan (1):

yi = β0 + β1x1i + β2x2i + · · ·+ βjxji + εi

Persamaan di atas dapat ditulis dalam bentuk matriks:y1y2...yn

=

β0(1) β1x11 β2x12 . . . βjx1j

β0(1) β1x21 β2x22 . . . βjx2j... ... ... . . . ...

β0(1) β1xn1 β2xn2 . . . βjxnj

+

ε1ε2...εn

y = Xβ + ε (9)

Vektor parameter β yang diestimasi adalah vektor yang akan meminimumkanjumlah kuadrat error ε′ε. Berikut vektor vektor parameter sampel b yang memi-nimumkan error kuadrat sampel e′e:

Min e′e = (y − Xb)′(y − Xb) (10)= y′y − b′X′y − y′Xb + b′X′Xb= y′y − 2y′Xb + b′X′Xb

Keadaan yang meminimumkan error‡ adalah:

∂e′e∂b = −2X′y + 2X′Xb = 0

2X′y = 2X′Xbb = (X′X)

−1(X′y) (11)

†Penurunan yang diuraikan di sini mengikuti method of moments.‡Penurunan yang diuraikan di sini mengikuti metode Least Squares, yang identik dengan

estimator method of moments (dan juga maximum likelihood)

benconomy.wordpress.com 21

Page 22: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

4.1.2 Asumsi OLS

Dalam regresi, parameter estimasi perlu memenuhi kriteria yang sering disingkatBLUE, yaitu Best (parameter estimasi meminimumkan varians (kuadrat) error),Linear (persamaan yang diestimasi bersifat linear), Unbiased (parameter estimasitidak bias) dan Estimator (parameter adalah estimator yang baik untuk parameterpopulasi). Estimator yang tidak bias dan konsisten berarti parameter sesuai denganparameter populasi dan semakin dekat dengan parameter populasi ketika sampelditambah (plim β = β)Berikut rangkuman definisi yang lebih formal dari asumsi OLS:

OLS 1 Parameter bersifat linear. yi = β0 + β1x1 + · · ·+ βjxj

Dengan kata lain, parameter model populasi tidak dapat bersifatbersifat non-linear, seperti xβ1

1 atau β1x1β2x2.

OLS 2 Random Sampling

Data yang diambil adalah sampel yang diambil secara random daripopulasi yang hendak dipelajari.

OLS 3 Corr(x1, x2, . . . , xj) = ±1

Tidak adanya multikolinearitas sempurna antara variabel indepen-den.

OLS 4 Variasi dalam sampel.

Nilai sampel tidak konstan (hanya satu nilai) untuk satu variabel.Asumsi ini adalah implikasi asumsi sebelumnya.

OLS 5 E(ε|x) = 0 (zero conditional mean)

Nilai error yang diekspektasikan bernilai 0 untuk semua nilai x.Implikasinya adalah (1) korelasi x dan ε adalah 0 dan (2) E(y|x) =y. Asumsi ini adalah dasar pendekatan method of moments yangdigunakan dalam persamaan (2) dan (3).

OLS 6 Corr(εi, εj) = 0

Tidak ada korelasi antar error dalam seluruh sampel.

OLS 7 Var(εi) = σ2

Varians error tidak berubah/konstan untuk semua nilai xj.

benconomy.wordpress.com 22

Page 23: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

Data/model yang tidak memenuhi asumsi tersebut akan mengakibatkan pa-rameter yang diestimasi tidak memenuhi kriteria BLUE. Karena itu, dibutuhkan(1) teknik deteksi pelanggaran asumsi tersebut untuk mengetahui adanya estimasiyang tidak konsisten dan (2) teknik estimasi yang mampu mengkoreksi pelang-garan yang terjadi untuk menghasilkan estimasi yang tetap konsisten dan efisien.Teknik-teknik lain yang menggunakan metode least square ada untuk mengatasiadanya pelanggaran asumsi OLS tersebut.

4.1.3 Pengujian Hipotesis

Sebagai bagian dari teknik statistik, ekonometrika tidak lepas dari pengujian hipote-sis. Pengujian statistik selalu menyajikan dua hipotesis yang bersifat eksklusif danlengkap:

H0 : a

H1 : ∼ a

Pada umumnya, peneliti “ingin” menolakH0. Perhitungan yang dilakukan akanmenghasilkan suatu ukuran tes (test statistic), seperti nilai z atau t. Statistik inidigunakan untuk melihat apakah peneliti akan menolak H0 (menerima H1) ataugagal menolak (menerima) H0. Dalam pengujian statistik yang melibatkan prosesinference, selalu terdapat dua kemungkinan kesalahan:

Type 1 error Menolak H0 ketika H0 benar (disebut juga false positive).Contohnya: (1) Mendiagnosa orang sehat mengalami infeksi; (2) Membuangproduk yang sebenarnya memenuhi standar kualitas.

Type 2 error Menerima H0 ketika H0 tidak benar (disebut juga false negative).Contohnya: (1) Mendiagnosa orang sakit tidak mengalami infeksi; (2) Mener-ima/meluluskan produk yang sebenarnya tidak memenuhi standar kualitas.

Nilai berbagai statistik pengujian dapat digunakan untuk menghitung p-value,yang dapat dikatakan mengukur kemungkinan terjadinya Type 1 error. Dalamekonometrika, pengujian yang sering dilakukan adalah melihat apakah suatu model/variabel independen signifikan menjelaskan variabel dependen. Jadi, dalam pen-gujian signifikansi, p-value mengukur peluang menyatakan bahwa model/variabelindependen tersebut tidak signifikan ketika model/variabel independen tersebutsignifikan. p-value dapat langsung dibandingkan dengan confidence interval (yangseyogianya telah ditetapkan secara a-priori) untuk memutuskan apakah suatumodel/variabel independen signifikan (H1) atau tidak signifikan (H0).

benconomy.wordpress.com 23

Page 24: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

4.2 Regresi OLS dengan StataDapat dikatakan seperti “Swiss Army Knife” pemodelan, regresi OLS digunakansecara paling luas dan menjadi alat paling mendasar dalam berbagai aplikasi pe-modelan ekonomi. Sintaks perintah regresi OLS di Stata adalah sebagai berikut:regress depvarname indepvarlist regress

Perhatikan bahwa variabel yang pertama disebut adalah (satu) variabel inde-penden (y), sedangkan variabel-variabel yang disebut berikutnya adalah variabel-variabel independent (x1, x2, . . . , xj) dalam model persamaan yang hendak diesti-masi. Berikut adalah contoh perintah dan output regresi dalam Stata dan panduaninterpretasinya.

A – Bagian ini adalah global test untuk signifikansi model (apakah variasi dalammodel dapat menjelaskan variasi dalam variabel dependen - joint test). Duastatistik yang dilaporkan adalah statistik F dan p-value-nya.

B – Bagian ini melaporkan goodness of fit dari model, yaitu berapa “persen”variasi dalam variabel dependen dapat dijelaskan oleh model, yaitu R2 danR2

adj. R2adj mengkoreksi bias positif pada R2 akibat penambahan variabel

independen.

C – Konstanta (β0). Stata dapat mencegah adanya konstanta, dengan cara menam-bahkan opsi noconstant (tidak dianjurkan karena akan membuat estimatormenjadi tidak konsisten).

D – Koefisien parameter estimasi βj untuk masing-masing variabel independenxj. Bagian ini dapat diinterpretasikan: “Bertambahnya 1 unit weight menye-babkan kenaikan 5.774712 dalam price”.

benconomy.wordpress.com 24

Page 25: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

E – Standar error parameter estimasi sd(βj).

F – Statistik t untuk masing-masing variabel independen. Statistik t dihitungdari βj/sd(βj).

G – p-value untuk menguji signifikansi masing-masing variabel.

H – Range masing-masing parameter estimasi dalam rentang confidence interval.Level yang dilaporkan dapat diatur dengan menambahkan opsi level()

4.3 Penanganan Pelanggaran Asumsi4.3.1 Heteroskedasitas

Heteroskedasitas adalah keadaan ketika varians error berubah seiring perubahannilai variabel independen xj. Heteroskedasitas umumnya tidak menyebabkan in-dikator menjadi bias, namun menyebabkan kesalahan dalam perhitungan standarerror, yang menurunkan efisiensi model.

Deteksi Terdapat dua metode statistik untuk mendeteksi heteroskedasitas sete-lah suatu model regresi diestimasi:

Breuch-Pagan Tes ini melakukan regresi OLS dengan ε2 sebagai variabel depen-den dan fitted values model sebagai variabel independen. Untuk menggu-nakan seluruh variabel independen dari model utama sebagai variabel inde-penden, tambahkan opsi rhs. Metode ini mampu mendeteksi heteroskeda-sitas yang bersifat linear. Perintah untuk melakukan BP-test adalah estathettest. Hasil yang dilaporkan adalah LM test-statistic yang mengikuti dis- hettesttribusi χ2 dan p-valuenya.

White Tes ini melakukan regresi OLS dengan varepsilon2 sebagai variabel depen-den dan seluruh variabel independen, kuadrat dan hasil perkaliannya darimodel utama sebagai variabel independen. Dengan demikian, metode inimampu mendeteksi heteroskedasitas dalam bentuk yang lebih kompleks. Pe-rintah untuk melakukan White test adalah estat imtest, white. Hasil imtestyang dilaporkan termasuk LM test-statistic yang mengikuti distribusi χ2 danp-valuenya.

Metode grafis untuk mendeteksi heteroskedasitas adalah dengan melakukan ploterror (variabel y) dan salah satu variabel independen (variabel x), yang dapatdilakukan dengan perintah rvpplot varname. rvpplot

benconomy.wordpress.com 25

Page 26: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

Koreksi Terdapat dua metode statistik untuk menangani heteroskedasitas.

weight Penggunaan weights (timbangan) untuk “menormalkan” efek variabel yang“menyebabkan” heteroskedasitas. Contohnya, varians error adalah linear darisuatu variabel (Var(ε) = σ2 = αx2), sehingga perlu timbangan 1/x2

2 menghi-langkan korelasi antara x2 dengan ε. Untuk menggunakan koreksi ini, tam-bahkan [aweight=varlist] di akhir command, sebelum tanda koma. Pe-rintah untuk contoh sebulumnya:gen invdepvar2sq=1/depvar2ˆ2regress indepvar depvar1 depvar2 [aweight=invdepvar2sq] aweight

robust Tambahkan opsi robust setelah perintah estimasi untuk menggunakanstandard error yang mampu menangani adanya heteroskedasitas (heteroske-dascity robust). Contoh:regress indepvar depvar1 depvar2, robust robust

Kedua metode tersebut dapat dikombinasikan. Bila variabel yang menyebabkanheteroskedasitas tersebut diketahui, variabel tersebut dapat ditransformasikan biladimungkinkan oleh teori yang mendasari spesifikasi model.

4.3.2 Autokorelasi

Autokorelasi adalah adanya hubungan antara error satu observasi dengan errorobservasi lainnya. Autokorelasi umumnya lebih umum terjadi pada data time se-ries, di mana terjadi antara error suatu periode (εt) dengan error periode lainnya(εt−1, εt2 , . . .). Autokorelasi dapat menyebabkan parameter estimasi menjadi bias,sehingga harus ditangani.

Deteksi Untuk mendeteksi adanya autokorelasi secara grafis, Stata menyedi-akan tiga perintah:

corrgram varname corrgramac varname (grafik autokorelasi) acpac varname (grafik autokorelasi parsial)

pacTambahkan opsi lags(#) untuk menampilkan autokorelasi sebanyak # lag.Terdapat dua metode statistik untuk mendeteksi adanya autokorelasi.

Durbin-Watson Pengujian Durbin-Watson hanya dapat mendeteksi autokorelasidengan lag 1 error (εt−1). Statistik Durbin Watson berada di antara 0-4.Nilai dekat 0 mengindikasikan autokorelasi positif, sedangkan nilai dekat4 mengindikasikan autokorelasi negatif. Dengan demikian, nilai dekat 2mengindikasikan tidak adanya autokorelasi. Perintah untuk menampilkanstatistik Durbin-Watson di Stata adalah estat dwatson. Pengembangan uji dwatson

benconomy.wordpress.com 26

Page 27: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

Durbin menghasilkan estat durbinalt yang memungkinkan uji hipotesis. durbinaltTambahkan opsi lags(numlist) untuk menspesifikasikan lag autokorelasiyang diuji.

Breuch-Godfrey Tes Breuch-Godfrey dilakukan dengan melakukan regresi errorterhadap error lag periode yang dispesifikasikan. Perintah untuk BG test diStata adalah sebagai berikut:estat bgodfrey, lags(numlist) bgodfreydi mana numlist adalah lag-lag yang ingin diuji (dapat lebih dari satu).Pengujian sebanyak lebih dari 1 lag periode dilakukan secara terpisah.

Koreksi Koreksi untuk masalah autokorelasi sebaiknya dilakukan mengubahspesifikasi model, atau menggunakan metode time series (bukan hanya OLS),seperti penambahan lag variabel dependen ke dalam model (model AR). Walaudemikian, terdapat dua metode OLS yang mampu menangani autokorelasi. Per-tama, menggunakan transformasi Cochrane-Orkutt dengan perintah sebagai berikut:

prais depvar indepvarlist, corc praisPerintah ini memiliki berbagai opsi dan pendekatan lain untuk menangani autoko-relasi yang dapat dieksplorasi lebih lanjut. Kedua, menggunakan standar errorNewey-West yang robust terhadap autokorelasi (dan heteroskedasitas) dengan pe-rintah sebagai berikut:

newey depvar indepvarlist, lag(#) neweyPerintah ini memungkinkan penanganan lags dengan order yang lebih tinggi. Lagsmaksimum yang digunakan dalam model dapat dispesifikasikan menggunakan opsilags(#)

4.3.3 Multikolinearitas

Multikolinearitas adalah adanya kombinasi linear korelasi antara variabel-variabelindependen, yang menyebabkan adanya korelasi. Kolinearitas antara dua variabelindependen dapat dilihat secara grafis dengan menggunakan perintahgraph matrix varlist.

Dalam Stata, statistik untuk mendeteksi multikolinearitas dapat ditampilkandengan perintah estat vif. Nilai Mean VIF yang lebih dari 10 dapat dikatakan vifmengindikasikan adanya kolinearitas. Namun, tidak terdapat batasan yang definitifmengenai statistik ini untuk menguji hipotesis secara statistik.

Secara matematis, tidak mungkin melakukan estimasi OLS bila terdapat satuvariabel independen yang adalah gabungan dari satu atau lebih variabel independenlain. Dalam sebagian besar kasus, multikolinearitas umumnya tidak menyebabkanmasalah estimasi. Bahkan, sulit untuk menemukan variabel-variabel independen

benconomy.wordpress.com 27

Page 28: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

yang tidak berkorelasi (terutama untuk data time series). Multikolinearitas mu-lai menjadi masalah bila terdapat variabel yang ‘benar-benar’ bergerak bersama(korelasi >90%). Hal ini dapat menyebabkan variabel-variabel yang mengalamikolinearitas secara bersama-sama tidak signifikan, sedangkan sebenarnya berpen-garuh terhadap variabel dependen (signifikan secara joint test). Kolinearitas akanhilang dengan mengeluarkan variabel yang ber-kolinear dari model. Namun, haltersebut dapat menyebabkan omitted variabel bias yang serius. Tidak terdapatmetode yang definitif untuk menangani multikolinearitas, sehingga menjadi kebi-jakan peneliti untuk memutuskan variabel yang tetap dimasukkan dalam modelbilamana terjadi multikolinearitas.

4.4 Instrumental VariablesPenggunakan Instrumental Variables (berikutnya disebut IV) dalam regresi adalahsalah satu teknik untuk menangani pelanggaran asumsi adanya korelasi antarasatu atau lebih variabel independen dengan error term ε. Dimulai dari spesifikasipersamaan utama;

yi = β0 + β1x1i + · · ·+ βjxji + βkxki + · · ·+ βmxmi + εi

di mana variabel-variabel βkxki + · · ·+ βmxmi berkorelasi dengan error;

Corr ((xk, . . . , xm) , εi) = 0

Pelanggaran ini akan menyebabkan estimator yang bias dan tidak konsisten. Pen-gujian dapat dilakukan dengan cara regresi dengan menggunakan error dari modelutama sebagai variabel dependen.

Untuk mengatasi masalah bias yang ditimbulkan, diperlukan adanya variabelz1, z2, . . . , zv yang berkorelasi dengan variabel yang bermasalah dan tidak berko-relasi dengan error untuk dijadikan IV untuk variabel yang bermasalah tersebut.Dengan demikian, variabel independen dalam model tidak lagi berkorelasi denganerror, sehingga dapat dihasilkan parameter yang konsisten.Perintah untuk menerapkan regresi dengan IV adalah:ivregress method depvar indepvarlist (indepvarlist2 = ivvarlist) ivregress

method adalah cara melakukan estimasi dengan IV. 3 metode yang dapat dipilihadalah 2SLS, liml dan gmm.

depvar adalah variabel independen yang diestimasi.

indepvarlist adalah variabel-variabel independen yang tidak mengalami masalahkorelasi dengan error.

benconomy.wordpress.com 28

Page 29: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

indepvarlist2 adalah variabel-variabel independen yang mengalami masalah ko-relasi dengan error, sehingga dicarikan variabel instrumen.

ivvarlist adalah variabel-variabel yang dijadikan Instrumental Variable.

4.5 Specification TestPengujian spesifikasi adalah salah satu topik paling penting dalam pemodelan, dimana spesifikasi persamaan regresi diuji untuk mendapatkan fungsi regresi populasiyang sedekat mungkin dengan fungsi “asli”. Teori yang dipelajari melalui pemode-lan sering memberi usul mengenai bentuk persamaan model secara a priori, yangtidak selalu didukung dengan temuan parameter estimasi. Hal ini membuat pen-gujian spesifikasi menjadi penting: Data dapat mengusulkan temuan yang berbedadengan teori, atau memperlihatkan bahwa teori tersebut benar atau tidak. Men-dapat “informasi” yang tepat dari data adalah tujuan dari pengujian spesifikasi:Apakah suatu variabel signifikan dalam model, bagaimana seharusnya suatu va-riabel dispesifikasikan dalam model (linear, logaritma, dlsb.), dan apakah perluditambahkan variabel independen lainnya ke dalam model.

Dua hal perlu diperhatikan dalam pengujian spesifikasi. Pertama, adanya va-riabel yang redundant atau tidak signifikan tidak akan parameter estimasi menjadibias, namun akan mengurangi degrees of freedom dan efisiensi model. Kedua,adanya variabel yang signifikan namun tidak dimasukkan dalam suatu model akanmembuat parameter menjadi bias. Bias memiliki pengaruh yang lebih merusakdibandingkan inefisiensi. Hal ini menunjukkan pentingnya pengujian spesifikasiyang dilakukan secara benar.

Metode formal uji spesifikasi cukup luas, termasuk pengujian manual sepertidalam metode Mizon dan Richard (1986)§ atau Davidson MacKinnon “J Test”(1981)¶ untuk non-nested model dan metode Ramsey Regression Error Specifica-tion Test (RESET)‖. Stata memiliki command untuk melakukan pengujian RamseyRESET, dengan perintah sebagai berikut:estat ovtest ovtest

§Masukkan berbagai bentuk spesifikasi fungsional dari variabel yang sama ke dalam model, danuji menggunakan Wald test apakah koefisien untuk masing-masing kelompok spesifikasi apakahkoefisionnya sama dengan 0.

¶Untuk mempelajari bentuk fungsional spesifikasi A dan B, lakukan estimasi untuk keduapersamaan tersebut, dan diambil error masing-masing persamaan. Ambil persamaan dari satumodel (misal model A) dan masukkan ke model satunya (Model B) sebagai variabel independen.Lakukan regresi model satunya tersebut dengan error. Bila koefision error model A dalam modelB tersebut tidak signifikan, model A telah dispesifikasikan dengan benar. Prosedur yang samadilakukan untuk model B.

‖Mengambil polinomial dari fitted values dan memasukkannya ke dalam model utama. Bilapolinomial model utama signifikan, maka model tersebut mengandung omitted variables.

benconomy.wordpress.com 29

Page 30: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

ovtest adalah singkatan untuk ommited variable test. Perintah ini dapat di-lakukan setelah estimasi OLS. Bila kita ingin menggunakan polinomial dari va-riabel independen (bukan hanya fitted values variabel dependen), tambahkan opsirhs.

4.6 Setelah estimasi…4.6.1 Perintah predict

Perintah predict berguna untuk membuat prediksi dari estimasi yang telah di-lakukan, baik prediksi fitted values, residual, dan lainnya. Berikut sintaks perintahtersebut.

predict varname, options predictHasil perintah tersebut dimasukkan dalam variabel baru (varname) yang dispesi-fikasikan. Nilai yang dapat diprediksi dispesifikasikan dalam options:

xb Analogis dengan Xβ, yaitu prediksi linear/fitted values dari model.

residuals Error εi hasil regresi.

rstd Nilai standardized dari error.

stdp Standar error nilai fitted values.

stdf Standar error nilai forecast (nilai baru).

stdr Standar error nilai error.

4.6.2 Perintah estimates

Perintah estimates berguna untuk menyimpan, mengelola dan mengakses hasil estimatesestimasi yang telah dilakukan sebelumnya. Dengan adanya fitur ini, kita tidak perlumenyimpan log-file Stata (.smcl) hanya untuk menyimpan hasil estimasi (lihat opsisave). Di samping itu, perintah ini juga menyimpan lebih banyak detail yang tidakditampilkan dalam tabel laporan estimasi. Berikut adalah beberapa penggunaanperintah tersebut.

estimates store modelname — menyimpan hasil regresi ke dalam memori(hilang bila Stata dimatikan) dengan nama modelname. Untuk mengak-ses/mengaktifkan kembali hasil estimasi yang telah di-store, gunakan perintahestimates restore modelname.

estimates save filename — menyimpan hasil regresi dengan nama filenameke hard-disk. Untuk mengakses kembali hasil estimasi yang telah di-save,gunakan perintah estimates use filename.

benconomy.wordpress.com 30

Page 31: Pelatihan Komputasi dengan Stata · PDF file3 Analisis Deskriptif 15 ... Cross section. Struktur data ini adalah struktur data yang dasar di Stata. Tidakadaunsurwaktudalamvariabelini

4 Analisis Regresi OLS

estimates replay modelnamelist — menampilkan kembali laporan/tabel esti-masi untuk hasil model-model dalam memori. Untuk menampilkan kembaliperintah regresi yang dilakukan dalam suatu model yang disimpan, gunakanperintah estimates describe modelname (hanya satu model).

estimates table modelnamelist, options — menampilkan satu atau lebihhasil estimasi dalam suatu tabel secara vertikal, yang (terutama) bergunauntuk memilih model. Opsi yang dapat digunakan adalah:

• Menampilkan beberapa statistik sekaligus untuk satu model, atau meng-gunakan ‘bintang’ (*) untuk menandai variabel yang signifikan. Bilakita ingin menampilkan beberapa statistik sekaligus, tambahkan statis-tik yang diinginkan secara langsung: b (koefisien estimasi), se (standarderror koefisien estimasi), t (statistik t terkait) dan p (p-value). Bila kitaingin menggunakan ‘bintang’ tambahkan opsi star(#1 #2 #3), di mana#1 adalah angka untuk mendapat 1 bintang, #2 adalah angka untukmendapat 2 bintang, dan seterusnya.

• Menampilkan statistik goodness of fit model. Statistik yang dapat dita-mpilkan dimasukkan dalam stat(list), di mana list dapat berupa r2(R2), r2_a (adjusted R2) ll (likelihood ratio), N (jumlah sampel), df_r(degress of freedom model), AIC dan BIC.

Untuk menunjukkan bagaimana menggunakan estimates digunakan, beberapabaris perintah berikut ini dapat menampilkan contohnya.sysuse auto, clearregress pr mp re trestimates store model1regress pr mp reestimates store model2estimates table model1 model2, b se p stats(r2 r2_a df_r)estimates table model1 model2, star(0.05 0.01 0.001)estimates describe model1estimates describe model2estimates replay model1 model2

Alternatif perintah estimates table yang memiliki kemampuan menampilkanbeberapa statistik sekaligus dan bintang secara bersamaan, kontrol hasil tampilanlebih baik serta ekspor hasil ke program lain (seperti LATEX) adalah paket estout.Gunakan perintah ssc install estout, replace untuk meng-install paket inike dalam Stata (dibutuhkan koneksi internet untuk download paket).

benconomy.wordpress.com 31