pendekatan random forest untuk model …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan...

98
i PENDEKATAN RANDOM FOREST UNTUK MODEL PERAMALAN HARGA TEMBAKAU RAJANGAN DI KABUPATEN TEMANGGUNG SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Diajukan oleh: Agenda Yudha Samudra NIM: 155314025 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2019 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Upload: others

Post on 09-Mar-2021

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

i

PENDEKATAN RANDOM FOREST UNTUK MODEL PERAMALAN HARGA

TEMBAKAU RAJANGAN DI KABUPATEN TEMANGGUNG

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Diajukan oleh:

Agenda Yudha Samudra

NIM: 155314025

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2019

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 2: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

ii

RANDOM FOREST APPROACH TO FORECAST MODEL OF CHOPPING

TOBACCO PRICE AT TEMANGGUNG

THESIS

Submitted in Partial Fullfillment of The Requirements

for The Degree of Sarjana Komputer

in Informatics Engineering Study Program

By :

Agenda Yudha Samudra

NIM : 155314025

INFORMATICS ENGINEERING STUDY PROGRAM

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2019

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 3: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

iii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 4: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

iv

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 5: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

v

.

HALAMAN PERSEMBAHAN

Innallaha ma’ashshobiriin...

(Allah selalu bersama hamba-Nya yang bersabar)

Kupersembahkan untuk:

Ibu dan Bapak tercinta,

Kakakku,

Calon Pendamping hidupku,

Teman-temanku,

serta orang-orang yang kusayangi

Semoga bermanfaat bagi kehidupan manusia.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 6: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

vi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 7: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

vii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 8: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

viii

PRAKATA

Assalamualaikum warahmatullahi wabarakatuh.

Puji syukur atas berkat dan rahmat Allah SWT yang telah memberikan

kesempatan hidup serta kasih dan karunia yang tak hingga kepada penulis sehingga

dapat menyelesaikan skripsi dengan judul “Pendekatan Random Forest Untuk

Model Peramalan Harga Tembakau Rajangan di Kabupaten Temanggung”.

Skripsi ini disusun untuk memenuhi salah satu syarat memperoleh gelar Sarjana

Teknik Informatika di Fakultas Sains Dan Teknologi, Universitas Sanata Dharma,

Yogyakarta.

Penulis sadar bahwa dalam proses pelaksanaan dan penyusunan skripsi ini

banyak sekali bantuan, bimbingan, dan dukungan dari berbagai pihak. Oleh karena

itu, ijinkan penulis untuk mengucapkan terima kasih kepada:

1. Bapak Sudi Mungkasi, S.Si., M.Math.Sc., PhD. selaku Dekan Fakultas Sains dan

Teknologi Universitas Sanata Dharma.

2. Ibu Dr. Anastasia Rita Widiarti selaku Ketua Program Studi Teknik Informatika

Fakultas Sains Dan Teknologi Universitas Sanata Dharma.

3. Ibu Agnes Maria Polina, S.Kom., M.Sc. selaku Dosen Pembimbing sekaligus Dosen

Penguji skripsi yang telah memberikan bimbingan, masukan, kritik, dan saran

dengan sangat sabar dari awal penelitian hingga akhir penyusunan skripsi.

4. Para Dosen Penguji yang telah memberikan masukan, kritik, dan saran yang

sangat membangun dalam proses penelitian dan penyusunan skripsi.

5. Keluarga Tercinta: Ibuk, Bapak, Mas Dhito, dan semua Pakdhe, Budhe, Bulik,

Om, dan Sepupu-Sepupuku yang selalu mendukung dengan nasihat dan doa tulus

demi kelancaran studi.

6. Terkhusus: Novi Morita Siwi, terima kasih banyak atas segala bantuan tenaga,

hati, dan pikiran, selama ini sudah membantu, membimbing, menemani, dan

memberikan semangat.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 9: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

ix

7. Teruntuk teman teman saya, Christian, Osmond, Timmo danYulius, terima kasih

atas support dan mau bertukar pikiran dalam perkuliahan.

8. Teman-teman FST 2015 Universitas Sanata Dharma atas segala kisah

perkuliahan.

9. Semua pihak yang tidak dapat disebutkan satu per satu, terima kasih banyak atas

doa dan dukungannya sehingga penulis dapat menyelesaikan skripsi ini.

Penulis sangat sadar bahwa masih banyak kesalahan dan kekurangan dalam

penulisan skripsi ini. Oleh karena itu, penulis memohon kritik dan saran yang

membangun agar penulisan skripsi dapat menjadi lebih baik. Demikian prakata yang

dapat disampaikan, semoga skripsi ini dapat menjadi manfaat bagi pembaca.

Wassalamualaikum warahmatullahi wabarakatuh.

Yogyakarta, …………….. 2019

Penulis,

Agenda Yudha Samudra

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 10: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

x

DAFTAR ISI

HALAMAN JUDUL .............................................................................. i

HALAMAN PERSETUJUAN PEMBIMBING .................................... iii

HALAMAN PENGESAHAN ................................................................ iv

HALAMAN PERSEMBAHAN ............................................................ v

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI ................. vi

PERNYATAAN KEASLIAN KARYA ................................................ vii

PRAKATA ............................................................................................. viii

DAFTAR ISI .......................................................................................... x

DAFTAR TABEL .................................................................................. xiii

DAFTAR GAMBAR ............................................................................. xiv

DAFTAR LAMPIRAN .......................................................................... xv

ABSTRAK ............................................................................................. xvi

ABSTRACT ............................................................................................. xvii

BAB I PENDAHULUAN ...................................................................... 1

1.1 Latar Belakang ........................................................................ 1

1.2 Rumusan Masalah ................................................................... 3

1.3 Tujuan Penelitian .................................................................... 3

1.4 Batasan Masalah ...................................................................... 4

1.5 Sistematika Penulisan ............................................................. 4

BAB II LANDASAN TEORI ................................................................ 6

2.1 Klasifikasi Tembakau .............................................................. 6

2.2 Faktor yang Mempengaruhi Kualitas Tembakau .................... 6

2.3 Penambangan Data .................................................................. 7

2.4 Peramalan ................................................................................ 9

2.5 Imputasi ................................................................................... 10

2.6 Classification And Regression Tree (CART) .......................... 10

2.7 Random Forest ........................................................................ 11

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 11: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xi

2.8 Jumlah Pohon Dalam Random Forest ..................................... . 13

2.9 Menghitung Akurasi ............................................................... 15

BAB III METODE PENELITIAN ......................................................... 16

3.1 Sumber Data ............................................................................ 16

3.2 Tahap-tahap Penelitian ............................................................ 17

3.2.1 Studi Pustaka .................................................................. 17

3.2.2 Observasi ........................................................................ . 18

3.2.3 Pengolahan Data ............................................................. 18

3.2.4 Pembuatan Alat Uji ......................................................... 20

3.2.5 Analisa Hasil dan Pembuatan Laporan .......................... 20

3.3 Spesifikasi Alat ....................................................................... 20

BAB IV PERANCANGAN PERANGKAT LUNAK ........................... 21

4.1 Perancanganan Sistem ............................................................. 21

4.1.1 Input ............................................................................... 21

4.1.2 Proses ............................................................................. 21

4.1.3 Output ............................................................................. 22

4.2 Preprocessing .......................................................................... 22

4.2.1 Missing data .................................................................... 22

4.2.2 Data selection ................................................................. 23

4.2.3 Data transformation ......................................................... 24

4.2.4 Data integration .............................................................. 24

4.2.5 Membagi data training dan data testing ......................... 25

4.2.6 Membangun model Random Forest ............................... 25

4.3 Desain Antarmuka ................................................................... 25

4.4 Pengujian ................................................................................. 26

4.5 Pengukuran Akurasi Sistem ..................................................... 26

BAB V ANALISA HASIL .................................................................... 27

5.1 Implementasi Desain Antarmuka ............................................ 27

5.2 Hasil Prediksi .......................................................................... 27

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 12: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xii

5.3 Analisis Hasil Prediksi ............................................................. 28

BAB VI PENUTUP ............................................................................... 31

6.1 Kesimpulan ............................................................................. 31

6.2 Saran ........................................................................................ 31

DAFTAR PUSTAKA ............................................................................ 32

LAMPIRAN ........................................................................................... 34

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 13: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xiii

DAFTAR TABEL

Tabel 1 Dataset pada penelitian How Many Tree in Random Forest .......................... 13

Tabel 2 Atribut dataset ......................................................................................... 16

Tabel 3 Perbandingan Jumlah Pohon Untuk Nilai Akurasi .................................. 30

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 14: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xiv

DAFTAR GAMBAR

Gambar 2.1 Sturktur Pohon Klasifikasi ........................................................... 11

Gambar 2.2 Random Forest ........................................................................... 12

Gambar 3.1 Blok Diagram .............................................................................. 18

Gambar 4.1 Flowchart Diagram .................................................................... 21

Gambar 4.2 Desain Antarmuka Sistem ........................................................... 26

Gambar 5.1 Antarmuka Sistem Prediksi ......................................................... 27

Gambar 5.2 Hasil Ploting untuk Random Forest dengan jumlah pohon 64 .... 28

Gambar 5.3 Pohon ke 1 dari 64 pohon dalam Random Forest........................ 29

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 15: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xv

DAFTAR LAMPIRAN

Lampiran 1 Tabel 4. Produk Domestik Regional Bruto Atas Dasar Harga Berlaku

Menurut Lapangan Usaha di Kabupaten Temanggung (Miliar rupiah)

2014-2017 (Badan Pusat Statistik Kabupaten Temangggung, 2018) .. 35

Lampiran 2 Tabel 5. Luas area dan produksi Tembakau Perkebunan Rakyat

Menurut Kabupaten dan keadaan Tanaman tahun 2014-2017 (Badan

Pusat Statistik Provinsi Jawa Tengah, 2017) ...................................... 37

Lampiran 3 Contoh Pembuatan Model Random Forest ........................................... 38

Lampiran 4 Dataset Iklim harian Tahun 2015 dari Bulan April Hingga

September .............................................................................................. 59

Lampiran 5 Contoh Dataset Transaksi Tembakau PT. GUDANG GARAM

TBK ..................................................................................................... 80

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 16: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xvi

ABSTRAK

Tembakau merupakan tanaman perkebunan unggul yang mempunyai nilai

ekonomis yang tinggi dan sudah lama diusahakan oleh petani tembakau di Jawa

Tengah khususnya di kabupaten Temanggung. Tidak adanya standarisasi harga dan

mutu tembakau menyebabkan harga kerugian di pihak petani dikarenakan untuk

menentukan harga tembakau rajangan masih bergantung kepada grader pabrik.

Dalam penelitian ini dibangun perangkat lunak untuk memprediksi harga

tembakau rajangan di kabupaten Temanggung dengan menggunakan metode Random

Forest dan diimplementasikan menggunakan Python.

Metode Random Forest merupakan pengembangan dari CART dengan

menerapkan metode bootstrap aggregating (bagging) dan random feature selection.

Dimana tidak hanya menghasilkan satu pohon tetapi puluhan hingga ratusan pohon

dari data replacement yang selanjutnya dilakukan pengumpulan informasi sehingga

pada Random Forest dapat dihasilkan pohon dengan ukuran yang berbeda-beda. Ini

dikarenakan pohon yang dihasilkan oleh dari bootstrap dan replacement tidak

dilakukan pemangkasan, Pada proses klasifikasi, didasarkan pada vote dari suara

terbanyak pada kumpulan populasi pohon, sedangkan untuk regresi menggunakan

hasil rata-rata populasi pohon.

Atribut yang digunakan dalam penelitian ini adalah suhu rata-rata,

kelembaban rata-rata ,curah hujan, lama penyinaran, seri, grade dan harga. Dengan

menggunkan data iklim dan penjualan tembakau sebanyak 1244 record, menunjukkan

bahwa hasil prediksi mencapai akurasi 82.39%.

Kata Kunci : Tembakau, Random Forest, CART

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 17: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

xvii

ABSTRACT

Tobacco is a superior crop that has high economic value and has long been

cultivated by tobacco farmers in Central Java, especially in Temanggung regency.

There is no standardization of the price and quality of tobacco which causes farmer

prices on the part of the parties to determine the price of chopped tobacco still

depends on the grader's factory.

In this study, the software was built to predict knit prices in the Temanggung

district by using the Random Forest method and implemented using Python.

The Random Forest method is the development of CART using the bootstrap

aggregating (bagging) method and random feature selection. Where not only produce

one tree but make a replacement tree for data which is then collected information so

that in Random Forest can produce trees of different sizes. This is related to the tree

produced by bootstrap and replacements are not pruned, in the classification process,

based on the sound of the most sounds in the tree cluster, whereas for regression

using the results of the average tree population.

The attributes used in this study are average temperature, average

temperature, rainfall, duration of irradiation, series, grade and, price. By using climate

data and sales of tobacco as many as 1244 records, the prediction results reached an

accuracy of 82.39%.

Keywords: Tobacco, Random Forest, CART

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 18: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Pertanian Indonesia adalah pertanian tropika yang sangat terpengaruh oleh

iklim. Selain permasalan produksi, pertanian Indonesia juga dihadapkan pada

fluktuasi harga. Fluktuasi harga yang berisiko pada harga komoditas pertanian

serta besarnya pembiayaan menjadi risiko tersendiri terhadap pendapatan yang

diharapkan petani (Ihsannudin, 2010).

Dalam meningkatkan kualitas dan produksitas hasil panen, petani harus

cakap dalam penyesuaian lahan. Pertumbuhan suatu tanaman sangat dipengaruhi

oleh empat faktor, yakni adaphis (tanah), climatis (iklim), fisiografis (benteng

alam), dan biologis. Komponen tanah yang penting adalah struktur dan tekstur

tanah, termasuk susunan partikel tanah, air tanah, temperatur tanah, dan hara

mineral tanah yang terkandung (Alfa Susetyo Yerymia, 2011).

Tembakau merupakan tanaman perkebunan unggul yang mempunyai nilai

ekonomis yang tinggi dan sudah lama diusahakan oleh petani tembakau di Jawa

Tengah. Tanaman tembakau berperan penting bagi perekonomian Indonesia,

terutama dalam penyediaan lapangan pekerjaan, sumber pendapatan bagi petani

dan sumber devisa bagi negara disamping mendorong berkembangnya agribisnis

tembakau dan agroindustri (Cahyono, 2005).

Pemetikan dilakukan antara 5-7 hari dengan selanh waktu 2-7 hari. Panen

pertama baru dapat dimulai sekitar 90 hari setelah tanam dan lama panen sekitar

20-30 hari (pemeraman, penggulungan). Sedangkan proses pengolahan sekitar 7-

10 hari (perajangan, penjemuran, pengemasan) itu bergantung pada sinar matahari

(Samsuri Tirtosastro,2004)

Komoditas pertanian tembakau mempunyai karakteristik spesifik, terlebih

lagi sifat kriteria tembakau dapat dikatakan unik, dengan grade yang sama akan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 19: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

2

tetapi harga tembakau rajangan berbeda. Grade tembakau dipengaruhi oleh

berbagai macam faktor mulai dari penanaman hingga pengemasan.

Usaha standardisasi belum berhasil dengan baik dan perdagangan

tembakau masih menggunakan cara lama, yaitu penentuan mutu dan harga secara

subyekif oleh konsumen (pabrikan). Penyebab belum berhasilnya penerapan

standar mutu tersebut karena stand mutu belum seluruhnya sesuai dengan selera

konsumen dan juga maraknya pemalsuan mutu (Samsuri Tirtosastro, 2004).

Davies dan Nielsen (1999), berpendapat bahwa mutu tembakau

mempunyai pengertian relatif, yang dapat berubah setiap saat karena pengaruh

orang, waktu dan tempat. Dapat disimpulkan bahwa mutu tembakau merupakan

sesuatu yang tidak tetap, mudah berubah sesuai ekonomi, selera konsumen dan

keputusan pabrikan menentukan karakteristik rokok yang dipasarkan.

Peramalan merupakan alat bantu yang penting dalam perencanaan yang

efektif dan efisien (Makridakis et al., 1991). Seringkali, dalam peramalan data

time series menunjukkan perilaku yang bersifat musiman. Musiman didefinisikan

sebagai kecenderungan data time series yang berulang setiap periode. Musiman

adalah istilah yang digunakan untuk mewakili periode waktu yang berulang

(Kalekar: 2004).

Menurut Pramudiono, data mining adalah analisi otomatis dari data yang

berjumlah besar atau kompleks dengan tujuan untuk menemukan pola

kecenderungan yang penting yang biasanya tidak disadari keberadaannya. Data

mining memiliki berbagai macam teknik, salah satunya adalah peramalan atau

forcasting (Kursrini & Luthfi, 2009).

Pada Lampiran 1, kabupaten Temanggug dengan luas wilayah 87.026 ha

terbagi menjadi 20 kecamatan, 266 desa dan 23 kelurahan merupakan daerah

yang menjadikan tembakau sebagai produk unggulan. Sektor pertanian menjadi

sektor penyumbang terbersar dalam pembetukan PDRBnya. Terdapat lima

subsektor pertaniaan di Kabupaten Temanggung antara lain tananam perkebunan,

tanaman pangan, perternakan, kehutanan dan perikanan. Hampir 70% dari

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 20: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

3

759.128 pedudukan adalah petani. Sektor pertanian ini menyumbang sekitar 24%

PDRB dari 20 industri dari pendapatan total PDRB 18.833.19 pada tahun 2017

(BPS Jawa Tengah, 2018).

Pada Lampiran 2, dapat dilihat bahwa Kabupaten Temanggung menempati

urutan pertama luas area dan produksi tembakau dibadingkan kabupaten-

kabupaten lainnya di Provinsi Jawa Tengah. Hal ini dapat dilihat juga dari aspek

ekologi dan geografis Kabupaten Temanggung yang cocok untuk perkembangan

tembakau dibandingkan dengan daerah-daerah lain. Dalam segi produksi

Kabupaten Temanggung merupakan pengahasil tembakau terbesar di Provinsi

Jawa Tengah dengan angka 10.581 ton pada tahun 2015.

Berdasarkan uraian di atas, peneliti mencoba untuk menganalisis pola data

harga tembakau di kabupaten Temanggung dengan menerapkan metode Random

Forest. Sehingga, berdasarkan dari latar belakang diatas maka penulis

mengangkat judul “PENDEKATAN RANDOM FOREST UNTUK MODEL

PERAMALAN HARGA TEMBAKAU RAJANGAN DI KABUPATEN

TEMANGGUNG”

1.2 Rumusan Masalah

a. Bagaimana membuat perangkat lunak peramalan untuk memprediksi harga

tembakau di Kabupaten Temanggung ?

b. Berapakah persentase akurasi yang diperoleh dalam proses peramalan untuk

memprediksi harga tembakau di Kabupaten Temanggung ?

1.3 Tujuan Penelitian

Tujuan penelitian ini yaitu membuat model peramalan untuk memprediksi

data harga tembakau di kabupaten Temanggung dengan pendekatan Random

Forest.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 21: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

4

1.4 Batasan Masalah

Batasan masalah yang ditentukan dalam penelitian ini, antara lain :

1. Metode peramalan yang digunakan adalah teknik Random Forest.

2. Dataset yang digunakan adalah data iklim harian tahun 2015, dan data

transaksi PT. GUDANG GARAM TBK pada tahun 2015 di kabupaten

Temanggung.

3. Pada penelitian ini menggunakan beberapa atribut, antara lain :

a. Suhu rata-rata

b. Kelembaban rata-rata

c. Curah hujan

d. Lama penyinaran matahari

e. Seri

f. Grade

g. Harga

4. Aplikasi yang dibuat menggunakan Pyhton.

5. Proses tanam tembakau hingga tembakau rajangan siap untuk dijual

memerlukan jangka waktu 4 bulan.

1.5 Sistematika Penulisan

Penulisan tugas akhir ini tersusun dari 6 (enam) bab dengan sistematika

penulisan sebagai berikut :

a. BAB I PENDAHULUAN

Bab ini berisi latar belakang, rumusan masalah, tujuan penelitian, batasan

masalah, sistematika penulisan.

b. BAB II LANDASAN TEORI

Bab ini menjelaskan tentang landasan teori yang akan menjadi dasar

penelitian implementasi algoritma Random Forest.

c. BAB III METODOLOGI PENELITIAN

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 22: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

5

Bab ini berisi tentang sumber data, studi pustaka, observasi, pengolahan data,

pembuatan alat uji, analisa hasil dan pembuatan laporan, spesifikasi alat.

d. BAB IV PERANCANGAN PERANGKAT LUNAK

Bab ini berisi tentang perancangan sistem mulai dari input, proses, dan output.

serta proses preprocessing, desain antarmuka, pengujian, pengukuran akurasi.

e. BAB V ANALISA HASIL

Bab ini berisi analisa hasil dari algoritma Random Forest, dan hasil prediksi.

f. BAB VI PENUTUP

Bab ini berisi kesimpulan dari penelitian yang sudah dibangun dan dijalankan

juga memuat saran-saran yang bisa digunakan guna memperbaiki dan

mengembangkan penelitian di kemudian hari.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 23: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

6

BAB II

LANDASAN TEORI

2.1 Klasifikasi Tembakau

Tembakau secara umum dapat diklasifikasikan :

Divisio : Spermatophyta

Sub divisio : Angiospermae

Class : Dicotyledoneae

Ordo : Solanales

Famili : Solanaceae

Genus : Nicotiana

Species : Nicotiana tabacum

Keadaan tanah harus memiliki pH yang berkisar 5,5-6,5. Tembakau yang

ditanam di dataran rendah memerlukan ketinggian 50-550 mdpl dengan curah

hujan 2000mm/tahun sedangkan tembakau yang ditanam di dataran tinggi

memerlukan ketinggian 1000-1500 mdpl dengan curah hujan sekitar 1500-3500

mm/tahun. Struktur tanah yang baik untuk tanaman tembakau adalah tanah yang

berstuktur gembur karena tanah ini memudahkan pertumbuhan dan

perkembangan perakaran tanaman, meningkatkan peredaran udara di dalam

tanah sehingga dapat mencegah air yang menggenang (Matnawi, 1997).

2.2 Faktor yang Mempengatuhi Kualitas Tembakau

Tembakau temanggung ditanam di 12 kecamatan dengan agroekosistem

beragam (tegal, sawah tadah hujan, sawah irigasi) dan topografi wilayah mulai

dari daerah datar, berbukit-bukit, sampai pada lereng-lereng gunung dengan

kemiringan 60o (Rochman dan Suwarso, 2000).

Tembakau temanggung sesuai ditanam di daerah dengan ketinggian 700

sampai dengan 1500 m dpl. Curah hujan yang dibutuhkan antara 2.200-3.100

mm/tahun dengan 8-9 bulan basah dan 3-4 bulan kering (Basuki et al . , 2000).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 24: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

7

Curah hujan merupakan faktor yang menentukan hasil dan mutu tembakau

temanggung, sedangkan intensitas matahari yang tinggi sangat diperlukan pada

saat panen dan pengeringan (Sholeh, 2000). Secara umum, elevasi yang tinggi

menghasilkan mutu tembakau yang tinggi, sedangkan elevasi rendah

menghasilkan mutu rendah (Purlani dan Rachman, 2000).

Menurut Djumali (2008), keterbatasan air tersedia dalam tanah berakibat

pada peningkatan produksi nikotin dalam akar, oleh karena itu ketersediaan air

dalam tanah sampai batas-batas tertentu berakibat pada peningkatan kadar

nikotin dalam daun.

Menurut Sulistyono (1995), tinggi tempat berpengaruh terhadap

temperatur udara dan intensitas cahaya. Temperatur dan intensitas cahaya akan

semakin kecil dengan semakin tingginya tempat tumbuh. Berkurangnya

temperatur dan intensitas cahaya dapat menghambat pertumbuhan karena proses

fotosintesis terganggu.

Dari (Elda Nurnasari dan Djumali, 2010), penelitian menunjukkan bahwa

ketinggian tempat mempengaruhi produksi dan kadar nikotin yang dihasilkan.

Perbedaan ketinggian tempat diikuti oleh perbedaan unsur-unsur lingkungan

(temperatur udara, kelembapan udara relatif, curah hujan, dan jumlah hari hujan)

berpengaruh terhadap produksi dan mutu tembakau Temanggung. Unsur

lingkungan yang mempengaruhi produksi adalah temperatur udara, kelembapan

relatif, curah hujan, dan jumlah hari hujan.

2.3 Penambangan data

Data mining adalah kegiatan menemukan pola yang menarik dari data

dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau

penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu

lain, seperti database system, data warehousing, statistic, machine learning,

information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 25: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

8

didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data

analysis, image database, signal processing (Han dan Kamber, 2006).

Karakteristik data mining sebagai berikut :

1. Data minig berhubungan dengan penemuan sesuatu yang tersembunyi dan pola

data tertentu yang tidak diketauhui sebelumnya.

2. Data minig biasa menggunakan data yang sangat besar. Biasanya data yang

besar digunakan untuk membuat hasil lebih dipercaya.

3. Data mining berguna untuk membuat keputusan yang kritis, tertama dalam

strategi (Davies, 2004).

Beberapa metode yang sering disebut-sebut dalam literatur data mining

antara lain clustering, classification, association rule mining, neural network,

genetic algorithm, dan lain-lain (Pramudiono, 2007).

Data mining sering disebut juga knowledge discovery in database (KDD),

adalah kegitan yang meliputi pengumpulan , pemakaian data historis untuk

menemukan keteraturan, pola atau hubungan dalam set data yang berukuran besar

(Santoso, 2007).

Penambangan data dibagi menjadi beberapa berdasarkan tugas yang

dapat dilakukan, yaitu (Kursrini & Luthfi, 2009):

1. Deskripsi

Menggambarkan pola dan kecenderungan yang terdapat dalam data. Deskripsi

dari pola dan kecenderungan sering memberikan kemungkinan penjelasan

untuk suatu pola atau kecenderungan.

2. Etimasi

Metode ini hampir sama dengan metode klasifikasi, namum pada variable

target, estimasi lebih ke arah numerik dari pada kearah kategori. Peninjauan

estimasi nilai dari variable target dibuat berdasarkan nilai prediksi.

3. Peramalan

Metode ini hampir sama dengan metode klasifikasi dan estimasi. Namum

dalam prediksi nilai dari hasil akan merujuk ke masa yang akan mendatang.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 26: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

9

4. Klasifikasi

Proses penemuan model atau fungsi yang menjelaskan atau membedakan

konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari

suatu objek yang labelnya tidak diketahui.

5. Klustering

Merupakan pengelompokan record, pengamatan, atau memperhatikan dan

membentuk kelas objek-objek yang memiliki kemiripan.

6. Asosiasi

Tugas asosiasi dalam penambangan data adalah menemukan atribut yang

muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis

keranjang belanja.

2.4 Peramalan

Menurut Martiningtyas (2004), peramalan (forecasting) adalah kegiatan

untuk memperkirakan apa yang akan terjadi pada masa yang akan datang.

Pengumpulan data yang relevan berupa informasi dapat menghasilkan peramalan

yang akurat disertai pemilihan teknik peramalan yang tepat maka pemanfaatan

informasi data akan diperoleh secara optimal.

Menurut Makridakis et al. (1991) peramalan kuantitatif dapat dilakukan

apabila terdapat 3 (tiga) kondisi, yaitu:

1. Tersedia informasi masa lalu.

2. Informasi tersebut dapat dikuantitatifkan dalam bentuk data numerik.

3. Dapat diasumsikan bahwa beberapa aspek pola masa lalu akan terus berlanjut

di masa mendatang.

Menurut Makridakis et al,. (1999), metode peramalan dibagi ke dalam

dua kategori utama, yaitu metode kualitatif dan metode kuantitatif. Metode

kuantitatif dilakukan apabila informasi masa lalu tersedia sehingga peramalan

bisa dilakukan, informasi tersebut dapat dikuantitatifkan dalam bentuk data

numerik. Dalam metode kualitatif pendapat-pendapat dari para ahli akan menjadi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 27: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

10

pertimbangan dalam pengambilan keputusan sebagai hasil dari peramalan yang

telah dilakukan. Namun, apabila data masa lalu tersedia, peramalan dengan

metode kuantitatif akan lebih efektif digunakan dibandingkan denganmetode

kualitatif.

2.5 Imputasi

Metode Imputasi adalah pengisian nilai hilang pada suatu survei. Salah

satu pendekatan dalam prosedur berbasis imputasi adalah single imputation.

Dalam single imputation, nilai hilang diisi dengan nilai penduga seperti

mean imputation, median imputation, mode imputation, cold deck imputation,

hot deck imputation. Masalah umum dalam single imputation adalah

menempatkan kembali nilai hilang dengan nilai tunggal dan kemudian

memperlakukannnya sebagaimana nilai tersebut merupakan nilai sebenarnya.

Imputation mengurangi kolelasi antara variable, dikarenakan dalam imputation

mengasumsikan bahwa tidak ada hubungan antara variable imputation dan

variable lainnya. (Little dan Rubin, 1987).

2.6 Classification And Regression Tree (CART)

Classification and regression tree, merupakan salah satu metode dari pohon

keputusan. Metode yang dikembangkan oleh Leo Breiman ini merupakan teknik

klasifikasi dengan menggunakan algoritma penyekatan rekursih secara biner

(Lewis dan Roger, 2000).

Classification and regression tree akan menghasilkan pohon klasifikasi jika

variable respon mempunyai skala kategorik dan menghasilkan pohon regresi jika

variable respon berupa data kontinu. Simpul awal disebut parent node dinotasikan

t1, simpul dalam dinotasikan dengan t2, t3, t4, t5 t7, t9 dan t13, serta simpul akhir

dinotasikan dengan t5, t6, t8, t11, t12, t14, t15, t16, dan t17 dimana setelahnya

tidak ada lagi pemilahan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 28: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

11

Gambar 2.1. Struktur Pohon Klasifikasi

2.7 Random Forest

Metode Random Forest merupakan pengembangan dari metode CART,

yaitu dengan menerapkan metode bootstrap aggregating (bagging) dan random

feature selection.

Random Forest yang dihasilkan memiliki banyak pohon bisa mencapai

ratusan, dan setiap pohon ditanam dengan cara yang sama. Beberapa fungsi

pembelajaran yang dihasilkan Random Forest digunakan strategi ensemble

bagging untuk mengatasi masalah overfitting apabila dihadapkan data train yang

kecil. Ada banyak algoritma yang dapat digunakan dalam pembentukan Decision

Tree, antara lain ID3, CART, dan C4.5 (Breiman, 2001).

Bagging atau disebut juga dengan bootstrap aggregating, merupakan

metode yang dapat memperbaiki hasil dari algoritma klasifikasi. Bagging

merupakan salah satu metode yang berdasar pada ensemble method, yaitu metode

yang menggunakan kombinasi dari beberapa model. Bagging prediktor adalah

metode yang digunakan untuk membangkitkan multiple versions dari prediktor

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 29: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

12

dan menggunakannya untuk mendapatkan kumpulan prediktor. Multiple versions

dibentuk dengan replikasi (replacement) bootstrap dari sebuah data percobaan

(Breiman, 1996).

Algoritma yang harus diikuti ketika membangun sebuah pohon

menggunakan Random Forest adalah:

1. Buat subset data dari data set menggunakan bootstrap dengan replacement

2. Gunakan subset data untuk membangun pohon ke i (i= 1,2,3 ….. k)

3. Ulangi langkah satu dan dua sebanyak k kali

Pada proses klasifikasi, individunya didasarkan pada vote dari suara terbanyak

pada kumpulan populasi pohon, sedangkan untuk regresi menggunakan hasil rata-

rata populasi pohon.

Gambar 2.2. Random Forest

Dalam membangun pohon keputusan dalam Random Forest menggunakan

metode CART, dimulai dengan cara menghitung nilai entropy sebagai penentu

tingkat ketidakmurnian atribut dan nilai information gain. Untuk menghitung nilai

entropy digunakan rumus :

Dimana :

Y : himpunan kasus

p(c|Y) : merupakam proporsi nilai Y terhadap kelaas c

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 30: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

13

Sedangkan untuk mencari information gain yang digunakan untuk mengukur

efektifitas suatu atribut dalam pengklasifikasian data dapat dihitung dengan

rumus :

Dimana :

Value(a) : merupakan semua nilai yang mungki dalam himpunan kasus a

Yv : subkelas dari Y dengan kelas v yang berhubungan dengan kelas a

Ya : semua nilai yang sesuai dengan a

Untuk mencari split-point terbaik maka data dari atribut tersebut harus

diurutkan terlebih dahulu. Nilai tengah antara setiap pasangan nilai yang

berdekatan dianggap sebagai kemungkinan yang bisa dijadikan split-point.

2.8 Jumlah Pohon Dalam Random Forest

Menurut (Thais Mayumi Oshiro et al., 2012) banyak literatur mengenai

Random Forest namum hampir tidak ada yang memberikan pentunjuk berapa

banyak pohon yang harus dibangun dalam menyusun Random Forest. Dimana

peningkatan jumlah pohon tidak menghasilkan peningkatan kinerja yang

signifikan, dan hanya mengingkatkan lama komputasi. Dari penelitian tersebut

dapat disimpulkan ketika jumlah pohon bertambah, tidak selalu berarti kinerja

Random Forest secara signifikan lebih baik daripada Random Forest sebelumnya

(lebih sedikit pohon), dan menggandakan jumlah pohon tidak bermakna.

Analisis dari 29 dataset menunjukkan bahwa dari 128 pohon tidak ada

perbedaan yang signifikan antara hutan menggunakan 256, 512,1024, 2048 dan

4096 pohon. Dataset yang digunakan dalam penelitian tersebut adalah :

Tabel 1. Dataset pada penelitian How Many Tree in Random Forest

No Dataset Banyak

data

Kelas

1 GCM (Global Cancer Map) 190 14

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 31: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

14

2 Lymphoma 96 3

3 CNS (Central Nervous System Tumour Outcome) 60 2

4 Leukimia 72 2

5 Leukimia nom. 72 2

6 Ovarian 61902 61902 253

7 Lung cancer 32 3

8 C. Arrhythmia 452 16

9 Dermatology 366 6

10 HD Switz 123 5

11 Lymphography 148 4

12 Hepatitis 155 2

13 HD Hungarian 294 5

14 HD Cleveland 303 5

15 P. Patient 90 3

16 WDBC (Wisconsin Diagnositic Breast Cancer) 569 2

17 Splice Junction 3190 3

18 Heart Statlog 270 2

19 Allhyper 3772 5

20 Allhypo 3772 4

21 Sick 3772 2

22 Breast cancer 286 2

23 Hypothyroid 3163 2

24 ANN thyroid 7200 3

25 WBC (Wisconsin Breast Cancer) 699 2

26 C. Method 1473 3

27 Pima Diabetes 768 2

28 Liver disorders 345 2

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 32: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

15

29 H. Survival 306 2

Analisa dari 29 dataset menunjukan bahwa dari 128 pohon tidak ada

perbedaan yang signifikan antara hutan menggunakan 256, 512,1024, 2048 dan

4096 pohon. Oleh karena itu, dimungkinkan banyak pohon, berdasarkan

percobaan sebelumnya, kisaran antara 64 dan 128 pohon di hutan. Dengan jumlah

pohon ini, memperoleh keseimbangan yang baik antara area under curva, waktu

pemrosesan, dan penggunaan memori.

2.9 Menghitung Akurasi

Performansi suatu prediksi dari suatu metode pada diukur dari error hasil

prediksi tersebut. Nilai error dapat dihitungan dengan menggunakan Mean

Absolute Percentage Error (MAPE). MAPE adalah rata-rata dari keseluruhan

persentase selisih antara data aktual dan data hasil prediksi. Rumus MAPE adalah

Dimana :

At = nilai harga sesungguhnya

Ft = nilai prediksi

n = banyak data

t = waktu

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 33: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

16

BAB III

METODE PENELITIAN

3.1 Sumber Data

Data yang digunakan pada penelitian ini merupakan data transaksi penjualan

tembakau rajangan diperoleh dari PT Gudang Garam TBK tahun 2015. Serta data

iklim harian tahun 2015 dari Badan Meteorologi Klimatologi dan Geofisika.

Jumlah data diperoleh 1244 record dan 23 atribut. Atribut data set ditunjukan

pada tabel 2 sebagai berikut:

Tabel 2. Atribut Dataset

No Atribut Keterangan dan Nilai

1 Daerah Asal daerah tembakau rajangan diambil

2 Party Tempat penjualan tembakau rajangan

3 Seri Jenis atau asal tembakau (sawah/tegalan/gunung/beli daun)

4 Nomor Nomor transaksi tembakau rajangan

5 Grade Tingkat kwalitas tembakau (A/B/C/D/E/F) A adalah kwalitas

terendah dan F adalah kwalitas tertinggi

6 Bruto Berat kotor, berat termasuk berat keranjang dalam (kg)

7 Netto Berat bersih tembakau murni dalam (kg)

8 Harga Harga perkilo gram tembakau dalam rupiah

9 Jumlah Hasil perkalian dari Netto dengan Harga

10 Tanggal

Transaksi Tanggal transaksi tembakau rajangan

11 Nama

stasiun Nama stasiun Klimatologi

12 WMO ID

Identitas World Meteorological Organization, WMO adalah badan

khusus Perserikatan Bangsa-Bangsa untuk meteorologi (cuaca dan

iklim), hidrologi dan geofisika

13 Tanggal Tanggal iklim harian Kabupaten Temanggung

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 34: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

17

14 Suhu

minimum Suhu minimum di Kabupaten Temanggung (°C)

15 Suhu

maksimum Suhu maksimum di Kabupaten Temanggung (°C)

16 Suhu rata-

rata Suhu rata-rata di Kabupaten Temanggung (°C)

17 Kelembaban

rata-rata Kelembaban rata-rata di Kabupaten Temanggung (°C)

18 Curah hujan Curah hujan di Kabupaten Temanggung (mm)

19 Lama

penyinaran

Lama penyinaran matahari di Kabupaten Temanggung

(jam)

20

Kecepatan

angin rata-

rata

Kecepatan angin rata-rata di Kabupaten Temanggung

(knot)

21 Arah angin

terbanyak Arah angin terbanyak di Kabupaten Temanggung (deg)

22

Kecepatan

angin

terbesar

Kecepatan angin terbesar di Kabupaten Temanggung

(knot)

23

Arah angin

saat

kecepatan

maksimum

Arah angin saat kecepatan maksimum di Kabupaten

Temanggung (deg)

3.2 Tahap-tahap penelitian

3.2.1 Studi Pustaka

Penulis mempelajari berbagai literatur yang berkaitan dengan metode

decision tree pada penambangan data khususnya mengenai algoritma

Random Forest dan literatur lainnya yang digunakan sebagai acuan

membangun sistem.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 35: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

18

3.2.2 Observasi

Observasi merupakah salah satu metode dalam mengumpulkan data

dengan melakukan pengamatan dan pencatatan mengenai objek yang sedang

diteliti. Objek yang diteliti adalah harga tembakau rajangan di kabupaten

Temanggung pada tahun 2015. Data transaksi diambil dari PT Gudang

Garam TBK sedangkan data iklim harian diambil dari BMKG. Berdasarkan

wawancara dengan grader PT Gudang Garam TBK diketahui bahwa harga

tembakau dipengaruhi oleh kualitas.

Berdasarkan studi literatur pada bab 2 sub bab 2.2 mengenai faktor

yang mempengaruhi kualitas tembakau dapat diketahui bahwa suhu,

kelembaban, curah hujan, lama penyinaran, agroeksistem, dan elevasi atau

ketinggian mempengaruhi kualitas tembakau.

3.2.3 Pengolahan Data

Setelah data terkumpul maka proses selanjutnya adalah pengolahan

data. Cara pengolahan data dapat dinyatakan kedalam bentuk blok diagram

seperti dibawah ini.

Gambar 3.1. Blok Diagram

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 36: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

19

Dataset dan pengujian memiliki langkah yang sama. Penjelasan

preprocessing akan dijelaskan pada proses Knowledge Discovery in

Database. Pada tahap ini, dilakukan proses Knowledge Discovery in

Database. Proses yang terjadi adalah sebagai berikut :

1. Data Integration

Proses data integration adalah proses menggabungkan data dari

berbagai sumber data yang berbeda. Pada penelitian ini dilakukan tahap

data integration terhadap dataset tidak konsisten. Atribut dataset iklim

digabung dengan dataset transaksi tembakau rajangan berdasarkan

tanggal transaksi. Pada tahap ini penulis melakukan secara manual

menggunakan aplikasi microsoft excel, yaitu menggabungkan dataset

iklim dan dataset transaksi.

2. Data Selection

Proses data selection adalah proses memilih data atau atribut yang

relevan untuk penelitian ini. Dalam data mining pemilihan atau

pengurangan dataset seharusnya dapat mengefektifkan hasil analisa tanpa

mengurangi integritas data asli. Tujuan dari pemilihan subset atribut

adalah untuk menemukan seperangkat atribut minimum sehingga

distribusi probabilitas yang dihasilkan dari data kelas sedekat mungkin

dengan distribusi asli yang diperoleh menggunakan semua atribut. Pada

tahap ini penulias melakukan secara manual menggunakan aplikasi

microsoft excel.

3. Data Transformation

Proses data transformation adalah proses menggabungkan data ke

dalam bentuk yang sesuai untuk ditambang. Pada penelitian ini, proses

data transformasi akan dilakukan perubahan menjadi data numerik untuk

semua atribut. Pada tahap ini penulias melakukan secara manual

menggunakan aplikasi microsoft excel.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 37: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

20

3.2.4 Pembuatan Alat Uji

Alat uji nantinya dibuat menggunakan aplikasi PyCharm dengan

menggunakan bahasa pemrogram Python dengan mengimplementasikan

metode Random Forest Regressor.

3.2.5 Analisa Hasil dan Pembuatan Laporan

Analisa hasil dari perangkat lunak dibuat berdasarkan pendekatan

algoritma Random Forest, yaitu algoritma yang digunakan pada klasifikasi

data dalam jumlah yang besar. Klasifikasi Random Forest dilakukan melalui

penggabungan pohon dengan melakukan training pada sampel dataset

penjualan tembakau dan dataset iklim harian di Kabupaten Temanggung.

Penentuan klasifikasi dengan Random Forest diambil berdasarkan hasil vote

terbanyak dari pohon yang terbentuk dan untuk regresi diambil berdasarkan

hasil rata-rata dari pohon yang terbentuk. Pemenang dari pohon yang

terbentuk ditentukan dengan rata-rata pohon. Hasil dari analisi dan

pengujian akan disusun kedalam sebuah laporan tugas akhir.

3.3 Spesifikasi Alat

Penelitian dilakukan dengan menggunakan hardware dan dan software

sebagai berikut:

a. Spesifikasi hardware

1) Prosessor : Intel® Core™ i5-4210 CPU @ 1.70GHz (4 CPUs), ~ 2.4GHz

2) RAM : 4.00 GB

3) Tipe Sistem : Windows 10 Pro 64-bit (10.0, Build 17134)

b. Spesifikasi software

1) Sistem Operasi Microsoft Windows 10.

2) Pycharm, software ini akan digunakan untuk membuat sistem.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 38: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

21

BAB IV

PERANCANGAN PERANGKAT LUNAK

4.1 Perancangan Sistem

4.1.1 Input

Masukan pada sistem perangkat lunak ini berupa data file dengan extensi

.csv dan jumlah pohon.

4.1.2 Proses

Data yang dimasukan ke perangkat lunak akan di proses memiliki beberapa

tahap untuk membangun model pohon Random Forest. Dapat dilihat pada

gambar 3.

Gambar 4.1. Flowchart diagram

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 39: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

22

4.1.3 Output

Output yang dihasilkan dari proses analisa Random Forest

menampilkan grafik model prediksi harga tembakau rajangan Kabupaten

Temanggung pada tahun 2015.

4.2 Preprocessing

Tahap preprocessing dilakukan untuk mempersiapkan data agar siap untuk

diolah untuk memprediksi harga. Proses preprocessing ini dibagi menjadi 4 tahap

yaitu mengatasi missing data dengan teknik impultasi, data integration, data

selection dan data transformation.

4.2.1 Mising Data

Pada dataset iklim terdapat missing data yang dinotasikan dengan

9999 untuk data iklim tidak tersedia dan 8888 untuk data iklim tidak

terukur. Proses untuk menangani missing data adalah dengan menggunakan

teknik impultasi.

Langkah 1 : membaca dataset iklim bertipe .csv

Langkah 2 : menghapus kolom atau baris yang bernilai NA, dan data

yang bernilai kosong dapat diisi dengan data baru hasil

implutasi.

Langkah 3 : menghitung nilai rata-rata dari variable a

Langkah 4 : menghitung nilai standar deviasi variable a

Langkah 5 : menjumlah banyak data yang kosong dari variable a

Langkah 6 : menentukan nilai random yang akan diisi kedalam list

sebanyak data kosong dari variable a, nilai random diambil dari

rata-rata variable a dikurangi standar deviasi nilai a sebagai

batas bawah dan rata-rata variable a ditambah standar deviasi

nilai a sebagai batas atas

Langkah 7 : mengisi dataset variable a dengan nilai yang sudah

disimpan dalam list (random)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 40: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

23

Langkah 8 : mengisi dataset variable a yang kosong dengan nilai

random

4.2.2 Data Selection

Dalam data selection akan menghilangkan atribut yang tidak relevan

dalam penelitian ini. Atribut yang dihapus dalam dataset dalam penelitian

ini adalah atribut yang tidak independen. Sesuai dengan (Elda Nurnasari dan

Djumali, 2010), perbedaan ketinggian tempat diikuti oleh perbedaan unsur-

unsur lingkungan (temperatur udara, kelembapan udara relatif, curah hujan,

dan jumlah hari hujan) berpengaruh terhadap produksi dan mutu tembakau

temanggung.

Atribut subset yang dihapus atau dihilangkan pada dataset iklim adalah :

a. Nama stasiun

b. WMO ID

c. Tanggal

d. Suhu minimum

e. Suhu maksimum

f. Kecepatan angin rata-rata

g. Arah angina terbanyak

h. Kecepatan angin terbesar

i. Arah angin saat kecepatan maksimum

Atribut yang dihapus atau dihilangkan pada dataset transaksi adalah :

a. Tanggal Transaksi

b. Party

c. Nomor transaksi

d. Bruto

e. Netto

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 41: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

24

4.2.3 Data Transformation

Tranformasi dilakukan di dataset transaksi pada atribut seri dan grade.

Dimana nilai grade A merupakan mutu terendah dan grade F merupakan

mutu tertinggi.

Atribut grade ditransformasi menjadi :

A : 1

B : 2

C : 3

D : 4

E : 5

F : 6

Sedangkan untuk atribut seri terdapat nilai LSP, LSW, LSS, LSY,

LSR, LSU, BLS, LSX merupakan tembakau yang ditanam di

agroekosistem sawah. TGP, TGW, TGS, TGR, TGX, TGU, TGS

merupakan tembakau yang ditanam di agroekosistem tegal. BLL, KTT,

BLS, BLP merupakan tembakau yang ditanam di agroekosistem gunung.

Dan GAL merupakan tembakau yang dibeli daun.

Atribut seri ditransformasi menjadi :

LSP, LSW, LSS , LSY, LSR, LSU, BLS, LSX : 1

TGP, TGW, TGS, TGR, TGX, TGU, TGS : 2

BLL, KTT, BLS, BLP : 3

GAL : 4

4.2.4 Data Integration

Menggabungkan dataset iklim dengan dataset transaksi,

Penggabungan berdasarkan tanggal transaksi. Contoh jika terdapat

transaksi di tanggal 28 Agustus 2015 (lampiran 4 dan 5) maka dataset

iklim diambil 4 bulan sebelum tanggal 28 Agustus 2015 yaitu tanggal 28

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 42: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

25

April 2015. Setelah mendapat dataset iklim selama 4 bulan, maka langkah

selanjutnya adalah menggabungkan dengan dataset transaksi.

4.2.5 Membagi data training dan data testing

Total data yang digunakan dalam penelitian ini adalah 1244 record,

dan akan dibagi 2/3 bagian untuk data training dan 1/3 bagian untuk data

testing. Maka akan di dapat 871 data training dan 373 data testing.

Langkah 1 : membuat parameter X dan y

Langkah 2 : besar parameter test size 30%

Langkah 3 : split_i sama dengan panjang parameter y dikurangi

panjang parameter y dibagi menggunakan floor division (

1 dibagi test size).

Langkah 4 : mengembalikan nilai X dan y

4.2.6 Membangun model Random Forest

Dalam membangun model Random Forest menggunakan fungsi

RandomForestRegressor. Dengan parameter bootstrap dan n_estimators.

Dimana n_estimator adalah jumlah pohon dan bootstrap bernilai true

maka bootstrap dan replacement digunkan ketika membangun pohon,

jika bootstrap bernilai false maka akan menggunkan semua dataset untuk

membangun pohon.

4.3 Desain Antarmuka

Prototype sistem yang dibangun memiliki interface seperti pada gambar

dibawah ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 43: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

26

Gambar 4.2. Desain Antarmuka Sistem

4.4 Pengujian

Dalam pengujian, mencari performa dataset akan dibagi menjadi 2/3

sebagai data training dan 1/3 sebagai data testing. Data testing digunakan sebagai

input. Kemudian menggunakan fungsi RandomForestRegressor( ) untuk membuat

regresi Random Forest. Jumlah pohon yang digunakan dalam penelitian ini

adalah 2j dimana j = 1,2,3…..12.

Dari 12 kali percobaan maka akan dicari nilai akurasi yang paling tinggi dan

nilai error yang paling rendah. Jumlah pohon yang digunakan adalah 2, 4, 8, 16,

32, 64, 128, 256, 512, 1024, 2048, 4096.

4.5 Pengukuran Akurasi Sistem

Cara untuk mengukur tingkat akurasi yaitu dengan mean absolute error

presentase. Nilai tingkat akurasi yang tinggi menunjukan bahwa sistem yang

dibuat cukup baik, untuk memprediksi harga tembakau rajangan di kabupaten

Temanggung pada tahun 2015.

\

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 44: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

27

BAB V

IMPLEMENTASI DAN ANALISA HASIL

5.1 Implementasi Desain Antarmuka

Gambar 5.1. Antarmuka sistem prediksi

Dalam desain antarmuka sistem, terdapat empat button yaitu Load, Proses, Pohon

dan Prediksi yang dibuat dengan Qpush button. Tombol Load digunakan untuk memuat

dataset, tombol Proses digunakan untuk membuat model prediksi, sedangkan tombol

Pohon digunakan menampilkan pohon. Untuk menampilkan dataset menggunakan

Qtabelview. Terdapat juga Qline edit untuk memasukan banyak pohon dan pohon ke-i

yang ingin ditampilkan.

5.2 Hasil Prediksi

Hasil akurasi pendekatan Random Forest untuk model peramalan harga

tembakau rajangan di kabupaten temanggung pada tahun 2015 menghasilkan nilai

akurasi 82.39%. Dari model Random Forest tersebut dapat diperdiksi harga

tembakau untuk tahun tahun kedepannya.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 45: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

28

5.3 Analisis Hasil Prediksi

Pembangunan pohon dalam Random Forest adalah dengan membagi dataset

menjadi data training dan data testing. Dimana ukuran dari data training adalah

2/3 sedangkan ukuran dari data testing adalah 1/3. Setelah membagi data,

kemudian membuat subset data secara acak dari dataset dengan menggunakan

bootstrap dengan replacement.

Pohon dibangun sampai ukuran maksimum tanpa adanya pruning, dimana banyak

data tiap model pohon lebih kecil samadengan daripada banyak data training. Setelah

mendapat pohon sebanyak k maka hasil dari tiap model di rata-rata untuk dijadikan nilai

prediksi. Contoh pembuatan model Random Forest dapat dilihat pada lampiran 3.

Gambar 5.2. Hasil ploting untuk Random Forest dengan jumlah pohon 64

Dengan 64 pohon dalam Random Forest, peneliti dapat memprediksi harga

tembakau pada transaksi selanjutnya atau pada tahun selanjutnya. Pohon ke 1

dapat dilihat pada gambar 5.2. Pada pohon ke 1 dataset bootstrap dan

replacement yang digunakan berjumlah 559.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 46: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

29

Gambar 5.3. Pohon ke 1 dari 64 pohon dalam Random Forest

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 47: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

30

Tabel 3 menunjukkan perbandingan jumlah pohon dalam Random

Forest dengan akurasi yang diperoleh.

Tabel 3. Perbandingan jumlah pohon dengan akurasi

No Banyak pohon Akurasi (%)

1 2 74.94

2 4 81.75

3 8 81.97

4 16 82.13

5 32 82.03

6 64 82.39

7 128 81.89

8 256 82.34

9 512 82.13

10 1024 81.86

11 2048 81.82

12 4096 81.89

Berdasarkan Tabel 3 dapat dianalisa bahwa jumlah pohon yang

optimal pada penelitian ini adalah 64 pohon dengan nilai akurasi 82.39%.

Dimana peningkatan jumlah pohon tidak menghasilkan peningkatan akurasi yang

signifikan (Tidak ada perubahan signifikan dari 256 pohon hingga 4096

pohon), sebaliknya hanya mengingkatkan lama komputasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 48: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

31

BAB VI

PENUTUP

6.1 Kesimpulan

Dari hasil uji data prediksi harga tembakau rajangan di kabupaten

Temanggung dengan menggunakan metode Random Forest. Maka kesimpulan

yang diperoleh dari penelitian ini adalah :

1. Algoritma Random Forest dapat diterapkan untuk memprediksi harga

tembakau rajangan di kabupaten Temanggung.

2. Proses predikisi terhadap 1244 record menggunakan algoritma Random Forest

mengahasilkan akurasi sebesar 82.39%.

3. Banyak pohon yang efektif dalam penelitian ini adalah 64 pohon. Jumlah

pohon mempengaruhi tingkat akurasi dan error serta waktu untuk komputasi.

6.2 Saran

Berdasarkan hasil analisis pada tugas akhir ini, saran yang dapat penulis

berikan untuk penelitian yang akan datang :

1. Mencari data transaksi tembakau dalam bentuk time series lebih banyak

2. Menggunakan teknik lain untuk menangani missing data pada dataset.

3. Mencari indikator lain yang dapat mempengarui harga tembakau, seperti warna

dan tekstur tembakau rajangan.

4. Data prediksi diberikan label, atau membuat pengelompokan harga. Semisal

harga 140000-90000 diberi label A, harga 89999-60000 diberi label B, dan

harga 59999-30000 diberi label C. A adalah harga tinggi, B adalah harga

sedang, dan C adalah harga rendah.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 49: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

32

DAFTAR PUSTAKA

Allison, P.D. 2000. Multiple Imputation for Missing Data. A Caautionary Tale.

Badan Pusat Statistik Kabupaten Temanggung, 2018. Kabupaten Temanggung dalam

Angka 2018.

Badan Pusat Statistik Provinsi Jawa Tengah, 2017. Provinsi Jawa Tengah dalam

Angka 2017.

Basuki, S., F. Rochman, dan S. Yulaikah, 2000. Biologi Tembakau Temanggung, 1-6.

Breiman, L., 2001. Random forests, Machine Learning, Kluwer Academic

Publishers, 45, 5-32.

Cahyono, B., 2005. Tembakau Budi Daya dan Analisis Tani, Kanisius, Yogyakarta.

Davies, B., 2004. Database Systems 3rd Edition. Palgrave, Basingstoke, UK.

Davis, D. L. and Neilsen, M. T., 1999. Tobacco Production, Chemistry and

Technology, Coresta, Blackwell Science Ltd.

Djumali. 2008. Produksi dan Mutu Tembakau Temanggung (Nicotiana tabacum L.)

di Daerah Tradisional serta Faktor-Faktor yang Mempengaruhinya, Disertasi,

Universitas Brawijaya, Malang.

Han, J., Kamber, M., dan Pei, J., 2006. Data Mining: Concepts and Techniques.

Morgan Kaufmann.

Kusrini, Luthfi, Taufiq, dan Emha, 2009. Algoritma Data Mining, Penerbit Andi,

Yogyakarta.

L. Breiman, “Bagging Predictors,” Machine Learning, 24, 123-140.

Lewis, M.D dan Roger, J. (2000). An Introducion to Classification and Regression

Trees (CART) Analysis. Annual Meeting of Society For Academic Emergency.

California, UCLA Medical Center

Makridakis, Wheelwright and Mcgee, 1991. Metode dan Aplikasi Peramalan, Edisi

Kedua. Jakarta: Erlangga.

Martiningtyas, N, 2004. Diktat Statistika. STIKOM, Surabaya.

Matnawi, H., 1997. Budi Daya Tembakau Dibawah Naungan. Kanisius. Yogyakarta.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 50: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

33

Mayumi, T. O. et al. 2012. How Many Trees in a Random Forest?. Department of

Computer Science and Mathematics Faculty of Philosophy, Sciences and

Languages at Ribeirao Preto University of Sao Paulo.

Nicholson. Walter, 1995. Teori Ekonomi Mikro Prinsip Dasar dan Perluasan.

Jakarta: Binarupa Aksara.

Nurnasari, E. dan Djumali, 2010. Pengaruh Kondisi Ketinggian Tempat Terhadap

Produksi dan Mutu Tembakau Temanggung.

Pramudiono, I., 2006. Apa itu Data Mining?, http://datamining.japati.net/cgibin/

indodm.cgi, diakses tanggal 06 November 2018.

Purlani, E. dan Rachman, A., 2000. Budi Daya Tembakau Temanggung, dalam

Monograf Tembakau Temanggung, Balai Penelitian Tembakau dan Tanaman

Serat, Malang, 19-31.

Rochman, F. dan Suwarso, 2000. Kultivar Lokal Tembakau Temanggung dan Usaha

Perbaikannya, dalam Monograf Tembakau Temanggung, Balai Penelitian

Tembakau dan Tanaman Serat, Malang, 7-13.

Rubin, D., 1987. Multiple imputation for nonresponse in surveys. John Wiley & Sons,

Inc., New York.

Santosa, Budi, 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis,

Graha Ilmu, Yogyakarta.

Sholeh, M. 2000. Curah Hujan dan Waktu Tanam Tembakau Temanggung, dalam

Monograf Tembakau Temanggung, Balai Penelitian Tembakau dan Tanaman

Serat, Malang, 14-18.

Sulistyono. 1995. Pengaruh tinggi tempat terhadap Pinus merkusii Jungh et de Vriese

di KPH Probolinggo Perum Perhutani Unit II Jawa Timur. Skripsi, IPB.

Tirtosastro, S., 2004. Penerapan Standar Mutu Tembakau di Indonesia.

Tirtosastro, S., 2004. Panen dan Pengolahan Tembakau Rajangan Temanggung

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 51: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

34

LAMPIRAN

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 52: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

35

Lampiran 1

Tabel 4. Produk Domestik Regional Bruto Atas Dasar Harga Berlaku Menurut

Lapangan Usaha di Kabupaten Temanggung (Miliar rupiah) 2014-2017 (Badan Pusat

Statistik Kabupaten Temangggung, 2018)

No Lapangan Usaha 2014 2015 2016 2017

1 Pertanian,

Kehutanan, dan

Perikanan

3,734.88 4,156.11 4,429.54 4,576.31

2 Pertambangan dan

Penggalian

120.93 140.87 156.46 168.90

3 Industri

Pengelolahan

3.862.67 4.272.81 4.701.85 5.094.77

4 Pengadaan Listrik dan

Gas

11.01 11.59 13.01 15.46

5 Pengadaan Air,

Pengelolaan

Sampah, Limbah dan

Daur Ulang

11.57 12.13 12.81 13.70

6 Konstruksi 653.21 746.20 809.21 907.37

7 Pedagang Besar dan

Eceran,

Reparasi Moobil dan

Sepeda Motor

3.023.32 3.272.21 3.566.49 3.847.20

8 Transportasi dan

Pergudangan

568.60 613.42 652.23 675.72

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 53: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

36

9 Penyediaan

Akomodasi dan

Makan Minum

188.55 201.30 212.59 228.95

10 Informasi dan 201.37 217.69 228.83 253.04

Komunikasi

11 Jasa Keuangan dan

Asuransi

359.10 387.73 418.78 437.36

12 Real Estate 99.76 106.71 112.91 121.78

13, 14 Jasa Perusahaan 39.26 42.45 44.74 48.39

15 Administrasi

Pemerintahan,

Pertahaan dan Jaminan

Sosial

Wajib

341.60 358.69 368.63 377.51

16 Jasa Pendidikan 486.47 516.48 547.87 575.21

17 Jasa Kesehatan dan

Kegiatan Sosial

123.93 130.65 140.36 154.28

18,19,

20,21

Jasa lainnya 243.33 250.29 268.52 289.60

Produk Domestik

Regional Bruto

11.867.68 12.486.49 13.110.80 13.724.46

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 54: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

37

Lampiran 2

Tabel 5. Luas area dan produksi Tembakau Perkebunan Rakyat Menurut

Kabupaten dan keadaan Tanaman tahun 2014-2017 (Badan Pusat Statistik

Provinsi Jawa Tengah, 2017)

No Provinsi-

Kabupaten

Luas Area (Ha) Produk

si (ton)

Produktivitas

(Kg/Ha)

Jumlah

Petani Tanam Panen

1 Kab

Temanggung

19.209 18.248 10.581 580 64.030

2 Kab Magelang 6.613 6.613 4.298 650 8.107

3 Kab

Wonosobo

3.876 3.876 2.785 718 7.071

4 Kab Boyolali 3.754 3.754 3.379 900 8.597

5 Kab Rembang 2.500 2.500 2.804 1.122 4.541

6 Kab Klaten 1.802 1.802 2.191 1.216 6.487

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 55: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

38

Lampiran 3 Pembuatan model random forset

Dataset yang digunakan untuk membangun model :

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran

1

Seri Grade Harga

Data

Training

27.7 67 15.5 9.4 1 2 45000

27.9 68 17 9.4 4 2 45000

27 68 17 9.5 1 1 40000

27.7 67 17 9 3 2 35000

27.7 68 9 9.4 3 3 40000

28.1 67 11 9.4 4 2 37500

27.9 69 13 8.4 2 3 35000

26 70 17 9.4 3 2 37500

27.7 68 15.5 9 3 2 35000

27.9 71 15 9.7 2 2 40000

Data

Testing

25.5 72 10 9.5 4 2 40000

25.5 72 10 9.5 4 2 45000

27.7 68 20 9.4 4 2 40000

Pembentukan pohon model 1

Setelah proses bootstrap dan replacement model 1 didapat random dataset untuk

membangun pohon 1

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 68 9 9.4 3 3 40000

27.7 68 9 9.4 3 3 40000

27.9 71 15 9.7 2 2 40000

28.1 67 11 9.4 4 2 37500

26 70 17 9.4 3 2 37500

27.7 68 15.5 9 3 2 35000

27.7 68 15.5 9 3 2 35000

27.9 69 13 8.4 2 3 35000

Langkah-langkah dalam membangun pohon 1:

1. Menentukan node 1

Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi

gain

Total 8 3 2 3 1.561278

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 56: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

39

Suhu 1 0.015712

<=27.7 5 2 1 2 1.521928

>27.7 3 1 1 1 1.584963

Kelembaban 1 0.015712

<=68 5 2 1 2 1.521928

>68 3 1 1 1 1.584963

Curah hujan 1 0.061278

<=14 4 2 1 1 1.5

>14 4 1 1 2 1.5

Lama Penyinaran 1 0.199204

<=9.4 7 2 2 3 1.556657

>9.4 1 1 0 0 0

Seri 0.293564

<=3 7 3 1 3 1.448816

>3 1 0 1 0 0

Grade 0.610073

<=2 5 1 2 2 1.521928

>2 3 2 0 1 0

Atribut yang dipilih untuk dijadikan node adalah grade, karena grade memiliki nilai

information gain yang paling besar.Hasil pohon :

2. Menentukan node 2

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 71 15 9.7 2 2 40000

28.1 67 11 9.4 4 2 37500

26 70 17 9.4 3 2 37500

27.7 68 15.5 9 3 2 35000

27.7 68 15.5 9 3 2 35000

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi

Grade <=2

sample = 8

Value = 41428.57

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 57: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

40

gain

Total 5 1 2 2 1.521928

Suhu 1 1.521928

<=27.7 3 0 1 2 0

>27.7 2 1 1 0 0

Kelembaban 1 1.521928

<=68 3 0 1 2 0

>68 2 1 1 0 0

Curah hujan 1 0.355894

<=15.5 4 1 1 2 1.457542

>15.5 1 0 1 0 0

Lama Penyinaran 1 1.521928

<=9.4 4 0 2 2 0

>9.4 1 1 0 0 0

Seri 0.355894

<=3 4 1 1 2 1.457542

>3 1 0 1 0 0

Grade 0

<=2 5 1 2 2 1.521928

>2 0 0 0 0 0

Atribut yang dipilih untuk dijadikan node adalah kelembaban 1, karena memiliki

yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.

Hasil pohon

True

Grade <=2

sample = 8

Value = 41428.57

Kelembaban 1 <= 68

sample = 5

Value = 37000

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 58: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

41

3. Menentukan node 3

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 68 9 9.4 3 3 40000

27.7 68 9 9.4 3 3 40000

27.9 69 13 8.4 2 3 35000

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi

gain

Total 3 2 - 1 0.918296

Suhu 1 0.918296

<=27.7 2 2 - 0 0

>27.7 1 0 - 1 0

Kelembaban 1 0.918296

<=68 2 2 - 0 0

>68 1 0 - 1 0

Curah hujan 1 0.918296

<=9 2 2 - 0 0

>9 1 0 - 1 0

Lama Penyinaran 1 0.918296

<=9.4 2 2 - 0 0

>9.4 1 0 - 1 0

Seri 0

<=3 3 2 - 1 0.918296

>3 0 0 - 0 0

Grade 0

<=3 3 2 - 1 0.918296

>3 0 0 - 0 0

Atribut yang dipilih untuk dijadikan node adalah suhu 1, karena memiliki yang

paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu. Hasil

pohon

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 59: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

42

True False

4. Menentukan node 4

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

28.1 67 11 9.4 4 2 37500

27.7 68 15.5 9 3 2 35000

27.7 68 15.5 9 3 2 35000

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi

gain

Total 3 - 1 2 0.918296

Suhu 1 0.918296

<=27.7 2 - 0 2 0

>27.7 1 - 1 0 0

Kelembaban 1 0.918296

<=68 2 - 0 2 0

>68 1 - 1 0 0

Curah hujan 1 0.918296

<=15.5 2 - 1 0 0

>15.5 1 - 0 2 0

Lama Penyinaran 1 0.918296

<=9 2 - 0 2 0

>9 1 - 1 0 0

Seri 0

<=3 3 - 0 2 0.918296

>3 0 - 1 0 0

Grade <=2

sample = 8

Value = 41428.57

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 60: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

43

Grade 0

<=2 3 - 1 2 0.918296

>2 0 - 0 0 0

Atribut yang dipilih untuk dijadikan node adalah lama penyinaran 1, karena memiliki

yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.

Hasil pohon

True False

5. Menentukan node 5

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 71 15 9.7 2 2 40000

26 70 17 9.4 3 2 37500

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi

gain

Total 2 1 1 - 1

Suhu 1 1

<=27 1 0 1 - 0

>27 1 1 0 - 0

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 61: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

44

Kelembaban 1 1

<=70.5 1 0 1 - 0

>70.5 1 1 0 - 0

Curah hujan 1 1

<=16 1 1 0 - 0

>16 1 0 1 - 0

Lama Penyinaran 1 1

<=9.6 1 0 1 - 0

>9.6 1 1 0 - 0

Seri 1

<=2.5 1 1 0 - 0

>2.5 1 0 1 - 0

Grade 0

<=2 2 1 1 - 1

>2 0 0 0 - 0

Atribut yang dipilih untuk dijadikan node adalah curah hujan 1, karena memiliki

yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.

Hasil pohon

True False

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Curah hujan 1 <= 16

sample = 2

Value = 38750

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 62: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

45

6. Menentukan node 6

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 68 15.5 9 3 2 35000

27.7 68 15.5 9 3 2 35000

Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut

kelas dijadikan leaf node dengan nilai kelas tersebut.

True False

7. Menentukan node 7

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

28.1 67 11 9.4 4 2 37500

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa.

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Curah hujan 1 <= 16

sample = 2

Value = 38750

sample = 2

Value = 35000

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 63: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

46

True False

8. Menentukan node 8

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 71 15 9.7 2 2 40000

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa

True False

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Curah hujan 1 <= 16

sample = 2

Value = 38750

sample = 2

Value = 35000

sample = 1

Value = 37500

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 64: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

47

9. Menentukan node 9

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

26 70 17 9.4 3 2 37500

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa

True False

10. Menentukan node 10

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Curah hujan 1 <= 16

sample = 2

Value = 38750

sample = 2

Value = 35000

sample = 1

Value = 37500 sample = 1

Value = 40000

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Curah hujan 1 <= 16

sample = 2

Value = 38750

sample = 2

Value = 35000

sample = 1

Value = 37500 sample = 1

Value = 40000 sample = 1

Value = 37500

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 65: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

48

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 68 9 9.4 3 3 40000

27.7 68 9 9.4 3 3 40000

Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut

kelas dijadikan leaf node dengan nilai kelas tersebut

True False

11. Menentukan node 11

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 69 13 8.4 2 3 35000

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa.

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Curah hujan 1 <= 16

sample = 2

Value = 38750

sample = 2

Value = 35000

sample = 1

Value = 37500

sample = 2

Value = 40000

sample = 1

Value = 40000 sample = 1

Value = 37500

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 66: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

49

True False

Pembentukan pohon model 2

Setelah proses bootstrap dan replacement model 2 didapat random dataset untuk

membangun pohon 2

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 67 15.5 9.4 1 2 45000

27.7 67 15.5 9.4 1 2 45000

27.9 68 17 9.4 4 2 45000

27 68 17 9.5 1 1 40000

27 68 17 9.5 1 1 40000

27.7 67 17 9 3 2 35000

27.9 71 8 9.7 2 2 40000

Langkah-langkah dalam membangun pohon 1:

Lama penyinaran 1 <= 9

sample = 3

Value = 37000

Kelembaban 1 <= 68

sample = 5

Value = 37000

Suhu 1 <= 27.7

sample = 3

Value =38333.33

Grade <=2

sample = 8

Value = 41428.57

Curah hujan 1 <= 16

sample = 2

Value = 38750

sample = 2

Value = 35000

sample = 1

Value = 37500

sample = 2

Value = 40000

sample = 1

Value = 35000

sample = 1

Value = 40000 sample = 1

Value = 37500

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 67: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

50

1. Menentukan node 1

Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi

gain

Total 7 3 3 1 1.448816

Suhu 1 0.361724

<=27.7 5 2 1 2 1.521928

>27.7 2 1 0 1 0

Kelembaban 1 0.198117

<=68 6 0 1 2 1.459148

>68 1 1 1 0 0

Curah hujan 1 0

<=17 7 3 1 3 1.448816

>17 0 0 0 0 0

Lama Penyinaran 1 1.448816

<=9.4 4 3 1 0 0

>9.4 3 0 0 3 0

Seri 0.769546

<=1 4 2 0 2 0

>1 3 1 1 1 1.584963

Grade 0

<=2 7 3 1 3 1.448816

>2 0 0 0 0 0

Atribut yang dipilih untuk dijadikan node adalah lama penyinaran 1, karena lama

penyinaran 1 memiliki nilai information gain yang paling besar.Hasil pohon :

2. Menentukan node 2

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 67 15.5 9.4 1 2 45000

27.7 67 15.5 9.4 1 2 45000

27.9 68 17 9.4 4 2 45000

27.7 67 17 9 3 2 35000

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 68: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

51

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi

gain

Total 4 - 3 1 0.811278

Suhu 1 0.122556

<=27.7 3 - 2 1 0.918296

>27.7 1 - 1 0 0

Kelembaban 1 0.122556

<=67 3 - 2 1 0.918296

>67 1 - 1 0 0

Curah hujan 1 0.311278

<=16.3 2 - 2 0 0

>16.3 2 - 1 1 1

Lama Penyinaran 1 0

<=9.4 4 - 3 1 0.811278

>9.4 0 - 0 0 0

Seri 0.311278

<=2 2 - 2 0 0

>2 2 - 1 1 1

Grade 0

<=2 4 - 3 1 0.811278

>2 0 - 0 0 0

Atribut yang dipilih untuk dijadikan node adalah seri, karena memiliki yang paling

besar dan jika ada nilai information gain yang sama maka dipilih salah satu. Hasil pohon

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

Seri <= 2

sample = 4

Value = 42500

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 69: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

52

3. Menentukan node 3

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27 68 17 9.5 1 1 40000

27 68 17 9.5 1 1 40000

27.9 71 8 9.7 2 2 40000

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi

gain

Total 3 3 - - 0

Suhu 1 0

<=27 2 2 - - 0

>27 1 1 - - 0

Kelembaban 1 0

<=68 2 2 - - 0

>68 1 1 - - 0

Curah hujan 1 0

<=17 2 2 - - 0

>17 1 1 - - 0

Lama Penyinaran 1 0

<=9.5 2 2 - - 0

>9.5 1 1 - - 0

Seri 0

<=1 2 2 - - 0

>1 1 1 - - 0

Grade 0

<=1 2 2 - - 0

>1 1 1 - - 0

Atribut yang dipilih untuk dijadikan node adalah suhu 1, karena memiliki yang

paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu. Hasil

pohon

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 70: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

53

4. Menentukan node 4

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 67 15.5 9.4 1 2 45000

27.7 67 15.5 9.4 1 2 45000

Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut

kelas dijadikan leaf node dengan nilai kelas tersebut

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Sample = 2

Value = 45000

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 71: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

54

5. Menentukan node 5

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 68 17 9.4 4 2 45000

27.7 67 17 9 3 2 35000

Hasil perhitungan information gain

Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi

gain

Total 2 - 1 1 1

Suhu 1 1

<=27.8 1 - 0 1 0

>27.8 1 - 1 0 0

Kelembaban 1 1

<=67.5 1 - 0 1 0

>67.5 1 - 1 0 0

Curah hujan 1 1

<=17 1 - 0 1 0

>17 1 - 1 0 0

Lama Penyinaran 1 1

<=9.2 1 - 0 1 0

>9.2 1 - 1 0 0

Seri 1

<=3.5 1 - 0 1 0

>3.5 1 - 1 0 0

Grade 0

<=2 2 - 1 1 1

>2 0 - 0 0 0

Atribut yang dipilih untuk dijadikan node adalah kelembaban 1, karena memiliki

yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.

Hasil pohon

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 72: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

55

6. Menentukan node 6

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.7 67 17 9 3 2 35000

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa.

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Sample = 2

Value = 45000

Kelembaban 1 <= 67.5

sample = 2

Value = 40000

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Sample = 2

Value = 45000 Kelembaban 1 <= 67.5

sample = 2

Value = 40000

Sample = 1

Value = 35000

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 73: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

56

7. Menentukan node 7

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 68 17 9.4 4 2 45000

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa.

8. Menentukan node 8

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27 68 17 9.5 1 1 40000

27 68 17 9.5 1 1 40000

Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut

kelas dijadikan leaf node dengan nilai kelas tersebut

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Sample = 2

Value = 45000 Kelembaban 1 <= 67.5

sample = 2

Value = 40000

Sample = 1

Value = 35000 Sample = 1

Value = 45000

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 74: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

57

9. Menentukan node 9

Suhu 1 Kelembaban

1

Curah

hujan 1

Lama

penyinaran 1

Seri Grade Harga

27.9 71 8 9.7 2 2 40000

Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai

kelas yang tersisa.

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Sample = 2

Value = 45000 Kelembaban 1 <= 67.5

sample = 2

Value = 40000

Sample = 1

Value = 35000 Sample = 1

Value = 45000

Sample = 2

Value = 40000

Lama penyinaran 1 <= 9.4

sample = 7

Value = 41428.57

Seri <= 2

sample = 4

Value = 42500

Suhu 1 <= 27

sample = 3

Value = 40000

Sample = 2

Value = 45000 Kelembaban 1 <= 67.5

sample = 2

Value = 40000

Sample = 1

Value = 35000 Sample = 1

Value = 45000

Sample = 2

Value = 40000

Sample = 1

Value = 40000

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 75: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

58

Setelah pohon terbentuk maka dapat dilakukan prediksi harga tembakau dan mengukur akurasi dari Random Forest

yang terbuat :

Suhu 1 Kelembaban 1 Curah hujan 1 Lama penyinaran 1 Seri Grade Harga Pohon 1 Pohon 2 Prediksi harga

25.5 72 10 9.5 4 2 40000 40000 40000 40000

25.5 72 10 9.5 4 2 45000 40000 40000 40000

27.7 68 20 9.4 4 2 40000 37500 45000 41250

Dari data testing dapat diprediksi harga berdasarkan pohon 1 dan pohon 2 dimana nilai predikisi adalahh rata-rata di tiap

pohon. Kemudian untuk menghitung akurasi menggunakan mean absolute percentage error, maka didapat nilai MAPE 4.75. Untuk

nilai akurasi yaitu dengan 100 - 4.75 = 95.25%.

Harga Prediksi Error MAPE

40000 40000 |40000-40000| = 0 (0/40000)x100 = 0

45000 40000 |40000-45000| = 5000 (5000/45000)x100 = 11.11

40000 41250 |41250-40000| = 1250 (1250/40000)x100 = 3.125

Mean dari MAPE 4.75

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 76: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

59

Lampiran 4 Dataset Iklim harian Tahun 2015 dari Bulan April Hingga September

Nama

Stasiun

WMO

ID Tanggal

Suhu

Minimum

Suhu

Maksimum

Suhu

Rata -

rata

Kelemba

ban

Rata-

rata

Curah

Hujan

Lama

Penyinaran

Kecepatan

Angin

Rata-

rata

Arah

Angin

Terban

yak

Kecepatan

Angin

Terbesar

Arah

Angin Saat

Kecepata

Maksimum

Stasiun

Klimatologi

Semarang 96835 01/04/2015 24.6 31.8 28.1 86 42.5 8.4 1 N 4 360

Stasiun

Klimatologi

Semarang 96835 02/04/2015 25.4 31.2 28 84 32.3 9999 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 03/04/2015 23 30.2 26.6 87 5.3 6.7 3 N 4 360

Stasiun

Klimatologi

Semarang 96835 04/04/2015 24.4 33.4 28.3 78 19 2.2 2 E 3 180

Stasiun

Klimatologi

Semarang 96835 05/04/2015 24.8 33 29.2 81 2 10 1 N 2 90

Stasiun

Klimatologi

Semarang 96835 06/04/2015 26.2 32.6 28.2 82 9999 8.5 1 N 4 45

Stasiun

Klimatologi

Semarang 96835 07/04/2015 25.6 30.6 27.1 80 9999 4.7 2 N 3 90

Stasiun

Klimatologi

Semarang 96835 08/04/2015 25 30.8 27.5 80 9999 4.3 2 N 4 360

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 77: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

60

Stasiun

Klimatologi

Semarang 96835 09/04/2015 24.4 31.4 28.2 74 9999 7.8 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 10/04/2015 24.2 33.6 29.1 75 9999 10.4 2 E 4 330

Stasiun

Klimatologi

Semarang 96835 11/04/2015 25.6 31.8 28.9 80 1 9.6 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 12/04/2015 25.6 31.6 28.6 9999 9999 8.2 9999 N 2 360

Stasiun

Klimatologi

Semarang 96835 13/04/2015 24 30.2 26.7 85 15.5 5.1 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 14/04/2015 25 31.8 27.4 82 9999 5.3 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 15/04/2015 24.2 32.2 28.4 78 49.9 7 2 E 2 90

Stasiun

Klimatologi

Semarang 96835 16/04/2015 24.4 31.6 28 85 9999 9999 2 N 2 90

Stasiun

Klimatologi

Semarang 96835 17/04/2015 26 30.8 28.3 79 9999 5 9999 N 2 90

Stasiun

Klimatologi

Semarang 96835 18/04/2015 24.4 31.8 28.1 77 8888 2.5 1 N 4 360

Stasiun

Klimatologi 96835 19/04/2015 26 31.6 26.9 87 9999 9999 1 N 4 225

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 78: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

61

Semarang

Stasiun

Klimatologi

Semarang 96835 20/04/2015 25.2 31.2 27.9 84 15.5 5.3 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 21/04/2015 25 31 28 82 9999 6.6 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 22/04/2015 25.4 31.2 28.2 85 9999 6.2 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 23/04/2015 25.2 31.4 27.4 83 1 4 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 24/04/2015 24.4 31.2 27.6 85 12.2 9.4 1 N 5 360

Stasiun

Klimatologi

Semarang 96835 25/04/2015 24 28.4 26.3 89 21.8 6.9 9999 N 2 360

Stasiun

Klimatologi

Semarang 96835 26/04/2015 24.8 31.2 26.9 86 0.6 0 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 27/04/2015 24.6 31.2 27.3 84 3.2 5 2 N 2 360

Stasiun

Klimatologi

Semarang 96835 28/04/2015 24.6 31 27.8 79 9999 3.8 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 29/04/2015 25.8 30.2 27.7 84 9999 6.7 9999 N 3 360

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 79: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

62

Stasiun

Klimatologi

Semarang 96835 30/04/2015 24 31 27.6 86 35.8 1 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 01/05/2015 23.6 31 27.6 85 27.5 7.8 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 02/05/2015 24 30.2 27.1 86 66 4.8 1 N 2 360

Stasiun

Klimatologi

Semarang 96835 03/05/2015 25 30.4 27.1 84 9999 1.4 2 N 2 360

Stasiun

Klimatologi

Semarang 96835 04/05/2015 20.6 30.4 25.5 94 0.3 1.4 1 N 2 90

Stasiun

Klimatologi

Semarang 96835 05/05/2015 23.6 32.8 27.9 76 71 3.5 1 N 3 90

Stasiun

Klimatologi

Semarang 96835 06/05/2015 26.2 33 29.6 9999 9999 10.4 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 07/05/2015 25.2 33 28.4 78 4.6 9999 1 N 3 90

Stasiun

Klimatologi

Semarang 96835 08/05/2015 24.4 32.8 28.5 69 9999 10.5 3 E 6 120

Stasiun

Klimatologi

Semarang 96835 09/05/2015 24 32.6 27.8 71 9999 10 2 E 2 90

Stasiun

Klimatologi 96835 10/05/2015 23.6 33.4 30 63 9999 9.8 2 E 5 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 80: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

63

Semarang

Stasiun

Klimatologi

Semarang 96835 11/05/2015 27 33.2 29.8 69 9999 9 3 E 5 130

Stasiun

Klimatologi

Semarang 96835 12/05/2015 26.4 34 29.5 71 9999 9.5 2 SE 3 120

Stasiun

Klimatologi

Semarang 96835 13/05/2015 27.8 33 29.8 69 9999 10.2 2 N 3 120

Stasiun

Klimatologi

Semarang 96835 14/05/2015 26.4 33.4 29.2 76 9999 5.2 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 15/05/2015 26 33.4 29.7 72 9999 8.5 3 E 4 90

Stasiun

Klimatologi

Semarang 96835 16/05/2015 24.6 32.4 28.8 75 9999 10 2 N 3 90

Stasiun

Klimatologi

Semarang 96835 17/05/2015 26 33.4 29.3 70 9999 9.8 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 18/05/2015 24.6 33.8 29.2 67 9999 10 1 N 4 90

Stasiun

Klimatologi

Semarang 96835 19/05/2015 25 32.6 28.1 71 9999 10 1 N 4 120

Stasiun

Klimatologi

Semarang 96835 20/05/2015 22.4 32.2 27.6 62 9999 10.3 2 E 4 120

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 81: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

64

Stasiun

Klimatologi

Semarang 96835 21/05/2015 25.4 32.6 29 63 9999 10.3 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 22/05/2015 24.2 33 28.9 66 9999 10.3 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 23/05/2015 24.6 33.8 28.5 69 9999 10 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 24/05/2015 26.4 33 28.9 73 9999 10 2 N 4 120

Stasiun

Klimatologi

Semarang 96835 25/05/2015 26 33.2 29.4 74 9999 10 2 N 5 120

Stasiun

Klimatologi

Semarang 96835 26/05/2015 27 33.2 29.8 73 9999 10 2 E 4 120

Stasiun

Klimatologi

Semarang 96835 27/05/2015 25.4 34 29.5 74 14 8 2 E 2 90

Stasiun

Klimatologi

Semarang 96835 28/05/2015 23.6 33.6 28.9 76 2 9.8 1 N 2 90

Stasiun

Klimatologi

Semarang 96835 29/05/2015 25.4 34.4 29.3 72 9999 9.6 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 30/05/2015 25.4 34.4 28.9 75 9999 10.4 1 N 4 90

Stasiun

Klimatologi 96835 31/05/2015 26.2 34 29 78 9999 9.9 2 E 4 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 82: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

65

Semarang

Stasiun

Klimatologi

Semarang 96835 01/06/2015 24.8 31.8 28.7 77 29.5 9 3 E 6 90

Stasiun

Klimatologi

Semarang 96835 02/06/2015 23.8 32.8 28.3 75 9999 1.2 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 03/06/2015 25.2 34.2 28.4 79 9999 3.8 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 04/06/2015 25.4 33.6 29.3 73 22 9999 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 05/06/2015 25.2 33.8 29.4 67 9999 8.9 2 SE 5 120

Stasiun

Klimatologi

Semarang 96835 06/06/2015 24.8 34 28.6 75 9999 9.5 2 N 4 90

Stasiun

Klimatologi

Semarang 96835 07/06/2015 25.6 32.8 29.1 73 9999 7.5 2 E 5 90

Stasiun

Klimatologi

Semarang 96835 08/06/2015 25 33.4 29 75 1.7 6 2 E 2 90

Stasiun

Klimatologi

Semarang 96835 09/06/2015 26.2 32 28.4 79 9999 7.3 2 N 3 100

Stasiun

Klimatologi

Semarang 96835 10/06/2015 25.4 32.2 28.5 81 9999 3.6 1 N 4 360

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 83: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

66

Stasiun

Klimatologi

Semarang 96835 11/06/2015 25.2 33.4 28.2 78 9999 7.6 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 12/06/2015 22 33 27.5 66 9999 8.3 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 13/06/2015 23 33.8 27.7 66 9999 9.7 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 14/06/2015 22 33.6 27.8 68 9999 9.5 2 E 2 90

Stasiun

Klimatologi

Semarang 96835 15/06/2015 23.6 33.2 27.6 75 2 7.8 1 E 3 90

Stasiun

Klimatologi

Semarang 96835 16/06/2015 22.6 33.6 27.9 61 9999 8 1 N 4 90

Stasiun

Klimatologi

Semarang 96835 17/06/2015 22.8 33.2 27.1 69 9999 10.5 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 18/06/2015 22.8 33.8 28.3 64 9999 9.9 2 E 5 90

Stasiun

Klimatologi

Semarang 96835 19/06/2015 23.4 33.4 27.8 71 9999 10.3 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 20/06/2015 22.6 33.2 28.1 67 9999 8.2 3 E 4 90

Stasiun

Klimatologi 96835 21/06/2015 23.6 33.8 28.7 68 9999 9.5 1 N 3 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 84: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

67

Semarang

Stasiun

Klimatologi

Semarang 96835 22/06/2015 21.4 33.8 27.5 61 9999 9 1 N 3 90

Stasiun

Klimatologi

Semarang 96835 23/06/2015 21.8 33.4 27.2 66 9999 10.3 2 E 5 90

Stasiun

Klimatologi

Semarang 96835 24/06/2015 21 33.6 26.9 64 9999 8.6 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 25/06/2015 22.6 33.2 9999 9999 9999 9999 1 E 3 90

Stasiun

Klimatologi

Semarang 96835 28/06/2015 24.4 33.8 28 71 9999 7 1 N 4 360

Stasiun

Klimatologi

Semarang 96835 29/06/2015 23.8 32.2 27.6 72 9999 10 2 N 6 45

Stasiun

Klimatologi

Semarang 96835 30/06/2015 22.8 33.4 27.7 66 9999 9.4 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 01/07/2015 24.2 30.6 27.4 70 9999 9.2 1 N 4 45

Stasiun

Klimatologi

Semarang 96835 02/07/2015 23.2 32.6 27.5 59 9999 9 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 03/07/2015 20 33.4 26.7 66 9999 6.3 1 N 2 340

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 85: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

68

Stasiun

Klimatologi

Semarang 96835 04/07/2015 22.4 32.4 26.7 69 9999 8.8 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 05/07/2015 22.4 31.6 26.1 71 9999 10 1 N 4 360

Stasiun

Klimatologi

Semarang 96835 06/07/2015 22.2 32.8 26.4 70 9999 9999 2 N 4 90

Stasiun

Klimatologi

Semarang 96835 07/07/2015 23.2 33.8 27.3 70 9999 9 2 E 3 120

Stasiun

Klimatologi

Semarang 96835 08/07/2015 23.4 33.2 27.4 67 9999 7.4 2 E 2 90

Stasiun

Klimatologi

Semarang 96835 09/07/2015 22.4 31.4 27.6 71 9999 8.2 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 10/07/2015 22.4 33.2 27 65 9999 2.5 2 E 5 90

Stasiun

Klimatologi

Semarang 96835 11/07/2015 24.6 33.4 28.6 63 9999 8.2 3 E 5 120

Stasiun

Klimatologi

Semarang 96835 12/07/2015 26.6 33.4 29.2 67 9999 8 4 SE 4 120

Stasiun

Klimatologi

Semarang 96835 13/07/2015 26.6 34.2 29.5 67 9999 10.1 4 E 6 90

Stasiun

Klimatologi 96835 14/07/2015 26.4 33.2 28.9 60 9999 10 2 E 3 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 86: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

69

Semarang

Stasiun

Klimatologi

Semarang 96835 15/07/2015 26 33.4 28.9 61 9999 9.5 3 E 5 90

Stasiun

Klimatologi

Semarang 96835 16/07/2015 25.3 33 28.9 62 9999 10 4 E 6 90

Stasiun

Klimatologi

Semarang 96835 17/07/2015 25 33.6 27.9 68 9999 10 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 18/07/2015 24.8 34 28.8 66 9999 10.3 2 N 4 90

Stasiun

Klimatologi

Semarang 96835 19/07/2015 24 34 27.9 67 9999 9.8 2 N 5 120

Stasiun

Klimatologi

Semarang 96835 20/07/2015 25.6 33.8 28.7 69 9999 10 2 E 5 90

Stasiun

Klimatologi

Semarang 96835 21/07/2015 26.2 33.6 29 68 9999 10 1 N 3 90

Stasiun

Klimatologi

Semarang 96835 22/07/2015 25.4 33.8 28.4 72 1.5 10.1 2 E 5 130

Stasiun

Klimatologi

Semarang 96835 23/07/2015 25.4 33.2 28.3 69 9999 9.4 2 SE 5 120

Stasiun

Klimatologi

Semarang 96835 24/07/2015 24.4 34 28.8 65 9999 10 2 N 5 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 87: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

70

Stasiun

Klimatologi

Semarang 96835 25/07/2015 23.8 33.8 32.5 50 9999 10.3 2 N 5 360

Stasiun

Klimatologi

Semarang 96835 26/07/2015 22.8 34 28.4 67 9999 9.6 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 27/07/2015 22.6 34.2 28.4 67 9999 10 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 28/07/2015 24.4 34.4 28.6 69 9999 9.8 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 29/07/2015 23.6 34.6 28.2 67 9999 10.2 2 E 5 90

Stasiun

Klimatologi

Semarang 96835 30/07/2015 26.2 34.2 28.8 68 9999 10.3 2 N 5 360

Stasiun

Klimatologi

Semarang 96835 31/07/2015 24.2 34 28.3 72 9 9 3 N 4 90

Stasiun

Klimatologi

Semarang 96835 01/08/2015 21.8 34.2 28 68 9999 10 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 02/08/2015 23.2 34 27.4 59 9999 7 3 N 4 90

Stasiun

Klimatologi

Semarang 96835 03/08/2015 19.8 33.4 25.8 66 9999 10.5 2 N 4 360

Stasiun

Klimatologi 96835 04/08/2015 23.6 32.6 27 68 9999 10.5 2 N 4 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 88: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

71

Semarang

Stasiun

Klimatologi

Semarang 96835 05/08/2015 23.6 33 27.8 66 9999 8.7 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 06/08/2015 25.8 32.4 28.2 67 9999 9.4 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 07/08/2015 22.8 33 27.9 74 5.6 5 2 E 3 180

Stasiun

Klimatologi

Semarang 96835 08/08/2015 23.6 33.6 27.7 67 9999 5.5 2 N 3 90

Stasiun

Klimatologi

Semarang 96835 09/08/2015 24.8 33.4 28.5 66 9999 9 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 10/08/2015 26 35 29.1 67 9999 7.3 3 N 6 120

Stasiun

Klimatologi

Semarang 96835 11/08/2015 26.2 34.6 29.4 64 9999 9.5 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 12/08/2015 25.8 35.4 28.8 72 9999 9.4 1 N 4 120

Stasiun

Klimatologi

Semarang 96835 14/08/2015 23.8 33.6 28.7 71 9999 9 2 N 5 360

Stasiun

Klimatologi

Semarang 96835 15/08/2015 26 34.6 29.3 69 9999 9.8 2 E 5 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 89: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

72

Stasiun

Klimatologi

Semarang 96835 16/08/2015 23.8 34.2 29 62 9999 10.3 3 E 5 360

Stasiun

Klimatologi

Semarang 96835 17/08/2015 24.6 35 28 68 9999 10 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 18/08/2015 25.2 34 28.1 67 9999 10 2 N 3 120

Stasiun

Klimatologi

Semarang 96835 19/08/2015 23.4 34 28.7 69 9999 9.8 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 20/08/2015 22 34.4 27.1 64 9999 10 2 E 4 330

Stasiun

Klimatologi

Semarang 96835 21/08/2015 21.4 33 26.8 67 9999 10 2 N 4 90

Stasiun

Klimatologi

Semarang 96835 22/08/2015 23.6 33.8 27.4 63 9999 10.5 2 E 5 360

Stasiun

Klimatologi

Semarang 96835 23/08/2015 22.4 34.4 27.2 61 9999 10 1 N 3 90

Stasiun

Klimatologi

Semarang 96835 24/08/2015 22.2 35.4 27.5 64 9999 10.4 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 25/08/2015 23.4 35.4 28.2 63 9999 10.2 2 E 4 360

Stasiun

Klimatologi 96835 26/08/2015 23.4 34.6 28.1 70 9999 9.2 2 E 3 360

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 90: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

73

Semarang

Stasiun

Klimatologi

Semarang 96835 27/08/2015 24.4 34.6 28.5 69 9999 10.3 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 28/08/2015 25 34.4 29.2 63 9999 10.3 1 N 4 360

Stasiun

Klimatologi

Semarang 96835 29/08/2015 22.4 35.8 28 67 9999 10.5 2 E 5 315

Stasiun

Klimatologi

Semarang 96835 30/08/2015 23.6 35.4 28.4 68 2 10.5 3 E 5 90

Stasiun

Klimatologi

Semarang 96835 31/08/2015 22.6 35.2 28.6 62 9999 10.5 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 01/09/2015 23.6 35.4 28.3 68 9999 10 1 E 2 90

Stasiun

Klimatologi

Semarang 96835 02/09/2015 22.8 35.4 28.1 61 9999 10 1 N 4 90

Stasiun

Klimatologi

Semarang 96835 03/09/2015 22 33.2 27.6 67 9999 10.7 2 N 6 90

Stasiun

Klimatologi

Semarang 96835 04/09/2015 23.8 35.2 28.1 65 9999 10.4 2 N 4 90

Stasiun

Klimatologi

Semarang 96835 05/09/2015 23.6 35 28.2 65 9999 10.3 2 E 3 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 91: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

74

Stasiun

Klimatologi

Semarang 96835 06/09/2015 20.8 35.2 28 68 9999 10.4 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 07/09/2015 23.2 35.6 28.4 64 9999 10 2 E 4 360

Stasiun

Klimatologi

Semarang 96835 08/09/2015 23.8 35.4 28.9 64 9999 9.8 2 N 3 90

Stasiun

Klimatologi

Semarang 96835 09/09/2015 23.4 35.4 28.4 66 9999 10 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 10/09/2015 25 35.4 29.7 53 9999 10.2 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 11/09/2015 21.6 35 28.3 61 9999 9999 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 12/09/2015 25.6 35.4 29.8 57 9999 10 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 13/09/2015 26 34.6 29.7 62 9999 9.7 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 14/09/2015 23.2 33.8 28.4 61 9999 9.6 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 15/09/2015 23.2 34.8 28 62 9999 9 2 N 4 90

Stasiun

Klimatologi 96835 16/09/2015 24.2 34.6 29.3 59 9999 8.9 2 E 5 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 92: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

75

Semarang

Stasiun

Klimatologi

Semarang 96835 17/09/2015 25.8 35.2 29.2 65 9999 7.6 2 E 4 120

Stasiun

Klimatologi

Semarang 96835 18/09/2015 26.6 36.2 30.9 52 9999 10 3 E 4 90

Stasiun

Klimatologi

Semarang 96835 19/09/2015 23.6 35.2 29.3 61 9999 9.6 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 20/09/2015 25.2 32.8 28.5 72 9999 9.7 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 21/09/2015 24.8 33 29.1 65 9999 10 2 N 4 360

Stasiun

Klimatologi

Semarang 96835 22/09/2015 23.4 37.6 29.4 59 9999 10 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 23/09/2015 24 35.8 29 64 9999 10.9 2 N 3 90

Stasiun

Klimatologi

Semarang 96835 24/09/2015 23.6 32.8 28.5 67 9999 9.3 3 N 3 360

Stasiun

Klimatologi

Semarang 96835 25/09/2015 23 35.4 28.6 62 9999 9.7 2 N 3 90

Stasiun

Klimatologi

Semarang 96835 26/09/2015 23.4 35.6 29.2 62 9999 9.7 2 N 3 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 93: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

76

Stasiun

Klimatologi

Semarang 96835 27/09/2015 26.2 35 29.9 61 9999 10 1 N 4 90

Stasiun

Klimatologi

Semarang 96835 29/09/2015 25.2 35.8 30.5 56 9999 9 3 E 5 90

Stasiun

Klimatologi

Semarang 96835 30/09/2015 26.4 35 30.8 53 9999 10 3 N 3 360

Stasiun

Klimatologi

Semarang 96835 01/10/2015 25.2 36.8 31 51 9999 8.7 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 02/10/2015 26.4 36.6 31.6 52 9999 9.4 3 E 5 90

Stasiun

Klimatologi

Semarang 96835 03/10/2015 26 36.4 30.4 52 0.4 9.8 2 N 6 90

Stasiun

Klimatologi

Semarang 96835 04/10/2015 27 36 30.5 51 9999 10 3 E 6 90

Stasiun

Klimatologi

Semarang 96835 05/10/2015 25.4 35.4 29.2 57 9999 10 3 E 4 120

Stasiun

Klimatologi

Semarang 96835 06/10/2015 24.4 32.4 28.1 73 9999 10 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 07/10/2015 24.2 36.2 29.6 67 9999 9.3 2 N 4 360

Stasiun

Klimatologi 96835 08/10/2015 25.4 36.4 29.4 66 9999 8.7 1 N 4 360

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 94: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

77

Semarang

Stasiun

Klimatologi

Semarang 96835 09/10/2015 25 36 29.5 65 9999 9.5 1 N 4 90

Stasiun

Klimatologi

Semarang 96835 10/10/2015 23.6 36.2 29.7 63 9999 10 2 E 4 90

Stasiun

Klimatologi

Semarang 96835 11/10/2015 27 34 29.2 63 9999 10.4 3 N 4 360

Stasiun

Klimatologi

Semarang 96835 12/10/2015 26.4 35.4 30.9 59 9999 10 3 N 5 360

Stasiun

Klimatologi

Semarang 96835 13/10/2015 25 36 29.5 9999 9999 9999 2 N 3 360

Stasiun

Klimatologi

Semarang 96835 14/10/2015 25 36.8 30.3 62 9999 9.3 1 N 3 90

Stasiun

Klimatologi

Semarang 96835 15/10/2015 25.8 36.8 30.4 59 9999 10.5 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 16/10/2015 24.6 36.6 30.8 49 9999 9.6 2 N 7 120

Stasiun

Klimatologi

Semarang 96835 17/10/2015 22.8 31.8 27.3 9999 9999 10 2 N 5 90

Stasiun

Klimatologi

Semarang 96835 18/10/2015 25 31 28 9999 9999 9999 2 N 3 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 95: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

78

Stasiun

Klimatologi

Semarang 96835 19/10/2015 25.4 37.6 30 63 9999 8.4 2 N 4 90

Stasiun

Klimatologi

Semarang 96835 20/10/2015 24 37.2 30.4 62 9999 4 2 E 3 90

Stasiun

Klimatologi

Semarang 96835 21/10/2015 24.8 36.6 30 61 9999 11 3 E 6 90

Stasiun

Klimatologi

Semarang 96835 22/10/2015 26.4 36.2 30.7 52 9999 9.4 3 E 6 90

Stasiun

Klimatologi

Semarang 96835 23/10/2015 24.8 36 30.4 9999 9999 9.8 4 E 8 80

Stasiun

Klimatologi

Semarang 96835 24/10/2015 26 36 31 9999 9999 9999 4 E 5 360

Stasiun

Klimatologi

Semarang 96835 25/10/2015 23.6 37 30.3 9999 9999 9999 1 N 3 360

Stasiun

Klimatologi

Semarang 96835 26/10/2015 24 36.8 30.2 62 9999 9.8 1 N 4 90

Stasiun

Klimatologi

Semarang 96835 27/10/2015 25.2 38.2 30.7 61 9999 9 3 E 5 90

Stasiun

Klimatologi

Semarang 96835 28/10/2015 26 34.6 29.6 72 9999 10.2 3 E 8 320

Stasiun

Klimatologi 96835 29/10/2015 25.8 38 31.9 9999 9999 9.2 3 E 5 90

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 96: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

79

Semarang

Stasiun

Klimatologi

Semarang 96835 30/10/2015 25.4 37.6 31.5 9999 9999 9999 9999 E 9999 90

Stasiun

Klimatologi

Semarang 96835 31/10/2015 25.4 36.6 30 69 9999 7 3 N 5 350

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 97: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

80

Lampiran 5 Contoh Dataset Transaksi Tembakau PT. GUDANG GARAM TBK

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 98: PENDEKATAN RANDOM FOREST UNTUK MODEL …repository.usd.ac.id/35477/2/155314025_full.pdfmenentukan harga tembakau rajangan masih bergantung kepada grader pabrik. Dalam penelitian ini

81

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI