ontologi populasi teks tentang penyakit tanaman tesis program studi

16
i ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN TESIS SUFIANTO 117038084 PROGRAM STUDI (S2) TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2014 Universitas Sumatera Utara

Upload: duongliem

Post on 28-Jan-2017

231 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: ontologi populasi teks tentang penyakit tanaman tesis program studi

i

ONTOLOGI POPULASI TEKS TENTANG

PENYAKIT TANAMAN

TESIS

SUFIANTO

117038084

PROGRAM STUDI (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2014

Universitas Sumatera Utara

Page 2: ontologi populasi teks tentang penyakit tanaman tesis program studi

i

ONTOLOGI POPULASI TEKS TENTANG

PENYAKIT TANAMAN

TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah

Magister Teknik Informatika

SUFIANTO

117038084

PROGRAM STUDI (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2014

Universitas Sumatera Utara

Page 3: ontologi populasi teks tentang penyakit tanaman tesis program studi

ii

PERSETUJUAN

Judul Tesis : Ontologi Populasi Teks Tentang Penyakit Tanaman

Kategori : Tesis

Nama Mahasiswa : Sufianto

NIM : 117038084

Program Studi : Magister Teknik Informatika

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

Pembimbing 2 Pembimbing 1

(Dr. Mahyuddin K.M. Nasution, M.IT) (Prof. Dr. Tulus,M.Si)

Diketahui/disetujui oleh:

Program Studi S2 Teknik Informatika

Ketua,

(Prof. Dr. Muhammad Zarlis) NIP. 19570701 198601 1003

Universitas Sumatera Utara

Page 4: ontologi populasi teks tentang penyakit tanaman tesis program studi

iii

PERNYATAAN ORIGINALITAS

ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa

kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 3 Januari 2014

Sufianto

117038084

Universitas Sumatera Utara

Page 5: ontologi populasi teks tentang penyakit tanaman tesis program studi

iv

PERNYATAAN PERSETUJUAN PUBLIKASI

KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan

dibawah ini:

Nama : Sufianto

NIM : 117038084

Program Studi : Teknik Informatika

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty

Free Right) atas tesis saya yang berjudul:

ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-

Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,

memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis

saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai

penulis dan sebagai pemegang dan/ atau sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya.

Medan, 3 Januari 2014

Sufianto

117038084

Universitas Sumatera Utara

Page 6: ontologi populasi teks tentang penyakit tanaman tesis program studi

v

Telah diuji pada

Tanggal : 3 Januari 2014

PANITIA PENGUJI TESIS

Ketua : Prof. Dr. Tulus, M.Si.

Anggota : 1. Dr. Mahyuddin K.M. Nasution, M.IT.

2. Prof. Dr. Herman Mawengkang.

3. Prof. Dr. Muhammad Zarlis.

4. Dr. Syahril Efendi, M.IT.

Universitas Sumatera Utara

Page 7: ontologi populasi teks tentang penyakit tanaman tesis program studi

vi

RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap (berikut gelar): Ir. Sufianto

Tempat dan Tanggal Lahir : Medan, 10 Nopember 1957

Alamat Rumah : Jl. Kemenyan II No. 1 Blok-H, P. Simalingkar

Kel. Mangga, Kec. Medan Tuntungan – 20141

Telepon/HP : (061)-8362916 – 0852.6201.2345

Email : [email protected]

Instansi Tempat Bekerja : Sekolah Tinggi Teknik Harapan

Alamt Kantor : Jl. HM Joni No.70 Medan

DATA PENDIDIKAN

SD : SD Neg 2/36 Medan TAMAT: tahun 1971

SLTP : SMP Tamansiswa Medan, TAMAT: tahun 1974

SLTA : SMA Tamansiswa Medan, TAMAT: tahun 1977

S1 : FP UISU TAMAT: tahun 1986

S2 : Teknik Informatika USU TAMAT: tahun 2014

Universitas Sumatera Utara

Page 8: ontologi populasi teks tentang penyakit tanaman tesis program studi

vii

KATA PENGANTAR

Syukur Alhamdulillah penulis persembahkan kepada Tuhan Yang Maha Suci dan

Maha Tinggi atas segala limpahan Rahmat dan Hidayah-Nya, sehingga penulis dapat

mempersiapkan tesis Magister (S2) Teknik Informatika sebagaimana yang telah

ditentukan. Tesis ini berjudul: “ONTOLOGI POPULASI TEKS TENTANG

PENYAKIT TANAMAN”. Tesis ini merupakan persyaratan tugas akhir pada

Program Studi Magister (S2) Teknik Informatika - Fakultas Ilmu Komputer dan

Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU).

Pada kesempatan ini, penulis menyampaikan ucapan terimakasih dan

penghargaan yang setinggi-tingginya kepada:

1. Prof. Dr. Syahril Pasaribu, DTM&H, M.Sc.(CTM), Sp.A(K), selaku Rektor

Universitas Sumatera Utara.

2. Prof. Dr. Muhammad Zarlis, selaku Dekan Fakultas Ilmu Komputer dan

Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU),

yang juga sebagai Ketua Program Studi Magister (S2) Teknik Informatika di

Fasilkom-TI USU.

3. Prof. Dr. Tulus, M.Si., selaku dosen pembimbing I dalam penyelesaian tesis

ini, penulis mengucapkan terimakasih yang setinggi-tingginya atas

bimbingan yang telah diberikan kepada penulis. Semoga Allah SWT,

memberikan balasan yang tiada batasnya.

4. Dr. Mahyuddin K.M. Nasution, M.IT, selaku dosen pembimbing II dalam

penyelesaian tesis ini, penulis menyampaikan terimakasih yang tiada

berhingga. Semoga pula Allah SWT, memberikan kemurahanNya kepada

beliau dalam segala hal.

5. Seluruh Staf Pengajar pada Fasilkom-TI USU yang telah dengan sungguh-

sungguh berupaya memberikan ilmu dan pengetahuannya kepada penulis

selama mengikuti perkuliahan di Program Studi Magister (S2) Teknik

Informatika di Fasilkom-TI USU. Demikian pula kepada seluruh pegawai

administrasi di Program Studi Magister (S2) Teknik Informatika di

Fasilkom-TI USU yang telah memberikan bantuan dan pelayanan yang

Universitas Sumatera Utara

Page 9: ontologi populasi teks tentang penyakit tanaman tesis program studi

viii

sangat baik kepada penulis. Mudah-mudah Allah SWT memberikan ganjaran

yang berlipat ganda. Amin.

6. Kepada teman-teman sekelas di Kom-C angkatan 2011/2012 yang telah

demikian akrab, penulis mengucapkan terimakasih yang sebesar-besarnya

atas kerjasama yang diberikan kepada penulis. Mudah-mudahan keakraban

ini terus berlanjut.

7. Kepada istri dan keluargaku tercinta semua, yang senantiasa setia

memberikan spirit dalam menyelesaikan pendidikan di Program Studi

Magister (S2) Teknik Informatika di Fasilkom-TI USU, penulis

mengucapkan terimakasih yang tiada berhingga. Semoga Allah SWT,

memberikan ganjaran yang berlipat ganda. Amin.

Demikian hal ini penulis sampaikan, semoga tesis ini bermanfaat kelak bagi kita

semua khususnya bagi penulis.

Medan, 3 Januari 2014

Penulis,

Sufianto

Universitas Sumatera Utara

Page 10: ontologi populasi teks tentang penyakit tanaman tesis program studi

ix

ABSTRAK

Populasi teks adalah sekumpulan teks atau kata yang mempunyai sifat yang sama dan

menjadi obyek konsep pengetahuan dan berperan sebagai inferensi. Ontologi

merupakan jenis metode pemodelan yang digunakan untuk menguraikan antara

hubungan kata dengan melibatkan penyusunan aturan hubungan dengan melibatkan

perlengkapan grafis yang dikenali sebagai TBox. Enam jenis dokumen yang memiliki

hubungan semantik dan rule baru berasal dari hubungan semantik awal. Studi ini

sangat membantu untuk memiliki latar belakang pengetahuan tentang domain sebelum

menemukan pola word. Dengan memetakan enam hubungan semantik dan aturan-

aturan (rule) untuk dokumen lainnya dalam corpus (teks) untuk mengekstrak

pengetahuan pada penyakit tanaman kakao yang relevan yang dilakukan secara

manual akan berkurang. Pendekatan pada penyakit busuk buah pada tanaman kakao

mempunyai word ke- 6 di dalam dokumen uji nilai indeks semantik web 0.09677419,

penyakit vascular streak dieback (VSD) pada tanaman kakao mempunyai word ke-8

di dalam dokumen uji nilai indeks semantik web 0.00428571, penyakit antraknosa pada

tanaman kakao mempunyai word ke-5 uji nilai indeks semantik web 0.0003139,

penyakit jamur upas pada tanaman kakao mempunyai word ke-6 uji nilai indeks

semantik web 0.00061798, penyakit busuk akar mempunyai word ke-6 uji nilai indeks

semantik web 0.99044586, sedangkan penyakit layu pentil buah word ke 217 uji nilai

indeks semantik web 0.05882353. Penelitian selanjutnya diharapkan jumlah kapasitas

pada sebuah dokumen uji dapat lebih besar di dalam pendekatan untuk uji dokumen

lainnya.

Kata kunci: Ontologi, Kakao, Penyakit, Tbox, Semantic Web

Universitas Sumatera Utara

Page 11: ontologi populasi teks tentang penyakit tanaman tesis program studi

x

ONTOLOGY POPULATION TEXT

OF PLANT DISEASE

ABSTRACT

The population is a set of text or text the word which has the same properties and

become the object of the concept of knowledge and serve as inference . Ontology is a

kind of modeling method is used to describe the relationship between words by

involving the preparation of equipment rules involving graphical relationships that are

recognized as TBox . Study domain is a plant cacao (chocolate) and diseases related to

it . Six types of documents that have semantic relations and the new rule is derived

from the initial semantic relationships. By mapping six semantic relationships and

rules (rule) to other documents in the corpus (text) to extract knowledge on cocoa

plant diseases relevant is done manually will be reduced . Approach to fruit rot disease

on cocoa crops have the 6th word in the test document semantic web index value

0.09677419 , vascular disease streak dieback (VSD) in cocoa plant has the 8th word in

the test document semantic web index value 0.00428571 , anthracnose disease the

cocoa plant has the 5th word test semantic web index value 0.0003139 , fungal

diseases in plants policeman cocoa - 6 has a word to test the semantic web index value

0.00061798 , word root rot has the 6th test semantic web index value 0.99044586 ,

whereas disease withered teat pieces to 217 word test semantic web index value

0.05882353 . Future studies are expected to total capacity on a test document can be

greater in the approach to test other documents

Kata kunci: Ontologi, Kakao, Penyakit, Tbox, Semantic Web

Universitas Sumatera Utara

Page 12: ontologi populasi teks tentang penyakit tanaman tesis program studi

xi

DAFTAR ISI

Halaman

HALAMAN JUDUL i

PERSETUJUAN ii

PERNYATAAN ORIGINALITAS iii

PERSETUJUAN PUBLIKASI iv

PANITIA PENGUJI v

RIWAYAT HIDUP vi

KATA PENGANTAR vii

ABSTRAK ix

ABSTRACT x

DAFTAR ISI xi

DAFTAR GAMBAR xiii

DAFTAR TABEL xiv

BAB 1 PENDAHULUAN 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 2

1.3 Tujuan Penelitian 3

1.4 Batasan Masalah/Ruang Lingkup Kajian 5

BAB 2 TINJAUAN PUSTAKA 6

2.1 Ontologi 6

2.1.1 TBox dan ABox 7

2.2 Sistem Pendukung Keputusan 8

Universitas Sumatera Utara

Page 13: ontologi populasi teks tentang penyakit tanaman tesis program studi

xii

2.3 Pemaknaan Teks 9

2.3.1 Korpus 9

2.3.2 Sampel dan Populasi teks 10

2.4 Text Mining 10

2.5 Recall dan Presisi 11

BAB 3 METODOLOGI PENELITIAN 12

3.1 Rancangan Penelitian 12

3.2 Analisis Ontologi Penyakit 15

3.2.1 Flowchat proses tokenizing 15

3.2.2 Flowchat pemotongan kata demi kata 16

3.2.3 Flowchat Mencari vocabulary kata 17

3.2.4 Pemilihan dokumen 21

3.2.5 Proses Tokenizing 21

3.2.6 Proses Filtering 22

3.2.7 Proses Stemming 22

3.2.8 Proses Analizing 22

3.3 Rule 23

BAB 4 HASIL DAN PEMBAHASAN 24

4.1 Indeks semantic web dari mesin pencarian yahoo 24

4.1.1 Indeks Populasi teks dengan kata “Penyakit” 24

4.1.2 Indeks Populasi teks dengan kata “busuk buah” 25

4.1.3 Indeks Populasi teks dengan kata “penyakit busuk buah pada

tanaman kakao” 26

4.1.4 Indeks Populasi teks dengan kata "vascular streak dieback" 26

4.1.5 Indeks Populasi teks dengan kata "penyakit vascular streak

dieback pada tanaman kakao" 27

4.1.6 Indeks Populasi teks dengan kata "busuk akar" 27

4.1.7 Indeks Populasi teks dengan kata "penyakit busuk akar pada

tanaman kakao" 28

4.1.8 Indeks Populasi teks dengan kata "antraknosa" 28

Universitas Sumatera Utara

Page 14: ontologi populasi teks tentang penyakit tanaman tesis program studi

xiii

4.1.9 Indeks Populasi teks dengan kata "penyakit antraknosa pada

tanaman kakao" 29

4.1.10 Indeks Populasi teks dengan kata "jamur upas" 29

4.2 Pengujian dokumen populasi teks 30

4.2.1 Tampilan Hasil pencarian kata pada populasi teks 30

4.2.2 Hasil penemuan kata penyakit pada tanaman kakao 31

Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao 31

4.2.3 Hasil pencarian populasi teks dari indeks semantik web 31

BAB 5 KESIMPULAN DAN SARAN 33

5.1 Kesimpulan 33

5.2 Saran 34

DAFTAR PUSTAKA 35

LAMPIRAN 1 Daftar Publikasi Ilmiah 38

LAMPIRAN 2 Dokumen Uji 39

Universitas Sumatera Utara

Page 15: ontologi populasi teks tentang penyakit tanaman tesis program studi

xiv

DAFTAR GAMBAR

Gambar 3. 1 Ilustrasi Proses Penelitian Secara Garis Besar 13

Gambar 3. 2 Tahap Pemotongan String Input Kata Yang Menyusunnya 16

Gambar 3. 3 Pemotongan Data Demi Kata 17

Gambar 3. 4 Mencari Vocabulary Kata 18

Gambar 3. 5 Tbox Ontologi Penyakit Pada Tanaman Kakao 19

Gambar 3. 6 Step Pada Semantic Identifikasi Relasi 20

Gambar 3. 7 Total Dokumen Uji Yang Dilakukan 21

Gambar 4. 1 Indeks pencarian kata “penyakit”dari yahoo 25

Gambar 4. 2 Indeks Pencarian Kata “Busuk Buah”Dari Yahoo 25

Gambar 4. 3 Pencarian Kata “Penyakit Busuk Buah Pada Kakao”Dari Yahoo 26

Gambar 4. 4 Indeks Pencarian Kata "Vascular Streak Dieback"Dari Yahoo 26

Gambar 4. 5 Pencarian Kata "Penyakit Vascular Streak Dieback Pada Tanaman 27

Gambar 4. 6 Indeks Pencarian Kata "Busuk Akar" Dari Yahoo 27

Gambar 4. 7 Pencarian Kata"Penyakit Busuk Akar Tanaman Kakao"Dari Yahoo 28

Gambar 4. 8 Pencarian Kata"Antraknosa"Dari Yahoo 28

Gambar 4. 9 Pencarian Kata"Penyakit Antraknosa Tanaman Kakao"Dari Yahoo 29

Gambar 4. 10 Indeks Pencarian Kata"Jamur Upas"Dari Yahoo 29

Gambar 4. 11 Hasil Pencarian Kata Pada Populasi Teks Dengan Dokumen Uji 30

Universitas Sumatera Utara

Page 16: ontologi populasi teks tentang penyakit tanaman tesis program studi

xv

DAFTAR TABEL

Tabel 4. 1 Populasi teks 24

Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao 31

Tabel 4. 3 Hasil pencarian populasi teks dari indeks semantik web 32

Universitas Sumatera Utara