ontologi populasi teks tentang penyakit tanaman tesis program studi
Post on 28-Jan-2017
231 Views
Preview:
TRANSCRIPT
i
ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN
TESIS
SUFIANTO
117038084
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2014
Universitas Sumatera Utara
i
ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
SUFIANTO
117038084
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2014
Universitas Sumatera Utara
ii
PERSETUJUAN
Judul Tesis : Ontologi Populasi Teks Tentang Penyakit Tanaman
Kategori : Tesis
Nama Mahasiswa : Sufianto
NIM : 117038084
Program Studi : Magister Teknik Informatika
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
Pembimbing 2 Pembimbing 1
(Dr. Mahyuddin K.M. Nasution, M.IT) (Prof. Dr. Tulus,M.Si)
Diketahui/disetujui oleh:
Program Studi S2 Teknik Informatika
Ketua,
(Prof. Dr. Muhammad Zarlis) NIP. 19570701 198601 1003
Universitas Sumatera Utara
iii
PERNYATAAN ORIGINALITAS
ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 3 Januari 2014
Sufianto
117038084
Universitas Sumatera Utara
iv
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan
dibawah ini:
Nama : Sufianto
NIM : 117038084
Program Studi : Teknik Informatika
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:
ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-
Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,
memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis
saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai
penulis dan sebagai pemegang dan/ atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 3 Januari 2014
Sufianto
117038084
Universitas Sumatera Utara
v
Telah diuji pada
Tanggal : 3 Januari 2014
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Tulus, M.Si.
Anggota : 1. Dr. Mahyuddin K.M. Nasution, M.IT.
2. Prof. Dr. Herman Mawengkang.
3. Prof. Dr. Muhammad Zarlis.
4. Dr. Syahril Efendi, M.IT.
Universitas Sumatera Utara
vi
RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap (berikut gelar): Ir. Sufianto
Tempat dan Tanggal Lahir : Medan, 10 Nopember 1957
Alamat Rumah : Jl. Kemenyan II No. 1 Blok-H, P. Simalingkar
Kel. Mangga, Kec. Medan Tuntungan – 20141
Telepon/HP : (061)-8362916 – 0852.6201.2345
Email : sufi_anto@yahoo.com
Instansi Tempat Bekerja : Sekolah Tinggi Teknik Harapan
Alamt Kantor : Jl. HM Joni No.70 Medan
DATA PENDIDIKAN
SD : SD Neg 2/36 Medan TAMAT: tahun 1971
SLTP : SMP Tamansiswa Medan, TAMAT: tahun 1974
SLTA : SMA Tamansiswa Medan, TAMAT: tahun 1977
S1 : FP UISU TAMAT: tahun 1986
S2 : Teknik Informatika USU TAMAT: tahun 2014
Universitas Sumatera Utara
vii
KATA PENGANTAR
Syukur Alhamdulillah penulis persembahkan kepada Tuhan Yang Maha Suci dan
Maha Tinggi atas segala limpahan Rahmat dan Hidayah-Nya, sehingga penulis dapat
mempersiapkan tesis Magister (S2) Teknik Informatika sebagaimana yang telah
ditentukan. Tesis ini berjudul: “ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN”. Tesis ini merupakan persyaratan tugas akhir pada
Program Studi Magister (S2) Teknik Informatika - Fakultas Ilmu Komputer dan
Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU).
Pada kesempatan ini, penulis menyampaikan ucapan terimakasih dan
penghargaan yang setinggi-tingginya kepada:
1. Prof. Dr. Syahril Pasaribu, DTM&H, M.Sc.(CTM), Sp.A(K), selaku Rektor
Universitas Sumatera Utara.
2. Prof. Dr. Muhammad Zarlis, selaku Dekan Fakultas Ilmu Komputer dan
Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU),
yang juga sebagai Ketua Program Studi Magister (S2) Teknik Informatika di
Fasilkom-TI USU.
3. Prof. Dr. Tulus, M.Si., selaku dosen pembimbing I dalam penyelesaian tesis
ini, penulis mengucapkan terimakasih yang setinggi-tingginya atas
bimbingan yang telah diberikan kepada penulis. Semoga Allah SWT,
memberikan balasan yang tiada batasnya.
4. Dr. Mahyuddin K.M. Nasution, M.IT, selaku dosen pembimbing II dalam
penyelesaian tesis ini, penulis menyampaikan terimakasih yang tiada
berhingga. Semoga pula Allah SWT, memberikan kemurahanNya kepada
beliau dalam segala hal.
5. Seluruh Staf Pengajar pada Fasilkom-TI USU yang telah dengan sungguh-
sungguh berupaya memberikan ilmu dan pengetahuannya kepada penulis
selama mengikuti perkuliahan di Program Studi Magister (S2) Teknik
Informatika di Fasilkom-TI USU. Demikian pula kepada seluruh pegawai
administrasi di Program Studi Magister (S2) Teknik Informatika di
Fasilkom-TI USU yang telah memberikan bantuan dan pelayanan yang
Universitas Sumatera Utara
viii
sangat baik kepada penulis. Mudah-mudah Allah SWT memberikan ganjaran
yang berlipat ganda. Amin.
6. Kepada teman-teman sekelas di Kom-C angkatan 2011/2012 yang telah
demikian akrab, penulis mengucapkan terimakasih yang sebesar-besarnya
atas kerjasama yang diberikan kepada penulis. Mudah-mudahan keakraban
ini terus berlanjut.
7. Kepada istri dan keluargaku tercinta semua, yang senantiasa setia
memberikan spirit dalam menyelesaikan pendidikan di Program Studi
Magister (S2) Teknik Informatika di Fasilkom-TI USU, penulis
mengucapkan terimakasih yang tiada berhingga. Semoga Allah SWT,
memberikan ganjaran yang berlipat ganda. Amin.
Demikian hal ini penulis sampaikan, semoga tesis ini bermanfaat kelak bagi kita
semua khususnya bagi penulis.
Medan, 3 Januari 2014
Penulis,
Sufianto
Universitas Sumatera Utara
ix
ABSTRAK
Populasi teks adalah sekumpulan teks atau kata yang mempunyai sifat yang sama dan
menjadi obyek konsep pengetahuan dan berperan sebagai inferensi. Ontologi
merupakan jenis metode pemodelan yang digunakan untuk menguraikan antara
hubungan kata dengan melibatkan penyusunan aturan hubungan dengan melibatkan
perlengkapan grafis yang dikenali sebagai TBox. Enam jenis dokumen yang memiliki
hubungan semantik dan rule baru berasal dari hubungan semantik awal. Studi ini
sangat membantu untuk memiliki latar belakang pengetahuan tentang domain sebelum
menemukan pola word. Dengan memetakan enam hubungan semantik dan aturan-
aturan (rule) untuk dokumen lainnya dalam corpus (teks) untuk mengekstrak
pengetahuan pada penyakit tanaman kakao yang relevan yang dilakukan secara
manual akan berkurang. Pendekatan pada penyakit busuk buah pada tanaman kakao
mempunyai word ke- 6 di dalam dokumen uji nilai indeks semantik web 0.09677419,
penyakit vascular streak dieback (VSD) pada tanaman kakao mempunyai word ke-8
di dalam dokumen uji nilai indeks semantik web 0.00428571, penyakit antraknosa pada
tanaman kakao mempunyai word ke-5 uji nilai indeks semantik web 0.0003139,
penyakit jamur upas pada tanaman kakao mempunyai word ke-6 uji nilai indeks
semantik web 0.00061798, penyakit busuk akar mempunyai word ke-6 uji nilai indeks
semantik web 0.99044586, sedangkan penyakit layu pentil buah word ke 217 uji nilai
indeks semantik web 0.05882353. Penelitian selanjutnya diharapkan jumlah kapasitas
pada sebuah dokumen uji dapat lebih besar di dalam pendekatan untuk uji dokumen
lainnya.
Kata kunci: Ontologi, Kakao, Penyakit, Tbox, Semantic Web
Universitas Sumatera Utara
x
ONTOLOGY POPULATION TEXT
OF PLANT DISEASE
ABSTRACT
The population is a set of text or text the word which has the same properties and
become the object of the concept of knowledge and serve as inference . Ontology is a
kind of modeling method is used to describe the relationship between words by
involving the preparation of equipment rules involving graphical relationships that are
recognized as TBox . Study domain is a plant cacao (chocolate) and diseases related to
it . Six types of documents that have semantic relations and the new rule is derived
from the initial semantic relationships. By mapping six semantic relationships and
rules (rule) to other documents in the corpus (text) to extract knowledge on cocoa
plant diseases relevant is done manually will be reduced . Approach to fruit rot disease
on cocoa crops have the 6th word in the test document semantic web index value
0.09677419 , vascular disease streak dieback (VSD) in cocoa plant has the 8th word in
the test document semantic web index value 0.00428571 , anthracnose disease the
cocoa plant has the 5th word test semantic web index value 0.0003139 , fungal
diseases in plants policeman cocoa - 6 has a word to test the semantic web index value
0.00061798 , word root rot has the 6th test semantic web index value 0.99044586 ,
whereas disease withered teat pieces to 217 word test semantic web index value
0.05882353 . Future studies are expected to total capacity on a test document can be
greater in the approach to test other documents
Kata kunci: Ontologi, Kakao, Penyakit, Tbox, Semantic Web
Universitas Sumatera Utara
xi
DAFTAR ISI
Halaman
HALAMAN JUDUL i
PERSETUJUAN ii
PERNYATAAN ORIGINALITAS iii
PERSETUJUAN PUBLIKASI iv
PANITIA PENGUJI v
RIWAYAT HIDUP vi
KATA PENGANTAR vii
ABSTRAK ix
ABSTRACT x
DAFTAR ISI xi
DAFTAR GAMBAR xiii
DAFTAR TABEL xiv
BAB 1 PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Rumusan Masalah 2
1.3 Tujuan Penelitian 3
1.4 Batasan Masalah/Ruang Lingkup Kajian 5
BAB 2 TINJAUAN PUSTAKA 6
2.1 Ontologi 6
2.1.1 TBox dan ABox 7
2.2 Sistem Pendukung Keputusan 8
Universitas Sumatera Utara
xii
2.3 Pemaknaan Teks 9
2.3.1 Korpus 9
2.3.2 Sampel dan Populasi teks 10
2.4 Text Mining 10
2.5 Recall dan Presisi 11
BAB 3 METODOLOGI PENELITIAN 12
3.1 Rancangan Penelitian 12
3.2 Analisis Ontologi Penyakit 15
3.2.1 Flowchat proses tokenizing 15
3.2.2 Flowchat pemotongan kata demi kata 16
3.2.3 Flowchat Mencari vocabulary kata 17
3.2.4 Pemilihan dokumen 21
3.2.5 Proses Tokenizing 21
3.2.6 Proses Filtering 22
3.2.7 Proses Stemming 22
3.2.8 Proses Analizing 22
3.3 Rule 23
BAB 4 HASIL DAN PEMBAHASAN 24
4.1 Indeks semantic web dari mesin pencarian yahoo 24
4.1.1 Indeks Populasi teks dengan kata “Penyakit” 24
4.1.2 Indeks Populasi teks dengan kata “busuk buah” 25
4.1.3 Indeks Populasi teks dengan kata “penyakit busuk buah pada
tanaman kakao” 26
4.1.4 Indeks Populasi teks dengan kata "vascular streak dieback" 26
4.1.5 Indeks Populasi teks dengan kata "penyakit vascular streak
dieback pada tanaman kakao" 27
4.1.6 Indeks Populasi teks dengan kata "busuk akar" 27
4.1.7 Indeks Populasi teks dengan kata "penyakit busuk akar pada
tanaman kakao" 28
4.1.8 Indeks Populasi teks dengan kata "antraknosa" 28
Universitas Sumatera Utara
xiii
4.1.9 Indeks Populasi teks dengan kata "penyakit antraknosa pada
tanaman kakao" 29
4.1.10 Indeks Populasi teks dengan kata "jamur upas" 29
4.2 Pengujian dokumen populasi teks 30
4.2.1 Tampilan Hasil pencarian kata pada populasi teks 30
4.2.2 Hasil penemuan kata penyakit pada tanaman kakao 31
Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao 31
4.2.3 Hasil pencarian populasi teks dari indeks semantik web 31
BAB 5 KESIMPULAN DAN SARAN 33
5.1 Kesimpulan 33
5.2 Saran 34
DAFTAR PUSTAKA 35
LAMPIRAN 1 Daftar Publikasi Ilmiah 38
LAMPIRAN 2 Dokumen Uji 39
Universitas Sumatera Utara
xiv
DAFTAR GAMBAR
Gambar 3. 1 Ilustrasi Proses Penelitian Secara Garis Besar 13
Gambar 3. 2 Tahap Pemotongan String Input Kata Yang Menyusunnya 16
Gambar 3. 3 Pemotongan Data Demi Kata 17
Gambar 3. 4 Mencari Vocabulary Kata 18
Gambar 3. 5 Tbox Ontologi Penyakit Pada Tanaman Kakao 19
Gambar 3. 6 Step Pada Semantic Identifikasi Relasi 20
Gambar 3. 7 Total Dokumen Uji Yang Dilakukan 21
Gambar 4. 1 Indeks pencarian kata “penyakit”dari yahoo 25
Gambar 4. 2 Indeks Pencarian Kata “Busuk Buah”Dari Yahoo 25
Gambar 4. 3 Pencarian Kata “Penyakit Busuk Buah Pada Kakao”Dari Yahoo 26
Gambar 4. 4 Indeks Pencarian Kata "Vascular Streak Dieback"Dari Yahoo 26
Gambar 4. 5 Pencarian Kata "Penyakit Vascular Streak Dieback Pada Tanaman 27
Gambar 4. 6 Indeks Pencarian Kata "Busuk Akar" Dari Yahoo 27
Gambar 4. 7 Pencarian Kata"Penyakit Busuk Akar Tanaman Kakao"Dari Yahoo 28
Gambar 4. 8 Pencarian Kata"Antraknosa"Dari Yahoo 28
Gambar 4. 9 Pencarian Kata"Penyakit Antraknosa Tanaman Kakao"Dari Yahoo 29
Gambar 4. 10 Indeks Pencarian Kata"Jamur Upas"Dari Yahoo 29
Gambar 4. 11 Hasil Pencarian Kata Pada Populasi Teks Dengan Dokumen Uji 30
Universitas Sumatera Utara
xv
DAFTAR TABEL
Tabel 4. 1 Populasi teks 24
Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao 31
Tabel 4. 3 Hasil pencarian populasi teks dari indeks semantik web 32
Universitas Sumatera Utara
top related