transliterasi mesin bahasa melayu: jawi lama...

11
Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 379 TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA - RUMI BERASASKAN PETUA Che Wan Shamsul Bahri C.W. Ahmad 1 , Khairuddin Omar 2 , Mohammad Faidzul Nasruddin 3 , Mohd Zamri Murah 4 , Juhaida Abu Bakar 5 1 Faculty of Information Science and Technology, Kolej Universiti Islam Antarabangsa Selangor, MALAYSIA [email protected] 2,3,4 Center for Artificial Intelligence Technology, Universiti Kebangsaan Malaysia, Selangor, MALAYSIA { 2 ko, 3 mfn, 4 zamri}@ftsm.ukm.my 5 School of Computing, Universiti Utara Malaysia, Kedah, MALAYSIA [email protected] Abstract Transliterasi mesin adalah proses menukar skrip daripada teks sumber kepada teks sasaran secara automatik. Ia banyak digunakan Dalam Capaian Maklumat Merentas Bahasa (CLIR), Terjemahan Mesin dan Pengekstrakan Maklumat. Isu utama dalam kajian transliterasi mesin adalah bagaimana untuk mendapatkan hasil transliterasi yang mempunyai ketepatan yang tinggi bagi perkataan yang tiada dalam kamus atau perbendaharaan kata (OOV). Model yang digunakan di dalam kajian ini adalah pendekatan berasaskan petua (rule based approach). Hasil eksprimen mendapati bahawa ketepatannya mencapai sehingga 75.39% berdasarkan ujian terhadap set data Jawi lama pada Majalah Qalam (1950) dan Kitab Hidayah Al-Salikin (1935). Berdasarkan hasil ujikaji, pendekatan berasaskan petua tidak mampu menyelesaikan sepenuhnya masalah yang terdapat di dalam transliterasi Jawi lama kepada Rumi. Ini kerana terdapat sebahagian ejaan Jawi lama mempunyai homograf (ejaannya sama tetapi sebutannya berbeza) yang mana memerlukan pendekatan yang berlainan. Oleh yang demikian, kajian ini mencadangkan agar dilanjutkan pada masa akan datang dalam menangani perkataan yang homograf atau kabur (ambiguity) agar ralat yang berlaku dapat dikurangkan. Kata kunci: pemetaan Jawi Rumi, transliterasi mesin, pendekatan berasaskan petua, homograf, peRumian 1.0 Pengenalan Transliterasi mesin merupakan satu proses menukar perkataan secara automatik daripada teks sumber kepada teks sasaran dengan mengekalkan sebutan daripada teks asal. Ia juga dipanggil sebagai transliterasi automatik. Terdapat pelbagai kaedah yang boleh kita lakukan untuk menukar teks daripada satu bahasa ke bahasa lain. Kamus dwibahasa biasanya digunakan untuk menukar teks dari satu bahasa kepada bahasa lain. Namun begitu, masalah utama timbul apabila tidak semua perkataan terdapat di dalam sesuatu kamus terutamanya bagi perkataan tertentu seperti kata nama khas dan juga istilah teknikal yang diambil daripada bahasa asing. Menurut Bushra Baig, M.Kumar, & Sujoy Das (2012), transliterasi sangat berguna apabila terdapat keperluan untuk memaparkan maklumat dalam dua bahasa. Sebagai contoh tempahan tiket penerbangan dan kereta api, paparan papan tanda, penerbitan prosiding Parlimen yang menggunakan dua bahasa terutama di negara-negara dwibahasa dan pelbagai lagi.

Upload: dokhanh

Post on 06-Feb-2018

247 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 379

TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA - RUMI

BERASASKAN PETUA

Che Wan Shamsul Bahri C.W. Ahmad1, Khairuddin Omar

2, Mohammad Faidzul Nasruddin

3,

Mohd Zamri Murah4, Juhaida Abu Bakar

5

1Faculty of Information Science and Technology, Kolej Universiti Islam Antarabangsa Selangor,

MALAYSIA

[email protected]

2,3,4

Center for Artificial Intelligence Technology, Universiti Kebangsaan Malaysia, Selangor,

MALAYSIA

{2ko,

3mfn,

4zamri}@ftsm.ukm.my

5School of Computing, Universiti Utara Malaysia, Kedah, MALAYSIA

[email protected]

Abstract

Transliterasi mesin adalah proses menukar skrip daripada teks sumber kepada teks sasaran secara

automatik. Ia banyak digunakan Dalam Capaian Maklumat Merentas Bahasa (CLIR), Terjemahan

Mesin dan Pengekstrakan Maklumat. Isu utama dalam kajian transliterasi mesin adalah bagaimana

untuk mendapatkan hasil transliterasi yang mempunyai ketepatan yang tinggi bagi perkataan yang

tiada dalam kamus atau perbendaharaan kata (OOV). Model yang digunakan di dalam kajian ini

adalah pendekatan berasaskan petua (rule based approach). Hasil eksprimen mendapati bahawa

ketepatannya mencapai sehingga 75.39% berdasarkan ujian terhadap set data Jawi lama pada Majalah

Qalam (1950) dan Kitab Hidayah Al-Salikin (1935). Berdasarkan hasil ujikaji, pendekatan berasaskan

petua tidak mampu menyelesaikan sepenuhnya masalah yang terdapat di dalam transliterasi Jawi lama

kepada Rumi. Ini kerana terdapat sebahagian ejaan Jawi lama mempunyai homograf (ejaannya sama

tetapi sebutannya berbeza) yang mana memerlukan pendekatan yang berlainan. Oleh yang demikian,

kajian ini mencadangkan agar dilanjutkan pada masa akan datang dalam menangani perkataan yang

homograf atau kabur (ambiguity) agar ralat yang berlaku dapat dikurangkan.

Kata kunci: pemetaan Jawi Rumi, transliterasi mesin, pendekatan berasaskan petua, homograf,

peRumian

1.0 Pengenalan

Transliterasi mesin merupakan satu proses menukar perkataan secara automatik daripada teks sumber

kepada teks sasaran dengan mengekalkan sebutan daripada teks asal. Ia juga dipanggil sebagai

transliterasi automatik. Terdapat pelbagai kaedah yang boleh kita lakukan untuk menukar teks

daripada satu bahasa ke bahasa lain. Kamus dwibahasa biasanya digunakan untuk menukar teks dari

satu bahasa kepada bahasa lain. Namun begitu, masalah utama timbul apabila tidak semua perkataan

terdapat di dalam sesuatu kamus terutamanya bagi perkataan tertentu seperti kata nama khas dan juga

istilah teknikal yang diambil daripada bahasa asing.

Menurut Bushra Baig, M.Kumar, & Sujoy Das (2012), transliterasi sangat berguna apabila terdapat

keperluan untuk memaparkan maklumat dalam dua bahasa. Sebagai contoh tempahan tiket

penerbangan dan kereta api, paparan papan tanda, penerbitan prosiding Parlimen yang menggunakan

dua bahasa terutama di negara-negara dwibahasa dan pelbagai lagi.

Page 2: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 380

Dalam transliterasi Jawi ke Rumi, ia masih berada di dalam ruang lingkup bahasa Melayu dan tidak

melibatkan dua bahasa yang berbeza. Dalam transliterasi Jawi terdapat beberapa isu sebagaimana

kajian Yonhendri (2009) sebelum ini. Yonhendri menggunakan pendekatan transliterasi berasaskan

petua untuk transliterasi Rumi kepada Jawi. Antaranya isu yang diketengahkan oleh Yonhendri

adalah berkaitan perkataan pinjaman Arab dan bahasa Inggeris yang merupakan satu isu besar dalam

transliterasi Jawi. Ini kerana perkataan Arab terutamanya tidak mengikut petua ejaan Jawi sebaliknya

sebahagian ejaannya kekal mengikut bahasa asal. Rajah 1 menunjukan beberapa model transliterasi

oleh Zhou, Huang & Chen (2008).

Rajah 1: Model Transliterasi (Zhou, Huang, & Chen, 2008)

Terdapat masalah berbeza pula terdapat dalam transliterasi Jawi lama kepada Rumi. Ini disebabkan

ejaan Jawi lama kurang menggunakan huruf vokal dalam perkataannya. Ini disebabkan terdapat

pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan huruf saksi yang terhad (Deep,

2011), maka terdapat sebahagian perkataan Jawi lama yang mengandungi homograf terutamanya bagi

perkataan yang mempunyai diftong. Contohnya perkataan gulai – guli, tupai – topi, peti – petai dan

pelbagai lagi.

Justeru itu, sistem ejaan Jawi baru diperkenalkan untuk mengelak daripada berlaku kekeliruan ini.

Sistem ejaan Jawi baru adalah lebih kepada pengaruh Melayu (Amat Juhari Moain, 1991). Sistem

ejaan baru ini disesuaikan dengan sistem ejaan Rumi dalam Bahasa Melayu moden pada hari ini.

2.0 Pemetaan Aksara Jawi kepada Rumi (Roman)

Dalam transliterasi Buckwalter, ‘و’ akan ditransliterasi sebagai w tanpa mengira sama ada ia diterima

sebagai vokal / u ː / atau konsonan / w / (2013). Buckwalter menggunakan pemetaan satu kepada satu

(one-to-one mapping) untuk aksara Arab. Terdapat beberapa perbezaan di antara pemetaan

Buckwalter dengan pemetaan Jawi – Rumi. Perbezaan tersebut boleh dirujuk melalui

http://www.qamus.org/transliteration.htm. Jadual 1 di bawah menunjukkan pemetaan aksara Jawi

kepada Rumi.

Page 3: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 381

Jadual 1: Pemetaan aksara Jawi kepada Rumi (Hashim Musa, 2009) Jawi Nama Rumi

alif a, mula: e (e pepet) ا

ba b ب

ta t ت

ta marbutah t/h ة

sa[tha] s,(th) ث

jim j ج

ca c چ

ha[ha] h,(h) ح

kha[kho] kh خ

dal d د

zal[dhal] z, (dh) ذ

ra[ro] r ر

zai z ز

sin s س

syin sy, (sh) ش

sad[sod] s,(s) ص

dad[dod] d, (d) ض

ta[to] t,(t) ط

za[zo] z,(z) ظ

ain[ain] عmula: a,i, u;

akhir: k, (‘)

ghain gh غ

nga ng ڠ

fa f ف

pa p ڤ

qaf k, q, (q) ق

kaf k ك

ga g ڬ

lam l ل

mim m م

nun n ن

wau w, u, o و

va v ۏ

ha h ه

(‘) ,hamzah mula: tiada; akhir: k ء

ya y, i, e taling ي

ye[ye] ‘alif maqsurah’ akhir: e (e pepet) ى

nya ny ڽ

Daripada Jadual 1 di atas, terdapat lebih daripada satu padanan untuk satu aksara Jawi. Sebagai

contoh huruf alif (ا) yang mana dipetakan kepada dua aksara Rumi iaitu ‘a’ dan ‘e’ (Mohd Alwee,

2005). Contohnya perkataan ayah (ايه), enam (انم) dan anak (انق). Masalah ini juga berlaku dalam

transliterasi Inggeris-Arab seperti aksara p, b dipetakan kepada ب manakala untuk transliterasi Arab-

Inggeris pula ه ,ح dipetakan hanya pada aksara h (Al-Onaizan & Knight, 2002). Begitu juga di dalam

bahasa Urdu (Ahmed, 2009). Contohnya perkataan معا (biasa) dan آم (mangga) ditransliterasikan

kepada skrip Rumi menjadi amm.

Fonem Jawi yang mempunyai padanan lebih daripada satu berbanding fonem Rumi adalah

sebagaimana berikut :

Page 4: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 382

Jadual 2 : Padanan Rumi – Jawi (Mohd Alwee, 2005)

Rumi Jawi

h حatau ھ

k ق atau ك

s ص atau س

t ط atau ت

z ظ atau ذ

Manakala fonem Rumi yang mempunyai padanan lebih daripada satu berbanding fonem Jawi adalah

sebagaimana berikut :

Jadual 3 : Padanan Jawi - Rumi (Yonhenderi, 2007)

Jawi Rumi a, e ا t/h ة

s,(th) ث z, (dh) ذ

sy, (sh) ش ;mula: a,i, u ع

akhir: k, (‘) k, q, (q) ق w, u, o و (‘) ,mula: tiada; akhir: k ء

y, i, e taling ي

3.0 Kajian-kajian lepas

Yonhendri (2009) menyatakan kesukaran untuk pemetaan huruf kaf iaitu sama ada sepadan dengan

huruf qaf (ق) dan kaf (ک). Contohnya perkataan ‘klinik’ dieja sebagai ‘کلينيک’ dengan menggunakan

huruf kaf manakala perkataan ‘masuk’ pula dieja sebagai ‘ماسوق’ dengan menggunakan huruf qaf.

Namun begitu, dalam transliterasi Jawi ke Rumi masalah sebaliknya berlaku iaitu sama ada huruf qaf

dipetakan dengan q atau k. Sebagaimana perkataan ماسوق (masuk) dan قرءان (quran). Huruf qaf(ق)

dipetakan dengan k atau q di dalam ejaan Rumi.

Kajian Yonhendri (2009), Suliana et al. (2011) memfokuskan kepada Jawi baru. Sebaliknya kajian ini

pula lebih memfokuskan kepada ejaan Jawi lama kerana manuskrip Melayu lama menggunakan ejaan

Jawi lama.

Jadual 4 : Kajian-kajian lepas berkaitan transliterasi Jawi

Pengkaji Jawi lama Jawi baru Cantasan Pendekatan

Ahmad (2007) √ √ Kamus

Juhaida (2008) √ Grafem

Yonhendri (2009) √ √ Petua

Suliana et al. (2011) √ √ Petua

Page 5: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 383

Ahmed (2009) mencadangkan senarai kata (wordlist) dalam transliterasi Roman-Urdu. Ini kerana

kesukaran mendapat ketepatan padanan yang sesuai. Bagi kata ganda, ejaan Rumi ditulis secara

penuh, seperti makan-makan, manakala di dalam ejaan Jawi lama ia ditulis dengan angka Arab iaitu ٢.

4.0 Petua Transliterasi Mesin untuk Skrip Jawi Lama

Penggunaan huruf wau (و) dan ya (ي), kadang-kadang bertindak sebagai vokal dan konsonan.

(ejaan Jawi lama) واجب، وقت، والوڤون، وران، يڠ، يعين،

Jika dilihat kepada perkataan Jawi di atas, huruf ‘و’ di permulaan perkataan bertindak sebagai

konsonan w manakala ‘و’ di akhir sukukata mewakili vokal u dan juga o. Huruf ‘ي’ di permulaan

perkataan pula bertindak sebagai konsonan y manakala di akhir sukukata mewakili vokal i dan juga e

taling.

Berikut adalah beberapa petua dalam transliterasi Jawi kepada Rumi.

Jadual 5: Petua Transliterasi Jawi

Petua Jawi Rumi

Huruf alif di depan -ا

انق، ايه، امق

a-, e -

anak, ayah, emak

Huruf wau di depan suku

kata

و-

واجب ، وقت ، والاوڤون ، وران

w-

wajib, waktu, walaupun, warna

Huruf wau di belakang suku

kata

-بو

بوال کوبو، البو،

bu, bo

labu, kubu, bola

Huruf alif wau di depan -او

اورين اولڠ، اوبه،

u-, o-

ubah, ulang, oren

Huruf ya di depan اي

يڠ يقني،

y-

yakin, yang

Huruf alif ya di depan -اي

ايکور ايتيق، ايکن،

i-, e-

ikan, iman, ekor

Hukum Deranglu ،ابوا ابال، الرا، ڠاڠا، دادا dada, nganga, lara, bala, bawa

Hukum Anjakan - Alif ڤرجالنن ڤرجالنن

جاوتن جواتن

Perjalanan

Jawatan

Hukum Kaf-Ga

Jika huruf kaf atau ga di

belakang perkataan, maka

perlu penambahan huruf ‘a’

di belakangnya.

دوک ، سوک ،ساݢ ، انݢ ،بوک

b ب

u و

k ک

a

buka, naga, saga, suka, duka

Hukum Kaf-Ga (Kecuali) تاک teka

Suku kata KV (terbuka) الݢو ،ابيو ،اکمو

k ک

kamu, bayu, lagu

Page 6: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 384

a ا

m م

u و

Suku kata KK (tertutup)

a + i

( ي + ا)

مك + بيڠ مكبيڠ =

k ك

a

m م

b ب

i ي

n ڠ

g

Kam + bing = kambing

Suku kata VK

a + a

( ا + ا)

امحد = اح + مد

Ah + mad = Ahmad

Perkataan ‘yang’ jika di

depan bersambung dengan

perkataan selepasnya, maka

selepas يڠ perlu ada satu

ruang kosong sebelum

memulakan perkataan baru

Yang telah (dua perkataan) يڠ تهل يڠتهل

Perkataan ‘yang’ juga

kadang-kadang bersambung

di bahagian belakang

Orang yang (dua perkataan) اورڠ يڠ اورڠيڠ

Jika ڽ di belakang sesuatu

perkataan, maka padanannya

adalah nya pengecualian bagi

perkataan nyonya, tanya,

empunya, dan lain-lain

جاديڽ

j ج

a ا

d د

i ي

n ڽ

y

a

Jadinya

Ejaan tradisi (tiada peraturan

yang khusus)

،دي ،جك ،بيت ،مك ،ڤد ،اد ،كتيك

،اين ،دان ،ايت ،سڤرت ،لمي ،كيت ،ݢتي

،واڠ ،تيڤ ،دري ،س يڤ ،بوهل ،اسا ،ڤول

،كڤال ،لݢس ،درڤد ،دمي ،ݢهڠ ،مريك

مأ نيس

ketika, ada, pada, binti, jika, dia,

tiga, kita, lima, seperti, itu, ini,

pula, esa, boleh, siap, dari, tiap

wang, mereka, hingga, diam,

daripada, segala, kepala, manusia

Diftong -ai, -au سنتو ،لنيت واسنت ،يالنت <--- lantai, santau

Perkataan pinjaman daripada

bahasa Arab

(kebanyakan dikekalkan

ejaan asal)

علامٴ ،حديث ،قرءان Quran, hadith, ulama

Perkataan pinjaman daripada کريتيک ،لکينيک Klinik, kritik

Page 7: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 385

bahasa Inggeris

(biasanya menggunakan

huruf kaf bagi mewakili

fonem k dalam tulisan Rumi

jika berada diakhir

perkataan)

K- konsonan, V- vokal

Terdapat beberapa petua dalam Jawi lama dan masih kekal di dalam Jawi baru adalah hukum kaf-ga

dan hukum darlung/deranglu (Ahmad et al., 2012). Walaubagaimana pun, hukum anjakan untuk

vokal alif bagi perkataan berimbuhan tidak lagi digunakan sebagaimana dalam Jawi lama.

5.0 Algoritma Transliterasi Jawi Lama kepada Rumi

1. Input - Jawi lama

2. Semak kata Jawi dalam senarai kata, dapatkan padanan perkataan

dalam Rumi

3. Jika tiada dalam senarai kata, maka guna Petua Transliterasi

Jawi Lama – Rumi

4. Output - Rumi

6.0 Hasil Uji kaji

Set data Jawi lama yang digunakan adalah teks Jawi lama pada Kitab Hidayah Al-Salikin dan Majalah

Qalam. Kitab Hidayah Al-Salikin adalah karangan Syeikh Abdul Samad al-Falimbani pada tahun

1935 manakala Majalah Qalam pula diterbitkan oleh Syed Abdullah bin Abdul Hamid al-Edrus

(meninggal 1969) di Singapura. Majalah Qalam dipilih berdasarkan tempoh penerbitan yang panjang

(hampir 20 tahun penerbitan, 1950 – 1969 ) dan konsisten dengan tulisan Jawi sehingga di akhir

penerbitannya sebagaimana Rajah 2.

Page 8: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 386

Rajah 2: Penerbitan Majalah Melayu pada kurun ke 20

Sumber : http://www.cias.kyoto-u.ac.jp/~yama/jawi/database.html

Berdasarkan Jadual 6 di bawah, T1 dan T2 adalah set data daripada Majalah Qalam (1951), manakala

T3 pula adalah set data daripada Kitab Hidayah Al-Salikin (1938).

Jadual 6: Peratusan Kadar Ralat

T1 T2 T3 Purata

Enjin Transliterasi Rumi-Jawi (TERUJA) 36.28 24.09 42.86 34.41

e-jawi.net 23.01 16.79 41.38 27.06

Petua Transliterasi Jawi Lama 18.02 19.73 36.31 24.69

Jadual 6 di atas menunjukkan purata ralat yang berlaku dalam transliterasi bagi perbandingan ketiga-

tiga transliterasi automatik yang diuji. Daripada jadual tersebut didapati bahawa petua transliterasi

yang dicadangkan untuk Jawi lama mempunyai kadar ralat yang rendah iaitu sebanyak 24.69 peratus

berbanding dengan TERUJA dan e-jawi.net yang masing-masing 34.41 dan 27.06 peratus.

Ralat yang berlaku didapati pada perkataan yang berada di dalam kategori berikut:

Jadual 7: Perkataan berimbuhan dan partikel

Jawi lama Jawi baru Rumi

Kumulai کوموالي مكوالي

تهلڧ دا Dapatlah داڤتهل

Sebegitulah س بݢيتوهل س بݢيتوهل

Hambanya مهباڽ مهباڽ

Kepenatan کڤننت کڤناتن

Page 9: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 387

Kegelisahan کݢليسهن کݢليساهن

Kesempatan کسمڤنت کسمڤاتن

Melaksanakan ملقساانکن ملقس ناکن

Dinamakan دانماکن دمناکن

Melainkan مالٴينکن ملينکن

Jadual 8: Gabungan dua perkataan

Jawi lama Jawi baru Rumi

Yang telah يڠ تهل يڠتهل

Yang mulia يڠ موليا يڠمليا

س ياڤا ابرڠ ابرڠس ياڤ Barang siapa

Jadual 9: Ejaan Jawi lama yang berbeza dengan ejaan Jawi baru

Jawi lama Jawi baru Rumi

دڧ Pada ڤد

Segala سݢاال سݢل

Lebih لبيه لبه

Kamu اکمو اکم

Tahniah هتنيئه هتنئه

Hingga هيڠݢ هڠݢ

Seluruh سلوروە سلورە

Bahawa هباوا هبوا

Dunia دونيا دنيا

ۃاوم Umat اومت

ۃام Amat امت

ءانتو Untuk اونتوق

7.0 Perbincangan

Daripada analisis yang dibuat, didapati bahawa ralat berlaku pada perkataan yang berimbuhan dan

berpartikel seperti dalam Jadual 7. Perkataan ini perlu dicantas terlebih dahulu.

Jawi lama tidak membezakan penggunaan huruf fa dan pa, ta dan ta marbutah, manakala penggunaan

huruf saksinya adalah minimum.

Jelaslah di sini bahawa perkataan Jawi lama yang homograf masih tidak dapat diselesaikan dengan

hanya menggunakan pendekatan berasaskan petua. Ia berbeza dengan Jawi moden yang mempunyai

persamaan dengan ejaan Rumi dan mengandungi peraturan yang standard. Sebagai contoh perkataan

yang homograf dalam ejaan Jawi lama ialah:

Page 10: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 388

Jadual 10: Perkataan Homograf

Jawi lama Jawi Baru Rumi

مكڤوڠ Kampung اکمڤوڠ

Kempung مكڤوڠ

چڠکوڠ Cangkung چاڠکوڠ

Cengkung چڠکوڠ

کنچيڠ Kancing اکچنيڠ

Kencing کنچيڠ

لبه Lebih لبيه

Lebah لبه

اکم Kamu اکمو

Kami اکيم

Homograf bagi perkataan diftong -au dan -ai dengan perkataan yang berakhir dengan suku kata

terbuka -u dan -i

Jadual 11: Perkataan Diftong –au dan –ai

Jawi lama Jawi Baru Rumi

ڤولو Polo ڤولو

Pulau ڤوالو

ڤيت Peti ڤيت

Petai ڤتاي

ݢويل Guli ݢويل

Gulai ݢوالي

Perbezaan transliterasi terhadap aksara qaf (ق) dan kaf (ك) masih tidak dapat diselesaikan dengan

menggunakan pendekatan berasaskan petua Jawi. Ini kerana padanan terhadap qaf (ق) dan kaf (ك)

dengan k dan q adalah tidak konsisten. Perkataan Jawi lama yang berasal daripada perkataan Arab

akan diserap dan ejaannya dikekalkan kecuali terhadap beberapa perkataan yang telah biasa

digunakan dalam ejaan Melayu. Cabaran utama dalam transliterasi mesin Ejaan Jawi lama juga adalah

kerana ejaannya yang tidak konsisten dan mantap. Untuk mengatasi masalah ini, Ahmed (2009)

mencadangkan pendekatan senarai kata digunakan dengan menyenaraikan segala kemungkinan

padanan yang ada.

8.0 Kesimpulan

Pengkaji mencadangkan supaya digunakan pendekatan yang berbeza untuk menyelesaikan masalah

perkataan yang homograf dan juga perkataan yang tidak berjaya ditransliterasi dengan tepat. Adalah

dicadangkan agar pendekatan hibrid iaitu gabungan beberapa pendekatan diketengahkan agar dapat

memperbaiki lagi hasil ujikaji yang telah dijalankan.

Page 11: TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA …worldconferences.net/proceedings/aics2013/toc/papers_aics2013/A091... · pengaruh Arab dalam tulisan Jawi lama. Oleh kerana penggunaan

Proceeding of the International Conference on Artificial Intelligence in Computer Science and ICT (AICS 2013), 25 - 26 November 2013, Langkawi, MALAYSIA. (e-ISBN 978-967-11768-3-2). Organized by WorldConferences.net 389

Rujukan

Ahmad, Che Wan Shamsul Bahri C.W., Khairuddin Omar, Mohammad Faidzul Nasrudin, Mohd

Zamri Murah, & Mohd Sanusi Azmi. (2012, 19-20 Jun 2012). Isu-Isu Dalam Transliterasi

Mesin Manuskrip Melayu Ejaan Jawi Lama Kepada Jawi Baru. Paper presented at the

Seminar Penyelidikan Jawi dan Manuskrip Melayu, Universiti Teknologi Mara, Shah Alam.

Ahmad, Che Wan Shamsul Bahri Che Wan. (2007). Penterjemah Jawi lama kepada Jawi baru. Tesis

Sarjana, Universiti Kebangsaaan Malaysia.

Ahmed, T. (2009). Roman to Urdu transliteration using word list. Paper presented at the Conference

of Language and Technology 2009, Lahore.

Al-Onaizan, Yaser, & Knight, Kevin. (2002). Machine transliteration of names in Arabic text. Paper

presented at the ACL-02 Conference Workshop on Computational approaches to Semantic

Languages.

Amat Juhari Moain. (1991). Sejarah Tulisan Jawi. dalam Jurnal Dewan Bahasa.

Bushra Baig, M.Kumar, & Sujoy Das. (2012). Rule Based Hindi to Urdu Transliteration System.

Journal of Emerging Trends in Computing and Information Sciences, Vol. 3(No. 8).

Deep, K., & Goyal, D. V. . (2011). Hybrid Approach for Punjabi to English Transliteration System.

International Journal of Computer Applications, 28(1), 1-6.

Hashim Musa. (2009). Early Jawi Materials and the Creation of a Network of Malay Islamic Centres.

The Journal of Shopia Asia Studies, No 27, 9-18.

Juhaida Abu Bakar. (2008). Transliterasi Jawi lama kepada Jawi baru berasaskan grafem (kajian kes

pada Hikayat Merong Mahawangsa). Tesis Sarjana, Universiti Kebangsaaan Malaysia.

Mohd Alwee Yusoff. (2005). Perkembangan Tulisan Jawi dan Aplikasinya Dalam Masyarakat Islam

di Malaysia. Jurnal Usuluddin, 21, 23-38.

Suliana Sulaiman, Khairuddin Omar, Nazlia Omar, Mohd Zamri Murah, & Rahman, Hamdan Abdul.

(2011, December 5-8, 2011). A Malay Stemmer for Jawi Characters. Paper presented at the

24th Australian Joint Conference Perth, Australia, Proceedings AI 2011: Advances in

Artificial Intelligence, Perth, Australia.

Wikipedia. (2013). Buckwalter transliteration. Wikipedia. Retrieved from

http://en.wikipedia.org/wiki/Buckwalter_transliteration

Yonhendri. (2009). Transliterasi Rumi ke Jawi berasaskan petua. Sarjana Tesis Sarjana, Universiti

Kebangsaaan Malaysia.

Zhou, Yilu, Huang, Feng, & Chen, Hsinchun. (2008). Combining probability models and web mining

models: a framework for proper name transliteration. Journal Information Technology and

Management, 9(2), 91-103.