06 kerangka awal transliterasi mesin teks jawi bbpt (cw shamsul) latest

24
Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 1 KERANGKA AWAL TRANSLITERASI MESIN TEKS JAWI PADA BATU BERSURAT PIAGAM TERENGGANU (BBPT) 1 Che Wan Shamsul Bahri bin Che Wan Ahmad 2 Khairuddin bin Omar 3 Mohd Sanusi bin Azmi 4 Mohammad Faidzul bin Nasrudin 5 Mohd Zamri bin Murah 6 Hamdan bin Abdul Rahman 1,2,4,5,6 Pusat Teknologi Kecerdasan Buatan Fakulti Teknologi dan Sains Maklumat Universiti Kebangsaan Malaysia, Bangi, Malaysia 1 [email protected], { 2 ko, 4 mfn, 5 zamri, 6 hamdan}@ftsm.ukm.my 3 Fakulti Teknologi Maklumat dan Komunikasi Universiti Teknikal Malaysia Melaka, Malaysia 3 [email protected] Abstrak: Transliterasi adalah satu proses menukar perkataan daripada satu jenis tulisan kepada jenis tulisan yang lain dengan mengekalkan sebutannya. Biasanya ia melibatkan sekurang- kurangnya dua bahasa iaitu bahasa sumber dan bahasa sasaran. Dalam konteks kajian ini, teks sumber adalah Jawi manakala teks sasaran adalah Rumi yang mana kedua-duanya dalam bahasa Melayu, bezanya adalah skrip penulisan yang digunakan. Batu Bersurat Piagam Terengganu (BBPT) menggunakan sistem ejaan Jawi sepenuhnya. Oleh kerana sistem ejaan ini menggunakan sistem ejaan yang berusia lebih kurang 700 tahun yang lepas, maka terdapat keperluan untuk mengkaji penggunaan transliterasi mesin yang mampu menterjemahkan ejaan Jawi lama kepada Rumi dengan lebih baik dan tepat sejajar dengan perkembangan sains dan teknologi. Cadangan kaedah yang digunakan dalam transliterasi mesin Jawi ke Rumi adalah pemetaan aksara, teknik berasaskan petua dan senarai kata, dengan disepadukan model saluran hingar (noisy channel model) dan pendekatan analisis statistik. Kata kunci: Batu Bersurat Terengganu, transliterasi, transliterasi mesin, pemetaan aksara, teknik berasaskan petua, analisis statistik dan model saluran hingar. 1.0 PENDAHULUAN Transliterasi adalah penukaran huruf (perkataan dan sebagainya) daripada abjad sesuatu tulisan (misalnya tulisan Arab) kepada huruf yang selaras bunyinya dalam abjad sistem tulisan lain (misalnya Rumi), manakala mentransliterasikan pula bermaksud membuat atau menyediakan transliterasi (Kamus Dewan, 2005). Dengan erti kata lain, transliterasi merupakan satu kaedah mengubah perkataan dari satu bahasa kepada aksara atau simbol yang bersesuaian dalam bahasa tulisan lain. Lebih jelas lagi, transliterasi mestilah melibatkan sekurang-kurangnya dua teks atau skrip yang berbeza kerana transliterasi melibatkan teks sumber dan teks sasaran.

Upload: fariz-hassan

Post on 25-Nov-2015

48 views

Category:

Documents


6 download

DESCRIPTION

06 Kerangka Awal Transliterasi Mesin Teks Jawi Bbpt (Cw Shamsul) Latest

TRANSCRIPT

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 1

    KERANGKA AWAL TRANSLITERASI MESIN TEKS JAWI PADA

    BATU BERSURAT PIAGAM TERENGGANU (BBPT)

    1Che Wan Shamsul Bahri bin Che Wan Ahmad

    2Khairuddin bin Omar

    3Mohd Sanusi bin Azmi

    4Mohammad Faidzul bin Nasrudin

    5Mohd Zamri bin Murah

    6Hamdan bin Abdul Rahman

    1,2,4,5,6

    Pusat Teknologi Kecerdasan Buatan

    Fakulti Teknologi dan Sains Maklumat

    Universiti Kebangsaan Malaysia, Bangi, Malaysia [email protected], {

    2ko,

    4mfn,

    5zamri,

    6hamdan}@ftsm.ukm.my

    3Fakulti Teknologi Maklumat dan Komunikasi

    Universiti Teknikal Malaysia Melaka, Malaysia [email protected]

    Abstrak: Transliterasi adalah satu proses menukar perkataan daripada satu jenis tulisan kepada

    jenis tulisan yang lain dengan mengekalkan sebutannya. Biasanya ia melibatkan sekurang-

    kurangnya dua bahasa iaitu bahasa sumber dan bahasa sasaran. Dalam konteks kajian ini, teks

    sumber adalah Jawi manakala teks sasaran adalah Rumi yang mana kedua-duanya dalam bahasa

    Melayu, bezanya adalah skrip penulisan yang digunakan. Batu Bersurat Piagam Terengganu

    (BBPT) menggunakan sistem ejaan Jawi sepenuhnya. Oleh kerana sistem ejaan ini menggunakan

    sistem ejaan yang berusia lebih kurang 700 tahun yang lepas, maka terdapat keperluan untuk

    mengkaji penggunaan transliterasi mesin yang mampu menterjemahkan ejaan Jawi lama kepada

    Rumi dengan lebih baik dan tepat sejajar dengan perkembangan sains dan teknologi. Cadangan

    kaedah yang digunakan dalam transliterasi mesin Jawi ke Rumi adalah pemetaan aksara, teknik

    berasaskan petua dan senarai kata, dengan disepadukan model saluran hingar (noisy channel

    model) dan pendekatan analisis statistik.

    Kata kunci: Batu Bersurat Terengganu, transliterasi, transliterasi mesin, pemetaan aksara, teknik

    berasaskan petua, analisis statistik dan model saluran hingar.

    1.0 PENDAHULUAN

    Transliterasi adalah penukaran huruf (perkataan dan sebagainya) daripada abjad sesuatu tulisan

    (misalnya tulisan Arab) kepada huruf yang selaras bunyinya dalam abjad sistem tulisan lain

    (misalnya Rumi), manakala mentransliterasikan pula bermaksud membuat atau menyediakan

    transliterasi (Kamus Dewan, 2005). Dengan erti kata lain, transliterasi merupakan satu kaedah

    mengubah perkataan dari satu bahasa kepada aksara atau simbol yang bersesuaian dalam bahasa

    tulisan lain. Lebih jelas lagi, transliterasi mestilah melibatkan sekurang-kurangnya dua teks atau

    skrip yang berbeza kerana transliterasi melibatkan teks sumber dan teks sasaran.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 2

    Dalam konteks Batu Bersurat Piagam Terengganu (BBPT), proses transliterasi tidak melibatkan

    dua bahasa tetapi ia lebih kepada pertukaran bentuk daripada tulisan Jawi kepada tulisan Rumi

    dalam bahasa Melayu. Walaupun sebahagian perkataan Jawi pada BBPT terdapat pengaruh

    bahasa Sanskrit (Abdul Razak Salleh, 2010), namun ia masih dalam bahasa Melayu kuno.

    Menurut Adi Yasran (2010), terdapat ramai pengkaji telah melakukan kajian terhadap BBPT

    antaranya Paterson (1924), Blagden (1924), Sheppard (1949), Muhammad Saleh (1956, 1978),

    Fatimi (1963), Syed Mohd. Naquib (1970), Omar Awang (1980), Hamdan Hassan (1984),

    Othman Mohd. Yatim dan Abdul Halim (1990), Hashim Musa (2006), Wan Ali Wan Mamat

    (2006) Adi Yasran, Wan Muhammad dan Mohd Sukki (2010) dan lain-lain lagi. Namun begitu,

    sehingga ke hari ini masih terdapat pelbagai versi transliterasi yang digunakan untuk

    mendapatkan maksud yang lebih tepat skrip Jawi pada BBPT.

    Dalam konteks negara kita, banyak transliterasi manual dilakukan bukan sahaja terhadap BBPT

    bahkan juga terhadap kitab-kitab Melayu lama bertulisan Jawi atau juga dipanggil juga sebagai

    proses perumian antaranya oleh Hj. Wan Mohd Shaghir Abdullah, Noraini Abu dan lain-lain

    lagi. Khazanah Fathaniyah (2012) menyatakan antara kitab yang telah ditransliterasi ke Rumi

    adalah Kitab Hidayatus Salikin Jilid 1-3, Al-Fatawal Fathaniyah Jilid 1-3, Dhiyaul Murid,

    Munyatul Mushalli, Faridatul Faraid, Hadiqatul Azhar War Rayahin, Al-Urwatul Wutsqa, dan

    Manhalush Shafi. Noraini Abu juga menjalankan ditransliterasi yang sama bagi kitab Anak

    Kunci Syurga, karya asal oleh Asy-Syeikh Abdul Qadir bin Abdul Muthalib Al-Indunisi Al-

    Mandili dan lain-lain lagi.

    Transliterasi juga dilakukan dalam teks Arab-Melayu. Mat (2010) telah melakukan transliterasi

    terhadap pelajaran bahasa Arab dan secara tidak langsung dapat membantu pelajar untuk

    menyebut perkataan dalam bahasa Arab walaupun pelajar tersebut tidak mempunyai asas dalam

    bahasa Arab. Ini kerana menurut beliau, bukan sahaja di kalangan orang Islam yang belajar

    bahasa Arab, malah kursus tersebut juga turut diambil oleh pelajar bukan Islam di peringkat

    pengajian tinggi.

    1.1 Proses Transliterasi

    Terdapat kaedah yang sistematik dalam proses pentransliterasian. Menurut Ahmad Nazuki

    (2006) transliterasi mempunyai sistemnya yang tersendiri. Menurut Catford (1996) pula, terdapat

    tiga langkah dalam proses menentukan sistem transliterasi iaitu :

    a. Huruf bahasa sumber digantikan dengan unit fonologi bahasa sumber. b. Unit fonologi bahasa sumber diterjemah kepada unit fonologi bahasa sasaran(target). c. Unit fonologi bahasa sasaran ditukarkan kepada huruf bahasa sasaran atau unit grafologi

    lain.

    Rajah 1 di bawah adalah proses umum bagi transliterasi iaitu melibatkan teks sumber dan teks

    sasaran.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 3

    Rajah 1 : Proses umum bagi transliterasi

    1.2 Transliterasi Mesin terhadap Batu Bersurat Piagam Terengganu

    Sebagaimana yang dikatakan oleh Adi Yasran (2010) sebelum ini, terdapat ramai pengkaji yang

    melakukan transliterasi terhadap BBPT. Oleh kerana sehingga ke hari ini masih terdapat pelbagai

    tafsiran dalam proses transliterasi BBPT, kertas ini cuba mencadangan satu kerangka kajian

    transliterasi mesin untuk menambah baik hasil transliterasi yang sedia ada.

    Terdapat banyak kajian dalam bidang transliterasi mesin di dunia ini, namun kajiannya dalam

    konteks bahasa Melayu masih kurang dan terdapat ruang kajian yang luas terutamanya yang

    melibatkan transliterasi Jawi ke Rumi.

    Transliterasi mesin diperlukan memandangkan ejaan Jawi yang digunakan begitu lama bukannya

    Jawi Zaba mahupun Jawi moden seperti hari ini. Oleh hal yang demikian, proses transliterasinya juga amat berbeza. Walaupun BBPT terdiri daripada empat muka sahaja yang mempunyai ukiran

    Jawi, namun proses transliterasinya begitu kompleks. Terdapat gangguan (noise) pada skrip asal

    BBPT kerana faktor masa dan cuaca. Ini memandangkan ketika ditemui, usia BBPT hampir 600

    tahun daripada tarikh ianya selesai dipahat (Wikipedia, 2012).

    Antara kesan daripada faktor jarak masa yang begitu lama, sebahagian huruf dan titiknya kabur

    (tidak jelas), manakala sebahagian penjuru batu tersebut menjadi serpihan, hilang dan tidak

    dijumpai hingga kini (Othman et al., 2007). Oleh kerana usianya begitu lama, faktor geografi

    seperti bencana alam, hakisan, banjir besar dan lain-lain lagi menjadi penyumbang kepada

    kemerosotan kualiti skrip Jawi pada BBPT.

    1.3 Kepentingan Kajian Transliterasi

    Proses pentransliterasian sangat penting untuk mengetahui sebutan yang betul bagi sesuatu

    perkataan terutamanya istilah Arab atau Islam yang khusus dalam bidang ilmu tertentu, petikan

    lafaz, dan kata nama khas seperti nama orang atau tokoh, tajuk buku, nama tempat, nama jalan

    dan sebagainya yang berasal daripada bahasa asal suatu negara (Wikipedia, 2012). Terdapat

    banyak kepentingan transliterasi mesin antaranya :

    i. Mempercepatkan proses penterjemahan daripada bahasa sumber kepada bahasa sasaran. Dengan transliterasi mesin, skrip sumber seperti Jawi lama dapat dirumikan dengan

    cepat.

    Teks Sasaran Teks Sumber TRANSLITERASI

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 4

    ii. Menggali khazanah lama dalam tulisan Jawi terutamanya kitab Melayu dan manuskrip-manuskrip lama sangat berharga. Mutakhir ini terdapat usaha untuk mendigitalkan teks-

    teks dan manuskrip Melayu lama. Koleksi tersebut kebanyakan menggunakan skrip Jawi

    dan sebahagiannya sukar difahami dan memerlukan transliterasi yang teliti dan tepat.

    iii. Transliterasi membantu orang yang tidak tahu membaca sesuatu sistem tulisan untuk menyebutnya. Ini secara tidak langsung membantu mereka yang tidak mahir Jawi untuk

    mendapat padanan Rumi. Di kalangan generasi muda hari ini ramai yang buta Jawi.

    Peranan transliterasi amat diperlukan oleh mereka.

    iv. Mencari padanan yang sesuai bagi perkataan baru yang tiada dalam perbendaharaan. Finch et al. (2008) menyatakan masalah utama dalam transliterasi mesin adalah untuk

    menyelesaikan perkataan yang tiada dalam perbendaharaan kata (out of vocabulary).

    Perkataan inilah yang perlu ditransliterasi dengan teliti agar tidak jauh bezanya daripada

    sebutan yang sebetulnya.

    Dari sudut BBPT, signifikan kajian transliterasi mesin adalah untuk mendapatkan padanan yang

    tepat bagi skrip Jawi semasa proses pentransliterasian berlaku agar hasilnya satu skrip Rumi

    yang menepati maksud penulis atau pemahat BBPT.

    1.4 Kajian Transliterasi Mesin Dalam Bahasa Melayu (Rumi-Jawi dan Sebaliknya)

    Walaupun kajian terhadap transliterasi mesin sudah lama di Malaysia, namun perkembangannya

    agak perlahan terutamanya yang melibatkan bahasa Melayu berbanding dengan bahasa-bahasa

    asing. Antara kajian dalam bahasa Melayu adalah (Khirulnizam, 1999) iaitu untuk menukar ejaan

    Rumi kepada Jawi. Turut mengkaji pertukaran tersebut adalah (Ab. Nasir, 1998) melalui Sistem

    Pertukaran Tulisan Jawi ke Rumi. Kedua-duanya mempunyai persamaan iaitu menggunakan

    teknik pemetaan aksara secara padanan terus iaitu a untuk , b untuk dan begitulah seterusnya. Oleh yang demikian, terdapat banyak perkataan yang tidak dapat ditukarkan dengan tepat dalam

    proses pentransliterasian mesin tersebut.

    Berbeza dengan kajian sebelum ini, Yonhendri (2009) menggunakan teknik transliterasi mesin

    berasaskan petua (rule based) dalam kajian menukar ejaan Rumi kepada Jawi. Setiap perkataan

    Rumi diproses mengikut pola ejaannya dalam Jawi. Perkataan tersebut terlebih dahulu

    dibahagikan kepada sukukata, kemudian sukukata tersebut dipadankan dengan petua Jawi untuk

    ditukarkan kepada ejaan Jawi sebagaimana Rajah 2. Berdasarkan hasil uji kaji beliau, terdapat

    perkataan Jawi yang tidak dapat ditukarkan dengan tepat kerana beberapa masalah iaitu :

    i. Kata pinjaman daripada Arab ii. Kata pinjaman daripada Inggeris iii. Kesukaran membezakan vokal e-taling dan e-pepet iv. Kesukaran membezakan hentian glottis sama ada atau .

    Dalam perbendaharaan Jawi, sesetengah perkataan tergolong sebagai lampau hukum. Ejaan

    perkataan ini tidak tertakluk kepada petua Jawi. Inilah di antara kesukaran yang dihadapi oleh

    Yonhendri kerana sistem ejaan Jawi yang begitu unik sifatnya. Rajah 2 di bawah menunjukkan

    seni bina enjin transliterasi yang dibangunkan oleh beliau.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 5

    Rajah 2 : Senibina enjin transliterasi Rumi ke Jawi

    Sumber : (Yonhendri, 2009)

    Hasil kajian Nik Muhammad (2011) pula hampir sama dengan Yonhendri (2009) kerana

    pendekatan mereka hampir serupa iaitu menggunakan teknik berasaskan petua.

    Walaubagaimanapun, transliterasi oleh Nik Muhammad lebih tepat kerana kelebihan pada kamus

    dalam transliterasinya. Hasil transliterasi Nik Muhammad dapat dilihat melalui laman sesawang

    www.ejawi.net dan banyak penambahbaikan dilakukan. Walaubagaimanapun, transliterasi Nik

    Muhammad masih tidak dapat membezakan perkataan e taling dan juga e pepet jika perkataan

    tersebut tiada dalam kamusnya.

    Semua kajian yang dibincangkan di atas adalah melibatkan pertukaran daripada skrip Rumi

    kepada Jawi. Tidak ramai di kalangan pengkaji di Malaysia membuat kajian terhadap pertukaran

    skrip Jawi kepada Rumi. Ia dipanggil sebagai transliterasi ke belakang (back transliteration).

    Suhailan Safei (2000) membuat kajian transliterasi Jawi ke Rumi. Setiap aksara Jawi dipetakan

    secara terus dan kemudiannya dilakukan proses pembetulan atau semakan. Kajian beliau lebih

    tertumpu kepada Jawi moden yang digunakan pada hari ini.

    Penggabungan

    Proses Transliterasi

    Kata Dasar

    Pemprosesan Kata (Cantasan)

    Awalan Akhiran

    Pemetaan Unicode

    Pemetaan Unicode

    Pemetaan Unicode

    Petua Suku Kata Token

    Perkataan

    Penggabungan

    Jawi Jawi Jawi

    Perkataan Jawi

    Pemprosesan Kata

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 6

    Di kalangan pengkaji baru, terdapat kajian transliterasi Jawi lama kepada Jawi baru antaranya

    oleh Ahmad (2007) dan Juhaida (2008). Kajian Ahmad (2007) menjadikan kitab Nazam yang

    telah didigitalkan terlebih dahulu sebagai bahan kajian. Ahmad menggunakan model cantasan

    dan tapisan iaitu untuk melakukan proses pengakaran dan pengasingan di antara perkataan Jawi

    lama dan Jawi baru berdasarkan satu pangkalan data Jawi lama yang dibina. Hasil perbandingan

    tersebut akan dijadikan sebagai output. Manakala Juhaida (2008) pula menggunakan transliterasi

    berasaskan grafem dalam kajiannya pada hikayat Merong Mahawangsa. Dengan kaedah grafem,

    Juhaida menukar aksara sumber kepada aksara sasaran. Beliau berjaya menukar huruf kepada huruf bagi perkataan Jawi lama yang sepatutnya menggunakan grafem p dalam Rumi berbanding f. Ini kerana kebanyakan skrip Jawi lama tidak membezakan fonem p dan f. Juhaida

    dapat mengurangkan perbezaan Jawi lama dan Jawi baru.

    1.5 Kajian Transliterasi Mesin dalam Bahasa Asing

    Terdapat banyak kajian transliterasi mesin dalam bahasa asing seperti Urdu, Hindi, Punjabi,

    Arab, English, Korea, Jepun, China, Thai dan lain-lain lagi.

    Dalam dunia ini, terdapat bahasa yang sama percakapannya tetapi menggunakan skrip penulisan

    yang berbeza seperti bahasa Melayu (Rumi) mempunyai sebutan yang sama tetapi berlainan

    skrip penulisannya dengan Jawi. Contoh lain juga adalah bahasa Urdu dan Hindi.

    Apa yang menarik dalam bahasa Urdu dan Hindi, orang Pakistan faham apabila melihat filem

    Hindi iaitu melalui percakapan (suara), tetapi mereka tidak tahu membaca tulisan Hindi dan

    begitulah sebaliknya (Bushra Jawaid et al., 2009). Ini kerana bahasa kebangsaan Pakistan adalah

    Urdu manakala bahasa kebangsaan India pula adalah Hindi (Malik et al., 2008).

    Berdasarkan Rajah 3, Malik et al. (2008) menggunakan Finite-State Transducer (FST) dalam

    transliterasi antara dialek. Menurutnya, FST sangat efisien dalam pasangan bahasa Hindi-Urdu.

    Beliau juga menggunakan transkripsi perantara sejagat (Universal Intermediate Transcription-

    UIT) dalam kajiannya. UIT adalah satu skima untuk menukar teks dalam Hindi, Urdu, Punjabi

    dan seumpamanya.

    Kajian Ahmed (2009) adalah untuk menukar perkataan daripada Urdu yang menggunakan skrip

    Roman kepada skrip Urdu. Beliau menggunakan pendekatan berasaskan senarai perkataan (word

    list based approach) dan petua pemetaan skrip Roman ke Urdu. Menurutnya, walaupun skrip

    Roman adalah bukannya skrip rasmi, namun penggunaannya agak meluas kerana pengaruh

    bahasa Inggeris. Cabarannya, skrip Roman bagi Urdu adalah tidak mengikut piawaian yang

    khusus.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 7

    Rajah 3 : Senibina Transliterasi Hindi Urdu Sumber : (Malik et al., 2008)

    Ahmed (2009) juga mencadangkan beberapa penambahbaikan dalam sistem Malik et al. (2008)

    dan juga pada Hindi to Urdu Transliterator, oleh Center for Research in Urdu Language

    Processing (CRULP), dengan memperkenalkan pra-pemprosesan dan pasca pemprosesan untuk

    mendapatkan transliterasi yang lebih baik.

    Malik et al. (2009) seterusnya memperkenalkan model hibrid untuk transliterasi Urdu Hindi.

    Pendekatan model hibrid ini adalah menggabungkan teknik berasaskan finite-state machine

    (FSM) dengan pendekatan berasaskan model statistical word language.

    Kajian Al-Onaizan et al. (2002) pula adalah untuk menukar entiti nama dari bahasa Arab kepada

    bahasa Inggeris dengan menggunakan sumber kedua-dua bahasa. Frasa yang melibatkan entiti

    nama adalah sangat sukar untuk ditransliterasi kerana tiada dalam kamus kedua-dua bahasa

    berkenaan. Dua langkah utama digunakan di dalam sistem ini ialah dengan memasukkan entiti

    nama yang terdiri daripada nama tempat, nama organisasi dan nama orang dalam bahasa sumber,

    algoritma akan mula menjelajahi calon terjemahan (translation candidates) di dalam senarai

    menggunakan sumber dari kedua-dua bahasa dan satu bahasa. Kemudian, senarai calon akan

    dikira semula (candidates re-ranker) menggunakan kunci yang lain dalam sumber satu bahasa

    untuk mendapatkan hasil yang tepat. Proses terjemahan digambarkan pada Rajah 4.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 8

    Rajah 4 : Senibina terjemahan nama Arab Inggeris

    Sumber : (Al-Onaizan et al., 2002)

    Transliterasi Jawi-Rumi adalah berbeza dengan Urdu-Hindi walaupun sama dari segi skrip

    sumbernya iaitu teks Arab-Parsi. Sebahagian perkataan Jawi mengandungi huruf vokal dan

    sebahagian yang lain pula sebaliknya. Tidak semua sukukata dalam Jawi memerlukan huruf

    vokal kerana terdapat peraturan tertentu dalam kaedah penulisannya.

    Transliterasi Jawi-Rumi juga berbeza dengan kajian Al-Onaizan dan Knight (2002) iaitu

    transliterasi Arab-Inggeris kerana ia hanya menukar entiti nama sahaja untuk kedua-dua bahasa

    tersebut. Kaedah penulisan Jawi dan Arab juga berbeza kecuali pada perkataan Jawi yang

    menggunakan kata pinjaman Arab. Perkataan pinjaman Arab pula sebahagiannya dikekalkan

    ejaannya mengikut ejaan bahasa Arab dan sebahagiannya pula dieja mengikut sebutan Melayu.

    Jadual 1 di bawah adalah ringkasan kajian oleh beberapa pengkaji dalam bidang tranliterasi

    mesin.

    Jadual 1 : Ringkasan Beberapa Kajian Transliterasi Mesin

    Pengkaji Transliterasi Model Kelemahan Hasil

    Ab. Nasir

    (998)

    Rumi Jawi Menggunakan kaedah pemetaan

    aksara (character

    mapping)

    Tidak

    menyokong

    sebahagian

    aksara Jawi

    Tidak

    dinyatakan

    Khirulnizam

    (1999)

    Rumi Jawi Menggunakan kaedah pemetaan

    aksara (character

    mapping)

    Tidak

    menyokong

    sebahagian

    aksara Jawi

    Tidak

    dinyatakan

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 9

    Suhailan

    (2000)

    Jawi - Rumi Padanan Aksara dan

    Pembetulan

    Perlu proses

    pengoptimuman

    untuk betul ralat

    Tidak

    dinyatakan

    Ahmad (2007) Jawi lama -

    Jawi baru

    Teknik tapisan dan

    Cantasan

    Perlu senarai

    ejaan Jawi lama

    yang berbeza

    dengan Jawi

    baru

    90.6%

    Juhaida

    (2008)

    Jawi lama -

    Jawi baru

    Berasaskan grafem Hanya menukar

    sebahagain huruf

    sahaja

    82%

    Yonhendri

    (2009)

    Rumi - Jawi Berasaskan petua Sebahagian

    perkataan Jawi

    tidak tepat

    70.7%

    Malik et al.

    (2008)

    Urdu Hindi Pendekatan transduser

    Perlu kepada

    Universal

    Intermediate

    Transciption

    (UIT)

    97.5%

    Ahmed (2009) Hindi Urdu Senarai kata, berasaskan petua

    Memerlukan satu

    senarai kata

    Tidak

    dinyatakan

    Malik et al.

    (2010)

    Urdu Hindi dan lain-lain

    Finite state machine,

    model statistik

    bahasa perkataan

    Perlu kepada

    Universal

    Intermediate

    Transciption

    (UIT)

    83.9%

    2.0 KERANGKA TRANSLITERASI MESIN JAWI -RUMI (TeJaR) PADA BBPT

    2.1 Kerangka Cadangan Kajian

    Dalam pembangunan transliterasi mesin Jawi ke Rumi pada BBPT, pengkaji perlu membina

    kerangka kajian supaya kajian yang akan dilakukan lebih berstruktur dan mencapai sasaran yang

    dikehendaki. Rajah 5 di bawah menunjukkan cadangan kerangka awal kajian transliterasi mesin

    untuk Jawi lama ke Rumi pada BBPT.

    Kajian literatur penting untuk melihat sejauhmana status kajian kini terhadap transliterasi mesin

    dalam bahasa-bahasa lain di dunia ini. Kajian terkini dalam bahasa Melayu juga perlu ditelusuri

    terutamanya yang melibatkan transliterasi Jawi sama ada lama dan baru. Dicadangkan juga

    penggunaan model analisis statistik dalam mendapatkan ketepatan ejaan Rumi (skrip sasaran)

    dengan dibantu oleh model saluran hingar (noisy channel model).

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 10

    Rajah 5 : Cadangan Kerangka Kajian Transliterasi Jawi ke Rumi (TEJaR) pada BBPT

    Rajah 6 di bawah pula menunjukkan proses-proses yang terlibat di dalam kerja-kerja

    pentransliterasian JawiRumi (TEJaR) pada BBPT.

    Rajah 6 : Model cadangan transliterasi mesin untuk Jawi Rumi (TEJaR)

    Tokenisasi

    Pengakaran

    Input Teks Jawi BBPT

    Semak kata

    Padanan

    Ouput Teks Melayu Rumi

    Senarai kata Jawi (Arab)

    Senarai kata

    Jawi (kecuali)

    Ejaan Tradisi

    Petua Jawi

    Model Saluran Hingar

    Pembangunan Model Transliterasi

    Kajian Literatur

    Pemprosesan Kata

    Pengujian

    Transliterasi Mesin Jawi Rumi

    Transliterasi

    Pasca Transliterasi

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 11

    Rajah 7 : Ringkasan model transliterasi untuk Melayu Jawi Rumi (TEJaR)

    Berdasarkan Rajah 7 di atas, terdapat pendekatan senarai kata. Pendekatan ini juga digunakan

    oleh (Ahmed, 2009) dalam transliterasi Roman ke Urdu. Pendekatan senarai kata digunakan

    kerana ia memberi transliterasi yang lebih baik kepada huruf Arab-Parsi yang mana

    menggunakan bunyi yang hampir sama walaupun cara penulisannya sedikit berbeza dalam skrip

    Urdu. Beliau juga menggunakan sistem berasaskan petua (rule based system) untuk transliterasi

    tersebut.

    2.2 Langkah-Langkah Yang Terlibat Dalam Pentransliterasian Jawi Ke Rumi

    Dalam pentransliterasian mesin Jawi ke Rumi terdapat beberapa proses kerja yang terlibat

    daripada teks asal atau teks sumber kepada hasil akhir iaitu teks sasaran. Berikut adalah

    penerangan ringkas berkenaan langkah-langkah yang terlibat di dalam proses pentransliterasian

    Jawi ke Rumi.

    a. Input

    Teks Jawi daripada Batu Bersurat Piagam Terengganu (BBPT).

    Contohnya :

    b. Tokenisasi

    Tokenisasi adalah merupakan proses untuk mendapatkan perkataan demi perkataan sebagaimana

    Rajah 8. Ia juga dipanggil sebagai segmentasi. Proses ini penting kerana sebahagian skrip Jawi

    lama tidak mempunyai jarak antara satu perkataan dengan perkataan yang lain.

    Senarai Kata

    Berasas Petua

    Pemetaan Aksara

    (Transliterasi Jawi ke Rumi)

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 12

    Kata7 Kata6 Kata5 Kata4 Kata3 Kata2 Kata1

    Rajah 8 : Tokenisasi

    c. Proses Pengakaran Jawi

    Pengakaran perkataan adalah satu proses analisis morfologi di bawah pemprosesan bahasa tabii

    sebelum dijalankan analisis sintaks dan semantik (T.M.T.Sembok, 2005). Proses pengakaran

    Jawi sebagaimana Rajah 9 adalah bertujuan mendapatkan kata akar atau kata dasar sesuatu

    perkataan Jawi (Suliana Sulaiman et al., 2011). Setiap perkataan yang telah ditokenkan boleh

    jadi terdiri daripada imbuhan, sama ada depan atau belakang, atau kedua-duanya sekali.

    Perkataan * adalah ejaan Jawi lama untuk teguh.

    Perkataan Berimbuhan (meneguhkan)

    Pengakaran

    (keluarkan imbuhan me..kan) + +

    (me + neguh + kan)

    Kata Akar * (teguh)

    Rajah 9 : Proses Pengakaran Jawi

    Rajah 10 di bawah menunjukkan bagaimana pengakaran pada perkataan (medudukan) untuk mendapatkan kata akar duduk. Perkataan * adalah ejaan Jawi lama untuk duduk.

    Rajah 10 : Proses pengakaran Jawi

    *

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 13

    d. Senarai kata Jawi pinjaman Arab

    Senarai Kata Jawi Pinjaman Arab merupakan satu senarai perkataan Jawi pinjaman daripada

    perkataan Arab yang lengkap. Contohnya: perkataan (Rasulullah) adalah kata pinjaman Arab, oleh itu menggunakan pendekatan senarai kata.

    Perkataan Jawi Padanan Rumi

    Rasulullah

    Sallahu alai wasalam

    Islam

    fardhu

    e. Senarai Perkataan Jawi sama ada tergolong dalam ejaan tradisi atau sebaliknya

    Senarai ejaan tradisi merupakan satu senarai perkataan Jawi menggunakan ejaan tradisi. Menurut

    (Ismail Dahaman, 1991) ejaan ini tidak mengikut petua Jawi. Berikut adalah antara senarainya :

    Perkataan Jawi Padanan Rumi

    Ini

    pada

    f. Padanan Jawi Ke Rumi

    Jika perkataan tersebut ada dalam senarai kata, padanan ruminya akan diperoleh. Sebaliknya,

    bagi perkataan Jawi yang tidak terdapat dalam senarai kata, ia akan melalui proses seterusnya.

    Pada asasnya, setiap aksara Jawi mempunyai padanan Rumi. Sebagai contoh pada Jadual 2 di

    bawah dan bahagian Lampiran 1. Pemetaan atau padanan aksara boleh ditentukan dalam proses

    pentransliterasian (Josan et al., 2011). Aksara sumber boleh dipadankan secara terus dengan

    aksara sasaran sebagaimana Jadual 2 di bawah.

    Jadual 2 : Pemetaan Aksara ke Aksara

    Aksara Jawi Padanan Rumi

    a

    b

    t

    ... ...

    w, u, o

    y

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 14

    Walaubagaimanapun, tidak semua aksara tersebut boleh dipetakan secara terus. Ini kerana aksara

    Jawi amat berbeza dengan aksara Rumi. Aksara Jawi mempunyai peranan yang berbeza

    bergantung kepada kedudukannya. Sebagai contoh, huruf , , boleh bertindak sebagai vokal dan juga sebagai konsonan. Sebagai contoh huruf mengandungi tiga padanan Rumi berdasarkan Jadual 2 di atas iaitu w, u, dan o . Justeru itu, di sinilah keperluan untuk

    menggunakan pendekatan berasaskan petua.

    g. Kata Kepada Sukukata Setiap kata akar yang diperoleh dan tiada dalam senarai kata akan melalui proses ceraian kata

    kepada suku kata. Tujuannya untuk mengenalpasti pola ejaan Jawi tersebut.

    h. Semak Petua Jawi Setiap suku kata yang diperoleh akan disemak samada mematuhi petua Jawi atau sebaliknya.

    Sekiranya memenuhi petua Jawi, padanan ruminya akan diperoleh berdasarkan petua Jawi

    tersebut.

    i. Berasaskan Konteks Perkataan yang tidak mematuhi petua ejaan Jawi atau mencurigakan akan ditransliterasi

    mengikut konteks. Antara perkataan yang menggunakan transliterasi berasaskan konteks adalah

    perkataan yang homograf sama ada homograf hakiki yang terdapat di dalam ejaan Jawi atau

    sebaliknya.

    j. Model Saluran Hingar (Noisy Channel Model) Model noisy channel adalah satu kerangka yang digunakan dalam penyemak ejaan (spell

    checker), pengecaman ucapan (speech recognition) dan penterjemahan mesin (Wikipedia, 2012).

    Dalam TeJaR, model ini mampu memberi ketepatan dalam transliterasi. Antara kebolehannya

    adalah mengesan:

    i. Huruf yang tertinggal, contohnya manga, sebetulnya mangga ii. Huruf terlebih, contohnya malass, sebetulnya malas

    iii. Pertukaran kedudukan huruf, contohnya maalng, sebetulnya malang iv. Penggantian huruf, contohnya macan, sebetulnya macam

    k. Pendekatan Analisis Statistik Pendekatan analisis statistik dilihat sebagai salah satu penyelesaian dalam menilai ketepatan

    transliterasi mesin berpandukan kepada dua korpus pada kedua-dua skrip. Google telah beralih

    menggunakan pendekatan ini dalam mesin terjemahan mereka sejak tahun 2007.

    l. Output Output yang akan dihasilkan oleh transliterasi mesin Jawi Rumi (TeJaR) adalah teks Rumi

    bahasa Melayu.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 15

    Jadual 3 : Contoh jangkaan output transliterasi mesin pada BBPT, Muka A

    Baris Muka A

    1

    Rasulullah dengan yang orang sanabi mereka

    2

    Asa pada Dewata Mulia Raya beri hamba meneguhkan Agama Islam

    3

    Dengan benar bicara derma meraksa bagi sekalian hamba Dewata Mulia Raya

    4

    Di Benuaku ini penentu agama Rasulullah sallallahi wassalama raja

    5

    Mandalika yang benar bicara sebelah Dewata Mulia Raya di dalam

    6

    Buhumi penentu itu fardhu pada sekalian Raja Manda

    7

    Lika Islam menurut setitah Dewata Mulia Raya dengan benar

    8

    Bicara berbajiki benua penentua itu maka titah Seri Paduka

    9

    Tuhan medudukan Tamra ini di Benua Terengganu adi pertama ada

    10

    Jumaat di bulan Rejab di tahun saratan disasanakala

    11

    Baginda Rasulullah telah lalu tujuh ratus dua

    2.3 Contoh proses kerja TeJaR

    Jadual 4 : Gambaran proses kerja TeJaR

    Jawi Rumi Penerangan

    Rasulullah Perkataan pinjaman Arab

    -menggunakan senarai kata Jawi pinjaman Arab

    dengan -menggunakan petua Jawi

    Pola kkk (k= konsonan) kv1kv2k, v1= e, v2=a

    = d , = ng , = n

    yang -menggunakan petua Jawi

    Pola kk kv1k, v1= a

    = y , = ng

    orang -menggunakan petua Jawi

    Pola vvkk v1v2kv3k, v1 v2= o, v3= a

    = o , = r , = ng

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 16

    senabi -menggunakan teknik padanan terus

    Pola kkvkv kv1kv2kv3, v1= e, v2= a, v3= i

    = s , = n, = a , = b , = i

    mereka Perkataan Jawi tradisi

    - menggunakan senarai kata Jawi tradisi

    3.0 CABARAN DALAM PROSES TRANSLITERASI MESIN DALAM KONTEKS BBPT

    3.1 Skrip Jawi lama

    Antara masalah utama dalam pentransliterasian BBPT adalah penentuan skrip itu sendiri. Oleh

    kerana BBPT telah berusia hampir 600 tahun ketika ditemui, maka kualiti skrip yang terdapat

    padanya juga terjejas. Sebahagian aksara sukar dikenalpasti kerana tidak mempunyai titik. Oleh

    itu, pengkaji ingin mencadangkan teknik analisis statistik digunakan dalam menentukan

    perkataan dalam skrip Jawi pada BBPT.

    3.2 Kaedah Garis Dasar (Pemetaan Aksara ke Aksara)

    Antara masalah utama dalam transliterasi mesin adalah tiada padanan yang tepat bagi setiap

    aksara pada kedua skrip sumber dan skrip sasaran. Menurut (Hamdan Abdul Rahman, 1999)

    terdapat tiga huruf telah digunakan sebagai lambang vokal Melayu berdasarkan kepanjangan

    vokal iaitu , dan sebagaimana Jadual 5 di bawah.

    Jadual 5 : Vokal Jawi dan padanan Rumi

    Vokal Jawi Rumi Contoh Perkataan

    Jawi Padanan Rumi

    a, e

    anak

    emak

    u, o, w

    burung

    botol

    mewah

    i, e, y

    bila

    belon

    yang

    e nasionalisme

    (depan) u, o

    udang

    orang

    (depan) i, e

    ekor

    ikan

    Uniknya, sebahagian sukukata Jawi tidak menggunakan huruf vokal di dalam sistem ejaannya

    sebaliknya terdapat petua tertentu dalam pengejaannya sebagaimana contoh ayat dibawah :

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 17

    (Saya orang kaya)

    Rajah 11 : Contoh transliterasi mudah

    Sebelum hasil transliterasi diperoleh sebagaimana pada Rajah 11, pemetaan aksara Jawi-Rumi

    dilakukan terlebih dahulu sebagaimana pada Jadual 6 sebelum mendapat padanan yang tepat

    dengan menggunakan kaedah berasaskan petua. Ia tidak hanya melibatkan satu proses sahaja.

    Jadual 6 : Contoh pemetaan Jawi-Rumi

    Perkataan Jawi Pemetaan Aksara ke Aksara Padanan Rumi

    say saya

    orng orang

    kay kaya

    3.3 Pola Ejaan

    Tidak dinafikan sistem ejaan Jawi moden mengadungi pola atau petua ejaanya yang tersendiri.

    Namun harus diingat, sebahagian ejaan Jawi lama tidak begitu. Ejaan Jawi lama bergantung

    kepada pengalaman penulis dan apa yang penting penulisannya dapat dibaca dan difahami oleh

    orang lain. Tiada panduan khusus dalam penulisan Jawi pada masa tersebut. Oleh yang

    demikian, kaedah penulisannya sedikit berbeza di antara satu penulis dengan penulis yang lain.

    3.4 Homograf Dan Ketidaktentuan

    Homograf adalah dua atau lebih perkataan yang dieja sama tetapi tidak semestinya sama

    sebutannya dan mempunyai makna dan asalnya yang berbeza. Ia bukan sahaja berlaku di dalam

    ejaan Jawi bahkan juga di dalam ejaan Rumi.

    Dalam Jawi terdapat homograf kekal atau juga dipanggil sebagai homograf hakiki. Contohnya

    seperti Jadual 7 yang dipetik daripada Jadual Ejaan Jawi, (Konvensyen Tulisan Jawi, 1991).

    Jadual 7 : Senarai perkataan Jawi yang homograf hakiki

    Perkataan Jawi Padanan Rumi

    golong

    gulung

    biro

    biru

    bilik

    belek

    titik

    tetek

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 18

    ciri

    ceri

    burung

    borong

    gilang

    gelang

    kuku

    koko

    kelih

    kuliah

    asa

    esa

    Dalam konteks BBPT, terdapat banyak homograf memandangkan skrip Jawi pada BBPT adalah

    skrip Jawi lama. Jadual 8 berikut adalah senarai homograf pada muka A, BBPT.

    Jadual 8 : Senarai perkataan Jawi yang homograf dalam BBPT (Muka A)

    Jawi Rumi

    Asa

    Esa

    menegahkan

    meneguhkan

    ani

    ini

    tahan

    tahun

    saratan

    suratan

    seratan

    tujah

    tujuh

    ratas

    ratus

    4.0 PENUTUP

    Daripada perbincangan di atas dapat dilihat satu keperluan untuk mendapatkan transliterasi yang

    lebih bersifat sistematik dengan menggunakan kaedah saintifik terhadap skrip Jawi pada BBPT.

    Kerangka transliterasi mesin yang dicadangkan dalam kajian ini adalah menggunakan

    pendekatan analisis statistik dan model saluran hingar (noisy channel model) untuk mendapatkan

    ejaan yang lebih tepat terutamanya dalam menangani perkataan-perkataan yang homograf dalam

    ejaan Jawi lama. Kajian ini diharapkan dapat memanfaatkan kemudahan sains dan teknologi

    dalam usaha untuk mendapatkan transliterasi yang lebih baik.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 19

    5.0 PENGHARGAAN

    Ucapan terima kasih ditujukan kepada Kolej Universiti Islam Antarabangsa Selangor (KUIS)

    kerana menyediakan dana untuk menyambung pengajian di peringkat Ijazah Doktor Falsafah di

    bawah Skim Latihan Akademik Kakitangan KUIS (SLAK) dan juga tidak dilupakan pihak

    Muzium Terengganu kerana telah menanggung keseluruhan pembiayaian seminar ini.

    SENARAI RUJUKAN

    Ab. Nasir Abdul Aziz. 1998. Sistem pertukaran tulisan Rumi ke Jawi. Tesis Sarjana Muda,

    Universiti Teknologi Malaysia, Skudai, Johor Bahru.

    Abdul Razak Salleh. 2010. Batu Bersurat Piagam Terengganu dari perspektif Matematik.

    Seminar Batu Bersurat Terengganu. Muzium Terengganu. 18-19 April.

    Adi Yasran Abdul Aziz, dan Nurhidayah Jumaat. 2010. Sistem ejaan Jawi dan kosa kata pada

    Batu Bersurat Piagam Terengganu (BBPT). Jurnal ASWARA 5 (1):3-17.

    Ahmad, Che Wan Shamsul Bahri C W. 2007. Penterjemah Jawi lama kepada Jawi baru. Tesis

    Sarjana, Fakulti Teknologi dn Sains Maklumat, Universiti Kebangsaaan Malaysia.

    Ahmad Nazuki@ Marzuki Yaakub, Adam Mat, dan Azman Che Mat. 2006. Penggunaan kaedah

    transliterasi dalam buku teks bahasa Arab: satu kajian kes. Shah Alam: Universiti

    Teknologi Mara.

    Ahmed, T. 2009. Roman to Urdu transliteration using word list. Conference of Language and

    Technology 2009, hlm. 1-8.

    Al-Onaizan, Yaser, dan Knight, Kevin. 2002. Machine transliteration of names in Arabic text.

    Proceedings of the ACL-02 Workshop on Computational Approaches to Semitic

    Languages, hlm. 34-36.

    Bushra Jawaid, dan Tafseer Ahmed. 2009. Hindi to Urdu conversion: beyond simple

    transliteration. Conference on Language & Technology 2009, hlm. 24-31.

    Catford, J. C. 1996. Teori linguistik bagi penterjemah. Pent. Uma a/p Iyawoo dan Koh Chung

    Gaik. Kuala Lumpur: Dewan Bahasa dan Pustaka.

    Finch, Andrew, dan Eiichiro, Sumita. 2008. Phrase-based machine transliteration. Workshop on

    Technologies and Corpora for Asia-Pacific Speech Translation (TCAST), hlm. 13-18.

    Hamdan Abdul Rahman. 1999. Panduan menulis dan mengeja Jawi. ed 1. Kuala Lumpur:

    Dewan Bahasa dan Pustaka.

    Ismail Dahaman. 1991. Pedoman ejaan Jawi yang disempurnakan (1986). Konvensyen Tulisan

    Jawi. Kuala Lumpur: Bahagian Hal Ehwal Islam, Jabatan Perdana Menteri.

    Josan, G.S., dan Kaur, J. 2011. Punjabi to Hindi statistical machine transliteration. International

    Journal of Information Technology 4 (2):459-463.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 20

    Juhaida Abu Bakar. 2008. Transliterasi Jawi lama kepada Jawi baru berasaskan grafem (kajian

    kes pada Hikayat Merong Mahawangsa). Tesis Sarjana, Fakulti Teknologi dan Sains

    Maklumat, Universiti Kebangsaaan Malaysia.

    Kamus Dewan. 2005. Kuala Lumpur: Dewan Bahasa dan Pustaka.

    Khazanah Fathaniyah. 2012. Khazanah Islam klasik dan moden.

    http://koleksikf.blogspot.com/2010/04/koleksi-karya-hj-wan-mohd-shaghir_14.html

    [8 Mac 2012].

    Khirulnizam Abd Rahman. 1999. Editor : Rumi kepada Jawi. Tesis Sarjana Muda, Universiti

    Kebangsaan Malaysia, Bangi.

    Konvensyen Tulisan Jawi. 1991. Jadual ejaan Jawi. Kuala Lumpur: Jabatan Perdana Menteri.

    Malik, M. G. Abbas, Boitet, Christian, dan Bhattacharyya, Pushpak. 2010. Finite-state scriptural

    translation. 23rd International Conference on Computational Linguistics: Posters, at

    Beijing, China, hlm. 791-800.

    Malik, M.G., Boitet, C., dan Bhattacharyya, P. 2008. Hindi Urdu machine transliteration using

    finite-state transducers, 22nd International Conference on Computational Linguistics

    (Coling 2008) , Manchester, hlm. 537-544.

    Mat, A.C., Nazuki, A., dan Yaakub, M. 2010. Kegunaan transliterasi dalam pengajaran dan

    pembelajaran bahasa Arab. GEMA: Online Journal of Language Studies 10 (2):19-35.

    Nik Muhammad Nik Abdul Kadir. 2011. Jawi spell checker. ejawi.net.

    Othman Mohd Yatim, dan Abdul Halim Nasir. 2007. Epigrafi Islam terawal di nusantara. ed 2.

    Kuala Lumpur: Dewan Bahasa dan Pustaka.

    Suhailan Safei. 2000. Sistem Penterjemahan Jawi Ke Rumi. Tesis Sarjana Muda, Universiti

    Teknologi Malaysia, Skudai, Johor Bahru.

    Suliana Sulaiman, Khairuddin Omar, Nazlia Omar, et al. 2011. A Malay stemmer for Jawi

    characters. 24th Australasian Joint Conference Perth, Australia, Proceedings AI 2011:

    Advances in Artificial Intelligence, 5-8 December, hlm. 668-676.

    T.M.T.Sembok. 2005. Word stemming algorithms and retrieval effectiveness in Malay and

    Arabic documents retrieval systems. World Academy of Science, Engineering and

    Technology (WASET):95-97.

    Wikipedia. 2012. Batu Bersurat Terengganu.

    http://ms.wikipedia.org/wiki/Batu_Bersurat_Terengganu [8 Mac 2012].

    Wikipedia. 2012. Transliterasi Arab-Rumi.

    http://ms.wikipedia.org/wiki/Wikipedia:Transliterasi_Arab-Rumi [8 Mac 2012].

    Yonhendri. 2009. Transliterasi Rumi ke Jawi berasaskan petua. Tesis Sarjana, Fakulti Teknologi

    dan Sains Maklumat, Universiti Kebangsaaan Malaysia.

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 21

    Lampiran 1 : Set huruf Jawi yang lengkap (Jawi Moden) (Hamdan Abdul Rahman, 1999)

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 22

    Lampiran 2 : Batu Bersurat Piagam Terengganu (BBPT), Muka A

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 23

    Lampiran 3 : Analisis Transliterasi Batu Bersurat Piagam Terengganu (BBPT)

    B Baris B1 Baris 1

    Prof Syed

    Muhammad

    Naquib (1970)

    dalam (Othman

    Mohd Yatim

    dan Abdul

    Halim Nasir,

    2007)

    H.S Peterson

    (1924) dalam

    Omar Awang

    (1985)

    Abdul

    Rahman Al-

    Ahmadi

    (1997)

    Adi Yasran

    Abdul Aziz dan

    Nurhidayah

    Jumaat (2010)

    Wikipedia

    (2012)

    Muka A

    B1,B4 Rasul Allah Rasul Allah Rasulullah Rasulullah Rasulullah

    B1 (bagi) bagi bagi sanabi santabi

    B2 ada ada ada esa asa

    B2,B4 ugama agama ugama agama agama

    B3 derma derma derma darma derma

    meraksa meraksa meraksa meraksa mereka

    B4 di benua ku Di benuaku dibenuakan di benuaku di benuaku

    B6 penentua penetua penentu penentua penentu

    B7 lika jika Lika lika lika

    B7 sa-titah sa-titah setitah setitah setitah

    B8 penentua penentua penetua penentua penentuan

    B9 mendudokkan medudukan mendudukkan medudukan menduduki

    B9 di pertama dipertama adi pratama adi pertama adi pertama

    B10 Jumaat Jumaat Jumaat Jumaat Jumaat

    B10 sarathan sarathan sarathan syaratan saratan

    B10 di sasanakala di-sasanakala di sasanakala di sasanakala disasanakala

    B10 dua dua dua dua tua

    Muka B

    B1 le;iarga keluarga keluarga keluarga keluarga

    B1 do di benua di benua di benua dibenua

    B1 jauh jauh jauh jawa jauhkan

    B2,B4,B6 derma derma derma darma derma

    B7 balachara balachara balacara balacara bala cara

    B7 sa-titah sa-ntah setitah setitah satitah

    B9 sa-ratus sa-ratus seratus seratus seratus

    B9 rautan rautan rautan rotan ratun

    B11 di hembalang di-hembalang dihembalang di hembalang dihambalang

    B12 inkar inkar ingkar inkar inkar

    B12 ba(lachara) ba(lachara) ba(lacara) ba(lacara) bala cara

    Muka C

    B1,B2,B3 danda-nya danda-nya dendanya dandanya dandanya

    B1 sa-puloh sa-puluh sepuluh sepuluh sepuluh

    B2,B4 sa-p(aha) sa-p(aha) sep(aha) sepaha sepaha

  • Seminar Batu Bersurat Piagam Terengganu (BBPT) 2012, 25-26 Mac 2012, Kuala Terengganu, Malaysia. 24

    B4, B5 tujoh tujoh tujoh tujuh tujuh

    B4 bendara bendara bendara bandara bandara

    B6 tida tida tida tiada tiada

    B6 balachara balachara balacara balacara balabicara

    Muka D

    B1 tida tiada tida tiada tiada

    B1 dandanya dandanya dendanya dandanya dendanya

    B1 sa-tahu sa-tahil setahil setahil setahil

    B1 sa-paha sa-paha sepaha sepaha sepaha

    B2 tida ... tida... tida... tiada hartanya tiada harta

    B2 dandanya dandanya dendanya dandanya dandanya

    B3 kesapulih kesapuluh kesepuluh kesepuluh kesepuluh

    B3 anakku anak-ku anakku anakku anakku

    B3 pemain(?) pernain pemain pemain(ku) pemaainku

    B3 cucuku chuchu-ku cucuku cucuku cucuku

    B3 keluarku - keluargaku keluargaku keluargaku

    B4 tida tida tida tiada tiada

    B4 laanat laanat laknat laknat laknat

    B5 langgar langgar longgar langgar langgar

    B5 acara achara acara acara acara

    B5 tamra ini tamra ini tamraini tamra ini tamra ini