biodiversiti & adaptasi (tugasan individu c)

20
Soalan C : DNA adalah salah satu molekul penting yang kerap dikenalpasti dalam setiap penemuan fosil organisma hidup. Ia mempunyai perkaitan rapat di antara organisma hidup menerusi hubungan filogenetik yang seterusnya boleh mengakui kebenaran sebahagian teori evolusi. Huraikan teknik pengelasan organisma hidup dengan cara sistematik molekul dan bioinformatik. Jawapan : Penggunaan komputer sangat meluas dalam pelbagai bidang. Antara kelebihan penggunaan komputer adalah keupayaan untuk mengira pelbagai penyelesaian dan menentukan penyelesaian yang paling sesuai dan tepat dalam masa yang terhad. Amnya tugas-tugas ini sangat sukar atau mustahil dilakukan tanpa komputer. Bagi bidang Bioinformatik, kegunaan komputer adalah kerana kepantasan pemprosesan dan keupayaan menyelesaikan masalah yang dimiliki. Bioinformatik adalah suatu bidang hasil gabungan Teknologi Maklumat dan Komunikasi (TMK) dan Biologi. Ia melibatkan tugas analisa berasaskan komputer terhadap suatu set data berkaitan biologi.Lazimnya terdapat dua aktiviti utama yang dilakukan iaitu pembangunan pangkalan data untuk menyimpan dan mencapai maklumat, serta pembangunan alat statistik dan algoritma untuk menganalisis dan menentukan hubungan antara set-set data biologi. Misalnya jujukan,

Upload: rosdi-ramli

Post on 16-Aug-2015

22 views

Category:

Education


6 download

TRANSCRIPT

Page 1: Biodiversiti & Adaptasi (Tugasan individu c)

Soalan C : DNA adalah salah satu molekul penting yang kerap dikenalpasti dalam setiap

penemuan fosil organisma hidup. Ia mempunyai perkaitan rapat di antara

organisma hidup menerusi hubungan filogenetik yang seterusnya boleh

mengakui kebenaran sebahagian teori evolusi. Huraikan teknik pengelasan

organisma hidup dengan cara sistematik molekul dan bioinformatik.

Jawapan :

Penggunaan komputer sangat meluas dalam pelbagai bidang. Antara kelebihan

penggunaan komputer adalah keupayaan untuk mengira pelbagai penyelesaian dan

menentukan penyelesaian yang paling sesuai dan tepat dalam masa yang terhad. Amnya

tugas-tugas ini sangat sukar atau mustahil dilakukan tanpa komputer. Bagi bidang

Bioinformatik, kegunaan komputer adalah kerana kepantasan pemprosesan dan

keupayaan menyelesaikan masalah yang dimiliki.

Bioinformatik adalah suatu bidang hasil gabungan Teknologi Maklumat dan

Komunikasi (TMK) dan Biologi. Ia melibatkan tugas analisa berasaskan komputer

terhadap suatu set data berkaitan biologi.Lazimnya terdapat dua aktiviti utama yang

dilakukan iaitu pembangunan pangkalan data untuk menyimpan dan mencapai maklumat,

serta pembangunan alat statistik dan algoritma untuk menganalisis dan menentukan

hubungan antara set-set data biologi. Misalnya jujukan, struktur, expression profile dan

laluan biokimia molekul makro.

Set-set data biologi yang dianalisa bersumberkan maklumat DNA

(Deoxyribonucleic Acid), satu unsur utama dalam sel hidupan. Bioinformatik asasnya

melibatkan manipulasi, carian dan perlombongan data terhadap data jujukan DNA, selain

struktur protein. Antara penyelidikan yang dijalankan adalah carian rentetan dan

algoritma padanan yang dibangunkan untuk mencari jujukan tertentu nukleotid (elemen

DNA). Selain itu penjajaran (alignment) jujukan juga dilakukan untuk mengenal pasti

jujukan yang homolog dan mengesan mutasi tertentu yang menyebabkan jujukan berbeza.

Semua ini bermatlamat untuk menentukan hubungan phylogenetic dan fungsi protein.

Selain itu jujukan DNA yang mempamerkan ciri tertentu berkaitan protein (seperti gen

pengekod-RNA) boleh dikenal pasti melalui algoritma pencarian gen.

Ini membolehkan penyelidik meramalkan kehadiran produk gen organisma

tertentu walaupun protein itu secara fizikalnya belum diasingkan (melalui eksperimen dan

Page 2: Biodiversiti & Adaptasi (Tugasan individu c)

lain-lain). Oleh kerana bioinformatik menggabungkan kemahiran dua bidang, maka untuk

mengembangkannya memerlukan penglibatan golongan yang mahir TMK dan ahli

biologi. Ahli TMK diperlukan sebagai sumber pengetahuan mengenai aspek sintaktik

data, pangkalan data dan algoritma (carian, capaian, dan dapatan maklumat yang relevan,

mengurus dan menyelenggara pelbagai pangkalan data, membangunkan sistem

pengintegrasian maklumat, memodelkan objek biologi dan menyokong pembangunan

sistem antaramuka pengguna). Manakala ahli biologi pula penting bagi membekalkan

pengetahuan atau menjadi rujukan tentang data biologi, aspek semantik pangkalan data,

dan algoritma saintifik.

Maka ini memerihalkan tentang bidang penyelidikan dan pengembangan

Bioinformatik dengan skop dan keutamaan disasarkan terhadap lulusan berkaitan TMK.

Berdasarkan pengamatan terhadap tren semasa, bidang bioinformatik di Malaysia sangat

kurang disertai oleh oleh golongan terbabit. Sebahagian besar individu yang terlibat

secara aktif (berkaitan penyelidikan dan pengembangan ilmu) dalam bidang ini

merupakan ahli biologi serta lulusan pengajian Bioinformatik yang lebih cenderung

kepada pengetahuan, kemahiran dan matlamat ilmu biologi. Penglibatan ahli TMK di

dalam bidang Bioinformatik merupakan satu keperluan bagi mengimbangi hala tuju

Bioinformatik. Ini kerana bagi ahli biologi atau mereka yang mahir ilmu biologi,

Bioinformatik hanya dilihat dari perspektif dan kepentingan pengembangan ilmu biologi

sahaja (seperti kaitan antara DNA x dengan fungsi protein y dan lain-lain). Maka

kepentingan ilmu berkaitan sains komputer tidak menyerlah dan menyebabkan komputer

hanya dilihat sebagai alat semata-mata, justeru mengehadkan perkembangan dan potensi

sains komputer berbanding bidang biologi. Tetapi, melalui penerapan ilmu dan

penglibatan ahli sains komputer dalam bidang Bioinformatik akan dapat mengembangkan

ilmu dan algoritma khusus bagi menyelesaikan masalah komputasi berkaitan biologi. Ini

dapat mewujudkan satu perspektif berbeza dalam Bioinformatik, di mana penyelesaian

masalah komputasi dilihat sama pentingnya dengan menyelesaikan masalah biologi.

Algoritma komputasi yang dibangunkan dalam bidang sains komputer lebih bersifat

umum.

Melalui pendedahan terhadap maklumat berkaitan biologi di dalam Bioinformatik

membolehkan masalah komputasi yang spesifik berkaitan biologi dapat dibangunkan.

Amnya, pembangunan teknik untuk penyimpanan dan pencarian jujukan DNA telah

Page 3: Biodiversiti & Adaptasi (Tugasan individu c)

membawa kepada meluasnya kemajuan dalam aplikasi sains komputer, terutama

algoritma carian, pembelajaran mesin (machine learning) dan teori pangkalan data. Hari

ini, ilmu yang dikembangkan melalui sains komputer seperti bahasa formal dan algoritma

carian teks telahpun digunakan dalam algoritma dan perisian bioinformatik, seperti yang

digunakan dalam perisian BLAST dan FASTA. Berdasarkan kepentingan ini, penerangan

dan galakan perlu diajukan kepada lulusan TMK supaya sedar tentang keperluan

penglibatan mereka. Maka makalah ini cuba memerihalkan tentang bidang Bioinformatik

dan juga prospek (lulusan TMK) berkaitan bidang ini, supaya lebih ramai lulusan TMK

yang memahami dan berminat menceburinya. Makalah ini terbahagi kepada 5 bahagian.

Bahagian 1 merupakan pengenalan kepada bidang Bioinformatik. Bahagian ini

merangkumi konsep dan proses-proses asas dalam bidang terbabit. Bahagian 2

menerangkan konsep penting TMK seperti ciri pembangunan perisian (pengaturcaraan),

dan infrastruktur seperti pangkalan data serta internet yang penting dan berguna bagi

Bioinformatik. Bahagian 3 pula menerangkan serba-sedikit tentang isu dan cabaran yang

dihadapi dalam bidang Bioinformatik. Ini bertujuan memberi panduan tentang potensi-

potensi yang boleh dimanfaatkan oleh mereka yang sedang atau ingin menceburi bidang

ini. Bahagian 4 pula mengulas perkembangan bidang bioteknologi dan

bioinformatik di Malaysia iaitu berkisar tentang pelaksanaan program NBBnet. Sementara

bahagian 5 menerangkan tentang prospek dan peluang, serta keperluan yang perlu

dipenuhi oleh lulusan TMK untuk menceburi bidang Bioinformatik.

1.0 Asas Bioinformatik

1.1 Sel, Kromosom dan DNA

Benda hidup terdiri daripada sel, dan setiap satu sel benda hidup mengandungi nukleus.

Nukleus mengandungi jalinan kromosom yang terbina oleh molekul DNA

(Deoxyribonucleic Acid). DNA merupakan kunci kepada pewarisan ciri dan fungsi

daripada satu benda hidup (pewaris) kepada benda hidup yang lain (waris). Struktur DNA

juga adalah unik bagi setiap benda hidup. Salah satu peranan DNA ialah membawa

maklumat seperti ciri dan fungsi suatu sel daripada suatu generasi kepada generasi yang

lain. Maklumat ini ’tersimpan’ dalam kawasan yang dinamakan gen, iaitu kawasan-

kawasan tertentu dalam seutas rantaian DNA4. Ringkasnya pemindahan maklumat

genetik melalui gen ialah melalui pasangan bes pelengkap (complementary base pairing).

Molekul DNA wujud dalam bentuk pasangan heliks (double-helix). Pasangan utas

(strand) DNA ini terbina melalui ikatan-ikatan molekul nukleotid. Molekul nukleotid

Page 4: Biodiversiti & Adaptasi (Tugasan individu c)

ialah gabungan antara monomer, fosfat dan gula. Terdapat 4 jenis monomer nukleotid

dalam DNA – Adenine (A) dan Guanine (G), Cytosine (C) dan Thymine (T). Struktur

nukleotid ini dipaparkan dalam Rajah 1 dibawah. Jujukan bes dalam utas DNA

menentukan jujukan asid amino, dan seterusnya menentukan bentuk dan fungsi protein

yang akan disintesis (berdasarkan maklumat yang dibawa dalam jujukan asid amino).

Setiap protein yang terbentuk akan memainkan fungsi tertentu dalam sesebuah sistem

biologi, misalnya enzim dalam tubuh manusia.

Rajah 1: Struktur am jalinan molekul DNA.Sumber : http://www.accessexcellence.org/RC/VL/GG/images/dna2.gif

1.2 Genomik

DNA wujud sebagai kromosom linear dalam eukaryotes (tumbuhan dan haiwan), dan

kromosom gegelang dalam prokaryotes (bakteria, virus). Set kromosom dalam sel

membentuk genom. Genomik adalah kajian terhadap genom sesuatu organisma. Kajian

ini meliputi usaha untuk menentukan keseluruhan jujukan DNA sesuatu organisma dan

juga pemetaan genetik skala-halus (fine-scale genetic mapping). Bidang ini juga

merangkumi kajian fenomena intragenomik seperti heterosis, epistasis, pleiotropy dan

interaksi-interaksi lain antara loki (loci) dan alel dalam sesuatu genom. Sebaliknya,

penyelidikan terhadap fungsi dan peranan sesuatu gen adalah fokus utama biologi

molekular atau genetik. Ini merupakan topik utama dalam bidang penyelidikan perubatan

dan biologi moden. Penyelidikan terhadap sesuatu gen tidak digolongkan dalam

Page 5: Biodiversiti & Adaptasi (Tugasan individu c)

genomik, melainkan tujuan analisis maklumat genetik, laluan dan fungsi adalah untuk

menjelaskan kesan kedudukan dan tindak balasnya terhadap keseluruhan rangkaian

genom.

1.3 Proteomik

Proteomik merujuk kepada kajian mengenai proteom, iaitu pelengkap kepada protein

yang hadir dalam sel atau jenis sel. Genomik struktural pula menentukan secara sistematik

struktur protein yang mewakili semua gumpalan (fold) yang mungkin. Kaedah

eksperimen utama dalam kajian proteomik termasuk 2D elektrophoresis, mass

spectrometry, protein microarrays, dan penapisan/penyaringan two-hybrid. 2D

elektrophoresis membolehkan pengasingan protein dalam jumlah yang banyak. Manakala

mass spectrometry membolehkan kekerapan throughput yang tinggi dalam

pengenalpastian protein dan penjujukan peptide. Protein microarrays pula membolehkan

pengesanan paras relatif sebilangan besar protein yang wujud dalam sel, dan penyaringan

two-hybrid membolehkan penjelajahan sistematik terhadap interaksi antara protein-

protein.

1.4 Proses Penghasilan Data dan Maklumat

Sebahagian besar set data yang dihasilkan dalam Bioinformatik merupakan data jujukan

biologi dan maklumat yang diterbitkan daripadanya. Data jujukan biologi ini merangkumi

jujukan asid nukleik seperti DNA yang diwakilkan dalam bentuk set 4 huruf – C, G, A, T.

Setiap huruf mewakili monomer DNA yang digelar bes (base). Selain itu data biologi

juga merangkumi jujukan protein yang diwakilkan kepada 20 huruf bagi mewakili

monomer protein asid amino. Amnya gen adalah jujukan asid nukleik yang

memegang maklumat berkenaan jenis protein yang disintesis (dijana) berdasarkan

maklumat tersebut. Jujukan asid amino menggambarkan bentuk 3-dimensi protein

berkenaan, manakala bentuk protein menentukan fungsi biologi yang akan dilaksanakan

oleh protein terbabit. Anotasi dan data struktur protein merupakan maklumat berkenaan

susunan protein. Anotasi yang dihubungkan kepada jujukan merupakan fungsi biologi

yang akan terhasil. Contoh 264 jujukan asid amino tertentu berfungsi sebagai enzim

tertentu. Penjujukan data dihasilkan melalui proses penjujukan. Salah satunya dinamakan

chain termination reaction (juga dikenali sebagai dideoxy sequencing atau Sanger

method). Dua kaedah utama yang digunakan adalah Sanger-Coulson method dan

chemical degradation method (Maxam-Gilbert method). Proses ini akan menghasilkan

Page 6: Biodiversiti & Adaptasi (Tugasan individu c)

jujukan data yang mewakili struktur asid nukleik. 3 jenis jujukan DNA yang digunakan

adalah genomic DNA, cDNA (copy DNA) dan recombinant DNA. Teknologi terkini

hanya membenarkan ~800bp untuk sekali bacaan reaksi (reaction). Maka molekul

DNA yang bersaiz besar memerlukan bacaan beberapa kali. Untuk menggabungkan

kesemua bacaan melibatkan proses pengawalan kualiti, seperti base calling dan penilaian

kualiti (menggunakan Phred), membuang jujukan vektor (menggunakan vector_clip atau

CrossMatch), menapis jujukan berulang (menggunakan RepeatMasker), dan akhirnya

menggabungkan semula semua bacaan menjadi contigs atau contiguous sequence reads

(menggunakan Phrap). Secara keseluruhannya, proses analisis dijalankan dari peringkat

yang terperinci (genomik) kepada peringkat yang lebih umum (fungsi biologi). Proses

analisis bermula dengan mendapatkan data jujukan di peringkat pengekstrakan sampel di

makmal. Melalui proses ekstrak akan menghasilkan data jujukan asid nukleik. Kemudian

data jujukan akan dianalisis melalui beberapa peringkat sehinggalah kepada mengenal

pasti fungsi biologi sesuatu protein dalam sebuah sistem biologi. Peringkat proses ini

digambarkan dalam Rajah 2 di bawah. Setiap peringkat analisis akan melibatkan

penggunaan pelbagai pangkalan data dan alat analisis untuk menghasilkan maklumat-

maklumat yang tertentu. Pada peringkat genomik, jujukan data diekstrak dan

dikumpulkan. Kemudian pangkalan data digunakan untuk mencari jujukan yang baru

diperolehi. Carian data digunakan untuk mengenal pasti sekiranya jujukan

sampel itu pernah ditemui/tidak sebelumnya. Manakala kaedah komputasi menggunakan

alat adalah untuk meramal gen putative. Peringkat seterusnya adalah melibatkan

penggunaan tatasusunan-mikro (mikroarray) untuk mengesan profil ekspresi atau

penampilan sesuatu gen atau jujukan. Kemudian algoritma pengelompokan (clustering

algorithm) digunakan untuk mengurangkan kompleksiti data.

Page 7: Biodiversiti & Adaptasi (Tugasan individu c)

Rajah 2: Penemuan berpandu-maklumat (Information driven discovery)

Analisis proteomik pula melibatkan analisis berbilang-dimensi ke atas kelompok gen.

Analisis ini berdasarkan kepada ekspresi corak protein, struktur/fungsi dan data interaksi

protein-ke-protein. Ini membolehkan analisis dibuat terhadap struktur yang bersambung

di pelbagai peringkat kedalaman (depth). Kemudian analisis dalam konteks sistem biologi

dilakukan. Analisis ini adalah untuk meneliti laluan (pathway) protein dan metabolik,

rangkaian pengawalaturan atau proses selular/jaringan yang lebih kompleks. Maka

jujukan proses ini secara tidak langsung menimbulkan beberapa masalah. Antara cabaran

yang dihadapi adalah integrasi maklumat eksperimental dan terkomputasi supaya setiap

maklumat ini saling melengkapi antara satu sama lain. Namun dengan adanya sejumlah

besar data genomik dan proteomik bagi pelbagai organisma dan hidupan membolehkan

penyelidik mengenal pasti, misalnya, protein yang homolog dalam organisma yang sangat

jauh kaitannya (distantly related) dengan lebih efisien menerusi penjajaran

jujukan. Jadi berdasarkan peringkat-peringkat di atas, bidang bioinformatik secara

keseluruhannya cuba untuk menghimpun, menganotasi dan menganalisis data genomik

dan proteomik, kemudian mengaplikasikan teknik komputasi kepada masalah biologi

seperti pencarian gen dan cladistics.

2.0 Pembangunan perisian dan sistem pangkalan data

2.1 Pengaturcaraan dan pembangunan perisian

Perisian dihasilkan melalui proses pengaturcaraan. Pengaturcaraan ialah tugas menulis

atur cara atau program. Kemudian atur cara akan dikompil untuk menghasilkan perisian

komputer. Setiap bahasa pengaturcaraan menyediakan perisian yang dipanggil

Page 8: Biodiversiti & Adaptasi (Tugasan individu c)

pengkompil / penterjemah. Pengaturcaraan perisian terbahagi kepada dua jenis – yang

terkompil dan berskrip (diterjemah). Bahasa terkompil menggunakan pengkompil,

manakala bahasa berskrip menggunakan penterjemah. Atur cara terkompil lebih pantas

tetapi pengemaskinian dan penyuntingan agak remeh. Manakala pengaturcaraan

berskrip menghasilkan atur cara yang lebih perlahan, tetapi mudah untuk diselenggara dan

dikemaskini. Contoh bahasa terkompil ialah C, C++, Java, Ocaml, Visual Basic.

Manakala bahasa berskrip termasuk Perl, Python, Ruby, HTML, PHP dan sebagainya.

Namun dalam kes tertentu ada juga bahasa yang tergolong dalam kedua-dua kategori,

misalnya BASIC dan Perl, iaitu boleh dikompil atau diterjemah. Keupayaan pemprosesan

komputer yang semakin pantas menjadikan atur cara skrip lebih pantas berbanding

sebelumnya. Ini mendorong penggunaan atur cara berskrip bagi konteks aplikasi. Namun

pada konteks sistem, aplikasi terkompil tetap menjadi pilihan kerana kepantasan dan

pelaksanaan yang lebih efisien berbanding atur cara berskrip. Pengatur cara perlu tahu

membezakan kelebihan dan kekurangan sesuatu sistem pembangunan perisian (seperti

memilih antara terkompil atau berskrip) bagi membolehkan mereka membangunkan

perisian yang terbaik dan sesuai dengan matlamat projek. Terdapat beratus bahasa

pengaturcaraan. Umumnya, pemilihan bahasa pengaturcaraan bergantung kepada

keupayaan pengatur cara untuk menguasai bahasa pengaturcaraan tersebut dan keupayaan

bahasapengaturcaraan untuk menghasilkan perisian yang dikehendaki. Selain itu,

pemilihan bergantung kepada:

• Kesesuaian dengan sistem/perisian yang dibangunkan – bahasa pengaturcaraan

dibangunkan dengan matlamat tertentu seperti pemprosesan teks.

• Sokongan pustaka (library) bagi bahasa pengaturcaraan – lebih banyak lebih baik

• Bahasa yang terkenal – jika terkenal kemungkinan lebih banyak sokongan

Pengaturcaraan tidak mempunyai satu kaedah umum yang tetap. Sebaliknya bergantung

pada pengatur cara untuk menghasilkan atur cara yang dapat menyelesaikan masalah yang

cuba diselesaikan. Oleh itu pengatur cara perlu ada kemahiran menganalisis masalah

(pengaturcaraan), mereka bentuk dan mengimplimentasi sistem, menguji serta mampu

mendokumentasi atur cara yang mereka hasilkan. Semua proses ini merupakan peringkat-

peringkat dalam kitar hayat pembangunan sistem (System/Software Development Life

Cycle atau SDLC). Bagi projek/sistem yang besar, individu yang berbeza ditugaskan pada

setiap peringkat. Namun bagi sistem yang kecil, pengatur cara boleh melakukan

kesemuanya. Oleh sebab masalah pengaturcaraan yang semakin kompleks, ditambah pula

kemampuan sistem pembangunan sistem yang semakin canggih, maka pengatur cara

Page 9: Biodiversiti & Adaptasi (Tugasan individu c)

(individu yang membangunkan/menulis atur cara) perlu lebih dinamik dan mempunyai

pelbagai kemahiran. Antaranya kemahiran menganalisis masalah. Perisian boleh

menyelesaikan banyak masalah pengiraan, namun masalah perlu dianalisis dan

diterjemahkan dengan betul kepada bentuk atur cara. Antara kaedah analisis masalah yang

semakin digemari ialah analisis berorientasi/berasaskan objek (Object Oriented Analysis

atau OOA). Hasil analisis ini membolehkan pengatur cara mereka bentuk penyelesaian

masalah menggunakan reka bentuk berasaskan objek (Object-Oriented Design atau

OOD). Oleh itu kemampuan untuk berfikir menggunakan konsep objek dan modul sangat

penting. Apabila menggunakan OOA dan OOD, sebaiknya pengatur cara membina atur

cara menggunakan bahasa yang mampu membina atur cara berorientasi objek juga

(Object-Oriented Programming atau OOP). Bahasa seperti Perl, Python, C++ dan Java

menyokong OOP. Bahasa OOP perlu membolehkan pengatur cara membina atur cara

dalam bentuk kelas dan objek. Ini supaya selaras dengan reka bentuk daripada peringkat

OOD. Seterusnya pengujian boleh dilakukan berasaskan konsep dan fungsi objek dalam

sistem aplikasi. Selain itu pengatur cara perlu mahir membina algoritma dan membentuk

penyelesaian menggunakan atur cara. Algoritma yang baik dan penggunaan struktur data

yang tepat boleh mendorong penghasilan atur cara/perisian yang efektif dan efisien.

Algoritma adalah susunan langkah penyelesaian masalah. Manakala struktur data merujuk

kepada struktur yang digunakan untuk menyimpan dan mengorganisasi data dalam

atur cara. Contohnya tatasusunan, senarai berpaut (linked list), pepohon (tree) dan cincang

(hash). Kelebihan sesuatu algoritma atau struktur data diukur berdasarkan tahap

kompleksiti. Kompleksiti diukur menggunakan unit O (big-oh). Jika suatu algoritma

menghasilkan O(n) manakala yang lain menghasilkan O(n2) atau O(mn), maka algoritma

dengan kompleksiti O(n) adalah yang terbaik.

2.2 Bahasa pengaturcaraan untuk Bioinformatik

Antara bahasa pengaturcaraan yang popular bagi bidang Bioinformatik adalah Perl. Perl

adalah bahasa berskrip, dan diterjemah menggunakan penterjemah Perl. Selain berbentuk

skrip, kelebihan Perl adalah keupayaan pemprosesannya untuk memproses data berjenis

rentetan (teks). Ia mampu menyokong OOP atau sekadar pengaturcaraan bermodul. Selain

itu Perl disokong oleh ramai individu dan mempunyai sokongan pustaka yang

komprehensif. Perl banyak digunakan sebagai asas perisian Bioinformatik kerana Perl

cekap memproses data jenis teks, menghubungkan aplikasi dengan pangkalan data dan

keupayaan yang tinggi bagi pengaturcaraan internet. Misalnya modul Bioperl Toolkit

Page 10: Biodiversiti & Adaptasi (Tugasan individu c)

menyediakan pelbagai kemudahan untuk membina perisian aplikasi berkaitan biologi dan

sains hayat (life sciences). Malah Perl digunakan bagi membangunkan perisian sistem

BioGrappler. Selain Perl, PHP, Python, Java, C, C++ juga turut digunakan dalam bidang

Bioinformatik.

2.3 Sistem pangkalan data

Pangkalan data ialah sistem perisian yang digunakan untuk menyimpan data dan

maklumat. Pangkalan data biasanya diurus oleh sebuah perisian khas yang dinamakan

sistem pengurusan pangkalan data (DataBase Management System atau DBMS). DBMS

merupakan enjin kepada pangkalan data dan merupakan sebahagian sistem pangkalan

data. DBMS menyediakan kemudahan mengurus penyimpanan dan dapatan semula data,

carian dan kemaskini. Antara DBMS yang terkenal adalah Oracle RDBMS (atau Oracle),

MySQL dan Microsoft-SQL server (MS-SQL). DBMS beroperasi ke atas pangkalan data

dengan menggunakan bahasa queri berstruktur yang dinamakan sebagai SQL (Structured

Query Language). SQL merupakan bahasa query pangkalan data standard yang

digunapakai oleh kesemua DBMS masakini. Oleh itu bagi pengatur cara perisian

berkaitan pangkalan data perlu mengetahui kaedah mengaturcara dalam bahasa SQL.

Terdapat dua jenis pangkalan data iaitu pangkalan data berskala kecil (MS-Access, dBase)

dan berskala besar (MS-SQL, MySQL dll). Skala ini menentukan kemampuan DBMS

untuk mengurus data. Bagi DBMS berskala kecil, kemampuannya terhad untuk mengurus

data dalam jumlah yang kecil. Biasanya ia hanya untuk kegunaan peribadi (cth desktop)

atau organisasi yang kecil. Manakala bagi DBMS skala besar, ia lebih sesuai digunakan

bagi tujuan penyimpanan data yang banyak. Sistem pangkalan data boleh dicapai dalam

pelbagai reka bentuk capaian. Setiap capaian boleh ditetapkan ciri-ciri keselamatan sama

ada bagi tujuan perlindungan/pengasingan atau menghalang capaian yang tidak

dibenarkan. Ciri keselamatan ini boleh diubah mengikut keperluan pemilik pangkalan

data. Seorang (atau sekumpulan) pentadbir akan menguruskan penetapan dan

penyelenggaraan pangkalan data. Pentadbir akan menetapkan hak capaian melalui akaun

pengguna dan mereka mempunyai penguasaan sepenuhnya terhadap data yang disimpan

di dalam pangkalan data. Dari sudut reka bentuk sistem, pangkalan data boleh dipasang

pada komputer pengguna atau dipasang pada sebuah pusat perkhidmatan (di dalam

pelayan atau komputer kerangka) dan semua pengguna akan dihubungkan kepada

pangkalan data melalui sistem rangkaian intranet mahupun internet. Hasil perkembangan

teknologi komputer dan internet, banyak pihak yang menyediakan perkhidmatan

Page 11: Biodiversiti & Adaptasi (Tugasan individu c)

pangkalan data secara percuma di internet. Bioinformatik memerlukan sistem pangkalan

data kerana jumlah data yang dihasilkan melalui eksperimen dan komputasi (perisian)

adalah sangat banyak. Justeru sistem pangkalan data adalah sangat penting bagi

membolehkan data disimpan dan diurus dengan baik. Selain itu DBMS membolehkan

carian semula maklumat dilakukan dengan cepat dan pantas. Proses seperti penjajaran

jujukan memerlukan perisian pengkomput (cth BLAST) mencari semula jujukan-jujukan

yang pernah direkodkan sebelumnya dalam pangkalan data dan membuat perbandingan

supaya penjajaran (alignment) boleh dilakukan.

2.4 Sistem pangkalan data untuk Bioinformatik

Kebanyakan sistem pangkalan data atau DBMS mampu melaksanakan fungsi berkaitan

bidang Bioinformatik. Keperluan utama bagi pangkalan data berkaitan Bioinformatik

ialah DBMS tersebut mestilah mampu mengurus sejumlah data dan maklumat yang

banyak (maka MS-Access dan DBMS lain setaraf dengannya bukan satu pilihan bagi

tugas ini). Selain itu ia mesti mempunyai antaramuka sistem dan pengaturcaraan aplikasi

(Application Programming Interface atau API) yang membenarkan pelbagai jenis

aplikasi berhubung dengan DBMS tersebut. Sistem keselamatan bagi DBMS ini juga

perlu bertaraf tinggi kerana aplikasi berkaitan Bioinformatik selalunya akan dihubungkan

melalui internet. Antara DBMS yang popular adalah MySQL kerana ia percuma, selamat,

mudah diselenggara dan dipertingkatkan keupayaannya (kod terbuka atau open source).

Bahasa Perl mempunyai modul API bagi antaramuka pangkalan data iaitu DBI (DataBase

Interface), yang membenarkan pengatur cara menghubungkan perisian Bioinformatik

menggunakan skrip Perl dengan pelbagai jenis DBMS7. Ini termasuklah MySQL. Modul

pustaka seperti DBI sangat berguna untuk menghubungkan perisian dengan DBMS.

Selain DBI bagi Perl, wujud juga antaramuka pangkalan data yang lain. Misalnya ODBC

(Open Database Connectivity) bagi sistem pangkalan data yang menggunakan pelantar

Windows, manakala bahasa Java dengan JDBC (Java Database Connectivity). Melalui

antaramuka pangkalan data, proses menghubungkan perisian pengguna dengan

DBMS/pangkalan data akan jadi lebih mudah dan seragam. Secara teknikal DBI berlainan

kategori daripada ODBC dan JDBC kerana DBI adalah API bagi Perl untuk sambungan

pangkalan data. Malah DBI boleh berinteraksi dengan ODBC dan JDBC.

Page 12: Biodiversiti & Adaptasi (Tugasan individu c)

2.6 Kepentingan internet untuk Bioinformatik

Perkembangan internet sangat berguna bagi perkembangan bidang Bioinformatik. Ini

kerana penggunaan pangkalan data menjadi sangat penting bagi tujuan rujukan dan

perbandingan (cth aplikasi BLAST8). Melalui teknologi internet, proses pencarian dan

capaian maklumat menjadi lebih mudah dan pantas. Misalnya pangkalan data GenBank di

Amerika Syarikat dan SwissProt di Switzerland mengandungi koleksi data yang sangat

komprehensif. Melalui penggunaan internet, penyelidik di Arab Saudi boleh merujuk

pangkalan data GenBank hampir serta-merta. Ini membolehkan penyelidikannya

dijalankan dengan lebih pantas. Selain itu, penyelidik atau sesiapa saja yang terlibat dalam

penyelidikan biologi boleh merujuk mana-mana pangkalan data melibatkan maklumat

biologi dengan mudah dan cepat. Aplikasi Bioinformatik juga memerlukan keupayaan

pemprosesan dan pengiraan yang tinggi. Ini kerana data-data yang dihasilkan melalui

eksperimen dan penggunaan perisian adalah sangat banyak. Maka pengurusan data perlu

cekap, efektif dan efisien. Selain mengurus pangkalan data, perisian juga digunakan bagi

melakukan komputasi. Komputasi yang dilakukan ada kalanya sangat kompleks (seperti

aplikasi pengaturcaraan dinamik atau dynamic programming), atau pengiraan yang

melibatkan sejumlah data yang banyak. Sistem grid adalah satu pilihan yang digunakan

untuk melaksanakan aplikasi perisian Bioinformatik kerana ia lebih murah berbanding

sistem kerangka utama, selain efektif dan efisien. Melalui penggunaan internet dan

rangkaian, sistem grid yang dipasang di satu tempat boleh dimanfaatkan

oleh pengguna yang berada di tempat lain. Misalnya EmasGrid merupakan sistem grid

yang diwujudkan hasil kerjasama di antara universiti utama di Malaysia bagi tujuan

penyelidikan, termasuk berkaitan aplikasi Bioinformatik. Sementara infrastruktur

NBBnet, iaitu usaha pembangunan bioteknologi kebangsaan, turut lebih mudah diwujud

dan dibangunkan dengan adanya kemudahan rangkaian.

6.0 Kesimpulan

Bidang Bioinformatik sedang berkembang dengan pesat sama ada di peringkat

kebangsaan mahupun global. Di peringkat tempatan, rangkaian NBBnet diwujudkan agar

dapat merancakkan usaha pembangunan bidang Bioteknologi dan Bioinformatik.

Kewujudan rangkaian ini dan GENOMalaysia, selain pelbagai usaha lain berkaitan bidang

Bioteknologi seharusnya diambil berat oleh lulusan TMK. Perkembangan bidang

Bioinformatik negara sememangnya menjanjikan potensi yang besar kepada lulusan

Page 13: Biodiversiti & Adaptasi (Tugasan individu c)

bidang TMK. Dengan memperkenalkan mereka terhadap bidang ini dan menghuraikan

perkembangan semasa diharap dapat memberi perspektif baru terhadap potensi bidang

TMK. Ini sekaligus memberi harapan yang lebih luas kepada lulusan TMK untuk

mendalami bidang masing-masing, dan juga melihat potensi ilmu mereka di bidang-

bidang lain yang berkaitan khususnya Bioinformatik. Namun yang lebih penting adalah

pengembangan dan pembangunan bidang Bioinformatik dan Bioteknologi. Melalui

penyertaan lulusan TMK, akan dapat mengisi keperluan dalam penyelidikan yang

memerlukan kemahiran TMK. Ini akan memberi impak dan rangsangan kepada bidang ini

untuk lebih maju. Sekaligus dapat meningkatkan perkembangan serta memajukan bidang

ini.Insyaallah….