uji fenolat
DESCRIPTION
Bioinformatika1 SejarahTRANSCRIPT
Bioinformatika
Pengenalan Bioinformatika
Contents
• Sejarah Bioinformatika
• Istilah Biologi
• Pangkalan Data
• Tools Bioinformatika
Definisi
• Bioinformatika (bioinformatics) adalah ilmu yang mempelajari penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis.
• Bidang ini mencakup penerapan metode-metode matematika, statistika, informatika, fisika, biologi, dan ilmu kedokteran untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam amino serta informasi yang berkaitan dengannya.
• Contoh topik utama bidang ini meliputi basis data untuk – mengelola informasi biologis, – penyejajaran sekuens (sequence alignment), – prediksi struktur untuk meramalkan bentuk struktur protein maupun
struktur sekunder RNA, – analisis filogenetik, dan – analisis ekspresi gen.
Pendahuluan
• Bioinformatika merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi dibidang molekular.
• Pembahasan dibidang bioinformatik ini tidak terlepas dari perkembangan biologi molekular modern, salah satunya peningkatan pemahaman manusia dalam bidang genomic yang terdapat dalam molekul DNA.
Latar Belakang Bioinformatika
• Kemajuan bioteknologi dan teknologi informasi• Dilatarbelakangi oleh ledakan data (data
explosion) observasi biologi sebagai hasil yang dicapai dari kemajuan bioteknologi. Contohnya adalah pertumbuhan pesat database DNA pada GenBank.
• Genbank adalah database utama dalam biologi molekuler, yang dikelola oleh NCBI (National Center for Biotechnology Information) di AS.
• Kemampuan untuk memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh teknologi informasi melalui perkembangan hardware dan software.
• Baik pihak pabrikan sofware dan harware maupun pihak ketiga dalam produksi perangkat lunak.
• Salah satu contohnya dapat dilihat pada upaya Celera Genomics, perusahaan bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang secara maksimal memanfaatkan teknologi informasi sehingga bisa melakukan pekerjaannya dalam waktu yang singkat (hanya beberapa tahun).
Peluang Bioinformatika
• Ilmu bioinformatika lahir atas insiatif para ahli ilmu komputer berdasarkan artificial intelligence.
• Mereka berpikir bahwa semua gejala yang ada di alam ini bisa dibuat secara artificial melalui simulasi dari gejala-gejala tersebut.
• Untuk mewujudkan hal ini diperlukan data-data yang yang menjadi kunci penentu tindak-tanduk gejala alam tersebut, yaitu gen yang meliputi DNA atau RNA.
• Bioinformatika ini penting untuk manajemen data-data dari dunia biologi dan kedokteran modern.
• Perangkat utama Bioinformatika adalah program software dan didukung oleh kesediaan internet
Teknologi DNA Rekombinan
• Perkembangan teknologi DNA rekombinan memainkan peranan penting dalam lahirnya bioinformatika.
• Teknologi DNA rekombinan memunculkan suatu pengetahuan baru dalam rekayasa genetika organisme yang dikenal dengan bioteknologi.
• Perkembangan bioteknologi dari bioteknologi tradisional ke bioteknologi modern salah satunya ditandainya dengan kemampuan manusia dalam melakukan analisis DNA organisme, sekuensing DNA dan manipulasi DNA.
Sekuensing DNA
• Sekuensing DNA satu organisme, misalnya suatu virus memiliki kurang lebih 5.000 nukleotida atau molekul DNA atau sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh pada tahun 1977.
• Kemudian sekuen seluruh DNA manusia terdiri dari 3 milyar nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu 3 tahun, walaupun semua ini belum terlalu lengkap.
• Saat ini terdapat milyaran data nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan tahun 1982.
Sejarah Bioinformatika
• 1960an: penerapan bidang-bidang dalam bioinformatika seperti pembuatan pangkalan data dan pengembangan algoritma untuk analisis sekuens biologi.
• 1960an: Pangkalan data sekuens protein mulai dikembangkan di Amerika Serikat.
• 1970an: pangkalan data sekuens DNA dikembangkan di Amerika Serikat dan Jerman pada Laboratorium Biologi Molekuler Eropa (European Molecular Biology Laboratory).
• 1970an: Penemuan teknik sekuensing DNA menjadi landasan terjadinya ledakan jumlah sekuens DNA yang dapat diungkapkan pada 1980an dan 1990an.
• Hal ini menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.
• 1980an: Bioinformatika pertamakali dikemukakan untuk mengacu kepada penerapan ilmu komputer dalam bidang biologi. Tepatnya, istilah Bioinformatika pertama kali diperkenalkan pada 1979 oleh Paulien Hogeweg.
• Perkembangan jaringan internet juga mendukung berkembangnya bioinformatika.
• Pangkalan data bioinformatika yang terhubungkan melalui internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke dalam pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan analisis.
• Selain itu, penyebaran program-program aplikasi bioinformatika melalui internet memudahkan ilmuwan dalam mengakses program-program tersebut dan kemudian memudahkan pengembangannya.
• Kemajuan ilmu Bioinformatika ini lebih didesak lagi oleh genome project yang dilaksanakan di seluruh dunia dan menghasilkan tumpukan informasi gen dari berbagai makhluk hidup, mulai dari makhluk hidup tingkat rendah sampai makhluk hidup tingkat tinggi
• Pada tahun 2001, genom manusia yang terdiri dari 2.91 juta bp (base-pare, pasangan basa) telah selesai dibaca [2].
• Baru-baru ini genom mikroba Plasmodium penyebab Malaria dan nyamuk Anopheles yang menjadi vektor mikroba tersebut juga telah berhasil dibaca [3-4].
• Dan masih banyak lagi gen-gen dari makhluk hidup lainnya yang sudah dan sedang dibaca
• Pengorganisasian data yang ada sangat berguna untuk analisis yang lebih baik.
• Pekerja di bidang bioinformatika memastikan informasi biologis tersedia, melalui pengawasan kualitas, pemeriksaan silang, dan standarisasi, untuk selanjutnya bisa dicari dengan mudah.
Istilah Biologi
• Biologi molekular• Sel• DNA• RNA• Gen• Molekul• Protein• Genom
Biologi molekular
• Merupakan salah satu cabang biologi yang merujuk kepada pengkajian mengenai kehidupan pada skala molekul.
• Ini termasuk penyelidikan tentang interaksi molekul dalam benda hidup dan kesannya, terutama tentang interaksi berbagai sistem dalam sel, termasuk interaksi DNA, RNA, dan sintesis protein, dan bagaimana interaksi tersebut diatur.
Sel
• Sel merupakan unit organisasi terkecil yang menjadi dasar kehidupan dalam arti biologis.
• Semua fungsi kehidupan diatur dan berlangsung di dalam sel.
• Karena itulah, sel dapat berfungsi secara autonom asalkan seluruh kebutuhan hidupnya terpenuhi.
Molekul
• Molekul didefinisikan sebagai sekelompok atom (paling sedikit dua) yang saling berikatan dengan sangat kuat (kovalen) dalam susunan tertentu dan bermuatan netral serta cukup stabil
DNA
• Asam deoksiribonukleat, lebih dikenal dengan DNA (bahasa Inggris: deoxyribonucleic acid), adalah sejenis asam nukleat yang tergolong biomolekul utama penyusun berat kering setiap organisme.
• Di dalam sel, DNA umumnya terletak di dalam inti sel.• Secara garis besar, peran DNA di dalam sebuah sel
adalah sebagai materi genetik; artinya, DNA menyimpan cetak biru bagi segala aktivitas sel.
• Ini berlaku umum bagi setiap organisme. • Di antara perkecualian yang menonjol adalah beberapa
jenis virus (dan virus tidak termasuk organisme) seperti HIV (Human Immunodeficiency Virus).
RNA
• Asam ribonukleat (bahasa Inggris:ribonucleic acid, RNA) senyawa yang merupakan bahan genetik dan memainkan peran utama dalam ekspresi genetik. Dalam dogma pokok (central dogma) genetika molekular, RNA menjadi perantara antara informasi yang dibawa DNA dan ekspresi fenotipik yang diwujudkan dalam bentuk protein.
Gen• Gen adalah unit pewarisan sifat bagi organisme hidup. • Bentuk fisiknya adalah urutan DNA yang menyandi suatu
protein, polipeptida, atau seuntai RNA yang memiliki fungsi bagi organisme yang memilikinya.
• Gen adalah bagian DNA yang bertugas untuk menentukan kapan, dimana, seberapa banyak suatu protein diproduksi.
• Kelainan yang terjadi pada gen, akan menyebabkan ketidaknormalan pada fungsi protein, dan pada gilirannya berkaitan erat dengan mekanisme timbulnya penyakit pada seseorang.
• Karena itu analisa ekspresi gen ini merupakan informasi penting untuk mengetahui mekanisme timbulnya suatu penyakit, dan mendesain terapi medis yang tepat bagi seorang pasien
Gen
Protein• Protein adalah senyawa organik kompleks berbobot molekul tinggi yang
merupakan polimer dari monomer-monomer asam amino yang dihubungkan satu sama lain dengan ikatan peptida.
• Molekul protein mengandung karbon, hidrogen, oksigen, nitrogen dan kadang kala sulfur serta fosfor.
• Protein berperan penting dalam struktur dan fungsi semua sel makhluk hidup dan virus.
• Kebanyakan protein merupakan enzim atau subunit enzim. • Jenis protein lain berperan dalam fungsi struktural atau mekanis, seperti
misalnya protein yang membentuk batang dan sendi sitoskeleton. • Protein terlibat dalam sistem kekebalan (imun) sebagai antibodi, sistem
kendali dalam bentuk hormon, sebagai komponen penyimpanan (dalam biji) dan juga dalam transportasi hara.
• Sebagai salah satu sumber gizi, protein berperan sebagai sumber asam amino bagi organisme yang tidak mampu membentuk asam amino tersebut (heterotrof).
Sintesis Protein
• Sintesis protein adalah proses pencetakan protein dalam sel.
• Sifat enzim (protein) sebagai pengendali dan penumbuh karakter makhluk hidup ditentukan oleh jumlah jenis, dan urutan asam amino yang menyusunnya.
• Jenis dan urutan asam amino ditentukan oleh ADN (Asam Dioksiribose Nukleat
• Sintesis protein meliputi dua langkah, yaitu transkripsi dan translasi.
Genom• Genom (Ing. genome), dalam genetika, adalah keseluruhan
bahan genetik yang membawa semua informasi pendukung kehidupan pada suatu makhluk hidup, baik yang merupakan gen atau bukan.
• Pada semua makhluk hidup, genom mencakup semua informasi genetik yang dibawa DNA, baik di inti sel (nukleus), mitokondria, maupun plastida.
• Virus tertentu memiliki genom dalam bentuk RNA. • Setiap spesies makhluk hidup memiliki paket genom yang berbeda-
beda, yang menjelaskan mengapa perkawinan silang antara dua spesies sering menghasilkan keturunan yang mandul (steril).
• Istilah ini diperkenalkan oleh Hans Winkler, seorang profesor dari Universitas Hamburg, Jerman pada tahun 1920, sebagai singkatan (portmanteau) dari gene dan chromosome.
• Kajian yang mempelajari bahan genetik secara keseluruhan ini dikenal sebagai genomika (genomics).
Gambar dari 46 macam kromosom yang membentuk Genom seseorang jenis laki-laki
Pangkalan data
• Pada dasarnya data-data gen yang sudah ada ini bisa menekan banyaknya waktu dan biaya yang diperlukan untuk menyelesaikan sebuah penelitian.
• Sebagai contoh, untuk menciptakan obat untuk penyakit tertentu, seorang peneliti bisa memulai dengan melihat karakteristik dan fungsi gen yang sudah ada dalam data, untuk kemudian dibandingkan dan diteliti lebih lanjut.
• Daripada memulai dengan ribuan kemungkinan yang ada, akan lebih menghemat waktu dan biaya bila peneliti memulai dengan yang memiliki kemungkinan berhasil paling tinggi.
Pangkalan Data
• Pangkalan data primer: digunakan untuk menyimpan sekuens primer asam nukleat dan protein.
• Pangkalan data sekunder: digunakan untuk menyimpan motif sekuens protein,
• Pangkalan data struktur: digunakan untuk menyimpan data struktur protein dan asam nukleat.
Pangkalan data primer• Pangkalan data primer untuk sekuens asam nukleat saat ini adalah
– GenBank (Amerika Serikat), – EMBL (the European Molecular Biology Laboratory, Eropa), dan – DDBJ (DNA Data Bank of Japan, Jepang).
• Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan masing-masing pangkalan data.
• Sumber utama data sekuens asam nukleat adalah submisi (pengumpulan) langsung dari
– peneliti individual, – proyek sekuensing genom, dan – pendaftaran paten.
• Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens asam nukleat pada umumnya mengandung informasi tentang
– jenis asam nukleat (DNA atau RNA), – nama organisme sumber asam nukleat tersebut, dan – segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.
• Selain asam nukleat, beberapa contoh pangkalan data penting yang menyimpan sekuens primer protein adalah PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa).
• Ketiga pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai terutama oleh Amerika Serikat.
• Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang pada umumnya berisi penjelasan mengenai fungsi protein tersebut.
Pangkalan data primer: Genbank
• Genbank, dioperasikan oleh NCBI (National Center for Biotechnology Information) mengakomodasi semua publikasi sequences of DNA, dengan annotations (penjelasan atau catatan), yang secara konstan akan selalu berkembang dan diperbaharui.
• Penjelasan meliputi identifikasi suatu gen, produk gen (jika diketahui), link informasi lain yang terkait dengan sumber database lain.
• NCBI berisi informasi dari sekuens DNA yang sama dengan sekuens DNA dalam EMBL (European Molecular Biology Laboratory) dan DDBJ (DNA Data Bank of Japan)
Pangkalan data primer: OMIM
• OMIM, (Online Mendelian Inheritance in Man—woman), adalah insiklopedia gen-gen manusia dan penyakit genetik, merupakan penghubung untuk entry gen pada GenBank dan literatur ilmiah pada PubMed, berisi informasi berbagai gen manusia komplit dan paling baru.
Pangkalan data primer: PDB
• PDB (Protein Data Bank) berisi semua publisitas yang ada secara eksperimen telah dideterminasi (oleh x-ray crystallography dan NMR) sebagai model structural proteins dan asam nukleat.
• Tidak berisi model homologi atau tipe model teoritis lainnya.
Pangkalan data primer: PubMed
• Diskripsi pada Wikipedia sebagai “suatu kebebasan mengakses sititasi database MEDLINE dan abstrak artikel riset biomedik.
• Subjek utama adalah riset di bidang kedokteran, dan PubMed juga mempublikasi bidang yang terkait dengan bidang kedokteran, seperti kebidanan dan disipiin kesehatan lainnya.
• Hal ini secara menyeIuruh meliputi keilmuan yang berhungan dengan ilmu seperti biokimia dan biologi sel.
• Situs ini ditawarkan oleh the United States National Library of Medicine di the National Institutes of Health sebagai bagian dari the Entrez information retrieval system.“
Pangkalan data primer : UniProt Knowledgebase
• UniProt Knowledgebase (Swiss-Prot and TrEMBL), dioperasikan oleh SIB (Swiss Institute of Bioinformatics) dan EBI (European Bioinformatics Institute), berisi sebagian besar publikasi yang ada berupa sekuens protein (bukan DNA atau RNA).
• Sekuens dalam Swiss-Prot dijelaskan secara manual dan menyediakan atau menghubungkan pengguna dengan semua informasi publisitas yang berisi sekuens tersebut.
• Sequences pada TrEMBL dikoleksi dan dijabarkan secara otomatis dari sekuens database, dan akan membuat jalannya menuju Swiss-Prot, tetapi tidak hanya setelah mereka secara manual menjabarkan Swiss-Prot standards.
Situs Informasi database DNA, RNA dan Protein
• NCBI: www.ncbi.nlm.nih.gov • EMBL: www.ebi.ac.uk • DDBJ: www.ddbj.nig.ac.jp • SWISS-PROT:www.expasy.ch/sprot/
sprot_details.html • ENSEMBL: www.ensembl.org • Univeristy California Santa Cruz:
genome.cse.ucsc.edu • MGD the Jackson Lab:
www.informatics.jax.org
Tools Bioinformatika : BLAST
• Perangkat bioinformatika yang berkaitan erat dengan penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment Search Tool).
• Penelusuran BLAST (BLAST search) pada pangkalan data sekuens memungkinkan ilmuwan untuk mencari sekuens baik asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya.
• Hal ini berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan hasil sekuensing atau untuk memeriksa fungsi gen hasil sekuensing.
• Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens.
Tools Bioinformatika : PDB
• PDB (Protein Data Bank, Bank Data Protein) ialah pangkalan data tunggal yang menyimpan model struktur tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR, dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam protein atau pun asam nukleat.
Peluang Bioinformatika
• Masih banyak kendala dalam bioinformatika, di antaranya adalah kesulitan untuk menemukan semua gen dari organisme, mengidentifikasi dan menjelaskan tentang gen-gen tersebut, kesulitan dalam membandingkan kemiripan DNA/protein yang ada, dan seterusnya.
• Namun semakin canggihnya komputer membuat bioinformatika patut optimis.
• Karena komputer hanya bisa membuat data dan mereka tidak memberikan jawaban, dunia ini masih memerlukan banyak orang yang mau dan mampu memberikan jawaban atas persoalan biologis yang bermanfaat bagi kehidupan di dunia.
Penerapan Utama Bioinformatika
Basis data sekuens biologis
Penyejajaran sekuens
Prediksi struktur protein
Analisis ekspresi gen
Sesuai dengan jenis informasi biologis yang
disimpannya, basis data sekuens biologis dapat
berupa:
basis data primer untuk menyimpan sekuens
primer asam nukleat maupun protein,
basis data sekunder untuk menyimpan motif
sekuens protein, dan
basis data struktur untuk menyimpan data
struktur protein maupun asam nukleat.
Basis data sekuens biologis
Basis data utama untuk sekuens asam nukleat
saat ini adalah
GenBank (Amerika Serikat),
EMBL (Eropa), dan
DDBJ(en) (DNA Data Bank of Japan, Jepang).
Ketiga basis data tersebut bekerja sama dan
bertukar data secara harian untuk menjaga
keluasan cakupan masing-masing basis data.
Sumber utama data sekuens asam nukleat adalah
submisi langsung dari periset individual,
proyek sekuensing genom, dan
pendaftaran paten.
Selain berisi sekuens asam nukleat, entri dalam
basis data sekuens asam nukleat umumnya
mengandung informasi tentang:
jenis asam nukleat (DNA atau RNA),
nama organisme sumber asam nukleat
tersebut, dan
pustaka yang berkaitan dengan sekuens asam
nukleat tersebut.
Sementara itu, contoh beberapa basis data penting yang
menyimpan sekuens primer protein adalah
PIR (Protein Information Resource, Amerika Serikat),
Swiss-Prot (Eropa), dan
TrEMBL (Eropa).
Ketiga basis data tersebut telah digabungkan dalam UniProt
(yang didanai terutama oleh Amerika Serikat).
Entri dalam UniProt mengandung informasi tentang:
sekuens protein,
nama organisme sumber protein,
pustaka yang berkaitan, dan
komentar yang umumnya berisi penjelasan mengenai
fungsi protein tersebut.
BLAST (Basic Local Alignment Search Tool) merupakan
perkakas bioinformatika yang berkaitan erat dengan
penggunaan basis data sekuens biologis.
Penelusuran BLAST (BLAST search) pada basis data
sekuens memungkinkan ilmuwan untuk mencari sekuens
asam nukleat maupun protein yang mirip dengan sekuens
tertentu yang dimilikinya.
Hal ini berguna misalnya:
untuk menemukan gen sejenis pada beberapa
organisme atau
untuk memeriksa keabsahan hasil sekuensing maupun
untuk memeriksa fungsi gen hasil sekuensing.
Algoritma yang mendasari kerja BLAST adalah
penyejajaran sekuens.
Penyejajaran sekuens (sequence alignment) adalah
proses penyusunan/pengaturan dua atau lebih sekuens
sehingga persamaan sekuens-sekuens tersebut tampak
nyata.
Hasil dari proses tersebut juga disebut sebagai sequence
alignment atau alignment saja.
Baris sekuens dalam suatu alignment diberi sisipan
(umumnya dengan tanda "–") sedemikian rupa sehingga
kolom-kolomnya memuat karakter yang identik atau sama
di antara sekuens-sekuens tersebut.
Berikut adalah contoh alignment DNA dari dua sekuens
pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac"
(tanda "|" menunjukkan kecocokan atau match di antara
kedua sekuens)
Penyejajaran sekuens
ccat-----caac
caatgggcaac
Sequence alignment merupakan metode dasar
dalam analisis sekuens.
Metode ini digunakan untuk mempelajari evolusi
sekuens-sekuens dari leluhur yang sama
(common ancestor).
Ketidakcocokan (mismatch) dalam alignment
diasosiasikan dengan proses mutasi, sedangkan
kesenjangan (gap, tanda "–") diasosiasikan
dengan proses insersi atau delesi.
Sequence alignment memberikan hipotesis atas
proses evolusi yang terjadi dalam sekuens-
sekuens tersebut.
Misalnya, kedua sekuens dalam contoh
alignment di atas bisa jadi berevolusi dari
sekuens yang sama "ccatgggcaac".
Dalam kaitannya dengan hal ini, alignment juga
dapat menunjukkan posisi-posisi yang
dipertahankan (conserved) selama evolusi dalam
sekuens-sekuens protein, yang menunjukkan
bahwa posisi-posisi tersebut bisa jadi penting
bagi struktur atau fungsi protein tersebut.
Selain itu, sequence alignment juga digunakan
untuk mencari sekuens yang mirip atau sama
dalam basis data sekuens.
BLAST adalah salah satu metode alignment yang
sering digunakan dalam penelusuran basis data
sekuens.
BLAST menggunakan algoritma heuristik dalam
penyusunan alignment.
Beberapa metode alignment lain yang merupakan
pendahulu BLAST adalah metode "Needleman-Wunsch"
dan "Smith-Waterman".
Metode Needleman-Wunsch digunakan untuk menyusun
alignment global di antara dua atau lebih sekuens, yaitu
alignment atas keseluruhan panjang sekuens tersebut.
Metode Smith-Waterman menghasilkan alignment lokal,
yaitu alignment atas bagian-bagian dalam sekuens.
Kedua metode tersebut menerapkan
pemrograman dinamik (dynamic programming) dan hanya
efektif untuk alignment dua sekuens (pairwise alignment)
Clustal adalah program bioinformatika untuk alignment
multipel (multiple alignment), yaitu alignment beberapa
sekuens sekaligus. Dua varian utama Clustal adalah
ClustalW dan ClustalX.
Metode lain yang dapat diterapkan untuk
alignment sekuens adalah metode yang
berhubungan dengan Hidden Markov Model
("Model Markov Tersembunyi", HMM).
HMM merupakan model statistika yang mulanya
digunakan dalam ilmu komputer untuk mengenali
pembicaraan manusia (speech recognition).
Selain digunakan untuk alignment, HMM juga
digunakan dalam metode-metode analisis
sekuens lainnya, seperti prediksi daerah
pengkode protein dalam genom dan prediksi
struktur sekunder protein.
Secara kimia/fisika, bentuk struktur protein diungkap dengan
kristalografi sinar-X ataupun spektroskopi NMR, namun kedua
metode tersebut sangat memakan waktu dan relatif mahal.
Sementara itu, metode sekuensing protein relatif lebih mudah
mengungkapkan sekuens asam amino protein.
Prediksi struktur protein berusaha meramalkan struktur tiga
dimensi protein berdasarkan sekuens asam aminonya
(dengan kata lain, meramalkan struktur tersier dan struktur
sekunder berdasarkan struktur primer protein).
Secara umum, metode prediksi struktur protein yang ada
saat ini dapat dikategorikan ke dalam dua kelompok, yaitu
metode pemodelan protein komparatif dan metode
pemodelan de novo.
Prediksi struktur protein
Pemodelan protein komparatif (comparative protein
modelling) meramalkan struktur suatu protein berdasarkan
struktur protein lain yang sudah diketahui.
Salah satu penerapan metode ini adalah pemodelan
homologi (homology modelling), yaitu prediksi struktur
tersier protein berdasarkan kesamaan struktur primer
protein.
Pemodelan homologi didasarkan pada teori bahwa dua
protein yang homolog memiliki struktur yang sangat mirip
satu sama lain.
Pada metode ini, struktur suatu protein (disebut protein
target) ditentukan berdasarkan struktur protein lain (protein
templat) yang sudah diketahui dan memiliki kemiripan
sekuens dengan protein target tersebut.
Selain itu, penerapan lain pemodelan komparatif adalah
protein threading yang didasarkan pada kemiripan
struktur tanpa kemiripan sekuens primer.
Latar belakang protein threading adalah bahwa struktur
protein lebih dikonservasi daripada sekuens protein
selama evolusi; daerah-daerah yang penting bagi fungsi
protein dipertahankan strukturnya.
Pada pendekatan ini, struktur yang paling kompatibel untuk
suatu sekuens asam amino dipilih dari semua jenis struktur
tiga dimensi protein yang ada.
Metode-metode yang tergolong dalam protein threading
berusaha menentukan tingkat kompatibilitas tersebut.
Dalam pendekatan de novo atau ab initio,
struktur protein ditentukan dari sekuens
primernya tanpa membandingkan dengan
struktur protein lain.
Terdapat banyak kemungkinan dalam
pendekatan ini, misalnya dengan menirukan
proses pelipatan (folding) protein dari sekuens
primernya menjadi struktur tersiernya (misalnya
dengan simulasi dinamika molekular), atau
dengan optimisasi global fungsi energi protein.
Prosedur-prosedur ini cenderung membutuhkan proses
komputasi yang intens, sehingga saat ini hanya digunakan
dalam menentukan struktur protein-protein kecil.
Beberapa usaha telah dilakukan untuk mengatasi
kekurangan sumber daya komputasi tersebut, misalnya
dengan:
superkomputer (misalnya superkomputer Blue Gene [1]
dari IBM) atau
komputasi terdistribusi (distributed computing, misalnya
proyek Folding@home) maupun komputasi grid.
Ekspresi gen dapat ditentukan dengan mengukur
kadar mRNA dengan berbagai macam teknik
(misalnya dengan microarray ataupun
Serial Analysis of Gene Expression ["Analisis
Serial Ekspresi Gen", SAGE]).
Teknik-teknik tersebut umumnya diterapkan pada
analisis ekspresi gen skala besar yang mengukur
ekspresi banyak gen (bahkan genom) dan
menghasilkan data skala besar.
Analisis ekspresi gen
Metode-metode penggalian data (data mining)
diterapkan pada data tersebut untuk memperoleh
pola-pola informatif.
Sebagai contoh, metode-metode komparasi
digunakan untuk membandingkan ekspresi di
antara gen-gen, sementara metode-metode
klastering (clustering) digunakan untuk
mempartisi data tersebut berdasarkan kesamaan
ekspresi gen.
Saat ini mata ajaran bioinformatika maupun mata
ajaran dengan muatan bioinformatika sudah
diajarkan di beberapa perguruan tinggi di
Indonesia.
Sekolah Ilmu dan Teknologi Hayati ITB
menawarkan mata kuliah "Pengantar
Bioinformatika" untuk program Sarjana dan mata
kuliah "Bioinformatika" untuk program
Pascasarjana.
Bioinformatika di Indonesia
Fakultas Teknobiologi Universitas Atma Jaya,
Jakarta menawarkan mata kuliah "Pengantar
Bioinformatika".
Mata kuliah "Bioinformatika" diajarkan pada
Program Pascasarjana Kimia Fakultas MIPA
Universitas Indonesia (UI), Jakarta.
Mata kuliah "Proteomik dan Bioinformatika"
termasuk dalam kurikulum program S3
bioteknologi Universitas Gadjah Mada (UGM),
Yogyakarta.
Materi bioinformatika termasuk di dalam silabus
beberapa mata kuliah untuk program sarjana
maupun pascasarjana biokimia,biologi, dan
bioteknologi pada Institut Pertanian Bogor
(IPB). Selain itu, riset-riset yang mengarah pada
bioinformatika juga telah dilaksanakan oleh
mahasiswa program S1 Ilmu Komputer maupun
program pascasarjana biologi serta bioteknologi
IPB. Riset bioinformatika protein dilaksanakan
sebagai bagian dari aktivitas riset rekayasa
protein pada Laboratorium Rekayasa Protein,
Pusat Penelitian Bioteknologi Lembaga Ilmu
Pengetahuan Indonesia (LIPI), Cibinong, Bogor.
Lembaga Biologi Molekul Eijkman, Jakarta,
secara khusus memiliki laboratorium
bioinformatika sebagai fasilitas penunjang
kegiatan risetnya. Selain itu, basis data sekuens DNA
mikroorganisme asli Indonesia sedang
dikembangkan di UI.
Daftar Pustaka
• bioinformatika-q.blogspot.com
• http://www.unpad.ac.id
• http://id.wikipedia.org