analisa suara serak berbasis transformasi wavelet dan
TRANSCRIPT
Analisa Suara Serak Berbasis Transformasi Wavelet dan Jaringan Syaraf Tiruan
Oleh:Luqman Hakim
2209204801
Pembimbing : Achmad Arifin, ST, M.Eng.,Ph.DCo-Pembimbing : Dr. Tri Arief Sardjono, ST, MT
Outline
Pendahuluan- Latar Belakang- Tujuan- Manfaat dan Hasil yang diharapkan- Perumusan Masalah
Metode dan Hasil Kesimpulan
Pendahuluan Latar Belakang Suara serak merupakan salah satu indikator adanya penyakit atau gangguan pada
organ penghasil suara (Larynx)
Diagnosa secara visual, spt: fiberoptic laryngoskop (FoL)
Riset Analisa suara untuk mengidentifikasi penyakit / gangguan pada daerah larynx mulai dilakukan.
Analisa suara manusia dapat menjadi tool yang penting dalam diagnosa dini penyakit pada daerah larynx. (Fonesca,E.S.,dkk:2009;El Imam I.,dkk:2008,Karthikeyan,U.,dkk: 2005)
Transformasi wavelet merupakan tool yang banyak digunakan untuk analisa sinyal alam yang kebanyakan non stasioner dalam domain waktu dan frekuensi secara simultan (Paul,S.E,dkk : 2009)
Jaringan Syaraf Tiruan (JST) merupakan algoritma yang banyak digunakan untuk identifikasi maupun klasifikasi berdasarkan proses pembelajaran ( J.I Godiono, dkk.: 2004)
Ilustrasi Penggunaan Fiberoptic Laringoscop(sumber: Klinik Dr. Cristopher Y. Chang)
visualisasi
Keidaksimultanan getaran TVC menyebabkan suara serak / suara tidak jelas
Ketidaknormalan tsb dapat terjadi karena radang, tonjolan (nodule) atau penyakit lainya
TujuanMengetahui apakah suara normal dan suara serak dapat dianalisa dan diidentifikasi
menggunakan transformasi wavelet dan algoritma jaringan syaraf tiruan
Hasil dan Manfaat Yang DiharapkanHasil yang diharapkan adalah sebuah perangkat lunak yang dapat digunakan untuk
menganalisa dan mengidentifikasi suara serak dan normal secara sistematis
Diharapkan dapat bermanfaat membantu tenaga medis untuk dapat mendeteksi secara dini adanya kelainan / gangguan pada daerah pita suara berdasarkan analisa suara pasien
Perumusan Masalah
Kesulitan mendapatkan sampel suara dari pasien dengan vonis penyakit tertentu dari dokter / rumah sakit lokal.
Sampel suara dari pasien penyakit daerah larynx dari internet juga sangat terbatas.
Sampel suara pasien penyakit tertentu didapat dari klinik Dr.Christopher Y. Chang yang diunggah di websie fauquerent.net .
Sampel suara yang digunakan sebagai objek penelitian baru pada suara serak karena radang tenggorokan karena kelelahan terlalu banyak mengeluarkan suara.
Diambil sampel suara berupa suara vokal “A” “E” “I” “O” “U” saat kondisi normal dan saat kondisi serak.
Metode Blok diagram metode yang dilakukan:
Sampel suara vokalnormal dan serak
(“A” “E” “I” “O” “U”)Dalam format . WAV
Chanal mono frekuensi sampling 44,1 kHz
Pre- Prosesing :- Konversi WAV ke DAT
- Normalisasi- Downsampling
- Pemisahan sinyal suara (Voice )dan bukan suara (non Voice)
Transformasi Wavelet Sinyal Suara :
Continous Wavelet Transform (CWT)Fungsi wavelet morlet
Matrik datasinyal suara
Xn[1.. N]
Karakterisasi sinyal suaranormal dan serak
dari hasil CWT Ternormalisasi
Matrik hasil CWT18 x 50
CWT[18x50]
Identifikasi Jenis Vokal dan Kondisi (Serak / Normal)
dengan algoritmaJaringan Syaraf Tiruan (JST)
Matrik karakterisasisinyal suaracwt[1x900]
Pre- Prosesing (1)
Konversi WAV ke DATFormat WAV merupakan format standar file audio windows tanpa ada kompresi data
Proses konversi WAV ke DAT memanfaatkan komponen audiolab dari mitov.com
Skema penggunaan komponen audiolab pada sistem yang dibuat:
Data audio x [i]i=1,2,..... N
Pre- Prosesing (2)
NormalisasiNormalisasi untuk menyeragamkan nilai amplitudo dari sinyal
sampel .
xnorm [i ]=x [ i ]
∣x (i)max∣
Pre- Prosesing (3)
Pemisahan sinyal suara (voice) dan bukan suara (unvoice) Urutan Langkah :
Mengambil sampel pada durasi unvoice Menghitung moving standar deviasi (setiap 10 ms atau 441 data ).Mencari standar deviasi terbesar dari setiap frame sampel unvoice Membuat threshold dari standar deviasi terbesar
Melakukan framing 10 ms atau per 441 data pada seluruh sinyal Menghitung standar deviasi pada setiap frame membandingkan dengan threshold yang telah dibuat.
Membuat deret logika, nilai 1 jika nilai standar deviasi pada titik tersebut lebih tinggi daripada thershold, sebaliknya berniali 0.
Menentukan titik awal dan akhir sinyal dari deret logika yang terbentuk.
Rumus umum standar deviasi dari sejumlah N data x
σ=√∑i=1
N
(x [ i ]−μ)2
N
Di mana μ=∑i=1
N
x [i ]
N = rata – rata (mean)
Continous Wavelet Transform (CWT)
Desain CWT yang digunakan:skala:
Translasi :
Frekuensi sentral fungsi morlet :
Hasil CWT :
Hasil CWT dapat ditampilkan dg grafik 3 dimensi atau scalogram.
a N=a N−1+δa ; N =2,3 ,... 100a1=0,00005 δa=0,00005
b=durasi sinyal100
ω0=5,33 rad / s atau f 0=0,849 Hz
T a , b=T [100x100]
CW T
Grafik 3D Scalogram
T (a ,b)= 1√a∫−∞
∞
x (t )ψ ' ( t−ba
)dt ψ( t)= 14√π
e j ωot e−t 2
2
f =f 0
a
Analisa Hasil CWT
rata – rata (mean) nilai CWT per skala sepanjang translasi dapat dilihat karakter spektral sinyal suara.
Tingkat stabilitas keberadaan frekuensi sinyal selama durasi pengucapan suara dapat dilihat dari parameter standar deviasi.
Nilai mean CWT per skala dijadikan sebagai nilai karakterisasi masing – masing sampel suara
μa=∑i=1
N b
CWT a [b]
N b
σa=√∑i=1
Nb
(CWT a[ i ]−μa)2
N b
CV a=σaμa
x100
Mean
Standar deviasi
Koefisien Variasi
Matrik karakterisasisinyal suara
[1..100]
Perbandingan Hasil CWT Hasil CWT Sampel Vokal “A” “E” “I” “O” “U”
Perbandingan Hasil CWT Sampel dan Hasil CWT Sampel suara pasien. Sampel suara pasien berupa vokal “I”
Scalogram hasil CWT sampel suara terkena kanker
Scalogram hasil CWT sampel suara terkena nodule
Hasil karakterisasi 5 sampel suara
Hasil karakterisasi 5 sampel suara
Identifikasi Suara Normal dan Serak Menggunakan JST Berdasarkan Hasil CWT
Data Pembelajaran : 50 sampel suara terdiri 5 sampel masing – masing vokal A E I O U normal dan serak
Pembelajaran sampai iterasi ke 4000an
Pengujian :Pengujian dengan data yang
telah dibelajarkan :
100%
Pengujian Online
Suara serak / normal 85%
Penutup Kesimpulan
Saran
Suara serak mempunyai tingkat ketidakstabilan atau variasi nilai CWT setiap skala yang lebih besar dibandingkan dengan suara normal dilihat dari standar deviasi dan koefisien variasi
Pada analisa CWT suara pasien ganguan pita suara, terlihat perbedaan karakter spektral suara dengan satu jenis penyakit dengan penyakit yang lain
Identifikasi suara normal dan serak dapat dilakukan dengan JST dengan input hasil CWT
Diharapkan dalam penelitian berikutnya didapatkan data sampel suara serak atau suara karena gangguan penyakit daerah tenggorokan dari Rumah Sakit atau klinik THT sebagai data referensi.