kontrol optimal berdasarkan pada kalkulus variasi - vanessa sarah griselda
TRANSCRIPT
0
KONTROL OPTIMAL BERDASARKAN PADA
KALKULUS VARIASI
Tugas Akhir
Diajukan untuk memenuhi persyaratan
Sidang Sarjana Matematika
Oleh:
VANESSA SARAH GRISELDA
10104017
PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
INSTITUT TEKNOLOGI BANDUNG
2010
1
PRAKATA
Puji syukur penulis haturkan sedalam-dalamnya ke hadirat Allah SWT yang telah
memberikan limpahan anugerah, bimbingan, dan kekuatan sehingga penulis dapat
menyelesaikan tugas akhir ini sejak Maret 2009 hingga Februari 2010. Tanpa
masukan berharga, kepercayaan, dan dukungan yang diberikan oleh Dr. Janson
Naiborhu selaku pembimbing, maka penulis tidak akan dapat menyelesaikan tugas
akhir ini dengan hasil memuaskan. Penulis berterima kasih sebesar-besarnya kepada
kedua orang tua penulis yang telah memberikan endless support dan courage selama
penulis berkuliah di ITB. Terima kasih penulis sampaikan Dr. Agus Yodi selaku
dosen penguji atas segala pelajaran dan bimbingan dalam tugas akhir ini, serta Dr.
Hanni Garminia selaku dosen penguji tugas akhir dan juga dosen wali selama 5 tahun
terakhir. Tidak lupa penulis berterima kasih kepada Heru Tjahjana atas bantuan
dalam menyelesaikan fundamental codes Matlab untuk hampiran numerik. Pada
akhirnya, penulis ingin mengucapkan terima kasih setulusnya kepada Hutama G.
Soediredja atas seluruh dukungannya setiap hari, setiap saat.
Penulis menyadari bahwa tugas akhir ini masih memiliki beberapa kekurangan. Oleh
karena itu, penulis mengharapkan kritik dan saran yang membangun dari pembaca
untuk perbaikan selanjutnya. Semoga tugas akhir ini dapat bermanfaat bagi kemajuan
ilmu pengetahuan dan bagi siapapun yang membacanya.
Bandung, Februari 2010
Penulis
2
ABSTRAK
Kontrol Optimal berhubungan dengan permasalahan dalam menentukan hukum
kontrol untuk suatu sistem sehingga kriteria keoptimalan tertentu dapat terpenuhi.
Permasalahan kontrol optimal melibatkan fungsi biaya yang merupakan fungsional
atas state dan variabel kontrol. Kontrol optimal adalah himpunan dari persamaan
diferensial yang merupakan lintasan dari variabel kontrol yang meminimalkan fungsi
biaya. Dalam tugas akhir ini, Pontryaginβs Maximum Principle digunakan untuk
menurunkan hukum kontrol dan solusi umum diperoleh dengan menerapkan
pendekatan Kalkulus Variasi. Lebih jauh lagi, beberapa permasalahan kontrol optimal
sederhana serta solusi analitik telah ditampilkan. Selain itu, algoritma Steepest
Descent digunakan sebagai hampiran numerik bagi solusi optimal.
3
ABSTRACT
Optimal Control deals with the problem of finding a control law for a given system
such that a certain optimality criterion is achieved. A control problem includes a cost
functional that is a function of state and control variables. An optimal control is a set
of differential equations describing the paths of the control variables that minimize
the cost functional. In this final project, Pontryaginβs Maximum Principle is used for
deriving control policies and general solutions are obtained by using Calculus of
Variations approach. Furthermore, several simple optimal control problems and their
analytical solutions are presented. In addition, Steepest Descent algorithm is being
used as numerical approach to optimal solutions.
4
BAB 1
PENDAHULUAN
1.1. Latar Belakang
Sebagian besar sistem dalam bidang fisika, kimia, biologi, dan ekonomi dapat
dimodelkan dengan persamaan matematika, salah satu bentuknya adalah model
persamaan diferensial stokastik atau deterministik. Keadaan dari sistem-sistem ini
kemudian mengalami perubahan nilai terhadap waktu atau variabel bebas lainnya,
tergantung pada persamaan dinamik tertentu. Lebih jauh lagi, sistem-sistem ini akan
membawa satu state ke state yang lainnya dengan cara menerapkan beberapa input
dari luar sistem, atau disebut juga kontrol input. Jika hal ini dapat dilakukan, maka
ada beberapa cara yang berbeda untuk mencapai nilai tertentu. Dan jika demikian,
maka ada cara yang terbaik di antara seluruh cara yang memungkinkan. Input yang
menghasilkan cara terbaik ini disebut kontrol optimal. Untuk mengukur seberapa baik
cara tersebut, digunakan indeks performa atau fungsi biaya sebagai parameter.
1.2. Rumusan Masalah
Bentuk umum dari permasalahan kontrol optimal diberikan sebagai berikut. Sistem
dinamik nonlinear dideskripsikan dalam bentuk persamaan diferensial
π₯ (π‘) = π π₯ π‘ , π’ π‘ , π‘ (1.2.1)
dengan state π₯(π‘) β πΉπ , kontrol input π’(π‘) β πΉπ , dan indeks performa
5
π½(π‘) = π π₯ π ,π + πΏ π₯ π‘ , π’ π‘ , π‘ ππ‘π
π‘0 (1.2.2)
dimana :
π‘0 adalah waktu awal (tetap),
π adalah waktu akhir (bebas),
πΏ π₯ π‘ , π’ π‘ , π‘ adalah fungsi biaya pada selang waktu antara [π‘0, π] ,
π π₯ π ,π adalah fungsi biaya pada waktu akhir yang bergantung hanya pada π dan
π₯(π).
Permasalahan kontrol optimal adalah untuk mencari input π’β π‘ pada selang waktu
[π‘0, π] yang membawa persamaan (1.2.1) sepanjang lintasan π₯β π‘ sehingga nilai dari
indeks performa (1.2.2) menjadi minimal, dan
π π₯ π ,π = 0 (1.2.3)
dimana π π₯ π , π merupakan fungsi pembatas pada state akhir dengan π β πΉπ
diberikan.
1.3. Tujuan
Tujuan dari tugas akhir ini adalah menurunkan kondisi keoptimalan bagi
permasalahan kontrol optimal dengan menggunakan pendekatan kalkulus variasi.
Kondisi keoptimalan yang diperoleh bersifat umum, oleh karena itu penulis akan
menerapkannya pada beberapa sistem kontrol optimal sederhana sebagai gambaran
khusus. Lebih jauh lagi, dengan menggunakan kondisi keoptimalan tersebut akan
ditentukan solusi analitik dan numerik bagi beberapa permasalahan.
6
1.4. Batasan Masalah
Dalam tugas akhir ini, penulis memfokuskan permasalahan pada sistem kontrol yang
kontinu. Lebih jauh lagi, pembahasan hanya terfokus pada sistem deterministik,
bukan pada sistem stokastik.
1.5. Sistematika Penulisan
Tugas akhir ini dibagi menjadi beberapa bab. Bab I menjelaskan tentang latar
belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penulisan dari
tugas akhir. Pada bab II dijelaskan pemaparan mengenai kontrol optimal dan kalkulus
variasi, serta bagaimana menentukan kondisi keoptimalan bagi sistem kontinu. Bab
III menyajikan tentang penerapan teori kontrol optimal dalam sistem nonlinear
sederhana dan penentuan solusi analitik serta numerik atas beberapa permasalahan.
Pada Bab IV, penulis memberikan kesimpulan atas tugas akhir ini.
7
BAB 2
KONTROL OPTIMAL BERDASARKAN PADA
KALKULUS VARIASI
Titik berat dari kontrol optimal adalah menentukan kontrol input π’β π‘ (tanda (*)
menandakan kondisi optimal) yang akan membawa suatu proses (plant) π₯ (π‘) dari
state awal ke state akhir yang memenuhi kondisi batas dan mengekstrimkan
(memaksimumkan atau meminimumkan) indeks performa π½.
Gambar 2.1 Permasalahan Kontrol Optimal
8
Terdapat dua metode yang umum digunakan untuk mencari kontrol input. Metode
pertama adalah metode dynamic programming yang dikembangkan oleh R.E.
Bellman, sedangkan metode kedua menggunakan Maximum Principle yang
dikemukakan oleh L.S. Pontryagin. Pontryagin Maximum Principle menyatakan
bahwa lintasan state yang optimal π₯β , kontrol optimal π’β , dan faktor pengali
Lagrange yang bersesuaian πβ harus meminimumkan Hamiltonian. Pada tugas akhir
ini, pendekatan kalkulus variasi berdasarkan Pontryagin Maximum Principle akan
digunakan untuk menurunkan kondisi keoptimalan.
Dalam penurunan kondisi keoptimalan akan disinggung mengenai permasalahan
meminimalkan indeks performa dengan cara mencari variasi pertama dari fungsional
tertentu. Oleh karena itu, penulis merasa perlu untuk memaparkan beberapa konsep
dasar dari kalkulus variasi yang berguna untuk mencari kondisi keoptimalan.
2.1. Kalkulus Variasi
Definisi 1 : Suatu variabel π₯ dikatakan fungsi atas π‘ , dituliskan π₯(π‘) , jika peta
(range) dari setiap nilai π‘ berkorespondensi dengan suatu nilai π₯.
Definisi 2 : Suatu variabel π½ dikatakan fungsional atas fungsi π π₯ , dituliskan
π½ = π½ π π₯ , jika untuk setiap fungsi π(π₯) berkorespondensi suatu nilai π½.
Definisi 3 : Jika π dan π + βπ adalah elemen-elemen dimana fungsi π terdefinisi,
maka increment dari fungsi π, dinotasikan dengan βπ, adalah
βπ β π π + βπ β π(π)
βπ bergantung pada π dan βπ, untuk lebih eksplisit, notasikan βπ(π, βπ).
9
Definisi 4 : Jika π₯ dan π₯ + πΏπ₯ adalah fungsi-fungsi dimana fungsional π½ terdefinisi,
maka increment dari fungsional π½, dinotasikan βπ½, adalah
βπ½ β π½ π₯ + πΏπ₯ β π½(π₯)
Untuk lebih eksplisit, notasikan βπ½(π₯, πΏπ₯), sedangan πΏπ₯ disebut variasi dari fungsi π₯.
Definisi 5 : Misalkan increment pada fungsi π saat π‘β dideskripsikan sebagai
βπ β π π‘β + βπ‘ β π(π‘β)
Dengan mengekspansi π π‘β + βπ‘ dengan deret Taylor di sekitar π‘β, diperoleh
βπ = π π‘β + ππ
ππ‘ ββπ‘ +
1
2! π2π
ππ‘2 β
βπ‘ 2 + β¦ β π(π‘β)
dimana
ππ
ππ‘ ββπ‘ = π π‘β βπ‘ = ππ
ππ disebut diferensial atas fungsi π pada titik π‘β, sedangkan π π‘β adalah turunan
atau slope dari π pada titik π‘β. Dengan kata lain, diferensial ππ adalah aproksimasi
orde pertama (linear) terhadap increment βπ.
10
Gambar 2.1.1 Increment βπ, Diferensial ππ, dan Turunan π dari Fungsi π(π‘)
Definisi 6 : Misalkan increment pada fungsional π½ dideskripsikan sebagai
βπ½ β π½ π₯ π‘ + πΏπ₯ π‘ β π½(π₯(π‘)
dengan mengekspansi π½ π₯ π‘ + πΏπ₯ π‘ menggunakan deret Taylor, diperoleh
βπ½ = π½ π₯ π‘ +ππ½
ππ₯πΏπ₯ π‘ +
1
2!
π2π½
ππ₯2 πΏπ₯ π‘
2+ β¦β π½ π₯ π‘
=ππ½
ππ₯πΏπ₯ π‘ +
1
2!
π2π½
ππ₯2 πΏπ₯ π‘
2+ β¦
= πΏπ½ + πΏ2π½ + β―
dimana,
πΏπ½ =ππ½
ππ₯πΏπ₯ π‘ dan πΏ2π½ =
1
2!
π2π½
ππ₯2 πΏπ₯ π‘
2
11
disebut variasi pertama dan variasi kedua dari fungsional π½ . Variasi πΏπ½ adalah
aproksimasi orde pertama (linear) dari increment βπ½.
Gambar 2.1.2 Increment βπ½ dan Variasi Pertama πΏπ½ dari Fungsional π½
Lema 1 : Hubungan antara variasi dan diferensial
Misalkan π₯(π‘) adalah fungsi kontinu dalam waktu π‘ , dan diferensial ππ₯(π‘) dan ππ‘
tidak independen. Namun dapat didefinisikan perubahan kecil dalam π₯(π‘) yang
independen terhadap ππ‘ . Definisikan variasi dalam π₯(π‘) , yaitu πΏπ₯(π‘) , sebagai
perubahan (increment) dalam π₯(π‘) saat π‘ dibuat tetap.
Untuk mengilustrasikan hubungan antara ππ₯, πΏπ₯, dan ππ‘, dapat diperhatikan gambar
berikut.
12
Gambar 2.1.2 Hubungan antara Variasi πΏπ₯ dan Diferensial ππ₯
Pada gambar ditunjukkan fungsi asal π₯(π‘) dan fungsi yang bertetangga π₯ π‘ + ππ₯(π‘)
dalam selang [π‘0, π].
Hubungan antara variasi πΏπ₯ dan diferensial ππ₯ dinyatakan dalam persamaan berikut
ππ₯ π = πΏπ₯ π + π₯ π ππ (2.1.1)
Lema 2 : Aturan Leibniz untuk fungsional
Jika π₯(π‘) β πΉπ adalah fungsi dari π‘ dan π½ π₯ = β π₯ π‘ , π‘ ππ‘π
π‘0 maka
ππ½ = β π₯ π ,π ππ β β π₯ π‘0 , π‘0 ππ‘0 + βπ₯π(π₯ π‘ , π‘)πΏπ₯(π‘) ππ‘
π
π‘0
dengan notasi
βπ₯ βπβ
ππ₯
13
Definisi 7 : Suatu fungsional π½ dikatakan memiliki nilai optimum relatif di π₯β jika
terdapat suatu π sehingga untuk setiap fungsi π₯ dalam domain Ξ© memenuhi π₯ β
π₯β < π . Dengan kata lain, jika
βπ½ = π½ π₯ β π½(π₯β) β₯ 0
maka π½(π₯β) adalah nilai minimum relatif. Dan sebaliknya, jika
βπ½ = π½ π₯ β π½(π₯β) β€ 0
maka π½(π₯β) adalah nilai maksimum relatif. Jika hubungan di atas terpenuhi untuk π
yang cukup besar, maka π½(π₯β) adalah nilai optimum global.
Teorema 1 : Teorema Dasar Kalkulus Variasi
Supaya suatu nilai π₯β(π‘) menjadi suatu nilai yang optimum, variasi pertama dari π½
harus bernilai 0 pada saat π₯β(π‘), dalam hal ini πΏπ½(π₯β π‘ , πΏπ₯ π‘ ) = 0, untuk semua
nilai yang memungkinkan dari πΏπ₯ π‘ .
2.2. Kontrol Optimal Berdasarkan pada Kalkulus Variasi
Tinjau sistem dinamik nonlinear (1.2.1)
π₯ (π‘) = π π₯ π‘ , π’ π‘ , π‘
dengan indeks performa (1.2.2)
π½(π‘0) = π π₯ π ,π + πΏ π₯ π‘ , π’ π‘ , π‘ ππ‘π
π‘0
serta fungsi pembatas pada state akhir (1.2.3)
π π₯ π ,π = 0
14
Berikut akan diturunkan kondisi yang diperlukan untuk keoptimalan dengan
menerapkan kalkulus variasi terhadap indeks performa yang merupakan subjek bagi
fungsi pembatas (1.2.1) dan (1.2.3).
Untuk mendekatkan fungsi pembatas (1.2.1) dan (1.2.3) dengan indeks performa
maka persamaan (1.2.2) dimodifikasi dengan faktor pengali Lagrange. Karena
π₯ (π‘) = π π₯ π‘ , π’ π‘ , π‘ berlaku untuk setiap π‘ β [π‘0, π] maka dibutuhkan faktor
pengali Lagrange yang bersesuaian, yaitu π(π‘) β πΉπ yang merupakan fungsi dalam π‘.
Sedangkan untuk π π₯ π ,π yang hanya berlaku saat π , faktor pengali Lagrange
yang bersesuaian adalah π£ β πΉπ .
Modifikasi indeks performa (1.2.2) dengan menggunakan faktor pengali Lagrange
tersebut dan diperoleh
π½ = π π₯ π , π + π£ππ π₯ π ,π
+ [πΏ π₯ π‘ , π’ π‘ , π‘ +ππ(π‘) π π₯ π‘ , π’ π‘ , π‘ β π₯ (π‘) ]ππ‘π
π‘0 (2.2.1)
Definisikan Hamiltonian π»(π₯ π‘ , π’ π‘ , π‘) untuk mendekatkan fungsi biaya dengan
fungsi pembatas
π» π₯ π‘ , π’ π‘ , π‘ = πΏ π₯ π‘ , π’ π‘ , π‘ + πππ(π₯ π‘ , π’ π‘ , π‘) (2.2.2)
Indeks performa (2.2.1) dapat dituliskan ulang sebagai
π½ = π π₯ π ,π + π£ππ π₯ π ,π + [π» π₯ π‘ , π’ π‘ , π‘ β πππ₯ (π‘)]ππ‘π
π‘0 (2.2.3)
Untuk menerapkan kondisi yang diperlukan bagi keoptimalan, dalam hal ini πΏπ½ = 0,
terlebih dahulu perlu dihitung variasi πΏπ½ . Dengan menggunakan aturan Leibniz pada
Lema 2 dan dengan mengasumsikan variasi independen dalam πΏπ’( ),πΏπ₯ ,πΏπ£, πΏπ,
dan πΏπ‘ diperoleh variasi pertama dari persamaan (2.2.3), yaitu
15
πΏπ½ = ππ₯ π₯ π ,π + ππ₯π π₯ π ,π π£ ππ₯(π) + ππ‘ π₯ π ,π + ππ‘
π π₯ π ,π π£ ππ
+ππ π₯ π ,π ππ£ + π» β ππ π π₯ (π) ππ β π» β ππ π‘0 π₯ (π‘0) ππ‘0
+ π»π₯ππΏπ₯ π‘ + π»π’
ππΏπ’ π‘ β ππ π‘ πΏπ₯ π‘ + (π»ππ β π₯ π π‘ πΏπ(π‘) ππ‘
π‘π
π‘0
Disusun ulang menjadi
πΏπ½ = ππ₯ π₯ π , π + ππ₯π π₯ π ,π π£ ππ₯ π
+ ππ‘ π₯ π ,π + ππ‘π π₯ π ,π π£ + π» β ππ π π₯ π ππ + ππ π₯ π ,π ππ£
β π» β ππ π‘0 π₯ π‘0 ππ‘0
+ π»π₯ππΏπ₯ π‘ + π»π’
ππΏπ’ π‘ β ππ π‘ πΏπ₯ π‘ + (π»ππ β π₯ π π‘ πΏπ(π‘) ππ‘
π‘ππ‘0
(2.2.4)
Dengan menggunakan pengintegralan parsial untuk ππ π‘ πΏπ₯ π‘ ππ‘π
π‘0,
penyederhanaan pada variasi π₯ dapat dilakukan.
β ππ π‘ πΏπ₯ π‘ ππ‘π
π‘0= βππ π πΏπ₯ π + ππ π‘0 πΏπ₯ π‘0 + π π π‘ πΏπ₯ π‘
π
π‘0ππ‘ (2.2.5)
Berdasarkan persamaan (2.1.1), hubungan antara variasi πΏπ₯ dan diferensial ππ₯ adalah
πΏπ₯ π‘ = ππ₯ π‘ β π₯ π‘ ππ‘
dimana π₯(π‘) fungsi kontinu atas π‘ , serta turunan ππ₯(π‘) dan ππ‘ saling
bergantung. πΏπ₯(π‘) adalah variasi dari π₯(π‘) , increment kecil dalam π₯(π‘) saat π‘
dianggap tetap, yang saling bebas dengan ππ‘. Term dalam π‘ = π bergantung pada
ππ₯(π‘) dan ππ.
πΏπ₯ π didefinisikan dalam ππ₯ π dan ππ, begitu pula dengan πΏπ₯ π‘0 didefinisikan
dalam ππ₯ π‘0 dan ππ‘0, menjadi
βππ π πΏπ₯ π = βππ π ππ₯ π + ππ π π₯ π ππ (2.2.6)
16
ππ π‘0 πΏπ₯ π‘0 = ππ π‘0 ππ₯ π‘0 β ππ π‘0 π₯ π‘0 ππ‘0 (2.2.7)
Substitusikan persamaan (2.2.6) dan (2.2.7) ke persamaan (2.2.5), maka akan
diperoleh
β ππ π‘ πΏπ₯ π‘ ππ‘π
π‘0
= βππ π ππ₯ π + ππ π π₯ π ππ + ππ π‘0 ππ₯ π‘0
βππ π‘0 π₯ π‘0 ππ‘0 + π π π‘ πΏπ₯ π‘ π
π‘0ππ‘ (2.2.8)
Kemudian substitusikan penyederhanaan pada persamaan (2.2.8) ke persamaan
(2.2.4).
πΏπ½ = ππ₯ π₯ π ,π + ππ₯π π₯ π ,π π£ β ππ π ππ₯ π
+ ππ‘ π₯ π , π + ππ‘π π₯ π , π π£ + π» β ππ π π₯ π + ππ π π₯ π ππ
+ππ π₯ π ,π ππ£ β π» β ππ π‘0 π₯ π‘0 + ππ π‘0 π₯ π‘0 ππ‘0 + ππ π‘0 ππ₯ π‘0
+ (π»π₯π + π π π‘ )πΏπ₯ π‘ + π»π’
ππΏπ’ π‘ + (π»ππ β π₯ π π‘ )πΏπ(π‘) ππ‘
π‘π
π‘0
Disederhanakan kembali menjadi
πΏπ½ = ππ₯ π₯ π ,π + ππ₯π π₯ π , π π£ β ππ π ππ₯ π + ππ π₯ π ,π ππ£
+ ππ‘ π₯ π , π + ππ‘π π₯ π ,π π£ + π» ππ β π»ππ‘0 + ππ π‘0 ππ₯ π‘0
+ (π»π₯π + π π π‘ )πΏπ₯ π‘ + π»π’
ππΏπ’ π‘ + (π»ππ β π₯ π π‘ )πΏπ(π‘) ππ‘
π‘π
π‘0
Berdasarkan teori Lagrange, nilai minimum (ekstremum) dari π½ dicapai pada keadaan
yang sama dengan nilai minimum dari π½ , yaitu saat πΏπ½ = 0. Untuk memenuhi keadaan
ini, nilai-nilai dari semua koefisien pada increment bebas πΏπ, ππ£, πΏπ’, πΏπ, πΏπ₯ π , πΏπ₯(π‘)
dijadikan 0.
17
ππ£ = 0 β ππ π₯ π ,π = 0
πΏπ = 0 β π»ππ β π₯ π π‘ = 0
π₯ π‘ =ππ»
ππ π‘ = π
πΏπ₯ = 0 β π»π₯π + π π π‘ = 0
π π‘ = βππ»
ππ₯
πΏπ’ = 0 β 0 = π»π’π =
ππ»
ππ’
ππ₯ π = 0 β ππ₯ π₯ π ,π + ππ₯π π₯ π ,π π£ β ππ π = 0
ππ₯ π₯ π ,π β ππ π = ππ₯π π₯ π ,π π£
ππ = 0 β ππ‘ π₯ π ,π + ππ‘π π₯ π , π π£ + π» = 0
π» + ππ‘ π₯ π ,π = βππ‘π π₯ π ,π π£
18
Tabel 1 Syarat keoptimalan bagi fungsi kontinu
Persamaan Variasi
Model
Pertumbuhan
Sistem
π₯ (π‘) = π π₯ π‘ , π’ π‘ , π‘
π‘ β₯ π‘0, π‘0 π‘ππ‘ππ
Indeks Performa
π½(π‘0) = π π₯ π ,π + πΏ π₯ π‘ , π’ π‘ , π‘ ππ‘π‘π
π‘0
Fungsi pembatas
bagi state akhir
π π₯ π , π = 0
ππ£
Persamaan State
π₯ π‘ =ππ»
ππ π‘
πΏπ
Persamaan
Costate
π π‘ = βππ»
ππ₯
πΏπ₯
Kondisi
Kestasioneran
Input
ππ»
ππ’= 0
πΏπ’
Kondisi Pembatas
pada waktu akhir
ππ₯ π₯ π ,π + ππ₯π π₯ π , π π£ β ππ π ππ₯ π
+ ππ‘ π₯ π ,π + ππ‘π π₯ π ,π π£ + π» ππ = 0
ππ₯(π)
ππ
19
BAB 3
APLIKASI KONTROL OPTIMAL
DALAM SISTEM KONTINU
3.1. Prinsip Hamilton dalam Dinamika Klasik
Dinamika klasik adalah salah satu cabang ilmu Mekanika klasik, yang mempelajari
ilmu fisika tentang gaya yang bekerja pada benda. Dinamika partikel dideskripsikan
oleh hukum-hukum Newton tentang gerak, terutama oleh hukum kedua Newton.
Hukum ini menyatakan, "Sebuah benda yang memperoleh pengaruh gaya atau
interaksi akan bergerak sedemikian rupa sehingga laju perubahan waktu dari
momentum sama dengan gaya tersebut".
Jika ditinjau gerak partikel pada suatu permukaan bidang, dapat diperhatikan bahwa
diperlukan adanya gaya tertentu yakni gaya konstrain yang berperan mempertahankan
kontak antara partikel dengan permukaan bidang. Namun tak selamanya gaya
konstrain yang beraksi terhadap partikel dapat diketahui. Pendekatan Newtonian
memerlukan informasi gaya total yang bekerja pada partikel. Gaya total ini
merupakan total dari keseluruhan gaya yang beraksi pada partikel, termasuk juga
gaya konstrain. Oleh karena itu, jika dalam kondisi khusus terdapat gaya yang tidak
dapat diketahui, maka pendekatan Newtonian tidak berlaku, sehingga diperlukan
pendekatan baru dengan meninjau kuantitas fisis lain yang merupakan karakteristik
partikel, misal energi totalnya. Pendekatan ini dilakukan dengan menggunakan
prinsip Hamilton, dimana persamaan Lagrange dapat diturunkan dari prinsip tersebut.
20
Prinsip Hamilton untuk sistem konservatif yang seringkali ditemukan dalam fisika
klasik menyatakan bahwa βDari seluruh lintasan yang mungkin bagi sistem dinamik
untuk berpindah dari satu titik ke titik lain dalam interval waktu spesifik (konsisten
dengan sembarang konstrain), lintasan nyata yang diikuti sistem dinamis adalah
lintasan yang meminimumkan integral waktu selisih antara energi kinetik dengan
energi potensial.β (Marion 1965).
Sesuai dengan prinsip Hamiltonian, persamaan gerak partikel yang dinyatakan oleh
persamaan Lagrange dapat diperoleh dengan meninjau energi kinetik dan energi
potensial partikel tanpa perlu meninjau gaya yang beraksi pada partikel. Energi
kinetik partikel dalam koordinat kartesian adalah fungsi dari kecepatan, energi
potensial partikel yang bergerak dalam medan gaya konservatif adalah fungsi dari
posisi.
Lebih jauh lagi, Lagrangian didefinisikan sebagai selisih antara energi kinetik dan
energi potensial. Dari prinsip Hamilton, dapat diturunkan persamaan Lagrange
dengan menggunakan kondisi kestasioneran. Persamaan Lagrange merupakan
persamaan gerak partikel sebagai fungsi dari koordinat, kecepatan, dan waktu.
Fungsi Lagrangian terhadap waktu merupakan konsekuensi dari fungsi konstrain
terhadap waktu atau dikarenakan persamaan transformasi yang menghubungkan
koordinat kartesian dan koordinat umum memuat fungsi atas waktu.
a. Persamaan Gerak Lagrange
Persamaan Lagrange untuk pergerakan dapat diturunkan dari Prinsip Hamilton
dengan mendefinisikan
π β vektor koordinat,
21
π’ = π β vektor kecepatan,
π(π) β energi potensial,
π(π, π’) β energi kinetik,
πΏ π, π’ β π π, π’ β π(π) , Lagrangian dari sistem.
Model pertumbuhan dideskripsikan dengan
π = π’ β π(π, π’) (3.1.1)
dimana fungsi π diberikan oleh bagian fisika dari permasalahan. Untuk mencari
lintasan gerak, prinsip Hamilton mengatakan bahwa indeks performa berikut
harus diminimalkan
π½ 0 = πΏ π, π’ ππ‘π
0 (3.1.2)
dengan Hamiltonian
π» = πΏ + πππ’ (3.1.3)
Berdasarkan tabel keoptimalan, untuk meminimalkan indeks performa maka
kondisi-kondisi berikut harus dipenuhi
βπ =ππ»
ππ=
ππΏ
ππ (3.1.4)
0 =ππ»
ππ’=
ππΏ
ππ’+ π (3.1.5)
Setelah mengkombinasikan kedua persamaan di atas diperoleh Persamaan Gerak
Lagrange
ππΏ
ππβ
π
ππ‘
ππΏ
ππ = 0 (3.1.6)
22
Perlu ditekankan bahwa dalam konteks ini, persamaan costate dan kondisi
kestasioneran ekivalen dengan Persamaan Lagrange. Dalam konteks yang lebih
umum dari permasalahan variasi, persamaan di atas disebut Persamaan Euler.
Persamaan costate dan kondisi kestasioneran pada tabel keoptimalan adalah
formulasi alternatif dari persamaan Euler.
b. Persamaan Gerak Hamilton
Jika vektor momentum didefinisikan dengan
π = βππΏ
ππ (3.1.7)
maka persamaan gerak dapat dituliskan dalam bentuk Hamiltonian dengan
π =ππ»
ππ (3.1.8)
βπ =ππ»
ππ (3.1.9)
Jadi, dalam permasalahan kontrol optimal, persamaan state dan costate adalah
generalisasi dari Persamaan Gerak Hamilton.
23
3.2. Jarak Terdekat antara Dua Titik
Persamaan panjang kurva π₯(π‘) yang bergantung pada parameter π‘ dengan π β€ π‘ β€ π
diberikan oleh
π½ = 1 + π₯ 2(π‘)π
πππ‘ (3.2.1)
Untuk menyatakan bahwa kurva π₯(π‘) menghubungkan dua titik di bidang, π, π΄ dan
(π, π΅), maka perlu ditetapkan kondisi-kondisi batas berikut
π₯ π = π΄ (3.2.2)
π₯ π = π΅ (3.2.3)
Berikutnya, akan dicari kurva π₯(π‘) yang menghubungkan π, π΄ dan (π, π΅) serta
meminimalkan π½.
Model pertumbuhan didefinisikan dengan
π₯ = π’ (3.2.4)
dan π½ jika dituliskan dalam π’ akan menjadi
π½ = 1 + π’2π
πππ‘ (3.2.5)
dengan Hamiltonian
π» = 1 + π’2 + ππ’ (3.2.6)
Tabel keoptimalan memberikan kondisi
π₯ = π»π = π’ (3.2.7)
βπ = π»π₯ = 0 (3.2.8)
24
0 = π»π’ = π +π’
1 + π’2 (3.2.9)
Untuk mencari π’ yang optimal, dari persamaan terakhir diperoleh
π’ =π
1 + π2 (3.2.10)
namun dari persamaan (3.2.8) diketahui bahwa π konstan, dengan demikian maka π’
yang bernilai konstan merupakan solusi optimal.
Kurva π₯(π‘) yang optimal memiliki persamaan
π₯ π‘ = π1π‘ + π2 (3.2.11)
Untuk mencari nilai π1 dan π2 dapat digunakan kondisi batas yang telah ditetapkan
sebelumnya, dan diperoleh
π₯ π‘ = π΄ β π΅ π‘ + ππ΅ β ππ΄
π β π (3.2.12)
yang merupakan persamaan garis lurus sebagai lintasan optimal antara dua titik.
3.3. Kontrol Temperatur dalam Ruangan
Misalkan suatu keadaan dimana dibutuhkan energi seminimal mungkin untuk
memanaskan ruangan. Jika π(π‘) adalah temperatur ruangan pada saat π‘ , ππ adalah
temperatur udara di luar ruangan (konstan), dan π’(π‘) adalah laju perubahan
temperatur ke dalam ruangan, maka model dinamiknya adalah
π = βπ π β ππ + ππ’ (3.3.1)
untuk suatu konstanta π dan π, yang bergantung pada redaman panas di ruangan, dan
sebagainya. Dengan menuliskan state sebagai
25
π₯ π‘ β π π‘ β ππ (3.3.2)
persamaan state dapat pula dinyatakan dengan
π₯ = βππ₯ + ππ’ (3.3.3)
Untuk mengontrol temperatur ruangan pada suatu interval waktu tetap [0, π] dengan
energi seminimal mungkin, definisikan indeks performa sebagai berikut
π½ 0 =1
2 π’2 π‘ ππ‘
π
0 (3.3.4)
Hamiltonian yang digunakan adalah
π» =π’2
2+ π βππ₯ + ππ’ (3.3.5)
Berdasarkan tabel keoptimalan, kontrol optimal π’(π‘) dapat ditentukan dengan
menyelesaikan
π₯ = π»π = βππ₯ + ππ’ (3.3.6)
π = βπ»π₯ = ππ (3.3.7)
0 = π»π’ = π’ + ππ (3.3.8)
Kondisi kestasioneran mengatakan bahwa kontrol optimal diberikan oleh
π’ π‘ = βππ(π‘) (3.3.9)
sehingga untuk menetukan π’β(π‘) diperlukan untuk mencari costate yang optimal
πβ(π‘) terlebih dahulu.
Substitusikan (3.3.9) ke (3.3.6) dan diperoleh persamaan state dan costate
π₯ = βππ₯ β π2π (3.3.10a)
26
π = ππ (3.3.10b)
yang harus diselesaikan untuk πβ(π‘) dan lintasan state yang optimal π₯β(π‘).
Walaupun final costate π(π) belum diketahui, namun persamaan di atas dapat
diselesaikan dengan mengasumsikan π(π) telah diketahui. Solusi untuk (3.3.10b)
adalah
πβ π‘ = πβπ πβπ‘ π(π) (3.3.11)
dan dengan menggunakan hasil ini untuk (3.3.10a), diperoleh
π₯ = βππ₯ β π2π(π)πβπ(πβπ‘) (3.3.12)
Terapkan transformasi Laplace pada persamaan ini, dan dihasilkan
π π =π₯(0)
π + πβ
π2π(π)πβππ
π + π (π β π)
=π₯(0)
π + πβ
π2
ππ π πβππ
β12
π + π+
12
π β π (3.3.13)
sehingga
π₯β π‘ = π₯ 0 πβππ βπ2
ππ π πβππ sinh ππ‘ (3.3.14)
Persamaan (3.3.11) dan (3.3.14) memberikan costate yang optimal πβ(π‘) dan state
yang optimal π₯β(π‘) dengan catatan bahwa final costate π(π) belum diketahui. State
awal π₯ 0 diberikan.
Lebih jauh lagi, objektif dari permasalahan kontrol perlu diklasifikasikan menjadi dua
kasus, yang masing-masing akan memberikan nilai π(π).
27
a. State Akhir Tetap
Misalkan temperatur awal ruangan sama dengan ππ = 60ΠΎ. Kemudian
π₯ 0 = 0ΠΎ (3.3.15)
Diasumsikan bahwa objektif dari permasalahan kontrol adalah untuk membawa
temperatur akhir π(π) tepat ke 70ΠΎ selama π detik, sehingga state akhir bernilai
tetap yaitu
π₯ π = 10ΠΎ (3.3.16)
Karena waktu akhir dan state akhir keduanya bernilai tetap, maka ππ dan ππ₯(π)
keduanya bernilai 0, dan kondisi batas (pada tabel keoptimalan) terpenuhi.
Dengan menggunakan persamaan (3.3.15) dan (3.3.16) akan ditentukan π(π) ;
kemudian akan dicari π(π‘) dengan menggunakan persamaan (3.3.11) dan mencari
kontrol optimal dengan memakai persamaan (3.3.9). Untuk mencari π(π) ,
gunakan persamaan (3.3.14) untuk mendapatkan
π₯ π = π₯ 0 πβππ βπ2
2ππ π 1 β πβ2ππ (3.3.17)
Substitusikan persamaan (3.3.15) dan (3.3.16) dan diperoleh final costate
π π = β20π
π2 1 β πβ2ππ (3.3.18)
maka lintasan costate yang optimal adalah
πβ π‘ = β10ππππ‘
π2 sinh ππ (3.3.19)
28
dan akhirnya laju perubahan temperatur yang optimal diberikan oleh (3.3.9) atau
π’β π‘ =10ππππ‘
π sinh ππ 0 β€ π‘ β€ π (3.3.20)
Untuk memeriksa solusi, terapkan π’β π‘ ke dalam sistem (3.3.3). Kemudian
selesaikan untuk lintasan state, diperoleh
π₯β π‘ = 10sinh ππ‘
sinh ππ (3.3.21)
π₯β π‘ = 10
sesuai dengan hasil yang diharapkan.
b. State Akhir Bebas
Misalkan state akhir tidak ditetapkan bernilai 10ΠΎ seperti kasus sebelumnya.
Yang diharapkan adalah fungsi kontrol π’(π‘) meminimalkan
π½ 0 =1
2π (π₯ π β 10)2 +
1
2 π’2 π‘ ππ‘
π
0
(3.3.22)
untuk suatu bobot π (misal π β πΉ) yang dipilih kemudian. Jika nilai π cukup
besar, maka solusi optimal akan memiliki nilai π₯(π) mendekati 10ΠΎ , karena
berikutnya term pertama akan berkontribusi kecil terhadap biaya.
Berdasarkan tabel keoptimalan, persamaan state dan costate diberikan oleh
(3.3.10), dan kontrol optimal oleh (3.3.9). Dengan demikian, (3.3.11) dan (3.3.14)
tetap valid.
Kondisi awal tetap diberikan oleh (3.3.15), namun kondisi akhir harus ditentukan
dengan menggunakan kondisi batas. Waktu akhir π bernilai tetap, sehingga
29
ππ = 0 dan term ke dua dari kondisi batas (pada tabel) otomatis bernilai 0.
Karena π₯(π) tidak tetap, ππ₯(π) tidak nol (sama seperti pada kasus state akhir
tetap).
Dengan memandang kondisi di atas, dibutuhkan bahwa
π π = ππ
ππ₯ π
= π π₯ π β 10 (3.3.23)
Dari (3.3.15) dan (3.3.23) akan ditentukan π(π).
Untuk itu, perhatikan bahwa
π₯ π =π π
π + 10 (3.3.24)
Kombinasikan (3.3.24), (3.3.15), dan (3.3.17) kemudian selesaikan untuk final
costate diperoleh
π π =β20ππ
2π + π2π 1 β πβ2ππ (3.3.25)
Dengan menggunakan (3.3.11) didapatkan lintasan costate yang optimal
πβ π‘ =β10ππ πππ‘
ππππ + π π2 sinh ππ (3.3.26)
Akhirnya diperoleh kontrol optimal
π’β π‘ =10πππ πππ‘
ππππ + π π2 sinh ππ (3.3.27)
Untuk memeriksa kebenaran solusi, simulasikan fungsi kontrol dengan
menggunakan π’β π‘ dalam model pertumbuhan (3.3.3). Dengan menyelesaikan
untuk lintasan state yang optimal diperoleh
30
π₯β π‘ =10π π2 sinh ππ‘
ππππ + π π2 sinh ππ (3.3.28)
Pada waktu akhir,
π₯β π =10π π2 sinh ππ
ππππ + π π2 sinh ππ (3.3.29)
3.4. Permasalahan Titik Potong dan Titik Temu
a. Formulasi Masalah
Geometri dari permasalahan ditunjukkan pada gambar, dimana π¦(π‘) dan π£(π‘)
masing-masing adalah posisi vertikal dan kecepatan dari pesawat pengejar π΄
relatif terhadap pesawat target π΄π‘ , yang diasumsikan sedang beristirahat. Jarak
horisontal awal pesawat pengejar terhadap pesawat target adalah π·. Kecepatan
horisontal pengejar relatif terhadap target π΄π‘ adalah π; sehingga waktu akhir π,
dimana kedua pesawat akan memiliki jarak horisontal yang sama, adalah tetap
dan diketahui bernilai
π = π‘0 +π·
π (3.4.1)
dengan sudut penglihatan π(π‘).
Dalam permasalahan titik temu, diinginkan agar posisi akhir π¦(π) dan kecepatan
akhir π£(π) keduanya bernilai 0. Namun dalam permasalahan titik potong,
kecepatan akhir tidak dipentingkan, meskipun diharapkan bahwa posisi akhir
π¦(π) adalah 0.
31
Gambar 3.4.1 Geometri dari Permasalahan Titik Potong dan Titik Temu
Persamaan dinamik dari pergerakan vertikal dinyatakan oleh persamaan state
π¦ = π£ (3.4.2)
π£ = π’ (3.4.3)
dimana π’(π‘) adalah percepatan vertikal. Kemudian indeks performa yang
digunakan adalah
π½ π‘0 =π π¦π¦
2(π)
2+
π π£π£2(π)
2+
1
2 π’2 π‘ ππ‘
π
π‘0
(3.4.4)
Untuk titik potong, π π£ = 0 dan π π¦ dibuat bernilai cukup besar sehingga kontrol
optimal akan menghasilkan π¦2(π) yang kecil. Untuk titik temu, π π£ dan π π¦
keduanya dipilih bernilai besar.
b. Solusi Permasalahan
Kontrol optimal akan dipilih sedemikian rupa sehingga meminimalkan (3.4.4).
32
Setiap komponen pada state harus memiliki faktor pengali Lagrange yang
bersesuaian; oleh karena itu ambil π β [ππ¦ , ππ£]π dan Hamiltonian
π» =1
2π’2 + π£ππ¦ + π’ππ£ (3.4.5)
maka persamaan costate adalah
π π¦ = βππ»
ππ¦= 0 (3.4.6)
π π£ = βππ»
ππ£= βππ¦ (3.4.7)
Kondisi kestasioneran adalah
0 =ππ»
ππ’= π’ + ππ£ (3.4.8)
sehingga kontrol optimal adalah negatif dari faktor pengali kecepatan
π’ π‘ = βππ£(π‘) (3.4.9)
Kondisi awal adalah
π¦ π‘0 ,π£ π‘0 diberikan. (3.4.10)
Kondisi akhir ditentukan oleh kondisi batas pada tabel keoptimalan. Karena
waktu akhir tetap, ππ = 0, maka hanya term pertama yang memberikan kondisi
mengikat.
ππ¦ π =ππ
ππ¦ π = π π¦π¦ π (3.4.11)
ππ£ π =ππ
ππ£ π = π π£π£ π (3.4.12)
33
Berikutnya akan diselesaikan permasalahan nilai batas yang didefinisikan oleh
persamaan state dan costate dengan π’ seperti pada (3.4.9) dan kondisi batas
(3.4.10) β (3.4.12). Seperti pada 3.3, ππ¦ π dan ππ£ π diasumsikan telah
diketahui. Persamaan costate diselesaikan secara mundur terhadap waktu, dan
persamaan state kemudian diselesaikan secara maju terhadap waktu.
Dengan mengintegralkan kedua ruas pada (3.4.6) dari π‘ hingga π diperoleh
konstanta komponen costate, yaitu
ππ¦ π‘ = ππ¦ π β ππ¦ (3.4.13)
Integralkan (3.4.7), memberikan
ππ£ π β ππ£ π‘ = β(π β π‘)ππ¦
atau
ππ£ π‘ = ππ£ π + (π β π‘)ππ¦ (3.4.14)
Selanjutnya, untuk menyederhanakan diasumsikan bahwa π‘0 = 0 . Kemudian
substitusikan kontrol (3.4.9) ke (3.4.3) dan dihasilkan
π£ = βππ£ π‘ (3.4.15)
Dengan menggunakan (3.4.14) dan mengintegralkan kedua ruas untuk [0, π‘]
diperoleh persamaan kuadrat
π£ π‘ = π£ 0 β π‘ ππ£ π + πππ¦ +π‘2
2ππ¦ (3.4.16)
Substitusikan hasil ini ke dalam perhitungan dan integralkan (3.4.2) lalu diperoleh
persamaan kubik
π¦ π‘ = π¦ 0 + π€ 0 βπ‘2
2 ππ£ π + πππ¦ +
π‘3
6ππ¦ (3.4.17)
34
Persamaan state dan costate telah diselesaikan dalam term π(π) dan π¦ 0 ,π£(0)
yang diberikan. Namun, final costate belum diketahui. Untuk mencarinya, dapat
digunakan hubungan (3.4.11) dan (3.4.12) antara final state dan final costate.
Setelah menggabungkan hubungan ini dengan (3.4.16) dan (3.4.17) didapat
ππ¦ = π π¦ π¦ 0 + ππ£ 0 βπ2
2 ππ£ π + πππ¦ +
π3
6ππ¦ (3.4.18)
dan
ππ£ π = π π£ π£ 0 β π ππ£ π + πππ¦ +π2
2 ππ¦ (3.4.19)
Kedua persamaan ini dapat dituliskan ulang sebagai
1 +
π π¦π3
3
π π¦π2
2π π£π
2
21 + π π£π
ππ¦
ππ£ π =
π π¦ π π¦π
0 π π£
π¦ 0
π£ 0 (3.4.20)
Menyelesaikan persamaan ini dan diperoleh final costate
ππ¦
ππ£ π =
1
β π π π£ + π π π π£ +
π
2
βπ2
2π π¦ β
π3
6 π¦ 0
π£ 0 (3.4.21)
dimana
β π = π π¦ +π3
3 π π£ + π β
π4
4 (3.4.22)
bobot akhir diperoleh
π π¦ β‘1
π π¦ (3.4.23π)
35
π π£ β‘1
π π£ (3.4.23π)
Pada faktanya, waktu awal π‘0 tidak bernilai 0. Karena persamaan state dan costate
linear, untuk mengoreksi dibutuhkan untuk mensubstitusi (π β π‘0) ke dalam π
pada ruas kanan persamaan (3.4.21). Sebelumnya, perlu diingat bahwa pada saat
π‘ β€ π nilai π¦ π‘ dan π£(π‘) telah diketahui, sehingga π‘ dapat diambil sebagai waktu
awal. Hal ini berkorespondensi dengan meminimalkan π½(π‘), yaitu remaining cost
pada selang [π‘, π].
Dengan mensubstitusikan (π β π‘) untuk π dalam persamaan (3.4.21) diperoleh
persamaan untuk final costate dalam variabel state saat ini :
ππ¦
ππ£ π =
1
β π β π‘ π π£ + π β π‘ π β π‘ π π£ +
π β π‘
2
β π β π‘ 2
2π π¦ β
π β π‘ 3
6 π¦ π‘
π£ π‘ (3.4.24)
Pada akhirnya, kontrol optimal dapat dihitung dengan mendasarkan perhitungan
pada (9) dan (14)
π’ π‘ = β π β π‘ 1 ππ¦
ππ£ π (3.4.25)
Dengan turut memperhitungkan (24) diperoleh kontrol optimal
π’ π‘ = β π β π‘ π π£ +
π β π‘ 2
2β π β π‘
π¦ π‘
βπ π¦ + π β π‘ 2π π£ +
π β π‘ 3
3β π β π‘
π£ π‘ (3.4.26)
Hasil ini merupakan hukum kontrol feedback karena kontrol yang sesungguhnya
hanya diberikan dalam state saat ini.
36
c. Navigasi Proporsional
Untuk permasalahan titik potong, pilih π π£ = 0 dan π π¦ β β. Dengan mengambil
limit dari (26) diperoleh
π’ π‘ = β3
π β π‘ 2π¦ π‘ β
3
π β π‘π£ π‘ (3.4.27)
sebagai kontrol optimal titik potong.
Perlu diperhatikan bahwa untuk sudut penglihatan yang kecil
π π‘ = tan π π‘ =π¦ π‘
π β π‘ π (3.4.28)
sehingga
π =π¦ (π‘)
π β π‘ π+
π¦ π‘
π β π‘ 2π (3.4.29)
maka kontrol optimalnya adalah
π’ π‘ = β3ππ (3.4.30)
Persamaan ini adalah hukum kontrol untuk navigasi proporsional. Setiap pilot
mengetahui bahwa untuk melakukan perpotongan hanya diperlukan untuk
menjaga sudut terhadap target tetap konsan sehingga tidak akan ada pergerakan
terhadap posisi relatif.
3.5. Keoptimalan Sudut Gaya Dorong
Contoh ini bertujuan untuk menekankan bahwa kondisi keoptimalan pada tabel dapat
diterapkan pada sistem tak linear umumnya.
37
a. Hukum Tangent Bilinear
Sebuah partikel dengan massa π digerakkan oleh gaya dorong konstan πΉ dan
dikenakan pada variabel sudut πΎ(π‘) . Posisi partikel adalah (π₯ π‘ , π¦ π‘ ) dan
kecepatan pada sumbu π₯ dan π¦ masing-masing adalah π’(π‘) dan π£(π‘). Perhatikan
gambar. Persamaan state tak linear untuk π = π(π, πΎ, π‘) adalah
π₯ = π’ (3.5.1)
π¦ = π£ (3.5.2)
π’ = π cos πΎ (3.5.3)
π£ = π sin πΎ (3.5.4)
dimana vektor untuk state adalah π = π₯ π¦ π’ π£ π , dan π β πΉ/π adalah
percepatan gaya dorong yang telah diketahui. Sudut gaya dorong πΎ(π‘) merupakan
kontrol input.
Indeks performa yang digunakan berupa fungsi atas waktu akhir π dan state
π½ = π(π π ,π) (3.5.5)
Misalkan suatu fungsi π atas state akhir harus bernilai 0, sehingga
π π π ,π = 0 (3.5.6)
Akan dicari bentuk dari πΎ(π‘) yang meminimalkan π½ dan memenuhi (3.5.6).
Hamiltonian adalah
π» = πΏ + πππ = ππ₯π’ + ππ¦π£ + ππ’π cos πΎ + ππ£π sin πΎ (3.5.7)
dimana faktor pengali Lagrange π π‘ = ππ₯ ππ¦ ππ’ ππ£ π memiliki komponen
yang berasosiasi dengan komponen setiap state.
38
Gambar 3.5.1 Keoptimalan Sudut Gaya Dorong
Berdasarkan tabel keoptimalan, persamaan costate adalah π = βππππ atau
π π₯ = βππ₯ππ = 0 (3.5.8)
π π¦ = βππ¦ππ = 0 (3.5.9)
π π’ = βππ’ππ = βππ₯ (3.5.10)
π π£ = βππ£ππ = βππ¦ (3.5.11)
(Perhatikan bahwa subskrip pada π menotasikan turunan parsial, sedangkan
subskrip pada π menotasikan komponen dari persamaan costate.)
Kondisi kestasioneran adalah
0 = π»πΎ = βππ’π sin πΎ + ππ£π cos πΎ (3.5.12)
atau
tan πΎ(π‘) =ππ£ π‘
ππ’ π‘ (3.5.13)
39
Dengan mengintegralkan persamaan costate secara mundur dari waktu akhir π
diperoleh
ππ₯ π‘ = ππ₯(π) β ππ₯ (3.5.14)
ππ¦ π‘ = ππ¦(π) β ππ¦ (3.5.15)
ππ’ π‘ = ππ’ π + πππ₯ β π‘ππ₯ β π1 β π‘ππ₯ (3.5.16)
ππ£ π‘ = ππ£ π + πππ¦ β π‘ππ¦ β π2 β π‘ππ¦ (3.5.17)
Kemudian substitusikan ke persamaan (3.5.13) dan diperoleh hukum kontrol
optimal
tan πΎ π‘ =π‘ππ¦ β π2
π‘ππ₯ β π1 (3.5.18)
Persamaan ini disebut hukum tangent bilinear untuk arah gaya dorong optimal
πΎ π‘ .
Untuk menentukan konstanta ππ₯ , ππ¦ , π1 , dan π2 , dapat dilakukan dengan cara
mensubstitusikan persamaan (3.5.18) ke persamaan state, menyelesaikannya, dan
menerapkan kondisi batas. Untuk menentukan kondisi batas, diperlukan untuk
mengetahui π dan π, yang bergantung pada objektif kontrol tertentu. Ada banyak
objektif permasalahan kontrol yang memungkinkan mengingat bahwa seluruhnya
bergantung pada sifat dari partikel π. Salah satu contoh yang memiliki solusi
sederhana dan menarik akan dibahas berikut ini.
b. Titik Potong dengan Waktu Minimum
Misalkan π merepresentasikan sebuah pesawat yang diharapkan berpotongan
dengan target π dalam waktu yang minimum. π memiliki posisi awal π₯1 dan
40
kecepatan konstan terhadap sumbu π₯ , yaitu π1 , sehingga persamaan posisi
pesawat terhadap sumbu π₯ pada saat π‘ adalah π₯1 + π1π‘ . Sedangkan posisi
terhadap sumbu π¦ bernilai konstan.
Karena objektif permasalahan ini adalah meminimalkan waktu, maka diharapkan
bahwa kontrol optimal dapat meminimalkan
π½ = π = 1 ππ‘π
0 (3.5.19)
dan karena πΏ = 1, maka Hamiltonian menjadi
π» π‘ = 1 + ππ₯π’ + ππ¦π£ + ππ’π cos πΎ + ππ£π sin πΎ (3.5.20)
Bagaimanapun, karena nilai πΏ konstan, hasil yang diperolah pada bagian a tetap
valid.
Jika π mulai bergerak saat π‘0 = 0 dan dimulai dari titik awal, kondisi awal dari
π adalah
π₯ 0 = 0, π¦ 0 = 0, π’ 0 = 0, π£ 0 = 0 (3.5.21)
Fungsi untuk final state adalah
π π π ,π = π₯ π β (π₯1 + π1π)
π¦ π β β = 0 (3.5.22)
sehingga
π₯ π = π₯1 + π1π (3.5.23)
π¦ π = β (3.5.24)
Untuk mencari kondisi akhir yang tersisa diperlukan untuk menggunakan syarat
kondisi batas pada tabel keoptimalan.
41
State akhir dan waktu akhir keduanya bernilai bebas. Oleh karena itu ππ₯ π β 0
dan ππ β 0 . Bagaimanapun, dalam permasalahan ini ππ₯ π dan ππ saling
independen sehingga syarat kondisi batas pada tabel keoptimalan menghasilkan
dua kondisi batas yang terpisah yaitu
(ππ + ππππ£ β π) π = 0 (3.5.25)
(ππ‘ + ππ‘ππ£ + π») π = 0 (3.5.26)
dimana π£ = π£π₯ π£π¦ π adalah faktor pengali Lagrange yang baru.
Dengan memperhitungkan (3.5.22) dan memperhatikan bahwa π π₯ π , π = 0,
maka persamaan (3.5.25) menjadi
π π =
1 00 10 00 0
π£π₯
π£π¦
atau
ππ₯ π = π£π₯ (3.5.27)
ππ¦ π = π£π¦ (3.5.28)
ππ’ π = 0 (3.5.29)
ππ£ π = 0 (3.5.30)
Perlu diperhatikan bahwa komponen-komponen dari π π yang berkorespondensi
dengan komponen final state yang tetap, yaitu π₯(π) dan π¦(π), adalah variabel-
variabel yang belum diketahui, sedangkan komponen-komponen dari π π yang
berkorespondensi dengan komponen final state yang bebas, yaitu π’(π) dan π£(π),
memiliki nilai tetap pada 0.
42
Dengan menggunakan kondisi (3.5.20) dan (3.5.22), kondisi akhir (3.5.26)
menjadi
π» π = β ππ‘ππ£ π = β βπ1 0
π£π₯
π£π¦
atau dengan menggunakan (3.5.27) β (3.5.30)
1 + π£π₯π’ π + π£π¦π£ π = π1π£π₯ (3.5.31)
Kemudian persamaan state (3.5.1) β (3.5.4) akan diselesaikan dengan
memperhitungkan (3.5.18) dan solusi costate (3.5.14) β (3.5.17) serta kondisi
batas (3.5.21), (3.5.23), (3.5.24), (3.5.27) β (3.5.30). Kondisi (3.5.31) juga
diperlukan untuk menyelesaikan waktu akhir optimal πβ yang belum diketahui.
Dari persamaan (3.5.27) β (3.5.30) solusi costate adalah
ππ₯ π‘ = π£π₯ (3.5.32)
ππ¦ π‘ = π£π¦ (3.5.33)
ππ’ π‘ = (π β π‘)π£π₯ (3.5.34)
ππ£ π‘ = (π β π‘)π£π¦ (3.5.35)
Dimana faktor pengali terakhir π£π₯ , π£π¦ perlu ditentukan. Dengan demikian, hukum
tangent bilinear (3.5.18) dapat dibuat dalam bentuk yang lebih sederhana
tan πΎ =π£π¦
π£π₯ (3.5.36)
Untuk permasalahan titik potong dengan waktu minimum ini, sudut gaya dorong
yang optimal bernilai konstan.
43
Untuk mencari kontrol optimal atas sudut gaya dorong πΎβ(π‘), yang tersisa adalah
untuk mencari π£π₯ dan π£π¦ .
Karena πΎ bernilai konstan, sangat mudah untuk melakukan proses integrasi secara
maju dari π‘0 = 0 hingga diperoleh
π£ π‘ = ππ‘ sin πΎ (3.5.37)
π’ π‘ = ππ‘ cos πΎ (3.5.38)
π¦ π‘ =ππ‘2
2sin πΎ (3.5.39)
π₯ π‘ =ππ‘2
2cos πΎ (3.5.40)
dimana kondisi awal (3.5.21) telah dimasukkan dalam perhitungan.
Dengan menyelesaikan persamaan (3.5.39) dan (3.5.40) pada saat π‘ = π
tan πΎ =π¦ π
π₯ π (3.5.41)
dan kondisi akhir (3.5.23) dan (3.5.24) kemudian memberikan persamaan untuk
kontrol dalam kondisi akhir :
tan πΎ =β
π₯1 + π1π (3.5.42)
Bagaimanapun, masih perlu ditentukan waktu akhir yang optimal πβ untuk
digunakan dalam (3.5.42). Peran dari persamaan (3.5.31) adalah untuk
menyelesaikan πβ, namun untuk menggunakannya dibutuhkan untuk mencari π£π₯
44
dan π£π¦ . Khusus dalam permasalahan ini dapat digunakan cara singkat dimana π£π₯ ,
π£π¦ tidak diperlukan.
Dapat diperhatikan bahwa (3.5.39), (3.5.40), (3.5.23), dan (3.5.24) menghasilkan
sin πΎ =2π¦(π)
ππ2=
2β
ππ2 (3.5.43)
cos πΎ =2π₯ π
ππ2=
2 π₯1 + π1π
ππ2 (3.5.44)
Kemudian, sin2 πΎ + cos2 πΎ = 1, atau
4β2 + 4(π₯1 + π1π)2 = π2π4 (3.5.45)
yang mana
βπ2π4
4+ π1
2π2 + 2π1π₯1π + π₯12 + β2 = 0 (3.5.46)
Persamaan kuadrat ini dapat diselesaikan untuk πβ dengan kondisi awal di sekitar
target π₯1, π1,β diberikan. Hanya ada satu solusi untuk persamaan (3.5.46) yang
masuk akal secara fisis.
Kontrol optimal ditentukan dengan menyelesaikan persamaan (3.5.46) untuk πβ
dan kemudian menyelesaikan persamaan (3.5.42) untuk sudut gaya dorong
optimal πΎβ.
Gambar di bawah ini merepreentasikan bahwa sisi miring dari segitiga
digambarkan dalam persamaan gerak target, sebagai
π2 = β2 + (π₯1 + π1πβ)2 (3.5.47)
atau dalam persamaan gerak pesawat pengejar sebagai
45
π2 = 1
2π πβ 2
2
(3.5.48)
Gambar 3.5.2 Kontrol Input bagi Permasalahan Titik Potong dengan Waktu Minimum
Persamaan (3.5.45) hanyalah sebuah persamaan yang harus dipenuhi agar kedua
pesawat berada pada titik yang sama pada waktu akhir.
Tanpa melalui penurunan yang detail dari (3.5.45) maka tidak dapat disimpulkan
dari gambar apakah solusinya merupakan waktu akhir yang optimal.
46
3.6. Solusi Numerik Sistem Hamiltonian untuk Hukum Newton
Misalkan model pertumbuhan yang mengikuti Hukum Newton, dimana
π¦ = π£
π£ = π’ (3.6.1)
dengan π¦ adalah vektor posisi, π£ adalah vektor kecepatan, dan π’ adalah input
percepatan. Vektor state adalah π₯ = [π¦ π£]π . Kemudian pilih indeks performa :
π½ =1
2 π’2 π‘ ππ‘
π
π‘0
(3.6.2)
Model pertumbuhan akan dibawa mendekati final state π₯(π) = [π¦ π π£ π ]π tanpa
menggunakan terlalu banyak energi. Nilai sesungguhnya dari final state tidaklah
tetap, meskipun waktu akhir π tetap.
Dalam 3.2. telah dibangun controller untuk model pertumbuhan ini, dan dalam 3.4.
telah dicari ekspresi analitik untuk controller feedback yang kontinu. Pada bagian ini
akan dicari kontrol optimal dengan menggunakan solusi numerik atas persamaan
stateβcostate.
Hamiltonian dan persamaan Euler sama seperti yang diberikan pada 3.4. yaitu
π» =1
2π’2 + π£ππ¦ + π’ππ£
π π¦ = βππ»
ππ¦= 0
π π£ = βππ»
ππ£= βππ¦
47
Kontrol optimal adalah
π’ = βππ£(π‘) (3.6.3)
Dengan menggunakan kontrol optimal di atas dalam persamaan state, diperoleh
Hamiltonian dari sistem, yaitu
π¦ = π£
π£ = βππ£
π π¦ = 0
π π£ = βππ¦ (3.6.4)
Dengan menggunakan persamaan terakhir, diperoleh
ππ¦ π‘ = π
ππ£ π‘ = exp βπ‘ π
untuk suatu konstanta π dan π.
Kondisi batas yang digunakan adalah
π¦ 0 = π diberikan,
π£ 0 = π diberikan,
π¦ π = 0
π£ π = 0 (3.6.5)
dengan π dan π merupakan tebakan untuk state awal, atau notasikan π₯ 0 = [π π]π
sedangkan untuk state akhir, diinginkan agar π₯ π = [0 0]π .
48
Karena kondisi awal dari persamaan costate tidak diketahui, maka akan dibangun
suatu metode aproksimasi terhadap kondisi awal costate yang sesuai.
Misalkan π = [π π]π = [ππ¦ 0 ππ£
0 ]π adalah vektor tebakan untuk costate awal
untuk suatu π β ππ§, π β ππ§ didapatkan
ππ¦ π‘ = π
ππ£ π‘ = exp βπ‘ π (3.6.6)
Jika kita mengkhususkan perhatian pada final state π£(π) dengan ππ£ 0 = π ,
diperoleh
π£ π; π = β exp(βπ‘) ππ‘π
0
π
Tentu saja, lintasan dari π₯(π) secara umum tidak berakhir pada π₯ π = [0 0]π .
Dengan kata lain, secara umum π₯(π) β π₯ (π).
Untuk menebak π yang sesuai yang membuat π₯ dimulai tepat pada π₯ 0 = [π π]π
dan berakhir di π₯ π = [0 0]π tidaklah mudah. Oleh karena itu, akan digunakan
algoritma berikut untuk menghampiri nilai π yang sesuai. Algoritma tidak bertujuan
untuk mencari nilai π yang presisi, namun diharapkan algoritma dapat menemukan π
yang meminimalkan fungsional berikut
πΉ π = π₯ π β π₯ (π) 2 (3.6.7)
dimana π₯(π) adalah evaluasi atas π₯ saat π dan (π₯, π) adalah solusi atas sistem
persamaan diferensial (3.6.4) dengan kondisi awal π₯ 0 , π 0 = π₯ 0 , π 0 .
Fungsional πΉ akan diminimalkan dengan menggunakan metode Steepest Descent.
Program yang digunakan adalah MATLAB. Kemudian akan diperoleh lintasan state
49
dan costate ππ¦(π‘) dan ππ£(π‘) , sehingga kontrol input dapat ditentukan dengan
menggunakan persamaan (3.6.3).
Algoritma untuk metode Steepest Descent dapat dideskripsikan sebagai berikut.
Pertama, pilih sebarang bilangan positif π dan πΌ, serta sebarang vektor
π 0 = [π π]π
Dengan menggunakan nilai-nilai ini dan kondisi awal π₯ 0 = [π π]π permasalahan
nilai awal berikut dapat diselesaikan
π¦ = π£
π£ = βππ£
π π¦ = 0
π π£ = βππ¦
dimana (π₯ 0 , π 0 ) = (π₯ 0 ,π 0). Kemudian, dapat dihitung final state π₯(π) untuk
π 0 tersebut. Lebih jauh lagi, dengan menggunakan nilai π₯(π) ini, nilai skalar dari
πΉ(π 0) dapat dihitung dengan persamaan (3.6.7). Berikutnya, akan dicari nilai π 1
yang baru yang akan membuat nilai πΉ(π 1) < πΉ(π 0).
Turunan parsial dari πΉ terhadap masing-masing ππ¦ dan ππ£ di π 0 diaproksimasi
dengan
ππΉ
πππ¦ π 0 β π·1 β
πΉ π 0 + π(1,0) β πΉ(π 0 )
π
ππΉ
πππ£ π 0 β π·2 β
πΉ π 0 + π(0,1) β πΉ(π 0 )
π
Sehingga, gradient dari πΉ di π 0 diaproksimasi dengan
50
βπΉ π 0 = ππΉ
πππ¦ π 0 ,
ππΉ
πππ£ π 0 β (π·1 , π·2)
Berikutnya, bentuk
πΈ1 = πΉ π 0 β Ξ± π·1 ,π·2
πΈ2 = πΉ π 0 βΞ±
2 π·1 , π·2
Jika πΈ1 < πΈ2 , maka π 1 = π 0 β πΌ π·1 ,π·2 . Dan jika sebaliknya, maka π 1 = π 0 β
πΌ
2 π·1 ,π·2 dan ubah nilai π dengan
π
2 serta nilai πΌ dengan
πΌ
2. Kemudian lanjutkan
dengan mengulangi proses di atas menggunakan nilai π 1 untuk variabel π 0, sehingga
dapat diperoleh nilai π 2 . Jika proses iterasi ini terus dilanjutkan, maka akan
dihasilkan barisan vektor π π π=0
β .
51
********************************************************************
% program input Hamiltonian
function dy = hamiltonian(t,y)
dy = zeros(4,1);
% a column vector
dy(1) = y(2) ; % y dot
dy(2) = -y(4) ; % v dot
dy(3) = 0; % lambda y dot
dy(4) = -y(3); % lambda v dot
end
********************************************************************
% program utama
clear all;
clc;
toleransi = 0.001; %besar galat
epsilon1 = 0.001; %nilai awal untuk epsilon
epsilon2 = epsilon1/2;
alpha1 = 0.001; %nilai awal untuk alpha
alpha2 = alpha1/2;
tmin = 0; %waktu awal (t0)
tmax = 10; %waktu akhir (tf)
time = [tmin tmax];
% Syarat awal untuk state dan costate
a = 1; % syarat awal y
52
b = 1; % syarat awal v
L10 = 2; % tebakan awal costate lambda v
L20 = 2; % tebakan awal costate lambda y
ic = [a b L10 L20];
options = odeset('RelTol', 1e-10);
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
F(1) = (Y(ujung,1))^2+(Y(ujung,2))^2; %syarat akhir state (0,0,0)
i=1;
alpha = alpha1;
epsilon = epsilon1;
while F(i) > toleransi
L10_lama = L10(i);
L20_lama = L20(i);
% Initial condition partial
L10partial = L10_lama + epsilon;
ic = [a b L10partial L20_lama];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
partialL1 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;
% Initial condition partial
L20partial = L20_lama + epsilon;
ic = [a b L10_lama L20partial];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
partialL2 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;
53
normF = sqrt(partialL1^2 + partialL2^2);
% Initial condition
L10_baru = L10_lama - alpha * partialL1 / normF;
L20_baru = L20_lama - alpha * partialL2 / normF;
ic = [a b L10_baru L20_baru];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
i=i+1;
F(i)= (Y(ujung,1))^2+(Y(ujung,2))^2;
if F(i)>=F(i-1)
alpha = alpha2;
epsilon = epsilon2;
else
alpha = alpha1;
epsilon = epsilon2;
end
L10 = [L10; L10_baru];
L20 = [L20; L20_baru];
end
figure(1)
plot(T, Y(:,1))
xlabel('t (s)')
ylabel('y (m)')
axis([0 10 0 10])
figure(2)
plot(T,Y(:,2))
xlabel('t (s)')
ylabel('v (m/s)')
54
figure (3)
plot(T,Y(:,1:2))
xlabel('t (s)')
ylabel('y (m) dan v (m/s)')
% Transpose
F = F.';
Hasil =[F L10 L20];
*********************************************************
55
Dengan menjalankan program di atas, diperoleh hasil plot lintasan state yang optimal
sebagai berikut
Gambar 3.6.1 Plot Lintasan π¦β terhadap t
Gambar 3.6.2 Plot Lintasan π£β terhadap t
56
Gambar 3.6.3 Plot Lintasan π¦β dan π£β terhadap t
Nilai costate yang optimal adalah
ππ¦ π‘ = 0.0738
ππ£ π‘ = 0.4662 β 0.0738π‘
Sehingga diperoleh kontrol input
π’β π‘ = β0.4662 + 0.0738π‘
57
BAB 4
KESIMPULAN
Dalam tugas akhir ini, beberapa konsep dasar dari kalkulus variasi telah dipaparkan
dan kondisi keoptimalan telah diturunkan dengan menggunakan Pontryagin
Maximum Principle. Variasi pertama dari indeks performa telah dicari, dan nilai dari
setiap increment bebas pada saat nol adalah syarat perlu bagi persamaan state dan
costate untuk mencapai keoptimalan. Tabel 1 merangkum syarat perlu bagi kondisi
keoptimalan tersebut.
Beberapa contoh permasalahan sistemn kontinu nonlinear yang diselesaikan dengan
menggunakan kontrol optimal telah diselesaikan dengan cara mencari solusi analitik
dan solusi numerik. Pendekatan solusi numerik yang digunakan adalah metode
Steepest Descent.
58
DAFTAR PUSTAKA
1. Athans, M and P. Falb, Optimal Control, New York : McGraw-Hill, 1966
2. Bryson, A. E. and Ho, Y-C., Applied Optimal Control, Blaisdell Publishing
Company, Waltham, 1969
3. Kirk, D., Optimal Control Theory : An Introduction, Prentice Hall, 1970
4. Lewis, F. L., Optimal Control, New York : Wiley, 1995
5. Tjahjana, H., Pranoto, I., Muhammad, H., Naiborhu, J., On The Optimal
Control Computation of Linear Systems, J. Indonesian Math. Society Vol. 15,
No. 1 (2009), pp. 13 β 20
6. Tomlin, C. J., Lecture Notes 8 : Optimal Control and Dynamic Games, (2005)