kontrol optimal berdasarkan pada kalkulus variasi - vanessa sarah griselda

0

KONTROL OPTIMAL BERDASARKAN PADA

KALKULUS VARIASI

Tugas Akhir

Diajukan untuk memenuhi persyaratan

Sidang Sarjana Matematika

Oleh:

VANESSA SARAH GRISELDA

10104017

PROGRAM STUDI MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

INSTITUT TEKNOLOGI BANDUNG

2010

1

PRAKATA

Puji syukur penulis haturkan sedalam-dalamnya ke hadirat Allah SWT yang telah

memberikan limpahan anugerah, bimbingan, dan kekuatan sehingga penulis dapat

menyelesaikan tugas akhir ini sejak Maret 2009 hingga Februari 2010. Tanpa

masukan berharga, kepercayaan, dan dukungan yang diberikan oleh Dr. Janson

Naiborhu selaku pembimbing, maka penulis tidak akan dapat menyelesaikan tugas

akhir ini dengan hasil memuaskan. Penulis berterima kasih sebesar-besarnya kepada

kedua orang tua penulis yang telah memberikan endless support dan courage selama

penulis berkuliah di ITB. Terima kasih penulis sampaikan Dr. Agus Yodi selaku

dosen penguji atas segala pelajaran dan bimbingan dalam tugas akhir ini, serta Dr.

Hanni Garminia selaku dosen penguji tugas akhir dan juga dosen wali selama 5 tahun

terakhir. Tidak lupa penulis berterima kasih kepada Heru Tjahjana atas bantuan

dalam menyelesaikan fundamental codes Matlab untuk hampiran numerik. Pada

akhirnya, penulis ingin mengucapkan terima kasih setulusnya kepada Hutama G.

Soediredja atas seluruh dukungannya setiap hari, setiap saat.

Penulis menyadari bahwa tugas akhir ini masih memiliki beberapa kekurangan. Oleh

karena itu, penulis mengharapkan kritik dan saran yang membangun dari pembaca

untuk perbaikan selanjutnya. Semoga tugas akhir ini dapat bermanfaat bagi kemajuan

ilmu pengetahuan dan bagi siapapun yang membacanya.

Bandung, Februari 2010

Penulis

2

ABSTRAK

Kontrol Optimal berhubungan dengan permasalahan dalam menentukan hukum

kontrol untuk suatu sistem sehingga kriteria keoptimalan tertentu dapat terpenuhi.

Permasalahan kontrol optimal melibatkan fungsi biaya yang merupakan fungsional

atas state dan variabel kontrol. Kontrol optimal adalah himpunan dari persamaan

diferensial yang merupakan lintasan dari variabel kontrol yang meminimalkan fungsi

biaya. Dalam tugas akhir ini, Pontryagin’s Maximum Principle digunakan untuk

menurunkan hukum kontrol dan solusi umum diperoleh dengan menerapkan

pendekatan Kalkulus Variasi. Lebih jauh lagi, beberapa permasalahan kontrol optimal

sederhana serta solusi analitik telah ditampilkan. Selain itu, algoritma Steepest

Descent digunakan sebagai hampiran numerik bagi solusi optimal.

3

ABSTRACT

Optimal Control deals with the problem of finding a control law for a given system

such that a certain optimality criterion is achieved. A control problem includes a cost

functional that is a function of state and control variables. An optimal control is a set

of differential equations describing the paths of the control variables that minimize

the cost functional. In this final project, Pontryagin’s Maximum Principle is used for

deriving control policies and general solutions are obtained by using Calculus of

Variations approach. Furthermore, several simple optimal control problems and their

analytical solutions are presented. In addition, Steepest Descent algorithm is being

used as numerical approach to optimal solutions.

4

BAB 1

PENDAHULUAN

1.1. Latar Belakang

Sebagian besar sistem dalam bidang fisika, kimia, biologi, dan ekonomi dapat

dimodelkan dengan persamaan matematika, salah satu bentuknya adalah model

persamaan diferensial stokastik atau deterministik. Keadaan dari sistem-sistem ini

kemudian mengalami perubahan nilai terhadap waktu atau variabel bebas lainnya,

tergantung pada persamaan dinamik tertentu. Lebih jauh lagi, sistem-sistem ini akan

membawa satu state ke state yang lainnya dengan cara menerapkan beberapa input

dari luar sistem, atau disebut juga kontrol input. Jika hal ini dapat dilakukan, maka

ada beberapa cara yang berbeda untuk mencapai nilai tertentu. Dan jika demikian,

maka ada cara yang terbaik di antara seluruh cara yang memungkinkan. Input yang

menghasilkan cara terbaik ini disebut kontrol optimal. Untuk mengukur seberapa baik

cara tersebut, digunakan indeks performa atau fungsi biaya sebagai parameter.

1.2. Rumusan Masalah

Bentuk umum dari permasalahan kontrol optimal diberikan sebagai berikut. Sistem

dinamik nonlinear dideskripsikan dalam bentuk persamaan diferensial

𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 (1.2.1)

dengan state 𝑥(𝑡) ∈ 𝑹𝑛 , kontrol input 𝑢(𝑡) ∈ 𝑹𝑚 , dan indeks performa

5

𝐽(𝑡) = 𝜙 𝑥 𝑇 ,𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡𝑇

𝑡0 (1.2.2)

dimana :

𝑡0 adalah waktu awal (tetap),

𝑇 adalah waktu akhir (bebas),

𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 adalah fungsi biaya pada selang waktu antara [𝑡0, 𝑇] ,

𝜙 𝑥 𝑇 ,𝑇 adalah fungsi biaya pada waktu akhir yang bergantung hanya pada 𝑇 dan

𝑥(𝑇).

Permasalahan kontrol optimal adalah untuk mencari input 𝑢∗ 𝑡 pada selang waktu

[𝑡0, 𝑇] yang membawa persamaan (1.2.1) sepanjang lintasan 𝑥∗ 𝑡 sehingga nilai dari

indeks performa (1.2.2) menjadi minimal, dan

𝜓 𝑥 𝑇 ,𝑇 = 0 (1.2.3)

dimana 𝜓 𝑥 𝑇 , 𝑇 merupakan fungsi pembatas pada state akhir dengan 𝜓 ∈ 𝑹𝑝

diberikan.

1.3. Tujuan

Tujuan dari tugas akhir ini adalah menurunkan kondisi keoptimalan bagi

permasalahan kontrol optimal dengan menggunakan pendekatan kalkulus variasi.

Kondisi keoptimalan yang diperoleh bersifat umum, oleh karena itu penulis akan

menerapkannya pada beberapa sistem kontrol optimal sederhana sebagai gambaran

khusus. Lebih jauh lagi, dengan menggunakan kondisi keoptimalan tersebut akan

ditentukan solusi analitik dan numerik bagi beberapa permasalahan.

6

1.4. Batasan Masalah

Dalam tugas akhir ini, penulis memfokuskan permasalahan pada sistem kontrol yang

kontinu. Lebih jauh lagi, pembahasan hanya terfokus pada sistem deterministik,

bukan pada sistem stokastik.

1.5. Sistematika Penulisan

Tugas akhir ini dibagi menjadi beberapa bab. Bab I menjelaskan tentang latar

belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penulisan dari

tugas akhir. Pada bab II dijelaskan pemaparan mengenai kontrol optimal dan kalkulus

variasi, serta bagaimana menentukan kondisi keoptimalan bagi sistem kontinu. Bab

III menyajikan tentang penerapan teori kontrol optimal dalam sistem nonlinear

sederhana dan penentuan solusi analitik serta numerik atas beberapa permasalahan.

Pada Bab IV, penulis memberikan kesimpulan atas tugas akhir ini.

7

BAB 2

KONTROL OPTIMAL BERDASARKAN PADA

KALKULUS VARIASI

Titik berat dari kontrol optimal adalah menentukan kontrol input 𝑢∗ 𝑡 (tanda (*)

menandakan kondisi optimal) yang akan membawa suatu proses (plant) 𝑥 (𝑡) dari

state awal ke state akhir yang memenuhi kondisi batas dan mengekstrimkan

(memaksimumkan atau meminimumkan) indeks performa 𝐽.

Gambar 2.1 Permasalahan Kontrol Optimal

8

Terdapat dua metode yang umum digunakan untuk mencari kontrol input. Metode

pertama adalah metode dynamic programming yang dikembangkan oleh R.E.

Bellman, sedangkan metode kedua menggunakan Maximum Principle yang

dikemukakan oleh L.S. Pontryagin. Pontryagin Maximum Principle menyatakan

bahwa lintasan state yang optimal 𝑥∗ , kontrol optimal 𝑢∗ , dan faktor pengali

Lagrange yang bersesuaian 𝜆∗ harus meminimumkan Hamiltonian. Pada tugas akhir

ini, pendekatan kalkulus variasi berdasarkan Pontryagin Maximum Principle akan

digunakan untuk menurunkan kondisi keoptimalan.

Dalam penurunan kondisi keoptimalan akan disinggung mengenai permasalahan

meminimalkan indeks performa dengan cara mencari variasi pertama dari fungsional

tertentu. Oleh karena itu, penulis merasa perlu untuk memaparkan beberapa konsep

dasar dari kalkulus variasi yang berguna untuk mencari kondisi keoptimalan.

2.1. Kalkulus Variasi

Definisi 1 : Suatu variabel 𝑥 dikatakan fungsi atas 𝑡 , dituliskan 𝑥(𝑡) , jika peta

(range) dari setiap nilai 𝑡 berkorespondensi dengan suatu nilai 𝑥.

Definisi 2 : Suatu variabel 𝐽 dikatakan fungsional atas fungsi 𝑓 𝑥 , dituliskan

𝐽 = 𝐽 𝑓 𝑥 , jika untuk setiap fungsi 𝑓(𝑥) berkorespondensi suatu nilai 𝐽.

Definisi 3 : Jika 𝑞 dan 𝑞 + ∆𝑞 adalah elemen-elemen dimana fungsi 𝑓 terdefinisi,

maka increment dari fungsi 𝑓, dinotasikan dengan ∆𝑓, adalah

∆𝑓 ≜ 𝑓 𝑞 + ∆𝑞 − 𝑓(𝑞)

∆𝑓 bergantung pada 𝑞 dan ∆𝑞, untuk lebih eksplisit, notasikan ∆𝑓(𝑞, ∆𝑞).

9

Definisi 4 : Jika 𝑥 dan 𝑥 + 𝛿𝑥 adalah fungsi-fungsi dimana fungsional 𝐽 terdefinisi,

maka increment dari fungsional 𝐽, dinotasikan ∆𝐽, adalah

∆𝐽 ≜ 𝐽 𝑥 + 𝛿𝑥 − 𝐽(𝑥)

Untuk lebih eksplisit, notasikan ∆𝐽(𝑥, 𝛿𝑥), sedangan 𝛿𝑥 disebut variasi dari fungsi 𝑥.

Definisi 5 : Misalkan increment pada fungsi 𝑓 saat 𝑡∗ dideskripsikan sebagai

∆𝑓 ≜ 𝑓 𝑡∗ + ∆𝑡 − 𝑓(𝑡∗)

Dengan mengekspansi 𝑓 𝑡∗ + ∆𝑡 dengan deret Taylor di sekitar 𝑡∗, diperoleh

∆𝑓 = 𝑓 𝑡∗ + 𝑑𝑓

𝑑𝑡 ∗∆𝑡 +

1

2! 𝑑2𝑓

𝑑𝑡2 ∗

∆𝑡 2 + … − 𝑓(𝑡∗)

dimana

𝑑𝑓

𝑑𝑡 ∗∆𝑡 = 𝑓 𝑡∗ ∆𝑡 = 𝑑𝑓

𝑑𝑓 disebut diferensial atas fungsi 𝑓 pada titik 𝑡∗, sedangkan 𝑓 𝑡∗ adalah turunan

atau slope dari 𝑓 pada titik 𝑡∗. Dengan kata lain, diferensial 𝑑𝑓 adalah aproksimasi

orde pertama (linear) terhadap increment ∆𝑓.

10

Gambar 2.1.1 Increment ∆𝑓, Diferensial 𝑑𝑓, dan Turunan 𝑓 dari Fungsi 𝑓(𝑡)

Definisi 6 : Misalkan increment pada fungsional 𝐽 dideskripsikan sebagai

∆𝐽 ≜ 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 − 𝐽(𝑥(𝑡)

dengan mengekspansi 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 menggunakan deret Taylor, diperoleh

∆𝐽 = 𝐽 𝑥 𝑡 +𝜕𝐽

𝜕𝑥𝛿𝑥 𝑡 +

1

2!

𝜕2𝐽

𝜕𝑥2 𝛿𝑥 𝑡

2+ …− 𝐽 𝑥 𝑡

=𝜕𝐽

𝜕𝑥𝛿𝑥 𝑡 +

1

2!

𝜕2𝐽


2+ …

= 𝛿𝐽 + 𝛿2𝐽 + ⋯

dimana,

𝛿𝐽 =𝜕𝐽

𝜕𝑥𝛿𝑥 𝑡 dan 𝛿2𝐽 =

1

2!

𝜕2𝐽


2

11

disebut variasi pertama dan variasi kedua dari fungsional 𝐽 . Variasi 𝛿𝐽 adalah

aproksimasi orde pertama (linear) dari increment ∆𝐽.

Gambar 2.1.2 Increment ∆𝐽 dan Variasi Pertama 𝛿𝐽 dari Fungsional 𝐽

Lema 1 : Hubungan antara variasi dan diferensial

Misalkan 𝑥(𝑡) adalah fungsi kontinu dalam waktu 𝑡 , dan diferensial 𝑑𝑥(𝑡) dan 𝑑𝑡

tidak independen. Namun dapat didefinisikan perubahan kecil dalam 𝑥(𝑡) yang

independen terhadap 𝑑𝑡 . Definisikan variasi dalam 𝑥(𝑡) , yaitu 𝛿𝑥(𝑡) , sebagai

perubahan (increment) dalam 𝑥(𝑡) saat 𝑡 dibuat tetap.

Untuk mengilustrasikan hubungan antara 𝑑𝑥, 𝛿𝑥, dan 𝑑𝑡, dapat diperhatikan gambar

berikut.

12

Gambar 2.1.2 Hubungan antara Variasi 𝛿𝑥 dan Diferensial 𝑑𝑥

Pada gambar ditunjukkan fungsi asal 𝑥(𝑡) dan fungsi yang bertetangga 𝑥 𝑡 + 𝑑𝑥(𝑡)

dalam selang [𝑡0, 𝑇].

Hubungan antara variasi 𝛿𝑥 dan diferensial 𝑑𝑥 dinyatakan dalam persamaan berikut

𝑑𝑥 𝑇 = 𝛿𝑥 𝑇 + 𝑥 𝑇 𝑑𝑇 (2.1.1)

Lema 2 : Aturan Leibniz untuk fungsional

Jika 𝑥(𝑡) ∈ 𝑹𝑛 adalah fungsi dari 𝑡 dan 𝐽 𝑥 = ℎ 𝑥 𝑡 , 𝑡 𝑑𝑡𝑇

𝑡0 maka

𝑑𝐽 = ℎ 𝑥 𝑇 ,𝑇 𝑑𝑇 − ℎ 𝑥 𝑡0 , 𝑡0 𝑑𝑡0 + ℎ𝑥𝑇(𝑥 𝑡 , 𝑡)𝛿𝑥(𝑡) 𝑑𝑡

𝑇

𝑡0

dengan notasi

ℎ𝑥 ≜𝜕ℎ

𝜕𝑥

13

Definisi 7 : Suatu fungsional 𝐽 dikatakan memiliki nilai optimum relatif di 𝑥∗ jika

terdapat suatu 𝜖 sehingga untuk setiap fungsi 𝑥 dalam domain Ω memenuhi 𝑥 −

𝑥∗ < 𝜖 . Dengan kata lain, jika

∆𝐽 = 𝐽 𝑥 − 𝐽(𝑥∗) ≥ 0

maka 𝐽(𝑥∗) adalah nilai minimum relatif. Dan sebaliknya, jika

∆𝐽 = 𝐽 𝑥 − 𝐽(𝑥∗) ≤ 0

maka 𝐽(𝑥∗) adalah nilai maksimum relatif. Jika hubungan di atas terpenuhi untuk 𝜖

yang cukup besar, maka 𝐽(𝑥∗) adalah nilai optimum global.

Teorema 1 : Teorema Dasar Kalkulus Variasi

Supaya suatu nilai 𝑥∗(𝑡) menjadi suatu nilai yang optimum, variasi pertama dari 𝐽

harus bernilai 0 pada saat 𝑥∗(𝑡), dalam hal ini 𝛿𝐽(𝑥∗ 𝑡 , 𝛿𝑥 𝑡 ) = 0, untuk semua

nilai yang memungkinkan dari 𝛿𝑥 𝑡 .

2.2. Kontrol Optimal Berdasarkan pada Kalkulus Variasi

Tinjau sistem dinamik nonlinear (1.2.1)

𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡

dengan indeks performa (1.2.2)

𝐽(𝑡0) = 𝜙 𝑥 𝑇 ,𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡𝑇

𝑡0

serta fungsi pembatas pada state akhir (1.2.3)

𝜓 𝑥 𝑇 ,𝑇 = 0

14

Berikut akan diturunkan kondisi yang diperlukan untuk keoptimalan dengan

menerapkan kalkulus variasi terhadap indeks performa yang merupakan subjek bagi

fungsi pembatas (1.2.1) dan (1.2.3).

Untuk mendekatkan fungsi pembatas (1.2.1) dan (1.2.3) dengan indeks performa

maka persamaan (1.2.2) dimodifikasi dengan faktor pengali Lagrange. Karena

𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 berlaku untuk setiap 𝑡 ∈ [𝑡0, 𝑇] maka dibutuhkan faktor

pengali Lagrange yang bersesuaian, yaitu 𝜆(𝑡) ∈ 𝑹𝑛 yang merupakan fungsi dalam 𝑡.

Sedangkan untuk 𝜓 𝑥 𝑇 ,𝑇 yang hanya berlaku saat 𝑇 , faktor pengali Lagrange

yang bersesuaian adalah 𝑣 ∈ 𝑹𝑝 .

Modifikasi indeks performa (1.2.2) dengan menggunakan faktor pengali Lagrange

tersebut dan diperoleh

𝐽 = 𝜙 𝑥 𝑇 , 𝑇 + 𝑣𝑇𝜓 𝑥 𝑇 ,𝑇

+ [𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 +𝜆𝑇(𝑡) 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 − 𝑥 (𝑡) ]𝑑𝑡𝑇

𝑡0 (2.2.1)

Definisikan Hamiltonian 𝐻(𝑥 𝑡 , 𝑢 𝑡 , 𝑡) untuk mendekatkan fungsi biaya dengan

fungsi pembatas

𝐻 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 = 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 + 𝜆𝑇𝑓(𝑥 𝑡 , 𝑢 𝑡 , 𝑡) (2.2.2)

Indeks performa (2.2.1) dapat dituliskan ulang sebagai

𝐽 = 𝜙 𝑥 𝑇 ,𝑇 + 𝑣𝑇𝜓 𝑥 𝑇 ,𝑇 + [𝐻 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 − 𝜆𝑇𝑥 (𝑡)]𝑑𝑡𝑇

𝑡0 (2.2.3)

Untuk menerapkan kondisi yang diperlukan bagi keoptimalan, dalam hal ini 𝛿𝐽 = 0,

terlebih dahulu perlu dihitung variasi 𝛿𝐽 . Dengan menggunakan aturan Leibniz pada

Lema 2 dan dengan mengasumsikan variasi independen dalam 𝛿𝑢( ),𝛿𝑥 ,𝛿𝑣, 𝛿𝜆,

dan 𝛿𝑡 diperoleh variasi pertama dari persamaan (2.2.3), yaitu

15

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 𝑑𝑥(𝑇) + 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡

𝑇 𝑥 𝑇 ,𝑇 𝑣 𝑑𝑇

+𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 (𝑇) 𝑑𝑇 − 𝐻 − 𝜆𝑇 𝑡0 𝑥 (𝑡0) 𝑑𝑡0

+ 𝐻𝑥𝑇𝛿𝑥 𝑡 + 𝐻𝑢

𝑇𝛿𝑢 𝑡 − 𝜆𝑇 𝑡 𝛿𝑥 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 𝛿𝜆(𝑡) 𝑑𝑡

𝑡𝑓

𝑡0

Disusun ulang menjadi

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 𝑑𝑥 𝑇

+ 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 + 𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣

− 𝐻 − 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0

+ 𝐻𝑥𝑇𝛿𝑥 𝑡 + 𝐻𝑢

𝑇𝛿𝑢 𝑡 − 𝜆𝑇 𝑡 𝛿𝑥 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 𝛿𝜆(𝑡) 𝑑𝑡

𝑡𝑓𝑡0

(2.2.4)

Dengan menggunakan pengintegralan parsial untuk 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡𝑇

𝑡0,

penyederhanaan pada variasi 𝑥 dapat dilakukan.

− 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡𝑇

𝑡0= −𝜆𝑇 𝑇 𝛿𝑥 𝑇 + 𝜆𝑇 𝑡0 𝛿𝑥 𝑡0 + 𝜆 𝑇 𝑡 𝛿𝑥 𝑡

𝑇

𝑡0𝑑𝑡 (2.2.5)

Berdasarkan persamaan (2.1.1), hubungan antara variasi 𝛿𝑥 dan diferensial 𝑑𝑥 adalah

𝛿𝑥 𝑡 = 𝑑𝑥 𝑡 − 𝑥 𝑡 𝑑𝑡

dimana 𝑥(𝑡) fungsi kontinu atas 𝑡 , serta turunan 𝑑𝑥(𝑡) dan 𝑑𝑡 saling

bergantung. 𝛿𝑥(𝑡) adalah variasi dari 𝑥(𝑡) , increment kecil dalam 𝑥(𝑡) saat 𝑡

dianggap tetap, yang saling bebas dengan 𝑑𝑡. Term dalam 𝑡 = 𝑇 bergantung pada

𝑑𝑥(𝑡) dan 𝑑𝑇.

𝛿𝑥 𝑇 didefinisikan dalam 𝑑𝑥 𝑇 dan 𝑑𝑇, begitu pula dengan 𝛿𝑥 𝑡0 didefinisikan

dalam 𝑑𝑥 𝑡0 dan 𝑑𝑡0, menjadi

−𝜆𝑇 𝑇 𝛿𝑥 𝑇 = −𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 (2.2.6)

16

𝜆𝑇 𝑡0 𝛿𝑥 𝑡0 = 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0 − 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 (2.2.7)

Substitusikan persamaan (2.2.6) dan (2.2.7) ke persamaan (2.2.5), maka akan

diperoleh

− 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡𝑇

𝑡0

= −𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0

−𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 + 𝜆 𝑇 𝑡 𝛿𝑥 𝑡 𝑇

𝑡0𝑑𝑡 (2.2.8)

Kemudian substitusikan penyederhanaan pada persamaan (2.2.8) ke persamaan

(2.2.4).

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇

+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇

+𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣 − 𝐻 − 𝜆𝑇 𝑡0 𝑥 𝑡0 + 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0

+ (𝐻𝑥𝑇 + 𝜆 𝑇 𝑡 )𝛿𝑥 𝑡 + 𝐻𝑢

𝑇𝛿𝑢 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 )𝛿𝜆(𝑡) 𝑑𝑡

𝑡𝑓

𝑡0

Disederhanakan kembali menjadi

𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣

+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣 + 𝐻 𝑑𝑇 − 𝐻𝑑𝑡0 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0

+ (𝐻𝑥𝑇 + 𝜆 𝑇 𝑡 )𝛿𝑥 𝑡 + 𝐻𝑢

𝑇𝛿𝑢 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 )𝛿𝜆(𝑡) 𝑑𝑡

𝑡𝑓

𝑡0

Berdasarkan teori Lagrange, nilai minimum (ekstremum) dari 𝐽 dicapai pada keadaan

yang sama dengan nilai minimum dari 𝐽 , yaitu saat 𝛿𝐽 = 0. Untuk memenuhi keadaan

ini, nilai-nilai dari semua koefisien pada increment bebas 𝛿𝜆, 𝑑𝑣, 𝛿𝑢, 𝛿𝑝, 𝛿𝑥 𝑇 , 𝛿𝑥(𝑡)

dijadikan 0.

17

𝑑𝑣 = 0 → 𝜓𝑇 𝑥 𝑇 ,𝑇 = 0

𝛿𝜆 = 0 → 𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 = 0

𝑥 𝑡 =𝜕𝐻

𝜕𝜆 𝑡 = 𝑓

𝛿𝑥 = 0 → 𝐻𝑥𝑇 + 𝜆 𝑇 𝑡 = 0

𝜆 𝑡 = −𝜕𝐻

𝜕𝑥

𝛿𝑢 = 0 → 0 = 𝐻𝑢𝑇 =

𝜕𝐻

𝜕𝑢

𝑑𝑥 𝑇 = 0 → 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 − 𝜆𝑇 𝑇 = 0

𝜙𝑥 𝑥 𝑇 ,𝑇 − 𝜆𝑇 𝑇 = 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣

𝑑𝑇 = 0 → 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 = 0

𝐻 + 𝜙𝑡 𝑥 𝑇 ,𝑇 = −𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣

18

Tabel 1 Syarat keoptimalan bagi fungsi kontinu

Persamaan Variasi

Model

Pertumbuhan

Sistem

𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡

𝑡 ≥ 𝑡0, 𝑡0 𝑡𝑒𝑡𝑎𝑝

Indeks Performa

𝐽(𝑡0) = 𝜙 𝑥 𝑇 ,𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡𝑡𝑓

𝑡0

Fungsi pembatas

bagi state akhir

𝜓 𝑥 𝑇 , 𝑇 = 0

𝑑𝑣

Persamaan State

𝑥 𝑡 =𝜕𝐻

𝜕𝜆 𝑡

𝛿𝜆

Persamaan

Costate

𝜆 𝑡 = −𝜕𝐻

𝜕𝑥

𝛿𝑥

Kondisi

Kestasioneran

Input

𝜕𝐻

𝜕𝑢= 0

𝛿𝑢

Kondisi Pembatas

pada waktu akhir

𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇

+ 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣 + 𝐻 𝑑𝑇 = 0

𝑑𝑥(𝑇)

𝑑𝑇

19

BAB 3

APLIKASI KONTROL OPTIMAL

DALAM SISTEM KONTINU

3.1. Prinsip Hamilton dalam Dinamika Klasik

Dinamika klasik adalah salah satu cabang ilmu Mekanika klasik, yang mempelajari

ilmu fisika tentang gaya yang bekerja pada benda. Dinamika partikel dideskripsikan

oleh hukum-hukum Newton tentang gerak, terutama oleh hukum kedua Newton.

Hukum ini menyatakan, "Sebuah benda yang memperoleh pengaruh gaya atau

interaksi akan bergerak sedemikian rupa sehingga laju perubahan waktu dari

momentum sama dengan gaya tersebut".

Jika ditinjau gerak partikel pada suatu permukaan bidang, dapat diperhatikan bahwa

diperlukan adanya gaya tertentu yakni gaya konstrain yang berperan mempertahankan

kontak antara partikel dengan permukaan bidang. Namun tak selamanya gaya

konstrain yang beraksi terhadap partikel dapat diketahui. Pendekatan Newtonian

memerlukan informasi gaya total yang bekerja pada partikel. Gaya total ini

merupakan total dari keseluruhan gaya yang beraksi pada partikel, termasuk juga

gaya konstrain. Oleh karena itu, jika dalam kondisi khusus terdapat gaya yang tidak

dapat diketahui, maka pendekatan Newtonian tidak berlaku, sehingga diperlukan

pendekatan baru dengan meninjau kuantitas fisis lain yang merupakan karakteristik

partikel, misal energi totalnya. Pendekatan ini dilakukan dengan menggunakan

prinsip Hamilton, dimana persamaan Lagrange dapat diturunkan dari prinsip tersebut.

20

Prinsip Hamilton untuk sistem konservatif yang seringkali ditemukan dalam fisika

klasik menyatakan bahwa “Dari seluruh lintasan yang mungkin bagi sistem dinamik

untuk berpindah dari satu titik ke titik lain dalam interval waktu spesifik (konsisten

dengan sembarang konstrain), lintasan nyata yang diikuti sistem dinamis adalah

lintasan yang meminimumkan integral waktu selisih antara energi kinetik dengan

energi potensial.” (Marion 1965).

Sesuai dengan prinsip Hamiltonian, persamaan gerak partikel yang dinyatakan oleh

persamaan Lagrange dapat diperoleh dengan meninjau energi kinetik dan energi

potensial partikel tanpa perlu meninjau gaya yang beraksi pada partikel. Energi

kinetik partikel dalam koordinat kartesian adalah fungsi dari kecepatan, energi

potensial partikel yang bergerak dalam medan gaya konservatif adalah fungsi dari

posisi.

Lebih jauh lagi, Lagrangian didefinisikan sebagai selisih antara energi kinetik dan

energi potensial. Dari prinsip Hamilton, dapat diturunkan persamaan Lagrange

dengan menggunakan kondisi kestasioneran. Persamaan Lagrange merupakan

persamaan gerak partikel sebagai fungsi dari koordinat, kecepatan, dan waktu.

Fungsi Lagrangian terhadap waktu merupakan konsekuensi dari fungsi konstrain

terhadap waktu atau dikarenakan persamaan transformasi yang menghubungkan

koordinat kartesian dan koordinat umum memuat fungsi atas waktu.

a. Persamaan Gerak Lagrange

Persamaan Lagrange untuk pergerakan dapat diturunkan dari Prinsip Hamilton

dengan mendefinisikan

𝑞 ≜ vektor koordinat,

21

𝑢 = 𝑞 ≜ vektor kecepatan,

𝑈(𝑞) ≜ energi potensial,

𝑇(𝑞, 𝑢) ≜ energi kinetik,

𝐿 𝑞, 𝑢 ≜ 𝑇 𝑞, 𝑢 − 𝑈(𝑞) , Lagrangian dari sistem.

Model pertumbuhan dideskripsikan dengan

𝑞 = 𝑢 ≜ 𝑓(𝑞, 𝑢) (3.1.1)

dimana fungsi 𝑓 diberikan oleh bagian fisika dari permasalahan. Untuk mencari

lintasan gerak, prinsip Hamilton mengatakan bahwa indeks performa berikut

harus diminimalkan

𝐽 0 = 𝐿 𝑞, 𝑢 𝑑𝑡𝑇

0 (3.1.2)

dengan Hamiltonian

𝐻 = 𝐿 + 𝜆𝑇𝑢 (3.1.3)

Berdasarkan tabel keoptimalan, untuk meminimalkan indeks performa maka

kondisi-kondisi berikut harus dipenuhi

−𝜆 =𝜕𝐻

𝜕𝑞=

𝜕𝐿

𝜕𝑞 (3.1.4)

0 =𝜕𝐻

𝜕𝑢=

𝜕𝐿

𝜕𝑢+ 𝜆 (3.1.5)

Setelah mengkombinasikan kedua persamaan di atas diperoleh Persamaan Gerak

Lagrange

𝜕𝐿

𝜕𝑞−

𝑑

𝑑𝑡

𝜕𝐿

𝜕𝑞 = 0 (3.1.6)

22

Perlu ditekankan bahwa dalam konteks ini, persamaan costate dan kondisi

kestasioneran ekivalen dengan Persamaan Lagrange. Dalam konteks yang lebih

umum dari permasalahan variasi, persamaan di atas disebut Persamaan Euler.

Persamaan costate dan kondisi kestasioneran pada tabel keoptimalan adalah

formulasi alternatif dari persamaan Euler.

b. Persamaan Gerak Hamilton

Jika vektor momentum didefinisikan dengan

𝜆 = −𝜕𝐿

𝜕𝑞 (3.1.7)

maka persamaan gerak dapat dituliskan dalam bentuk Hamiltonian dengan

𝑞 =𝜕𝐻

𝜕𝜆 (3.1.8)

−𝜆 =𝜕𝐻

𝜕𝑞 (3.1.9)

Jadi, dalam permasalahan kontrol optimal, persamaan state dan costate adalah

generalisasi dari Persamaan Gerak Hamilton.

23

3.2. Jarak Terdekat antara Dua Titik

Persamaan panjang kurva 𝑥(𝑡) yang bergantung pada parameter 𝑡 dengan 𝑎 ≤ 𝑡 ≤ 𝑏

diberikan oleh

𝐽 = 1 + 𝑥 2(𝑡)𝑏

𝑎𝑑𝑡 (3.2.1)

Untuk menyatakan bahwa kurva 𝑥(𝑡) menghubungkan dua titik di bidang, 𝑎, 𝐴 dan

(𝑏, 𝐵), maka perlu ditetapkan kondisi-kondisi batas berikut

𝑥 𝑎 = 𝐴 (3.2.2)

𝑥 𝑏 = 𝐵 (3.2.3)

Berikutnya, akan dicari kurva 𝑥(𝑡) yang menghubungkan 𝑎, 𝐴 dan (𝑏, 𝐵) serta

meminimalkan 𝐽.

Model pertumbuhan didefinisikan dengan

𝑥 = 𝑢 (3.2.4)

dan 𝐽 jika dituliskan dalam 𝑢 akan menjadi

𝐽 = 1 + 𝑢2𝑏

𝑎𝑑𝑡 (3.2.5)

dengan Hamiltonian

𝐻 = 1 + 𝑢2 + 𝜆𝑢 (3.2.6)

Tabel keoptimalan memberikan kondisi

𝑥 = 𝐻𝜆 = 𝑢 (3.2.7)

−𝜆 = 𝐻𝑥 = 0 (3.2.8)

24

0 = 𝐻𝑢 = 𝜆 +𝑢

1 + 𝑢2 (3.2.9)

Untuk mencari 𝑢 yang optimal, dari persamaan terakhir diperoleh

𝑢 =𝜆

1 + 𝜆2 (3.2.10)

namun dari persamaan (3.2.8) diketahui bahwa 𝜆 konstan, dengan demikian maka 𝑢

yang bernilai konstan merupakan solusi optimal.

Kurva 𝑥(𝑡) yang optimal memiliki persamaan

𝑥 𝑡 = 𝑐1𝑡 + 𝑐2 (3.2.11)

Untuk mencari nilai 𝑐1 dan 𝑐2 dapat digunakan kondisi batas yang telah ditetapkan

sebelumnya, dan diperoleh

𝑥 𝑡 = 𝐴 − 𝐵 𝑡 + 𝑎𝐵 − 𝑏𝐴

𝑎 − 𝑏 (3.2.12)

yang merupakan persamaan garis lurus sebagai lintasan optimal antara dua titik.

3.3. Kontrol Temperatur dalam Ruangan

Misalkan suatu keadaan dimana dibutuhkan energi seminimal mungkin untuk

memanaskan ruangan. Jika 𝜃(𝑡) adalah temperatur ruangan pada saat 𝑡 , 𝜃𝑎 adalah

temperatur udara di luar ruangan (konstan), dan 𝑢(𝑡) adalah laju perubahan

temperatur ke dalam ruangan, maka model dinamiknya adalah

𝜃 = −𝑎 𝜃 − 𝜃𝑎 + 𝑏𝑢 (3.3.1)

untuk suatu konstanta 𝑎 dan 𝑏, yang bergantung pada redaman panas di ruangan, dan

sebagainya. Dengan menuliskan state sebagai

25

𝑥 𝑡 ≜ 𝜃 𝑡 − 𝜃𝑎 (3.3.2)

persamaan state dapat pula dinyatakan dengan

𝑥 = −𝑎𝑥 + 𝑏𝑢 (3.3.3)

Untuk mengontrol temperatur ruangan pada suatu interval waktu tetap [0, 𝑇] dengan

energi seminimal mungkin, definisikan indeks performa sebagai berikut

𝐽 0 =1

2 𝑢2 𝑡 𝑑𝑡

𝑇

0 (3.3.4)

Hamiltonian yang digunakan adalah

𝐻 =𝑢2

2+ 𝜆 −𝑎𝑥 + 𝑏𝑢 (3.3.5)

Berdasarkan tabel keoptimalan, kontrol optimal 𝑢(𝑡) dapat ditentukan dengan

menyelesaikan

𝑥 = 𝐻𝜆 = −𝑎𝑥 + 𝑏𝑢 (3.3.6)

𝜆 = −𝐻𝑥 = 𝑎𝜆 (3.3.7)

0 = 𝐻𝑢 = 𝑢 + 𝑏𝜆 (3.3.8)

Kondisi kestasioneran mengatakan bahwa kontrol optimal diberikan oleh

𝑢 𝑡 = −𝑏𝜆(𝑡) (3.3.9)

sehingga untuk menetukan 𝑢∗(𝑡) diperlukan untuk mencari costate yang optimal

𝜆∗(𝑡) terlebih dahulu.

Substitusikan (3.3.9) ke (3.3.6) dan diperoleh persamaan state dan costate

𝑥 = −𝑎𝑥 − 𝑏2𝜆 (3.3.10a)

26

𝜆 = 𝑎𝜆 (3.3.10b)

yang harus diselesaikan untuk 𝜆∗(𝑡) dan lintasan state yang optimal 𝑥∗(𝑡).

Walaupun final costate 𝜆(𝑇) belum diketahui, namun persamaan di atas dapat

diselesaikan dengan mengasumsikan 𝜆(𝑇) telah diketahui. Solusi untuk (3.3.10b)

adalah

𝜆∗ 𝑡 = 𝑒−𝑎 𝑇−𝑡 𝜆(𝑇) (3.3.11)

dan dengan menggunakan hasil ini untuk (3.3.10a), diperoleh

𝑥 = −𝑎𝑥 − 𝑏2𝜆(𝑇)𝑒−𝑎(𝑇−𝑡) (3.3.12)

Terapkan transformasi Laplace pada persamaan ini, dan dihasilkan

𝑋 𝑠 =𝑥(0)

𝑠 + 𝑎−

𝑏2𝜆(𝑇)𝑒−𝑎𝑇

𝑠 + 𝑎 (𝑠 − 𝑎)

=𝑥(0)

𝑠 + 𝑎−

𝑏2

𝑎𝜆 𝑇 𝑒−𝑎𝑇

−12

𝑠 + 𝑎+

12

𝑠 − 𝑎 (3.3.13)

sehingga

𝑥∗ 𝑡 = 𝑥 0 𝑒−𝑎𝑇 −𝑏2

𝑎𝜆 𝑇 𝑒−𝑎𝑇 sinh 𝑎𝑡 (3.3.14)

Persamaan (3.3.11) dan (3.3.14) memberikan costate yang optimal 𝜆∗(𝑡) dan state

yang optimal 𝑥∗(𝑡) dengan catatan bahwa final costate 𝜆(𝑇) belum diketahui. State

awal 𝑥 0 diberikan.

Lebih jauh lagi, objektif dari permasalahan kontrol perlu diklasifikasikan menjadi dua

kasus, yang masing-masing akan memberikan nilai 𝜆(𝑇).

27

a. State Akhir Tetap

Misalkan temperatur awal ruangan sama dengan 𝜃𝑎 = 60о. Kemudian

𝑥 0 = 0о (3.3.15)

Diasumsikan bahwa objektif dari permasalahan kontrol adalah untuk membawa

temperatur akhir 𝜃(𝑇) tepat ke 70о selama 𝑇 detik, sehingga state akhir bernilai

tetap yaitu

𝑥 𝑇 = 10о (3.3.16)

Karena waktu akhir dan state akhir keduanya bernilai tetap, maka 𝑑𝑇 dan 𝑑𝑥(𝑇)

keduanya bernilai 0, dan kondisi batas (pada tabel keoptimalan) terpenuhi.

Dengan menggunakan persamaan (3.3.15) dan (3.3.16) akan ditentukan 𝜆(𝑇) ;

kemudian akan dicari 𝜆(𝑡) dengan menggunakan persamaan (3.3.11) dan mencari

kontrol optimal dengan memakai persamaan (3.3.9). Untuk mencari 𝜆(𝑇) ,

gunakan persamaan (3.3.14) untuk mendapatkan

𝑥 𝑇 = 𝑥 0 𝑒−𝑎𝑇 −𝑏2

2𝑎𝜆 𝑇 1 − 𝑒−2𝑎𝑇 (3.3.17)

Substitusikan persamaan (3.3.15) dan (3.3.16) dan diperoleh final costate

𝜆 𝑇 = −20𝑎

𝑏2 1 − 𝑒−2𝑎𝑇 (3.3.18)

maka lintasan costate yang optimal adalah

𝜆∗ 𝑡 = −10𝑎𝑒𝑎𝑡

𝑏2 sinh 𝑎𝑇 (3.3.19)

28

dan akhirnya laju perubahan temperatur yang optimal diberikan oleh (3.3.9) atau

𝑢∗ 𝑡 =10𝑎𝑒𝑎𝑡

𝑏 sinh 𝑎𝑇 0 ≤ 𝑡 ≤ 𝑇 (3.3.20)

Untuk memeriksa solusi, terapkan 𝑢∗ 𝑡 ke dalam sistem (3.3.3). Kemudian

selesaikan untuk lintasan state, diperoleh

𝑥∗ 𝑡 = 10sinh 𝑎𝑡

sinh 𝑎𝑇 (3.3.21)

𝑥∗ 𝑡 = 10

sesuai dengan hasil yang diharapkan.

b. State Akhir Bebas

Misalkan state akhir tidak ditetapkan bernilai 10о seperti kasus sebelumnya.

Yang diharapkan adalah fungsi kontrol 𝑢(𝑡) meminimalkan

𝐽 0 =1

2𝑠(𝑥 𝑇 − 10)2 +

1


𝑇

0

(3.3.22)

untuk suatu bobot 𝑠 (misal 𝑠 ∈ 𝑹) yang dipilih kemudian. Jika nilai 𝑠 cukup

besar, maka solusi optimal akan memiliki nilai 𝑥(𝑇) mendekati 10о , karena

berikutnya term pertama akan berkontribusi kecil terhadap biaya.

Berdasarkan tabel keoptimalan, persamaan state dan costate diberikan oleh

(3.3.10), dan kontrol optimal oleh (3.3.9). Dengan demikian, (3.3.11) dan (3.3.14)

tetap valid.

Kondisi awal tetap diberikan oleh (3.3.15), namun kondisi akhir harus ditentukan

dengan menggunakan kondisi batas. Waktu akhir 𝑇 bernilai tetap, sehingga

29

𝑑𝑇 = 0 dan term ke dua dari kondisi batas (pada tabel) otomatis bernilai 0.

Karena 𝑥(𝑇) tidak tetap, 𝑑𝑥(𝑇) tidak nol (sama seperti pada kasus state akhir

tetap).

Dengan memandang kondisi di atas, dibutuhkan bahwa

𝜆 𝑇 = 𝜕𝜙

𝜕𝑥 𝑇

= 𝑠 𝑥 𝑇 − 10 (3.3.23)

Dari (3.3.15) dan (3.3.23) akan ditentukan 𝜆(𝑇).

Untuk itu, perhatikan bahwa

𝑥 𝑇 =𝜆 𝑇

𝑠+ 10 (3.3.24)

Kombinasikan (3.3.24), (3.3.15), dan (3.3.17) kemudian selesaikan untuk final

costate diperoleh

𝜆 𝑇 =−20𝑎𝑠

2𝑎 + 𝑏2𝑠 1 − 𝑒−2𝑎𝑇 (3.3.25)

Dengan menggunakan (3.3.11) didapatkan lintasan costate yang optimal

𝜆∗ 𝑡 =−10𝑎𝑠𝑒𝑎𝑡

𝑎𝑒𝑎𝑇 + 𝑠𝑏2 sinh 𝑎𝑇 (3.3.26)

Akhirnya diperoleh kontrol optimal

𝑢∗ 𝑡 =10𝑎𝑏𝑠𝑒𝑎𝑡


Untuk memeriksa kebenaran solusi, simulasikan fungsi kontrol dengan

menggunakan 𝑢∗ 𝑡 dalam model pertumbuhan (3.3.3). Dengan menyelesaikan

untuk lintasan state yang optimal diperoleh

30

𝑥∗ 𝑡 =10𝑠𝑏2 sinh 𝑎𝑡


Pada waktu akhir,

𝑥∗ 𝑇 =10𝑠𝑏2 sinh 𝑎𝑇


3.4. Permasalahan Titik Potong dan Titik Temu

a. Formulasi Masalah

Geometri dari permasalahan ditunjukkan pada gambar, dimana 𝑦(𝑡) dan 𝑣(𝑡)

masing-masing adalah posisi vertikal dan kecepatan dari pesawat pengejar 𝐴

relatif terhadap pesawat target 𝐴𝑡 , yang diasumsikan sedang beristirahat. Jarak

horisontal awal pesawat pengejar terhadap pesawat target adalah 𝐷. Kecepatan

horisontal pengejar relatif terhadap target 𝐴𝑡 adalah 𝑉; sehingga waktu akhir 𝑇,

dimana kedua pesawat akan memiliki jarak horisontal yang sama, adalah tetap

dan diketahui bernilai

𝑇 = 𝑡0 +𝐷

𝑉 (3.4.1)

dengan sudut penglihatan 𝜎(𝑡).

Dalam permasalahan titik temu, diinginkan agar posisi akhir 𝑦(𝑇) dan kecepatan

akhir 𝑣(𝑇) keduanya bernilai 0. Namun dalam permasalahan titik potong,

kecepatan akhir tidak dipentingkan, meskipun diharapkan bahwa posisi akhir

𝑦(𝑇) adalah 0.

31

Gambar 3.4.1 Geometri dari Permasalahan Titik Potong dan Titik Temu

Persamaan dinamik dari pergerakan vertikal dinyatakan oleh persamaan state

𝑦 = 𝑣 (3.4.2)

𝑣 = 𝑢 (3.4.3)

dimana 𝑢(𝑡) adalah percepatan vertikal. Kemudian indeks performa yang

digunakan adalah

𝐽 𝑡0 =𝑠𝑦𝑦

2(𝑇)

2+

𝑠𝑣𝑣2(𝑇)

2+

1


𝑇

𝑡0

(3.4.4)

Untuk titik potong, 𝑠𝑣 = 0 dan 𝑠𝑦 dibuat bernilai cukup besar sehingga kontrol

optimal akan menghasilkan 𝑦2(𝑇) yang kecil. Untuk titik temu, 𝑠𝑣 dan 𝑠𝑦

keduanya dipilih bernilai besar.

b. Solusi Permasalahan

Kontrol optimal akan dipilih sedemikian rupa sehingga meminimalkan (3.4.4).

32

Setiap komponen pada state harus memiliki faktor pengali Lagrange yang

bersesuaian; oleh karena itu ambil 𝜆 ≜ [𝜆𝑦 , 𝜆𝑣]𝑇 dan Hamiltonian

𝐻 =1

2𝑢2 + 𝑣𝜆𝑦 + 𝑢𝜆𝑣 (3.4.5)

maka persamaan costate adalah

𝜆 𝑦 = −𝜕𝐻

𝜕𝑦= 0 (3.4.6)

𝜆 𝑣 = −𝜕𝐻

𝜕𝑣= −𝜆𝑦 (3.4.7)

Kondisi kestasioneran adalah

0 =𝜕𝐻

𝜕𝑢= 𝑢 + 𝜆𝑣 (3.4.8)

sehingga kontrol optimal adalah negatif dari faktor pengali kecepatan

𝑢 𝑡 = −𝜆𝑣(𝑡) (3.4.9)

Kondisi awal adalah

𝑦 𝑡0 ,𝑣 𝑡0 diberikan. (3.4.10)

Kondisi akhir ditentukan oleh kondisi batas pada tabel keoptimalan. Karena

waktu akhir tetap, 𝑑𝑇 = 0, maka hanya term pertama yang memberikan kondisi

mengikat.

𝜆𝑦 𝑇 =𝜕𝜙

𝜕𝑦 𝑇 = 𝑠𝑦𝑦 𝑇 (3.4.11)

𝜆𝑣 𝑇 =𝜕𝜙

𝜕𝑣 𝑇 = 𝑠𝑣𝑣 𝑇 (3.4.12)

33

Berikutnya akan diselesaikan permasalahan nilai batas yang didefinisikan oleh

persamaan state dan costate dengan 𝑢 seperti pada (3.4.9) dan kondisi batas

(3.4.10) – (3.4.12). Seperti pada 3.3, 𝜆𝑦 𝑇 dan 𝜆𝑣 𝑇 diasumsikan telah

diketahui. Persamaan costate diselesaikan secara mundur terhadap waktu, dan

persamaan state kemudian diselesaikan secara maju terhadap waktu.

Dengan mengintegralkan kedua ruas pada (3.4.6) dari 𝑡 hingga 𝑇 diperoleh

konstanta komponen costate, yaitu

𝜆𝑦 𝑡 = 𝜆𝑦 𝑇 ≜ 𝜆𝑦 (3.4.13)

Integralkan (3.4.7), memberikan

𝜆𝑣 𝑇 − 𝜆𝑣 𝑡 = −(𝑇 − 𝑡)𝜆𝑦

atau

𝜆𝑣 𝑡 = 𝜆𝑣 𝑇 + (𝑇 − 𝑡)𝜆𝑦 (3.4.14)

Selanjutnya, untuk menyederhanakan diasumsikan bahwa 𝑡0 = 0 . Kemudian

substitusikan kontrol (3.4.9) ke (3.4.3) dan dihasilkan

𝑣 = −𝜆𝑣 𝑡 (3.4.15)

Dengan menggunakan (3.4.14) dan mengintegralkan kedua ruas untuk [0, 𝑡]

diperoleh persamaan kuadrat

𝑣 𝑡 = 𝑣 0 − 𝑡 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +𝑡2

2𝜆𝑦 (3.4.16)

Substitusikan hasil ini ke dalam perhitungan dan integralkan (3.4.2) lalu diperoleh

persamaan kubik

𝑦 𝑡 = 𝑦 0 + 𝑤 0 −𝑡2

2 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +

𝑡3

6𝜆𝑦 (3.4.17)

34

Persamaan state dan costate telah diselesaikan dalam term 𝜆(𝑇) dan 𝑦 0 ,𝑣(0)

yang diberikan. Namun, final costate belum diketahui. Untuk mencarinya, dapat

digunakan hubungan (3.4.11) dan (3.4.12) antara final state dan final costate.

Setelah menggabungkan hubungan ini dengan (3.4.16) dan (3.4.17) didapat

𝜆𝑦 = 𝑠𝑦 𝑦 0 + 𝑇𝑣 0 −𝑇2

2 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +

𝑇3

6𝜆𝑦 (3.4.18)

dan

𝜆𝑣 𝑇 = 𝑠𝑣 𝑣 0 − 𝑇 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +𝑇2

2 𝜆𝑦 (3.4.19)

Kedua persamaan ini dapat dituliskan ulang sebagai

1 +

𝑠𝑦𝑇3

3

𝑠𝑦𝑇2

2𝑠𝑣𝑇

2

21 + 𝑠𝑣𝑇

𝜆𝑦

𝜆𝑣 𝑇 =

𝑠𝑦 𝑠𝑦𝑇

0 𝑠𝑣

𝑦 0

𝑣 0 (3.4.20)

Menyelesaikan persamaan ini dan diperoleh final costate

𝜆𝑦

𝜆𝑣 𝑇 =

1

∆ 𝑇 𝑠 𝑣 + 𝑇 𝑇 𝑠 𝑣 +

𝑇

2

−𝑇2

2𝑠 𝑦 −

𝑇3

6 𝑦 0

𝑣 0 (3.4.21)

dimana

∆ 𝑇 = 𝑠 𝑦 +𝑇3

3 𝑠 𝑣 + 𝑇 −

𝑇4

4 (3.4.22)

bobot akhir diperoleh

𝑠 𝑦 ≡1

𝑠𝑦 (3.4.23𝑎)

35

𝑠 𝑣 ≡1

𝑠𝑣 (3.4.23𝑏)

Pada faktanya, waktu awal 𝑡0 tidak bernilai 0. Karena persamaan state dan costate

linear, untuk mengoreksi dibutuhkan untuk mensubstitusi (𝑇 − 𝑡0) ke dalam 𝑇

pada ruas kanan persamaan (3.4.21). Sebelumnya, perlu diingat bahwa pada saat

𝑡 ≤ 𝑇 nilai 𝑦 𝑡 dan 𝑣(𝑡) telah diketahui, sehingga 𝑡 dapat diambil sebagai waktu

awal. Hal ini berkorespondensi dengan meminimalkan 𝐽(𝑡), yaitu remaining cost

pada selang [𝑡, 𝑇].

Dengan mensubstitusikan (𝑇 − 𝑡) untuk 𝑇 dalam persamaan (3.4.21) diperoleh

persamaan untuk final costate dalam variabel state saat ini :

𝜆𝑦

𝜆𝑣 𝑇 =

1

∆ 𝑇 − 𝑡 𝑠 𝑣 + 𝑇 − 𝑡 𝑇 − 𝑡 𝑠 𝑣 +

𝑇 − 𝑡

2

− 𝑇 − 𝑡 2

2𝑠 𝑦 −

𝑇 − 𝑡 3

6 𝑦 𝑡

𝑣 𝑡 (3.4.24)

Pada akhirnya, kontrol optimal dapat dihitung dengan mendasarkan perhitungan

pada (9) dan (14)

𝑢 𝑡 = − 𝑇 − 𝑡 1 𝜆𝑦

𝜆𝑣 𝑇 (3.4.25)

Dengan turut memperhitungkan (24) diperoleh kontrol optimal

𝑢 𝑡 = − 𝑇 − 𝑡 𝑠 𝑣 +

𝑇 − 𝑡 2

2∆ 𝑇 − 𝑡

𝑦 𝑡

−𝑠 𝑦 + 𝑇 − 𝑡 2𝑠 𝑣 +

𝑇 − 𝑡 3

3∆ 𝑇 − 𝑡

𝑣 𝑡 (3.4.26)

Hasil ini merupakan hukum kontrol feedback karena kontrol yang sesungguhnya

hanya diberikan dalam state saat ini.

36

c. Navigasi Proporsional

Untuk permasalahan titik potong, pilih 𝑠𝑣 = 0 dan 𝑠𝑦 → ∞. Dengan mengambil

limit dari (26) diperoleh

𝑢 𝑡 = −3

𝑇 − 𝑡 2𝑦 𝑡 −

3

𝑇 − 𝑡𝑣 𝑡 (3.4.27)

sebagai kontrol optimal titik potong.

Perlu diperhatikan bahwa untuk sudut penglihatan yang kecil

𝜎 𝑡 = tan 𝜎 𝑡 =𝑦 𝑡

𝑇 − 𝑡 𝑉 (3.4.28)

sehingga

𝜎 =𝑦 (𝑡)

𝑇 − 𝑡 𝑉+

𝑦 𝑡

𝑇 − 𝑡 2𝑉 (3.4.29)

maka kontrol optimalnya adalah

𝑢 𝑡 = −3𝑉𝜎 (3.4.30)

Persamaan ini adalah hukum kontrol untuk navigasi proporsional. Setiap pilot

mengetahui bahwa untuk melakukan perpotongan hanya diperlukan untuk

menjaga sudut terhadap target tetap konsan sehingga tidak akan ada pergerakan

terhadap posisi relatif.

3.5. Keoptimalan Sudut Gaya Dorong

Contoh ini bertujuan untuk menekankan bahwa kondisi keoptimalan pada tabel dapat

diterapkan pada sistem tak linear umumnya.

37

a. Hukum Tangent Bilinear

Sebuah partikel dengan massa 𝑚 digerakkan oleh gaya dorong konstan 𝐹 dan

dikenakan pada variabel sudut 𝛾(𝑡) . Posisi partikel adalah (𝑥 𝑡 , 𝑦 𝑡 ) dan

kecepatan pada sumbu 𝑥 dan 𝑦 masing-masing adalah 𝑢(𝑡) dan 𝑣(𝑡). Perhatikan

gambar. Persamaan state tak linear untuk 𝑋 = 𝑓(𝑋, 𝛾, 𝑡) adalah

𝑥 = 𝑢 (3.5.1)

𝑦 = 𝑣 (3.5.2)

𝑢 = 𝑎 cos 𝛾 (3.5.3)

𝑣 = 𝑎 sin 𝛾 (3.5.4)

dimana vektor untuk state adalah 𝑋 = 𝑥 𝑦 𝑢 𝑣 𝑇 , dan 𝑎 ≜ 𝐹/𝑚 adalah

percepatan gaya dorong yang telah diketahui. Sudut gaya dorong 𝛾(𝑡) merupakan

kontrol input.

Indeks performa yang digunakan berupa fungsi atas waktu akhir 𝑇 dan state

𝐽 = 𝜙(𝑋 𝑇 ,𝑇) (3.5.5)

Misalkan suatu fungsi 𝜓 atas state akhir harus bernilai 0, sehingga

𝜓 𝑋 𝑇 ,𝑇 = 0 (3.5.6)

Akan dicari bentuk dari 𝛾(𝑡) yang meminimalkan 𝐽 dan memenuhi (3.5.6).

Hamiltonian adalah

𝐻 = 𝐿 + 𝜆𝑇𝑓 = 𝜆𝑥𝑢 + 𝜆𝑦𝑣 + 𝜆𝑢𝑎 cos 𝛾 + 𝜆𝑣𝑎 sin 𝛾 (3.5.7)

dimana faktor pengali Lagrange 𝜆 𝑡 = 𝜆𝑥 𝜆𝑦 𝜆𝑢 𝜆𝑣 𝑇 memiliki komponen

yang berasosiasi dengan komponen setiap state.

38

Gambar 3.5.1 Keoptimalan Sudut Gaya Dorong

Berdasarkan tabel keoptimalan, persamaan costate adalah 𝜆 = −𝑓𝑋𝑇𝜆 atau

𝜆 𝑥 = −𝑓𝑥𝑇𝜆 = 0 (3.5.8)

𝜆 𝑦 = −𝑓𝑦𝑇𝜆 = 0 (3.5.9)

𝜆 𝑢 = −𝑓𝑢𝑇𝜆 = −𝜆𝑥 (3.5.10)

𝜆 𝑣 = −𝑓𝑣𝑇𝜆 = −𝜆𝑦 (3.5.11)

(Perhatikan bahwa subskrip pada 𝑓 menotasikan turunan parsial, sedangkan

subskrip pada 𝜆 menotasikan komponen dari persamaan costate.)

Kondisi kestasioneran adalah

0 = 𝐻𝛾 = −𝜆𝑢𝑎 sin 𝛾 + 𝜆𝑣𝑎 cos 𝛾 (3.5.12)

atau

tan 𝛾(𝑡) =𝜆𝑣 𝑡

𝜆𝑢 𝑡 (3.5.13)

39

Dengan mengintegralkan persamaan costate secara mundur dari waktu akhir 𝑇

diperoleh

𝜆𝑥 𝑡 = 𝜆𝑥(𝑇) ≜ 𝜆𝑥 (3.5.14)

𝜆𝑦 𝑡 = 𝜆𝑦(𝑇) ≜ 𝜆𝑦 (3.5.15)

𝜆𝑢 𝑡 = 𝜆𝑢 𝑇 + 𝑇𝜆𝑥 − 𝑡𝜆𝑥 ≜ 𝑐1 − 𝑡𝜆𝑥 (3.5.16)

𝜆𝑣 𝑡 = 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 − 𝑡𝜆𝑦 ≜ 𝑐2 − 𝑡𝜆𝑦 (3.5.17)

Kemudian substitusikan ke persamaan (3.5.13) dan diperoleh hukum kontrol

optimal

tan 𝛾 𝑡 =𝑡𝜆𝑦 − 𝑐2

𝑡𝜆𝑥 − 𝑐1 (3.5.18)

Persamaan ini disebut hukum tangent bilinear untuk arah gaya dorong optimal

𝛾 𝑡 .

Untuk menentukan konstanta 𝜆𝑥 , 𝜆𝑦 , 𝑐1 , dan 𝑐2 , dapat dilakukan dengan cara

mensubstitusikan persamaan (3.5.18) ke persamaan state, menyelesaikannya, dan

menerapkan kondisi batas. Untuk menentukan kondisi batas, diperlukan untuk

mengetahui 𝜙 dan 𝜓, yang bergantung pada objektif kontrol tertentu. Ada banyak

objektif permasalahan kontrol yang memungkinkan mengingat bahwa seluruhnya

bergantung pada sifat dari partikel 𝑚. Salah satu contoh yang memiliki solusi

sederhana dan menarik akan dibahas berikut ini.

b. Titik Potong dengan Waktu Minimum

Misalkan 𝑚 merepresentasikan sebuah pesawat yang diharapkan berpotongan

dengan target 𝑃 dalam waktu yang minimum. 𝑃 memiliki posisi awal 𝑥1 dan

40

kecepatan konstan terhadap sumbu 𝑥 , yaitu 𝑉1 , sehingga persamaan posisi

pesawat terhadap sumbu 𝑥 pada saat 𝑡 adalah 𝑥1 + 𝑉1𝑡 . Sedangkan posisi

terhadap sumbu 𝑦 bernilai konstan.

Karena objektif permasalahan ini adalah meminimalkan waktu, maka diharapkan

bahwa kontrol optimal dapat meminimalkan

𝐽 = 𝑇 = 1 𝑑𝑡𝑇

0 (3.5.19)

dan karena 𝐿 = 1, maka Hamiltonian menjadi

𝐻 𝑡 = 1 + 𝜆𝑥𝑢 + 𝜆𝑦𝑣 + 𝜆𝑢𝑎 cos 𝛾 + 𝜆𝑣𝑎 sin 𝛾 (3.5.20)

Bagaimanapun, karena nilai 𝐿 konstan, hasil yang diperolah pada bagian a tetap

valid.

Jika 𝑚 mulai bergerak saat 𝑡0 = 0 dan dimulai dari titik awal, kondisi awal dari

𝑚 adalah

𝑥 0 = 0, 𝑦 0 = 0, 𝑢 0 = 0, 𝑣 0 = 0 (3.5.21)

Fungsi untuk final state adalah

𝜓 𝑋 𝑇 ,𝑇 = 𝑥 𝑇 − (𝑥1 + 𝑉1𝑇)

𝑦 𝑇 − ℎ = 0 (3.5.22)

sehingga

𝑥 𝑇 = 𝑥1 + 𝑉1𝑇 (3.5.23)

𝑦 𝑇 = ℎ (3.5.24)

Untuk mencari kondisi akhir yang tersisa diperlukan untuk menggunakan syarat

kondisi batas pada tabel keoptimalan.

41

State akhir dan waktu akhir keduanya bernilai bebas. Oleh karena itu 𝑑𝑥 𝑇 ≠ 0

dan 𝑑𝑇 ≠ 0 . Bagaimanapun, dalam permasalahan ini 𝑑𝑥 𝑇 dan 𝑑𝑇 saling

independen sehingga syarat kondisi batas pada tabel keoptimalan menghasilkan

dua kondisi batas yang terpisah yaitu

(𝜙𝑋 + 𝜓𝑋𝑇𝑣 − 𝜆) 𝑇 = 0 (3.5.25)

(𝜙𝑡 + 𝜓𝑡𝑇𝑣 + 𝐻) 𝑇 = 0 (3.5.26)

dimana 𝑣 = 𝑣𝑥 𝑣𝑦 𝑇 adalah faktor pengali Lagrange yang baru.

Dengan memperhitungkan (3.5.22) dan memperhatikan bahwa 𝜙 𝑥 𝑇 , 𝑇 = 0,

maka persamaan (3.5.25) menjadi

𝜆 𝑇 =

1 00 10 00 0

𝑣𝑥

𝑣𝑦

atau

𝜆𝑥 𝑇 = 𝑣𝑥 (3.5.27)

𝜆𝑦 𝑇 = 𝑣𝑦 (3.5.28)

𝜆𝑢 𝑇 = 0 (3.5.29)

𝜆𝑣 𝑇 = 0 (3.5.30)

Perlu diperhatikan bahwa komponen-komponen dari 𝜆 𝑇 yang berkorespondensi

dengan komponen final state yang tetap, yaitu 𝑥(𝑇) dan 𝑦(𝑇), adalah variabel-

variabel yang belum diketahui, sedangkan komponen-komponen dari 𝜆 𝑇 yang

berkorespondensi dengan komponen final state yang bebas, yaitu 𝑢(𝑇) dan 𝑣(𝑇),

memiliki nilai tetap pada 0.

42

Dengan menggunakan kondisi (3.5.20) dan (3.5.22), kondisi akhir (3.5.26)

menjadi

𝐻 𝑇 = − 𝜓𝑡𝑇𝑣 𝑇 = − −𝑉1 0

𝑣𝑥

𝑣𝑦

atau dengan menggunakan (3.5.27) – (3.5.30)

1 + 𝑣𝑥𝑢 𝑇 + 𝑣𝑦𝑣 𝑇 = 𝑉1𝑣𝑥 (3.5.31)

Kemudian persamaan state (3.5.1) – (3.5.4) akan diselesaikan dengan

memperhitungkan (3.5.18) dan solusi costate (3.5.14) – (3.5.17) serta kondisi

batas (3.5.21), (3.5.23), (3.5.24), (3.5.27) – (3.5.30). Kondisi (3.5.31) juga

diperlukan untuk menyelesaikan waktu akhir optimal 𝑇∗ yang belum diketahui.

Dari persamaan (3.5.27) – (3.5.30) solusi costate adalah

𝜆𝑥 𝑡 = 𝑣𝑥 (3.5.32)

𝜆𝑦 𝑡 = 𝑣𝑦 (3.5.33)

𝜆𝑢 𝑡 = (𝑇 − 𝑡)𝑣𝑥 (3.5.34)

𝜆𝑣 𝑡 = (𝑇 − 𝑡)𝑣𝑦 (3.5.35)

Dimana faktor pengali terakhir 𝑣𝑥 , 𝑣𝑦 perlu ditentukan. Dengan demikian, hukum

tangent bilinear (3.5.18) dapat dibuat dalam bentuk yang lebih sederhana

tan 𝛾 =𝑣𝑦

𝑣𝑥 (3.5.36)

Untuk permasalahan titik potong dengan waktu minimum ini, sudut gaya dorong

yang optimal bernilai konstan.

43

Untuk mencari kontrol optimal atas sudut gaya dorong 𝛾∗(𝑡), yang tersisa adalah

untuk mencari 𝑣𝑥 dan 𝑣𝑦 .

Karena 𝛾 bernilai konstan, sangat mudah untuk melakukan proses integrasi secara

maju dari 𝑡0 = 0 hingga diperoleh

𝑣 𝑡 = 𝑎𝑡 sin 𝛾 (3.5.37)

𝑢 𝑡 = 𝑎𝑡 cos 𝛾 (3.5.38)

𝑦 𝑡 =𝑎𝑡2

2sin 𝛾 (3.5.39)

𝑥 𝑡 =𝑎𝑡2

2cos 𝛾 (3.5.40)

dimana kondisi awal (3.5.21) telah dimasukkan dalam perhitungan.

Dengan menyelesaikan persamaan (3.5.39) dan (3.5.40) pada saat 𝑡 = 𝑇

tan 𝛾 =𝑦 𝑇

𝑥 𝑇 (3.5.41)

dan kondisi akhir (3.5.23) dan (3.5.24) kemudian memberikan persamaan untuk

kontrol dalam kondisi akhir :

tan 𝛾 =ℎ

𝑥1 + 𝑉1𝑇 (3.5.42)

Bagaimanapun, masih perlu ditentukan waktu akhir yang optimal 𝑇∗ untuk

digunakan dalam (3.5.42). Peran dari persamaan (3.5.31) adalah untuk

menyelesaikan 𝑇∗, namun untuk menggunakannya dibutuhkan untuk mencari 𝑣𝑥

44

dan 𝑣𝑦 . Khusus dalam permasalahan ini dapat digunakan cara singkat dimana 𝑣𝑥 ,

𝑣𝑦 tidak diperlukan.

Dapat diperhatikan bahwa (3.5.39), (3.5.40), (3.5.23), dan (3.5.24) menghasilkan

sin 𝛾 =2𝑦(𝑇)

𝑎𝑇2=

2ℎ

𝑎𝑇2 (3.5.43)

cos 𝛾 =2𝑥 𝑇

𝑎𝑇2=

2 𝑥1 + 𝑉1𝑇

𝑎𝑇2 (3.5.44)

Kemudian, sin2 𝛾 + cos2 𝛾 = 1, atau

4ℎ2 + 4(𝑥1 + 𝑉1𝑇)2 = 𝑎2𝑇4 (3.5.45)

yang mana

−𝑎2𝑇4

4+ 𝑉1

2𝑇2 + 2𝑉1𝑥1𝑇 + 𝑥12 + ℎ2 = 0 (3.5.46)

Persamaan kuadrat ini dapat diselesaikan untuk 𝑇∗ dengan kondisi awal di sekitar

target 𝑥1, 𝑉1,ℎ diberikan. Hanya ada satu solusi untuk persamaan (3.5.46) yang

masuk akal secara fisis.

Kontrol optimal ditentukan dengan menyelesaikan persamaan (3.5.46) untuk 𝑇∗

dan kemudian menyelesaikan persamaan (3.5.42) untuk sudut gaya dorong

optimal 𝛾∗.

Gambar di bawah ini merepreentasikan bahwa sisi miring dari segitiga

digambarkan dalam persamaan gerak target, sebagai

𝑑2 = ℎ2 + (𝑥1 + 𝑉1𝑇∗)2 (3.5.47)

atau dalam persamaan gerak pesawat pengejar sebagai

45

𝑑2 = 1

2𝑎 𝑇∗ 2

2

(3.5.48)

Gambar 3.5.2 Kontrol Input bagi Permasalahan Titik Potong dengan Waktu Minimum

Persamaan (3.5.45) hanyalah sebuah persamaan yang harus dipenuhi agar kedua

pesawat berada pada titik yang sama pada waktu akhir.

Tanpa melalui penurunan yang detail dari (3.5.45) maka tidak dapat disimpulkan

dari gambar apakah solusinya merupakan waktu akhir yang optimal.

46

3.6. Solusi Numerik Sistem Hamiltonian untuk Hukum Newton

Misalkan model pertumbuhan yang mengikuti Hukum Newton, dimana

𝑦 = 𝑣

𝑣 = 𝑢 (3.6.1)

dengan 𝑦 adalah vektor posisi, 𝑣 adalah vektor kecepatan, dan 𝑢 adalah input

percepatan. Vektor state adalah 𝑥 = [𝑦 𝑣]𝑇 . Kemudian pilih indeks performa :

𝐽 =1


𝑇

𝑡0

(3.6.2)

Model pertumbuhan akan dibawa mendekati final state 𝑥(𝑇) = [𝑦 𝑇 𝑣 𝑇 ]𝑇 tanpa

menggunakan terlalu banyak energi. Nilai sesungguhnya dari final state tidaklah

tetap, meskipun waktu akhir 𝑇 tetap.

Dalam 3.2. telah dibangun controller untuk model pertumbuhan ini, dan dalam 3.4.

telah dicari ekspresi analitik untuk controller feedback yang kontinu. Pada bagian ini

akan dicari kontrol optimal dengan menggunakan solusi numerik atas persamaan

state–costate.

Hamiltonian dan persamaan Euler sama seperti yang diberikan pada 3.4. yaitu

𝐻 =1

2𝑢2 + 𝑣𝜆𝑦 + 𝑢𝜆𝑣

𝜆 𝑦 = −𝜕𝐻

𝜕𝑦= 0

𝜆 𝑣 = −𝜕𝐻

𝜕𝑣= −𝜆𝑦

47

Kontrol optimal adalah

𝑢 = −𝜆𝑣(𝑡) (3.6.3)

Dengan menggunakan kontrol optimal di atas dalam persamaan state, diperoleh

Hamiltonian dari sistem, yaitu

𝑦 = 𝑣

𝑣 = −𝜆𝑣

𝜆 𝑦 = 0

𝜆 𝑣 = −𝜆𝑦 (3.6.4)

Dengan menggunakan persamaan terakhir, diperoleh

𝜆𝑦 𝑡 = 𝑙

𝜆𝑣 𝑡 = exp −𝑡 𝑘

untuk suatu konstanta 𝑙 dan 𝑘.

Kondisi batas yang digunakan adalah

𝑦 0 = 𝑚 diberikan,

𝑣 0 = 𝑛 diberikan,

𝑦 𝑇 = 0

𝑣 𝑇 = 0 (3.6.5)

dengan 𝑚 dan 𝑛 merupakan tebakan untuk state awal, atau notasikan 𝑥 0 = [𝑚 𝑛]𝑇

sedangkan untuk state akhir, diinginkan agar 𝑥 𝑇 = [0 0]𝑇 .

48

Karena kondisi awal dari persamaan costate tidak diketahui, maka akan dibangun

suatu metode aproksimasi terhadap kondisi awal costate yang sesuai.

Misalkan 𝜙 = [𝑝 𝑞]𝑇 = [𝜆𝑦 0 𝜆𝑣

0 ]𝑇 adalah vektor tebakan untuk costate awal

untuk suatu 𝑝 ∈ 𝐑𝐧, 𝑞 ∈ 𝐑𝐧 didapatkan

𝜆𝑦 𝑡 = 𝑝

𝜆𝑣 𝑡 = exp −𝑡 𝑞 (3.6.6)

Jika kita mengkhususkan perhatian pada final state 𝑣(𝑇) dengan 𝜆𝑣 0 = 𝑞 ,

diperoleh

𝑣 𝑇; 𝑞 = − exp(−𝑡) 𝑑𝑡𝑇

0

𝑞

Tentu saja, lintasan dari 𝑥(𝑇) secara umum tidak berakhir pada 𝑥 𝑇 = [0 0]𝑇 .

Dengan kata lain, secara umum 𝑥(𝑇) ≠ 𝑥 (𝑇).

Untuk menebak 𝜙 yang sesuai yang membuat 𝑥 dimulai tepat pada 𝑥 0 = [𝑚 𝑛]𝑇

dan berakhir di 𝑥 𝑇 = [0 0]𝑇 tidaklah mudah. Oleh karena itu, akan digunakan

algoritma berikut untuk menghampiri nilai 𝜙 yang sesuai. Algoritma tidak bertujuan

untuk mencari nilai 𝜙 yang presisi, namun diharapkan algoritma dapat menemukan 𝜙

yang meminimalkan fungsional berikut

𝐹 𝜙 = 𝑥 𝑇 − 𝑥 (𝑇) 2 (3.6.7)

dimana 𝑥(𝑇) adalah evaluasi atas 𝑥 saat 𝑇 dan (𝑥, 𝜙) adalah solusi atas sistem

persamaan diferensial (3.6.4) dengan kondisi awal 𝑥 0 , 𝜙 0 = 𝑥 0 , 𝜙 0 .

Fungsional 𝐹 akan diminimalkan dengan menggunakan metode Steepest Descent.

Program yang digunakan adalah MATLAB. Kemudian akan diperoleh lintasan state

49

dan costate 𝜆𝑦(𝑡) dan 𝜆𝑣(𝑡) , sehingga kontrol input dapat ditentukan dengan

menggunakan persamaan (3.6.3).

Algoritma untuk metode Steepest Descent dapat dideskripsikan sebagai berikut.

Pertama, pilih sebarang bilangan positif 𝜖 dan 𝛼, serta sebarang vektor

𝜙 0 = [𝑝 𝑞]𝑇

Dengan menggunakan nilai-nilai ini dan kondisi awal 𝑥 0 = [𝑚 𝑛]𝑇 permasalahan

nilai awal berikut dapat diselesaikan

𝑦 = 𝑣

𝑣 = −𝜆𝑣

𝜆 𝑦 = 0

𝜆 𝑣 = −𝜆𝑦

dimana (𝑥 0 , 𝜙 0 ) = (𝑥 0 ,𝜙 0). Kemudian, dapat dihitung final state 𝑥(𝑇) untuk

𝜙 0 tersebut. Lebih jauh lagi, dengan menggunakan nilai 𝑥(𝑇) ini, nilai skalar dari

𝐹(𝜙 0) dapat dihitung dengan persamaan (3.6.7). Berikutnya, akan dicari nilai 𝜙 1

yang baru yang akan membuat nilai 𝐹(𝜙 1) < 𝐹(𝜙 0).

Turunan parsial dari 𝐹 terhadap masing-masing 𝜆𝑦 dan 𝜆𝑣 di 𝜙 0 diaproksimasi

dengan

𝜕𝐹

𝜕𝜆𝑦 𝜙 0 ≈ 𝐷1 ≈

𝐹 𝜙 0 + 𝜖(1,0) − 𝐹(𝜙 0 )

𝜖

𝜕𝐹

𝜕𝜆𝑣 𝜙 0 ≈ 𝐷2 ≈

𝐹 𝜙 0 + 𝜖(0,1) − 𝐹(𝜙 0 )

𝜖

Sehingga, gradient dari 𝐹 di 𝜙 0 diaproksimasi dengan

50

∇𝐹 𝜙 0 = 𝜕𝐹

𝜕𝜆𝑦 𝜙 0 ,

𝜕𝐹

𝜕𝜆𝑣 𝜙 0 ≈ (𝐷1 , 𝐷2)

Berikutnya, bentuk

𝐸1 = 𝐹 𝜙 0 − α 𝐷1 ,𝐷2

𝐸2 = 𝐹 𝜙 0 −α

2 𝐷1 , 𝐷2

Jika 𝐸1 < 𝐸2 , maka 𝜙 1 = 𝜙 0 − 𝛼 𝐷1 ,𝐷2 . Dan jika sebaliknya, maka 𝜙 1 = 𝜙 0 −

𝛼

2 𝐷1 ,𝐷2 dan ubah nilai 𝜖 dengan

𝜖

2 serta nilai 𝛼 dengan

𝛼

2. Kemudian lanjutkan

dengan mengulangi proses di atas menggunakan nilai 𝜙 1 untuk variabel 𝜙 0, sehingga

dapat diperoleh nilai 𝜙 2 . Jika proses iterasi ini terus dilanjutkan, maka akan

dihasilkan barisan vektor 𝜙 𝑚 𝑚=0

∞ .

51

********************************************************************

% program input Hamiltonian

function dy = hamiltonian(t,y)

dy = zeros(4,1);

% a column vector

dy(1) = y(2) ; % y dot

dy(2) = -y(4) ; % v dot

dy(3) = 0; % lambda y dot

dy(4) = -y(3); % lambda v dot

end

********************************************************************

% program utama

clear all;

clc;

toleransi = 0.001; %besar galat

epsilon1 = 0.001; %nilai awal untuk epsilon

epsilon2 = epsilon1/2;

alpha1 = 0.001; %nilai awal untuk alpha

alpha2 = alpha1/2;

tmin = 0; %waktu awal (t0)

tmax = 10; %waktu akhir (tf)

time = [tmin tmax];

% Syarat awal untuk state dan costate

a = 1; % syarat awal y

52

b = 1; % syarat awal v

L10 = 2; % tebakan awal costate lambda v

L20 = 2; % tebakan awal costate lambda y

ic = [a b L10 L20];

options = odeset('RelTol', 1e-10);

[T,Y] = ode45(@hamiltonian, time, ic, options);

ujung = length(T);

F(1) = (Y(ujung,1))^2+(Y(ujung,2))^2; %syarat akhir state (0,0,0)

i=1;

alpha = alpha1;

epsilon = epsilon1;

while F(i) > toleransi

L10_lama = L10(i);

L20_lama = L20(i);

% Initial condition partial

L10partial = L10_lama + epsilon;

ic = [a b L10partial L20_lama];


ujung = length(T);

partialL1 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;

% Initial condition partial

L20partial = L20_lama + epsilon;

ic = [a b L10_lama L20partial];


ujung = length(T);

partialL2 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;

53

normF = sqrt(partialL1^2 + partialL2^2);

% Initial condition

L10_baru = L10_lama - alpha * partialL1 / normF;

L20_baru = L20_lama - alpha * partialL2 / normF;

ic = [a b L10_baru L20_baru];


ujung = length(T);

i=i+1;

F(i)= (Y(ujung,1))^2+(Y(ujung,2))^2;

if F(i)>=F(i-1)

alpha = alpha2;

epsilon = epsilon2;

else

alpha = alpha1;

epsilon = epsilon2;

end

L10 = [L10; L10_baru];

L20 = [L20; L20_baru];

end

figure(1)

plot(T, Y(:,1))

xlabel('t (s)')

ylabel('y (m)')

axis([0 10 0 10])

figure(2)

plot(T,Y(:,2))

xlabel('t (s)')

ylabel('v (m/s)')

54

figure (3)

plot(T,Y(:,1:2))

xlabel('t (s)')

ylabel('y (m) dan v (m/s)')

% Transpose

F = F.';

Hasil =[F L10 L20];

*********************************************************

55

Dengan menjalankan program di atas, diperoleh hasil plot lintasan state yang optimal

sebagai berikut

Gambar 3.6.1 Plot Lintasan 𝑦∗ terhadap t

Gambar 3.6.2 Plot Lintasan 𝑣∗ terhadap t

56

Gambar 3.6.3 Plot Lintasan 𝑦∗ dan 𝑣∗ terhadap t

Nilai costate yang optimal adalah

𝜆𝑦 𝑡 = 0.0738

𝜆𝑣 𝑡 = 0.4662 − 0.0738𝑡

Sehingga diperoleh kontrol input

𝑢∗ 𝑡 = −0.4662 + 0.0738𝑡

57

BAB 4

KESIMPULAN

Dalam tugas akhir ini, beberapa konsep dasar dari kalkulus variasi telah dipaparkan

dan kondisi keoptimalan telah diturunkan dengan menggunakan Pontryagin

Maximum Principle. Variasi pertama dari indeks performa telah dicari, dan nilai dari

setiap increment bebas pada saat nol adalah syarat perlu bagi persamaan state dan

costate untuk mencapai keoptimalan. Tabel 1 merangkum syarat perlu bagi kondisi

keoptimalan tersebut.

Beberapa contoh permasalahan sistemn kontinu nonlinear yang diselesaikan dengan

menggunakan kontrol optimal telah diselesaikan dengan cara mencari solusi analitik

dan solusi numerik. Pendekatan solusi numerik yang digunakan adalah metode

Steepest Descent.

58

DAFTAR PUSTAKA

1. Athans, M and P. Falb, Optimal Control, New York : McGraw-Hill, 1966

2. Bryson, A. E. and Ho, Y-C., Applied Optimal Control, Blaisdell Publishing

Company, Waltham, 1969

3. Kirk, D., Optimal Control Theory : An Introduction, Prentice Hall, 1970

4. Lewis, F. L., Optimal Control, New York : Wiley, 1995

5. Tjahjana, H., Pranoto, I., Muhammad, H., Naiborhu, J., On The Optimal

Control Computation of Linear Systems, J. Indonesian Math. Society Vol. 15,

No. 1 (2009), pp. 13 – 20

6. Tomlin, C. J., Lecture Notes 8 : Optimal Control and Dynamic Games, (2005)

kontrol optimal berdasarkan pada kalkulus variasi - vanessa sarah griselda

Documents