Kas ir optimālās kontroles teorija?

Optimālās vadības teorija tiek plaši izmantota zinātnē, kā arī inženierzinātnēs. Tā ir matemātiska optimizācijas metode, ko parasti izmanto kontroles politiku izveidē. Ļevs Pontrjagins kopā ar savu komandu bijušajā Padomju Savienībā un amerikānis Ričards Belmans lielākoties ir atbildīgi par optimālās kontroles teoriju. Teorijas vispārējais mērķis ir izmantot dažādas analīzes metodes, lai noteiktu sistēmas parametrus, veicot izmēģinājumu un kļūdu procesus.

Optimālās vadības teorija noder, mēģinot atrisināt nepārtrauktas laika optimizācijas problēmas. Teorija risina problēmu, nosakot kontroles likumu hipotētiskai sistēmai, lai sasniegtu optimāluma līmeni. Optimālā vadība sastāv no dažādu vienādojumu kopas, kas apraksta mainīgo ceļus, kas samazina izmaksu funkcionālo līmeni līdz minimumam. Izmaksu funkcionālā vērtība būtībā ir mainīgo lielumu funkcija, kas saistīta ar stāvokli un vadību. Optimālās vadības teorijā tiek izmantots Pontrjagina maksimuma princips, kas parasti nosaka, ka optimizācijas problēmu P var atrisināt, izmantojot Hamiltona funkciju H viena perioda laikā, kas ir nepieciešams nosacījums. Teoriju var atvasināt arī ar Hamiltona-Jacobi-Bellman vienādojumu.

Lai palīdzētu personai izprast optimālās vadības teoriju, parasti tiek izmantots piemērs “braukt ar automašīnu pa kalnainu ceļu”. Iedomājieties, ka braucat ar automašīnu pa klinšainu ceļu taisnā līnijā. Teorija var noteikt, kā vajadzētu paātrināties, lai samazinātu absolūto ceļojuma laiku. Tādā gadījumā “sistēmu” veido transportlīdzeklis un akmeņains ceļš un optimāluma kritērijs ir braukšanas laika minimizēšanas sasniegšana. Ir zināms, ka šādas problēmas ietver ierobežojumus (piemēram, degvielas ierobežojumu, ātruma ierobežojumus). Vēl viens jautājums var būt veids, kā automašīnai optimizēt degvielas patēriņu, vienlaikus veicot noteiktu kursu noteiktā termiņā.

Vēl viens optimālās kontroles teorijas izmantošanas piemērs ir izmaksu jeb ēnu cenas risināšana. Tas sastāv no stāvokļa mainīgā paplašināšanas robežvērtības. To atrisinot, kontroles optimālā vērtība var veidot diferenciālvienādojumu, kas ir atkarīgs no kostata apzināšanās. Parasti šī stratēģija tiek atrisināta reģioniem, kas apraksta optimālo kontroli un savlaicīgi nošķir faktiskās izvēles vērtības.