240 likes | 376 Views
6.3 用变分法求解最优控制问题. 引言:. 1 、动态最优控制中目标函数是一个泛函数,最优控制问题就是求泛函数的极值问题。. 2 、对无约束的最优控制:通常用变分法求解; 对有约束的最优控制:通常用以变分法为基础的极小值原理求解。. 以上两种最优控制,都可以用动态规划法求解。. 3 、 无约束是指控制 u(t) 不受不等式的约束,可以在整个 r 维向量空间 R r 任意取值。. 一、变分法的基本概念. 变分法--求泛函极值的方法.
E N D
6.3 用变分法求解最优控制问题 引言: 1、动态最优控制中目标函数是一个泛函数,最优控制问题就是求泛函数的极值问题。 2、对无约束的最优控制:通常用变分法求解; 对有约束的最优控制:通常用以变分法为基础的极小值原理求解。 以上两种最优控制,都可以用动态规划法求解。 3、无约束是指控制u(t)不受不等式的约束,可以在整个r维向量空间Rr任意取值。
一、变分法的基本概念 变分法--求泛函极值的方法 1、泛函定义:对某一类函数集合中的每一个函数y(x),有一个确定的数J与之对应,就称J为依赖于函数y(x)的泛函,记J=J[y(x)]。 讨论: (1)性能指标J取决于向量函数x(t)及u(t)的选取而定,称指标泛函,记作J[u(t),x(t)]。 (2)因为x(t)和u(t)必须满足一定的关系(状态方程),u(t)的选取又影响到x(t)的选取,一般又将指标泛函记作J[u(t)]
(3)函数u(t)称为泛函J[u(t)]的宗量。(或自变量)(3)函数u(t)称为泛函J[u(t)]的宗量。(或自变量) (4)泛函与函数的区别: 泛函宗量是函数,而函数的宗量是变数。 (5)求最优控制u*(t),就是求使J[u(t)]取极小值的u(t)。
三、多元泛函的极值条件(变量为向量的情况)三、多元泛函的极值条件(变量为向量的情况)
四、求解连续系统最优控制 思路:由于泛函J所依赖的函数总要受到受控系统状态方程的约束,应用拉格朗日乘子法,将有约束泛函极值问题转化为无约束的泛函极值问题。