CTA2 HILSアプローチ

仮想制御実験のためには、厳密な実時間計算ではありませんが、Simulink Desktop Real-Timeが有用です。

コントローラの実装には、Simulink Real-Time, MATLAB Coder, Simulink Coderが有用です。

CT83 1次系のLQI制御

Home Work 8.3

[M] 偏差系の安定化をLQ制御方式で行っているけど、偏差系が3種類も出てくるね。 

[C] 評価関数の重みを与えるとき、偏差系E3が便利だからだよ。

[P] 多変数系の場合、定常状態で非干渉化が行われるみたいだけど、物理的にどうなっているのか説明できるのだろうか?

Flipped Classroom 8.3
[1][2] 試行錯誤で偏差系の安定化を行う場合に比べて、設計が少しは楽になると思われます。

CT82 定値外乱下の位置制御

Home Work 8.2

[C] ここでも、定常偏差を生じさせる定値外乱の除去に焦点を当てているようだ。

[P] 位置を目標値(定値)に合わせるときは、速度は0にしか合わせられないということだね。

[M] 3次の行列の逆行列の計算が、こんなところで出てきたね。

Flipped Classroom 8.2
[1] (8.15)ではなく、(8.17)からx_I\frac{w^*}{k_I}=\frac{1}{1}=1に漸近するはず。図8.6の下段のシミュレーションはプログラムからx_Iではなく-k_Ix_I=-x_Iだから、その値は-1に漸近しており、x_Iは1に漸近することが確かめられます。(下段のシミュレーションがx_Iとなるように、プログラムを変更する予定です。)

[2] 偏差系の安定化を、閉ループ系の固有値を指定して求めています。

CT81 定値外乱下の速度制御

Home Work 8.1

[C] 積分器は目標値(定値)との定常偏差をなくすために必要となると思っていたけど、ここでの説明はちょっと違うね。定常偏差を生じさせる定値外乱の除去に焦点を当てているようだ。

[P] 積分器が未知の外乱を推定するとは、不思議な気がするね。

[M] でも数学的には、確かに標値との定常偏差をなくすことと、積分器が未知の外乱を推定することが証明されているよ。

Flipped Classroom 8.1
[1] (8.10)からx_I\frac{w^*}{k_I}=\frac{1}{1}=1に漸近するはず。図8.3の下段のシミュレーションはプログラムからx_Iではなく-k_Ix_I=-x_Iだから、その値は-1に漸近しており、x_Iは1に漸近することが確かめられます。(下段のシミュレーションがx_Iとなるように、プログラムを変更する予定です。)

[2] 多い風の場合は、w^s=-1とします。

CT73 補遺7

[C] LQ制御の要点をまとめると、次のようになるかな。 

【LQ制御】 可制御な制御対象

\displaystyle{(1)\quad %\left\{\begin{array}{ll} \dot{x}(t)=Ax(t)+Bu(t)\quad (x(t)\in{\bf R}^n,u(t)\in{\bf R}^m)\\ %z(t)=Cx(t)&(z(t)\in{\bf R}^q) %\end{array}\right. }

を安定化する状態フィードバック

\displaystyle{(2)\quad u(t)=-Fx(t) }

の決定法を考えます。一つの方法は,閉ループ系

\displaystyle{(3)\quad %\left\{\begin{array}{l} \dot{x}(t)=(A-BF)x(t)  \\ %z(t)=Cx(t) %\end{array}\right. }

の時間応答に関する評価規範として,2次形式評価関数

(4)\quad \boxed{\begin{array}{l} \displaystyle{J=\int_0^\infty (z^T(t)Qz(t)+u^T(t)Ru(t))\,dt\quad (Q>0,R>0)}\\ \displaystyle{z(t)=Cx(t)\quad (z(t)\in{\bf R}^q)} \end{array}}

を設定し,これを最小化する問題を解くことです。ただし、(A,C)は可観測対とします。これによる状態フィードバックのゲイン行列Fは,リッカチ方程式

\displaystyle{(5)\quad {\boxed{\Pi A+A^T\Pi-\Pi BR^{-1}B^T\Pi+C^TQC=0}} }

の解\Pi>0を用いて,次式で与えられます。

\displaystyle{(6)\quad {\boxed{F=R^{-1}B^T\Pi}} }

[P] LQ制御は、運動の自由度の連成を解きほぐすという意味の多変数制御を保証するわけではなさそうだ。やはり、運動の自由度の対応するアクチュエーションを工夫して、状態空間モデルを得ることが大切ということかな?

[M] LQ制御に関する証明については、次を参照するらしいよ。

まず閉ループ系の安定性を表す制約条件について

リャプノフ方程式

そして、一般の状態フィードバックについて

LQ制御

さらには、オブザーバベースコントローラについて

LQG制御

(詳しい説明は、あとで行う予定です。)

CT72 2次系のLQ制御

Home Work 7.2

[P] よく多変数制御というけど、制御対象の運動の複数の自由度を同時に操ることを意味しているのであれば、本当にできるのかなと思ってしまう。

[C] 制御対象の可制御性と可観測性を前提とし、2次形式評価関数を最小化する状態FBを求めるLQ制御は、多変数制御のための強力なツールとなっているらしいよ。

[M] その導出は、基本的には1入力系の場合と同じアプローチでできて、最終的にはリッカチ方程式という行列の2次方程式を解くことになるんだ。 

Flipped Classroom 7.2
[1] 仮にq_2=0としても、閉ループ2次系の減衰係数は1/sqrt(2)となっており、十分減衰がかかっていることを意味しています。
[2] 著者は、プログラムopt.mを用いて、多くの制御問題を解いてきました。世界一重要なツールと言っても過言ではないと思っています。

CT71 1次系のLQ制御

Home Work 7.1

[P] 平衡状態から外れたとき、これを戻すためには、いろいろな「軌道(時系列)」があると思うけど、何かリーズナブルな決め方はあるのかな?

[C] 状態変数の振る舞い(2乗面積)と操作変数の振る舞い(2乗面積)のトレードオフを計ることがよく行われているよ。

[M] トレードオフの意味だけど、高校で、次の関数の最小値を求める問題があったね。

\displaystyle{(1)\quad y=x+\frac{1}{x} }

右辺第1項は増加関数、第2項は減少関数だから、グラフを描いてみると、最小値が生まれているよね。

Flipped Classroom 7.1
[1]

評価関数はスカラ値を取るので、定数倍してもOKだから、q^2で割ると、

\displaystyle{(1)\quad \frac{J}{q^2}=\int_0^\infty (x^2(t)+(\frac{r}{q})^2u^2(t))dt =\int_0^\infty (x^2(t)+\frac{1}{\rho^2}u^2(t))dt }

これから1/\rhoは操作のためのコストとみなせます。すなわちコスト1/\rhoがより小さくなると、操作はより大きな振る舞いが許されます。\rho\rightarrow\inftyのときはcheap controlと呼ばれます。
 
[2]  

\displaystyle{(1)\quad \begin{array}{l} (\lambda I_2- \left[\begin{array}{cc} a & -r^{-2}b^2\\ -q^2 & -a \end{array}\right]) =(\lambda-a)(\lambda+a)-q^2r^{-2}b^2=\lambda^2-a^2-q^2r^{-2}b^2=0 \end{array} }

を解くと

\displaystyle{(2)\quad \lambda=\pm\sqrt{a^2+\frac{q^2}{r^2}b^2} }

\lambda<0の場合の固有ベクトルは

\displaystyle{(3)\quad %\begin{array}{l} \left[\begin{array}{cc} a & -r^{-2}b^2\\ -q^2 & -a \end{array}\right] \left[\begin{array}{cc} v_1\\ v_2 \end{array}\right] =-\sqrt{a^2+\frac{q^2}{r^2}b^2} \left[\begin{array}{cc} v_1\\ v_2 \end{array}\right] %\end{array} }

すなわち

\displaystyle{(4)\quad \left\{\begin{array}{l} av_1-r^{-2}b^2v_2=-\sqrt{a^2+\frac{q^2}{r^2}b^2}v_1\\ -q^2v_1-av_2=-\sqrt{a^2+\frac{q^2}{r^2}b^2}v_2 \end{array}\right. }

v_1=1の場合(と規格化する場合)は

\displaystyle{(4)\quad %\left\{\begin{array}{l} a-r^{-2}b^2v_2=-\sqrt{a^2+\frac{q^2}{r^2}b^2} \Rightarrow  v_2=\frac{a+\sqrt{a^2+\frac{q^2}{r^2}b^2}}{r^{-2}b^2} %\end{array}\right. }

したがって

\displaystyle{(5)\quad %\left\{\begin{array}{l} f=r^{-2}b^2v_2v_1^{-1}=r^{-2}b^2\frac{a+\sqrt{a^2+\frac{q^2}{r^2}b^2}}{r^{-2}b^2} =a+\sqrt{a^2+\frac{q^2}{r^2}b^2} %\end{array}\right. }