可検出性と可観測性

可検出性と可観測性…Homework

[1] 制御対象のモデルが

\displaystyle{(1)\quad \left\{\begin{array}{ll} \dot{x}(t)=Ax(t)+Bu(t)&(x(t)\in{\bf R}^n,u(t)\in{\bf R}^m)\\ y(t)=Cx(t)&(y(t)\in{\bf R}^p)\right. \end{array} }

で与えられるとき、これに対する状態オブザーバは、微分方程式

\displaystyle{(2)\quad \dot{\hat{x}}(t)=(A-HC)\hat{x}(t)+Bu(t)+Hy(t),\ \hat{x}(0)=0\\ }

で与えられました。ここで、オブザーバゲインHA-HCが安定行列になるように選ぶ必要がありました。でもこれはいつでも可能であるわけではありません。すなわちHA-HCが安定行列になるように選べる場合に状態オブザーバが構成可能となり、このとき可検出性(detectability)が成り立つと言います。

A-HCを安定行列とするためには、双対システム

\displaystyle{(3)\quad \dot{w}(t)=A^Tw(t)+C^Tv(t)}

に対する状態フィードバック

\displaystyle{(4)\quad v(t)=-H^Tw(t)}

による閉ループ系

\displaystyle{(5)\quad \dot{w}(t)=(A^T-C^TH^T)w(t)=(A-HC)^Tw(t)}

を安定化して求めます。ということは、可検出性の条件は双対システムの可安定性と等価になります。すなわち可安定性の条件において

\displaystyle{(6)\quad A\leftarrow A^T,\ B\leftarrow C^T}

のように置き換えて、次が得られます。

【可検出性の定義とその等価な条件】

定義DD: 状態オブザーバを構成可能

条件D1: {\rm rank}\, \left[\begin{array}{c} C \\ A-\lambda I_n \end{array}\right]=n (\lambdaAのすべての不安定固有値)

条件D2: Cv=0,\ Av=\lambda v \Rightarrow v=0 (\lambdaAのすべての不安定固有値)

可検出性の判定は行列ACを用いて行われるので、可検出性が成り立つとき、対(A,C)可検出対という言い方をします。

可安定性よりも強い条件として可制御性がありましたが、これに対応する概念は可観測性(observability)と言われ、これと等価な条件は次のようにまとめられます。

【可観測性の定義とその等価な条件】

定義DO: 任意有限時間[0,t]上の入出力データu(\tau),y(\tau)\tau\in[0,t]から,初期状態x(0)を一意に決定できる

条件O1: \displaystyle{\underbrace{\int_0^t \exp(A^T\tau)C^TC\exp(A\tau)\,d\tau}_{W_o(t)}>0 \quad (\forall t>0)}

条件O2: {\rm rank}\, \underbrace{ \left[\begin{array}{c} C \\ CA \\ \vdots\\ CA^{n-1} \end{array}\right] }_{observability\ matrix} =n

条件O3: Hを選んで,A-HCの固有値を任意に設定可能

条件O4: {\rm rank} \left[\begin{array}{c} C \\ A-\lambda I_n \end{array}\right]=n (\lambdaAのすべての固有値)

条件O5: Cv=0,\ Av=\lambda v \Rightarrow v=0 (\lambdaAのすべての固有値)

条件O6: (A^T,C^T)は可制御対

可観測性の判定も行列ACを用いて行われるので、可観測性が成り立つとき、対(A,C)可観測対という言い方をします。条件O1の積分式を可観測性グラミアン行列、条件O2の行列を可観測性行列と呼びます。また条件O4を満足するAの固有値を\lambda可観測固有値、満足しない固有値を不可観測固有値と呼びます。

上で述べたように、可観測性の議論は、可制御性の議論において、AA^Tに、BC^Tに置き換えて行えばよいので、次が成り立ちます。

条件O6\Leftrightarrow条件O1\Leftrightarrow条件O2\Leftrightarrow条件O3\Leftrightarrow条件O4\Leftrightarrow条件O5

<定義DO\Rightarrow条件O1>

適当な入力のもとでの出力は次式で表されます。

\displaystyle{(8)\quad y(t)=C\exp(At)x(0)+\int_0^tC\exp(A\tau)Bu(t-\tau)\,d\tau}

ここで、零状態応答は計算できますので、これを出力から引いたz(t)を次のようにおきます。

\displaystyle{(9)\quad \underbrace{y(t)-\int_0^tC\exp(A\tau)Bu(t-\tau)\,d\tau}_{z(t)}=C\exp(At)x(0)}

したがって、入出力データu(\tau),z(\tau)\tau\in[0,t]から,初期状態x(0)を一意に決定できるかが問題となります。

このとき、W_o(t)>0を否定して、矛盾を導きます。

(10)\quad \begin{array}{l} \displaystyle{\overline{(\forall v\ne0:v^TW_o(t)v>0)}}\\ \displaystyle{\Rightarrow \exists v\ne0:w^TW_o(t)v=0}\\ \displaystyle{\Rightarrow \exists v\ne0,\forall \tau\le t: C\exp(A\tau)v=0}\\ \displaystyle{\Rightarrow x(0)=v\Rightarrow z(t)=0} \end{array}

これは、入出力データu(\tau),z(\tau)\tau\in[0,t]から,初期状態x(0)を一意に決定できることにはならないことを示しています。

<条件O1\Rightarrow定義DO>

上と同様に(9)を考えますと、入出力データu(\tau),z(\tau)\tau\in[0,t]から,初期状態x(0)は次式で計算できます。

\displaystyle{(11)\quad x(0)=W_o^{-1}(t)\int_0^t\exp(A^T\tau)C^Tz(\tau)\,d\tau}

実際、左辺は、次のようにx(0)となります。

\displaystyle{(12)\quad (\int_0^t\exp(A^T\tau)C^TC\exp(A\tau)\,d\tau)^{-1}\int_0^t\exp(A^T\tau)C^TC\exp(At)x(0)\,d\tau=x(0) }

以上で、可観測性\LeftrightarrowO1\LeftrightarrowO2が示されました。

Note A43 可安定性と可制御性

状態フィーバックにより安定化できることを可安定性と言います。

【可安定性の定義とその等価な条件】

定義DS: 状態フィードバックにより安定化可能

条件S1: {\rm rank}\, \left[\begin{array}{cc} B & A-\lambda I_n \end{array}\right] =n (\lambdaAのすべての不安定固有値)

条件S2: B^Tw=0,\ A^Tw=\lambda w \Rightarrow w=0 (\lambdaAのすべての不安定固有値)

可安定性の判定は行列ABを用いて行われるので、可安定性が成り立つとき、対(A,B)可安定対という言い方をします。

可安定性の十分条件として次の可制御性が知られています。

【可制御性の定義とその等価な条件】

定義DC: 任意初期状態を,任意有限時間内に,任意状態に移動可能

条件C1: \displaystyle{\int_0^t \exp(A\tau)BB^T\exp(A^T\tau)\,d\tau>0 \quad (\forall t>0)}

条件C2: \boxed{{\rm rank}\, \left[\begin{array}{cccc} B & AB & \cdots & A^{n-1}B \end{array}\right]=n}

条件C3: Fを選んで,A-BFの固有値を任意に設定可能

条件C4: \boxed{{\rm rank}\, \left[\begin{array}{cc} B & A-\lambda I_n \end{array}\right] =n} (\lambdaAのすべての固有値)

条件C5: B^Tw=0,\ A^Tw=\lambda w \Rightarrow w=0 (\lambdaAのすべての固有値)

可制御性の判定も行列ABを用いて行われるので、可制御性が成り立つとき、対(A,B)可制御対という言い方をします。条件C1の積分式を可制御性グラミアン行列、条件C2の行列を可制御性行列と呼びます。また条件C4を満足するAの固有値を\lambda可制御固有値、満足しない固有値を不可制御固有値と呼びます。