1次系のLQ制御…Homework
[1] ある平衡状態周りの挙動が状態方程式
で表される制御対象に対して、状態フィードバック(state feedback)
を考えます。ここで、定数はゲインと呼ばれ、を満たすものを選びます。(2)を(1)に代入して、次式を得ます。
これは制御対象とコントローラ(状態フィードバック)が閉路を構成することから(図1参照)、閉ループ系(closed-loop system)と呼ばれます。ここで、物理的に興味深いのは、制御対象が漸近安定でなくても()、状態フィードバックを行って閉ループ系を漸近安定()にできることです。そのようなゲインを決定する問題を状態フィードバックによる安定化問題と言います。
図1 状態フィードバックによる閉ループ系
[2] 1次系(1)に対する安定化状態フィードバック(2)による閉ループ系に対して、評価関数
を最小化するようにを決めるLQ制御問題を考えます。
●閉ループ系における状態の振舞いは次式で与えられます。
したがって、評価関数(4)の第1項は、次式のように計算されます。
これからを大きくすれば、はいくらでも小さくできることが分かります。
●閉ループ系における入力の振舞いは次式で与えられます。
したがって、評価関数(4)の第2項は、次式のように計算されます。
が下に凸で、 において最小値を取ることは、次式から分かります。
いま、として、との場合について、、、の外形を描くと、次図のようになります。ここで、には○で示す最小値が生まれていることに注意してください。
●それではの最小値を与えるを求めてみます。評価関数は
のように書けますので、の最小化は、次のの最小化と等価です。
図2 評価関数の概形
●この極値を求めるためにで微分すると
これより
ここで、 は を満足させるものでなければならないので
となります。そしてこれが一意に定まることは、以下のようにが下に凸でであることから分かります。
[2] LQ制御問題の解は求まったので、今度は評価関数(4)の重み係数との与え方について考えます。まず被積分項は物理量の2乗和になっていますので、予め代表時間と代表長さによる無次元化を行っておく必要があります。たとえば、状態変数と入力変数がとりうる範囲を想定して
とすると、重み係数は物理単位の無次元化の役割を果たすことになります。次に(15)による閉ループ系を考えます。
ここで、の場合を考えると
となって、新しい時定数は元の時定数より小さくなることが分かります。これを決めるパラメータは重み係数の比で、これが大きいほど時定数は小さくなります。
●パラメータを導入して重み係数を次のように設定します。
ここで、は固定されますので、設計パラメータはのみになります。
、、、、として、設計パラメータをと変えてみると、次の応答を得ます。
図3 重み係数の比による応答の変化
演習A03-1…Flipped Classroom
図2のグラフを描け。またパラメータの値による状態と入力の振る舞いを観察し、トレードオフの関係について述べよ。
MATLAB |
|
SCILAB |
|
ハミルトン行列と呼ばれる
の安定な固有値
に対応する固有ベクトルは
となることを確かめ、次式を計算せよ。
状態オブザーバ…Homework
[3] 状態フィードバックを使うには状態変数の変化をセンサで捉えてフィードバックする必要があるのですが、状態方程式が分かっているのですから、これを計算機内で解いてやれば良いのではないでしょうか?
いま制御対象(1次系)の状態空間表現を
とします。これを計算機で解きますが、その状態と出力を区別して
で表します。(26)から(25)の第1式どうしを辺々引くと
を得ます。ここででない限り
とはなりません。そこで、図4に示すような工夫が行われました。
図4 状態オブザーバの考え方
● いま(2)に次のような補正項を加えます。
すなわち
ここで、は適当な定数です。(30)から(26)の第1式どうしを辺々引くと
を得ます。ここでであるとすると
が成り立ちます。すなわち状態オブザーバ(30)の状態は、制御対象の状態を漸近的に推定することができます。このときを満たす(30)を状態オブザーバ、をオブザーバゲインと呼びます。
● 1次系
に対して、状態オブザーバ
によって推定された状態を用いる状態フィードバック
による閉ループ系の状態方程式は、次式となります。
これから閉ループ系の安定性を判定したいのですが、このままでは見当がつきません。そこで、状態の推定誤差をとおくと、状態変数を変更した閉ループ系の状態方程式として、次式を得ます。
実際、状態の推定誤差の定義から、
に注意すると、状態フィードバック(35)は
これによる閉ループ系は、に代入して
となります。これが(37)の第1式に他なりません。また、第2式は(31)そのもの、すなわち次式となります。
閉ループ系の状態方程式は(40)と(41)に分離されており、とは共に負となるようにとを独立に設計してもよいことが分かります。この事実は分離定理と呼ばれています。
なお状態フィードバックを状態オブザーバの出力を用いて実施するコントローラ
は、オブザーバベースコントローラと呼ばれています。
演習A03-2…Flipped Classroom
1次系に対する状態フィードバックと,状態オブザーバ()を考える。状態オブザーバによって推定された状態を用いる状態フィードバックによる閉ループ系の状態方程式を求めよ。
閉ループ系の行列の固有値が
,()となるように,とを定めよ。
とに,とをどう対応させたか,およびその理由を述べよ。
1次系のLQG制御…Homework
[5] 1次系(33)に対して、オブザーバベースコントローラ(42)による閉ループ系に対して、評価関数
を最小化するように、状態フィードバックゲインと状態オブザーバゲインを決定するLQG制御問題を考えます。
●評価関数は次のように計算できます。
状態方程式
と出力方程式
で表される閉ループ系の応答は
<このパートは最初は読み飛ばして結構です> このとき
|
ここで、初期値
をどう選ぶかですが、図4に示す閉ループ系を考えます。すなわち、(33)の代わりに、
を考えます。ここで、新たに加えられた入力とはそれぞれシステムノイズと観測ノイズとよばれ、定常正規確率過程として扱うのが普通です。特に、とは分散を表しています。ここでは確率的な議論を避けるため、とは確定的なインパルス入力であると仮定します。
図5 オブザーバベース・コントローラによる閉ループ系の評価
このとき、閉ループ系の状態方程式は、次式となります。
出力方程式(45)の場合のインパルス応答は、インパルス入力をに与える場合とに与える場合の2通り
<このパートは最初は読み飛ばして結構です>
|
があるので、評価関数を改めて次式のように両者の2乗和とします。
これは、とおくと
と計算できます。ここで、を直接計算することは容易ではないのですが、
<このパートは最初は読み飛ばして結構です> が安定行列であることは,が,リャプノフ方程式
|
すなわち
の解であることに等しいという結果を用います。
(56)よりを求めれば,評価関数は
となります。ここで,第1項は,(11)で,としたものであることに注意します。いま,かつという場合を考えてみると,(50)の第2行目より
だから,(35)は状態フィードバックに相当します。この場合の議論はすでに行っており,は存在しないので,評価関数(59)は第1項だけとなり,これを最小化するは,リッカチ方程式
の解を用いて次のように与えられます。
そうすると,評価関数(59)の第2項と第3項は,状態オブザーバを用いるために生じると考えられます。このように,理想的な状態フィードバックに比べて評価関数の値が増えることを評価関数の劣化と呼びます。
つぎに,仮定,,のもとでは,(57)よりを得ます。このとき,式(58)は
となり,これからが求まります。したがって,評価関数(59)は
と書けます。評価関数の劣化分を最小化するためには,#2をについて最小化すればよいことになります。幸いなことに,#2は#1と同形であるので,これを最小化するの決定法はと同様に行ないます。
●以上の議論をまとめると、次のようになります。
アルゴリズム <1次系のLQG制御>
入力パラメータ ステップ1: 状態フィードバックゲイン の決定 を解いて,を求め,をつぎのように定める。 ステップ2: オブザーバゲイン の決定 を解いて,を求め,をつぎのように定める。 ステップ3: オブザーバベース コントローラの構成 ただし
|
●、、、、、、、、として、状態フィードバックだけとオブザーバベース コントローラを用いた場合とを比較してみると、次の応答を得ます。
図6 状態フィードバックとオブザーバベース コントローラを用いた場合の応答の変化
演習A03-3…Flipped Classroom
図6のグラフを描け。
MATLAB |
|
SCILAB |
|
上のシミュレーションにおいて、となっていることを確かめよ。
Note A03 ラグランジュの未定定数法
1入力1出力1次系に対する最適制御(LQ制御)を考えましたが、一般の多入力多出力高次系の場合も同様な議論ができて、大変有用な制御手段として知られています。その説明はあとで行ないますが、そこではラグランジュの未定定数法によるアプローチが採用されます。
(11)の評価関数を最小化する問題を、をラグランジュの未定定数として
を最小化する問題として考え直してみます。ここで、制約条件は、リャプノフ方程式と呼ばれる
ですが、はを意味することに注意します。そこで、必要条件として次を得ます。
ここで、第2式から得られるを第3式に代入して
すなわち、リッカチ方程式と呼ばれるの2次方程式
を得ます。これからを
を求めて、は
のように得られます。十分性の議論はここでは省きます。