Was ist Kontrolltheorie?

Rückführung (feedback): Bei dynamischen Systemen ändern sich die Variablen im Lauf der Zeit, oft durch externe Einflüsse. Bei einer sog. Rückführung (feedback) sind mehrere dynamische Systeme miteinander verbunden und beeinflussen sich gegenseitig.

Beispiele:

  • Knopf zur automatischen Geschwindigkeitsreglung in US-amerikanischen Autos

  • Biologie: z. B. die Regulierung des Glukosespiegels im Blut, damit dieser konstant bleibt (Leber und Pankreas messen bzw. schütten die Hormone Insulin und Glukagon aus und beeinflussen sich somit gegenseitig)

  • Steuerproblem: Flug einer Rakete zum Mond mit möglichst wenig Treibstoffaufwand

  • Fliehkraftregler (centrifugal governor): Dieser hält die Rotationsgeschwindigkeit auf einem konstanten Wert, der von der Belastung der Maschine unabhängig ist. Obwohl er seit dem 17. Jahrhundert bekannt ist, wird er meist Watt/Boulton (1788) zugeschrieben. Eine theoretische Stabilitätsanalyse wurde von Maxwell und Hurwitz durchgeführt. Man spricht von negativer Rückführung, da das Ventil geschlossen/geöffnet wird, wenn sich die Maschine zu schnell/zu langsam bewegt. Allerdings muss nicht ein stabiles Gleichgewicht eintreten, es wäre z. B. auch eine Oszillation möglich (wie die Temperatur beim Thermostat).

positive Auswirkungen von Rückführung:

  • Erhöhung der Unempfindlichkeit des Systems auf externe Einflüsse
    (mehr Glukose durch Essen, Änderung der Belastung beim Fliehkraftregler)

  • Erhöhung der Robustheit gegen Veränderungen in den Komponenten
    (Veränderung der Masse des Rades beim Fliehkraftregler)

  • lineares Verhalten bei nicht-linearen Systemen erzwingen
    (Autopilot bei Kampfjets, Leistungselektronik)

negative Auswirkungen von Rückführung:

  • Erzeugung von dynamischen Instabilitäten, also Oszillationen oder bestimmte Divergenz
    (Reduktion der Reibung durch Optimierung der Maschine kann zu Oszillationen beim Fliehkraftregler führen)

  • Erhöhung der Empfindlichkeit auf externe Einflüsse und Veränderungen der Komponenten
    (Verstärkung des Rauschens bei einem Sensor)

Kontrolltheorie: Der Zweck von Regelung (control) ist die Gestaltung von Komponenten eines technischen Rückführungssystems, um ein gewünschtes Gesamtverhalten zu erzielen.
Kontrolltheorie (control theory) stellt die notwendigen mathematischen Grundlagen, Werkzeuge und Algorithmen sowie das nötige Vokabular bzw. die Technik bereit, um dieses Ziel zu erreichen.

Mathematische Modelle dynamischer Systeme

dynamisches System:
In einem dynamischen System treten die Auswirkungen einer Aktion nicht sofort auf.

Zum Beispiel erhöht die Betätigung des Gaspedals im Auto nicht sofort die Geschwindigkeit, die Temperatur steigt nicht sofort an, wenn die Heizung angeschaltet wird, Kopfschmerzen verschwinden erst langsam, nachdem Medizin eingenommen wurde, und eine Geldanlage führt nur in der Zukunft zu Gewinnen oder Verlusten.

Variablen eines dynamischen Systems verändern sich mit der Zeit. Die Entwicklung hängt dabei von der äußeren Anregung ab, die sich selbst mit der Zeit ändert.

mathematisches Modell: Eine Möglichkeit der Analyse des Verhalten eines dynamischen Systems besteht mittels eines mathematischen Modells. Solche Modelle werden oft durch (gewöhnliche oder partielle) Differentialgleichungen beschrieben.

Beispiel: Beim gedämpften Federpendel (mass-spring-damper system) hängt eine Masse \(m\) mittels einer Feder (Federkonstante \(k\)) an einer Wand (Abstand \(q\), abhängig von der Zeit \(t\)). Gleichzeitig ist zwischen Masse und Wand eine Dämpfung \(c(\dot {q})\) eingebaut, die von der Geschwindigkeit der Masse abhängt (auch nicht-linear möglich). Nach dem zweiten Newtonschen Gesetz und dem Hookeschen Gesetz gilt \(m \ddot {q} + c(\dot {q}) + kq = 0\) (Federkraft wirkt in Richtung der Ruheposition).

Eingangsgrößen: Ein dynamisches System ist autonom (autonomous), falls es nicht externen Einflüssen ausgesetzt ist. Nicht-autonome Systeme haben externe Eingangsgrößen (inputs).

Beispiel: Im obigen Beispiel erhält man mit \(u(\cdot )\) der externen Kraft, die auf die Masse wirkt, \(m \ddot {q} + c(\dot {q}) + kq = u\). Die Kraft \(u(\cdot )\) variiert normalerweise mit der Zeit. Je nach Umständen kann sie auf zwei verschiedene Arten interpretiert werden:

  • Steuergröße (control input): falls \(u(\cdot )\) frei verändert werden darf

  • Störgröße (disturbance input): falls \(u(\cdot )\) durch die Natur feststeht und nicht verändert werden darf

Ausgangsgrößen: Meistens interessiert man sich nicht für alle Variablen, die in einem Modell vorkommen. Ausgangsgrößen (outputs) beschreiben die Größen, für die man sich interessiert.

Beispiel: Wenn man sich im obigen Beispiel nur für die Auslenkung interessiert, dann ist der Ausgang \(y\) bestimmt durch \(m \ddot {q} + c(\dot {q}) + kq = u\), \(y = q\). Für eine bestimmte Steuergröße \(u(\cdot )\) ist die Ausgangsgröße \(y(\cdot )\) eine Funktion in Abhängigkeit von der Zeit. Auch \(y\) kann auf zwei Arten interpretiert werden:

  • \(y\) ist eine Variable, die gemessen werden kann (mittels Sensoren).

  • \(y\) ist eine Variable, die zur Analyse der Eigenschaften des Systems überwacht werden soll (in der Simulation).

Interpretation des Modells: Seien \(u(t)\) eine Eingangsgröße, die für \(t \ge 0\) definiert ist, und \(q_0\) und \(v_0\) eine Anfangsposition bzw. eine Anfangsgeschwindigkeit. Falls \(u \in \C \) und \(c \in \C ^1\) gilt, dann hat das Anfangswertproblem \(m \ddot {q}(t) + c(\dot {q}(t)) + k q(t) = u(t)\) mit \(q(0) = q_0\), \(\dot {q}(0) = v_0\) eine eindeutige, differenzierbare Lösung \(q(t)\), die für \(t \in [0, t_1)\) mit einem \(t_1 > 0\) definiert ist (die Lösung muss nicht für alle \(t \ge 0\) existieren).

Zustandsgröße: Weil die Werte für \(q(0)\) und \(\dot {q}(0)\) die Lösung der DGL (für eine feste Eingangsgröße) eindeutig festlegen, heißen \(x = \smallpmatrix {x_1 \\ x_2} := \smallpmatrix {q \\ \dot {q}}\) und \(x(t) = \smallpmatrix {x_1(t) \\ x_2(t)} := \smallpmatrix {q(t) \\ \dot {q}(t)}\) Zustandsvektor (state-vector) bzw. Zustandsgröße (state-response). Der Ausgang (response) des Systems ist bestimmt durch \(y(t) = q(t)\).

Verhalten: Bei einem System wie \(m \ddot {q} + c(\dot {q}) + kq = u\), \(y = q\) ist man an seinem Verhalten (behavior) interessiert, also die Menge aller Eingangs-, Zustands- und Ausgangsgrößen \(u(\cdot )\), \((q(\cdot ), \dot {q}(\cdot ))\) und \(y(\cdot )\), die diese Gleichung erfüllen.

Trajektorien: Signale (signals) oder Traktorien (trajectories) sind vektorwertige Funktionen der Zeit. Normalerweise wird stillschweigend angenommen, dass sie abschnittsweise stetig sind.

Die Bedingungen, die erfüllt sein müssen, werden oft durch DGLs beschrieben. Dabei müssen Annahmen gemacht werden, sodass die Existenz und Eindeutigkeit der Lösung des Anfangswertproblems sichergestellt ist.

Äquivalenz: Verschiedene Beschreibungen eines Systems können zum selben Verhalten führen. In diesem Fall heißen die System(-Beschreibungen) äquivalent (equivalent). Im sog. verhaltensbasierten Ansatz bei dynamischen Systemen wird die nötige Theorie in einer mathematisch präzisen Weise entwickelt.

beispielhafte Fragen:

  • Falls es keinen externen Einfluss gibt, wie verhalten sich die Zustands- und Ausgangsgröße?

  • Kann das System von einer Position in eine andere gebracht werden (Steuerproblem, steering problem)?

  • Ist es möglich, die Eingangs- aus der Ausgangsgröße zu rekonstruieren?

  • Kann das System so modifiziert werden, sodass ein gewünschtes Verhalten erzielt wird?

Bei manchen von diesen (groben) Fragen muss das System auf seine Eigenschaften hin untersucht werden, bei anderen müssen Eingangsgrößen verarbeitet oder die Systembedingungen verändert werden, um das Verhalten des Systems zu ändern. Mit der Kontrolltheorie versucht man, solche Fragen systematisch zu beantworten.

von Modellen zweiter zu Modellen erster Ordnung: Die Beschreibung \(m \ddot {q} + c(\dot {q}) + kq = u\) beinhaltet die ersten beiden Ableitungen von \(q\). Für \(m \not = 0\) heißt sie DGL zweiter Ordnung. Mit den Zustandsvariablen (state-variables) \(x_1 = q\) und \(x_2 = \dot {q}\) gilt \(\dot {x}_1 = \dot {q} = x_2\), also
\(\dot {x}_2 = \ddot {q} = -\frac {k}{m} q - \frac {c(\dot {q})}{m} + \frac {1}{m} u = -\frac {k}{m} x_1 - \frac {1}{m} c(x_2) + \frac {1}{m} u\). Das kann geschrieben werden als
\(\dot {x} := \smallpmatrix {\dot {x}_1 \\ \dot {x}_2} = \smallpmatrix {x_2 \\ -\frac {k}{m} x_1 - \frac {1}{m} c(x_2) + \frac {1}{m} u} =: f(x, u)\), man erhält also eine zweidim. DGL erster Ordnung.

Lemma (Umwandlung in System erster Ordnung): Sei \(r\) eine reellwertige, nicht-lineare Funktion mit \(n + 1\) Argumenten. Dann ist das System \(q^{(n)} + r(q^{(n-1)}, q^{(n-2)}, \dotsc , \dot {q}, q, u) = 0\) äquivalent zu \(\dot {x} := \smallpmatrix {\dot {x}_1 \\ \dot {x}_2 \\ \vdots \\ \dot {x}_{n-1} \\ \dot {x}_n} = \smallpmatrix {x_2 \\ x_3 \\ \vdots \\ x_n \\ -r(x_n, x_{n-1}, \dotsc , x_2, x_1, u)} =: f(x, u)\).

Diese Methode ist jedoch nicht eindeutig:

Lemma (Umwandlung in System erster Ordnung 2): Sei \(r\) eine reellwertige, nicht-lineare Funktion mit \(n + 1\) Argumenten. Dann ist das System \(q^{(n)} + r(q^{(n-1)}, q^{(n-2)}, \dotsc , \dot {q}, q, u) = 0\) äquivalent zu \(\dot {z} := \smallpmatrix {\dot {z}_1 \\ \dot {z}_2 \\ \vdots \\ \dot {z}_{n-1} \\ \dot {z}_n} = \smallpmatrix {-r(z_1, z_2, \dotsc , z_{n-1}, z_n, u) \\ z_1 \\ \vdots \\ z_{n-2} \\ z_{n-1}} =: \widehat {f}(z, u)\).

Zustandsraum-Darstellung: Physikalische Modelle führen oft zu einem System von DGLs höherer Ordnung. Wie gerade gezeigt, können diese oft (aber nicht immer!) äquivalent geschrieben werden als eine Vektor-DGL erster Ordnung \(\dot {x} = f(x, u)\) und \(y = h(x, u)\) mit Abbildungen \(f\colon X \times U \rightarrow \real ^n\) und \(h\colon X \times U \rightarrow \real ^k\), wobei \(X \subset \real ^n\) und \(U \subset \real ^m\).
Ausführlich geschrieben:

\begin{align*} \dot {x}_1 &= f_1(x_1, \dotsc , x_n, u_1, \dotsc , u_m),& y_1 &= h_1(x_1, \dotsc , x_n, u_1, \dotsc , u_m),\\ &\;\;\vdots &&\;\;\vdots \\ \dot {x}_n &= f_n(x_1, \dotsc , x_n, u_1, \dotsc , u_m),& y_k &= h_k(x_1, \dotsc , x_n, u_1, \dotsc , u_m). \end{align*} Diese Darstellung nennt man die Zustandsraum-Darstellung (state-space description). Die Funktionen können auch explizit von der Zeit abhängen.

Wenn \(u(\cdot )\colon I \rightarrow U\) eine Eingangsgröße auf einem offenen Intervall \(I \subset \real \) mit \(0 \in I\) und \(\xi \in \real ^n\) eine Anfangsbedingung für den Zustand ist, dann erhält man die Zustandsgröße durch Lösung des AWP \(\dot {x}(t) = f(x(t), u(t))\), \(x(0) = \xi \). Die Ausgangsgröße ist dann einfach \(y(t) := h(x(t), u(t))\) für \(t \in I\).

Die Existenz und Eindeutigkeit der Zustandsgröße \(x\) auf einem offenen Teilintervall von \(I\) ist garantiert, wenn \(f\) stetig in \((x, u)\), \(f\) Lipschitz-stetig in \(x\) und \(u\) stetig ist. Das gilt auch für Eingänge \(u\), die nur abschnittsweise stetig sind (endlich viele Sprungstellen). In diesem Fall löst man die DGL abschnittsweise und setzt als Anfangsbedingung für den zweiten Abschnitt den Wert der Lösung im ersten Abschnitt an der Zeit ein, an der der Sprung stattfindet. Dadurch ist die Lösung in jedem Fall stetig, wird jedoch Sprünge in der Ableitung besitzen.

allgemeine Beschreibung eines linearen Systems: Wenn \(f\) und \(h\) linear sind, dann gilt \(f(x, u) = Ax + Bu\) und \(h(x, u) = Cx + Du\) mit \(A \in \real ^{n \times n}\), \(B \in \real ^{n \times m}\), \(C \in \real ^{k \times n}\), \(D \in \real ^{k \times m}\).
Daher wird ein allgemeines lineares, zeit-invariantes System, genannt LTI-System (linear, time-
invariant system)
, beschrieben durch \(\dot {x} = Ax + Bu\), \(y = Cx + Du\).

Dieses System wird im Folgenden hauptsächlich verwendet, denn viele technische Systeme können oft durch lineare Systeme angenähert werden. Andererseits benötigen physikalische Modelle oft nicht-lineare dynamische Systeme.

Wiederholung: Globale Existenz und Eindeutigkeit von Lösungen von Anfangswertproblemen

Sei das Anfangswertproblem \(\dot {x} = g(t, x)\), \(x(\tau ) = \xi \), für \(g\colon D \rightarrow \real ^n\) mit \(D \subset \real \times \real ^n\) gegeben.

Voraussetzungen: Seien \(D \subset \real \times \real ^n\) offen und \(g\colon D \rightarrow \real ^n\) stetig in \((t, x)\) und
lokal Lipschitz-stetig in \(x\), d. h. für alle \((\tau , \xi ) \in D\) gibt es eine Umgebung \(U \subset D\) von \((\tau , \xi )\) und ein \(L > 0\) mit \(\norm {g(t, x) - g(t, y)} \le L \norm {x - y}\) für alle \((t, x), (t, y) \in U\).

Die Voraussetzungen sind erfüllt, wenn \(g\) und \(\partial _x g\) stetig auf \(D\) sind, also insbesondere, wenn \(g \in \C ^1(D, \real ^n)\).

Satz (globale Existenz und Eindeutigkeit): Unter obigen Voraussetzungen gibt es für jedes \((\tau , \xi ) \in D\) ein maximales Existenzintervall \(I_{(\tau , \xi )} = (t_-, t_+)\) mit \(\tau \in I_{(\tau , \xi )}\) und eine eindeutige \(\C ^1\)-Lösung \(x(\cdot , \tau , \xi )\colon I_{(\tau , \xi )} \rightarrow \real ^n\) des AWP \(\dot {x} = g(t, x)\), \(x(\tau ) = \xi \).
Maximalität von \(I_{(\tau , \xi )}\) bedeutet, dass für jede \(\C ^1\)-Lösung \(x_J\colon J \rightarrow \real ^n\) des AWP auf einem Intervall \(J\) mit \(\tau \in J\) automatisch \(J \subset I_{(\tau , \xi )}\) und \(x_J = x|_J\) erfüllt ist.
Außerdem gilt für \(t_+ < \infty \) genau eine der folgenden beiden Eigenschaften (analog für \(t_- > -\infty \)):

  • Die Lösung divergiert bestimmt in der Norm:
    \(\lim _{t \to t_+-0} \norm {x(t)} = \infty \).

  • Die Lösung nähert sich dem Rand von \(D\) an:
    Für alle Folgen \((t_\nu )_{\nu \in \natural }\) in \(I_{(\tau , \xi )}\) mit \(t_\nu \to t_+\) und \(x(t_\nu ) \to x_+\) gilt \((t_+, x_+) \in \partial D\).

Simulation

Integraldarstellung von DGLs: Die Beschreibung eines Systems mit Differential- und Ausgangsgleichung \(\dot {x}(t) = f(x(t), u(t))\), \(x(0) = \xi \), und \(y(t) = h(x(t), u(t))\) erlaubt die numerische Berechnung des Ausgangs (für einen Eingang und eine Anfangsbedingung) durch ODE-Löser wie z. B. ode45 oder ode15s in MATLAB. Durch Integration der DGL über die Zeit erhält man die Integraldarstellung \(x(t) = \xi + \int _0^t f(x(\tau ), u(\tau ))\d \tau \), \(y(t) = h(x(t), u(t))\).

Die Darstellung kann man wie folgt interpretieren: Definiere zunächst die Abbildung \(\Sigma _1\) mit \(\smallpmatrix {x(\cdot ) \\ u(\cdot )} \mapsto z(\cdot )\), wobei \(z(t) := f(x(t), u(t))\) (statisches System (static system)). Definiere dann die Integration mit Anfangswert \(\xi \): \(\Sigma _2\) mit \(v(\cdot ) \mapsto w(\cdot )\), wobei \(w(t) := \xi + \int _0^t v(\tau )\d \tau \). Durch Komposition der beiden Abbildungen erhält man die Abbildung \(\Sigma _2 \circ \Sigma _1\) mit \(\smallpmatrix {x(\cdot ) \\ u(\cdot )} \mapsto w(\cdot )\), wobei \(w(t) := \xi + \int _0^t f(x(\tau ), u(\tau ))\d \tau \). Für ein festes \(u(\cdot )\) ist nun ein Fixpunkt \(x(\cdot )\) dieser Abbildung gesucht. Dies kann man in einem Simulink-Diagramm darstellen:

(image)

Den Ausgang erhält man dann einfach durch Anwendung von \(h(\cdot , \cdot )\) auf \(x(\cdot )\) und \(u(\cdot )\) (wie bei \(\Sigma _1\)).

inverses Pendel: Ein inverses Pendel (cart-pendulum system) ist ein mathematisches Pendel, das in der Ruhelage nach oben zeigt. Das Pendel kann nur in einer Dimension schwingen und ist auf einem Wagen befestigt, der sich in derselben Dimension hin- und her bewegen kann. Der „Wagen“ ist so gebaut, dass das Pendel auch nach unten schwingen kann, es kann also die 360° voll ausnutzen. Das Ziel ist, das Pendel durch Bewegung des Wagens in seiner instabilen Ruhelage zu halten. Ein Segway kann vereinfacht als inverses Pendel betrachtet werden.

Bezeichnet man die Masse am Pendel mit \(m\), die Masse des Wagens mit \(M\), die zurückgelegte Strecke des Wagens mit \(p\), die auf den Wagen wirkende Kraft mit \(F\), die Länge des Pendels mit \(\ell \) und den Winkel der Auslenkung des Pendels aus der Ruhelage mit \(\theta \), so erhält man mit den Lagrange-Gleichungen \((M + m)\ddot {p} - m\ell \cos (\theta )\ddot {\theta } + c\dot {p} + m\ell \sin (\theta )\dot {\theta }^2 = F\) sowie
\(-m\ell \cos (\theta )\ddot {p} + m\ell ^2\ddot {\theta } + \gamma \dot {\theta } - mg\ell \sin (\theta ) = 0\), wobei \(c\) und \(\gamma \) den Reibungswiderstand des Wagens und des Pendels beschreiben.

Mit \(U(\theta ) := \smallpmatrix {M + m&-m\ell \cos (\theta )\\-m\ell \cos (\theta )&m\ell ^2}\) und \(v(\theta , \dot {p}, \dot {\theta }) := \smallpmatrix {c\dot {p} + m\ell \sin (\theta )\dot {\theta }^2 \\ \gamma \dot {\theta } - mg\ell \sin (\theta )}\) kann man das System schreiben als \(U(\theta ) \smallpmatrix {\ddot {p} \\ \ddot {\theta }} + v(\theta , \dot {p}, \dot {\theta }) = \smallpmatrix {F \\ 0}\). Dabei ist \(U(\theta )\) invertierbar, weil die Determinante für kein \(\theta \) verschwindet. Deswegen kann man dies schreiben als
\(\smallpmatrix {\ddot {p} \\ \ddot {\theta }} = -U(\theta )^{-1} v(\theta , \dot {p}, \dot {\theta }) + U(\theta )^{-1} \smallpmatrix {F \\ 0} =: \smallpmatrix {w_1(p, \theta , \dot {p}, \dot {\theta }, F) \\ w_2(p, \theta , \dot {p}, \dot {\theta }, F)}\).

Wenn man die Zustandsgrößen \(\smallpmatrix {x_1 \\ x_2} := \smallpmatrix {p \\ \theta }\) und \(\smallpmatrix {x_3 \\ x_4} := \smallpmatrix {\dot {p} \\ \dot {\theta }}\) sowie die Eingangsgröße \(u := F\) definiert, so kann das System durch \(\dot {x} = f(x, u)\) als System erster Ordnung beschrieben werden, wobei \(f(x, u) := \smallpmatrix {x_3 \\ x_4 \\ w_1(x, u) \\ w_2(x, u)}\).

Gleichgewichte und Linearisierung

Gleichgewicht: Alle Paare von Vektoren \((x_e, u_e) \in X \times U\) mit \(f(x_e, u_e) = 0\) heißen
Gleichgewichte (equilibria) des Systems \(\dot {x} = f(x, u)\).

Wenn ein System mit der konstanten Steuergröße \(u(t) = u_e\) betrieben wird, der Zustand durch \(x_e(t_0) = x_e\) initialisiert wird und die Lösung des Systems eindeutig ist, dann gilt \(x(t) \equiv x_e\) für alle \(t \ge t_0\) (weil das eine Lösung ist, da \(f(x_e, u_e) = 0\)).

Beispiel: Für Gleichgewichte in obiger DGL müssen die Ableitungen von \(p\) und \(\theta \) verschwinden, also \(0 = F\) und \(-mg\ell \sin (\theta ) = 0\). Die Lösungen sind \(\theta _e = 0\) (aufrechte Position) und \(\theta _e = \pi \) (nach unten zeigend), wobei \(p_e\) beliebig ist.

Herleitung der Linearisierung: Falls \(f\) und \(h\) stetig differenzierbar sind, kann man die Taylorentwicklungen erster Ordnung um \((x_e, u_e)\) berechnen als
\(f(x, u) \approx f(x_e, u_e) + \partial _x f(x_e, u_e) (x - x_e) + \partial _u f(x_e, u_e) (u - u_e)\) und
\(h(x, u) \approx y_e + \partial _x h(x_e, u_e) (x - x_e) + \partial _u h(x_e, u_e) (u - u_e)\), wobei \(y_e := h(x_e, u_e)\).
Dabei sind die partiellen Ableitungen die Jacobi-Matrizen. Die Näherung ist besonders gut, falls \(x \approx x_e\) und \(u \approx u_e\). Daher kann man die Entwicklungen zur Linearisierung von nicht-linearen Systemen verwenden.

Linearisierung: Seien \(f(x_e, u_e) = 0\) und \(f, h \in \C ^1\). Dann ist die Linearisierung (linearization) von \(\dot {x} = f(x, u)\), \(y = h(x, u)\) bei \((x_e, u_e)\) gegeben durch \(\dot {x}_\Delta = A x_\Delta + B u_\Delta \), \(y_\Delta = C x_\Delta , + D u_\Delta \), wobei \(A := \partial _x f(x_e, u_e)\), \(B := \partial _u f(x_e, u_e)\), \(C := \partial _x h(x_e, u_e)\), \(D := \partial _u h(x_e, u_e)\).

Für die betrachteten \(t\) gelte \(u(t) \approx u_e\) und \(x(t) \approx x_e\). Für die nicht-lineare Ausgangsgröße gilt also \(y(t) \approx y_e\). Wenn man nun die Linearisierung mit \(u_\Delta := u(t) - u_e\) für den Anfangswert \(x_\Delta (0) := x(0) - x_e\) ausführt, so hofft man, dass \(y_e + y_\Delta (t)\) die nicht-lineare Ausgangsgröße \(y(t)\) gut approximiert.
Es gilt nämlich \(\left [x(t) - x_e\right ]^\cdot = \dot {x}(t) = f(x(t), u(t)) \approx A[x(t) - x_e] + Bu_\Delta (t)\) nach Definition der Linearisierung (\((x_e, u_e)\) ist nämlich ein Gleichgewicht). Wenn die Trajektorie \(x(\cdot )\) nahe an \(x_e\) bleibt, dann ist die Taylor-Abschätzung besonders gut – würde ein Gleichheitszeichen stehen, dann wäre \([x(t) - x_e]\) ebenfalls eine Lösung der Linearisierung, es müsste also \(x_\Delta (t) = x(t) - x_e\) gelten. Aufgrund der nur ungefähren Gleichheit gilt aber nur \(x_\Delta (t) \approx x(t) - x_e\).
Außerdem gilt \(\left [y(t) - y_e\right ] = h(x(t), u(t)) - y_e \approx C[x(t) - x_e] + Du_\Delta (t)\). Für \(x_\Delta (t) \approx x(t) - x_e\) ist die rechte Seite ungefähr gleich \(y_\Delta (t)\), also \(y_\Delta (t) \approx y(t) - y_e\). So erhält man \(y(t) \approx y_e + y_\Delta (t)\).

Beispiel: Man betrachtet das inverse Pendel im nach unten zeigenden, stabilen Gleichgewicht. Wenn man nur kurz eine Kraft anwendet, dann schlägt das Pendel nur kurz in beide Richtungen aus, ehe es sich wieder im Gleichgewicht befindet. Weil keine großen Abweichungen der Position auftreten, ist die zugehörige Linearisierung eine ziemlich gute Annäherung.
Anders sieht es aus, wenn man das Pendel im oberen, instabilen Gleichgewicht startet und dieselbe Kraft kurz anwendet. Dann wird das Pendel nach unten schwingen und sich im unteren Gleichgewicht einpendeln. Wegen der großen Abweichungen der Position zur Startposition ist die Linearisierung für das obere Gleichgewicht keine gute Annäherung.

Systemverbindungen und Blockdiagramme

Modularität ist eines der wichtigsten Konzepte bei der Modellierung von dynamischen Systemen. Komplexe Modelle werden durch Verbindung einfacher Systemkomponenten in einer Art Hierarchie verbunden. Die Verbindung geschieht dabei durch Gleichsetzung von Signalen.

Vorteile der Modularität:

  • Benutzung von Softwarebibliotheken mit Standard-Systemkomponenten und Schnittstellen zwischen verschiedenen physikalischen Bereichen

  • Benutzung von Modellierungspaketen (MATLAB, Modelica)

  • Übersichtlichkeit auch bei komplexen Modellen durch die hierarchische, verschachtelte Struktur

  • Veränderung von einzelnen Komponenten, ohne das Gesamtgefüge zu zerstören

Beispiel: Beim inversen Pendel geht man davon aus, dass die Kraft des Wagens durch einen elektrischen Gleichstrom-Motor an einem Rad mit Radius \(r\) erzeugt wird. Wenn die Spannung \(V\) an den Motor angelegt wird, dann erzeugt der Strom in den Spulen ein Drehmoment. Wenn \(T\) das Lastmoment des Motors ist, dann wird die Dynamik des Motors durch \(J\ddot {\phi } + b\dot {\phi } = k_m I - T\), \(L\dot {I} + RI = V - k_e\dot {\phi }\) beschrieben, wobei \(J, b, k_m, L, R, k_e > 0\) konstant sind. Man nimmt an, dass das Lastmoment und der Winkel der Motorwelle durch \(T = Fr\) und \(p = r\phi \) mit \(F\) und \(p\) zusammenhängen. Diese Gleichungen muss man nun mit der ursprünglichen DGL des inversen Pendels kombinieren. Man erhält dann \(L\dot {I} + RI + \frac {k_e}{r}\dot {p} = V\),
\(\left (M + m + \frac {J}{r^2}\right )\ddot {p} - m\ell \cos (\theta )\ddot {\theta } + \left (c + \frac {b}{r^2}\right )\dot {p} + m\ell \sin (\theta )\dot {\theta }^2 - \frac {k_m}{r}I = 0\) sowie
\(-m\ell \cos (\theta )\ddot {p} + m\ell ^2\ddot {\theta } + \gamma \dot {\theta } - mg\ell \sin (\theta ) = 0\).
Die gekoppelten Gleichungen heißen oft auch beidseitig gekoppelt, weil sich die Dynamik beider Systeme gegenseitig beeinflusst. Für \(k_e = 0\) wäre die Kopplung einseitig (die erste Gleichung könnte dann separat gelöst werden).
In der Simulation erkennt man, dass für kleines \(L\) (Motor kann die Kraft schnell aufwenden) die Lösung sich kaum von der Lösung ohne Motor unterscheidet. Für größeres \(L\) (nur langsame Aufwendung der Kraft) unterscheiden sich die beiden Systeme jedoch erheblich.

Reihenschaltung: Die Reihenschaltung (series interconnection) der Systeme
\(\dot {x}_1 = f_1(x_1, u_1)\), \(y_1 = h_1(x_1, u_1)\) und \(\dot {x}_2 = f_2(x_2, u_2)\), \(y_2 = h_2(x_2, u_2)\) erhält man, wenn man den Ausgang des ersten Systems mit dem Eingang des zweiten Systems verbindet, also \(u_2 = y_1\) (dabei müssen die Dimensionen übereinstimmen). Man erhält das System
\(\dot {x} = f(x, u_1)\), \(y_2 = h_2(x_2, h_1(x_1, u_1))\), wobei \(x := \smallpmatrix {x_1 \\ x_2}\) und \(f(x, u_1) := \smallpmatrix {f_1(x_1, u_1) \\ f_2(x_2, h_1(x_1, u_1))}\).

Für lineare Systeme \(\dot {x}_1 = A_1 x_1 + B_1 u_1\), \(y_1 = C_1 x_1 + D_1 u_1\) und
\(\dot {x}_2 = A_2 x_2 + B_2 u_2\), \(y_2 = C_2 x_2 + D_2 u_2\) entspricht dies \(\dot {x} = Ax + Bu_1\), \(y_2 = Cx + Du_1\)
mit \(x := \smallpmatrix {x_1 \\ x_2}\) sowie \(A := \smallpmatrix {A_1 & 0 \\ B_2 C_1 & A_2}\), \(B := \smallpmatrix {B_1 \\ B_2 D_1}\), \(C := \smallpmatrix {D_2 C_1 & C_2}\) und \(D := D_2 D_1\).

Parallelschaltung: Die Parallelschaltung (parallel interconnection) der Systeme
\(\dot {x}_1 = f_1(x_1, u_1)\), \(y_1 = h_1(x_1, u_1)\) und \(\dot {x}_2 = f_2(x_2, u_2)\), \(y_2 = h_2(x_2, u_2)\) erhält man, wenn beide denselben Eingang haben und man die Ausgänge summiert, also \(u_1 = u_2 = u\) und \(y = y_1 + y_2\) (dabei müssen die Dimensionen übereinstimmen). Man erhält das System
\(\dot {x} = f(x, u)\), \(y = h_1(x_1, u) + h_2(x_2, u)\), wobei \(x := \smallpmatrix {x_1 \\ x_2}\) und \(f(x, u) := \smallpmatrix {f_1(x_1, u) \\ f_2(x_2, u)}\).

Für lineare Systeme \(\dot {x}_1 = A_1 x_1 + B_1 u_1\), \(y_1 = C_1 x_1 + D_1 u_1\) und
\(\dot {x}_2 = A_2 x_2 + B_2 u_2\), \(y_2 = C_2 x_2 + D_2 u_2\) entspricht dies \(\dot {x} = Ax + Bu\), \(y = Cx + Du\)
mit \(x := \smallpmatrix {x_1 \\ x_2}\) sowie \(A := \smallpmatrix {A_1 & 0 \\ 0 & A_2}\), \(B := \smallpmatrix {B_1 \\ B_2}\), \(C := \smallpmatrix {C_1 & C_2}\) und \(D := D_1 + D_2\).

Control System Toolbox: Die Control System Toolbox von MATLAB stellt sog. ss-Objekte bereit, die lineare Systeme darstellen. Die Verwendung erfolgt wie folgt:

  • Definition: sys = ss(A, B, C, D)

  • Reihenschaltung: sys = sys1 * sys2

  • Parallelschaltung: sys = sys1 + sys2

  • Simulation: y = lsim(sys, u, T, x0)

  • Bestimmung der definierenden Matrizen: [A, B, C, D] = ssdata(sys)

Die überladenen Operatoren * und + erinnern an die zugehörigen Operationen der Matrizen, die bei der Bildung der Reihen- bzw. Parallelschaltung verwendet werden.

Blockdiagramm: Ein Blockdiagramm (block-diagram) besteht aus Verbindungen von einzelnen Blöcken. Solche Diagramme sollten bestimmten algebraischen Gleichungen entsprechen.

Beispiele:

  • Reihenschaltung:
    (image)

  • Parallelschaltung:
    (image)

  • gedämpftes Federpendel:
    (image)

  • allgemeines lineares System: (in Simulink auch darstellbar durch einen State-Space- oder LTI Systems-Block, definiert durch \(A, B, C, D\) bzw. ein ss-Objekt)
    (image)