Numerische Mathematik 2 – Randwertprobleme für gewöhnliche Differentialgleichungen 2. Ordnung

Definitionen und Beispiele

allgemeines Anfangs-Randwertproblem: Es seien \(a, b \in \real \), \(I = (a, b)\) und \(T \ge 0\).
Außerdem sind ein Differentialoperator \(B\colon \C ^\alpha \rightarrow \C ^\beta \) und eine Funktion \(f \in \C ^\beta ([0, T] \times I, \real ^n)\) gegeben. Gesucht ist eine Funktion \(u \in \C ^\alpha ([0, T] \times I, \real ^n)\) mit \(B(u) = f\).
Dabei sollen die Anfangsbedingungen \(\forall _{x \in I}\; u(0, x) = u_0(x)\) sowie die Randbedingungen
\(\forall _{t \in [0, T]}\; (\gamma _a u)(t, a) = g_a(t),\; (\gamma _b u)(t, b) = g_b(t)\) mit gegegeben Funktionen \(u_0, g_a, g_b\) sowie
Randdifferentialoperatoren \(\gamma _a, \gamma _b\) erfüllt sein.
Für \(u(0, a)\) und \(u(0, b)\) sind außerdem Kompatibilitätsbedingungen erforderlich, damit sich die Anfangs- und Randbedingungen nicht von vorneherein widersprechen.
Dieses Problem heißt allgemeines Anfangs-Randwertproblem (ARWP).

stationär: Ein ARWP heißt stationär, falls \(T = 0\) (d. h. \(B(u)\) enthält keine Abhängigkeiten von \(t\)) und keine Anfangsbedingung existiert. Man nennt das ARWP dann auch stationäres Randwertproblem (RWP).

Beispiel: Ein Beispiel für ein stationäres RWP ist die Poisson-Gleichung \(-u’’(x) = f(x)\) für \(x \in (a, b)\) mit den sog. Dirichlet-Randbedingungen \(u(a) = u_a\) und \(u(b) = u_b\). Man erhält eine triviale Lösung durch zweifache Integration unter Bestimmung der Integrationskonstanten aus den Randbedingungen.

Beispiel: Bei der instationären Wärmeleitungsgleichung ist ein Stab der Länge \(L\) gegeben. Gesucht wird die Temperaturverteilung \(u(t, x)\) im Stab in Abhängigkeit von der Zeit \(t\) und der Stelle \(x\). Das ARWP ist \(u_t = u_{xx}\) für \((t, x) \in (0, \infty ) \times (0, L)\) mit der Anfangsbedingung \(u(0, x) = u_0(x)\) für \(x \in (0, L)\) und den Randbedingungen \(u(t, 0) = u^{(0)}(t)\) und \(u(t, L) = u^{(L)}(t)\) für \(t \in (0, \infty )\). Die Kompatibilitätsbedingung ist \(u(0, 0) = u_0(0) = u^{(0)}(0)\).
Man kann auch ein stationäres RWP für \(t \to \infty \) formulieren: \(u_{xx} = 0\) für \(x \in (0, L)\) mit \(u(0) = u^{(0)}\) und \(u(L) = u^{(L)}\).

Beispiel: Weitere Beispiele umfassen chemische Reaktionen (Transport durch Diffusion und Reaktion) und die Festkörpermechanik (Modellierung von Verschiebungen und Spannungen unter dem Einfluss von Randbedingungen und Kräften).

Typen von linearen Anfangs-Randwertproblemen: Sei ein ARWP mit \(B\) linear gegeben. Außerdem sei \(B\) so, dass keine gemischten Ableitungen auftreten.

Falls die Terme mit den höchsten Ableitungen gleiches Vorzeichen haben, so heißt \(B\) elliptisch. Ein Beispiel ist \(Bu = -u_{xx}\) (Poisson-Gleichung, ein stationäres Problem ist stets elliptisch).
Falls die Terme mit den höchsten Ableitungen umgekehrtes Vorzeichen haben, so heißt \(B\) hyperbolisch. Ein Beispiel ist \(Bu = u_{tt} - u_{xx}\) (Wellengleichung).
Falls ein Term höchster Ableitung fehlt, so heißt \(B\) parabolisch.
Ein Beispiel ist \(Bu = u_t - u_{xx}\) (Wärmeleitungsgleichung).

Sturm-Liouville-Problem: Gesucht ist \(u \in \C ^2(I)\) mit \(-(pu’)’ + qu = g\) für \(x \in I = (a, b)\). Dabei sind \(p(x) > 0\) und \(q(x) \ge 0\) gegeben und es sollen die Randbedingungen
\(R_1 u := r_{11} u(a) + r_{12} u’(a) = s_1\) und \(R_2 u := r_{21} u(b) + r_{22} u’(b) = s_2\) mit gegebenen \(r_{ij} \in \real \),
\((r_{11}, r_{12}), (r_{21}, r_{22}) \not = (0, 0)\) und \(s_i \in \real \) erfüllt werden.
Dieses Problem heißt Sturm-Liouville-Problem.

Bemerkung: Das Sturm-Liouville-Problem \(-(pu’)’ + qu = g\) ist äquivalent zu
\(\alpha _2(x) u’’(x) + \alpha _1 u’(x) + \alpha _0(x) u(x) = g(x)\) mit \(\alpha _2 = -p\), \(\alpha _1 = -p’\) und \(\alpha _0 = q\):
Einerseits gilt \(-(pu’)’ + qu = g = -pu’’ - p’u’ + qu\).
Andererseits gilt mit \(u := vw\), \(v, w\) beliebig, dass \(u’ = v’w + vw’\) und \(u’’ = v’’w + 2v’w’ + vw’’\), also \(\alpha _2 u’’ + \alpha _1 u’ + \alpha _0 u = (\alpha _2 w) v’’ + (2 \alpha _2 w’ + \alpha _1 w) v’ + (\alpha _2 w’’ + \alpha _1 w’ + \alpha _0 w) v\). Definiert man \(p := -\alpha _2 w\) und \(q := \alpha _2 w’’ + \alpha _1 w’ + \alpha _0 w\), so muss \((\alpha _2 w)’ = (2 \alpha _2 w’ + \alpha _1 w)\) gelten, also
\(\alpha _2 w’ + (\alpha _1 - \alpha _2’) w = 0\). Man erhält die Differentialgleichung \(\frac {\alpha _2’ - \alpha _1}{\alpha _2} w = w’\), die durch die spezielle Wahl von \(w(x) = e^{\beta (x)}\) mit \(\beta (x) = \int \frac {\alpha _2’(x) - \alpha _1(x)}{\alpha _2(x)} \dx \) gelöst wird. Somit erhält man das Problem \(-(pv’)’ + qv = g\) mit \(p = -\alpha _2 e^\beta \) und
\(q = \alpha _2 w’’ + \alpha _1 w’ + \alpha _0 w = \alpha _2 \beta ’’ w + \alpha _2 \beta ’ w’ + \alpha _1 \beta ’ w + \alpha _0 w = (\alpha _2 \beta ’’ + \alpha _2 (\beta ’)^2 + \alpha _1 \beta ’ + \alpha _0) e^\beta \).

Satz (eindeutige Lösbarkeit des Sturm-Liouville-Problems):
Das Sturm-Liouville-Problem \(\alpha _2 u’’ + \alpha _1 u’ + \alpha _0 u = g\) für \(x \in I\) und \(\alpha _2 \not = 0\) mit den Randbedingungen \(R_1 u := r_{11} u(a) + r_{12} u’(a) = s_1\) und \(R_2 u := r_{21} u(b) + r_{22} u’(b) = s_2\) ist eindeutig lösbar genau dann, wenn \(\det \)\(\begin {pmatrix}R_1 u_1 & R_1 u_2 \\ R_2 u_1 & R_2 u_2\end {pmatrix}\) \(\not = 0\), wobei \((u_1, u_2)\) ein Fundamentalsystem zur homogenen Gleichung \(\alpha _2 u’’ + \alpha _1 u’ + \alpha _0 u = 0\) ist.

Beispiel: Für das Beispiel \(-u’’(x) = f(x)\) für \(x \in I\) und \(R_1 u := u’(a) = 0\), \(R_2 u := u’(b) = 0\) muss zunächst ein Fundamentalsystem von \(u’’(x) = 0\) gefunden werden. Das ist z. B. \(u_1(x) = 1\) und \(u_2(x) = x\). Damit ist \(\det \)\(\begin {pmatrix}R_1 u_1 & R_1 u_2 \\ R_2 u_1 & R_2 u_2\end {pmatrix}\) \(=\) \(\det \)\(\begin {pmatrix}0 & 1 \\ 0 & 1\end {pmatrix}\) \(= 0\), d. h. das Sturm-Liouville-Problem ist nicht eindeutig lösbar.

Bemerkung: Die Schreibweise \(-(pu’)’ + qu = g\) ist vor allem daher von Bedeutung, weil sie „Variationsstruktur“ besitzt. Sei \(F\colon \C ^1(I) \rightarrow \real \) das Funktional \(F(v) := \frac {1}{2} \int _a^b p(x) (v’(x))^2 \dx + \frac {1}{2} \int _a^b q(x) (v(x))^2 \dx - \int _a^b g(x) v(x) \dx \). Betrachte folgende Variationsaufgabe: Finde \(u \in \C ^2(I)\) mit \(\forall _{v \in \C ^2(I)}\; F(u) \le F(v)\). Für eine Lösung \(u\) dieses Variationsproblems gilt
\(\forall _{w \in \C _0^\infty (I)}\; \lim _{\varepsilon \to 0} \frac {dF}{d\varepsilon }(u + \varepsilon w) = 0\). Mit \(z(\varepsilon ) := F(u + \varepsilon w)\)
\(= \frac {1}{2} \int _a^b p(x) (u’(x) + \varepsilon w’(x))^2 \dx + \frac {1}{2} \int _a^b q(x) (u(x) + \varepsilon w(x))^2 \dx - \int _a^b g(x) (u(x) + \varepsilon w(x)) \dx \) gilt
\(\frac {dz}{d\varepsilon } = \int _a^b p (u’ + \varepsilon w’) w’ \dx + \int _a^b q (u + \varepsilon w) w \dx - \int _a^b g w \dx \)
\(= -\int _a^b (p (u’ + \varepsilon w’))’ w \dx + \int _a^b q (u + \varepsilon w) w \dx - \int _a^b g w \dx \xrightarrow {\varepsilon \to 0} 0\). Daraus folgt
\(-\int _a^b (p u’)’ w \dx + \int _a^b q u w \dx - \int _a^b g w \dx = \int _a^b ((-p u’)’ + q u - g) w \dx = 0\) für alle \(w \in \C _0^\infty (I)\), d. h. \(u\) ist Lösung des SL-Problems. Umgekehrt ist jede Lösung eine Lösung des Var.problems.
Ein anderer Zugang erfolgt über die Euler-Lagrange-Gleichung.

Typen von RB: Für stationäre RWP unterscheidet man folgende Arten von RB:

Dirichlet-Randbedingungen: \(u(a) = u_a\), \(u(b) = u_b\)
Neumann-Randbedingungen: \(u’(a) = v_a\), \(u’(b) = v_b\)
Robinsche Randbedingungen: \(u’(a) + \alpha u(a) = w_a\), \(u’(b) + \beta u(b) = w_b\)

Beispiel: Dirichlet-Randbedingungen finden sich bspw. für eine fest vorgegebene Temperatur am Rand eines Stabes und bei einem fest eingespannten Körper. Neumann-Randbedingungen können bei vorgegebenem Fluss/Kraft auftreten. Robinsche Randbedingungen sind eine Kombination von Dirichlet- und Neumann-Randbedingung und kommen in der Modellierung vor. Natürlich sind auch andere Kombinationen wie \(u(a) = u_a\), \(u’(b) = v_b\) usw. möglich.

Die Finite-Differenzen-Methode in einer Dimension

Sturmsches Problem: Gesucht ist \(u \in \C ^2(I)\) mit \(-u’’(x) = f(x, u, u’)\) für \(x \in I = (a, b)\) mit Dirichlet-Randbedingungen \(u(a) = u_a\) und \(u(b) = u_b\).
Dieses Problem heißt Sturmsches Problem.

Bemerkung: Das Sturmsche Problem ist bis auf die Randbedingungen eine Verallgemeinerung des Sturm-Liouville-Problems. Hier wird vereinfachend \(n = 1\) angenommen.

Bemerkung: Angenommen, das Sturmsche Problem als Modellproblem ist lösbar. In diesem Fall soll das Problem approximativ (numerisch) gelöst werden.
Sei \(I_h = \{x_0, \dotsc , x_N\}\) ein äquidistantes Gitter zu \(I\), d. h. \(a = x_0 < x_1 < \dotsb < x_{N-1} < x_N = b\) mit \(h := \frac {b - a}{N}\) und \(x_i := a + ih\) für \(i = 0, \dotsc , N\).
Auf \(I_h\) werden die zentralen Differenzenquotienten \(u’(x_i) \approx \frac {u(x_{i+1}) - u(x_{i-1})}{2h}\) für \(i = 1, \dotsc , N - 1\) betrachtet. Durch zweifache Anwendung mit halber Schrittweite erhält man
\(u’’(x_i) \approx \frac {u’(x_i + h/2) - u’(x_i - h/2)}{h} \approx \frac {1}{h} \left (\frac {u(x_i + h) - u(x_i)}{h} - \frac {u(x_i) - u(x_i - h)}{h}\right ) = \frac {u(x_{i+1}) - 2 u(x_i) + u(x_{i-1})}{h^2}\).
Durch Einsetzen in das Sturmsche Problem erhält man das folgende Verfahren.

Finite-Differenzen-Methode: Sei ein Sturmsches Problem mit \(-u’’(x) = f(x, u, u’)\) gegeben. Dann heißt das Verfahren \(-\frac {1}{h^2} (u_{i+1} - 2 u_i + u_{i-1}) = f(x_i, u_i, \frac {1}{2h} (u_{i+1} - u_{i-1}))\), \(i = 1, \dotsc , N - 1\) Finite-Differenzen-Methode (FDM) zum Sturmschen Problem.

Bemerkung: Um \(u_h\) nach diesem Verfahren zu bestimmen, muss man ein Gleichungssystem mit \(N - 1\) Variablen und Gleichungen lösen, das eventuell (je nach den Eigenschaften von \(f\)) nicht-linear ist.

diskreter Operator: Sei eine FDM und ein äquidistantes Gitter \(I_h\) gegeben.
Man definiert \(X_h := \{w_h\colon I_h \rightarrow \real \}\) und bezeichnet \(T_h\colon X_h \rightarrow X_h\) mit
\((T_h w_h)(x_0) := w_h(x_0) - u_0\),
\((T_h w_h)(x_N) := w_h(x_N) - u_N\) und
\((T_h w_h)(x_i) := -\frac {1}{h^2} (w_h(x_{i+1}) - 2 w_h(x_i) + w_h(x_{i-1})) - f(x_i, w_h(x_i), \frac {1}{2h} (w_h(x_{i+1}) - w_h(x_{i-1})))\)
für \(i = 1, \dotsc , N - 1\) als den der FDM zugeordneten diskreten Operator.

Bemerkung: Die FDM ist äquivalent zu \(T_h w_h = 0\).

Konsistenz: Die FDM heißt konsistent mit der Ordnung \(p\), falls \(\norm {T_h (u|_{I_h})}_\infty = \O (h^p)\).

Konvergenz: Die FDM heißt konvergent mit der Ordnung \(p\), falls \(\overline {e_h} = \O (h^p)\) mit
\(\overline {e_h} := \max _{i=0,\dotsc ,N} \norm {u_h(x_i) - u(x_i)}_\infty \).

Stabilität: Die FDM heißt stabil, falls \(\exists _{c > 0} \forall _{w_h, \widetilde {w}_h \in X_h}\; \norm {w_h - \widetilde {w}_h}_\infty \le c \cdot \norm {T_h w_h - T_h \widetilde {w}_h}_\infty \).

Satz (Konsistenz der FDM): Seien \(f(x, v, w) \in \C (I \times \real ^2, \real )\) und \(\frac {\partial ^2 f}{\partial w^2} \in \C (I \times \real ^2, \real )\).
Dann ist die FDM für \(u \in \C ^4(\overline {I})\) mit der Ordnung \(2\) konsistent.

Bemerkung: \(u \in \C ^4(\overline {I})\) ist oft nicht realistisch.

Bemerkung: Wie hängen Konsistenz und Stabilität mit Konvergenz zusammen?

Die Frage wird im Folgenden für das (einfachere) Sturm-Liouville-Problem in der Form
\(-u’’(x) + \alpha _1(x) u’(x) + \alpha _0(x) u(x) = g(x)\) für \(x \in I = (a, b)\) beantwortet.
Die zugehörige FDM hat dann die Gestalt \(-\frac {u_{i+1} - 2 u_i + u_{i-1}}{h^2} + \alpha _1(x_i) \frac {u_{i+1} - u_{i-1}}{2h} + \alpha _0(x_i) u_i = g(x_i)\) für \(i = 1, \dotsc , N - 1\).

Für \(T_h\) ergibt sich dabei
\((T_h w_h)(x_i) = -\frac {1}{h^2} (w_h(x_{i+1}) - 2 w_h(x_i) + w_h(x_{i-1})) - f(x_i, w_h(x_i), \frac {1}{2h} (w_h(x_{i+1}) - w_h(x_{i-1})))\)
\(= -\frac {1}{h^2} (w_{i+1} - 2w_i + w_{i-1}) + \alpha _1(x_i) \frac {1}{2h} (w_{i+1} - w_{i-1}) + \alpha _0(x_i) w_i - g(x_i)\)
\(= (-\frac {1}{h^2} - \frac {\alpha _1(x_i)}{2h}) w_{i-1} + (\frac {2}{h^2} + \alpha _0(x_i)) w_i + (-\frac {1}{h^2} + \frac {\alpha _1(x_i)}{2h}) w_{i+1} - g(x_i)\) für \(i = 2, \dotsc , N - 2\),
\((T_h w_h)(x_1) = (\frac {2}{h^2} + \alpha _0(x_1)) w_1 + (-\frac {1}{h^2} + \frac {\alpha _1(x_1)}{2h}) w_2 - g(x_1) + (-\frac {1}{h^2} - \frac {\alpha _1(x_1)}{2h}) w_0\) und
\((T_h w_h)(x_{N-1}) = (-\frac {1}{h^2} - \frac {\alpha _1(x_{N-1})}{2h}) w_{N-2} + (\frac {2}{h^2} + \alpha _0(x_{N-1})) w_{N-1} - g(x_{N-1}) + (-\frac {1}{h^2} + \frac {\alpha _1(x_{N-1})}{2h}) w_N\).

Man betrachtet nun \(\widetilde {X}_h := \{w_h \in X_h \;|\; w_h(x_0) = u_a,\; w_h(x_N) = u_b\}\), d. h.
\((T_h w_h)(x_i) = 0\) ist für \(i \in \{0, N\}\) immer erfüllt.

Man erhält damit eine Matrixschreibweise für \(T_h w_h = A_h w_h - r_h\) mit \(w_h = (w_1, \dotsc , w_{N-1})^t\),
\(A_h :=\) \(\begin {pmatrix} \frac {2}{h^2} + \alpha _0(x_1) & -\frac {1}{h^2} + \frac {\alpha _1(x_1)}{2h} & 0 & \dots & 0 \\ -\frac {1}{h^2} - \frac {\alpha _1(x_2)}{2h} & \frac {2}{h^2} + \alpha _0(x_2) & -\frac {1}{h^2} + \frac {\alpha _1(x_2)}{2h} & & \\ & \ddots & \ddots & \ddots & & & \\ & & -\frac {1}{h^2} - \frac {\alpha _1(x_{N-2})}{2h} & \frac {2}{h^2} + \alpha _0(x_{N-2}) & -\frac {1}{h^2} + \frac {\alpha _1(x_{N-2})}{2h} \\ 0 & \dots & 0 & -\frac {1}{h^2} - \frac {\alpha _1(x_{N-1})}{2h} & \frac {2}{h^2} + \alpha _0(x_{N-1}) \end {pmatrix}\) und
\(r_h := \left (\left (\frac {1}{h^2} + \frac {\alpha _1(x_1)}{2h}\right ) u_a + g(x_1),\; g(x_2),\; \dotsc ,\; g(x_{N-2}),\; \left (\frac {1}{h^2} - \frac {\alpha _1(x_{N-1})}{2h}\right ) u_b + g(x_{N-1})\right )^t\).

Es gilt \(T_h w_h = 0\) genau dann, wenn \(w_h\) das LGS \(A_h w_h = r_h\) löst.
Eine notwendige Voraussetzung dafür ist \(\det A_h \not = 0\).

Bemerkung: Angenommen, \(A_h\) ist invertierbar und es gilt \(\norm {A_h^{-1}}_\infty \le c\) für hinreichend kleine \(h < h_0\), wobei \(\norm {B}_\infty := \sup _{x \in X_h,\; x \not = 0} \frac {\norm {Bx}_\infty }{\norm {x}_\infty }\) die Matrixnorm ist.
Dann ist die FDM stabil, denn \(\norm {w_h - \widetilde {w}_h}_\infty \le \norm {A_h^{-1}}_\infty \norm {A_h (w_h - \widetilde {w}_h)}_\infty \)
\(\le c \cdot \norm {(A_h w_h - r_h) - (A_h \widetilde {w}_h - r_h)}_\infty = c \cdot \norm {T_h w_h - T_h \widetilde {w}_h}_\infty \).
Um Bedingungen herzuleiten, wann \(\norm {A_h^{-1}}_\infty \le c\) gilt, muss ein kleiner Exkurs in die Matrizenalgebra unternommen werden.

Halbordnung auf \(\real ^m\), \(\real ^{m \times m}\): Seien \(u, v \in \real ^m\) und \(A, B \in \real ^{m \times m}\). Dann schreibt man \(u \le v\), falls \(u_i \le v_i\) für alle \(i = 1, \dotsc , m\), und \(A \le B\), falls \(a_{ij} \le b_{ij}\) für alle \(i, j = 1, \dotsc , m\).
Analog ist \(<\) definiert.

nicht-negative Matrix:
Eine quadratische Matrix \(A\) heißt nicht-negativ (oder monoton), falls \(0 \le A\).

inversmonoton:
Eine quadratische Matrix \(A\) heißt inversmonoton, falls \(\det A \not = 0\) und \(A^{-1}\) monoton ist.

Satz (Äquivalenz zu Monotonie): Sei \(A \in \real ^{m \times m}\). Dann gilt:
\(A\) ist nicht-negativ \(\iff \forall _{u, v \in \real ^m}\; (u \le v \;\Rightarrow \; Au \le Av) \iff \forall _{v \in \real ^m}\; (0 \le v \;\Rightarrow \; 0 \le Av)\).

Satz (Äquivalenz zu Inversmonotonie): Sei \(A \in \real ^{m \times m}\) invertierbar. Dann gilt:
\(A\) ist inversmonoton \(\iff \forall _{u, v \in \real ^m}\; (Au \le Av \;\Rightarrow \; u \le v) \iff \forall _{v \in \real ^m}\; (0 \le Av \;\Rightarrow \; 0 \le v)\).

gewichtete Maximumsnorm: Sei \(e \in \real ^m\) mit \(0 < e\).
Dann heißt die Norm \(\norm {\cdot }_e\colon \real ^m \rightarrow \real \) mit \(\norm {u}_e := \max _{j=1,\dotsc ,m} \frac {|u_j|}{e_j}\) gewichtete Maximumsnorm.
Die gewichtete Maximumsnorm induziert eine Matrixnorm \(\norm {A}_e := \sup _{u \in \real ^m,\; \norm {u}_e = 1} \norm {Au}_e\).

Beispiel: Ein triviales Beispiel ist \(e = (1, \dotsc , 1)^t\), in diesem Fall ist \(\norm {\cdot }_e = \norm {\cdot }_\infty \).

Satz (Normabschätzung für \(A^{-1}\)):
Seien \(A \in \real ^{m \times m}\) inversmonoton sowie \(e \in \real ^m\) mit \(0 < e\) und \(\exists _{c > 0}\; ce \le Ae\).
Dann gilt \(\norm {A^{-1}}_e \le \frac {1}{c}\).

Bemerkung: Im Allgmeinen ist die Inversmonotonie \(0 \le A^{-1}\) allerdings schwer zu zeigen, daher geht man einen Umweg über M-Matrizen.

M-Matrix: Eine Matrix \(A \in \real ^{m \times m}\) heißt M-Matrix, falls \(A\) inversmonoton und \(a_{ij} \le 0\) für \(i, j = 1, \dotsc , m\) mit \(i \not = j\) gilt.

Satz (M-Kriterium): Sei \(A \in \real ^{m \times m}\) mit \(a_{ij} \le 0\) für \(i, j = 1, \dotsc , m\) mit \(i \not = j\).
Falls ein \(e \in \real ^m\) mit \(0 < e\) und \(0 < Ae\) existiert, dann ist \(A\) eine M-Matrix.

Satz (Konvergenz der FDM): Sei die Sturm-Liouville-Gleichung \(-(pu’)’ + qu = g\) mit Dirichlet-Randbedingungen gegeben. Außerdem seien \(p, q > 0\) und \(u \in \C ^4(\overline {I})\) die eindeutige Lösung.
Dann gilt:

Es gibt ein \(h_0 > 0\), sodass die FDM \(T_h u_h = 0\) für alle \(0 < h < h_0\) eindeutig lösbar ist.
Für den Fehler gilt \(\norm {u|_{I_h} - u_h}_\infty = \O (h^2)\), d. h. die FDM ist konvergent mit Ordnung \(2\).

Bemerkung: Es lassen sich die gleichen Ideen wie bei Zeitschrittverfahren anwenden:

„eingebettete Verfahren“, d. h. zwei Rechnungen auf dem gleichen Gitter, aber mit verschiedener Ordnung
gleiches Verfahren, aber zwei Gitter (grob/fein)
Interpolation usw.

Bemerkung: Eine weitere Idee zur Lösung eines Randwertproblems, z. B. das Sturmsche Problem \(-u’’ = f(x, u, u’)\) mit Dirichlet-Randbedingungen \(u(a) = u_a\) und \(u(b) = u_b\), besteht in der Rückführung auf ein Anfangswertproblem.
Man setzt also \(u_\alpha ’(a) = \alpha \) und löst \(-u_\alpha ’’(x) = f(x, u_\alpha (x), u_\alpha ’(x)\) für \(x \in (a, b)\) mit \(u_\alpha (a) = u_a\) und \(u_\alpha ’(a) = \alpha \). Dies geht z. B. durch Überführung in ein System erster Ordnung mit \(u_\alpha ’ = w\), d. h. löse das Differentialgleichungssystem \(w’(x) = f(x, u_\alpha (x), w(x))\), \(u_\alpha ’(x) = w(x)\) für \(x \in (a, b)\) mit \(u_\alpha (a) = u_a\) und \(w(a) = \alpha \). Danach wendet man eines der bekannten Zeitschrittverfahrens bis zur „Zeit“ \(T = b\) an und erhält so einen Schätzwert \(u_h^{(\alpha )}(b)\) für \(u_b\). Falls \(u_h^{(\alpha )}(b) \approx u_b\), dann war \(\alpha \) richtig gewählt, sonst muss eine Korrektur vorgenommen werden.
Das Verfahren nennt sich Schießverfahren, weil \(\alpha \) die Steigung der Lösung im Punkt \(a\) bestimmt und das \(\alpha \) so gewählt werden muss, dass \(u_b\) für \(T = b\) „getroffen“ wird.
Mathematischer formuliert ist \(\alpha \in \real \) gesucht mit \(F(\alpha ) = 0\), wobei \(F(\alpha ) := u_{\alpha }(b) - u_b\). Dies kann z. B. durch das Newton-Verfahren durchgeführt werden.
Eine Variante, das Mehrschießverfahren, besteht in der stückweisen Anwendung auf Teilintervalle.

Die Finite-Elemente-Methode in einer Dimension

Einführung und Motivation

Bemerkung: Betrachtet wird wieder die Sturm-Liouville-Gleichung \(-(pu’)’ + qu = g\) für
\(x \in (a, b)\) mit Randbedingungen. Anstatt die Gleichung punktweise zu lösen, wird sie in eine Variationsform wie folgt überführt:

Multiplikation der Gleichung mit einer Testfunktion \(v\)
partielle Integration: \(-\int _a^b (pu’)’v\dx + \int _a^b quv\dx = \int _a^b gv\dx \) mit
\(\int _a^b (pu’)’v\dx = pu’v|_a^b - \int _a^b pu’v’\dx \), dies ergibt die Aufgabenstellung:
Gesucht ist ein \(u \in U\) mit \(\int _a^b p(x)u’(x)v’(x)\dx + \int _a^b q(x)u(x)v(x)\dx \;-\)
\((p(b)u’(b)v(b) - p(a)u’(a)v(a)) = \int _a^b g(x)v(x)\dx \) für alle \(v \in V\).
Dabei sind \(U, V\) Funktionenräume, dies ist die schwache Formulierung und \(u \in U\) heißt schwache Lösung.
näherungsweises Lösen der schwachen Formulierung durch Ersetzen der (unendlich-dimensionalen) Räume \(U\) und \(V\) durch endlich-dimensionale Teilräume \(U_h\) und \(V_h\), z. B. stückweise Polynome. Das entstehende Verfahren heißt Galerkin-Verfahren.
Für \(U_h = V_h\) spricht man von einem Galerkin-Bulimov-Verfahren,
für \(U_h \not = V_h\) heißt das Verfahren Galerkin-Petrov-Verfahren.
Überführung in ein Gleichungssystem

Bemerkung: Dabei drängen sich folgende Fragen auf:

Wie hängen „klassische“ und „schwache Lösung“ zusammen?
Wie baut man die Randbedingungen ein?
Was sind \(U\) und \(V\)?
Wie wählt man \(U_h\) und \(V_h\)? Welche Eigenschaften für Konsistenz, Stabilität und A-priori-Fehlerabschätzung ergeben sich dann?
Kann man den Fehler a posteriori schätzen und gibt es adaptive Verfahren?
Wie löst man das Gleichungssystem?

Klassische und schwache Lösung

klassische Lösung: Es seien in der Sturm-Liouville-Gleichung \(-(pu’)’ + qu = g\) die Bedingungen \(p \in \C ^1(\overline {I})\) und \(q, g \in \C (\overline {I})\) erfüllt.
Dann heißt eine Funktion \(u \in \C ^2(\overline {I})\), die die Sturm-Liouville-Gleichung punktweise erfüllt (inklusive gegebener Randbedingungen) klassische Lösung.

Bemerkung:
Seien nun \(p, q \in L^\infty (I)\) und \(g \in L^2(I)\) mit \(p(x) \ge p_0 > 0\) und \(q(x) \ge 0\) für alle \(x \in \overline {I}\).

Bemerkung: Diese Bedingungen sind wesentlich schwächer als die Bedingungen in der Definition für klassische Lösungen. Gelten nur obige Bedingungen, so sind das klassische Lösungskonzept einer punktweisen Lösung und die Finite-Differenzen-Methode nicht anwendbar.

Satz (schwache Lösung als klassische Lösung):
Sei \(-(pu’)’ + qu = g\) die Sturm-Liouville-Gleichung mit Dirichlet-Randbedingungen
\(u(a) = u(b) = 0\). Außerdem seien obige Bedingungen erfüllt, d. h.
\(p, q \in L^\infty (I)\) und \(g \in L^2(I)\) mit \(p(x) \ge p_0 > 0\) und \(q(x) \ge 0\) für alle \(x \in \overline {I}\).
Weiter sei \(V := \{v \in \C ^1(\overline {I}) \;|\; v(a) = v(b) = 0\}\) und \(u \in U = V\) eine schwache Lösung, d. h. \(\int _a^b pu’v’\dx + \int _a^b quv\dx = \int _a^b gv\dx \) für alle \(v \in V\).
Wenn \(u \in \C ^2(\overline {I})\), \(p \in \C ^1(\overline {I})\) und \(q, g \in \C (\overline {I})\) gilt, dann ist \(u\) auch eine klassische Lösung der Sturm-Liouville-Gleichung.

Lemma (Variationslemma): Sei \(G \subset \real \) offen und \(u\colon G \rightarrow \real \) stetig.
Wenn \(\int _G u(x)\varphi (x)\dx = 0\) für alle \(\varphi \in \C _0^\infty (G)\) gilt, dann ist \(u = 0\).

Bemerkung: Wie \(V\) zu wählen ist, hängt u. a. von den Randbedingungen ab. Gilt z. B. \(u(a) = 0\) und \(u’(b) = 0\) (natürliche Randbedingungen), so ist \(V := \{v \in \C ^1(\overline {I}) \;|\; v(a) = 0\}\) sinnvoll.

Bemerkung: Variationsformulierungen werden in den Ingenieurwissenschaften oft als Prinzip der virtuellen Arbeit/Verrückung o. Ä. bezeichnet und zum Beispiel über Kräfte- oder Energiebilanzen hergeleitet.

Bemerkung: Man benötigt für den neuen Lösungsbegriff „schwache Lösung“ neue Lösungsräume. Die klassischen Räume \(\C ^k(I)\) sind nur für punktweise Betrachtungen geeignet.

Sobolev-Räume in einer Dimension

Bemerkung: Um später Terme der Art \(\int _a^b pu’v’\dx \) und \(\int _a^b quv\dx \) abschätzen zu können, ist es sinnvoll, mit einer Norm \(\norm {v}_V := \left (\int _a^b (v’(x))^2\dx + \int _a^b (v(x))^2\dx \right )^{1/2}\) (ähnlich wie im \(L^2\)) zu arbeiten. Allerdings ist \((V, \norm {\cdot }_V)\) nicht vollständig.

Beispiel: Sei \(I = (-1, 1)\). Für \(n \in \natural \) sei
\(v_n(x) :=\) \(\begin {cases} -x & x \in [-1, -1/n] \\ 1/2 \cdot nx^2 + 1/(2n) & x \in \left ]-1/n, 1/n\right ] \\ x & x \in \left ]1/n, 1\right ]\end {cases}\). Es gilt \(v_n’(x) :=\) \(\begin {cases} -1 & x \in [-1, -1/n] \\ nx & x \in \left ]-1/n, 1/n\right ] \\ 1 & x \in \left ]1/n, 1\right ]\end {cases}\).
\(\{v_n\}_{n \in \natural }\) ist eine Cauchy-Folge, da die beiden Integrale gegen \(0\) gehen.
Alerdings konvergiert diese Folge nicht, da \(v_n \to v\) mit der Grenzfunktion \(v(x) = |x|\) und \(v’(x)\) ist nicht stetig, d. h. \(v \notin \C ^1(I)\). Also ist \((V, \norm {\cdot }_V)\) nicht vollständig.

schwache Ableitung: Sei \(u \in L^1_\loc (I) := \{w\colon I \rightarrow \real \;|\; \forall _{K \subset I \text { kpkt.}}\; w|_K \in L^1(K)\}\).
Dann heißt \(v \in L^1_\loc (I)\) schwache Ableitung der Ordnung \(k\) von \(u\), falls
\(\int _a^b u(x)\phi ^{(k)}(x)\dx = (-1)^k \int _a^b v(x)\phi (x)\dx \) für alle \(\phi \in \C _0^\infty (I)\).

Bemerkung: Für \(k = 1\) muss z. B. \(\int _a^b u(x)\phi ’(x)\dx = -\int _a^b v(x)\phi (x)\dx \) für alle \(\phi \in \C _0^\infty (I)\) gelten.
Wenn \(v, \widetilde {v} \in L^1_\loc (I)\) schwache Ableitungen von \(u\) sind, so gilt \(v = \widetilde {v}\) fast überall.
Wenn \(u \in L^1_\loc (I) \cap \C ^1(\overline {I})\) gilt, so existiert eine schwache Ableitung von \(u\) und sie stimmt mit der klassischen Ableitung überein.

Beispiel: Sei \(u \in L^1_\loc (I)\) mit \(u(x) = |x|\). Dann ist eine schwache Ableitung \(u’\) durch
\(v(x) =\) \(\begin {cases} -1 & x < 0 \\ 1 & x \ge 0\end {cases}\) definiert, wie man durch Ausrechnen der Integrale nachrechnet.

Beispiel: Dieses \(v(x)\) ist nicht schwach differenzierbar. Angenommen doch, dann wäre
\(\int _{-1}^1 v(x)\phi ’(x)\dx = -\int _{-1}^1 w(x)\phi (x)\dx \) für alle \(\phi \in \C _0^\infty (I)\) und ein \(w \in L^1_\loc (I)\).
Daraus folgt \(\int _{-1}^1 v(x)\phi ’(x)\dx = -2\phi (0) = -\int _{-1}^1 w(x)\phi (x)\dx \) für alle \(\phi \in \C _0^\infty (I)\).
Andererseits gibt es eine Folge \(\{\phi _n\}_{n \in \natural }\) von \(\phi _n \in \C _0^\infty (I)\) mit \(\left |\int _{-1}^1 w(x)\phi _n(x)\dx \right | \le \delta \) für alle \(n \ge N(\delta )\) und \(\phi _n(0) = 1\). Das Integral wird also betragsmäßig sehr klein, soll andererseits aber immer gleich \(2\phi _n(0) = 2\) sein, ein Widerspruch.

Sobolev-Räume: Seien \(p \in [1, \infty ]\) und \(k \in \natural _0\).
Dann heißt der Raum \(W^{k,p}(I) := \{u \in L^1_\loc (I) \;|\; \forall _{\ell =0,\dotsc ,k}\; u^{(\ell )} \in L^p(I)\}\) Sobolev-Raum,
wobei \(u^{(\ell )}\) die \(\ell \)-te schwache Ableitung bedeutet.

Bemerkung: Es gilt \(W^{0,p}(I) = L^p(I)\). Für \(p = 2\) schreibt man häufig \(H^k(I) := W^{k,2}(I)\).

Beispiel: \(u = |x|\) ist offenbar in \(W^{1,p} \subset L^p(I)\) für \(I = (-1, 1)\), aber \(u \notin W^{2,p}(I)\)
(klassisch gilt \(u \in \C (I)\) und \(u \notin \C ^1(I)\), d. h. man hat eine Ordnung „gewonnen“).

Sobolev-Norm: Die Sobolev-Norm ist \(\norm {u}_{W^{k,p}(I)} := \left (\sum _{\ell =0}^k \int _I |u^{(\ell )}(x)|^p\dx \right )^{1/p}\)
für \(p \in \left [1, \infty \right [\) und \(\norm {u}_{W^{k,\infty }(I)} := \sum _{\ell =0}^k \esssup |u^{(\ell )}(x)|\),
wobei \(\esssup w(x) := \inf \{M \in \real \;|\; \mu (\{x \in I \;|\; w(x) > M\}) = 0\}\) das wesentliche Supremum ist für eine \(\mu \)-messbare, reellwertige Funktion \(f\).

Satz (Sobolev-Raum als Banachraum):
\(W^{k,p}(I)\) ist mit der Norm \(\norm {\cdot }_{W^{k,p}(I)}\) mit \(k \in \natural _0\) und \(p \in [1, \infty ]\) ein Banachraum.

Bemerkung: Mithilfe der Sobolev-Slobodeckij-Norm lassen sich auch Räume \(W^{s,p}(I)\) mit \(s \notin \natural _0\), \(s \ge 0\) definieren: Sei \(s = k + \sigma \) mit \(k = \lfloor s \rfloor \). Dann ist \(|u|_{W^{\sigma ,p}(I)} := \left (\int _I \int _I \frac {|u^{(k)}(x) - u^{(k)}(y)|^p} {|x - y|^{1+\sigma p}} \dx \dy \right )^{1/p}\) die Sobolev-Slobodeckij-Halbnorm und \(\norm {u}_{W^{s,p}(I)} := \left (\norm {u}_{W^{k,p}(I)}^p + |u|_{W^{\sigma ,p}(I)}^p\right )^{1/p}\) die
Sobolev-Slobodeckij-Norm. Der Raum \(W^{s,p}(I)\) ist dann der Raum aller Funktionen aus \(W^{k,p}(I)\), sodass die Ableitungen bis zur Ordnung \(k\) beschränkt sind.

Bemerkung: Für \(s < 0\) definiert man \(W^{s,p}(I) := (W^{-s,q}_0(I))^\ast \) als Raum der linearen Funktionale über \(W^{-s,q}_0(I)\) mit \(\frac {1}{p} + \frac {1}{q} = 1\). Dabei ist \(W^{-s,q}_0(I)\) der Abschluss von \(\C _0^\infty (I)\) in \(W^{-s,q}(I)\).

Bemerkung: Alternativ kann man Sobolev-Räume auch über Distributionen definieren:
Sei \(D’(I)\) der Raum der linearen Funktionale über \(D(I) = \C _0^\infty (I)\). Die Ableitung einer Distribution \(T \in D’(I)\) ist gegeben durch \(T’(\varphi ) := -T(\varphi ’)\) für alle \(\varphi \in D(I)\). Eine Distribution ist z. B. \(T_f(\varphi ) = \int _I f(x)\varphi (x)\dx \) oder auch \(T_\delta (\phi ) := \phi (0)\) für alle \(\phi \in \C _0^\infty (I)\). Man definiert dann den Sobolev-Raum durch \(W^{s,p}(\real ) := \{u \in S’(\real ) \;|\; (1 + |\xi |^2)^{s/2} (\F u)(\xi ) \in L^p(\real )\}\) mit \(\F \) der Fouriertransformation, \(S’ \subset D’\) durch \(S’ := S^\ast \) mit dem Schwartz-Raum
\(S(\real ) := \{\phi \in \C ^\infty (\real ) \;|\; \forall _{\alpha , \beta \in \natural _0}\; \sup _{x \in \real } |x^\alpha \phi ^{(\beta )}(x)| < \infty \}\).

Existenz und Eindeutigkeit der schwachen Lösung

schwache Formulierung: Sei \(-(pu’)’ + qu = g\) die Sturm-Liouville-Gleichung mit Dirichlet-Randbedingungen \(u(a) = u(b) = 0\).
Sei außerdem \(U = V = \widetilde {W}^{2,1}(I)\) mit \(\widetilde {W}^{k,p}(I) := \{w \in W^{k,p}(I) \;|\; w(a) = w(b) = 0\}\).
Dann heißt folgende Formulierung schwache Formulierung:
Gesucht ist ein \(u \in V\) mit \(\int _a^b pu’v’\dx + \int _a^b quv\dx = \int _a^b gv\dx \) für alle \(v \in V\).

schwache Lösung: Eine Lösung der schwachen Formulierung heißt schwache Lösung.

Bemerkung: Die schwache Formulierung ist äquivalent zu folgender Minimierungsaufgabe: Finde \(u \in V\) mit \(F(u) \le F(v)\) für alle \(v \in V\), wobei \(F(v) := \frac {1}{2} \int _a^b p(v’)^2 \dx + \frac {1}{2} \int _a^b q v^2 \dx - \int _a^b g v \dx \).
(Dabei gilt für die Lösung \(u\), dass \(\lim _{\varepsilon \to 0} \frac {dF}{d\varepsilon }(u + \varepsilon w) = 0\).)

Lemma (Youngsche Ungleichung/\(\varepsilon \)-Ungleichung): Für \(a, b \ge 0\) und \(\varepsilon > 0\) gilt \(a \cdot b \le \varepsilon a^2 + \frac {1}{4\varepsilon } b^2\).

Lemma (Poincaré-Ungleichung): Für \(v \in \widetilde {W}^{2,1}(I)\) gilt \(\int _a^b (v(x))^2 \dx \le \frac {(b - a)^2}{2} \int _a^b (v’(x))^2 \dx \).

Satz (Existenz und Eindeutigkeit einer schwachen Lösung):
Seien \(p, q \in L^\infty (I)\) und \(g \in L^2(I)\) mit \(p(x) \ge p_0 > 0\) und \(q(x) \ge 0\) für alle \(x \in I\).
Dann gibt es genau eine schwache Lösung der schwachen Formulierung.

Finite-Elemente-Diskretisierung in einer Dimension

Bemerkung: Die Idee ist nun, die schwache Variationsformulierung in einem endlich-dimensionalen Teilraum \(V_h \subset V\) von \(V\) mit \(\dim V_h = N < \infty \) zu betrachten.
Gesucht ist also ein \(u_h \in V_h\) mit \(\int _a^b pu_h’v_h’\dx + \int _a^b qu_hv_h\dx = \int _a^b gv_h\dx \) für alle \(v_h \in V_h\).

Satz (Existenz und Eindeutigkeit von \(u_h\)):
Unter den Bedingungen des obigen Satzes ist das Problem für \(V_h\) eindeutig lösbar.

Bemerkung: Im Gegensatz zur FDM (\(I_h \rightarrow \real \)) ist hier \(u_h\colon I \rightarrow \real \).
Wie wählt man nun den Raum \(V_h\)?

Bemerkung: Eine Idee ist, Polynome zu verwenden.
Sei also \(V_h := P_n \cap \widetilde {W}^{2,1}(I) = \{v_h \in P_n \;|\; v_h(a) = v_h(b) = 0\}\). Es gilt \(V_h = \aufspann {\varphi _2, \dotsc , \varphi _n}\) mit
\(\varphi _k(x) := (x - a)^{k/2} (b - x)^{k/2}\) für \(k\) gerade und
\(\varphi _k(x) := \frac {1}{2} ((x - a)^{(k-1)/2} (x - b)^{(k+1)/2} + (x - a)^{(k+1)/2} (x - b)^{(k-1)/2})\) für \(k\) ungerade.
Ein Polynom \(u_h \in V_h\) lässt sich dann durch \(u_h(x) = \sum _{i=2}^n u_i \varphi _i(x)\) darstellen, d. h. die schwache Formulierung für \(V_h\) ist dann: Gesucht ist ein \(\widetilde {u} \in \real ^{n-2}\) mit
\(\sum _{i=2}^n \left (\int _a^b p\varphi _i’v_h’\dx + \int _a^b q\varphi _iv_h\dx \right )u_i = \int _a^b gv_h\dx \) für alle \(v_h \in V_h\).
Aus Linearitätsgründen genügt es, diese Gleichung für die Basis von \(V_h\) zu erfüllen, d. h. \(\sum _{i=2}^n a_{ij} u_i = g_j\) für alle \(j = 2, \dotsc , n\) mit \(a_{ij} := \int _a^b p\varphi _i’\varphi _j’\dx + \int _a^b q\varphi _i\varphi _j\dx \) und \(g_j := \int _a^b g\varphi _j\dx \).
Man erhält also ein LGS \(A\widetilde {u} = g\).

Dabei ergeben sich jedoch zwei Probleme: \(A\) ist voll besetzt, d. h. numerisches Lösen ist nicht so einfach. Außerdem ist die Lösung des LGS instabil, da die Kondition
\(\cond (A) = \norm {A}_2 \cdot \norm {A^{-1}}_2\) zu groß ist.

Bemerkung: Ein Ausweg ist, stückweise definierte Polynome (Splines) zu verwenden.
Sei \(I_h = \{x_0 = a, x_1, \dotsc , x_N, x_{N+1} = b\}\) ein Gitter und \(h_j := x_{j+1} - x_j\), \(I_j := [x_j, x_{j+1}]\) für \(j = 0, \dotsc , N\). Man nennt die \(I_j\) auch finite Elemente.
Sei nun \(V_{h,k} := \{\varphi _h \in \C (\overline {I}) \;|\; \forall _{j=0,\dotsc ,N}\; \varphi _h|_{I_j} \in P_k,\; \varphi _h(a) = \varphi _h(b) = 0\} \subset \widetilde {W}^{2,1}(I)\).
\(k = 0\) ist nicht möglich, da dann aus der Stetigkeit der \(\varphi _h\) und den Randbedingungen folgt, dass \(\varphi _h \equiv 0\) ist.

Der einfachste Fall ist \(k = 1\). In diesem Fall sind die Hütchenfunktionen
\((\varphi _1, \dotsc , \varphi _N)\) eine Basis von \(V_{h,k}\), d. h. \(V_{h,1} = \aufspann {\varphi _1, \dotsc , \varphi _N}\) mit \(\varphi _j(x) =\) \(\begin {cases} (x - x_{j-1})/h_{j-1} & x \in I_{j-1} \\ (x_{j+1} - x)/h_j & x \in I_j \\ 0 & \text {sonst} \end {cases}\) für \(j = 1, \dotsc , N\) und \((\varphi _1, \dotsc , \varphi _N)\) ist linear unabhängig.

Im Fall von Neumann-Randbedingungen kommen am Rand Basisfunktionen hinzu, z. B.
\(\varphi _{N+1}(x) =\) \(\begin {cases} (x - x_N)/h_N & x \in I_N \\ 0 & \text {sonst} \end {cases}\).

Die Matrix \(A = (a_{ij})_{i,j=1}^N\) mit \(a_{ij} = \int _a^b p\varphi _i’\varphi _j’\dx + \int _a^b q\varphi _i\varphi _j\dx \) ist schwach besetzt, denn aus \(\supp \varphi _j = I_{j-1} \cup I_j\) folgt \(\supp (\varphi _j) \cap \supp (\varphi _i) = \emptyset \) für \(|j - i| \ge 2\), d. h. \(a_{ij} = 0\) für \(|j - i| \ge 2\).

Führt man eine Koordinatentransformation \(\xi = \frac {x - x_j}{h_j}\) bzw. \(x = x_j + \xi h_j\) mit \(dx = h_j d\xi \) für \(\xi \in (0, 1)\) (Referenz-Element) durch und definiert Funktionen auf \((0, 1)\) durch \(\psi _1(\xi ) := \xi \) und \(\psi _2(\xi ) := 1 - \xi \), so reicht es aus, die Integrale für \(a_{ij}\) nur einmal als \(\int _0^1 \psi _\ell (\xi ) \psi _k(\xi ) \d \xi \) bzw. \(\int _0^1 \psi _\ell ’(\xi ) \psi _k’(\xi ) \d \xi \) für \(\ell , k = 1, 2\) zu berechnen und anschließend zu transformieren.
Man bezeichnet diesen Vorgang als Assemblierung von \(A\) Element für Element.

Beispiel: Für \(-u’’(x) = g\), \(I = (-1, 1)\), \(u(-1) = u(1) = 0\) und \(N = 3\) ist \(A\) gegeben durch
\(a_{ij} = \int _{-1}^1 \varphi _i’\varphi _j’\dx \), d. h. \(A =\) \(\begin {pmatrix} \int _{x_0}^{x_1} (\varphi _1’)^2\dx + \int _{x_1}^{x_2} (\varphi _1’)^2\dx & \int _{x_1}^{x_2} \varphi _1’\varphi _2’\dx & 0 \\ \int _{x_1}^{x_2} \varphi _1’\varphi _2’\dx & \int _{x_1}^{x_2} (\varphi _2’)^2\dx + \int _{x_2}^{x_3} (\varphi _2’)^2\dx & \int _{x_2}^{x_3} \varphi _2’\varphi _3’\dx \\ 0 & \int _{x_2}^{x_3} \varphi _2’\varphi _3’\dx & \int _{x_2}^{x_3} (\varphi _3’)^2\dx + \int _{x_3}^{x_4} (\varphi _3’)^2\dx \end {pmatrix}\)
\(=\) \(\begin {pmatrix} \int _{x_0}^{x_1} (\varphi _1’)^2\dx & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end {pmatrix} + \begin {pmatrix} \int _{x_1}^{x_2} (\varphi _1’)^2\dx & \int _{x_1}^{x_2} \varphi _1’\varphi _2’\dx & 0 \\ \int _{x_1}^{x_2} \varphi _1’\varphi _2’\dx & \int _{x_1}^{x_2} (\varphi _2’)^2\dx & 0 \\ 0 & 0 & 0 \end {pmatrix} + \begin {pmatrix} 0 & 0 & 0 \\ 0 & \int _{x_2}^{x_3} (\varphi _2’)^2\dx & \int _{x_2}^{x_3} \varphi _2’\varphi _3’\dx \\ 0 & \int _{x_2}^{x_3} \varphi _2’\varphi _3’\dx & \int _{x_2}^{x_3} (\varphi _3’)^2\dx \end {pmatrix} + \begin {pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & \int _{x_3}^{x_4} (\varphi _3’)^2\dx \end {pmatrix}\)
\(=\) \(\frac {1}{h_1} \begin {pmatrix} \int _0^1 (\psi _1’)^2\d \xi & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end {pmatrix} + \frac {1}{h_2} \begin {pmatrix} \int _0^1 (\psi _1’)^2\d \xi & \int _0^1 \psi _1’\psi _2’\d \xi & 0 \\ \int _0^1 \psi _1’\psi _2’\d \xi & \int _0^1 (\psi _2’)^2\d \xi & 0 \\ 0 & 0 & 0 \end {pmatrix}\)
\(+\; \frac {1}{h_3} \begin {pmatrix} 0 & 0 & 0 \\ 0 & \int _0^1 (\psi _2’)^2\d \xi & \int _0^1 \psi _1’\psi _2’\d \xi \\ 0 & \int _0^1 \psi _1’\psi _2’\d \xi & \int _0^1 (\psi _1’)^2\d \xi \end {pmatrix} +\frac {1}{h_4} \begin {pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & \int _0^1 (\psi _2’)^2\d \xi \end {pmatrix}\)
\(=\) \(\frac {1}{h_1} \begin {pmatrix} 1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end {pmatrix} + \frac {1}{h_2} \begin {pmatrix} 1 & -1 & 0 \\ -1 & 1 & 0 \\ 0 & 0 & 0 \end {pmatrix} + \frac {1}{h_3} \begin {pmatrix} 0 & 0 & 0 \\ 0 & 1 & -1 \\ 0 & -1 & 1 \end {pmatrix} +\frac {1}{h_4} \begin {pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end {pmatrix}\)
mit der Elementsteifigkeitsmatrix \(\begin {pmatrix} 1 & -1 \\ -1 & 1 \end {pmatrix}\). Im äquidistanten Fall gilt also \(A = \frac {1}{h}\) \(\begin {pmatrix} 2 & -1 & 0 \\ -1 & 2 & -1 \\ 0 & -1 & 2 \end {pmatrix}\).

Konvergenz der FEM

Bemerkung: Man kann die schwache Formulierung allgemeiner ausdrücken:
Gesucht ist \(u \in V\) mit \(a(u, v) = (g, v)\) für alle \(v \in V\).
Dabei ist \((g, v) := \int _a^b gv\dx \) ein Funktional auf \(V\) und z. B. \(a(u, v) := \int _a^b pu’v’\dx + \int _a^b quv\dx \) eine Bilinearform auf \(V \times V\).
Das zugehörige Galerkin-Verfahren betrachtet wieder nur einen endlich-dimensionalen Teilraum: Gesucht ist \(u_h \in V_h\) mit \(a(u_h, v_h) = (g, v_h)\) für alle \(v_h \in V_h\).
Für den Fehler \(e_h := u - u_h\) gilt \(a(e_h, v_h) = 0\) für alle \(v_h \in V_h\) (Galerkin-Orthogonalität),
da \(a(e_h, v_h) = a(u, v_h) - a(u_h, v_h) = (g, v_h) - (g, v_h) = 0\).

Satz (Céas Lemma): Sei \(a(\cdot , \cdot )\colon V \times V \rightarrow \real \) bilinear mit
\(\exists _{C_0 > 0} \forall _{v \in V}\; a(v, v) \ge C_0 \norm {v}_V^2\) (Koerzitivität, Elliptizität) und
\(\exists _{C_1 > 0} \forall _{v, w \in V}\; a(v, w) \le C_1 \norm {v}_V \norm {w}_V\) (Stetigkeit).
Dann gibt es ein \(C > 0\) (unabhängig von \(h\)) mit \(\norm {u - u_h}_V \le C \cdot \inf _{v_h \in V_h} \norm {u - v_h}_V\),
wobei \(u \in V\) die schwache Lösung und \(u_h \in V_h\) die diskrete Lösung ist.

Satz (Konvergenz der FEM):
Seien \(u \in V\) die schwache Lösung der schwachen Formulierung und \(u_h \in V_h\) die Finite-Elemente-Approximation für einen Teilraum \(V_h\), wobei \(u \in W^{2,2}(I)\) gelten soll.
Dann gilt die Fehlerabschätzung \(\norm {u - u_h}_{W^{1,2}(I)} \le c |h| \norm {u’’}_{L^2(I)}\).
Ist außerdem \(h_{\max } = |h| \le c h_{\min }\) mit \(h_{\min } = \min _{j=1,\dotsc ,N} h_j\) für das Gitter \(I_h\) erfüllt
(d. h. \(I_h\) ist quasi-uniform),
dann gilt zusätzlich \(\norm {u - u_h}_{L^2(I)} \le c |h|^2 \norm {u’’}_{L^2(I)}\) und \(\norm {u - u_h}_{L^\infty (I)} \le c |h|^2 \norm {u’’}_{L^2(I)}\).

Bemerkung: Allgemein gilt \(\norm {u - u_h}_{W^{s,2}} \le c h^{t-s} \norm {u}_{W^{t,2}}\) für \(t \ge 2\).
Oft kann man zeigen, dass \(\norm {u’’}_{L^2(I)} \sim \norm {u}_{W^{2,2}(I)} \sim \norm {g}_{L^2(I)}\).

Adaptive Verfahren

Bemerkung: Die Aufgabe bei adaptiven Verfahren ist, ein optimales Gitter \(I_h\) zu finden, sodass \(\norm {u - u_h} \le \TOL \) gilt. Eigentlich ist dies ein nicht-lineares Optimierungsproblem.
In der Praxis verwendet man daher A-posteriori-Fehlerschätzer, um den Fehler möglichst genau (gute Abschätzung) und möglichst lokal (wo muss Genauigkeit erhöht werden) zu kontrollieren.

Fehlerschätzer: Eine Größe \(\eta \) heißt Fehlerschätzer zu \(\norm {e_h} = \norm {u - u_h}\), falls Konstanten \(c_l\) und \(c_r\) unabhängig von \(I_h\) existieren, sodass \(c_l \eta \le \norm {e_h} \le c_r \eta \).
Gilt zusätzlich \(\lim _{|h| \to 0} \frac {\norm {e_h}}{|\eta |} = 1\), dann heißt der Fehlerschätzer asymptotisch exakt.

Fehlerindikator: Wenn sich ein Fehlerschätzer durch \(\eta = (\sum _{i=1}^N \lambda _i^2)^{1/2}\), \(\lambda _i \ge 0\) darstellen lässt (wobei jedes \(\lambda _i\) einem finiten Element \(I_i\) zugeordnet sein soll), so heißen die Zahlen \(\lambda _i\) Fehlerindikatoren.

Bemerkung: Ein adaptives Verfahren zur FEM läuft so ab, dass die Elemente \(I_i\) mit großem Fehlerindikator \(\lambda _i\) verkleinert werden (\(h\)-Methode).
Alternativ kann man auch den Polynomgrad erhöhen (\(p\)-Methode, dafür ist aber eine höhere Regularität notwendig).
Die Kombinationen beider Methoden nennen sich wenig überraschend \(h\)-\(p\)-Methoden.

Numerische Stabilität der FEM

Bemerkung: Wie stabil ist die Lösung von \(u_h \in V_h\colon \forall _{v_h \in V_h}\; a(u_h, v_h) = (g, v_h)\) gegenüber Störungen bei der Diskretisierung? Wie hoch ist der Aufwand der FEM?

Bemerkung: Das Problem ist äquivalent zur Lösung \(Au = g\) mit \(a_{ij} = a(\varphi _i, \varphi _j)\) und \(g_i = (g, \varphi _i)\) für \(i, j = 1, \dotsc , N\).

Spektralradius: Sei \(A \in \real ^{N \times N}\) eine Matrix mit den Eigenwerten \(\mu _1, \dotsc , \mu _m\).
Dann heißt \(\varrho (A) := \max _{i=1,\dotsc ,m} |\mu _i|\) Spektralradius von \(A\).

Kondition: Seien \(\norm {\cdot }\) eine Vektornorm im \(\real ^N\) und \(\norm {A}\) die entsprechende induzierte Matrixnorm für \(A \in \real ^{N \times N}\). Dann heißt \(\cond (A) := \norm {A} \cdot \norm {A^{-1}}\) Kondition von \(A\).

Bemerkung: Die euklidische Vektornorm \(\norm {x}_2^2 = \sum _{i=1}^N x_i^2\) induziert die Spektralnorm
\(\norm {A}_2^2 = \mu _{\max }(A^t A)\). Für \(A = A^t\) gilt damit \(\cond _2(A) = \frac {|\mu _{\max }|}{|\mu _{\min }|}\).

Bemerkung: Seien \(\widetilde {u}\) die numerische Lösung zu \(Au = g\), \(e := u - \widetilde {u}\) der Fehler und
\(r := Ae = g - A\widetilde {u}\) das Residuum. Dann gilt wegen \(\norm {g} \le \norm {A} \cdot \norm {u}\) für den relativen Fehler, dass \(\frac {\norm {e}}{\norm {u}} \le \frac {\norm {A^{-1}} \cdot \norm {r}}{\norm {g} \cdot \norm {A}^{-1}} = \norm {A} \cdot \norm {A^{-1}} \cdot \frac {\norm {r}}{\norm {g}}\), also \(e_\rel \le \cond (A) \cdot r_\rel \) mit \(e_\rel := \frac {\norm {e}}{\norm {u}}\) und \(r_\rel := \frac {\norm {r}}{\norm {g}}\).
Sei nun \((A + \Delta A) (u + \Delta u) = g + \Delta g\) das mit \(\Delta A\) und \(\Delta g\) gestörte LGS, wobei \(\Delta u = \widetilde {u} - u\).

Satz (Abschätzung für relativen Fehler):
Für den relativen Fehler gilt \(\frac {\norm {\Delta u}}{\norm {u}} \le \frac {\cond (A)} {1 - \cond (A) \cdot \norm {\Delta A}/\norm {A}} \cdot \left (\frac {\norm {\Delta g}}{\norm {g}} + \frac {\norm {\Delta A}}{\norm {A}}\right )\), wenn \(A + \Delta A\) invertierbar ist und \(\norm {A^{-1} \Delta A} < 1\).

Beispiel: Bei der Aufgabe \(-u’’ = g\) mit \(u(-1) = u(1) = 0\) und Hütchenfunktionen auf einem äquidistanten Gitter erhält man \(\frac {1}{h}\) \(\begin {pmatrix} 2 & -1 & & & 0 \\ -1 & 2 & -1 \\ & \ddots & \ddots & \ddots \\ & & -1 & 2 & -1 \\ 0 & & & -1 & 2 \end {pmatrix}\), d. h. \(\cond (A) = \frac {1}{h} \O (N^2)\).
Um dies zu verbessern, führt man eine Vorkonditionierung durch, also betrachtet man statt \(Au = g\) das LGS \(CAu = Cg\) mit \(\widetilde {A} := CA\) und \(\widetilde {g} := Cg\), sodass \(\cond (CA) \ll \cond (A)\) (Links-Vorkonditionierung).
Bei der symmetrischen Vorkonditionierung ist \(Au = g\) äquivalent zu \(K^t A K y = K^t g\) mit
\(y = K^{-1} u\) und \(C = K K^t\). Dabei ist \(K = K^t\) mit \(\det K \not = 0\).

Numerischer Aufwand und schnelle Löser für die FEM

Bemerkung: Bestandteile der FEM waren das Berechnen der Matrix \(A\) (Aufwand \(\O (N)\)), das Berechnen der rechten Seite (Aufwand \(\O (N)\)) und das Lösen des LGS – direkte Verfahren wie das Gaußsche Eliminationsverfahren haben einen Aufwanden von \(\O (N^3)\).
Um den Aufwand zu verkleinern, werden iterative Verfahren betrachtet, die nur Matrix-Vektor-Operationen benutzen (jede Multiplikation hat einen Aufwand von \(\O (N)\)).
Optimal wären iterative Verfahren mit von \(N\) unabhängiger Iterationszahl, sodass ein Gesamtaufwand von \(\O (N)\) besteht.

Fixpunkt-Iteration: Umformung von \(Au = g\) in \(u_{k+1} = u_k + T(g - Au_k)\) mit \(T \in \real ^{N \times N}\)
Verfahren, die auf einer Aufspaltung von \(A\) beruhen
(also \(A = M_1 - M_2\) und \(u_{k+1} = M_1^{-1} (M_2 u_k + g)\))
- Jacobi-Verfahren: \(u_{k+1} = D^{-1} (L + R) u_k + g\)
- Gauß-Seidel-Verfahren: \(u_{k+1} = (D - L)^{-1} (Ru_k + g)\)
Verfahren, die ein der Gleichung \(Au = g\) äquivalentes Funktional verwenden
- Gradientenverfahren: \(A\) symmetrisch positiv definit, Funktional \(f(v) := \frac {1}{2} v^t A v - g^t v\), Energienorm \(\norm {v}_A := \sqrt {v^t A v}\) (Norm, falls \(A\) positiv definit ist)
  Es gilt \(f(v) = \frac {1}{2} v^t A v - g^t v = \frac {1}{2} u^t A u - g^t u + \frac {1}{2} v^t A v - v^t A u + \frac {1}{2} u^t A u = f(u) + \frac {1}{2} \norm {v - u}_A^2\).
  Das Gradientenverfahren besteht nun darin, \(f\) in Richtung des steilsten Abstiegs zu minimieren. Ausgehend von einer aktuellen Näherungslösung \(v_k\) ist
  \(d_k := -\nabla f(v_k) = g - Av_k\) der negative Gradient und \(v_{k+1} := v_k + \alpha _k d_k\), sodass \(f(v_k + t d_k)\) minimal wird. Dies ist der Fall für \(\alpha _k := \frac {d_k^t d_k}{d_k^t A d_k}\).
  Für den Fehler gilt \(\norm {v_k - u}_A \le \left (\frac {\cond _2(A) - 1}{\cond _2(A) + 1}\right )^k \norm {v_0 - u}_A\). Der Ausdruck in Klammern ist sehr nahe bei \(1\), falls \(\cond _2(A)\) groß ist, d. h. die Fehlerschranke verkleinert sich für größer werdendes \(k\) nur sehr langsam.
- cg-Verfahren: Wählt man die Suchrichtungen anders, sodass sie \(A\)-orthogonal zueinander sind (also \(d_k^t A d_\ell = 0\) für \(k \not = \ell \)), so erhält man Konvergenz nach \(N\) Schritten (bei exakter Rechnung).
  Seien \(v_0 \in \real ^N\) ein Startvektor und \(d_0 := -g_0 := g - Av_0\).
  Dann ist \(\alpha _k := \frac {g_k^t g_k}{d_k^t A d_k}\), \(v_{k+1} := v_k + \alpha _k d_k\), \(g_{k+1} := g_k + \alpha _k A d_k\),
  \(\beta _k := \frac {g_{k+1}^t g_{k+1}}{g_k^t g_k}\), \(d_{k+1} := -g_{k+1} + \beta _k d_k\).
  Für den Fehler gilt \(\norm {v_k - u}_A \le 2 \left (\frac {\sqrt {\cond _2(A)} - 1} {\sqrt {\cond _2(A)} + 1}\right )^k \norm {v_0 - u}_A\).
- cg-Verfahren mit Vorkonditionierung: Seien \(g_0 := g - Av_0\), \(h_0 := Cg_0\) und \(d_0 := -h_0\).
  Dann ist \(\alpha _k := \frac {g_k^t h_k}{d_k^t A d_k}\), \(v_{k+1} := v_k + \alpha _k d_k\), \(g_{k+1} := g_k + \alpha _k A d_k\),
  \(h_{k+1} := Cg_{k+1}\), \(\beta _k := \frac {g_{k+1}^t h_{k+1}}{g_k^t h_k}\), \(d_{k+1} := -h_{k+1} + \beta _k d_k\).
  Es gelten die gleichen Fehlerabschätzungen und Konvergenzaussagen analog mit \(\cond _2(CA)\).

Bemerkung: Möglichkeiten zur Vorkonditionierung:

Diagonalvorkonditionierung: \(c_{ij} = a_{ij}\) für \(i = j\) und \(c_{ij} = 0\) sonst
einige Schritte des Gauß-Seidel-Verfahrens mit Relaxation
Incomplete-Chomsky-Zerlegung (IC-Vorkonditionierung):
Statt der Chomsky-Zerlegung \(A = LL^t\) mit \(A^{-1} = (L^t)^{-1} L^{-1}\) betrachtet man die Zerlegung \(A = \widetilde {L}\widetilde {L}^t + R\) mit \(\widetilde {A} = \widetilde {L}\widetilde {L}^t\) und \(\widetilde {A}^{-1} = (\widetilde {L}^t)^{-1} \widetilde {L}^{-1}\).
Mehrgitterverfahren: Aus der Beobachtung, dass „klassische“ Verfahren den Fehler „glätten“, kann man durch eine Approximation auf einem gröberen Gitter einen besseren Fehler erhalten. Bei den Zweigitterverfahren führt man in jedem Zyklus zunächst eine Glättung (d. h. \(\nu \) Glättungsschritte) und anschließend eine Grobgitterkorrektur durch. Bei den Mehrgitterverfahren wird diese Methode verschachtelt und iterativ angewandt. Diese Verfahren können zur Vorkonditionierung benutzt werden.
Vorkonditionierung durch Lösen einfacherer, aber ähnlicher Probleme: Beispielsweise kann eine einfachere Gleichung (z. B. \(-u’’\) für Sturm-Liouville oder \(-\Delta \) für Elastizitätsgleichung) oder ein entkoppeltes Problem gelöst werden (die Matrizen der Kopplung, d. h. die Matrizen, die den Zusammenhang zwischen verschiedenen Abschnitten herstellen, weglassen).