Formale Sprachen und Automatentheorie – Reguläre Sprachen

Deterministische Automaten

Bemerkung: Während Grammatiken mit vordefinierten Regeln Wörter einer Sprache erzeugen können, tun Automaten in gewisser Weise das Gegenteil. Automaten erkennen Wörter, d. h. man gibt ein Wort ein und der Automat gibt zurück, ob das Wort erkannt wurde (zu einer bestimmten Sprache gehört) oder nicht.
Das Ziel der folgenden Abschnitte wird es sein zu zeigen, dass DEAs dasselbe „können“ wie Typ-3-Grammatiken. Dafür wird das Hilfsmittel des NEAs eingeführt, der ebenfalls genau so viel kann wie DEAs.

deterministischer endlicher Automat (DEA):
Ein deterministischer endlicher Automat (DEA) oder DFA ist ein \(5\)-Tupel \(M = (Z, \Sigma , \delta , z_0, E)\) mit

\(Z\) einer endlichen, nicht-leeren Menge (die Menge der Zustände),
\(\Sigma \) einer endlichen, nicht-leeren Menge mit \(Z \cap \Sigma = \emptyset \) (das Alphabet),
\(\delta \colon Z \times \Sigma \rightarrow Z\) (die Überführungsfunktion),
\(z_0 \in Z\) (der Startzustand) und
\(E \subset Z\) (die akzeptierenden Endzustände).

Bemerkung: Bildhaft kann man sich einen Automat vorstellen als eine Maschine, die von einem endlichen Eingabeband Zeichen für Zeichen einliest. Die Maschine hat einen Lesekopf, der sich zu Beginn am Anfang des Eingabebands befindet, und speichert sich den aktuellen Zustand \(q\), der anfangs \(z_0\) ist. Die Maschine liest ein Zeichen \(y\) und ermittelt durch \(\delta (q, y)\) den Zustand, der als nächstes angenommen wird. Diesen speichert sie sich als neuen Zustand und setzt den Lesekopf um ein Zeichen weiter. Ist das Ende das Bands erreicht, so zeigt die Maschine an, ob der erreichte Zustand \(q\) ein Endzustand ist (d. h. \(q \in E\)).

Bemerkung: Automaten kann man durch gerichtete, beschriftete Graphen (den Zustandsgraphen) darstellen. Die Zustände entsprechen den Knoten. Der dem Startzustand entsprechende Knoten wird durch einen eingehenden Pfeil („aus dem Nichts“) besonders markiert. Endzustände werden durch doppelte Kreise gekennzeichnet. Die Kanten veranschaulichen \(\delta \):
Für alle \(z_1 \in Z\) und \(a \in \Sigma \) geht eine mit \(a\) beschriftete Kante von \(z_1\) nach \(z_2 = \delta (z_1, a)\).

akzeptierte Sprache: Sei \(M = (Z, \Sigma , \delta , z_0, E)\) ein DEA.
Man definiert induktiv die Abbildung \(\widehat {\delta }\colon Z \times \Sigma ^\ast \rightarrow Z\) durch \(\widehat {\delta }(z, \varepsilon ) := z\) für alle \(z \in Z\)
und \(\widehat {\delta }(z, ax) := \widehat {\delta }(\delta (z, a), x)\) für alle \(z \in Z\), \(a \in \Sigma \) und \(x \in \Sigma ^\ast \).
Die von \(M\) akzeptierte Sprache ist \(T(M) := \{x \in \Sigma ^\ast \;|\; \widehat {\delta }(z_0, x) \in E\}\).

Bemerkung: Die Abbildung \(\widehat {\delta }\) gibt an, in welchen Zustand man gelangt, wenn man von einem bestimmten Zustand startet und ein Wort aus \(\Sigma ^\ast \) eingelesen wird. In der Tat gilt
\(\widehat {\delta }(z, a_1 \dotsb a_n) = z’ \;\Leftrightarrow \; \exists _{q_1, \dotsc , q_n \in Z}\; \delta (z, a_1) = q_1,\; \delta (q_i, a_{i+1}) = q_{i+1}, i = 1, \dotsc , n - 1, q_n = z’\).
Außerdem folgt aus \(x, y \in \Sigma ^\ast \), dass \(\widehat {\delta }(z, xy) = \widehat {\delta }(\widehat {\delta }(z, x), y)\) für alle \(z \in Z\).
Diese Aussagen folgen direkt aus \(\widehat {\delta }(z, a_1 \dotsb a_n) = \delta (\delta (\dotsb \delta (\delta (z, a_1), a_2)\dotsb , a_{n-1}), a_n)\), was man induktiv beweisen kann.

\(\DEA \): Die Menge \(\DEA := \{L \subset \Sigma ^\ast \;|\; \exists _{\text {det. endl. Automat } M}\; T(M) = L\}\) ist die Menge aller Sprachen, die von DEAs akzeptiert werden.

\(\REG \): Die Menge \(\REG := \{L \subset \Sigma ^\ast \;|\; \exists _{\text {Typ-3-Grammatik } G}\; L(G) = L\}\) ist die Menge aller Typ-3-Sprachen.

Satz (obere Schranke für DEA): Es gilt \(\DEA \subset \REG \)
(d. h. für jeden DEA \(M\) gibt es eine Typ-3-Grammatik \(G\) mit \(L(G) = T(M)\)).

Beweis: Sei \(M = (Z, \Sigma , \delta , z_0, E)\) ein DEA. Definiere \(G = (V, \Sigma , P, S)\) mit \(V = Z\), \(S = z_0\) und \(P\) wie folgt: Für alle \(p, q \in Z\) und \(a \in \Sigma \) mit \(q = \delta (p, a)\) wird die Regel \(p \rightarrow aq\) in \(P\) aufgenommen. Ist zusätzlich \(q \in E\), so wird auch noch \(p \rightarrow a\) in \(P\) aufgenommen. \(G\) ist regulär.

Zu zeigen ist \(T(M) = L(G)\). Sei \(x = a_1 \dotsb a_n\). Dann gilt \(x \in T(M) \iff \widehat {\delta }(z_0, x) \in E\)
\(\iff \exists _{q_1, \dotsc , q_n \in Z}\; \delta (z_0, a_1) = q_1,\; \delta (q_i, a_{i+1}) = q_{i+1}\; (i = 1, \dotsc , n - 1),\; q_n \in E\)
\(\iff \exists _{q_1, \dotsc , q_n \in V}\; z_0 \rightarrow a_1 q_1 \in P,\; q_i \rightarrow a_{i+1} q_{i+1} \in P\; (i = 1, \dotsc , n - 1),\; q_{n-1} \rightarrow a_n \in P\)
\(\iff \exists _{q_1, \dotsc , q_n \in V}\; z_0 \Rightarrow _G a_1 q_1 \Rightarrow _G a_1 a_2 q_2 \Rightarrow _G \dotsb \Rightarrow _G a_1 a_2 \dotsb a_{n-1} q_{n-1} \Rightarrow _G a_1 a_2 \dotsb a_{n-1} a_n = x\)
\(\iff x \in L(G)\).

Nichtdeterministische Automaten

nichtdeterministischer endlicher Automat (NEA): Ein nichtdeterministischer
endlicher Automat (NEA) oder NFA ist ein \(5\)-Tupel \(M = (Z, \Sigma , \delta , Z_0, E)\), wobei

\(Z\) eine endliche, nicht-leere Menge (die Menge der Zustände),
\(\Sigma \) eine endliche, nicht-leere Menge mit \(Z \cap \Sigma = \emptyset \) (das Alphabet),
\(\delta \colon Z \times \Sigma \rightarrow \P (Z)\) (die Überführungsfunktion),
\(Z_0 \subset Z\) (die Startzustände) und
\(E \subset Z\) (die akzeptierenden Endzustände).

Bemerkung: Auch NEAs können durch Zustandsgraphen dargestellt werden. Es gibt nun jedoch evtl. mehrere Startzustände und von jedem Knoten können mehrere mit demselben Buchstaben beschriftete Kanten ausgehen (oder auch keine).

akzeptierte Sprache: Sei \(M = (Z, \Sigma , \delta , z_0, E)\) ein NEA.
Man definiert induktiv die Abbildung \(\widehat {\delta }\colon \P (Z) \times \Sigma ^\ast \rightarrow \P (Z)\) durch \(\widehat {\delta }(Q, \varepsilon ) := Q\) für alle \(Q \subset Z\) und \(\widehat {\delta }(Q, ax) := \bigcup _{q \in Q} \widehat {\delta }(\delta (q, a), x)\) für alle \(Q \subset Z\), \(a \in \Sigma \) und \(x \in \Sigma ^\ast \).
Die von \(M\) akzeptierte Sprache ist \(T(M) := \{x \in \Sigma ^\ast \;|\; \widehat {\delta }(Z_0, x) \cap E \not = \emptyset \}\).

\(\NEA \): Die Menge \(\NEA := \{L \subset \Sigma ^\ast \;|\; \exists _{\text {nichtdet. endl. Automat } M}\; T(M) = L\}\) ist die Menge aller Sprachen, die von NEAs akzeptiert werden.

Bemerkung: Es ist klar, dass \(\DEA \subset \NEA \) gilt.

Satz (Satz von Rabin und Scott): Es gilt \(\NEA \subset \DEA \)
(d. h. für jeden NEA \(M\) gibt es einen DEA \(M’\) mit \(T(M’) = T(M)\)).

Beweis: Sei \(M = (Z, \Sigma , \delta , Z_0, E)\) ein NEA. Definiere den DEA \(M’ = (\P (Z), \Sigma , \delta ’, Z_0, E’)\) wie folgt: \(\delta ’(Q, a) := \widehat {\delta }(Q, a) = \bigcup _{q \in Q} \delta (q, a)\) und \(E’ := \{Q \in \P (Z) \;|\; Q \cap E \not = \emptyset \}\).

Zunächst beweist man folgendes Lemma: Für alle \(Q \subset Z\) und \(w \in \Sigma ^\ast \) gilt \(\widehat {\delta }(Q, w) = \widehat {\delta ’}(Q, w)\).
Der Beweis erfolgt über Induktion über \(n = |w| \in \natural _0\).
Der Induktionsanfang ist klar (\(Q = \widehat {\delta }(Q, \varepsilon ) = \widehat {\delta ’}(Q, \varepsilon ) = Q\)).
Beim Induktionsschritt \(n \rightarrow n + 1\) ist die Induktionsvoraussetzung, dass \(\widehat {\delta }(Q, x) = \widehat {\delta ’}(Q, x)\) für alle \(Q \subset Z\) und \(x \in \Sigma ^\ast \) mit \(|x| \le n\). Für beliebige \(P \subset Z\) und \(a \in \Sigma \) gilt somit
\(\widehat {\delta }(P, ax) = \widehat {\delta }(\delta (P, a), x) = \widehat {\delta ’}(\delta (P, a), x) = \widehat {\delta ’}(\widehat {\delta }(P, a), x) = \widehat {\delta ’}(\delta ’(P, a), x) = \widehat {\delta ’}(P, ax)\).

Zu zeigen ist \(T(M) = T(M’)\). Mit der Hilfsbehauptung ergibt sich
\(w \in T(M) \iff \widehat {\delta }(Z_0, w) \cap E \not = \emptyset \iff \widehat {\delta ’}(Z_0, w) \cap E \not = \emptyset \iff \widehat {\delta ’}(Z_0, w) \in E’\)
\(\iff w \in T(M’)\).

Bemerkung: Somit ist \(\DEA = \NEA \), d. h. DEAs und NEAs „können“ dasselbe.

Potenzmengenkonstruktion: Die Konstruktion eines DEA \(M’\) aus einem NEA \(M\) mit \(L(M’) = L(M)\) wie im Beweis vom Satz von Rabin und Scott bezeichnet man als
Potenzmengenkonstruktion.

Bemerkung: Für \(M = (Z, \Sigma , \delta , Z_0, E)\) hat \(M’\) dann \(|\P (Z)| = 2^{|Z|}\) viele Zustände.
Im Allgemeinen geht es nicht viel besser, d. h. selbst minimale DEAs haben \(\O (2^{|Z|})\) viele Zustände (Blow-Up). Betrachte dafür die Sprache \(L_k = \{x0y \in \{0, 1\}^\ast \;|\; |y| = k - 1\}\) für \(k \in \natural \) fest. Ein NEA lässt sich mit \(k + 1\) Zuständen konstruieren.
Nach der Potenzmengenkonstruktion gibt es einen DEA mit \(2^{k+1}\) Zuständen, allerdings kann es keinen DEA geben, der weniger als \(2^k\) Zustände besitzt, da dieser sich die letzten \(k\) Buchstaben „merken“ muss (um zu entscheiden, ob der momentan \(k\)-letzte Buchstabe eine \(0\) ist).
Um dies zu beweisen, zeigt man \(\widehat {\delta }(z_0, w_1) \not = \widehat {\delta }(z_0, w_2)\) für \(w_1 \not = w_2\) mit \(|w_1| = |w_2| = k\) (somit muss es mindestens so viele Zustände geben wie Wörter der Länge \(k\)). Wegen \(w_1 \not = w_2\) gilt \(w_1 = x0y_1\) und \(w_2 = x1y_2\) für bestimmte \(x, y_1, y_2 \in \Sigma ^\ast \). Wäre \(\widehat {\delta }(z_0, w_1) = \widehat {\delta }(z_0, w_2)\), dann wäre \(\widehat {\delta }(z_0, w_1 x) = \widehat {\delta }(z_0, w_2 x)\). Der \(k\)-letzte Buchstabe von \(w_1 x\) ist \(0\) (da \(|0y_1 x| = |x0y_1| = k\)), der von \(w_2 x\) ist \(1\), d. h. \(\widehat {\delta }(z_0, w_1 x) \in E\) und \(\widehat {\delta }(z_0, w_2 x) \notin E\), ein Widerspruch.

Satz (obere Schranke für \(\REG \)): Es gilt \(\REG \subset \NEA \)
(d. h. für jede Typ-3-Grammatik \(G\) existiert ein NEA \(M\) mit \(T(M) = L(G)\)).

Beweis: Sei \(G = (V, \Sigma , P, S)\) eine Typ-3-Grammatik. Definiere den NEA
\(M = (V \cup \{X\}, \Sigma , \delta , \{S\}, E)\) mit \(X \notin V\) durch
\(E := \{X\}\) für \(\varepsilon \notin L(G)\) und \(E := \{S, X\}\) für \(\varepsilon \in L(G)\) sowie
\(\delta (A, a) := \{B \in V \;|\; A \rightarrow aB \in P\}\) für \(A \rightarrow a \notin P\) und
\(\delta (A, a) := \{B \in V \;|\; A \rightarrow aB \in P\} \cup \{X\}\) für \(A \rightarrow a \in P\).

Man kann sich leicht überlegen, dass \(T(M) = L(G)\).

Bemerkung: Damit gilt \(\REG = \DEA = \NEA \).

Reguläre Ausdrücke

reguläre Ausdrücke: Sei \(\Sigma \) ein Alphabet.
Die Menge \(\RegExp \) aller regulären Ausdrücke über \(\Sigma \) ist wie folgt definiert:

\(\emptyset \in \RegExp \)
\(\varepsilon \in \RegExp \)
\(a \in \RegExp \) für alle \(a \in \Sigma \)

Diese regulären Ausdrücke heißen atomar. Für \(\alpha , \beta \in \RegExp \) sei:

\(\alpha \beta \in \RegExp \)
\((\alpha |\beta ) \in \RegExp \)
\((\alpha )^\ast \in \RegExp \)

Klammern dürfern ggf. weggelassen werden.
(Rein formal definiert man \(\RegExp _0 := \{\emptyset , \varepsilon \} \cup \{a \;|\; a \in \Sigma \}\) und \(\RegExp _{i+1} :=\)
\(\RegExp _i \cup \{\alpha \beta \;|\; \alpha , \beta \in \RegExp _i\} \cup \{(\alpha |\beta ) \;|\; \alpha , \beta \in \RegExp _i\} \cup \{(\alpha )^\ast \;|\; \alpha \in \RegExp _i\}\) für \(i \in \natural _0\) und schließlich \(\RegExp := \bigcup _{i=0}^\infty \RegExp _i\).)

\(\emptyset \), \(\varepsilon \) und \(a\) sind zunächst einmal nur Zeichen ohne Bedeutung (syntaktische Definition).

Semantik regulärer Ausdrücke:
Jedem regulären Ausdruck \(\alpha \in \RegExp \) über \(\Sigma \) ordnet man eine Sprache \(L(\alpha ) \subset \Sigma ^\ast \) zu:

\(L(\emptyset ) := \emptyset \)
\(L(\varepsilon ) := \{\varepsilon \}\)
\(L(a) := \{a\}\) für alle \(a \in \Sigma \)

Außerdem sei für \(\alpha , \beta \in \RegExp \):

\(L(\alpha \beta ) := L(\alpha ) L(\beta ) = \{xy \;|\; x \in L(\alpha ),\; y \in L(\beta )\}\)
\(L((\alpha |\beta )) := L(\alpha ) \cup L(\beta )\)
\(L((\alpha )^\ast ) := L(\alpha )^\ast = \{a_1 \dotsc a_n \;|\; n \in \natural _0, a_1, \dotsc , a_n \in L(\alpha )\}\)

Bemerkung: Es gilt \(\varepsilon \in L(\alpha )^\ast \) für alle \(\alpha \in \RegExp \), d. h. insbesondere \(\varepsilon \in L(\emptyset )^\ast \).
Beispiele für korrekte reguläre Ausdrücke über \(\{0, 1\}\) sind \(0111010\), \(11|0^\ast \) und \((11|0)^\ast \) (man beachte die Klammerung).

Satz (Satz von  Kleene):
Die Menge der durch reguläre Ausdrücke beschreibbaren Sprachen ist gleich \(\REG \).

Beweis: Sei \(\gamma \in \RegExp \). Man zeigt induktiv, dass es einen NEA \(M\) gibt mit \(T(M) = L(\gamma )\).
NEAs für \(L(\emptyset ) = \emptyset \), \(L(\varepsilon ) = \{\varepsilon \}\) und \(L(a) = \{a\}\) sind klar (kein Endzustand, Anfangs- gleich Endzustand bzw. einfacher Automat mit zwei Zuständen).
Seien also \(M_1\) ein NEA für \(L(\alpha )\) und \(M_2\) ein NEA für \(L(\beta )\). Konstruiere einen NEA für \(L(\alpha )L(\beta )\) durch Zusammenschalten der zwei NEAs: Für \(\varepsilon \notin L(\alpha )\) wird jeder Übergang \(p \xrightarrow {a} e\) mit \(e\) Endzustand in \(M_1\) ergänzt durch \(p \xrightarrow {a} q\) für alle Startzustände \(q\) von \(M_2\). Startzustände des neuen Automaten sind die von \(M_1\), Endzustände sind die von \(M_2\). Für \(\varepsilon \in L(M_1)\) fügt man einen zusätzlichen (isolierten) Zustand ein, der gleichzeitig Start- und Endzustand ist.
Für \(L(\alpha ) \cup L(\beta )\) „vereinigt“ man die beiden Automaten (Zustände, Startzustände, Endzustände usw., Annahme: Automaten sind disjunkt).
Für \((L(\alpha ))^\ast \) verfährt man ähnlich wie für \(L(\alpha )L(\beta )\), nur dass man hier den Automaten \(L_1\) mit sich selbst zusammenschaltet.

Für die andere Richtung geht man von einem DEA \(M = (Z, \Sigma , \delta , z_1, E)\) mit \(Z = \{z_1, \dotsc , z_n\}\) aus und konstruiert einen regulären Ausdruck \(\gamma \in \RegExp \) mit \(L(\gamma ) = T(M)\).
Definiere \(R_{i,j}^k := \{x \in \Sigma ^\ast \;|\; \widehat {\delta }(z_i, x) = z_j \text { über Zwischenzustände mit Index} \le k\}\).
Man zeigt nun durch Induktion über \(k \in \natural _0\), dass es für alle \(R_{i,j}^k\) reguläre Ausdrücke gibt, die diese Sprachen beschreiben. Klar ist, dass für alle \(R_{i,j}^0\) solche regulären Ausdrücke existieren, da \(R_{i,j}^0 = \{a \in \Sigma \;|\; \delta (z_i, a) = z_j\}\) endlich und somit durch reguläre Ausdrücke beschreibbar ist.
Wenn für alle \(R_{i,j}^k\) die Behauptung gezeigt ist, dann gilt sie auch für \(R_{i,j}^{k+1}\), denn:
Für \(w \in R_{i,j}^{k+1}\) ist \(\widehat {\delta }(z_i, w) = z_j\) über Zwischenzustände mit Index \(\le k + 1\). Für den Fall, dass die Zwischenzustände sogar alle Index \(\le k\) besitzen, lässt sich die Induktionsvoraussetzung direkt anwenden. Andernfalls lässt sich \(w\) zerlegen zu \(w = w_1 x_1 \dotsb x_r w_2\) mit \(w_1 \in R_{i,k+1}^k\), \(w_2 \in R_{k+1,j}^k\) und \(x_i \in R_{k+1,k+1}^k\) für \(i = 1, \dotsc , r\). Also gilt \(R_{i,j}^{k+1} = R_{i,j}^k \cup R_{i,k+1}^k (R_{k+1,k+1}^k)^\ast R_{k+1,j}^k\) und die Induktionsvoraussetzung lässt sich anwenden.
Da \(T(M) = \bigcup _{z_j \in E} R_{1,j}^n\) gilt, ist somit auch \(T(M)\) durch einen regulären Ausdruck \(\gamma \in \RegExp \) beschreibbar (mittels \((\dotsb |\dotsb )\)).

Das Pumping-Lemma

Satz (Pumping-Lemma): Sei \(L \subset \Sigma ^\ast \) eine reguläre Sprache.
Dann gilt \(\exists _{n \in \natural } \forall _{x \in L,\; |x| \ge n} \exists _{u, v, w \in \Sigma ^\ast ,\; uvw = x}\; (1. \land 2. \land 3.)\) mit

\(|v| \ge 1\)
\(|uv| \le n\)
\(\forall _{i \in \natural _0}\; u v^i w \in L\)

Beweis: Sei \(L\) eine reguläre Sprache. Dann gibt es wegen \(\REG = \DEA \) einen DEA
\(M = (Z, \Sigma , \delta , z_0, E)\) mit \(L(M) = L\). Setze \(n := |Z|\).
Sei \(x \in L\) mit \(|x| \ge n\), z. B. \(x = x_1 \dotsb x_m\) mit \(m \ge n\). Setze \(q_j := \widehat {\delta }(z_0, x_1 \dotsb x_j)\) für \(j = 0, \dotsc , m\). Unter den \(n + 1\) Zuständen \(q_0, \dotsc , q_n\) müssen zwei gleiche sein, da \(|Z| = n\). Wähle \(j, k \in \natural _0\), sodass \(0 \le j < k \le n\) und \(q_j = q_k\). Setze \(u := x_1 \dotsb x_j\), \(v := x_{j+1} \dotsb x_k\) und \(w := x_{k+1} \dotsb x_m\).

Es gilt \(x = uvw\) und

\(|v| \ge 1\), da \(j < k\) und somit \(x_{j+1} \dotsb x_k \not = \varepsilon \),
\(|uv| \le n\), da \(k \le n\), sowie
\(\forall _{i \in \natural _0}\; u v^i w \in L\), da aus \(\widehat {\delta }(z_0, u) = q_j = q_k = \widehat {\delta }(z_0, uv) = \widehat {\delta }(\widehat {\delta }(z_0, u), v)\) mit \(p := \widehat {\delta }(z_0, u)\) folgt, dass \(\widehat {\delta }(p, v) = p\), also \(\widehat {\delta }(p, v^i) = p\) für alle \(i \in \natural _0\). Wegen \(\widehat {\delta }(p, w) = \widehat {\delta }(z_0, uvw) \in E\) gilt somit \(\widehat {\delta }(z_0, u v^i w) = \widehat {\delta }(\widehat {\delta }(p, v^i), w) = \widehat {\delta }(p, w) \in E\) für alle \(i \in \natural _0\).

Bemerkung: Das Pumping-Lemma ist keine Charakterisierung von regulären Sprachen, d. h. es gibt nicht-reguläre Sprachen, die trotzdem die Eigenschaft des Pumping-Lemmas erfüllen.
Das Pumping-Lemma kann benutzt werden, um über einen Widerspruch die Nicht-Regulärität von Sprachen zu beweisen. (Auch dies geht nicht für alle nicht-regulären Sprachen.)

Beispiel: \(L = \{a^m b^m \;|\; m \ge 1\}\) ist nicht regulär, denn andernfalls gäbe es nach dem Pumping-Lemma ein \(n \in \natural \), sodass für alle Wörter \(x \in L\) mit \(|x| \ge n\) es Wörter \(u, v, w \in \Sigma ^\ast \) mit \(uvw = x\) und 1., 2. und 3. geben würde. Wählt man \(x = a^n b^n \in L\) (es gilt \(|a^n b^n| = 2n \ge n\)), dann gilt \(a^n b^n = uvw\) mit \(|v| \ge 1\) und \(|uv| \le n\). \(v\) kann also nur aus \(a\)’s bestehen (mindestens jedoch aus einem \(a\)). Es gilt allerdings \(uv^2 w = a^{n + |v|} b^n \notin L\), da \(n + |v| > n\), somit gilt 3. nicht.

Beispiel: \(L = \{0^{m^2} \;|\; m \ge 1\}\) ist nicht regulär, denn andernfalls gilt Ähnliches wie eben. Wählt man \(x = 0^{n^2} \in L\) (es gilt \(|0^{n^2}| = n^2 \ge n\)), dann gilt \(0^{n^2} = uvw\) mit \(u = 0^a\), \(v = 0^b\) und \(w = 0^c\), sodass \(b \ge 1\) und \(a + b \le n\), insbesondere gilt \(1 \le b \le n\). Es gilt allerdings \(uv^2 w = 0^{n^2 + b} \notin L\), da aufgrund \(n^2 < n^2 + b < n^2 + n + 1 < (n + 1)^2\) die Zahl \(n^2 + b\) keine Quadratzahl ist.

Beispiel: \(L = \{0^p \;|\; p \text { prim}\}\) ist nicht regulär, denn andernfalls gilt Ähnliches wie eben. Wählt man \(x = 0^p \in L\), wobei \(p\) eine Primzahl mit \(p > n + 2\) ist (es gilt \(|0^p| = p \ge n\)), dann gilt \(0^p = uvw\) mit \(u = 0^a\), \(v = 0^b\) und \(w = 0^c\), sodass \(b \ge 1\) und \(a + b \le n\), insbesondere gilt \(1 \le b \le n\). Für \(i = a + c\) gilt allerdings \(uv^i w = 0^{a + b(a + c) + c} \notin L\), da \(a + b(a + c) + c = (b + 1)(a + c)\) keine Primzahl ist.

Äquivalenzrelation und Minimalautomat

Äquivalenzrelation \(R_L\): Für eine gegebene Sprache \(L \subset \Sigma ^\ast \) definiert man eine Relation \(R_L\) auf \(\Sigma ^\ast \) durch \(x R_L y\) für \(x, y \in \Sigma ^\ast \), falls \(\forall _{z \in \Sigma ^\ast }\; (xz \in L \iff yz \in L)\).
Diese Relation ist eine Äquivalenzrelation.

Bemerkung: Die Äquivalenzklassen von \(R_L\) teilen nicht die „Grenze“ zwischen \(L\) und \(\Sigma ^\ast \setminus L\), d. h. \(\lnot (\exists _{x, y \in \Sigma ^\ast ,\; [x] = [y]}\; x \in L,\; y \notin L)\), denn für \(x R_L y\) folgt mit \(z = \varepsilon \), dass \(x \in L \iff y \in L\).

Lemma (Verfeinerung von \(R_L\)): Für jede reguläre Sprache \(L = L(M)\) mit dem DEA
\(M = (Z, \Sigma , \delta , z_0, E)\) gilt \(\forall _{x, y \in \Sigma ^\ast }\; (\widehat {\delta }(z_0, x) = \widehat {\delta }(z_0, y) \;\Rightarrow \; x R_L y)\).

Beweis: Seien \(x, y \in \Sigma ^\ast \) mit \(\widehat {\delta }(z_0, x) = \widehat {\delta }(z_0, y)\) und \(z \in \Sigma ^\ast \) beliebig.
Dann gilt \(xz \in L \iff \widehat {\delta }(z_0, xz) \in E \iff \widehat {\delta }(\widehat {\delta }(z_0, x), z) \in E \iff \widehat {\delta }(\widehat {\delta }(z_0, y), z) \in E\)
\(\iff \widehat {\delta }(z_0, yz) \in E \iff yz \in L\).

Äquivalenzrelation \(R_M\): Für einen DEA \(M = (Z, \Sigma , \delta , z_0, E)\) definiert man eine Relation \(R_M\) auf \(\Sigma ^\ast \) durch \(x R_M y\) für \(x, y \in \Sigma ^\ast \), falls \(\widehat {\delta }(z_0, x) = \widehat {\delta }(z_0, y)\).
Diese Relation ist eine Äquivalenzrelation und es gilt \(R_M \subset R_L\), d. h. \(R_M\) ist eine Verfeinerung von \(R_L\). (die Äquivalenzklassen von \(R_L\) werden durch \(R_M\) „verfeinert“).

Index: Seien \(M\) eine Menge und \(R \subset M \times M\) eine Äquivalenzrelation. Dann heißt die Anzahl \(|\{[m]_R \;|\; m \in M\}|\) der Äquivalenzklassen Index der Äquivalenzrelation \(R\).

Satz (Satz von Myhill und Nerode):
Eine Sprache \(L\) ist regulär genau dann, wenn die zugehörige Relation \(R_L\) endlichen Index hat.

Beweis: „\(\Rightarrow \)“: Sei \(L = L(M)\) mit dem DEA \(M = (Z, \Sigma , \delta , z_0, E)\). Dann gilt nach obigem Lemma \(R_M \subset R_L\), also ist der Index von \(R_L\) kleiner oder gleich dem Index von \(R_M\). Dieser ist allerdings maximal \(|Z|\) (aufgrund der Definition von \(R_M\)) und damit endlich.

„\(\Leftarrow \)“: Sei \(L \subset \Sigma ^\ast \) eine Sprache, sodass \(R_L\) endlichen Index \(k\) hat. Man wählt \(k\) Repräsentanten \(x_1, \dotsc , x_k \in \Sigma ^\ast \) der Äquivalenzklassen (d. h. es gilt \(\Sigma ^\ast = [x_1] \cup \dotsb \cup [x_k]\)) und setzt oBdA \(\varepsilon \in [x_1]\). Nun konstruiert man einen DEA \(M = (Z, \Sigma , \delta , z_0, E)\) mit \(T(M) = L\) wie folgt:
\(Z := \{[x_1], \dotsc , [x_k]\}\), \(z_0 := [x_1] = [\varepsilon ]\), \(E := \{[x_i] \;|\; x_i \in L\}\) und \(\delta ([x_i], a) := [x_i a]\).
\(E\) ist wohldefiniert, da \([x] = [y]\) impliziert, dass \(x \in L \iff y \in L\) (siehe oben).
\(\delta \) ist wohldefiniert, denn aus \([x] = [y]\) folgt \([xa] = [ya]\) für alle \(a \in \Sigma \) (für \(z \in \Sigma ^\ast \) beliebig ist \(xaz \in L \iff yaz \in L\) aufgrund \(xz’ \in L \iff yz’ \in L\) für alle \(z’ \in \Sigma ^\ast \), also auch für \(z’ = az\)).
Es gilt \(x \in T(M) \iff \widehat {\delta }(z_0, x) = \widehat {\delta }([\varepsilon ], x) = [x] \in E \iff x \in L\), also ist \(L\) regulär.

Beispiel: Sei \(L = \{0^{m^2} \;|\; m \ge 1\}\). \(R_L\) muss unendlich viele Äquivalenzklassen besitzen, denn \(L\) ist nicht regulär (siehe oben). Dies kann man auch direkt nachweisen: Für \(m < n\) gilt \([0^{m^2}] \not = [0^{n^2}]\), denn wählt man \(z = 0^{2m + 1}\), so gilt \(0^{m^2} z = 0^{(m+1)^2} \in L\), aber \(0^{n^2} z \notin L\).

Beispiel: Betrachtet man \(L = \{x \in \{a, b\}^\ast \;|\; x \text { enthält } abb\}\), so sind die paarweise disjunkten Äquivalenzklassen \(\Sigma ^\ast = [abb] \cup [\varepsilon ] \cup [a] \cup [ab]\), denn: \([abb] = L\) und \(\lnot (\varepsilon R_L a)\) (mit \(z = ab\)), \(\lnot (\varepsilon R_L ab)\) und \(\lnot (a R_L ab)\) (jeweils mit \(z = b\)). Wegen \(\varepsilon , a, ab \notin L = [abb]\) sind die Äquivalenzklassen disjunkt. Es gibt keine weiteren, da für jedes Wort \(x \in \Sigma ^\ast \setminus L\) gilt, dass \(x \in [ab]\), falls \(x\) mit \(ab\) endet, dass \(x \in [a]\), falls \(x\) mit \(a\) endet, und dass \(x \in [\varepsilon ]\), falls \(x\) mit \(b\) endet, aber nicht mit \(ab\) (in diesem Fall kann \(x\) nur aus \(b\)’s bestehen oder leer sein). Somit ist \(L\) regulär.

Beispiel: Für \(L = \{x \in \{a, b, c\}^\ast \;|\; |x|_a - |x|_b \equiv 3 \mod 5\}\) sind die disjunkten Äquivalenzklassen \(\Sigma ^\ast = [aaa] \cup [\varepsilon ] \cup [a] \cup [aa] \cup [aaaa]\), d. h. auch diese Sprache ist regulär (auch siehe oben).

minimaler Automat: Sei \(L \subset \Sigma ^\ast \) eine reguläre Sprache.
Ein DEA bzw. NEA \(M\) heißt minimal, falls \(T(M) = L\) und es keinen DEA bzw. NEA gibt, der dieselbe Sprache erkennt und weniger Zustände besitzt.

Satz (Minimalität des Äquivalenzklassen-DEA): Der im Beweis des Satzes von Myhill und Nerode konstruierte Äquivalenzklassenautomat ist ein minimaler DEA für jede reguläre Sprache.
Der Minimalautomat ist bis auf Isomorphie (Umbenennen der Zustände) eindeutig bestimmt.

Beweis: Sei \(M_0\) der Äquivalenzklassen-DEA und \(M\) ein weiterer DEA mit \(T(M) = L\).
Dann gilt \(R_M \subset R_L = R_{M_0}\) (\(R_{M_0} \subset R_L\) klar, \(R_L \subset R_{M_0}\) gilt, da aus \(x R_L y\) folgt, dass
\(\widehat {\delta }(z_0, x) = [x] = [y] = \widehat {\delta }(z_0, y)\)). Also ist \(R_M\) eine Verfeinerung von \(R_{M_0}\), die Zahl der Zustände von \(M\) kann also nicht kleiner als die von \(M_0\) sein (Anzahl der Zustände von \(M_0\) \(=\) Anzahl der vom Startzustand erreichbaren Zustände von \(M_0\) \(=\) Index von \(R_{M_0}\) \(\le \) Index von \(R_M\) \(=\) Anzahl der vom Startzustand erreichbaren Zustände von \(M\) \(\le \) Anzahl der Zustände von \(M\)).
Falls \(M\) die minimale Zustandszahl besitzt, gilt \(R_M = R_L\).

Bemerkung:
Der minimale NEA für eine gegebene reguläre Sprache ist nicht eindeutig bestimmt.

Algorithmus zur Bestimmung des Minimalautomaten: Der Algorithmus zur Bestimmung des minimalen DEA bekommt als Eingabe einen DEA, in dem alle Zustände erreichbar sind, und gibt Teilmengen von der Zustandsmenge \(Z\) aus, die verschmolzen werden können.
Dazu legt sich der Algorithmus eine Matrix \(Z \times Z\) an und verfährt folgendermaßen:

Markiere alle Paare \((z, z’)\) mit \(z \in E \land z’ \notin E\) oder \(z \notin E \land z’ \in E\).
Markiere jedes Zustandspaar \((p, q)\) mit \(\delta (p, a) = z\), \(\delta (q, a) = z’\) und \((z, z’)\) bereits markiert für ein \(a \in \Sigma \).
Wiederhole 2., bis sich nichts mehr ändert.
Die nun unmarkierten Paare von Zuständen können jeweils zu einem Zustand verschmolzen werden.

Bemerkung: Man kann sich den Algorithmus herleiten, indem man sich überlegt, dass ein Automat dann nicht minimal ist, wenn es zwei verschiedene Zustände \(z, z’\) gibt mit \(\widehat {\delta }(z, x) \in E \iff \widehat {\delta }(z’, x) \in E\) für alle \(x \in \Sigma ^\ast \) (es reicht dabei, nur Wörter mit \(|x| \le |Z|\) zu betrachten).

Einschub: Erkennung durch Monoide

Monoid: Das Paar \((M, \ast )\) heißt Monoid, falls \(M\) eine Menge und \(\ast \colon M \times M \rightarrow M\) eine Abbildung ist mit \(\forall _{a, b, c \in M}\; a \ast (b \ast c) = (a \ast b) \ast c\) und \(\exists _{e \in M} \forall _{a \in M}\; e \ast a = a = a \ast e\).

Monoidhomomorphismus: Seien \((M_1, \ast _1)\) und \((M_2, \ast _2)\) Monoide.
Eine Abbildung \(\varphi \colon M_1 \rightarrow M_2\) heißt Monoidhomomorphismus, falls \(\varphi (m \ast _1 n) = \varphi (m) \ast _2 \varphi (n)\) für alle \(m, n \in M_1\) und \(\varphi (e_1) = e_2\).

Erkennung durch Monoide: Seien \(L \subset \Sigma ^\ast \) eine Sprache und \(M\) ein Monoid.
\(M\) erkennt \(L\), falls es eine Teilmenge \(A \subset M\) und einen Homomorphismus \(\varphi \colon \Sigma ^\ast \rightarrow M\) gibt mit \(L = \varphi ^{-1}(A)\) (d. h. \(w \in L \iff \varphi (w) \in A\)).

Bemerkung: Alternativ kann man definieren, dass ein Homomorphismus \(\varphi \colon \Sigma ^\ast \rightarrow M\) existieren soll mit \(L = \varphi ^{-1}(\varphi (L))\) (hier ist \(A = \varphi (L)\)).

erkennbar:
Eine Sprache heißt erkennbar, falls sie von einem endlichen Monoid erkannt wird.

syntaktische Kongruenz: Sei \(L \subset \Sigma ^\ast \) eine Sprache. Zwei Wörter \(w_1, w_2 \in \Sigma ^\ast \) heißen äquivalent, falls \(\forall _{x, y \in \Sigma ^\ast }\; x w_1 y \in L \iff x w_2 y \in L\). Man schreibt dafür auch \(w_1 \equiv _L w_2\) oder \(w_1 \equiv w_2\). \(\equiv _L\) ist eine Äquivalenzrelation und sogar eine Kongruenz, d. h.
\(w_1 \equiv _L w_2 \iff \forall _{x, y \in \Sigma ^\ast }\; x w_1 y \equiv _L x w_2 y\). Man nennt \(\equiv _L\) daher auch syntaktische Kongruenz.

Bemerkung: \(\equiv _L\) ist eine Verfeinerung von \(R_L\), d. h. \(w_1 \equiv _L w_2 \;\Rightarrow \; w_1 R_L w_2\).

syntaktisches Monoid: Das Quotientenmonoid \(\Synt (L) := \Sigma ^\ast /\!\!\equiv _L \;= \{[w]_{\equiv _L} \;|\; w \in \Sigma ^\ast \}\) heißt syntaktisches Monoid von \(L\).

Bemerkung: Um zu zeigen, dass dies auch tatsächlich wieder ein Monoid ist, muss man zunächst die Wohldefiniertheit der Monoidoperation zeigen. Für \([a] = [a’]\) und \([b] = [b’]\) ist \(a \equiv _L a’\) und \(b \equiv _L b’\), d. h. für \(x, y \in \Sigma ^\ast \) beliebig gilt \(x ab y \in L \iff x a’b y \in L \iff x a’b’ y \in L\), also \([ab] = [a’b’]\). Die Assoziativität gilt wegen der Assoziativität in \(\Sigma ^\ast \), außerdem ist \([\varepsilon ]\) neutral. Damit ist \(\Synt (L)\) ein Monoid.

Bemerkung: \(\Synt (L)\) erkennt \(L\), denn wähle als Homomorphismus die Quotientenabbildung \(\varphi \colon \Sigma ^\ast \rightarrow \Synt (L)\), \(\varphi (a) = [a]\) und als Menge \(A = \{[a] \;|\; a \in L\}\).
Dann gilt \(L = \varphi ^{-1}(A)\), denn \(a \in L \iff \varphi (a) = [a] \in A\) („\(\Leftarrow \)“: \([a] = [b]\) für ein \(b \in L\), also \(a \equiv _L b\), daraus folgt wegen \(b \in L\), dass auch \(a \in L\) gilt).

Satz (Zusammenhang des syntaktischen Monoids mit regulären Sprachen):
Sei \(L \subset \Sigma ^\ast \) eine Sprache. Dann sind folgende Aussagen äquivalent:

\(L\) ist regulär.
\(L\) ist erkennbar.
\(\Synt (L)\) ist endlich.

Beweis: 3. \(\Rightarrow \) 2. klar, da \(\Synt (L)\) die Sprache \(L\) erkennt.
3. \(\Rightarrow \) 1. gilt, weil \(\equiv _L\) einen endlichen Index hat, wenn \(\Synt (L)\) endlich ist. Da aber \(\equiv _L\) eine Verfeinerung von \(R_L\) ist, ist der Index von \(R_L\) höchstens so groß wie der von \(\equiv _L\), d. h. \(R_L\) hat endlichen Index und somit ist \(L\) regulär.

Abschlusseigenschaften

Satz (Abschluss von \(\REG \)):
Die Klasse \(\REG \) der regulären Sprachen ist abgeschlossen unter Vereinigung, Schnitt und Komplement (boolesche Operationen) sowie unter Produkt (Konkatenation) und Stern.

Beweis: Abschluss unter Vereinigung: Sind \(L_1\) und \(L_2\) regulär, dann gibt es reguläre Ausdrücke \(\alpha _1\) und \(\alpha _2\) mit \(L(\alpha _1) = L_1\) und \(L(\alpha _2) = L_2\). Es gilt \(L(\alpha _1 | \alpha _2) = L_1 \cup L_2\), d. h. \(L_1 \cup L_2\) ist regulär.

Abschluss unter Komplement: Ist \(L\) regulär, so gibt es ein endliches Monoid \(M\), einen Homomorphismus \(\varphi \colon \Sigma ^\ast \rightarrow M\) und eine Teilmenge \(A \subset M\) mit \(L = \varphi ^{-1}(A)\). Dann gilt aber auch \(\Sigma ^\ast \setminus L = \varphi ^{-1}(M \setminus A)\), d. h. \(\Sigma ^\ast \setminus L\) wird von demselben endlichen Monoid erkannt und ist somit regulär. (Alternativ kann man in einem DEA \(M\) mit \(T(M) = L\) Endzustände und Nicht-Endzustände vertauschen, um einen DEA \(M’\) mit \(T(M’) = \Sigma ^\ast \setminus L\) zu erhalten.)

Somit folgt der Abschluss unter booleschen Operationen, denn alle booleschen Operationen (auch der Durchschnitt) sind mit Vereinigung und Komplement darstellbar. (Alternativ kann man zu zwei Automaten \(M_1 = (Z_1, \Sigma , \delta _1, z_{01}, E_1)\) und \(M_2 = (Z_2, \Sigma , \delta _2, z_{02}, E_2)\) mit \(T(M_1) = L_1\) und \(T(M_2) = L_2\) den Kreuzproduktautomaten \(M := (Z_1 \times Z_2, \Sigma , \delta , (z_{01}, z_{02}), E_1 \times E_2)\) mit \(\delta ((z, z’), a) := (\delta _1(z, a), \delta _2(z’, a))\) betrachten, für den \(T(M) = L_1 \cap L_2\) gilt.)

Abschluss unter Produkt: Sind \(L_1\) und \(L_2\) regulär, dann gibt es reguläre Ausdrücke \(\alpha _1\) und \(\alpha _2\) mit \(L(\alpha _1) = L_1\) und \(L(\alpha _2) = L_2\). Es gilt \(L(\alpha _1 \alpha _2) = L_1 L_2\), d. h. \(L_1 L_2\) ist regulär.

Abschluss unter Stern: Ist \(L\) regulär, dann gibt es einen regulären Ausdruck \(\alpha \) mit \(L(\alpha ) = L\). Es gilt \(L(\alpha ^\ast ) = L^\ast \), d. h. \(L^\ast \) ist regulär.

Entscheidbarkeit

Bemerkung: In diesem Abschnitt wird untersucht, welche Probleme in Bezug auf reguläre Sprachen entscheidbar sind.

Bemerkung: Das Wortproblem besteht darin, bei gegebener Sprache \(L\) und einem Wort \(x\) zu entscheiden, ob \(x \in L\) gilt. Das Wortproblem ist für reguläre Sprachen entscheidbar (sogar schon für Typ-1-Sprachen).
Ist ein DEA \(M\) mit \(T(M) = L\) gegeben, dann ist die Entscheidung in Linearzeit möglich: Zeichen für Zeichen kann man die Zustandsübergänge im Automaten verfolgen, die durch die Eingabe eines Wortes \(x \in \Sigma ^\ast \) hervorgerufen werden. Falls ein Endzustand erreicht wird, ist \(x \in L\). Man spricht von Echtzeit, da man vorhersehen kann, wie lange die Lösung des Wortproblems mit einem DEA dauern wird.
Dies geht nicht so effizient, wenn \(L\) durch einen NEA gegeben ist (mehrere Möglichkeiten).

Bemerkung: Das Leerheitsproblem besteht darin, bei gegebener Sprache \(L\) zu entscheiden, ob \(L = \emptyset \) gilt. Das Leerheitsproblem ist für reguläre Sprachen entscheidbar.
In einem DEA kann man z. B. prüfen, ob es einen Weg vom Startzustand zu einem Endzustand gibt. Dies gilt genau dann, wenn \(L \not = \emptyset \).
Alternativ kann man (bei algorithmisch nicht akzeptablem Zeitaufwand) das Pumping-Lemma anwenden. Es gilt \(L \not = \emptyset \iff \exists _{w \in L}\; |w| < n\), wobei \(n\) das \(n\) aus dem Pumping-Lemma ist. Man prüft also alle Wörter der Länge \(< n\) auf Mitgliedschaft in \(L\) (Wortproblem).

Bemerkung: Das Endlichkeitsproblem besteht darin, bei gegebener Sprache \(L\) zu entscheiden, ob \(|L| < \infty \) gilt. Das Endlichkeitsproblem ist für reguläre Sprachen entscheidbar.
In einem DEA kann man z. B. prüfen, ob es einen Zyklus gibt, der vom Startzustand erreichbar ist und von dem aus ein Endzustand erreichbar ist. Dies gilt genau dann, wenn \(|L| = \infty \).
Alternativ kann man (bei algorithmisch nicht akzeptablem Zeitaufwand) das Pumping-Lemma anwenden. Es gilt \(|L| = \infty \iff \exists _{w \in L}\; n \le |w| < 2n\), wobei \(n\) das \(n\) aus dem Pumping-Lemma ist. Man prüft also alle Wörter der Länge \(\ge n\) und \(< 2n\) auf Mitgliedschaft in \(L\) (Wortproblem).

Beweis: „\(\Leftarrow \)“: Sei \(x \in L\) mit \(n \le |x| < 2n\). Dann gilt aufgrund des Pumping-Lemmas \(x = uvw\), d. h. \(uv^i w \in L\) für alle \(i \in \natural _0\). Somit ist \(L\) unendlich.

„\(\Rightarrow \)“: Sei \(|L| = \infty \) und entgegen der Behauptung habe das kürzeste Wort \(x \in L\) mit \(|x| \ge n\) eine Länge \(\ge 2n\). Aufgrund des Pumping-Lemmas gilt \(x = uvw\) mit \(uv^0 w = uw \in L\). Wegen \(|v| \le |uv| \le n\) gilt \(|uw| \ge n\). Damit ist aber \(x\) nicht minimal gewesen, ein Widerspruch.

Bemerkung: Das Äquivalenzproblem besteht darin, bei gegebenen Sprachen \(L_1\) und \(L_2\) zu entscheiden, ob \(L_1 = L_2\) gilt. Das Äquivalenzproblem ist für reguläre Sprachen entscheidbar.
Die Klasse \(\REG \) der regulären Sprachen ist effektiv abgeschlossen unter booleschen Operationen. Man kann also \(L_1 \vartriangle L_2\) bilden und auf Leerheit prüfen (Lösung des Leerheitsproblems).
Alternativ kann man die Minimalautomaten bilden und vergleichen.

Bemerkung: Das Schnittproblem besteht darin, bei gegebenen Sprachen \(L_1\) und \(L_2\) zu entscheiden, ob \(L_1 \cap L_2 = \emptyset \) gilt. Das Schnittproblem ist für reguläre Sprachen entscheidbar.
Die Klasse \(\REG \) der regulären Sprachen ist effektiv abgeschlossen unter booleschen Operationen (d. h. die Ergebnisse dieser Operationen können algorithmisch in endlicher Zeit bestimmt werden). Man kann also \(L_1 \cap L_2\) bilden und auf Leerheit prüfen (Lösung des Leerheitsproblems).