Berechenbarkeit und Komplexität – Komplexität

Komplexitätsklassen

Bemerkung: Zur Wiederholung wird noch einmal definiert, was eine Rechnung einer Turingmaschine ist.

Rechnung: Sei \(M\) eine Turingmaschine. Eine Rechnung von \(M\) bei Eingabe \(w\) ist eine Folge von Konfigurationen \((\alpha _0, \dotsc , \alpha _m)\) mit \(\alpha _0 = \Start (w)\) und \(\alpha _{i-1} \vdash \alpha _i\) für \(i = 1, \dotsc , m\). Die Berechnung ist erfolgreich, falls \(\alpha _m \in \Accept \).

Zeitbedarf: Der Zeitbedarf der Berechnung \((\alpha _0, \dotsc , \alpha _m)\) ist \(m\).
Der Zeitbedarf einer Turingmaschine \(M\) bei Eingabe \(w\) ist \(N \in \natural \), falls jede Berechnung von \(M\) bei Eingabe \(w\) Zeitbedarf \(\le N\) hat.

Platzbedarf: Der Platzbedarf der Berechnung \((\alpha _0, \dotsc , \alpha _m)\) ist \(\max _{i = 0, \dotsc , m} |\alpha _i|\).
Der Platzbedarf einer Turingmaschine \(M\) bei Eingabe \(w\) ist \(N \in \natural \), falls jede Berechnung von \(M\) bei Eingabe \(w\) Platzbedarf \(\le N\) hat.

Komplexitätsklassen: Seien \(t, s\colon \natural _0 \rightarrow \natural _0\) monoton steigende Funktionen.
Dann sind folgende Komplexitätsklassen definiert:

\(\DTIME (t) := \{L \subset \Sigma ^\ast \;|\; \text {es gibt eine det. TM } M \text { mit } L = L(M) \text {,}\)
\(\text {die auf allen Eingaben der Länge } n \text { Zeitbedarf } \max \{t(n), n + 1\} \text { hat}\}\)
\(\NTIME (t) := \{L \subset \Sigma ^\ast \;|\; \text {es gibt eine nicht-det. TM } M \text { mit } L = L(M) \text {,}\)
\(\text {die auf allen Eingaben der Länge } n \text { Zeitbedarf } \max \{t(n), n + 1\} \text { hat}\}\)
\(\DSPACE (s) := \{L \subset \Sigma ^\ast \;|\; \text {es gibt eine det. TM } M \text { mit } L = L(M) \text {,}\)
\(\text {die auf allen Eingaben der Länge } n \text { Platzbedarf } s(n) \text { hat}\}\)
\(\NSPACE (s) := \{L \subset \Sigma ^\ast \;|\; \text {es gibt eine nicht-det. TM } M \text { mit } L = L(M) \text {,}\)
\(\text {die auf allen Eingaben der Länge } n \text { Platzbedarf } s(n) \text { hat}\}\)

Für eine Komplexitätsklasse \(\C \) ist \(\Co \C := \{L \subset \Sigma ^\ast \;|\; \Sigma ^\ast \setminus L \in \C \}\) die Komplexitätsklasse aller Komplemente.

Bemerkung: Für \(\DTIME (t)\) und \(\NTIME (t)\) werden nur Funktionen \(t\colon \natural _0 \rightarrow \natural _0\) mit \(t(n) \ge n\) für alle \(n \in \natural \) betrachtet. Das erlaubt, die ganze Eingabe einzulesen (tatsächlich werden nämlich \(n + 1\) Schritte zugelassen).
Für \(\DSPACE (s)\) und \(\NSPACE (s)\) werden nur Funktionen \(s\colon \natural _0 \rightarrow \natural _0\) mit \(s \in \Omega (\log _2 n)\) betrachtet. Das erlaubt, eine Position \(i \in \{1, \dotsc , n\}\) auf dem Arbeitsband abzuspeichern (in binärer Darstellung).

gebräuchliche Komplexitätsklassen:

\(\L := \DSPACE (\log n)\)
\(\NL := \NSPACE (\log n)\)
\(\P := \bigcup _{k \in \natural } \DTIME (n^k)\)
\(\NP := \bigcup _{k \in \natural } \NTIME (n^k)\)
\(\PSPACE := \bigcup _{k \in \natural } \DSPACE (n^k) = \bigcup _{k \in \natural } \NSPACE (n^k)\)

Bemerkung: Die letzte Gleichung folgt aus dem Satz von Savitch, der weiter unten noch kommt.

Bemerkung: Es gelten die Beziehungen \(\L \subset \NL \subset \P \subset \NP \cap \Co \NP \subset \NP \subset \PSPACE \).
Bei keiner von den Inklusionen ist jedoch bekannt, ob sie echt ist oder nicht.
Außerdem gilt \(\NL \subsetneqq \bigcup _{k \in \natural } \DSPACE (\log _2^k n) = \bigcup _{k \in \natural } \NSPACE (\log _2^k n) \subsetneqq \DSPACE (n) \subset \)
\(\NSPACE (n) = \Co \NSPACE (n) \subsetneqq \PSPACE (n)\). Bei \(\DSPACE (n) \subset \NSPACE (n)\) ist ebenfalls nicht bekannt, ob diese Inklusion echt ist (1. LBA-Problem).

Beispiel:

Es gilt \(\{a^n b^n c^n \;|\; n \in \natural \} \in \L \): Eine TM, die die Sprache erkennt, muss sich nur speichern, wie viele \(a\)’s am Anfang gelesen wurden. Dafür wird nur logarithmischer Platz benötigt.
Außerdem gilt \(\{w \dollar w^R \;|\; w \in \Sigma ^\ast \}, \{w w^R \;|\; w \in \Sigma ^\ast \} \in \L \): Bei der ersten Sprache geht man zunächst zum Dollarzeichen in der Mitte, anschließend vergleicht man die Zeichen von der Mitte ausgehend (also zunächst die neben dem Dollar, dann die Nachbarn von diesen usw.). Dafür muss man die aktuelle Position (logarithmischer Platz) abspeichern).
Bei der zweiten Sprache ist das ein wenig schwieriger, aber hier prüft man zunächst, ob die Länge des Wortes ungerade ist, und läuft dann zur Mitte des Worts (dann verfährt man wie bei der anderen Sprache).
Es gilt \(\{w \dollar w \;|\; w \in \Sigma ^\ast \}, \{w w \;|\; w \in \Sigma ^\ast \} \in \L \): Hier geht man wie eben vor, nur dass die Buchstaben jeweils von vorne verglichen werden.
\(\{p \in 1\{0, 1\}^\ast \;|\; p \text { Binärdarstellung einer Primzahl}\}\) ist in \(\P \) (das wurde erst 2002 mit der Entdeckung des AKS-Primzahltests gezeigt, vorher war nur Mitgliedschaft in \(\NP \cap \Co \NP \) bekannt).

Algorithmische Probleme

Traveling Salesman Problem (TSP): Sei \(G = (V, E, \gamma )\) ein gerichteter, gewichteter Graph mit Knotenmenge \(V = \{1, \dotsc , n\}\), Kantenmenge \(E \subset V \times V\) und Kantengewichtungsfunktion \(\gamma \colon E \rightarrow \natural \) (d. h. \(\gamma (e) > 0\) für alle \(e \in E\)).
Ein Rundweg \(W\) ist eine Folge \(W = (x_0, \dotsc , x_n)\) mit \(x_0 = x_n\), \(x_i \not = x_j\) für \(i \not = j\) und \((x_{i-1}, x_i) \in E\) für \(i = 1, \dotsc , n\).
Die Kosten \(\gamma (W)\) des Rundwegs \(W\) sind \(\gamma (W) = \sum _{i=1}^n \gamma (x_{i-1}, x_i)\).
Dann sind folgende Varianten des Traveling Salesman Problems (TSP) definiert:

Entscheidungsvariante: Gegeben ist \(G\) und \(k \ge 0\).
Gefragt ist, ob ein Rundweg mit Kosten \(\le k\) exisiert.
Berechnungsvariante: Gegeben ist \(G\) und \(k \ge 0\).
Gesucht ist ein Rundweg \(W\) mit \(\gamma (W) \le k\), falls ein solcher existiert.
Optimierungsproblem: Gegeben ist \(G\).
Gesucht ist ein Rundweg \(W\) mit kleinstmöglichen Kosten
(d. h. \(\gamma (W) \le \gamma (W’)\) für alle Rundwege \(W’\)).

In allen drei Varianten ist die Eingabegröße bis auf einen konstanten Faktor gleich
\(|V| + \sum _{e \in E} \log _2 \gamma (e) \;(+ \log _2 k)\).

Satz (\(\text {(A)} \in \P \;\Rightarrow \; \text {(C)} \in \P \)): Ist (A) in Polynomialzeit lösbar, so auch (C).

Beweis:

Überprüfe, ob überhaupt ein Rundweg existiert. Dazu ruft man (A) mit \(k_{\max } = \sum _{e \in E} \gamma (e)\) auf, denn jeder Rundweg hat Kosten \(\le k_{\max }\). Im Folgenden wird die Existenz eines Rundwegs vorausgesetzt.
Berechne \(k_\opt = \min \{\gamma (W) \;|\; W \text { Rundweg}\}\) mittel binärer Suche:
\(\seteqnumber{0}{}{0}\)
\begin{align*} &k_{\min } := 0;\\ &\WHILE (k_{\min } < k_{\max })\; \DO \\ &\qquad k_\text {mitte} := k_{\min } + \left \lceil \frac {k_{\max } - k_{\min }}{2} \right \rceil ;\\ &\qquad \IF (\exists _{\text {Rundweg } W}\; \gamma (W) \le k_\text {mitte})\; \THEN k_{\max } := k_\text {mitte};\\ &\qquad \ELSE k_{\min } := k_\text {mitte} + 1;\\ &\qquad \END \IF \\ &\END \WHILE \\ &\RETURN k_{\min }; \end{align*} Die Anzahl der Durchläufe der While-Schleife ist beschränkt durch
\(\log _2 k_{\max } = \log _2 (\sum _{e \in E} \gamma (e)) \le \sum _{e \in E} \log _2 \gamma (e)\).
Berechne einen optimalen Rundweg mit \(E = \{e_1, \dotsc , e_m\}\) wie folgt:
\(\seteqnumber{0}{}{0}\)
\begin{align*} &G_0 := G;\\ &\FOR i := 1 \;\TO m \;\DO \\ &\qquad \IF (\exists _{\text {Rundweg } W \text { in } G_{i-1} \setminus \{e_i\}}\; \gamma (W) \le k_\opt )\; \THEN G_i := G_{i-1} \setminus \{e_i\};\\ &\qquad \ELSE G_i := G_{i-1};\\ &\qquad \END \IF \\ &\END \FOR \\ &\RETURN G_m; \end{align*}

Vertex Cover (VC): Sei \(G = (V, E)\) ein ungerichteter Graph.
Eine Teilmenge \(C \subset V\) heißt Knotenüberdeckung (oder Träger) von \(G\), falls für jede Kante \(\{u, v\} \in E\) gilt, dass \(\{u, v\} \cap C \not = \emptyset \).
Dann sind folgende Varianten von Vertex Cover (VC) definiert:

Entscheidungsvariante: Gegeben ist \(G\) und \(k \ge 0\).
Gefragt ist, ob eine Knotenüberdeckung von \(G\) mit \(|C| \le k\) existiert.
Berechnungsvariante: Gegeben ist \(G\) und \(k \ge 0\).
Gesucht ist eine Knotenüberdeckung \(C\) von \(G\) mit \(|C| \le k\), falls eine solche existiert.
Optimierungsproblem: Gegeben ist \(G\).
Gesucht ist eine kleinstmögliche Knotenüberdeckung \(C\) von \(G\)
(d. h. \(|C| \le |C’|\) für alle Knotenüberdeckungen \(C’\) von \(G\)).

Satz (\(\text {(A)} \in \P \;\Rightarrow \; \text {(C)} \in \P \)): Ist (A) in Polynomialzeit lösbar, so auch (C).

Grapherreichbarkeitsproblem (GAP): Das Grapherreichbarkeitsproblem (GAP) ist wie folgt definiert: Gegeben ist ein gerichteter Graph \(G = (V, E)\) und zwei Knoten \(s, t \in V\).
Gefragt ist, ob ein Pfad in \(G\) von \(s\) nach \(t\) existiert.

Bemerkung: GAP gehört zur Klasse \(\P \): GAP kann in Zeit \(\O (|V|)\) mittels Breitensuche gelöst werden (mit der einfachsten Dijkstra-Variante).
Es gilt sogar die Verschärfung, dass GAP zur Klasse \(\NL \) gehört (später wird \(\NL \subset \P \) gezeigt):

\begin{align*} &v := s;\\ &\WHILE (v \not = t) \DO \\ &\qquad \text {wähle einen Knoten } w \in V \text { mit } (v, w) \in E;\\ &\qquad v := w;\\ &\END \WHILE \\ &\RETURN \text {„es gibt einen Pfad in } G \text { von } s \text { nach } t \text {“}; \end{align*} Dieser nicht-det. Algorithmus kann man leicht auf einer nicht-det. TM implementieren. Der Algorithmus benötigt nur logarithmischen Platz, weil er sich zu jedem Zeitpunkt nur einen Knoten \(v \in V\) merken muss und dieser binär mit \(\log _2 n\) vielen Bits abgespeichert werden kann (wenn man \(V\) mit \(\{1, \dotsc , n\}\) identifiziert).

Bemerkung: Aus dem Satz von Savitch weiter unten folgt GAP \(\in \DSPACE (\log _2^2 n)\).
Man konnte 2004 zeigen, dass das Grapherreichbarkeitsproblem für ungerichtete Graphen
UGAP zur Klasse \(\L \) gehört.

Beziehungen zwischen den Komplexitätsklassen

Komplexitätsklassen in Landau-Notation:
Man definiert \(\DTIME (\O (f)) = \bigcup _{c \in \natural } \DTIME (c \cdot f) = \bigcup _{g \in \O (f)} \DTIME (g)\).
Analog sind \(\NTIME (\O (f))\), \(\DSPACE (\O (f))\) und \(\NSPACE (\O (f))\) definiert.

Satz (Beziehungen zwischen den Komplexitätsklassen): Sei \(f\colon \natural \rightarrow \natural \) eine Funktion.

Für \(\mathbf {X} \in \{\mathbf {D}, \mathbf {N}\}\) gilt \(\XSPACE (\O (f)) = \XSPACE _{\text {Einband}}(f)\)
(Bandreduktion mit Bandkompression).
Aus \(\exists _{\varepsilon > 0} \forall _{n \in \natural }\; f(n) \ge (1 + \varepsilon ) n\) folgt, dass \(\DTIME (\O (f)) = \DTIME (f)\)
(deterministische Zeitkompression).
Es gilt \(\NTIME (\O (f)) = \NTIME (f)\)
(nicht-deterministische Zeitkompression).
Es gilt \(\DTIME (n) \not = \DTIME (\O (n))\).

Bemerkung: Der folgende Satz stellt einen Bandreduktionssatz für Zeitkomplexitätsklassen dar.

Satz (Satz von Hennie und Stearns): Seien \(k \in \natural \) und \(f\colon \natural \rightarrow \natural \) mit \(\forall _{n \in \natural }\; f(n) \ge n\).
Dann gilt \(\DTIME _{k\text {-Band}}(f) \subset \DTIME _{2\text {-Band}}(f \cdot \log f)\).

Satz (\(\NTIME (f) \subset \DSPACE (f)\)):
Für \(f(n) \ge n\) gilt \(\DTIME (f) \subset \NTIME (f) \subset \DSPACE (f)\).

Beweis: Die erste Inklusion ist klar, zu zeigen ist also \(\NTIME (f) \subset \DSPACE (f)\).

Sei \(M = (Q, \Sigma , \Gamma , \delta , q_0, F, \Box )\) eine nicht-deterministische TM, die durch \(f(n)\) zeitbeschränkt ist. Für eine Eingabe \(w \in \Sigma ^\ast \) der Länge \(n\) kann man sich alle Rechnungen von \(M\) in einem Berechnungsraum \(T(M, w)\) vorstellen, dessen Knoten Konfigurationen sind. Die Wurzel ist gleich \(\Start (w)\) und die Kinder einer Konfiguration \(\alpha \) sind alle Konfigurationen \(\beta \) mit \(\alpha \vdash _M \beta \).
Diesen Baum \(T(M, w)\) untersucht man jetzt durch Breitensuche auf eine akzeptierende Konfiguration. Dabei merkt man sich nur die aktuelle Konfiguration und das Protokoll \(P \in \delta ^\ast \), mit dem man diese Konfiguration von der Wurzel \(\Start (w)\) erreichen kann.

Die Konfiguration zu merken benötigt den Platz \(f(n)\), da man nach \(f(n)\) vielen Schritten höchstens \(f(n)\) viele Felder des Bands beschrieben haben kann. Das Protokoll für eine bei \(\Start (w)\) beginnende Berechnung hat höchstens Länge \(f(n)\) und kann somit in Platz \(\O (f)\) gespeichert werden. Also ergibt sich ein gesamter Platzbedarf von \(\O (f)\).

Nach obigem Satz hat man also den Platzbedarf \(\DSPACE (\O (f)) = \DSPACE (f)\).

Satz (\(\NSPACE (f) \subset \DTIME (2^{\O (f)})\)):
Für \(f(n) \ge \log n\) gilt \(\DSPACE (f) \subset \NSPACE (f) \subset \DTIME (2^{\O (f)})\).

Beweis: Die erste Inklusion ist klar, zu zeigen ist also \(\NSPACE (f) \subset \DTIME (2^{\O (f)})\).

Sei \(M = (Q, \Sigma , \Gamma , \delta , q_0, F, \Box )\) eine nicht-deterministische TM, die durch \(f(n)\) platzbeschränkt ist. Es gibt eine Konstante \(c > 0\), die nur von \(M\) abhängt, sodass die für eine Eingabe \(w \in \Sigma ^\ast \) der Länge \(n\) die Anzahl der von \(\Start (w)\) erreichbaren Konfigurationen durch \(c^{f(n)}\) beschränkt ist. Hierbei ist \(f(n) \ge \log n\) wichtig.

Nun berechnet man die Menge \(R\) der von \(\Start (w)\) aus erreichbaren Konfigurationen wie folgt (Markierungsalgorithmus oder Flutalgorithmus):

\begin{align*} &R := \{\Start (w)\};\\ &\WHILE \exists _{\alpha , \beta \text { Konfigurationen}}\; \alpha \in R,\; \beta \notin R,\; \alpha \vdash _M \beta \;\DO \\ &\qquad R := R \cup \{\beta \};\\ &\END \WHILE \\ &\IF \Accept \cap R \not = \emptyset \;\THEN \RETURN M \text { akzeptiert } w; \end{align*} \(R\) enthält maximal \(c^{f(n)}\) Konfigurationen der Länge \(\le f(n)\). Der Test \(\exists _{\alpha , \beta \text { Konfigurationen}}\)
\(\alpha \in R,\; \beta \notin R,\; \alpha \vdash _M \beta \) kann somit in Zeit \(\O (c^{f(n)} \cdot c^{f(n)} \cdot f(n)) = \O (c^{2f(n)} \cdot f(n))\) implementiert werden. Der gesamte Zeitbedarf des Algorithmus beträgt also \(\O (c^{3f(n)} \cdot f(n)) \subset 2^{\O (f)}\).

Folgerung:

\(\L \subset \NL \subset \DTIME (2^{\O (\log n)}) = \P \)
\(\CS = \LBA = \NSPACE (n) \subset \DTIME (2^{\O (n)})\)
(mit \(\CS \) den kontextsensitiven und \(\LBA \) den durch LBAs akzeptierten Sprachen)
\(\DSPACE (n^2) \subset \DTIME (2^{\O (n^2)})\)

Der Satz von Savitch

platzkonstruierbar: Sei \(f\colon \natural \rightarrow \natural \) eine Funktion mit \(f \in \Omega (\log (n))\). Dann heißt \(f\) platzkonstruierbar, falls es eine deterministische Turingmaschine gibt, die bei Eingabe \(a^n\) (d. h. unäre Kodierung von \(n\)) genau \(f(n)\) Felder auf den Arbeitsbändern markiert, dann hält und bei der Berechnung diesen Platz nicht verlässt.

zeitkonstruierbar: Sei \(f\colon \natural \rightarrow \natural \) eine Funktion mit \(f \in \Omega (n)\). Dann heißt \(f\) zeitkonstruierbar, falls es eine deterministische Turingmaschine gibt, die bei Eingabe \(a^n\) (d. h. unäre Kodierung von \(n\)) nach genau \(f(n)\) Schritten hält.

Satz (Satz von  Savitch): Sei \(s \in \Omega (\log n)\). Dann gilt \(\NSPACE (s) \subset \DSPACE (s^2)\).

Beweis: Im Folgenden wird der Satz bewiesen unter der Annahme, dass \(s\) platzkonstruierbar ist. Der Satz ist auch für andere \(s\) beweisbar, allerdings ist dann der Beweis etwas schwieriger.

Sei also \(M\) eine durch \(s\) platzbeschränkte nicht-deterministische TM und \(w\) eine Eingabe für \(M\). Sei außerdem \(\text {Conf}(M, w)\) die Menge aller Konfigurationen \(\alpha \), sodass auf dem Eingabeband die Eingabe \(w\) steht und \(|\alpha | \le s(|w|)\). OBdA gebe es nur eine einzige akzeptierende Konfiguration \(\alpha _f\). Für \(\alpha , \beta \in \text {Conf}(M, w)\) und \(i \in \natural _0\) ist das Prädikat \(\text {Reach}(\alpha , \beta , i)\) definiert durch \(\text {Reach}(\alpha , \beta , i) \iff \exists _{k \le 2^i}\; \alpha \vdash _M^k \beta \). Aus der Beschreibung von \(M\) kann man explizit eine Konstante \(c\) bestimmen, sodass es \(\le 2^{c \cdot s(|w|)}\) Konfigurationen gibt, die nur \(s(|w|)\) viel Platz benötigen (insbesondere gilt \(\text {Conf}(M, w) \le 2^{c \cdot s(|w|)}\)). Damit gilt für alle Eingaben \(w\), dass \(w \in L(M) \iff \text {Reach}(\Start (w), \alpha _f, c \cdot s(|w|))\), denn keine Berechnung kann bei Eingabe \(w\) länger als \(2^{c \cdot s(|w|)}\) viel Zeit brauchen.

Das Ziel ist nun, das Prädikat \(\text {Reach}(\alpha , \beta , i)\) für \(\alpha , \beta \in \text {Conf}(M, w)\) und \(i \in \{0, \dotsc , c \cdot s(|w|)\}\) mit Platz \(\O (s^2)\) durch eine deterministische TM zu berechnen. Für \(i > 0\) verwendet man dabei das Rekursionsschema \(\exists _{\gamma \in \text {Conf}(M, w)}\; (\text {Reach}(\alpha , \gamma , i - 1) \land \text {Reach}(\gamma , \beta , i - 1))\). Das kann man in einen deterministischen Algorithmus umsetzen:

\begin{align*} &b := \FALSE ;\\ &\IF i = 0 \;\THEN \\ &\qquad b := ((\alpha = \beta ) \lor (\alpha \vdash _M \beta ));\\ &\ELSE \\ &\qquad \FORALL \gamma \in \text {Conf}(M, w) \;\DO \\ &\qquad \qquad \IF ((\lnot b) \land \text {Reach}(\alpha , \gamma , i - 1)) \;\THEN b := \text {Reach}(\gamma , \beta , i - 1);\\ &\qquad \END \FOR \\ &\END \IF \\ &\RETURN b; \end{align*}

Zu zeigen ist, dass ein Aufruf von \(\text {Reach}(\alpha , \beta , i)\) den Platz \(\O ((i + 1) s(|w|))\) benötigt. Man kann das induktiv zeigen: Für \(i = 0\) kann die Bedingung \(((\alpha = \beta ) \lor (\alpha \vdash _M \beta ))\) in \(\O (s(|w|))\) geprüft werden. Für \(i > 0\) benötigt der erste Aufruf \(\text {Reach}(\alpha , \gamma , i - 1)\) nach Induktionsvoraussetzung den Platz \(\O (i \cdot s(|w|))\). Das gleiche gilt auch für den zweiten Aufruf \(\text {Reach}(\gamma , \beta , i - 1)\), aber hier kann der Platz, der für den ersten Aufruf benötigt wurde, wiederverwendet werden. Zusätzlich benötigt man noch den Platz \(s(|w|)\), um die Konfiguration \(\gamma \) zu speichern. Also benötigt man insgesamt den Platz \(\O ((i + 1) s(|w|))\).

Um \(w \in L(M)\) zu entscheiden, kann man noch obiger Bemerkung \(\text {Reach}(\Start (w), \alpha _f, c \cdot s(|w|))\) testen. \(s(|w|)\) kann man berechnen, weil \(s\) nach Annahme platzkonstruierbar ist. Also ist der gesamte Platzbedarf \(\O (c \cdot s(|w|) \cdot s(|w|)) = \O (s(|w|)^2)\).

Bemerkung: Der Satz von Savitch besagt, dass eine nicht-deterministische platzbeschränkte TM unter quadratischem Mehraufwand deterministisch simuliert werden kann. Diese platzeffiziente Simulation wird durch einen extremen Mehraufwand an Rechenzeit realisiert.

Folgerung: GAP ist in \(\DSPACE (\log ^2 n)\), da GAP in \(\NL \) ist.
\(\PSPACE = \bigcup _{k \in \natural } \DSPACE (n^k) = \bigcup _{k \in \natural } \NSPACE (n^k)\),
da \(\NSPACE (n^k) \subset \DSPACE (n^{2k})\). Daher wurde auch so etwas wie \(\NPSPACE \) nicht definiert, weil das gleich \(\PSPACE \) wäre.

Hierarchiesätze

Satz (Platzhierarchiesatz):
Seien \(s_1, s_2\colon \natural \rightarrow \natural \) Funktionen mit \(s_2\) platzkonstruierbar, \(s_2 \in \Omega (\log n)\) und \(s_2 \notin \O (s_1)\).
Dann gilt \(\DSPACE (s_2) \not \subset \DSPACE (s_1)\), d. h. \(\DSPACE (s_2) \setminus \DSPACE (s_1) \not = \emptyset \).

Beweis: Wegen \(s_2 \notin \O (s_1)\) gilt \(\forall _{\varepsilon > 0} \exists _{n \in \natural }\; s_1(n) \le \varepsilon \cdot s_2(n)\).
Zu zeigen ist \(\exists _{L \in \DSPACE (s_2)}\; L \notin \DSPACE (s_1)\).

Wähle zunächst eine berechenbare binäre Kodierung von deterministischen TM, d. h. eine berechenbare Funktion \(x \mapsto M_x\), sodass zu jeder deterministischen TM \(M\) eine Kodierung \(x \in 1\{0, 1\}^\ast \) mit \(L(M) = L(M_x)\) existiert (jedes Wort \(x \in 1\{0, 1\}^\ast \) soll also als Kodierung einer TM \(M_x\) interpretiert werden können). Für beliebige \(x \in 1\{0, 1\}^\ast \) und \(k \in \natural \) gelte dabei \(M_{0^k x} := M_x\). Somit hat jede TM eine Kodierung in fast allen Längen. Im Folgenden wird eine TM \(M\) konstruiert mit \(L(M) \in \DSPACE (s_2) \setminus \DSPACE (s_1)\).

Dazu wird zunächst eine durch \(s_2\) platzbeschränkte TM \(M’\) konstruiert, die auf Eingabe \(y\) mit \(|y| = n\) wie folgt arbeitet: Zuerst markiert \(M’\) den Platz \(s_2(n)\) auf den Arbeitsbändern (geht, da \(s_2\) platzkonstruierbar). Sobald danach der markierte Platz verlassen wird, stoppt \(M’\) und akzeptiert \(y\) nicht – damit ist \(M’\) automatisch \(s_2\)-platzbeschränkt und es gilt \(L(M’) \in \DSPACE (s_2)\). Jetzt führt \(M’\) die Maschine \(M_y = M_x\) mit \(y =: 0^k x\) und \(x \in 1\{0, 1\}^\ast \) auf der Eingabe \(y\) aus. Danach akzeptiert \(M’\) die Eingabe \(y\) genau dann, wenn \(M_x\) die Eingabe \(y\) akzeptiert (und dabei der markierte Platz nicht verlassen wird).

Da deterministische Platzklassen unter Komplement effektiv abgeschlossen sind, kann man eine TM \(M\) konstruieren mit \(L(M) = \{0, 1\}^\ast \setminus L(M’) \in \DSPACE (s_2)\). Angenommen, es gelte \(L(M) \in \DSPACE (s_1)\). Es ist \(L(M) = L(M_x)\) für ein \(x \in 1\{0, 1\}^\ast \). Sei \(s_x\) die Platzfunktion von \(M_x\). Wegen \(L(M) \in \DSPACE (s_1)\) gilt \(\forall _{n \in \natural }\; s_x(n) \le s_1(n)\). Es gibt eine Konstante \(c_x\), sodass die Simulation von \(M_x\) auf Eingabe \(y\) mit \(|y| = n\) den Platz \(c_x \cdot s_x(n)\) kostet. Wähle \(\varepsilon > 0\) mit \(c_x \cdot \varepsilon < 1\). Wenn man \(n \in \natural \) mit \(n > |x|\) und \(s_1(n) \le \varepsilon \cdot s_2(n)\) wählt (geht nach der Voraussetzung \(s_1 \notin \Omega (s_2)\)) und \(y := 0^k x\) mit \(|y| := n\) setzt, dann gilt \(c_x \cdot s_1(n) \le c_x \cdot \varepsilon \cdot s_2(n) < s_2(n)\), also reicht der Platz \(s_2(n)\) aus.

Es gilt daher \(y \in L(M) \iff y \notin L(M’) \iff y \notin L(M_x) = L(M)\), ein Widerspruch (für die zweite Äquivalenz benötigt man, dass der Platz \(s_2(n)\) ausreicht).

Folgerung: Aus dem Platzhierarchiesatz folgt \(\L \subsetneqq \DSPACE (\log ^2 n) \subsetneqq \DSPACE (n)\)
\(\subset \NSPACE (n) \subsetneqq \DSPACE (n^{2.1}) \subsetneqq \PSPACE \).

Satz (Zeithierarchiesatz):
Seien \(t_1, t_2\colon \natural \rightarrow \natural \) Funktionen mit \(t_2\) zeitkonstruierbar, \(t_2 \in \Omega (n \cdot \log n)\) und \(t_2 \notin \O (t_1 \cdot \log t_1)\).
Dann gilt \(\DTIME (t_2) \not \subset \DTIME (t_1)\), d. h. \(\DTIME (t_2) \setminus \DTIME (t_1) \not = \emptyset \).

Folgerung: Aus dem Zeithierarchiesatz folgt \(\DTIME (\O (n)) \subsetneqq \DTIME (\O (n^2)) \subsetneqq \P \)
\(\subsetneqq \DTIME (\O (2^n) \subsetneqq \DTIME (\O ((2 + \varepsilon )^n))\).

Lückensatz von Borodin

Bemerkung: Der Lückensatz von Borodin besagt, dass es in der Hierarchie von Komplexitätsklassen beliebig große Lücken gibt. Egal wie groß \(r\) im folgenden Satz gewählt wird, es gibt immer eine Funktion \(s\), sodass vom Übergang von \(\DTIME (s)\) zu \(\DTIME (r \circ s)\) keine neuen Elemente dazukommen, d. h. es gibt eine Lücke zwischen \(\DTIME (s)\) und \(\DTIME (r \circ s)\). \(s\) kann nicht zeitkonstruierbar sein, denn sonst wäre das ein Widerspruch zum Zeithierarchiesatz.

Satz (Lückensatz von  Borodin):
Sei \(r\colon \natural \rightarrow \natural \) eine überall definierte, berechenbare Funktion mit \(\forall _{n \in \natural }\; r(n) \ge n\).
Dann gibt es effektiv eine überall definierte, berechenbare Funktion \(s\colon \natural \rightarrow \natural \) mit
\(\forall _{n \in \natural }\; s(n) \ge n + 1\) und \(\DTIME (s) = \DTIME (r \circ s)\).

Beweis: Seien \(M_1, M_2\) eine Aufzählung aller deterministischen TM und \(t_k(n) \in \natural \cup \{\infty \}\) der tatsächliche maximale Zeitbedarf einer Rechnung von \(M_k\) auf einer Eingabe der Länge \(\le n\). Betrachte die Menge \(N_n := \{t_k(n) \;|\; 1 \le k \le n\}\). Diese Menge ist endlich, denn \(|N_n| \le n\). Also gibt es für alle \(n \in \natural \) ein \(s(n)\) mit \(N_n \cap [s(n), r(s(n))] = \emptyset \).

Einen passenden, berechenbaren Wert \(s(n)\) kann man durch folgenden Algorithmus ermitteln:

\begin{align*} &s := n + 1;\\ &\DO \\ &\qquad s := s + 1;\\ &\UNTIL \forall _{k \le n}\; t_k(n) \notin [s, r(s)]\\ &\RETURN s; \end{align*} Somit ist \(s(n)\) überall definiert, berechenbar und es gilt \(\forall _{n \in \natural }\; s(n) \ge n + 1\).

Es gilt \(\DTIME (s) = \DTIME (r \circ s)\):
„\(\subset \)“: Wegen \(\forall _{n \in \natural }\; r(n) \ge n\) gilt \(\DTIME (s) \subset \DTIME (r \circ s)\).
„\(\supset \)“: Sei \(L \in \DTIME (r \circ s)\). Dann gibt es ein \(k \in \natural \) mit \(L = L(M_k)\) und \(M_k\) einer durch \(r \circ s\) zeitbeschränkten, deterministischen TM. Es gilt \(\forall _{n \in \natural }\; t_k(n) \le r(s(n))\), denn es ist n. V. \(L(M_k) \in \DTIME (r \circ s)\). Wegen \(t_k(n) \in N_n\) für \(n \ge k\) und \(N_n \cap [s(n), r(s(n))] = \emptyset \) gilt also \(\forall _{n \ge k}\; t_k(n) < s(n)\). Es gilt daher \(t_k(n) \le s(n)\) für fast alle \(n \in \natural \). Für die endlich vielen Ausnahmen lässt sich eine zweite TM konstruieren, die diese Ausnahmen abfängt, d. h. es gibt ein \(k’ \in \natural \) mit \(L(M_k) = L(M_{k’})\) und \(\forall _{n \in \natural }\; t_{k’}(n) \le s(n)\).
Somit gilt \(L = L(M_k) = L(M_{k’}) \in \DTIME (s)\).

Der Satz von Immerman und Szelepcsényi

Bemerkung: Die Klassen \(\DTIME \) und \(\DSPACE \) sind unter Komplement abgeschlossen. Ob dies auch für \(\NSPACE \) gilt, war lange Zeit offen. 1964 stellte Kuroda die Frage, ob die kontextsensitiven Sprachen unter Komplement abgeschlossen sind (2. LBA-Problem). Äquivalent dazu ist \(\NSPACE (n) = \Co \NSPACE (n)\). Diese Frage konnte nach 20 Jahren von Immerman und Szelepcsényi positiv beantwortet werden.

Satz (Satz von Immerman und Szelepcsényi):
Sei \(f \in \Omega (\log n)\). Dann gilt \(\NSPACE (f) = \Co \NSPACE (f)\).

Polynomialzeit-Reduktionen

Bemerkung: Zur Wiederholung wird noch einmal die Definition einer Reduktion angegeben.

Reduktion: Seien \(L \subset \Sigma ^\ast \) und \(L’ \subset \Sigma ’^\ast \) Sprachen. Dann heißt eine überall definierte, berechenbare Abbildung \(f\colon \Sigma ^\ast \rightarrow \Sigma ’^\ast \) Reduktion von \(L\) auf \(L’\), falls \(x \in L \iff f(x) \in L’\) für alle \(x \in \Sigma ^\ast \). \(A\) heißt auf \(B\) reduzierbar (\(L \le L’\)), falls es eine Reduktion von \(L\) auf \(L’\) gibt.

Polynomialzeit-Reduktion: Eine Reduktion \(f\colon \Sigma ^\ast \rightarrow \Sigma ’^\ast \) von \(L\) auf \(L’\) heißt
Polynomialzeit-Reduktion, falls sich \(f\) durch eine deterministische polynomialzeit-beschränkte Turingmaschine berechnen lässt.

Satz (Übertragbarkeit bei Polynomialzeit-Reduktionen): Seien \(L \subset \Sigma ^\ast \) und \(L’ \subset \Sigma ’^\ast \) Sprachen, sodass es eine Polynomialzeit-Reduktion von \(L\) auf \(L’\) gibt. Wenn \(L’ \in \P \) gilt, dann auch \(L \in \P \).

Beweis: Seien \(L’ \in \DTIME (n^k)\) und \(f\) eine Polynomialzeit-Reduktion, die in Zeit \(n^\ell \) berechnet werden kann. Ist \(x \in \Sigma ^\ast \) eine Eingabe der Länge \(n\), dann kann \(f(x)\) in Zeit \(n^\ell \) berechnet werden. Anschließend wird \(f(x) \in L’\) überprüft, dies geht in Zeit \((n^\ell )^k = n^{k \cdot \ell }\), weil \(f(x)\) höchstens Länge \(n^\ell \) haben kann. Wegen \(x \in L \iff f(x) \in L’\) wurde \(x \in L\) in polynomialer Zeit \(n^\ell + n^{k \cdot \ell }\) überprüft, d. h. \(L \in \P \).

Matching und Fluss als Beispiel für eine Polynomialzeit-Reduktion

bipartiter Graph: \(G = (A, B, E)\) heißt bipartiter Graph, wenn \(E \subset A \times B\) und \(A \cap B = \emptyset \).

Matching: Sei \(G = (A, B, E)\) ein bipartiter Graph. Ein Matching \(M \subset E\) eine Teilmenge von \(E\), sodass keine zwei verschiedene Kanten aus \(M\) denselben Endknoten haben.

Bemerkung: Das Problem, ein Matching maximaler Größe zu berechnen, kann sehr effizient auf die Berechnung eines maximalen Flusses in einem Netzwerk reduziert werden.

Netzwerk: Ein Netzwerk ist ein \(5\)-Tupel \(N = (V, E, s, t, c)\), wobei

\((V, E)\) ein gerichteter Graph (d. h. \(E \subset V \times V\)) ist,
\(s, t \in V\) mit \(s \not = t\) (Quelle und Senke) gilt und
\(c\colon E \rightarrow \natural \) jeder Kante \(e \in E\) eine Kapazität \(c(e) > 0\) zuordnet.

Fluss: Ein Fluss \(F\) ist eine Abbildung \(F\colon E \rightarrow \natural _0\) mit

\(\forall _{v \in V \setminus \{s, t\}}\; \sum _{(x, v) \in E} F(x, v) = \sum _{(v, y) \in E} F(v, y)\) (Flusserhaltung)
\(\forall _{e \in E}\; F(e) \le c(e)\) (Kapazitätskonformität)

\(|F| := \sum _{(s, y) \in E} F(s, y)\) ist die Größe des Flusses \(F\).

Bemerkung: Ein Fluss maximaler Größe kann in polynomialer Zeit mittels des Algorithmus von Ford-Fulkerson (Max-Flow-Min-Cut-Theorem) berechnet werden.

Satz (Reduktion von Matching auf Fluss): Das Problem, ein maximales Matching zu berechnen, kann auf das Problem, einen maximalen Fluss zu berechnen, reduziert werden.
Genauer gilt: Sei \(G = (A, B, E)\) ein bipartiter Graph. Definiere ein Netzwerk \(N := (V, E’, s, t, c)\) mit \(V := A \cup B \cup \{s, t\}\) (\(s, t \notin A \cup B\)), \(E’ := E \cup \{(s, a) \;|\; a \in A\} \cup \{(b, t) \;|\; b \in B\}\) und \(c(x, y) := 1\) für alle \((x, y) \in E’\). Ist nun \(F\colon E’ \rightarrow \natural _0\) ein Fluss maximaler Größe in \(N\), dann ist \(M := \{e \in E \;|\; F(e) = 1\}\) ein Matching maximaler Größe in \(G\).

Logspace-Reduktionen

Bemerkung: Viele in der Praxis wichtige Reduktionen lassen sich in logarithmischem Platz berechnen. Deswegen definiert man Logspace-Reduktionen.

Logspace-Transducer: Ein logarithmisch platzbeschränkter Transduktor
(Logspace-Transducer) ist eine deterministische Turingmaschine \(M\) mit

einem Eingabeband, von dem nur gelesen werden kann,
einem logarithmisch in der Eingabelänge platzbeschränkten Arbeitsband und
einem getrennten Ausgabeband, auf das nur geschrieben werden kann (und der Schreibkopf bewegt sich nur nach rechts).

in Logspace berechenbar: Eine Abbildung \(f\colon \Sigma ^\ast \rightarrow \Sigma ’^\ast \) heißt in Logspace berechenbar, falls es einen Logspace-Transducer \(M\) gibt, sodass für alle \(x \in \Sigma ^\ast \) der Transduktor \(M\) bei Eingabe \(x\) anhält und \(f(x) \in \Sigma ’^\ast \) auf dem Ausgabeband steht.

Logspace-Reduktion: Seien \(L \subset \Sigma ^\ast \) und \(L’ \subset \Sigma ’^\ast \) Sprachen. Dann heißt eine überall definierte, in Logspace berechenbare Abbildung \(f\colon \Sigma ^\ast \rightarrow \Sigma ’^\ast \) Logspace-Reduktion von \(L\) auf \(L’\), falls \(x \in L \iff f(x) \in L’\) für alle \(x \in \Sigma ^\ast \). \(L\) heißt auf \(L’\) in Logspace reduzierbar (\(L \le _m^{\log } L’\)), falls es eine Logspace-Reduktion von \(L\) auf \(L’\) gibt.

Bemerkung: Der Index \(m\) steht für many-one, was bedeutet, dass mehrere \(w \in \Sigma ^\ast \) auf ein Wort in \(\Sigma ’^\ast \) abgebildet werden können.
Jede in Logspace berechenbare Abbildung \(f\colon \Sigma ^\ast \rightarrow \Sigma ’^\ast \) ist in polynomialer Zeit berechenbar.

Bemerkung: Eine analoge Aussage der folgenden gilt trivialerweise für Polynomialzeit-Reduktionen. Für Logspace-Reduktionen muss man etwas arbeiten, denn man kann das Ergebnis der ersten Reduktion nicht einfach auf das Arbeitsband schreiben (nicht in logarithmischem Platz).

Satz (\(\le _m^{\log }\) ist transitiv): Seien \(L \subset \Sigma ^\ast \), \(L’ \subset \Sigma ’^\ast \) und \(L’’ \subset \Sigma ’’^\ast \) mit \(L \le _m^{\log } L’ \le _m^{\log } L’’\).
Dann gilt \(L \le _m^{\log } L’’\).

Beweis: Seien \(f\colon \Sigma ^\ast \rightarrow \Sigma ’^\ast \) bzw. \(g\colon \Sigma ’^\ast \rightarrow \Sigma ’’^\ast \) Logspace-Reduktionen von \(L\) auf \(L’\) bzw. von \(L’\) auf \(L’’\) und \(w \in \Sigma ^\ast \) eine Eingabe mit \(|w| = n\). Dann wird \(g(f(w))\) in Platz \(\O (\log n)\) wie folgt berechnet:

Starte den Logspace-Transducer zur Berechnung von \(g\) (ohne \(f(w)\) vorher zu berechnen).
Wenn während der Berechnung von \(g\) das \(i\)-te Bit von \(f(w)\) benötigt wird, dann wird der Logspace-Transducer zur Berechnung von \(f(w)\) neugestartet, bis schließlich das \(i\)-te Bit von \(f(w)\) ausgegeben ist. Die Bits \(1, \dotsc , i - 1\) von \(f(w)\) werden dabei nicht ausgegeben. Dazu wird ein Binärzähler jedesmal genau dann inkrementiert, wenn der Logspace-Transducer für \(f\) ein Ausgabebit produziert.

Der Binärzähler benötigt Platz \(\O (\log |f(w)|) = \O (\log n)\), denn es gilt \(|f(w)| \le n^k\) für eine Konstante \(k\). Also ist die Komposition \(g \circ f\) eine Logspace-Reduktion von \(L\) auf \(L’’\).

Zusatz: Aussagenlogik

aussagenlogische Formel: Sei \(\Sigma _0 := \{\lnot , \land , \lor , \Rightarrow , \Leftrightarrow , 0, 1, (, ), x\}\). Dann ist \(\mathbb {A} \subset \Sigma _0^\ast \) die Menge aller aussagenlogischen Formeln über der Variablenmenge \(V := x1\{0, 1\}^\ast \) intuitiv definiert.

Bemerkung: \(\mathbb {A} \subset \Sigma _0^\ast \) ist deterministisch kontextfrei und gehört damit zu \(\DTIME (n)\).

erfüllbare Formel: Eine aussagenlogische Formel \(F\) heißt erfüllbar, falls es eine Belegung \(\mathcal {B}\colon \Var (F) \rightarrow \{\TRUE , \FALSE \}\) der in \(F\) vorkommenden Variablen \(\Var (F)\) mit Wahrheitswerten so gibt, sodass sich \(F\) zu \(\TRUE \) auswertet.

\(\SAT \): Das Problem \(\SAT \) ist definiert durch \(\SAT := \{F \in \mathbb {A} \;|\; F \text { erfüllbar}\}\).

Literal: Ein Literal ist eine aussagenlogische Variable oder die Negation einer aussagenlogischen Variablen. Statt \(\lnot x\) kann man auch \(\overline {x}\) schreiben. Außerdem sei \(\overline {\overline {x}} := x\).

Konjunktion: Die Konjunktion von zwei aussagenlogischen Formeln \(A\) und \(B\) ist \(A \land B\).

Disjunktion: Die Disjunktion von zwei aussagenlogischen Formeln \(A\) und \(B\) ist \(A \lor B\).

Klausel: Eine Klausel ist eine Disjunktion \(A_1 \lor \dotsb \lor A_n\) von Literalen \(A_1, \dotsc , A_n\).

\(\DNF \) und \(\KNF \): Die Probleme \(\DNF \) und \(\KNF \) sind definiert durch
\(\DNF := \{F \in \mathbb {A} \;|\; F \text { ist Disjunktion von Konjunktionen von Literalen}\}\) und
\(\KNF := \{F \in \mathbb {A} \;|\; F \text { ist Konjunktion von Disjunktionen von Literalen}\}\).

\(\kKNF {k}\) und \(\kSAT {k}\): Die Probleme \(\kKNF {k}\) und \(\kSAT {k}\) sind definiert durch
\(\kKNF {k} := \{F \in \KNF \;|\; \text {jede Klausel in } F \text { enthält genau } k \text { Literale}\}\) und
\(\kSAT {k} := \kKNF {k} \cap \SAT \).

Satz (Umformung in Normalform): Für jede aussagenlogische Formel \(F\) gibt es äquivalente Formeln \(\DNF (F) \in \DNF \) und \(\KNF (F) \in \KNF \).

Beweis: Für die Konstruktion von \(\DNF (F)\) geht man die Wahrheitstabelle von \(F\) zeilenweise durch. Bei jeder Zeile (also Belegung), für die die Formel wahr wird, erstellt man einen Ausdruck, der genau für diese Belegung wahr wird (z. B. wenn \(F\) für \(A = B = \FALSE \) und \(C = \TRUE \) wahr wird, ist der zugehörige Ausdruck \(\overline {A} \land \overline {B} \land C\)). All diese Klauseln werden nachher durch Disjunktionen zusammengefasst, womit man \(\DNF (F)\) erhält.

\(\KNF (F)\) erhält man analog, indem man die Zeilen betrachtet, für die die Formel falsch wird, und für diese Zeilen die Negation der entsprechenden Klausel aufstellt (z. B. wenn \(F\) für \(A = \TRUE \) und \(B = C = \FALSE \) falsch wird, dann ist die zugehörige Klausel \(\overline {A} \lor B \lor C\)). Diese Klauseln werden dann durch Konjunktionen verbunden, womit man \(\KNF (F)\) erhält.

Horn-Formel: Eine Horn-Klausel ist eine Klausel mit höchstens einem positiven Literal. Eine Horn-Formel ist eine Formel in KNF, bei der jeder Disjunktionsterm eine Horn-Klausel ist.

\(\HORN \) und \(\HORNSAT \): Die Probleme \(\HORN \) und \(\HORNSAT \) sind definiert durch
\(\HORN := \{F \in \KNF \;|\; F \text { Horn-Formel}\}\) und \(\HORNSAT := \HORN \cap \SAT \).

Schwierige und vollständige Probleme

schwierig: Sei \(\C \) eine Komplexitätsklasse. Dann heißt \(L \subset \Sigma ^\ast \) schwierig für \(\C \) oder
\(\C \)-schwierig (bzgl. Logspace-Reduktionen), falls \(\forall _{K \in \C }\; K \le _m^{\log } L\).

vollständig: Sei \(\C \) eine Komplexitätsklasse. Dann heißt \(L \subset \Sigma ^\ast \) vollständig für \(\C \) oder \(\C \)-vollständig (bzgl. Logspace-Reduktionen), falls \(L\) \(\C \)-schwierig ist und \(L \in \C \) gilt.

Satz (Abschluss unter Komplement): Wenn die Komplexitätsklasse \(\C \) unter Komplement abgeschlossen ist (d. h. \(\overline {L} \in \C \) für alle \(L \in \C \)), dann ist eine Sprache \(K \in \Sigma ^\ast \) \(\C \)-vollständig genau dann, wenn \(\overline {K}\) \(\C \)-vollständig ist.

Beweis: Sei \(K \in \Sigma ^\ast \). Dann gilt \(K \in \C \) genau dann, wenn \(\overline {K} \in \C \) gilt. Außerdem gilt \(K\) \(\C \)-schwierig genau dann, wenn für alle \(L \in \C \) gilt, dass \(L \le _m^{\log } K\). Das ist äquivalent zu \(\overline {L} \le _m^{\log } K\) für alle \(\overline {L} \in \C \), da \(\C \) unter Komplement abgeschlossen ist. Das gilt genau dann, wenn \(L \le _m^{\log } \overline {K}\) für alle \(L \in \C \) (durch Komplementbildung auf beiden Seiten der Reduktion). Also ist \(K\) \(\C \)-vollständig genau dann, wenn \(\overline {K}\) \(\C \)-vollständig ist.

NL-vollständige Probleme

Satz (GAP \(\NL \)-vollständig): Das Grapherreichbarkeitsproblem GAP ist \(\NL \)-vollständig.

Beweis: \(\text {GAP} \in \NL \) wurde bereits gezeigt.

Seien \(L \in \NL \) und \(M\) eine nicht-deterministische logarithmisch platzbeschränkte Turingmaschine mit \(L(M) = L\). Für eine Eingabe \(w \in \Sigma ^\ast \) wird eine Reduktion \(f\) definiert durch \(f(w) := (G, s, t)\) mit

\(G := (V, E)\) der gerichtete Graph mit \(V := \{\alpha \;|\; \alpha \text { Konfiguration von } M \text { bei Eingabe } w,\)
\(|\alpha | \le \log |w|\}\) und \(E := \{(\alpha , \beta ) \;|\; \alpha , \beta \in V,\; \alpha \vdash _M \beta \}\),
\(s := \Start (w)\) und
\(t := \text {die oBdA eindeutige akzeptierende Konfiguration von } M\).

Offensichtlich gilt \(w \in L(M) \iff \text {in } G \text { gibt es einen gerichteten Pfad von } s \text { nach } t\). Also ist \(f\) eine Reduktion von \(L\) auf GAP, die man in logarithmischem Platz berechnen kann.

Satz (\(\kSAT {2}\) \(\NL \)-vollständig): \(\kSAT {2}\) ist \(\NL \)-vollständig.

Beweis: Aufgrund des Satzes von Immerman und Szelepcsényi genügt es, die \(\NL \)-Vollständigkeit von \(2\text {-NSAT} := \kKNF {2} \setminus \SAT \) zu zeigen, denn es gilt \(\overline {2\text {-NSAT}} = \kSAT {2}\) (Komplement bzgl. \(\kKNF {2}\)) und \(\NL \) ist unter Komplement abgeschlossen (nach dem Satz von Immerman und Szelepcsényi).

\(2\text {-NSAT}\) ist \(\NL \)-schwierig: Dies kann man durch Reduktion \(\text {GAP} \le _m^{\log } 2\text {-NSAT}\) des Grapherreichbarkeitsproblems GAP auf \(2\text {-NSAT}\) zeigen. Sei \(G = (V, E)\) ein gerichteter Graph und \(s, t \in V\). Für jeden Knoten \(u \in V\) erstellt man eine logische Variable und für jede Kante \((u, v) \in E\) die Implikation \(u \Rightarrow v\), also die Klausel \(\lnot u \lor v\). Außerdem werden die Klauseln \(s\) und \(\lnot t\) hinzugefügt. Die so durch Konjunktionen zusammengesetzte Formel ist unerfüllbar, wenn in \(G\) ein Weg von \(s\) nach \(t\) existiert. Wenn kein Weg existiert, dann können alle Variablen, deren zugehörige Knoten von \(s\) aus erreichbar sind, zu \(\TRUE \) und alle anderen zu \(\FALSE \) gesetzt werden. Dies definiert eine die Formel erfüllende Belegung. Also ist die Formel erfüllbar genau dann, wenn in \(G\) ein Weg von \(s\) nach \(t\) existiert. Man hat also eine Reduktion von GAP auf \(2\text {-NSAT}\) gefunden. GAP ist \(\NL \)-schwierig, also ist auch \(2\text {-NSAT}\) ist \(\NL \)-schwierig.

\(2\text {-NSAT}\) liegt in \(\NL \): Gegeben sei eine Formel \(\phi \in \kKNF {2}\) in den Variablen \(x_1, \dotsc , x_n\). Nun wird ein Graph mit Knotenmenge \(V := \{x_1, \dotsc , x_n, \overline {x_1}, \dotsc , \overline {x_n}\}\) konstruiert. Jede Klausel \(\alpha \lor \beta \) kann als Implikation interpretiert werden, denn es gilt \((\alpha \lor \beta ) \iff ((\overline {\alpha } \Rightarrow \beta ) \lor (\overline {\beta } \Rightarrow \alpha ))\). Deswegen werden zwei Kanten \(\overline {\alpha } \rightarrow \beta \) und \(\overline {\beta } \rightarrow \alpha \) eingefügt. Behauptung: Es gibt genau dann einen Knoten \(x\) und Pfade \(x \rightarrow ^\ast \overline {x}\) sowie \(\overline {x} \rightarrow ^\ast x\), wenn \(\phi \) unerfüllbar ist. Somit kann die Nichterfüllbarkeit von \(\phi \) mithilfe des \(\NL \)-Algorithmus für Grapherreichbarkeit überprüft werden.

Es reicht also, die Behauptung zu zeigen. Das kann man wie folgt beweisen:

„\(\Rightarrow \)“: Wenn es einen Knoten \(x\) und Pfade \(x \rightarrow ^\ast \overline {x}\) sowie \(\overline {x} \rightarrow ^\ast x\) gibt, dann gelten die Implikationen \(x \Rightarrow \overline {x}\) und \(\overline {x} \Rightarrow x\), d. h. weder \(x\) noch \(\overline {x}\) kann wahr sein. \(\phi \) ist also nicht erfüllbar.

„\(\Leftarrow \)“: Für jeden Knoten \(x\) existiere nun höchstens einer der Pfade \(x \rightarrow ^\ast \overline {x}\) oder \(\overline {x} \rightarrow ^\ast x\). Man kann annehmen, dass genau einer der Pfade existiert, ansonsten füge die Kante \(x \rightarrow \overline {x}\) hinzu.
Dies erzeugt keinen neuen Kreis: Angenommen, durch die neue Kante \(x \rightarrow \overline {x}\) wurde ein Kreis mit \(\alpha \) und \(\overline {\alpha }\) erzeugt. Dann benutzt dieser Kreis die Kante \(x \rightarrow \overline {x}\), d. h. es gilt \(\alpha \rightarrow ^\ast x \rightarrow \overline {x} \rightarrow ^\ast \overline {\alpha } \rightarrow ^\ast \alpha \rightarrow ^\ast x\) oder \(\alpha \rightarrow ^\ast x \rightarrow \overline {x} \rightarrow ^\ast \overline {\alpha } \rightarrow ^\ast x \rightarrow \overline {x} \rightarrow ^\ast \alpha \) (\(\rightarrow ^\ast \) benutzt nur alte Kanten). Damit hätte der ursprüngliche Graph einen Pfad \(\overline {x} \rightarrow ^\ast x\), im Widerspruch zur Annahme. Somit kann immer eine Kante neu hinzugefügt werden, sodass immer genau einer der Pfade \(x \rightarrow ^\ast \overline {x}\) oder \(\overline {x} \rightarrow ^\ast x\) existiert.
Nun wird \(x\) auf \(\TRUE \) gesetzt, wenn \(\overline {x} \rightarrow ^\ast x\) existiert und \(\FALSE \) sonst. Diese Belegung ist erfüllend: Sei \(\alpha \lor \beta \) eine beliebige Klausel mit \(\beta = \FALSE \) (sonst ist \(\alpha \lor \beta \) ohnehin schon wahr). Dann gibt es nach Konstruktion einen Pfad \(\beta \rightarrow ^\ast \overline {\beta }\). Außerdem gibt es wegen der Klausel \(\alpha \lor \beta \) die Kanten \(\overline {\alpha } \rightarrow \beta \) und \(\overline {\beta } \rightarrow \alpha \). Somit erhält man den Weg \(\overline {\alpha } \rightarrow \beta \rightarrow ^\ast \overline {\beta } \rightarrow \alpha \). Also gilt \(\alpha = \TRUE \) und die Klausel ist erfüllt.
Es sind also alle Klauseln von \(\phi \) erfüllt und damit \(\phi \) selbst.

NP-vollständige Probleme

Satz (\(\NP \)-vollständige Sprache): Wenn es eine \(\NP \)-vollständige Sprache \(L\) gibt, dann gibt es eine \(\NP \)-vollständige Sprache \(L’ \in \NTIME (n)\).

Beweis: Für eine Eingabe \(w \in \Sigma ^\ast \) der Länge \(|w| = n\) produziert eine Turingmaschine zunächst \(w\dollar ^{n^k}\) in der Zeit \(n^k\) mit \(\dollar \notin \Sigma \) (\(n \mapsto n^k\) ist zeitkonstruierbar).

Setze nun \(L’ := \{w\dollar ^{|w|^k} \;|\; w \in L\}\). Es gilt \(L \le _m^{\log } L’\) durch \(f\colon \Sigma ^\ast \rightarrow (\Sigma \cup \{\dollar \})^\ast \), \(f(w) := w\dollar ^{|w|^k}\), d. h. \(L’\) ist \(\NP \)-vollständig, weil \(L\) auch \(\NP \)-vollständig ist. Es gilt \(L’ \in \NTIME (n)\).

Satz (Satz von Cook (und Levin)): \(\SAT \) ist \(\NP \)-vollständig.

Beweis: Es gilt \(\SAT \in \NP \): Für \(F \in \Sigma _0^\ast \) überprüft man \(F \in \SAT ?\), indem man zunächst in Zeit \(\O (|F|)\) prüft, ob \(F\) überhaupt eine gültige aussagenlogische Formel ist, also \(F \in \A \) (geht, weil \(\A \) deterministisch kontextfrei ist, d. h. \(A \in \DTIME (n)\)). In diesem Fall rät man eine Belegung \(\B \colon \Var (F) \rightarrow {\true , \false }\) der in \(F\) vorkommenden Variablen \(\Var (F)\) mit Wahrheitswerten und man akzeptiert, wenn \(F\) sich unter \(\B \) zu \(\true \) auswertet (kann in polynomieller Zeit geprüft werden).

Um die \(\NP \)-Schwierigkeit von \(\SAT \) zu zeigen, reduziert man eine beliebige Sprache \(L \in \NP \) auf \(\SAT \), d. h. man konstruiert eine Logspace-Reduktion \(\varphi \colon \Sigma ^\ast \rightarrow \Sigma _0^\ast \) mit
\(w \in L \iff \varphi (w) \text { erfüllbar}\). Dazu seien \(M = (Q, \Sigma , \Gamma , \delta , q_0, F, \Box )\) eine durch das Polynom \(p(n)\) zeitbeschränkte Turingmaschine mit \(L = L(M)\) und \(w = w_1 \dotsb w_n \in \Sigma ^\ast \) eine Eingabe der Länge \(n\). OBdA stellt man folgende Forderungen an \(M\):

\(M\) hat nur ein les- und schreibbares Band, auf dem zu Beginn die Eingabe steht.
\(F = \{q_f\}\), es gibt also nur einen Endzustand.
Bei jeder Eingabe \(w \in \Sigma ^\ast \) hält \(M\) nie, aber nach \(p(n)\) Schritten ist \(M\) im Endzustand genau dann, wenn \(w \in L(M)\).
Nach \(p(n)\) Schritten ist der Lese- und Schreib-Kopf wieder auf der Ausgangsposition.
Aus \((q, a, q’, a’, D) \in \delta \) und \((q, b, p’, b’, D’) \in \delta \) folgt \(a = b\), \(a’ = b’\) und \(D = D’\), d. h. nur der resultierende neue Zustand wird nicht-deterministisch festgelegt (hängt nicht vom Zeichen auf dem Band ab). Dazu kann man zum Beispiel die Zustandsmenge \(Q\) umdefinieren zu \(Q’ := \{q_{a,a’,D} \;|\; q \in Q,\; a, a’ \in \Gamma ,\; D \in \{L, R, N\}\}\) und die Übergangsrelation \(\delta \) zu
\(\delta ’ := \{(q_{a,a’,D}, a, q’_{b,b’,D’}, a’, D) \;|\; (q, a, q’, a’, D) \in \delta ,\; b, b’ \in \Gamma , D’ \in \{L, R, N\}\}\).

Somit können die Konfigurationen als \(\Conf := \{\Box uqv \Box \;|\; q \in Q,\; u, v \in \Gamma ^\ast ,\; |uv| = p(n)\}\) aufgefasst werden (nach 1.). Die Startkonfiguration ist \(\Box q_0 w \Box ^{p(n)-n+1}\) und die akzeptierende Konfigurationen sind aus \(\Box q_f \Gamma ^{p(n)} \Box \) (nach 2. und 4.). Man kann eine Konfiguration \(\alpha \in \Conf \) auch schreiben als \(\alpha = \alpha _{-1} \alpha _{0} \dotsb \alpha _{p(n)} \alpha _{p(n)+1}\) mit \(\alpha _{-1} = \Box \), \(\alpha _{0}, \dotsc , \alpha _{p(n)} \in Q \cup \Gamma \) und \(\alpha _{p(n)+1} = \Box \) (dabei ist natürlich genau ein \(\alpha _{0}, \dotsc , \alpha _{p(n)}\) in \(Q\) und die anderen sind in \(\Gamma \)).

Man definiert nun eine Menge von \(4\)-Tupeln, nämlich die Menge der lokalen Bandinhalte:
\(\Delta := \{(a, b, c, b) \;|\; a, b, c \in \Gamma \} \;\cup \)
\(\{(c, b, q, p), (b, q, a, b), (q, a, d, a’) \;|\; (q, a, p, a’, L) \in \delta ,\; c, b, d \in \Gamma ^\ast \} \;\cup \)
\(\{(c, b, q, b), (b, q, a, p), (q, a, d, a’) \;|\; (q, a, p, a’, N) \in \delta ,\; c, b, d \in \Gamma ^\ast \} \;\cup \)
\(\{(c, b, q, b), (b, q, a, a), (q, a, d, p) \;|\; (q, a, p, a’, R) \in \delta ,\; c, b, d \in \Gamma ^\ast \}\).
Wegen 5. gilt dann für alle \(\alpha , \alpha ’ \in \Box (Q \cup \Gamma )^\ast \Box \) mit \(|\alpha | = |\alpha ’|\), dass \(\alpha , \alpha ’ \in \Conf \) und \(\alpha \vdash _M \alpha ’\) genau dann, wenn \(\alpha \in \Conf \) und \((\alpha _{i-1}, \alpha _{i}, \alpha _{i+1}, \alpha ’_{i}) \in \Delta \) für alle \(i = 0, \dotsc , p(n)\).

Falls zum Beispiel \((q, a, p, a’, L) \in \delta \) gilt, so ist folgende lokale Bandänderung für alle \(b \in \Gamma \) möglich: \(\alpha = \dotsb \alpha _{i-2} b q a \alpha _{i+2} \dotsb \vdash _M \alpha = \dotsb \alpha ’_{i-2} p b a’ \alpha ’_{i+2} \dotsb \).

Eine Rechnung \((\alpha _0, \alpha _1, \dotsc , \alpha _{p(n)})\) von \(M\) kann damit als Matrix beschrieben werden:

\begin{align*} \begin{array}{cccccccc} \alpha _0 & = & \Box & \alpha _{0,0} & \alpha _{0,1} & \dotsb & \alpha _{0,p(n)} & \Box \\ \alpha _1 & = & \Box & \alpha _{1,0} & \alpha _{1,1} & \dotsb & \alpha _{1,p(n)} & \Box \\ & \vdots \\ \alpha _{p(n)} & = & \Box & \alpha _{p(n),0} & \alpha _{p(n),1} & \dotsb & \alpha _{p(n),p(n)} & \Box \end {array} \end{align*} Für jedes Tripel \((a, i, t)\) mit \(a \in Q \cup \Gamma \), \(i \in \{-1, 0, \dotsc , p(n), p(n) + 1\}\) und \(t \in \{0, \dotsc , p(n)\}\) sei nun \(x(a, i, t)\) eine aussagenlogische Variable. Die Interpretation der Variable ist, dass \(x(a, i, t)\) wahr sein soll genau dann, wenn zum Zeitpunkt \(t\) das \(i\)-te Zeichen der aktuellen Konfiguration ein \(a\) ist.

Man definiert folgende Hornformeln:

Konsistenzformel: \(C(n) := \bigwedge _i \bigwedge _t \bigwedge _{a \not = b}\; (\lnot x(a, i, t) \lor \lnot x(b, i, t))\)
(an der \(i\)-ten Stelle kann zu einem Zeitpunkt nur ein Zeichen stehen)
Randformel: \(R(n) := \bigwedge _t\; (x(\Box , -1, t) \land x(\Box , p(n) + 1, t))\)
(es darf nicht über den polynomiell beschränkten Platz hinausgegangen werden)
Startformel: \(S(w) := X(q_0, 0, 0) \land \bigwedge _{i=1,\dotsc ,n}\; x(a_i, i, 0) \land \bigwedge _{i>n}\; x(\Box , i, 0)\)
(Startkonfiguration ist \(\Box q_0 w \Box ^{p(n)-n+1}\))
Akzeptierungsformel: \(A(n) := x(q_f, 0, p(n))\)
(akzeptierende Konfigurationen sind aus \(\Box q_f \Gamma ^{p(n)} \Box \))

Anschließend definiert man die Übergangsformel \(D(n) := \bigwedge _i \bigwedge _t \bigwedge _{(a, b, c) \in (\Gamma \cup Q)^3}\)
\(\Big (\big (x(a, i - 1, t - 1) \lor x(b, i, t - 1) \lor x(c, i + 1, t - 1)\big ) \Rightarrow \big (\bigvee _{(a, b, c, d) \in \Delta }\; x(d, i, t)\big )\Big )\).
Die Endformel ist damit \(\varphi (n) := C(n) \land R(n) \land S(w) \land A(n) \land D(n)\).

Diese Formel ist in KNF. Sie ist eine Hornformel genau dann, wenn \(M\) deterministisch ist. Dabei sind die Klauseln, die nur negative Literale enthalten, genau die Klauseln in \(C(n)\) und die Klauseln in \(D(n)\), bei denen die Disjunktion leer ist.

Die Formel \(\varphi ’(w) := C(n) \land R(n) \land S(w) \land D(n)\) ist immer erfüllbar. Die erfüllenden Belegungen entsprechen nämlich genau den Rechnungen von \(M\). Am Wert von \(A(n)\) kann man einer solchen Belegung ansehen, ob sie erfolgreich ist. Damit ist \(\varphi (w)\) erfüllbar genau dann, wenn \(w \in L\).

Bemerkung: Aus dem Beweis ergibt sich unmittelbar folgendes Korollar.

Folgerung: \(\HORNSAT \) ist \(\P \)-vollständig.

Satz (\(\KNF \cap \SAT \) \(\NP \)-vollständig): \(\KNF \cap \SAT \) ist \(\NP \)-vollständig.

Beweis: Siehe Beweis vom Satz von Cook (und Levin), denn \(\varphi (n)\) ist in KNF.

Satz (\(\kSAT {3}\) \(\NP \)-vollständig): \(\kSAT {3}\) ist \(\NP \)-vollständig.

Beweis: \(\kSAT {3} \in \NP \) gilt, weil die Prüfung der syntaktischen Korrektheit und der Anzahl an Literalen pro Klausel deterministisch in polynomieller Zeit möglich ist. Anschließend kann eine Belegung nicht-deterministisch geraten und in polynomieller Zeit auf Erfüllung geprüft werden.

Für die \(\NP \)-Schwierigkeit von \(\kSAT {3}\) zeigt man \(\KNF \cap \SAT \le \kSAT {3}\). Sei also \(F\) eine Formel, die schon in \(\KNF \) ist. Dann unterscheidet man drei Fälle:

\(F\) enthält eine Klausel \((\widetilde {x})\) mit nur einem Literal. In diesem Fall führt man eine neue Variable \(z\) ein und ersetzt \((\widetilde {x})\) durch \((\widetilde {x} \lor z) \land (\widetilde {x} \lor \overline {z})\). (Natürlich wird für jede solche Klausel mit nur einem Literal jeweils eine neue Variable eingeführt.)
\(F\) enthält eine Klausel \((\widetilde {x} \lor \widetilde {y})\) mit zwei Literalen. In diesem Fall führt man eine neue Variable \(z\) ein und ersetzt \((\widetilde {x} \lor \widetilde {y})\) durch \((\widetilde {x} \lor \widetilde {y} \lor z) \land (\widetilde {x} \lor \widetilde {y} \lor \overline {z})\).
\(F\) enthält eine Klausel \(c := (\widetilde {x}_1 \lor \dotsb \lor \widetilde {x}_k)\) mit \(k \ge 4\) Literalen. In diesem Fall führt man \(k - 3\) neue Variablen \(z_3, \dotsc , z_{k-1}\) ein und ersetzt \(c\) durch \(c’ :=\)
\((\widetilde {x}_1 \lor \widetilde {x}_2 \lor z_3) \land (\overline {z}_3 \lor \widetilde {x}_3 \lor z_4) \land (\overline {z}_4 \lor \widetilde {x}_4 \lor z_5) \land \dotsb \land (\overline {z}_{k-2} \lor \widetilde {x}_{k-2} \lor z_{k-3}) \land (\overline {z}_{k-1} \lor \widetilde {x}_{k-1} \lor \widetilde {x}_k)\).

Diese Umwandlungen ändert nichts an der Erfüllbarkeit von \(F\). Für die ersten beiden Fälle ist das klar, für den dritten Fall gilt auch:

Sei \(\sigma \) eine erfüllende Belegung für \(c\). Dann gilt \(\sigma (\widetilde {x}_j) = 1\) für ein \(j \in \{1, \dotsc , k\}\). Wenn man \(\sigma \) zu \(\sigma ’\) erweitert durch \(\sigma ’(z_i) := 1\) für \(i = 3, \dotsc , j\) und \(\sigma ’(z_i) := 0\) für \(i = j + 1, \dotsc , k - 1\), dann ist \(\sigma ’\) eine erfüllende Belegung für \(c’\).
Sei \(\sigma ’\) eine erfüllende Belegung für \(c’\). Angenommen, es gelte \(\sigma ’(\widetilde {x}_i) = 0\) für alle \(i = 1, \dotsc , k\). Dann muss \(\sigma ’(z_3) = 1\) gelten (wegen der ersten Klausel \((\widetilde {x}_1 \lor \widetilde {x}_2 \lor z_3)\)). Induktiv folgt dann \(\sigma ’(z_i) = 1\) für alle \(k = 3, \dotsc , k - 1\). Dann gilt aber \(\sigma ’((\overline {z}_{k-1} \lor \widetilde {x}_{k-1} \lor \widetilde {x}_k)) = 0\), ein Widerspruch (es müssen alle Klauseln erfüllt werden). Also ist die Einschränkung \(\sigma \) von \(\sigma ’\) auf \(\widetilde {x}_1, \dotsc , \widetilde {x}_k\) eine erfüllende Belegung von \(c\).

Somit hat man \(F\) auf eine Formel in \(3\text {-}\KNF \) abgebildet, die erfüllbar ist genau dann, wenn \(F\) erfüllbar ist.

\(\LinProg (\integer )\): \(\LinProg (\integer )\) ist definiert durch
\(\LinProg (\integer ) := \{\kod {A, b} \;|\; A \in \integer ^{m \times n},\; b \in \integer ^m,\; \exists _{x \in \integer ^n}\; Ax \ge b\}\).

Satz (\(\LinProg (\integer )\) \(\NP \)-vollständig): \(\LinProg (\integer )\) ist \(\NP \)-vollständig.

Beweis: \(\LinProg (\integer ) \in \NP \) ist der schwierige Teil des Beweises und wird hier ausgelassen. Man kann nämlich nicht einfach nicht-deterministisch ein \(x \in \integer ^n\) raten, da das evtl. nicht in polynomieller Zeit geht (wenn \(x\) groß genug ist).

\(\LinProg (\integer )\) \(\NP \)-schwierig zeigt man durch \(\kSAT {3} \le _m^{\log } \LinProg (\integer )\). Sei \(F = c_1 \land \dotsb \land c_m\) eine Formel in \(3\text {-}\KNF \) mit Variablen \(x_1, \dotsc , x_n\). Dazu wird das folgende System von ganzzahligen Ungleichungen über den Variablen \(x_i, \overline {x}_i\), \(i = 1, \dotsc , n\) gebildet:

\(x_i \ge 0\) für \(i = 1, \dotsc , n\)
\(\overline {x_i} \ge 0\) für \(i = 1, \dotsc , n\)
\(x_i + \overline {x_i} \ge 1\) für \(i = 1, \dotsc , n\)
\(-x_i - \overline {x_i} \ge -1\) für \(i = 1, \dotsc , n\)
\(\widetilde {x}_{j1} + \widetilde {x}_{j2} + \widetilde {x}_{j3} \ge 1\) für jede Klausel \(c_j = (\widetilde {x}_{j1} \lor \widetilde {x}_{j2} \lor \widetilde {x}_{j3})\), \(j = 1, \dotsc , m\)

Dieses System ist lösbar genau dann, wenn \(F\) erfüllbar ist.

Bemerkung: Zur Wiederholung wird nochmal definiert, was Vertex Cover (VC) ist.

Vertex Cover (VC): Sei \(G = (V, E)\) ein ungerichteter Graph.
Eine Teilmenge \(C \subset V\) heißt Knotenüberdeckung (oder Träger) von \(G\), falls für jede Kante \(\{u, v\} \in E\) gilt, dass \(\{u, v\} \cap C \not = \emptyset \). Dann ist Vertex Cover (VC) wie folgt definiert:
Gegeben ist \(G\) und \(k \ge 0\). Gefragt ist, ob eine Knotenüberdeckung von \(G\) mit \(|C| \le k\) existiert.

Satz (VC \(\NP \)-vollständig): VC ist \(\NP \)-vollständig.

Beweis: \(\VC \in \NP \): Rate eine Teilmenge \(C \subset V\) mit \(|C| \le k\) und prüfe in Polynomialzeit, ob \(C\) eine Knotenüberdeckung ist.

VC \(\NP \)-schwierig kann man durch \(\kSAT {3} \le _m^{\log } \VC \) zeigen. Sei \(F = c_1 \land \dotsb \land c_m\) eine Formel in \(3\text {-}\KNF \) mit \(c_j = (\widetilde {x}_{j1} \lor \widetilde {x}_{j2} \lor \widetilde {x}_{j3})\), \(j = 1, \dotsc , m\). Man konstruiert zu \(F\) einen ungerichteten Graphen \(G(F)\) wie folgt: Für jedes Literal in jeder Klausel erstellt man einen Knoten (d. h. es gibt insgesamt \(3m\) Knoten). Kanten werden zwischen den Literalen einer Klausel eingefügt (sodass man lauter disjunkte „Dreiecke“ erhält) und zusätzlich noch zwischen allen \(x\) und \(\overline {x}\) für alle Variablen \(x\) aus \(F\).

In \(G(F)\) muss jede Knotenüberdeckung \(C\) mindestens \(2m\) Knoten haben, weil in jedem der \(m\) Dreiecke mindestens zwei Knoten zu \(C\) gehören müssen.

Es gilt nun: \(F \in \kSAT {3} \iff G(F)\) hat eine Knotenüberdeckung \(C\) mit \(|C| = 2m\).

„\(\Rightarrow \)": Sei \(F\) erfüllbar. Dann wird in jeder Klausel \(c_j\) mindestens ein Literal \(\widetilde {x}_{ji}\) wahr. Sei \(C\) die Knotenmenge, die für jedes Dreieck die anderen beiden Literale enthält. Dann enthält \(C\) genau \(2m\) Elemente und \(C\) ist eine Knotenüberdeckung.

„\(\Leftarrow \)“: Sei \(C\) eine Knotenüberdeckung mit \(|C| = 2m\). Dann enhält \(C\) in jedem Dreieck genau zwei Knoten. Definiere eine Belegung \(\sigma \) von \(F\) durch
\(\sigma (x) := 1\), falls eine Kopie von \(x\) nicht zu \(C\) gehört,
\(\sigma (x) := 0\), falls eine Kopie von \(\overline {x}\) nicht zu \(C\) gehört, und
\(\sigma (x) := 0\), falls alle Kopien von \(x\) und \(\overline {x}\) zu \(C\) gehören.
Weil \(C\) eine Knotenüberdeckung ist und alle Kanten \((x, \overline {x})\) in \(G(F)\) vorhanden sind, wird keine Variable gleichzeitig auf \(0\) und \(1\) gesetzt. Es gilt \(\sigma (F) = 1\).

\(\NAEkSAT {k}\): Das Problem \(\NAEkSAT {k}\) ist definiert durch
\(\NAEkSAT {k} := \{F \in \kKNF {k} \;|\; \exists _{\text {Belegung } \sigma }\; F(\sigma ) = 1 = F(1 - \sigma )\}\).
Zur Abkürzung definiert man \(\NAESAT := \NAEkSAT {3}\).

Bemerkung: \(F \in \NAEkSAT {k}\) heißt \(F = c_1 \land \dotsb \land c_m\) mit \(c_j = (\widetilde {x}_{1j} \lor \dotsb \lor \widetilde {x}_{kj})\) Klausel mit \(k\) Literalen, sodass es eine Belegung \(\sigma \) gibt, für die in jeder Klausel ein Literal wahr und eins falsch ist.

Satz (\(\NAESAT \) \(\NP \)-vollständig): \(\NAESAT \) ist \(\NP \)-vollständig.

Beweis: Es gilt \(\NAESAT \in \NP \), da man \(\sigma \) nicht-deterministisch raten und
\(F(\sigma ) = F(1 - \sigma ) = 1\) in polynomieller Zeit verifizieren kann.

Für \(\NAESAT \) \(\NP \)-schwierig zeigt man zunächst \(\kSAT {3} \le _m^{\log } \NAEkSAT {4}\).
Dazu sei \(F \in \kKNF {3}\) (dafür muss zuerst die syntaktische Korrektheit überprüft werden). Sei \(z\) eine neue Variable. Ersetze nun jede Klausel \(c_j\) in \(F\) durch \(c_j’ := (c_j \lor z)\), d. h. aus
\(F = (c_1 \land \dotsb \land c_m)\) wird \(F’ := (c_1’ \land \dotsb \land c_m’)\). Es gilt \(F \in \kSAT {3} \iff F’ \in \NAEkSAT {4}\), denn:

„\(\Rightarrow \)“: Sei \(F \in \kSAT {3}\), d. h. es gibt eine Belegung \(\sigma \), sodass \(F(\sigma ) = 1\). Erweitere nun \(\sigma \) zu \(\sigma ’\) durch \(\sigma ’(z) := 0\). Dann gilt immer noch \(F’(\sigma ’) = 1\) (die \(c_j\) sind weiterhin alle wahr), aber auch \(F’(1 - \sigma ’) = 1\), da \(z\) in der Belegung \(1 - \sigma ’\) zu wahr ausgewertet wird.

„\(\Leftarrow \)“: Sei \(F’ \in \NAEkSAT {4}\), d. h. es gibt eine Belegung \(\sigma ’\), sodass \(F’(\sigma ’) = F’(1 - \sigma ’) = 1\). Gilt \(\sigma ’(z) = 0\), dann werten alle Klauseln \(c_j\) zu wahr aus (weil die \(c_j’ = (c_j \lor z)\) zu wahr auswerten, aber \(z\) falsch ist), d. h. die Einschränkung von \(F’\) auf die Variablen von \(F\) ist eine erfüllende Belegung von \(F\). Gilt \(\sigma ’(z) = 1\), so ersetzt man \(\sigma ’\) durch \(1 - \sigma ’\).

Nun zeigt man \(\NAEkSAT {4} \le _m^{\log } \NAESAT \) wie oben: Für \(F \in \kKNF {4}\) mit \(F = (c_1 \land \dotsb \land c_m)\) ersetzt man \(c_j = (\widetilde {x}_{1j} \lor \widetilde {x}_{2j} \lor \widetilde {x}_{3j} \lor \widetilde {x}_{4j})\) durch \(c_j’ := (\widetilde {x}_{1j} \lor \widetilde {x}_{2j} \lor z_j) \land (\overline {z_j} \lor \widetilde {x}_{3j} \lor \widetilde {x}_{4j})\) (dabei sind die \(z_j\), \(j = 1, \dotsc , m\) neue Variablen). Somit erhält man \(F’ := c_1’ \land \dotsb \land c_m’\).

Es gilt \(F \in \NAEkSAT {4} \iff F’ \in \NAESAT \):

„\(\Rightarrow \)“: Sei \(F \in \NAEkSAT {4}\), d. h. es gibt eine Belegung \(\sigma \) mit \(F(\sigma ) = F(1 - \sigma ) = 1\).
Man erweitert \(\sigma \) zu \(\sigma ’\) wie folgt:
Wenn \(\sigma (\widetilde {x}_{1j}) = \sigma (\widetilde {x}_{2j})\) gilt, dann setze \(\sigma ’(z_j) := 1 - \sigma (\widetilde {x}_{1j})\).
Wenn \(\sigma (\widetilde {x}_{3j}) = \sigma (\widetilde {x}_{4j})\) gilt, dann setze \(\sigma ’(z_j) := \sigma (\widetilde {x}_{3j})\).
(Beide Fälle können in Kombination mit \(\sigma (\widetilde {x}_{1j}) = \sigma (\widetilde {x}_{3j})\) nicht auftreten, da ein mindestens Literal wahr und mindestens eins falsch sein muss.)
Für \(\sigma (\widetilde {x}_{1j}) \not = \sigma (\widetilde {x}_{2j})\) und \(\sigma (\widetilde {x}_{3j}) \not = \sigma (\widetilde {x}_{4j})\) setze \(\sigma ’(z_j)\) beliebig.
Damit gilt \(F’(\sigma ’) = F’(1 - \sigma ’) = 1\) und \(F’ \in \NAESAT \).

„\(\Leftarrow \)“: Sei \(F’ \in \NAESAT \), d. h. es gibt eine Belegung \(\sigma ’\) mit \(F’(\sigma ’) = F’(1 - \sigma ’) = 1\). Sei \(\sigma \) die Einschränkung von \(\sigma ’\) auf die Variablen von \(F\).
Wenn \(\sigma ’(\widetilde {x}_{1j}) \not = \sigma ’(\widetilde {x}_{2j})\) oder \(\sigma ’(\widetilde {x}_{3j}) \not = \sigma ’(\widetilde {x}_{4j})\) gilt, dann gilt \(F(\sigma ) = F(1 - \sigma ) = 1\).
Sei also \(\sigma ’(\widetilde {x}_{1j}) = \sigma ’(\widetilde {x}_{2j})\) und \(\sigma ’(\widetilde {x}_{3j}) = \sigma ’(\widetilde {x}_{4j})\). Dann muss \(\sigma ’(\widetilde {x}_{2j}) \not = \sigma ’(\widetilde {x}_{3j})\) gelten, denn sonst wäre eine der beiden Klauseln aus \(c_j’\) bei \(\sigma ’\) oder \(1 - \sigma ’\) nicht erfüllt (z. B. wenn \(\sigma ’(z_j) = \sigma ’(\widetilde {x}_{1j})\) gilt, dann wäre die erste Klausel aus \(c_j’\) für \(\sigma ’\) nicht erfüllt, wenn \(\sigma ’(z_j) = 1\), und nicht für \(1 - \sigma ’\), wenn \(\sigma ’(z_j) = 0\)). Damit ist aber ebenfalls \(F(\sigma ) = F(1 - \sigma ) = 1\), d. h. \(F \in \NAEkSAT {4}\).

\(\kSAT {2\text {-}4}\): Das Problem \(\kSAT {2\text {-}4}\) ist definiert durch \(\kSAT {2\text {-}4} :=\)
\(\{F \in \kKNF {4} \;|\; \exists _{\text {Belegung } \sigma }\; \text {in jeder Klausel sind zwei Literale wahr und zwei falsch}\}\).

Satz (\(\kSAT {2\text {-}4}\) \(\NP \)-vollständig): \(\kSAT {2\text {-}4}\) ist \(\NP \)-vollständig.

Beweis: Man zeigt \(\NAESAT \le _m^{\log } \kSAT {2\text {-}4}\), indem man die Klauseln \(c_j = (\widetilde {x}_{1j} \lor \widetilde {x}_{2j} \lor \widetilde {x}_{3j})\) ersetzt durch \(c_j’ := (c_j \lor z_j)\).

\(\kFaerbbarkeit {3}\): Sei \(G = (V, E)\) ein ungerichteter Graph mit \(V = \{1, \dotsc , n\}\) und
\(E \subset \binom {V}{2} := \{\{u, v\} \;|\; u, v \in V,\; u \not = v\}\).
Das Problem \(\kFaerbbarkeit {3}\) ist damit wie folgt definiert: Gegeben sei \(G = (V, E)\).
Gefragt ist, ob es eine Abbildung \(c\colon V \rightarrow \{\red , \green , \blue \}\) gibt, sodass \(\forall _{\{x, y\} \in E}\; c(x) \not = c(y)\).

Satz (\(\kFaerbbarkeit {3}\) \(\NP \)-vollständig): \(\kFaerbbarkeit {3}\) ist \(\NP \)-vollständig.

Beweis: \(\kFaerbbarkeit {3} \in \NP \) ist klar (Raten einer Abbildung \(c\) und Überprüfung der Bedingung).

Für \(\kFaerbbarkeit {3}\) \(\NP \)-schwierig zeigt man \(\NAESAT \le _m^{\log } \kFaerbbarkeit {3}\). Sei also \(F \in \kKNF {3}\) mit \(F = (c_1 \land \dotsb \land c_m)\) eine Formel mit Variablen \(x_1, \dotsc , x_n\) und Klauseln \(c_j = (\widetilde {x}_{1j} \lor \widetilde {x}_{2j} \lor \widetilde {x}_{3j})\). Erstelle nun einen Graphen \(G(F)\) wie folgt:

Führe für jede Variable \(x_i\) und der Negation \(\overline {x_i}\) einen Knoten ein, d. h. zunächst \(2n\) Knoten. Führe außerdem einen separaten „Wurzelknoten“ ein. Verbinde jedes \(x_i\) mit \(\overline {x_i}\) und alle \(x_i\) und \(\overline {x_i}\) jeweils mit dem Wurzelknoten. Der Wurzelknoten soll im Folgenden immer blau gefärbt sein. Damit können die anderen Knoten im bisherigen Graphen nur rot oder grün gefärbt sein. Die 3-Färbungen des Teilgraphen entsprechen den möglichen Belegungen.
Füge nun für jede Klausel \(c_j = (\widetilde {x}_{1j} \lor \widetilde {x}_{2j} \lor \widetilde {x}_{3j})\) jeweils ein disjunktes Dreieck ein. Verbinde in den Dreiecken alle Literale mit ihrem komplementären Literal aus dem 1. Schritt.

Es gilt \(F \in \NAESAT \iff G(F)\) 3-färbbar:

„\(\Rightarrow \)“: Sei \(\sigma \) eine Belegung von \(F\) mit \(F(\sigma ) = F(1 - \sigma ) = 1\). In den Dreiecken wird ein Knoten rot gefärbt, dessen entsprechendes Literal in der Klausel für \(\sigma \) wahr wird. Ein Knoten, dessen Literal falsch ist (bzw. wahr für \(1 - \sigma \)), wird grün gefärbt und der verbleibende Knoten blau. Die Knoten im 1. Teilgraph werden dann entsprechend gefärbt (\(x_i\) rot und \(\overline {x_i}\), falls \(\sigma (x_i) = 1\), sonst andersherum).

„\(\Leftarrow \)“: Sei \(G(F)\) 3-färbbar, oBdA sei der Wurzelknoten blau gefärbt. Pro Dreieck müssen in jedem Fall alle Farben rot, grün und blau verwendet werden. Definiere \(\sigma (x_i) := 1\), falls \(x_i\) im 1. Teilgraphen rot ist, und \(\sigma (x_i) := 0\), falls \(x_i\) im 1. Teilgraphen grün ist. Das ist eine erfüllende Belegung, denn wenn z. B. \(\sigma (c_j) = 0\) wäre, dann wären alle Knoten des entsprechenden Dreiecks mit grünen Knoten verbunden. Analog muss ein Literal pro Klausel falsch sein.

planar: Ein Graph \(G = (V, E)\) heißt planar, falls \(G\) kreuzungsfrei in die Ebene \(\real ^2\) eingebettet werden kann.

Bemerkung: Jeder planare Graph ist 4-färbbar.

Satz (planare \(\kFaerbbarkeit {3}\) \(\NP \)-vollständig):
\(\kFaerbbarkeit {3}\) für planare Graphen ist \(\NP \)-vollständig.

Rucksack-Problem: Das Problem \(\Rucksack \) ist wie folgt definiert:
Gegeben seien \((s_i, p_i)\) und \(s\) mit \(s_i, p_i, s \in \natural \), \(i = 1, \dotsc , n\). Gesucht ist \(I \subset \{1, \dotsc , n\}\), sodass \(\sum _{i \in I} s_i \le s\) gilt und unter dieser Bedingung \(\sum _{i \in I} p_i\) maximal wird.

Bemerkung: Bei der Entscheidungsvariante ist zusätzlich ein \(p \in \natural \) gegeben.
Gefragt ist, ob \(I \subset \{1, \dotsc , n\}\) existiert, sodass \(\sum _{i \in I} s_i \le s\) und \(\sum _{i \in I} p_i \ge p\).
Mit binärer Suche (startend bei \(p_{\max } := \sum _{i=1}^n p_i\)) kann man zeigen:
Wenn die Entscheidungsvariante in \(\P \) liegt, dann auch die Optimierungsvariante.
In der Kryptografie geht es oft nur um einen Spezialfall von \(\Rucksack \).

\(\SubsetSum \): Das Problem \(\Rucksack \) ist wie folgt definiert:
Gegeben seien \(s_i, s \in \natural \), \(i = 1, \dotsc , n\). Gesucht ist \(I \subset \{1, \dotsc , n\}\), sodass \(\sum _{i \in I} s_i = s\).

Satz (\(\Rucksack \)/\(\SubsetSum \) \(\NP \)-vollständig):
\(\Rucksack \) (sogar schon \(\SubsetSum \)) ist \(\NP \)-vollständig.

Beweis: \(\SubsetSum \in \NP \) ist klar (rate \(I\) und verifiziere).

\(\SubsetSum \) \(\NP \)-schwierig kann man mit \(\kSAT {2\text {-}4} \le _m^{\log } \SubsetSum \) zeigen.
Sei also \(F = (c_1 \land \dotsb \land c_m)\) eine Formel in \(\kKNF {4}\) mit Klauseln \(c_j = (\widetilde {x}_{1j} \lor \widetilde {x}_{2j} \lor \widetilde {x}_{3j} \lor \widetilde {x}_{4j})\). Aus dieser Formel werden \(2n\) Werte \(\widetilde {s}_i\) (ein Paar für jede Variable \(x_i\), die in \(F\) vorkommt) wie folgt erzeugt: \(\widetilde {s}_i := \ast \ast \; \ast \ast \; \dotsb \; \ast \ast \;\; \ast \;\; 0 \dotsb 010 \dotsb 0\). Dabei stehen vorne \(2m\) Bits (also \(m\) Paare), danach folgt ein Trennbit und hinten befinden sich \(n\) Bits, wobei die \(1\) an der \(i\)-ten Position von hinten ist. Die vorderen Bits bestimmen sich folgendermaßen:
Das \(j\)-te vordere Paar von \(s_i\) ist \(00\), falls \(x_i \notin c_j\), und \(01\), falls \(x_i \in c_j\).
Das \(j\)-te vordere Paar von \(\overline {s_i}\) ist \(00\), falls \(\overline {x_i} \notin c_j\), und \(01\), falls \(\overline {x_i} \in c_j\).
Das Trennbit ist beliebig, z. B. \(0\).

Wenn man nun \(s := 10\; 10\; \dotsb \; 10\;\; 0\;\; 11 \dotsb 1\) setzt, dann gilt \(F \in \kSAT {2\text {-}4}\) genau dann, wenn es ein \(I \subset \{1, \dotsc , n\}\) gibt mit \(\sum _{i \in I} s_i = s\).

Bemerkung: \(\Rucksack \) und \(\SubsetSum \) sind pseudo-polynomiell lösbar, d. h. die Probleme liegen in \(\P \), falls die Zahlen unär kodiert werden (zum Lösen benötigt man also polynomiell viel Zeit, wobei das Polynom nicht von der Länge von \(s\), sondern von \(s\) selbst abhängt).

Die Lösung erfolgt dabei mit dynamischem Programmieren:
Sei \(S[j] := \{\sum _{i \in I} s_i \;|\; I \subset \{1, \dotsc , j\},\; \sum _{i \in I} s_i \le s\}\). Ausgehend von \(S[0] = 0\) kann man \(S[j]\) aus \(S[j-1]\) für \(j = 1, \dotsc , n\) berechnen durch \(S[j] = \{s_j + k \;|\; k \in S[j-1],\; s_j + k \le s\} \cup S[j-1]\). Es gilt \(S[0] \subset S[1] \subset \dotsb \subset S[n] \subset \{0, \dotsb s\}\), d. h. \(|S[j]| \le s + 1\) für alle \(j = 0, \dotsc , n\). Falls \(|S[n]|\) polynomiell begrenzt bleibt, so ist das Problem polynomiell lösbar, denn die Laufzeit ist \(\O (n \cdot s \cdot \log s)\).

PSPACE-vollständige Probleme

quantifizierte Boolesche Formel (QBF): Eine quantifizierte Boolesche Formel (QBF) entsteht folgendermaßen:

Jede Aussagenvariable \(x\) ist eine QBF. In dieser Formel \(x\) tritt \(x\) frei auf.
\(\lnot \varphi \), \((\varphi \land \psi )\) und \((\varphi \lor \psi )\) sind QBF, falls \(\varphi \) und \(\psi \) QBF sind. Eine Aussagenvariable \(x\) aus \(\varphi \) oder \(\psi \) ist frei in den Formeln, falls \(x\) frei in \(\varphi \) oder frei in \(\psi \) ist.
\(\forall _x \varphi \) und \(\exists _x \varphi \) sind QBF, falls \(\varphi \) QBF und \(x\) eine Aussagenvariable ist. Der Gültigkeitsbereich von \(\forall _x\) bzw. \(\exists _x\) erstreckt sich auf jedes freie Vorkommen von \(x\) in \(\varphi \). \(x\) ist in der entstehenden Formel nicht mehr frei, alle anderen Aussagenvariablen dagegen schon.

pränexe Normalform: Eine QBF \(F\) ist in pränexer Normalform, falls
\(F = Q^{(1)}_{x_1} \dotsb Q^{(n)}_{x_n} \varphi (x_1, \dotsc , x_n)\) mit \(Q^{(1)}, \dotsc , Q^{(n)} \in \{\forall , \exists \}\) und
\(\varphi (x_1, \dotsc , x_n)\) aussagenlogische Formel ohne Quantoren in den Variablen \(x_1, \dotsc , x_n\).

Satz (Existenz der pränexen Normalform): Jede QBF kann in eine äquivalente pränexe Normalform gebracht werden (in polynomieller Zeit).

\(\QBF \): Das Problem \(\QBF \) ist definiert durch
\(\QBF := \{F \;|\; F \text { quantifizierte Boolesche Formel, die sich zu wahr auswertet}\}\).

Satz (\(\QBF \) \(\PSPACE \)-schwierig): \(\QBF \) ist \(\PSPACE \)-schwierig.