Die erweiterte Zahlengerade extreal

erweiterte Zahlengerade:  Die erweiterte Zahlengerade ist definiert als \(\extreal := \real \cup \{\pm \infty \}\). Die Operationen \(+\) und \(\cdot \) werden auf \(\extreal \) erweitert durch \(\infty + \infty := \infty \), \((-\infty ) + (-\infty ) := -\infty \), \(-\infty < a < +\infty \) für alle \(a \in \real \) usw. Für \(c \in \real \) sei \(c \cdot \infty := \infty \) für \(c > 0\), \(c \cdot \infty := -\infty \) für \(c < 0\) und \(c \cdot \infty := 0\) für \(c = 0\). Damit ist das Produkt \(a \cdot b\) für alle \(a, b \in \extreal \) definiert.
Ausdrücke wie \(\infty - \infty \) werden undefiniert gelassen.

Intervalle und Umgebungen:  Intervalle \([-\infty , a)\), \([-\infty , a]\), \((a, \infty ]\) und \([a, \infty ]\) sind definiert durch \([-\infty , a) := \{-\infty \} \cup (-\infty , a)\) usw. mit \(a \in \extreal \). Für \(\varepsilon > 0\) sind \(\varepsilon \)-Umgebungen von \(\pm \infty \) definiert durch \(U_\varepsilon (\infty ) := (\frac {1}{\varepsilon }, \infty ]\) und \(U_\varepsilon (-\infty ) := [-\infty , -\frac {1}{\varepsilon })\). Dadurch sind auch offene und abgeschlossene Teilmengen von \(\extreal \) definiert.

Bemerkung: Eine Teilmenge von \(\real \) ist offen in \(\extreal \) genau dann, wenn sie offen in \(\real \) ist. Mit „abgeschlossen“ statt „offen“ stimmt die Aussage nicht mehr: Es gibt Teilmengen von \(\real \), die zwar abgeschlossen in \(\real \), aber nicht in \(\extreal \) abgeschlossen sind (z. B. \(M = [0, \infty )\)).

Die Borel-sigma-Algebra

erzeugte \(\sigma \)-Algebra:  Seien \(\Omega \not = \emptyset \) eine nicht-leere Menge und \(\E \in \P (\Omega )\) ein System von Teilmengen. Dann gibt es eine kleinste \(\sigma \)-Algebra \(\sigma (\E )\), die \(\E \) enthält. Sie heißt die von \(\E \) erzeugte \(\sigma \)-Algebra.

Beispiel: Sei \(\Omega \not = \emptyset \) eine nicht-leere Menge.

  • Für \(A \subset \Omega \) ist \(\sigma (\{A\}) = \{\emptyset , A, \Omega \setminus A, \Omega \}\).

  • Für eine Partition \((A_n)_{n \in \natural }\) von \(\Omega \) (d. h. \(A_n \subset \Omega \) paarweise disjunkt und \(\bigcup _{n \in \natural } A_n = \Omega \)) gilt \(\sigma (\{A_1, A_2, \dotsc \}) = \left \{\bigcup _{k \in K} A_k \;|\; K \subset \natural \right \}\).

Satz (Abschluss der \(\sigma \)-Algebra): Seien \(\Omega \not = \emptyset \) eine nicht-leere Menge, \(\E \in \P (\Omega )\) ein System von Teilmengen und \(A, A_1, A_2, \dotsc \in \E \). Dann ist \(\Omega \setminus A, \bigcup _{n=1}^\infty A_n, \bigcap _{n=1}^\infty A_n \in \sigma (\E )\).

Borel-\(\sigma \)-Algebra auf \(\real \):  Sei \(\E (\real ) := \{(a, b] \;|\; -\infty < a \le b < \infty \}\).
Dann heißt \(\B (\real ) := \sigma (\E (\real ))\) die Borel-\(\sigma \)-Algebra auf \(\real \).
Die Elemente von \(\B (\real )\) heißen Borel-Mengen.

Beispiel: Beispiele für Borel-Mengen von \(\real \) sind

  • die offenen und abgeschlossenen Intervalle \((a, b) = \bigcup _{n=1}^\infty (a, b - \frac {1}{n}]\) und \([a, b] = \bigcap _{n=1}^\infty (a - \frac {1}{n}, b + \frac {1}{n})\),

  • die Elementarereignisse \(\{a\} = [a, a]\) (d. h. jede abzählbare Teilmenge von \(\real \)),

  • alle offenen und abgeschlossenen Teilmengen von \(\real \) (jede offene Menge ist eine höchstens abzählbare Vereinigung offener Intervalle) und

  • alle höchstens abzählbaren Vereinigungen oder Schnitte von offenen und/oder abgeschlossenen Teilmengen von \(\real \) (z. B. das Cantorsche Diskontinuum).

Bemerkung: \(\B (\real )\) hat auch andere Erzeugendensysteme:

  • \(\{[a, b) \;|\; -\infty < a \le b < \infty \}\)

  • \(\{(a, b) \;|\; -\infty < a \le b < \infty \}\)

  • \(\{[a, b] \;|\; -\infty < a \le b < \infty \}\)

  • \(\{(-\infty , b] \;|\; b \in \real \}\)

  • \(\{O \subset \real \;|\; O \text { offen}\}\)

  • \(\{A \subset \real \;|\; A \text { abgeschlossen}\}\)

Borel-\(\sigma \)-Algebra auf \(\extreal \):  Sei \(\E (\extreal ) := \{(a, b] \;|\; -\infty \le a \le b \le \infty \}\).
Dann heißt \(\B (\extreal ) := \sigma (\E (\extreal ))\) die Borel-\(\sigma \)-Algebra auf \(\extreal \)

Borel-\(\sigma \)-Algebra auf \(\real ^n\):  Sei \(\E (\real ^n) := \{I_1 \times \dotsb \times I_n \;|\; I_1, \dotsc , I_n \in \E (\real )\}\).
Dann heißt \(\B (\real ^n) := \sigma (\E (\real ^n))\) die Borel-\(\sigma \)-Algebra auf \(\real ^n\)

Spur-\(\sigma \)-Algebra:  Sei \((\Omega , \A )\) ein Messraum und \(M \subset \Omega \) eine nicht-leere Teilmenge.
Dann ist \(\A _M := \{A \cap M \;|\; A \in \A \}\) eine \(\sigma \)-Algebra auf \(M\), die sog. Spur-\(\sigma \)-Algebra.
Ist \(M\) eine Teilmenge von \(\real \), \(\extreal \) oder \(\real ^n\), dann heißt die Spur-\(\sigma \)-Algebra \(\B (\real )_M\), \(\B (\extreal )_M\) oder \(\B (\real ^n)_M\) die Borel-\(\sigma \)-Algebra \(\B (M)\) auf \(M\).

Fortsetzung von Maßen

Halbring:  Sei \(\Omega \not = \emptyset \). Dann heißt \(\H \subset \P (\Omega )\) Halbring über \(\Omega \), falls

  • \(\emptyset \in \H \)

  • \(A, B \in \H \;\Rightarrow \; A \cap B \in \H \)

  • Für alle \(A, B \in \H \) mit \(A \subset B\) existieren \(C_1, \dotsc , C_n \in \H \) paarweise disjunkt mit
    \(B \setminus A = \bigcup _{k=1}^n C_k\).

Beispiel:

  • Jede \(\sigma \)-Algebra über \(\Omega \) ist ein Halbring.

  • Für \(\Omega \not = \emptyset \) ist \(\H := \{A \subset \Omega \;|\; |A| \le 1\} = \{\emptyset \} \cup \{\{x\} \;|\; x \in \Omega \}\) ein Halbring über \(\Omega \).

  • \(\E (\real ^n)\) ist ein Halbring über \(\real ^n\).

Satz (Vereinigung von zwei Mengen im Halbring): Sei \(\H \) ein Halbring über \(\Omega \) und \(A, B \in \H \).
Dann gibt es paarweise disjunkte Mengen \(C_1, \dotsc , C_n \in \H \) mit \(A \cup B = \bigcup _{k=1}^n C_k\).

Prämaß:  Sei \(\H \) ein Halbring über \(\Omega \not = \emptyset \).
Dann heißt eine Abbildung \(\mu _0\colon \H \rightarrow [0, \infty ]\) Prämaß auf \(\H \), falls

  • \(\mu _0(\emptyset ) = 0\) (Nulltreue)

  • \(\mu _0(\bigcup _{n=1}^\infty A_n) = \sum _{n=1}^\infty \mu _0(A_n)\) für \(A_n \in \A \) paarweise disjunkt mit \(\bigcup _{n=1}^\infty A_n \in \H \)
    (\(\sigma \)-Additivität)

Falls es zusätzlich Mengen \((A_n)_{n \in \natural }\) mit \(\mu _0(A_n) < \infty \) für alle \(n \in \natural \) und \(\bigcup _{n=1}^\infty A_n = \Omega \) gibt, so heißt \(\mu _0\) \(\sigma \)-endlich.

Beispiel:

  • Jedes Maß ist auch ein Prämaß.

  • Für \(\Omega \not = \emptyset \) und den Halbring \(\H = \{A \subset \Omega \;|\; |A| \le 1\}\) ist \(\mu _0\colon \H \rightarrow [0, \infty ]\) mit \(A \mapsto 0\) für \(A = \emptyset \) und \(A \mapsto 1\) sonst ein Prämaß. Es ist \(\sigma \)-endlich genau dann, wenn \(\Omega \) höchstens abzählbar ist.

  • \(\E (\real ^n) = \{(a_1, b_1] \times \dotsb \times (a_n, b_n] \;|\; a_i \le b_i\}\) ist ein Halbring. Die Abbildung \(\lambda _0^n\colon \E (\real ^n) \rightarrow [0, \infty ]\) mit \((a_1, b_1] \times \dotsb \times (a_n, b_n] \mapsto \prod _{i=1}^n (b_i - a_i)\) ist ein \(\sigma \)-endliches Prämaß und heißt Lebesgue-Prämaß.

Satz (Fortsetzungssatz von  Carathéodory):
Seien \(\H \) ein Halbring über \(\Omega \not = \emptyset \) und \(\mu _0\colon \H \rightarrow [0, \infty ]\) ein \(\sigma \)-endliches Prämaß.
Dann gibt es genau ein Maß \(\mu \colon \sigma (\H ) \rightarrow [0, \infty ]\) mit \(\mu |_\H = \mu _0\).
Außerdem gilt für \(A \in \sigma (\H )\) beliebig \(\mu (A) = \inf \{\sum _{n=1}^\infty \mu _0(B_n) \;|\; B_n \in \H ,\; A \subset \bigcup _{n=1}^\infty B_n\}\).

Folgerung: Seien \(\H \) ein Halbring über \(\Omega \not = \emptyset \) und \(\mu , \nu \colon \sigma (\H ) \rightarrow [0, \infty ]\) zwei \(\sigma \)-endliche Maße mit \(\mu |_\H = \nu |_\H \). Dann gilt \(\mu = \nu \).

Beispiel: Seien wieder \(\Omega \not = \emptyset \), \(\H = \{A \subset \Omega \;|\; |A| \le 1\}\) und \(\mu _0\colon \H \rightarrow [0, \infty ]\) wie oben. Wenn \(\Omega \) höchstens abzählbar ist, dann gibt es genau ein Maß auf \(\sigma (\H ) = P(\Omega )\) mit \(\mu |_\H = \mu _0\).
Weil das Zählmaß auch diese Eigenschaft hat, muss \(\mu \) nach dem Fortsetzungssatz von Carathéodory gleich dem Zählmaß sein (d. h. \(\mu (A) = |A| \in \natural _0 \cup \{\infty \}\)).

Lebesgue-Maß:  Das Lebesgue-Prämaß \(\lambda _0^n\) lässt sich nach Carathéodory eindeutig zu einem Maß \(\lambda ^n\colon \B (\real ^n) \rightarrow [0, \infty ]\) fortsetzen. \(\lambda ^n\) heißt Lebesgue-Maß.
Es gilt \(\lambda ^n((a_1, b_1] \times \dotsb \times (a_n, b_n]) = \prod _{i=1}^n (b_i - a_i)\) bzw. insbesondere gilt für
\(\lambda := \lambda ^1\colon \B (\real ) \rightarrow [0, \infty ]\), dass \(\lambda ((a, b]) = b - a\).

Beispiel: Für \(\Omega \in \B (\real ^n)\) mit \(0 < \lambda ^n(\Omega ) < \infty \) definiert \(P\colon \B (\Omega ) \rightarrow [0, 1]\) mit \(A \mapsto \frac {\lambda ^n(A)}{\lambda ^n(\Omega )}\) ein W-Maß auf \((\Omega , \B (\Omega ))\). \(P\) heißt kontinuierliche Gleichverteilung.

Satz (Aussagen über das Lebesgue-Maß):

  • Für \(A \subset \real ^n\) höchstens abzählbar gilt \(\lambda ^n(A) = 0\), d. h. \(A\) ist eine Nullmenge.

  • Es gilt \(\lambda ^n([0, 1]^n) = 1\).

  • Für \(O \subset \real ^n\) offen mit \(O \not = \emptyset \) gilt \(\lambda ^n(O) > 0\).

  • Sei \(A \in \B (\real ^n)\) mit \(\lambda ^n(A) < \infty \). Dann gilt \(\lambda ^n(A) = \sup \{\lambda ^n(K) \;|\; K \subset A \text { kompakt}\}\)
    (Regularität von innen).

  • Sei \(A \in \B (\real ^n)\). Dann gilt \(\lambda ^n(A) = \inf \{\lambda ^n(O) \;|\; O \supset A \text { offen}\}\)
    (Regularität von außen).

  • Für jede Isometrie \(f\colon \real ^n \rightarrow \real ^n\) (d. h. \(f(x) = Lx + b\) mit \(L \in \real ^{n \times n}\) orthogonal und \(b \in \real ^n\)) und alle Mengen \(A \in \B (\real ^n)\) gilt \(f(A) \in \B (\real ^n)\) sowie \(\lambda ^n(f(A)) = \lambda ^n(A)\)
    (Bewegungsinvarianz des Lebesgue-Maßes).

Bemerkung: Es gibt kein bewegungsinvariantes Maß \(\mu \colon \P (\real ) \rightarrow [0, \infty ]\) mit \(\mu ([0, 1]) = 1\)
(Unlösbarkeit des Maßproblems). Mithilfe des Auswahlaxioms kann man zeigen, dass es Mengen (sog. Vitali-Mengen) gibt, die nicht messbar sind.

Konstruktion von Wahrscheinlichkeitsmaßen auf ℝ

Verteilungsfunktion:  Eine Verteilungsfunktion auf \(\real \) ist eine Funktion \(F\colon \real \rightarrow \real \) mit

  • \(F\) monoton wachsend und rechtsstetig (d. h. \(\lim _{y \to x+0} F(y) = F(y)\))

  • \(\lim _{x \to -\infty } F(x) = 0\) und \(\lim _{x \to +\infty } F(x) = 1\)

Beispiel: Die Funktion \(F\colon \real \rightarrow \real \) mit \(F(x) = 0\) für \(x < 0\), \(F(x) = 1\) für \(x > 1\) und \(F(x) = x\) für \(x \in [0, 1]\) ist eine Verteilungsfunktion.

Satz (von Verteilungsfunktion zu W-Maß): Sei \(F\colon \real \rightarrow \real \).
Dann existiert genau ein W-Maß \(P\) auf \((\real , \B (\real ))\) mit \(P((-\infty , x]) = F(x)\) für alle \(x \in \real \).

Beispiel: Die Funktion \(F\) von oben erzeugt ein W-Maß \(P\) mit \(P((-\infty , x]) = F(x)\). Es gilt \(P(A) = \lambda (A \cap [0, 1])\).

Dichte:  Eine Dichte ist eine nicht-negative, integrierbare Funktion \(f\colon \real \rightarrow [0, \infty )\) mit \(\int _{-\infty }^{+\infty } f(u)\du = 1\). Ein W-Maß \(P\) auf \(\real \) besitzt die Dichte \(f\colon \real \rightarrow [0, \infty )\), falls \(f\) eine Dichte ist und \(P((-\infty , x]) = \int _{-\infty }^x f(u)\du \) gilt (das ist äquivalent zu \(P([a, b]) = \int _a^b f(u)\du \)).

Bemerkung: In den meisten praktischen Anwendungen ist \(f\) stückweise stetig, sodass
\(f\) Riemann-integrierbar ist. Später wird ein weiterer Integrationsbegriff eingeführt
(das Lebesgue-Integral), sodass man die Integrierbarkeit auf diesen Begriff erweitern kann.

Beispiele für Wahrscheinlichkeitsmaße mit Dichte

Gleichverteilung:  Für \(a < b\) ist \(f(x) := \frac {1}{b - a} \cdot \1_{[a,b]}(x)\) eine Dichte. Sie erzeugt ein W-Maß \(\U ([a, b])\), die Gleichverteilung auf \([a, b]\). Die Verteilungsfunktion ist \(F(x) = \int _{-\infty }^x \frac {1}{b - a} \1_{[a, b]}(u) \du \), d. h. \(F(x) = 0\) für \(x < a\), \(F(x) = \frac {x - a}{b - a}\) für \(a \le x \le b\) und \(F(x) = 1\) für \(x > b\). Für die Gleichverteilung gilt \(\U ([a, b])(A) = \lambda (A \cap [a, b]) \cdot \frac {1}{b - a}\).

Exponentialverteilung:  Für \(\lambda > 0\) ist \(f(x) := \lambda \cdot e^{-\lambda x} \cdot \1_{[0, \infty )}(x)\) eine Dichte, denn
\(\int _{-\infty }^x f(u)\du = \int _0^x \lambda e^{-\lambda u} \du = [-e^{-\lambda u}]_0^x = 1 - e^{-\lambda x} \xrightarrow {x \to +\infty } 1\) für \(x \ge 0\). Die zugehörige Verteilungsfunktion ist \(F(x) = 1 - e^{-\lambda x}\). Die Dichte erzeugt ein W-Maß \(\Exp (\lambda )\), die Exponentialverteilung zum Parameter \(\lambda \).

Bemerkung: Die Exponentialverteilung ist das kontinuierliche Pendant zur geometrischen Verteilung im diskreten Fall. Zum Beispiel kann durch die Exponentialverteilung atomarer Zerfall durch Radioaktivität modelliert werden. Die Exponentialverteilung ist wie die geometrische Verteilung gedächtnislos, d. h. \(P(\{x > s + t\} \;|\; \{x > t\}) = P(\{x > s\})\).

Normalverteilung:  Für \(\mu , \sigma \in \real \) mit \(\sigma \not = 0\) ist \(\varphi _{\mu ,\sigma ^2}(x) := \frac {1}{\sqrt {2\pi \sigma ^2}} \exp \left (-\frac {(x - \mu )^2}{2\sigma ^2}\right )\) eine Dichte, denn \(\int _{-\infty }^{+\infty } \varphi _{\mu ,\sigma ^2}(u)\du = \frac {1}{\sqrt {2\pi }} \int _{-\infty }^{+\infty } exp\left (-\frac {x^2}{2}\right )\dx = \frac {1}{\sqrt {2\pi }} \sqrt {2\pi } = 1\) für \(\mu = 0\) und \(\sigma = 1\) (sonst führt man eine Koordinatensubstitution durch). Die Dichte \(\varphi _{\mu ,\sigma ^2}\) definiert ein W-Maß \(\N (\mu , \sigma ^2)\), die Normalverteilung mit Erwartungswert \(\mu \) und Varianz \(\sigma ^2\). \(\Phi _{\mu ,\sigma ^2}(x) = \frac {1}{\sqrt {2\pi \sigma ^2}} \int _{-\infty }^x \exp \left (-\frac {(u - \mu )^2}{2\sigma ^2}\right ) \du \) ist die Verteilungsfunktion zu \(\N (\mu , \sigma ^2)\).

Satz (Aussagen zu Normalverteilung):

  • \(\Psi _{\mu ,\sigma ^2}(x) = \Psi _{0,1}\left (\frac {x - \mu }{\sigma }\right )\)

  • \(\Psi _{\mu ,\sigma ^2}(2\mu - x) = 1 - \psi _{\mu ,\sigma ^2}(x)\)

Messbare Abbildungen

messbare Abbildung:  Seien \((\Omega , \A )\) und \((\Omega ’, \A ’)\) zwei Messräume. Dann heißt eine Abbildung \(f\colon \Omega \rightarrow \Omega ’\) messbar, falls \(f^{-1}(A’) \in \A \) für alle \(A’ \in \A ’\). Die Menge \(\M (\Omega , \Omega ’)\) sei die Menge der messbaren Abbildungen von \(\Omega \) nach \(\Omega ’\). Die Menge \(\M (\Omega )\) sei definiert als \(\M (\Omega , \extreal )\).

Satz (Erzeugendensystem überprüfen): Seien \((\Omega , \A )\) und \((\Omega ’, \A ’)\) zwei Messräume, \(\E ’\) ein Erzeugendensystem für \(\A ’\) und \(f\colon \Omega \rightarrow \Omega ’\). Dann ist \(f\) messbar genau dann, wenn \(f^{-1}(A’) \in \A \) für alle \(A’ \in \E ’\).

Beispiel:

  • Ist \((\Omega , \P (\Omega ))\) diskret, so ist jede Abbildung \(f\colon \Omega \rightarrow \Omega ’\) messbar.

  • Für \(f\colon \real \rightarrow \real \) stetig mit der Borel-\(\sigma \)-Algebra und \(g\colon \real ^m \rightarrow \real ^n\) stetig, so sind \(f\) und \(g\) messbar. Für \(h\colon \real \rightarrow \real \) monoton ist \(h\) ebenfalls messbar.

Satz (messbare Funktionen):

  • Für \(f\colon (\Omega , \A ) \rightarrow (\Omega ’, \A ’)\) messbar und \(g\colon (\Omega , \A ’) \rightarrow (\Omega ’’, \A ’’)\) messbar ist \(g \circ f\) auch messbar.

  • Für \(X = (X_1, \dotsc , X_n)\colon \Omega \rightarrow \real ^n\) mit \(X(\omega ) = (X_1(\omega ), \dotsc , X_n(\omega ))\) und \(X_k\colon \Omega \rightarrow \real \) gilt, dass \(X\) messbar ist genau dann, wenn \(X_1, \dotsc , X_n\) messbar sind.

Satz (messbare Funktionen):
Seien \(X_k\colon \Omega \rightarrow \extreal \) messbare Funktionen für \(k \in \natural \). Dann sind ebenfalls messbar:

  • \(c_1 X_1 + \dotsb + c_n X_n\) für \(n \in \natural \) und \(c_1, \dotsc , c_n \in \real \)

  • \(X_1 \cdot \dotsm \cdot X_n\) für \(n \in \natural \)

  • \(\sup _{k \in \natural } X_k\)

  • \(\inf _{k \in \natural } X_k\)

  • \(\limsup _{k \to \infty } X_k\)

  • \(\liminf _{k \to \infty } X_k\)

  • \(\lim _{k \to \infty } X_k\) (wenn \(X_k\) punktweise konvergiert)

Bildmaß:  Seien \((\Omega , \A )\) und \((\Omega ’, \A ’)\) zwei Messräume und \(f\colon \Omega \rightarrow \Omega ’\) eine messbare Abbildung. Ist \(\mu \) ein Maß auf \((\Omega , \A )\), so ist \(\mu _f\colon \A ’ \rightarrow [0, \infty ]\), \(\mu _f(A’) := \mu (f^{-1}(A’))\) ein Maß auf \((\Omega ’, \A ’)\). \(\mu _f\) heißt Bildmaß von \(\mu \) unter \(f\).
\(\mu _f\) ist ein W-Maß genau dann, wenn \(\mu \) ein W-Maß ist.

\(\mu \)-maßerhaltend:  Sei \((\Omega , \A , \mu )\) ein Maßraum. Eine messbare Abbildung \(T\colon \Omega \rightarrow \Omega \) heißt \(\mu \)-maßerhaltend, falls \(\mu _T = \mu \) mit \(\mu _T\) dem Bildmaß von \(\mu \) unter \(T\) gilt.

Zufallsvariablen und ihre Verteilungen

Zufallsvariable:  Seien \((\Omega , \A , P)\) ein W-Raum und \((E, \A ’)\) ein Messraum. Dann heißt eine messbare Abbildung \(X\colon \Omega \rightarrow E\) Zufallsvariable auf \(\Omega \) mit Werten in \(E\).

Verteilung:  Sei \(X\colon \Omega \rightarrow E\) eine Zufallsvariable. Dann heißt \(P_X\colon \A ’ \rightarrow [0, 1]\), \(P_X(B) := P(X \in B) = P(X^{-1}(B))\) die Verteilung von \(X\).

Verteilungsfunktion:  Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable. Dann heißt \(F_X\colon \real \rightarrow [0, 1]\), \(F_X(x) := P(X \le x) = P_X((-\infty , x])\) die Verteilungsfunktion von \(X\).

Beispiel: Beim „gebrochenen Stab“ mit \(\Omega = [0, L]\) kann man die Zufallsvariable betrachten, die jedem Ergebnis die Länge der kürzeren Bruchstücks zuordnet, also \(X\colon \Omega \rightarrow \real \) mit \(X(\omega ) = \min \{\omega , L - \omega \}\). Für die Verteilungsfunktion \(F_X\) gilt \(F_X(x) = P(X \le x) = P([0, x] \cup [L - x, L]) = 2x\) für \(x \in [0, \frac {L}{2}]\), \(F_X(x) = P(\emptyset ) = 0\) für \(x < 0\) und \(F_X(x) = P(\Omega ) = 1\) für \(x > \frac {L}{2}\). Also ist \(P_X\) die Gleichverteilung auf \([0, \frac {L}{2}]\).

Satz (Aussagen über Verteilungsfunktionen):
Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit Verteilungsfunktion \(F_X\). Dann gilt:

  • \(F_X\) ist monoton wachsend und rechtsseitig stetig.

  • \(\lim _{x \to -\infty } F_X(x) = 0\) und \(\lim _{x \to +\infty } F_X(x) = 1\)

  • Für alle \(x \in \real \) gilt \(F_X(x) - \lim _{y \to x-0} F_X(y) = P(X = x)\), wobei \(F_X(x) = \lim _{y \to x+0} F_X(y)\) aufgrund der rechtsseitigen Stetigkeit.
    Somit ist \(F_X\) stetig genau dann, wenn für alle \(x \in \real \) \(P(X = x) = 0\) gilt.

Bemerkung: Nach (a) und (b) stimmt also obige Definition der Verteilungsfunktion mit der Definition im diskreten Fall überein.

diskret verteilt/mit Dichte verteilt:  Eine reelle Zufallsvariable \(X\colon \Omega \rightarrow \real \) heißt diskret verteilt, falls \(P_X\) diskret verteilt ist. \(X\) heißt mit Dichte verteilt oder absolutstetig verteilt, falls \(P_X\) eine Dichte besitzt.

Das Lebesgue-Integral

Bemerkung: Im Folgenden sei \((\Omega , \A , \mu )\) ein Maßraum.

Lebesgue-Integral für Indikatorfunktionen:  Seien \(A \in \A \) und \(\1_A\colon \Omega \rightarrow \extreal \) mit
\(\1_A(x) = 1\) für \(x \in A\) und \(\1_A(x) = 0\) für \(x \notin A\) die zugehörige Indikatorfunktion.
Dann ist \(\1_A \in \M (\Omega )\) messbar und \(\int _\Omega \1_A d\mu := \mu (A)\) das Lebesgue-Integral von \(\1_A\).

Elementarfunktion:  Seien \(c_k \in \real \setminus \{0\}\) und \(A_k \in \A \) paarweise disjunkt für \(k \in \natural \). Dann heißt \(\varphi = \sum _{k=1}^n c_k \cdot \1_{A_k}\) Elementarfunktion über \(\Omega \). \(\E (\Omega )\) sei der Raum der Elementarfunktionen über \(\Omega \) (ein \(\real \)-Vektorraum). \(\E _+(\Omega )\) sei der Raum aller nicht-negativen Elementarfunktionen.

Lebesgue-Integral für Elementarfunktionen: 
Sei \(\varphi = \sum _{k=1}^n c_k \cdot \1_{A_k}\) eine Elementarfunktion.
Dann ist \(\int _\Omega \varphi d\mu := \sum _{k=1}^n c_k \cdot \int _{\Omega } \1_{A_k} d\mu = \sum _{k=1}^n c_k \cdot \mu (A_k)\) das Lebesgue-Integral von \(\varphi \).

Bemerkung: Man kann zeigen, dass dieses Integral wohldefiniert ist, d. h. der Wert des Integrals hängt nicht von der Zerlegung in die \(A_k\) ab. Mit dieser Definition ist das Lebesgue-Integral für Elementarfunktionen linear (d. h. \(\int _\Omega (a\varphi + b\psi ) d\mu = a \int _\Omega \varphi d\mu + b \int _\Omega \psi d\mu \) für \(\varphi , \psi \in \E (\Omega )\) mit \(a, b \in \real \)) und monoton (d. h. \(\int _\Omega \varphi d\mu \le \int _\Omega \psi d\mu \) für \(\varphi , \psi \in \E (\Omega )\) mit \(\varphi \le \psi \)).

Lebesgue-Integral für nicht-negative Funktionen:  Sei \(f \in \M (\Omega )\) mit \(f \ge 0\). Dann ist \(\int _\Omega f d\mu := \sup \left \{\left .\int _\Omega \varphi d\mu \;\right |\; \varphi \in \E _+(\Omega ),\; \varphi \le f\right \} \in [0, \infty ]\) das Lebesgue-Integral von \(f \ge 0\).
\(f\) heißt positiv Lebesgue-integrierbar (\(f \in \L ^1_+(\mu )\)), falls \(\int _\Omega f d\mu < \infty \).

Bemerkung: Damit gilt eine gewisse „Linearität“ (nämlich \(\int _\Omega (af + bg) d\mu = a \int _\Omega f d\mu + b \int _\Omega g d\mu \) für \(f, g \in \L ^1_+(\mu )\) und \(a, b \ge 0\)) und Monotonie (genauer \(f \in \L ^1_+(\mu )\) und \(\int _\Omega f d\mu \le \int _\Omega g d\mu \) für \(f \in \M (\Omega )\) und \(g \in \L ^1_+(\mu )\) mit \(0 \le f \le g\)).

punktweise Konvergenz von unten:  Seien \(f_n, f\colon \Omega \rightarrow \extreal \) Funktionen. \((f_n)_{n \in \natural }\) konvergiert punktweise von unten gegen \(f\) (\(f_n \nearrow f\)), falls \(\forall _{x \in \Omega }\; f_1(x) \le f_2(x) \le \dotsb \le f(x)\) und
\(\lim _{n \to \infty } f_n(x) = f(x)\).

Satz (Existenz einer Folge von Treppenfunktionen und Grenzwertsatz):
Sei \(f \in \M (\Omega )\) mit \(f \ge 0\). Dann gilt:

  • Es gibt eine Folge \((\varphi _n)_{n \in \natural }\) mit \(\varphi _n \in \E _+(\Omega )\) und \(\varphi _n \nearrow f\).

  • Ist \((\varphi _n)_{n \in \natural }\) eine Folge mit \(\varphi _n \in \E _+(\Omega )\) und \(\varphi _n \nearrow f\), dann gilt
    \(\int _\Omega f d\mu = \lim _{n \to \infty } \left (\int _\Omega \varphi _n d\mu \right )\).

Nullmenge, \(\mu \)-fast überall: 

  • Eine Menge \(N \in \A \) heißt Nullmenge, falls \(\mu (N) = 0\).

  • Eine Aussage \(A(x)\) mit \(x \in \Omega \) gilt \(\mu \)-fast überall (für \(\mu \)-fast alle \(x \in \Omega \)), falls es eine Nullmenge \(N \in \A \) gibt mit \(\forall _{x \in \Omega \setminus N}\; \lnot A(x)\).

  • Für zwei Funktionen \(f, g\colon \Omega \rightarrow \real \) mit \(f(x) = g(x)\) für \(\mu \)-fast alle \(x \in \Omega \) schreibt man \(f \underset {\mu }{=} g\) (analog sind auch \(f \underset {\mu }{\le } g\), \(f \underset {\mu }{<} g\), \(f \underset {\mu }{\nearrow } g\) usw. definiert).

Satz (Lebesgue-Integral invariant auf Nullmenge): Seien \(f \in \L ^1_+(\mu )\) und \(g \in \M (\Omega )\) mit \(g \ge 0\), sodass \(N := \{x \in \Omega \;|\; f(x) \not = g(x)\} \in \A \) eine Nullmenge ist.
Dann gilt \(g \in \L ^1_+(\mu )\) und \(\int _\Omega g d\mu = \int _\Omega f d\mu \).

positiver/negativer Anteil:  Sei \(f\colon \Omega \rightarrow \extreal \) eine Funktion.
Dann heißt \(f_+ := \max (f, 0)\) positiver Anteil und \(f_- := \max (-f, 0)\) negativer Anteil von \(f\).

Bemerkung: Es gilt \(f = f_+ - f_-\) und \(|f| = f_+ + f_-\).

Lebesgue-Integral:  Sei \(f \in \M (\Omega )\).
\(f\) heißt Lebesgue-integrierbar (\(f \in \L ^1(\mu )\)), falls \(f_+ \in \L ^1_+(\mu )\) und \(f_- \in L^1_+(\mu )\).
In diesem Fall ist \(\int _\Omega f d\mu := \int _\Omega f_+ d\mu - \int _\Omega f_- d\mu \) das Lebesgue-Integral von \(f\).

Satz (Aussagen über das Lebesgue-Integral):

  • \(\L ^1(\mu )\) ist ein \(\real \)-Vektorraum und es gilt \(\int _\Omega (af + bg) d\mu = a \int _\Omega f d\mu + b \int _\Omega g d\mu \) für alle \(f, g \in \L ^1(\mu )\) und \(a, b \in \real \) (Linearität).

  • Für \(f, g \in \L ^1(\mu )\) mit \(f \le g\) gilt \(\int _\Omega f d\mu \le \int _\Omega g d\mu \) (Monotonie).

  • Für \(f \in \L ^1(\mu )\) gilt \(|f| \in \L ^1(\mu )\) und \(\left |\int _\Omega f d\mu \right | \le \int _\Omega |f| d\mu \).

  • Für \(h \in \M (\Omega )\) und \(f \in \L ^1(\mu )\) mit \(|h| \le f\) gilt \(h \in \L ^1(\mu )\).

  • Für \(f \in \L ^1(\mu )\) ist \(A := \{x \in \Omega \;|\; |f(x)| = \infty \}\) eine Nullmenge.

Satz (allgemeiner Transformationssatz): Seien \((\Omega , \A , \mu )\) ein Maßraum, \((\Omega ’, \A ’)\) ein Messraum, \(T \in \M (\Omega , \Omega ’)\), \(\mu _T\) das Bildmaß von \(T\) auf \(\Omega ’\) und \(f \in \M (\Omega ’)\).
Dann gilt \(f \in \L ^1(\mu _T) \iff f \circ T \in \L ^1(\mu )\). In diesem Fall gilt \(\int _{\Omega ’} f d\mu _T = \int _\Omega (f \circ T) d\mu \).

Grenzwertsätze für das Lebesgue-Integral

Satz (Satz von Beppo-Levi zur monotonen Konvergenz):
Sei \((f_n)_{n \in \natural }\) eine Folge mit \(f_n \in \M (\Omega )\) und \(0 \le f_1 \le f_2 \le \dotsb \).
Dann gibt es ein \(f \in \M (\Omega )\) mit \(f \ge 0\) und \(f_n \xrightarrow {(\cdot )} f\) und es gilt \(\int _\Omega f d\mu = \lim _{n \to \infty } \left (\int _\Omega f_n d\mu \right )\).

Satz (Satz von Lebesgue zur majorisierten Konvergenz):
Seien \((f_n)_{n \in \natural }\) eine Folge mit \(f_n \in \M (\Omega )\), \(f \in \M (\Omega )\) mit \(f_n \xrightarrow {(\cdot )} f\) und \(h \in \L ^1(\mu )\) mit \(|f_n| \le h\).
Dann gilt \(f \in \L ^1(\mu )\) und \(\int _\Omega f d\mu = \lim _{n \to \infty } \left (\int _\Omega f_n d\mu \right )\).

Lemma (Lemma von Fatou): Seien \((f_n)_{n \in \natural }\) eine Folge mit \(f_n \in \M (\Omega )\) und \(f_n \ge 0\).
Dann gilt \(\int _\Omega (\liminf _{n \to \infty } f_n) d\mu \le \liminf _{n \to \infty } \left (\int _\Omega f_n d\mu \right )\).

Integration in ℝ und ℝⁿ

Satz (Riemann-integrierbar \(\Rightarrow \) Lebesgueintegrierbar):
Sei \(f\colon [a, b] \rightarrow \real \) messbar und Riemann-integrierbar.
Dann ist \(f \in \L ^1(\lambda )\) und \(\int _{[a, b]} f d\lambda = \int _a^b f(x)\dx \).

Satz (uneigentliche Riemann-Integrierbarkeit): Seien \(I \subset \real \) ein Intervall und \(f\colon I \rightarrow \real \) messbar, sodass \(f|_K\) für jede kompaktes Intervall \(K \subset I\) Riemann-integrierbar ist.
Dann gilt \(f \in \L ^1(\lambda ) \iff |f| \text { ist über } I \text { uneigentlich Riemann-integrierbar}\).
In diesem Fall gilt \(\int _I f d\lambda = \int _a^b f(x)\dx \).

Satz (Integration bzgl. W-Maßen mit Dichte):
Seien \((\real , \B (\real ), P)\) ein W-Raum, \(P\) ein W-Maß mit Dichtefunktion \(f\colon \real \rightarrow \real \) und \(g \in \M (\real )\).
Dann gilt \(g \in \L ^1(P) \iff g \cdot f \in \L ^1(\lambda )\).
In diesem Fall gilt \(\int _\real g dP = \int _\real g \cdot f d\lambda \) (es gilt außerdem \(\int _{[a, b]} g dP = \int _{[a, b]} g \cdot f d\lambda \)).

Satz (Satz von Fubini):
Seien \((\Omega _1, \A _1, \mu _1)\) und \((\Omega _2, \A _2, \mu _2)\) zwei \(\sigma \)-endliche Maßräume und \(f \in \M (\Omega _1 \times \Omega _2)\).
Zusätzlich gilt mindestens einer der beiden folgenden Fälle:

  • \(f \ge 0\)

  • \(f \in \L ^1(\mu _1 \otimes \mu _2)\)

Dann gilt \(\int _{\Omega _1 \times \Omega _2} f d(\mu _1 \otimes \mu _2) = \int _{\Omega _2} \left (\int _{\Omega _1} f(\omega _1, \omega _2) d\mu _1(\omega _1)\right ) d\mu _2(\omega _2)\)
\(= \int _{\Omega _1} \left (\int _{\Omega _2} f(\omega _1, \omega _2) d\mu _2(\omega _2)\right ) d\mu _1(\omega _1)\).

Integration auf diskreten Maßräumen

Bemerkung: Sei \((\Omega , \P (\Omega ), \mu )\) ein diskreter Maßraum, d. h. \(\Omega = \{\omega _1, \omega _2, \dotsc \}\) ist abzählbar. Jede Funktion \(f\colon \Omega \rightarrow \extreal \) ist automatisch messbar. Was ist das Lebesgue-Integral \(\int _\Omega f d\mu \) einer solchen Funktion?

\(f\) lässt sich als Reihe \(f = \sum _{k=1}^\infty f(\omega _k) \cdot \1_{\{\omega _k\}}\) darstellen. Für \(f \ge 0\) gilt für die Folge \((\varphi _n)_{n \in \natural }\) mit \(\varphi _n := \sum _{k=1}^n f(\omega _k) \cdot \1_{\{\omega _k\}}\), dass \(\varphi _n \in \E _+(\Omega )\) und \(\varphi _n \nearrow f\). Es gilt \(\int _\Omega \varphi _n d\mu = \sum _{k=1}^n f(\omega _k) \cdot \mu (\{\omega _k\})\). Somit ist \(f \in \L ^1_+(\omega ) \iff \int _\Omega f d\mu = \sum _{k=1}^\infty f(\omega _k) \cdot \mu (\{\omega _k\}) < \infty \).

Für eine beliebige Funktion \(f\) gilt wegen der Messbarkeit \(f \in \L ^1(\mu ) \iff |f| \in \L ^1(\mu )\) \(\iff \sum _{k=1}^\infty |f(\omega _k)| \cdot \mu (\{\omega _k\}) < \infty \iff \sum _{k=1}^\infty f(\omega _k) \cdot \mu (\{\omega _k\}) \text { konvergiert absolut}\).
In diesem Fall gilt \(\int _\Omega f d\mu = \sum _{k=1}^\infty f(\omega _k) \cdot \mu (\{\omega _k\})\).

Mit diesen Beziehungen kann man die Theorie der diskreten W-Räume als Spezialfall der Theorie der kontinuierlichen W-Räume sehen.

Wählt man speziell \(\Omega = \natural \) und \(\mu = \sigma \) das Zählmaß auf \(\natural \), so sind Funktionen \(a\colon \Omega \rightarrow \real \) eigentlich reelle Zahlenfolgen \((a_n)_{n \in \natural }\) mit \(a_n = a(n)\). Nach eben Gesagtem ist \(a\) bzgl. des Zählmaßes Lebesgue-integrierbar genau dann, wenn die Reihe \(\int _\natural a \d \sigma = \sum _{k=1}^\infty a_k\) absolut konvergiert. Daher ist die Theorie der absolut konvergenten Reihen in der Theorie des Lebesgue-Integrals enthalten.

Erwartungswerte von Zufallsvariablen

Erwartungswert: 
Seien \((\Omega , \A , P)\) ein W-Raum und \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit \(X \in \L ^1(P)\).
Dann heißt \(\EW (X) := \int _\Omega X dP\) Erwartungswert (EW) von \(X\).

Satz (Rechenregeln für den Erwartungswert): Seien \(X, Y \in \L ^1(P)\) zwei reelle Zufallsvariablen.
Dann gilt:

  • \(X + Y \in \L ^1(P)\) und \(\EW (X + Y) = \EW (X) + \EW (Y)\)

  • Für \(\alpha \in \real \) gilt \(\alpha X \in \L ^1(P)\) und \(\EW (\alpha \cdot X) = \alpha \cdot \EW (X)\).

  • Für \(A \in \A \) ist \(\1_A \in \L ^1(P)\) eine reelle Zufallsvariable und \(\EW (\1_A) = P(A)\).

  • Aus \(X \le Y\) folgt \(\EW (X) \le \EW (Y)\).

  • \(|X| \in \L ^1(P)\) ist eine reelle Zufallsvariable und \(|\EW (X)| \le \EW (|X|)\).

Satz (Transformationssatz für Erwartungswerte): Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable und \(P_X\) ihre Verteilung.
Dann ist \(X \in \L ^1(P) \iff \id _\real \in \L ^1(P_X)\). In diesem Fall gilt \(\EW (X) = \int _\Omega X dP = \int _\Omega (\id _\real \circ X) dP = \int _\real \id _\real dP_X\).
Hat \(P_X\) die Dichtefunktion \(f\), dann gilt außerdem \(\EW (X) = \int _\real x \cdot f(x) d\lambda \).

Satz (Erwartungswert von elementaren Verteilungen): Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit \(X \in \L ^1(P)\) und \(P_X\) ihre Verteilung. Dann gilt:

  • Ist \(P_X = \U ([a, b])\) (d. h. \(X\) ist gleichverteilt), dann gilt \(\EW (X) = \frac {a + b}{2}\).

  • Ist \(P_X = \Exp (\lambda )\) mit \(\lambda > 0\) (d. h. \(X\) ist exponentialverteilt), dann gilt \(\EW (X) = \frac {1}{\lambda }\).

  • Ist \(P_X = \N (\mu , \sigma ^2)\) mit \(\mu , \sigma \in \real \) und \(\sigma ^2 > 0\) (d. h. \(X\) ist normalverteilt), dann gilt \(\EW (X) = \mu \).

(stochastisch) unabhängig:  Seien \((\Omega , \A , P)\) ein W-Raum, \((E_i, \A _i)\) Messräume und
\(X_i\colon \Omega \rightarrow E_i\) Zufallsvariablen für \(i \in I\). Dann heißt die Folge \((X_i)_{i \in I}\) (stochastisch) unabhängig, falls für jede Wahl von \(B_i \in \A _i’\) (\(i \in I\)) die Ereignisse \(\{X_i \in B_i\} = X_i^{-1}\) stochastisch unabhängig sind.

Lemma (Kriterium für Unabhängigkeit von Zufallsvariablen): Seien \(X_1, X_2\colon \Omega \rightarrow \real \) zwei reelle Zufallsvariablen, \(X := (X_1, X_2)\colon \Omega \rightarrow \real ^2\) und \(P_{X_1}, P_{X_2}, P_X\) die Verteilungen dieser Zufallsvariablen.
Dann sind \(X_1\) und \(X_2\) unabhängig genau dann, wenn \(P_X = P_{X_1} \otimes P_{X_2}\).

Satz (EW von Produkt von unabhängigen ZV ist Produkt der EW):
Seien \((\Omega , \A , P)\) ein W-Raum und \(X_1, \dotsc , X_n\colon \Omega \rightarrow \real \) reelle Zufallsvariablen mit \(X_1, \dotsc , X_n \in \L ^1(P)\), die unabhängig sind. Dann ist auch \(X_1 \dotsm X_n \in \L ^1(P)\) und \(\EW (X_1 \dotsm X_n) = \EW (X_1) \dotsm \EW (X_n)\).

k-te Momente, Varianz und Streuung von Zufallsvariablen

\(p\)-fach Lebesgue-integrierbar:  Seien \((\Omega , \A , \mu )\) ein Maßraum, \(f \in \M (\Omega )\) und \(p > 0\).
Dann heißt \(f\) \(p\)-fach Lebesgue-integrierbar (\(f \in \L ^p(\mu )\)), falls \(|f| \in \L ^1(\mu )\).
In diesem Fall definiert man \(\norm {f}_p := (\int _\Omega |f|^p d\mu )^{1/p}\).

Bemerkung: \(\L ^p(\mu )\) ist ein reeller Vektorraum.
\(\norm {\cdot }_p\) ist im Allgemeinen keine Norm auf \(\L ^p(\mu )\), sondern nur eine Halbnorm. Es gilt also \(\norm {f}_p \ge 0\), \(\norm {c f}_p = |c| \norm {f}_p\) (Homogenität) und \(\norm {f + g}_p = \norm {f}_p + \norm {g}_p\) (Dreiecksungleichung, in diesem Fall als Minkowski-Ungleichung bekannt), aber aus \(\norm {f}_p = 0\) folgt nicht unbedingt \(f = 0\) (sondern nur \(f \underset {\mu }{=} 0\)). In der Tat ist \(\norm {\cdot }_p\) eine Norm genau dann, wenn \(\emptyset \) die einzige \(\mu \)-Nullmenge in \(\A \) ist.

Satz (Höldersche Ungleichung): Seien \(p, q, r > 0\) mit \(\frac {1}{p} + \frac {1}{q} = \frac {1}{r}\) sowie \(f \in \L ^p(\mu )\) und \(g \in \L ^q(\mu )\). Dann ist \(f \cdot g \in \L ^r(\mu )\) und es gilt \(\norm {f \cdot g}_r \le \norm {f}_p \cdot \norm {g}_q\).

Folgerung: Seien \((\Omega , \A , P)\) ein W-Raum und \(0 < p < q < \infty \).
Dann gilt \(\L ^q(P) \subset \L ^p(P)\) (es gilt sogar \(\norm {f}_p \le p \cdot \norm {f}_q\) für \(f \in \L ^q(P)\)).

(zentriertes) \(k\)-tes Moment:  Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \extreal \) eine Zufallsvariable und \(k \in \natural \). Für \(X \in \L ^k(P)\) oder \(X^k \ge 0\) heißt \(\EW (X^k)\) \(k\)-tes Moment und \(\EW ((X - \EW (X))^k)\) zentriertes \(k\)-tes Moment von \(X\).

Varianz: 
Das zentrierte 2. Moment \(\Var (X) := \EW ((X - \EW (X))^2) = \EW (X^2) - \EW (X)^2\) heißt Varianz von \(X\).

Standardabweichung: 
Die Wurzel \(\sigma _X := \sqrt {\Var (X)}\) der Varianz heißt Standardabweichung von \(X\).

Satz (Transformationssatz für Momente): Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable, \(P_X\) ihre Verteilung und \(k \in \natural \).
Dann ist \(X^k \in \L ^1(P) \iff x^k \in \L ^1(P_X)\) mit \(x^k\colon \real \rightarrow \real \), \(x \mapsto x^k\).
In diesem Fall gilt \(\EW (X^k) = \int _\real x^k dP_X\) und \(\EW ((X - E(X))^k) = \int _\real (x - \EW (X))^k dP_X\).

Satz (Varianz von elementaren Verteilungen): Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit \(X \in \L ^1(P)\) und \(P_X\) ihre Verteilung. Dann gilt:

  • Ist \(P_X = \U ([a, b])\) (d. h. \(X\) ist gleichverteilt), dann gilt \(\Var (X) = \frac {1}{12} (b - a)^2\).

  • Ist \(P_X = \Exp (\lambda )\) mit \(\lambda > 0\) (d. h. \(X\) ist exponentialverteilt), dann gilt \(\Var (X) = \frac {1}{\lambda ^2}\).

  • Ist \(P_X = \N (\mu , \sigma ^2)\) mit \(\mu , \sigma \in \real \) und \(\sigma ^2 > 0\) (d. h. \(X\) ist normalverteilt), dann gilt \(\Var (X) = \sigma ^2\).

Satz (Rechenregeln für die Varianz): Seien \((\Omega , \A , P)\) ein W-Raum und \(X, X_1, \dotsc , X_n\colon \Omega \rightarrow \real \) reelle Zufallsvariablen mit \(\Var (X), \Var (X_i) < \infty \) für \(i = 1, \dotsc , n\). Dann gilt:

  • Für \(\alpha , c \in \real \) ist \(\Var (\alpha \cdot X) = \alpha ^2 \cdot \Var (X)\) und \(\Var (X + c) = \Var (X)\).

  • Sind die Zufallsvariablen \(X_1, \dotsc , X_n\) unabhängig, so gilt
    \(\Var (X_1 + \dotsb + X_n) = \Var (X_1) + \dotsb + \Var (X_n)\).

  • Für \(\Var (X) = 0\) gilt \(X \underset {P}{=} \EW (X)\).

Bemerkung: Aussage (b) gilt auch schon, wenn die Bildung der Erwartungswerte irgendwelcher der beteiligten Zufallsvariablen mit der Multiplikation verträglich ist. Daher kann man diese Aussage verallgemeinern.

unkorreliert:  Seien \((\Omega , \A , P)\) ein W-Raum und \((X_i)_{i \in I}\) eine Familie von reellen Zufallsvariablen mit \(X_i \in \L ^1(P)\) mit \(I \not = \emptyset \). Dann heißt die Familie \((X_i)_{i \in I}\) unkorreliert, falls für jede endliche Teilmenge \(K \subset I\) mit \(K \not = \emptyset \) gilt, dass \(\EW (\prod _{i \in K} X_i) = \prod _{i \in K} \EW (X_i)\).

Bemerkung: Nach einem vorherigen Satz ist jede unabhängige Familie von Zufallsvariablen auch unkorelliert. Daher ist der folgende Satz eine Verallgemeinerung der Aussage (b) von eben.

Satz (Satz von  Bienaymé): Seien \((\Omega , \A , P)\) ein W-Raum und \(X_1, \dotsc , X_n\colon \Omega \rightarrow \real \) unkorrelierte, reelle Zufallsvariablen mit \(\Var (X_k) < \infty \) für \(k = 1, \dotsc , n\). Dann gilt \(\Var (X_1 + \dotsb + X_n) = \Var (X_1) + \dotsb + \Var (X_n)\).

Bemerkung: Für eine reelle Zufallsvariable \(X \in \L ^1(P)\) gilt
\(P(|X| \ge t = P_X((-\infty , -t] \cup [t, \infty )) \xrightarrow {t \to \infty } 0\) wegen der Stetigkeit von oben. Die folgende Ungliehcung ergibt eine Abschätzung der Konvergenzgeschwindigkeit in Abhängigkeit vom Grad der Integrierbarkeit von \(X\).

Satz (Markovsche Ungleichung): Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \extreal \) eine Zufallsvariable und \(q > 0\). Dann gilt:

  • Für \(X \in \L ^q(P)\) gilt \(P(|X| \ge t) \le \frac {\EW (|X|^q)}{t^q}\) für jedes \(t > 0\)
    (Markovsche Ungleichung, für \(q = 2\) Tschebyscheff-Ungleichung).

  • Wenn es ein \(c > 0\) gibt mit \(P(|X| \ge t) \le \frac {c}{t^q}\) für jedes \(t > 0\), dann gilt \(X \in \L ^{q - \varepsilon }(P)\) für jedes \(\varepsilon \in (0, q)\).

Folgerung:
Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \extreal \) eine Zufallsvariable mit \(X \in \L ^2(P)\) und \(\varepsilon > 0\).
Dann gilt \(P(|X - \EW (X)| \ge \varepsilon ) \le \frac {\Var (X)}{\varepsilon ^2}\).