Wahrscheinlichkeitstheorie – Maß- und Integrationstheorie

Die erweiterte Zahlengerade extreal

erweiterte Zahlengerade: Die erweiterte Zahlengerade ist definiert als \(\extreal := \real \cup \{\pm \infty \}\). Die Operationen \(+\) und \(\cdot \) werden auf \(\extreal \) erweitert durch \(\infty + \infty := \infty \), \((-\infty ) + (-\infty ) := -\infty \), \(-\infty < a < +\infty \) für alle \(a \in \real \) usw. Für \(c \in \real \) sei \(c \cdot \infty := \infty \) für \(c > 0\), \(c \cdot \infty := -\infty \) für \(c < 0\) und \(c \cdot \infty := 0\) für \(c = 0\). Damit ist das Produkt \(a \cdot b\) für alle \(a, b \in \extreal \) definiert.
Ausdrücke wie \(\infty - \infty \) werden undefiniert gelassen.

Intervalle und Umgebungen: Intervalle \([-\infty , a)\), \([-\infty , a]\), \((a, \infty ]\) und \([a, \infty ]\) sind definiert durch \([-\infty , a) := \{-\infty \} \cup (-\infty , a)\) usw. mit \(a \in \extreal \). Für \(\varepsilon > 0\) sind \(\varepsilon \)-Umgebungen von \(\pm \infty \) definiert durch \(U_\varepsilon (\infty ) := (\frac {1}{\varepsilon }, \infty ]\) und \(U_\varepsilon (-\infty ) := [-\infty , -\frac {1}{\varepsilon })\). Dadurch sind auch offene und abgeschlossene Teilmengen von \(\extreal \) definiert.

Bemerkung: Eine Teilmenge von \(\real \) ist offen in \(\extreal \) genau dann, wenn sie offen in \(\real \) ist. Mit „abgeschlossen“ statt „offen“ stimmt die Aussage nicht mehr: Es gibt Teilmengen von \(\real \), die zwar abgeschlossen in \(\real \), aber nicht in \(\extreal \) abgeschlossen sind (z. B. \(M = [0, \infty )\)).

Die Borel-sigma-Algebra

erzeugte \(\sigma \)-Algebra: Seien \(\Omega \not = \emptyset \) eine nicht-leere Menge und \(\E \in \P (\Omega )\) ein System von Teilmengen. Dann gibt es eine kleinste \(\sigma \)-Algebra \(\sigma (\E )\), die \(\E \) enthält. Sie heißt die von \(\E \) erzeugte \(\sigma \)-Algebra.

Beispiel: Sei \(\Omega \not = \emptyset \) eine nicht-leere Menge.

Für \(A \subset \Omega \) ist \(\sigma (\{A\}) = \{\emptyset , A, \Omega \setminus A, \Omega \}\).
Für eine Partition \((A_n)_{n \in \natural }\) von \(\Omega \) (d. h. \(A_n \subset \Omega \) paarweise disjunkt und \(\bigcup _{n \in \natural } A_n = \Omega \)) gilt \(\sigma (\{A_1, A_2, \dotsc \}) = \left \{\bigcup _{k \in K} A_k \;|\; K \subset \natural \right \}\).

Satz (Abschluss der \(\sigma \)-Algebra): Seien \(\Omega \not = \emptyset \) eine nicht-leere Menge, \(\E \in \P (\Omega )\) ein System von Teilmengen und \(A, A_1, A_2, \dotsc \in \E \). Dann ist \(\Omega \setminus A, \bigcup _{n=1}^\infty A_n, \bigcap _{n=1}^\infty A_n \in \sigma (\E )\).

Borel-\(\sigma \)-Algebra auf \(\real \): Sei \(\E (\real ) := \{(a, b] \;|\; -\infty < a \le b < \infty \}\).
Dann heißt \(\B (\real ) := \sigma (\E (\real ))\) die Borel-\(\sigma \)-Algebra auf \(\real \).
Die Elemente von \(\B (\real )\) heißen Borel-Mengen.

Beispiel: Beispiele für Borel-Mengen von \(\real \) sind

die offenen und abgeschlossenen Intervalle \((a, b) = \bigcup _{n=1}^\infty (a, b - \frac {1}{n}]\) und \([a, b] = \bigcap _{n=1}^\infty (a - \frac {1}{n}, b + \frac {1}{n})\),
die Elementarereignisse \(\{a\} = [a, a]\) (d. h. jede abzählbare Teilmenge von \(\real \)),
alle offenen und abgeschlossenen Teilmengen von \(\real \) (jede offene Menge ist eine höchstens abzählbare Vereinigung offener Intervalle) und
alle höchstens abzählbaren Vereinigungen oder Schnitte von offenen und/oder abgeschlossenen Teilmengen von \(\real \) (z. B. das Cantorsche Diskontinuum).

Bemerkung: \(\B (\real )\) hat auch andere Erzeugendensysteme:

\(\{[a, b) \;|\; -\infty < a \le b < \infty \}\)
\(\{(a, b) \;|\; -\infty < a \le b < \infty \}\)
\(\{[a, b] \;|\; -\infty < a \le b < \infty \}\)
\(\{(-\infty , b] \;|\; b \in \real \}\)
\(\{O \subset \real \;|\; O \text { offen}\}\)
\(\{A \subset \real \;|\; A \text { abgeschlossen}\}\)

Borel-\(\sigma \)-Algebra auf \(\extreal \): Sei \(\E (\extreal ) := \{(a, b] \;|\; -\infty \le a \le b \le \infty \}\).
Dann heißt \(\B (\extreal ) := \sigma (\E (\extreal ))\) die Borel-\(\sigma \)-Algebra auf \(\extreal \)

Borel-\(\sigma \)-Algebra auf \(\real ^n\): Sei \(\E (\real ^n) := \{I_1 \times \dotsb \times I_n \;|\; I_1, \dotsc , I_n \in \E (\real )\}\).
Dann heißt \(\B (\real ^n) := \sigma (\E (\real ^n))\) die Borel-\(\sigma \)-Algebra auf \(\real ^n\)

Spur-\(\sigma \)-Algebra: Sei \((\Omega , \A )\) ein Messraum und \(M \subset \Omega \) eine nicht-leere Teilmenge.
Dann ist \(\A _M := \{A \cap M \;|\; A \in \A \}\) eine \(\sigma \)-Algebra auf \(M\), die sog. Spur-\(\sigma \)-Algebra.
Ist \(M\) eine Teilmenge von \(\real \), \(\extreal \) oder \(\real ^n\), dann heißt die Spur-\(\sigma \)-Algebra \(\B (\real )_M\), \(\B (\extreal )_M\) oder \(\B (\real ^n)_M\) die Borel-\(\sigma \)-Algebra \(\B (M)\) auf \(M\).

Fortsetzung von Maßen

Halbring: Sei \(\Omega \not = \emptyset \). Dann heißt \(\H \subset \P (\Omega )\) Halbring über \(\Omega \), falls

\(\emptyset \in \H \)
\(A, B \in \H \;\Rightarrow \; A \cap B \in \H \)
Für alle \(A, B \in \H \) mit \(A \subset B\) existieren \(C_1, \dotsc , C_n \in \H \) paarweise disjunkt mit
\(B \setminus A = \bigcup _{k=1}^n C_k\).

Beispiel:

Jede \(\sigma \)-Algebra über \(\Omega \) ist ein Halbring.
Für \(\Omega \not = \emptyset \) ist \(\H := \{A \subset \Omega \;|\; |A| \le 1\} = \{\emptyset \} \cup \{\{x\} \;|\; x \in \Omega \}\) ein Halbring über \(\Omega \).
\(\E (\real ^n)\) ist ein Halbring über \(\real ^n\).

Satz (Vereinigung von zwei Mengen im Halbring): Sei \(\H \) ein Halbring über \(\Omega \) und \(A, B \in \H \).
Dann gibt es paarweise disjunkte Mengen \(C_1, \dotsc , C_n \in \H \) mit \(A \cup B = \bigcup _{k=1}^n C_k\).

Prämaß: Sei \(\H \) ein Halbring über \(\Omega \not = \emptyset \).
Dann heißt eine Abbildung \(\mu _0\colon \H \rightarrow [0, \infty ]\) Prämaß auf \(\H \), falls

\(\mu _0(\emptyset ) = 0\) (Nulltreue)
\(\mu _0(\bigcup _{n=1}^\infty A_n) = \sum _{n=1}^\infty \mu _0(A_n)\) für \(A_n \in \A \) paarweise disjunkt mit \(\bigcup _{n=1}^\infty A_n \in \H \)
(\(\sigma \)-Additivität)

Falls es zusätzlich Mengen \((A_n)_{n \in \natural }\) mit \(\mu _0(A_n) < \infty \) für alle \(n \in \natural \) und \(\bigcup _{n=1}^\infty A_n = \Omega \) gibt, so heißt \(\mu _0\) \(\sigma \)-endlich.

Beispiel:

Jedes Maß ist auch ein Prämaß.
Für \(\Omega \not = \emptyset \) und den Halbring \(\H = \{A \subset \Omega \;|\; |A| \le 1\}\) ist \(\mu _0\colon \H \rightarrow [0, \infty ]\) mit \(A \mapsto 0\) für \(A = \emptyset \) und \(A \mapsto 1\) sonst ein Prämaß. Es ist \(\sigma \)-endlich genau dann, wenn \(\Omega \) höchstens abzählbar ist.
\(\E (\real ^n) = \{(a_1, b_1] \times \dotsb \times (a_n, b_n] \;|\; a_i \le b_i\}\) ist ein Halbring. Die Abbildung \(\lambda _0^n\colon \E (\real ^n) \rightarrow [0, \infty ]\) mit \((a_1, b_1] \times \dotsb \times (a_n, b_n] \mapsto \prod _{i=1}^n (b_i - a_i)\) ist ein \(\sigma \)-endliches Prämaß und heißt Lebesgue-Prämaß.

Satz (Fortsetzungssatz von  Carathéodory):
Seien \(\H \) ein Halbring über \(\Omega \not = \emptyset \) und \(\mu _0\colon \H \rightarrow [0, \infty ]\) ein \(\sigma \)-endliches Prämaß.
Dann gibt es genau ein Maß \(\mu \colon \sigma (\H ) \rightarrow [0, \infty ]\) mit \(\mu |_\H = \mu _0\).
Außerdem gilt für \(A \in \sigma (\H )\) beliebig \(\mu (A) = \inf \{\sum _{n=1}^\infty \mu _0(B_n) \;|\; B_n \in \H ,\; A \subset \bigcup _{n=1}^\infty B_n\}\).

Folgerung: Seien \(\H \) ein Halbring über \(\Omega \not = \emptyset \) und \(\mu , \nu \colon \sigma (\H ) \rightarrow [0, \infty ]\) zwei \(\sigma \)-endliche Maße mit \(\mu |_\H = \nu |_\H \). Dann gilt \(\mu = \nu \).

Beispiel: Seien wieder \(\Omega \not = \emptyset \), \(\H = \{A \subset \Omega \;|\; |A| \le 1\}\) und \(\mu _0\colon \H \rightarrow [0, \infty ]\) wie oben. Wenn \(\Omega \) höchstens abzählbar ist, dann gibt es genau ein Maß auf \(\sigma (\H ) = P(\Omega )\) mit \(\mu |_\H = \mu _0\).
Weil das Zählmaß auch diese Eigenschaft hat, muss \(\mu \) nach dem Fortsetzungssatz von Carathéodory gleich dem Zählmaß sein (d. h. \(\mu (A) = |A| \in \natural _0 \cup \{\infty \}\)).

Lebesgue-Maß: Das Lebesgue-Prämaß \(\lambda _0^n\) lässt sich nach Carathéodory eindeutig zu einem Maß \(\lambda ^n\colon \B (\real ^n) \rightarrow [0, \infty ]\) fortsetzen. \(\lambda ^n\) heißt Lebesgue-Maß.
Es gilt \(\lambda ^n((a_1, b_1] \times \dotsb \times (a_n, b_n]) = \prod _{i=1}^n (b_i - a_i)\) bzw. insbesondere gilt für
\(\lambda := \lambda ^1\colon \B (\real ) \rightarrow [0, \infty ]\), dass \(\lambda ((a, b]) = b - a\).

Beispiel: Für \(\Omega \in \B (\real ^n)\) mit \(0 < \lambda ^n(\Omega ) < \infty \) definiert \(P\colon \B (\Omega ) \rightarrow [0, 1]\) mit \(A \mapsto \frac {\lambda ^n(A)}{\lambda ^n(\Omega )}\) ein W-Maß auf \((\Omega , \B (\Omega ))\). \(P\) heißt kontinuierliche Gleichverteilung.

Satz (Aussagen über das Lebesgue-Maß):

Für \(A \subset \real ^n\) höchstens abzählbar gilt \(\lambda ^n(A) = 0\), d. h. \(A\) ist eine Nullmenge.
Es gilt \(\lambda ^n([0, 1]^n) = 1\).
Für \(O \subset \real ^n\) offen mit \(O \not = \emptyset \) gilt \(\lambda ^n(O) > 0\).
Sei \(A \in \B (\real ^n)\) mit \(\lambda ^n(A) < \infty \). Dann gilt \(\lambda ^n(A) = \sup \{\lambda ^n(K) \;|\; K \subset A \text { kompakt}\}\)
(Regularität von innen).
Sei \(A \in \B (\real ^n)\). Dann gilt \(\lambda ^n(A) = \inf \{\lambda ^n(O) \;|\; O \supset A \text { offen}\}\)
(Regularität von außen).
Für jede Isometrie \(f\colon \real ^n \rightarrow \real ^n\) (d. h. \(f(x) = Lx + b\) mit \(L \in \real ^{n \times n}\) orthogonal und \(b \in \real ^n\)) und alle Mengen \(A \in \B (\real ^n)\) gilt \(f(A) \in \B (\real ^n)\) sowie \(\lambda ^n(f(A)) = \lambda ^n(A)\)
(Bewegungsinvarianz des Lebesgue-Maßes).

Bemerkung: Es gibt kein bewegungsinvariantes Maß \(\mu \colon \P (\real ) \rightarrow [0, \infty ]\) mit \(\mu ([0, 1]) = 1\)
(Unlösbarkeit des Maßproblems). Mithilfe des Auswahlaxioms kann man zeigen, dass es Mengen (sog. Vitali-Mengen) gibt, die nicht messbar sind.

Konstruktion von Wahrscheinlichkeitsmaßen auf ℝ

Verteilungsfunktion: Eine Verteilungsfunktion auf \(\real \) ist eine Funktion \(F\colon \real \rightarrow \real \) mit

\(F\) monoton wachsend und rechtsstetig (d. h. \(\lim _{y \to x+0} F(y) = F(y)\))
\(\lim _{x \to -\infty } F(x) = 0\) und \(\lim _{x \to +\infty } F(x) = 1\)

Beispiel: Die Funktion \(F\colon \real \rightarrow \real \) mit \(F(x) = 0\) für \(x < 0\), \(F(x) = 1\) für \(x > 1\) und \(F(x) = x\) für \(x \in [0, 1]\) ist eine Verteilungsfunktion.

Satz (von Verteilungsfunktion zu W-Maß): Sei \(F\colon \real \rightarrow \real \).
Dann existiert genau ein W-Maß \(P\) auf \((\real , \B (\real ))\) mit \(P((-\infty , x]) = F(x)\) für alle \(x \in \real \).

Beispiel: Die Funktion \(F\) von oben erzeugt ein W-Maß \(P\) mit \(P((-\infty , x]) = F(x)\). Es gilt \(P(A) = \lambda (A \cap [0, 1])\).

Dichte: Eine Dichte ist eine nicht-negative, integrierbare Funktion \(f\colon \real \rightarrow [0, \infty )\) mit \(\int _{-\infty }^{+\infty } f(u)\du = 1\). Ein W-Maß \(P\) auf \(\real \) besitzt die Dichte \(f\colon \real \rightarrow [0, \infty )\), falls \(f\) eine Dichte ist und \(P((-\infty , x]) = \int _{-\infty }^x f(u)\du \) gilt (das ist äquivalent zu \(P([a, b]) = \int _a^b f(u)\du \)).

Bemerkung: In den meisten praktischen Anwendungen ist \(f\) stückweise stetig, sodass
\(f\) Riemann-integrierbar ist. Später wird ein weiterer Integrationsbegriff eingeführt
(das Lebesgue-Integral), sodass man die Integrierbarkeit auf diesen Begriff erweitern kann.

Beispiele für Wahrscheinlichkeitsmaße mit Dichte

Gleichverteilung: Für \(a < b\) ist \(f(x) := \frac {1}{b - a} \cdot \1_{[a,b]}(x)\) eine Dichte. Sie erzeugt ein W-Maß \(\U ([a, b])\), die Gleichverteilung auf \([a, b]\). Die Verteilungsfunktion ist \(F(x) = \int _{-\infty }^x \frac {1}{b - a} \1_{[a, b]}(u) \du \), d. h. \(F(x) = 0\) für \(x < a\), \(F(x) = \frac {x - a}{b - a}\) für \(a \le x \le b\) und \(F(x) = 1\) für \(x > b\). Für die Gleichverteilung gilt \(\U ([a, b])(A) = \lambda (A \cap [a, b]) \cdot \frac {1}{b - a}\).

Exponentialverteilung: Für \(\lambda > 0\) ist \(f(x) := \lambda \cdot e^{-\lambda x} \cdot \1_{[0, \infty )}(x)\) eine Dichte, denn
\(\int _{-\infty }^x f(u)\du = \int _0^x \lambda e^{-\lambda u} \du = [-e^{-\lambda u}]_0^x = 1 - e^{-\lambda x} \xrightarrow {x \to +\infty } 1\) für \(x \ge 0\). Die zugehörige Verteilungsfunktion ist \(F(x) = 1 - e^{-\lambda x}\). Die Dichte erzeugt ein W-Maß \(\Exp (\lambda )\), die Exponentialverteilung zum Parameter \(\lambda \).

Bemerkung: Die Exponentialverteilung ist das kontinuierliche Pendant zur geometrischen Verteilung im diskreten Fall. Zum Beispiel kann durch die Exponentialverteilung atomarer Zerfall durch Radioaktivität modelliert werden. Die Exponentialverteilung ist wie die geometrische Verteilung gedächtnislos, d. h. \(P(\{x > s + t\} \;|\; \{x > t\}) = P(\{x > s\})\).

Normalverteilung: Für \(\mu , \sigma \in \real \) mit \(\sigma \not = 0\) ist \(\varphi _{\mu ,\sigma ^2}(x) := \frac {1}{\sqrt {2\pi \sigma ^2}} \exp \left (-\frac {(x - \mu )^2}{2\sigma ^2}\right )\) eine Dichte, denn \(\int _{-\infty }^{+\infty } \varphi _{\mu ,\sigma ^2}(u)\du = \frac {1}{\sqrt {2\pi }} \int _{-\infty }^{+\infty } exp\left (-\frac {x^2}{2}\right )\dx = \frac {1}{\sqrt {2\pi }} \sqrt {2\pi } = 1\) für \(\mu = 0\) und \(\sigma = 1\) (sonst führt man eine Koordinatensubstitution durch). Die Dichte \(\varphi _{\mu ,\sigma ^2}\) definiert ein W-Maß \(\N (\mu , \sigma ^2)\), die Normalverteilung mit Erwartungswert \(\mu \) und Varianz \(\sigma ^2\). \(\Phi _{\mu ,\sigma ^2}(x) = \frac {1}{\sqrt {2\pi \sigma ^2}} \int _{-\infty }^x \exp \left (-\frac {(u - \mu )^2}{2\sigma ^2}\right ) \du \) ist die Verteilungsfunktion zu \(\N (\mu , \sigma ^2)\).

Satz (Aussagen zu Normalverteilung):

\(\Psi _{\mu ,\sigma ^2}(x) = \Psi _{0,1}\left (\frac {x - \mu }{\sigma }\right )\)
\(\Psi _{\mu ,\sigma ^2}(2\mu - x) = 1 - \psi _{\mu ,\sigma ^2}(x)\)

Messbare Abbildungen

messbare Abbildung: Seien \((\Omega , \A )\) und \((\Omega ’, \A ’)\) zwei Messräume. Dann heißt eine Abbildung \(f\colon \Omega \rightarrow \Omega ’\) messbar, falls \(f^{-1}(A’) \in \A \) für alle \(A’ \in \A ’\). Die Menge \(\M (\Omega , \Omega ’)\) sei die Menge der messbaren Abbildungen von \(\Omega \) nach \(\Omega ’\). Die Menge \(\M (\Omega )\) sei definiert als \(\M (\Omega , \extreal )\).

Satz (Erzeugendensystem überprüfen): Seien \((\Omega , \A )\) und \((\Omega ’, \A ’)\) zwei Messräume, \(\E ’\) ein Erzeugendensystem für \(\A ’\) und \(f\colon \Omega \rightarrow \Omega ’\). Dann ist \(f\) messbar genau dann, wenn \(f^{-1}(A’) \in \A \) für alle \(A’ \in \E ’\).

Beispiel:

Ist \((\Omega , \P (\Omega ))\) diskret, so ist jede Abbildung \(f\colon \Omega \rightarrow \Omega ’\) messbar.
Für \(f\colon \real \rightarrow \real \) stetig mit der Borel-\(\sigma \)-Algebra und \(g\colon \real ^m \rightarrow \real ^n\) stetig, so sind \(f\) und \(g\) messbar. Für \(h\colon \real \rightarrow \real \) monoton ist \(h\) ebenfalls messbar.

Satz (messbare Funktionen):

Für \(f\colon (\Omega , \A ) \rightarrow (\Omega ’, \A ’)\) messbar und \(g\colon (\Omega , \A ’) \rightarrow (\Omega ’’, \A ’’)\) messbar ist \(g \circ f\) auch messbar.
Für \(X = (X_1, \dotsc , X_n)\colon \Omega \rightarrow \real ^n\) mit \(X(\omega ) = (X_1(\omega ), \dotsc , X_n(\omega ))\) und \(X_k\colon \Omega \rightarrow \real \) gilt, dass \(X\) messbar ist genau dann, wenn \(X_1, \dotsc , X_n\) messbar sind.

Satz (messbare Funktionen):
Seien \(X_k\colon \Omega \rightarrow \extreal \) messbare Funktionen für \(k \in \natural \). Dann sind ebenfalls messbar:

\(c_1 X_1 + \dotsb + c_n X_n\) für \(n \in \natural \) und \(c_1, \dotsc , c_n \in \real \)
\(X_1 \cdot \dotsm \cdot X_n\) für \(n \in \natural \)
\(\sup _{k \in \natural } X_k\)
\(\inf _{k \in \natural } X_k\)
\(\limsup _{k \to \infty } X_k\)
\(\liminf _{k \to \infty } X_k\)
\(\lim _{k \to \infty } X_k\) (wenn \(X_k\) punktweise konvergiert)

Bildmaß: Seien \((\Omega , \A )\) und \((\Omega ’, \A ’)\) zwei Messräume und \(f\colon \Omega \rightarrow \Omega ’\) eine messbare Abbildung. Ist \(\mu \) ein Maß auf \((\Omega , \A )\), so ist \(\mu _f\colon \A ’ \rightarrow [0, \infty ]\), \(\mu _f(A’) := \mu (f^{-1}(A’))\) ein Maß auf \((\Omega ’, \A ’)\). \(\mu _f\) heißt Bildmaß von \(\mu \) unter \(f\).
\(\mu _f\) ist ein W-Maß genau dann, wenn \(\mu \) ein W-Maß ist.

\(\mu \)-maßerhaltend: Sei \((\Omega , \A , \mu )\) ein Maßraum. Eine messbare Abbildung \(T\colon \Omega \rightarrow \Omega \) heißt \(\mu \)-maßerhaltend, falls \(\mu _T = \mu \) mit \(\mu _T\) dem Bildmaß von \(\mu \) unter \(T\) gilt.

Zufallsvariablen und ihre Verteilungen

Zufallsvariable: Seien \((\Omega , \A , P)\) ein W-Raum und \((E, \A ’)\) ein Messraum. Dann heißt eine messbare Abbildung \(X\colon \Omega \rightarrow E\) Zufallsvariable auf \(\Omega \) mit Werten in \(E\).

Verteilung: Sei \(X\colon \Omega \rightarrow E\) eine Zufallsvariable. Dann heißt \(P_X\colon \A ’ \rightarrow [0, 1]\), \(P_X(B) := P(X \in B) = P(X^{-1}(B))\) die Verteilung von \(X\).

Verteilungsfunktion: Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable. Dann heißt \(F_X\colon \real \rightarrow [0, 1]\), \(F_X(x) := P(X \le x) = P_X((-\infty , x])\) die Verteilungsfunktion von \(X\).

Beispiel: Beim „gebrochenen Stab“ mit \(\Omega = [0, L]\) kann man die Zufallsvariable betrachten, die jedem Ergebnis die Länge der kürzeren Bruchstücks zuordnet, also \(X\colon \Omega \rightarrow \real \) mit \(X(\omega ) = \min \{\omega , L - \omega \}\). Für die Verteilungsfunktion \(F_X\) gilt \(F_X(x) = P(X \le x) = P([0, x] \cup [L - x, L]) = 2x\) für \(x \in [0, \frac {L}{2}]\), \(F_X(x) = P(\emptyset ) = 0\) für \(x < 0\) und \(F_X(x) = P(\Omega ) = 1\) für \(x > \frac {L}{2}\). Also ist \(P_X\) die Gleichverteilung auf \([0, \frac {L}{2}]\).

Satz (Aussagen über Verteilungsfunktionen):
Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit Verteilungsfunktion \(F_X\). Dann gilt:

\(F_X\) ist monoton wachsend und rechtsseitig stetig.
\(\lim _{x \to -\infty } F_X(x) = 0\) und \(\lim _{x \to +\infty } F_X(x) = 1\)
Für alle \(x \in \real \) gilt \(F_X(x) - \lim _{y \to x-0} F_X(y) = P(X = x)\), wobei \(F_X(x) = \lim _{y \to x+0} F_X(y)\) aufgrund der rechtsseitigen Stetigkeit.
Somit ist \(F_X\) stetig genau dann, wenn für alle \(x \in \real \) \(P(X = x) = 0\) gilt.

Bemerkung: Nach (a) und (b) stimmt also obige Definition der Verteilungsfunktion mit der Definition im diskreten Fall überein.

diskret verteilt/mit Dichte verteilt: Eine reelle Zufallsvariable \(X\colon \Omega \rightarrow \real \) heißt diskret verteilt, falls \(P_X\) diskret verteilt ist. \(X\) heißt mit Dichte verteilt oder absolutstetig verteilt, falls \(P_X\) eine Dichte besitzt.

Das Lebesgue-Integral

Bemerkung: Im Folgenden sei \((\Omega , \A , \mu )\) ein Maßraum.

Lebesgue-Integral für Indikatorfunktionen: Seien \(A \in \A \) und \(\1_A\colon \Omega \rightarrow \extreal \) mit
\(\1_A(x) = 1\) für \(x \in A\) und \(\1_A(x) = 0\) für \(x \notin A\) die zugehörige Indikatorfunktion.
Dann ist \(\1_A \in \M (\Omega )\) messbar und \(\int _\Omega \1_A d\mu := \mu (A)\) das Lebesgue-Integral von \(\1_A\).

Elementarfunktion: Seien \(c_k \in \real \setminus \{0\}\) und \(A_k \in \A \) paarweise disjunkt für \(k \in \natural \). Dann heißt \(\varphi = \sum _{k=1}^n c_k \cdot \1_{A_k}\) Elementarfunktion über \(\Omega \). \(\E (\Omega )\) sei der Raum der Elementarfunktionen über \(\Omega \) (ein \(\real \)-Vektorraum). \(\E _+(\Omega )\) sei der Raum aller nicht-negativen Elementarfunktionen.

Lebesgue-Integral für Elementarfunktionen:
Sei \(\varphi = \sum _{k=1}^n c_k \cdot \1_{A_k}\) eine Elementarfunktion.
Dann ist \(\int _\Omega \varphi d\mu := \sum _{k=1}^n c_k \cdot \int _{\Omega } \1_{A_k} d\mu = \sum _{k=1}^n c_k \cdot \mu (A_k)\) das Lebesgue-Integral von \(\varphi \).

Bemerkung: Man kann zeigen, dass dieses Integral wohldefiniert ist, d. h. der Wert des Integrals hängt nicht von der Zerlegung in die \(A_k\) ab. Mit dieser Definition ist das Lebesgue-Integral für Elementarfunktionen linear (d. h. \(\int _\Omega (a\varphi + b\psi ) d\mu = a \int _\Omega \varphi d\mu + b \int _\Omega \psi d\mu \) für \(\varphi , \psi \in \E (\Omega )\) mit \(a, b \in \real \)) und monoton (d. h. \(\int _\Omega \varphi d\mu \le \int _\Omega \psi d\mu \) für \(\varphi , \psi \in \E (\Omega )\) mit \(\varphi \le \psi \)).

Lebesgue-Integral für nicht-negative Funktionen: Sei \(f \in \M (\Omega )\) mit \(f \ge 0\). Dann ist \(\int _\Omega f d\mu := \sup \left \{\left .\int _\Omega \varphi d\mu \;\right |\; \varphi \in \E _+(\Omega ),\; \varphi \le f\right \} \in [0, \infty ]\) das Lebesgue-Integral von \(f \ge 0\).
\(f\) heißt positiv Lebesgue-integrierbar (\(f \in \L ^1_+(\mu )\)), falls \(\int _\Omega f d\mu < \infty \).

Bemerkung: Damit gilt eine gewisse „Linearität“ (nämlich \(\int _\Omega (af + bg) d\mu = a \int _\Omega f d\mu + b \int _\Omega g d\mu \) für \(f, g \in \L ^1_+(\mu )\) und \(a, b \ge 0\)) und Monotonie (genauer \(f \in \L ^1_+(\mu )\) und \(\int _\Omega f d\mu \le \int _\Omega g d\mu \) für \(f \in \M (\Omega )\) und \(g \in \L ^1_+(\mu )\) mit \(0 \le f \le g\)).

punktweise Konvergenz von unten: Seien \(f_n, f\colon \Omega \rightarrow \extreal \) Funktionen. \((f_n)_{n \in \natural }\) konvergiert punktweise von unten gegen \(f\) (\(f_n \nearrow f\)), falls \(\forall _{x \in \Omega }\; f_1(x) \le f_2(x) \le \dotsb \le f(x)\) und
\(\lim _{n \to \infty } f_n(x) = f(x)\).

Satz (Existenz einer Folge von Treppenfunktionen und Grenzwertsatz):
Sei \(f \in \M (\Omega )\) mit \(f \ge 0\). Dann gilt:

Es gibt eine Folge \((\varphi _n)_{n \in \natural }\) mit \(\varphi _n \in \E _+(\Omega )\) und \(\varphi _n \nearrow f\).
Ist \((\varphi _n)_{n \in \natural }\) eine Folge mit \(\varphi _n \in \E _+(\Omega )\) und \(\varphi _n \nearrow f\), dann gilt
\(\int _\Omega f d\mu = \lim _{n \to \infty } \left (\int _\Omega \varphi _n d\mu \right )\).

Nullmenge, \(\mu \)-fast überall:

Eine Menge \(N \in \A \) heißt Nullmenge, falls \(\mu (N) = 0\).
Eine Aussage \(A(x)\) mit \(x \in \Omega \) gilt \(\mu \)-fast überall (für \(\mu \)-fast alle \(x \in \Omega \)), falls es eine Nullmenge \(N \in \A \) gibt mit \(\forall _{x \in \Omega \setminus N}\; \lnot A(x)\).
Für zwei Funktionen \(f, g\colon \Omega \rightarrow \real \) mit \(f(x) = g(x)\) für \(\mu \)-fast alle \(x \in \Omega \) schreibt man \(f \underset {\mu }{=} g\) (analog sind auch \(f \underset {\mu }{\le } g\), \(f \underset {\mu }{<} g\), \(f \underset {\mu }{\nearrow } g\) usw. definiert).

Satz (Lebesgue-Integral invariant auf Nullmenge): Seien \(f \in \L ^1_+(\mu )\) und \(g \in \M (\Omega )\) mit \(g \ge 0\), sodass \(N := \{x \in \Omega \;|\; f(x) \not = g(x)\} \in \A \) eine Nullmenge ist.
Dann gilt \(g \in \L ^1_+(\mu )\) und \(\int _\Omega g d\mu = \int _\Omega f d\mu \).

positiver/negativer Anteil: Sei \(f\colon \Omega \rightarrow \extreal \) eine Funktion.
Dann heißt \(f_+ := \max (f, 0)\) positiver Anteil und \(f_- := \max (-f, 0)\) negativer Anteil von \(f\).

Bemerkung: Es gilt \(f = f_+ - f_-\) und \(|f| = f_+ + f_-\).

Lebesgue-Integral: Sei \(f \in \M (\Omega )\).
\(f\) heißt Lebesgue-integrierbar (\(f \in \L ^1(\mu )\)), falls \(f_+ \in \L ^1_+(\mu )\) und \(f_- \in L^1_+(\mu )\).
In diesem Fall ist \(\int _\Omega f d\mu := \int _\Omega f_+ d\mu - \int _\Omega f_- d\mu \) das Lebesgue-Integral von \(f\).

Satz (Aussagen über das Lebesgue-Integral):

\(\L ^1(\mu )\) ist ein \(\real \)-Vektorraum und es gilt \(\int _\Omega (af + bg) d\mu = a \int _\Omega f d\mu + b \int _\Omega g d\mu \) für alle \(f, g \in \L ^1(\mu )\) und \(a, b \in \real \) (Linearität).
Für \(f, g \in \L ^1(\mu )\) mit \(f \le g\) gilt \(\int _\Omega f d\mu \le \int _\Omega g d\mu \) (Monotonie).
Für \(f \in \L ^1(\mu )\) gilt \(|f| \in \L ^1(\mu )\) und \(\left |\int _\Omega f d\mu \right | \le \int _\Omega |f| d\mu \).
Für \(h \in \M (\Omega )\) und \(f \in \L ^1(\mu )\) mit \(|h| \le f\) gilt \(h \in \L ^1(\mu )\).
Für \(f \in \L ^1(\mu )\) ist \(A := \{x \in \Omega \;|\; |f(x)| = \infty \}\) eine Nullmenge.

Satz (allgemeiner Transformationssatz): Seien \((\Omega , \A , \mu )\) ein Maßraum, \((\Omega ’, \A ’)\) ein Messraum, \(T \in \M (\Omega , \Omega ’)\), \(\mu _T\) das Bildmaß von \(T\) auf \(\Omega ’\) und \(f \in \M (\Omega ’)\).
Dann gilt \(f \in \L ^1(\mu _T) \iff f \circ T \in \L ^1(\mu )\). In diesem Fall gilt \(\int _{\Omega ’} f d\mu _T = \int _\Omega (f \circ T) d\mu \).

Grenzwertsätze für das Lebesgue-Integral

Satz (Satz von Beppo-Levi zur monotonen Konvergenz):
Sei \((f_n)_{n \in \natural }\) eine Folge mit \(f_n \in \M (\Omega )\) und \(0 \le f_1 \le f_2 \le \dotsb \).
Dann gibt es ein \(f \in \M (\Omega )\) mit \(f \ge 0\) und \(f_n \xrightarrow {(\cdot )} f\) und es gilt \(\int _\Omega f d\mu = \lim _{n \to \infty } \left (\int _\Omega f_n d\mu \right )\).

Satz (Satz von Lebesgue zur majorisierten Konvergenz):
Seien \((f_n)_{n \in \natural }\) eine Folge mit \(f_n \in \M (\Omega )\), \(f \in \M (\Omega )\) mit \(f_n \xrightarrow {(\cdot )} f\) und \(h \in \L ^1(\mu )\) mit \(|f_n| \le h\).
Dann gilt \(f \in \L ^1(\mu )\) und \(\int _\Omega f d\mu = \lim _{n \to \infty } \left (\int _\Omega f_n d\mu \right )\).

Lemma (Lemma von Fatou): Seien \((f_n)_{n \in \natural }\) eine Folge mit \(f_n \in \M (\Omega )\) und \(f_n \ge 0\).
Dann gilt \(\int _\Omega (\liminf _{n \to \infty } f_n) d\mu \le \liminf _{n \to \infty } \left (\int _\Omega f_n d\mu \right )\).

Integration in ℝ und ℝⁿ

Satz (Riemann-integrierbar \(\Rightarrow \) Lebesgueintegrierbar):
Sei \(f\colon [a, b] \rightarrow \real \) messbar und Riemann-integrierbar.
Dann ist \(f \in \L ^1(\lambda )\) und \(\int _{[a, b]} f d\lambda = \int _a^b f(x)\dx \).

Satz (uneigentliche Riemann-Integrierbarkeit): Seien \(I \subset \real \) ein Intervall und \(f\colon I \rightarrow \real \) messbar, sodass \(f|_K\) für jede kompaktes Intervall \(K \subset I\) Riemann-integrierbar ist.
Dann gilt \(f \in \L ^1(\lambda ) \iff |f| \text { ist über } I \text { uneigentlich Riemann-integrierbar}\).
In diesem Fall gilt \(\int _I f d\lambda = \int _a^b f(x)\dx \).

Satz (Integration bzgl. W-Maßen mit Dichte):
Seien \((\real , \B (\real ), P)\) ein W-Raum, \(P\) ein W-Maß mit Dichtefunktion \(f\colon \real \rightarrow \real \) und \(g \in \M (\real )\).
Dann gilt \(g \in \L ^1(P) \iff g \cdot f \in \L ^1(\lambda )\).
In diesem Fall gilt \(\int _\real g dP = \int _\real g \cdot f d\lambda \) (es gilt außerdem \(\int _{[a, b]} g dP = \int _{[a, b]} g \cdot f d\lambda \)).

Satz (Satz von Fubini):
Seien \((\Omega _1, \A _1, \mu _1)\) und \((\Omega _2, \A _2, \mu _2)\) zwei \(\sigma \)-endliche Maßräume und \(f \in \M (\Omega _1 \times \Omega _2)\).
Zusätzlich gilt mindestens einer der beiden folgenden Fälle:

\(f \ge 0\)
\(f \in \L ^1(\mu _1 \otimes \mu _2)\)

Dann gilt \(\int _{\Omega _1 \times \Omega _2} f d(\mu _1 \otimes \mu _2) = \int _{\Omega _2} \left (\int _{\Omega _1} f(\omega _1, \omega _2) d\mu _1(\omega _1)\right ) d\mu _2(\omega _2)\)
\(= \int _{\Omega _1} \left (\int _{\Omega _2} f(\omega _1, \omega _2) d\mu _2(\omega _2)\right ) d\mu _1(\omega _1)\).

Integration auf diskreten Maßräumen

Bemerkung: Sei \((\Omega , \P (\Omega ), \mu )\) ein diskreter Maßraum, d. h. \(\Omega = \{\omega _1, \omega _2, \dotsc \}\) ist abzählbar. Jede Funktion \(f\colon \Omega \rightarrow \extreal \) ist automatisch messbar. Was ist das Lebesgue-Integral \(\int _\Omega f d\mu \) einer solchen Funktion?

\(f\) lässt sich als Reihe \(f = \sum _{k=1}^\infty f(\omega _k) \cdot \1_{\{\omega _k\}}\) darstellen. Für \(f \ge 0\) gilt für die Folge \((\varphi _n)_{n \in \natural }\) mit \(\varphi _n := \sum _{k=1}^n f(\omega _k) \cdot \1_{\{\omega _k\}}\), dass \(\varphi _n \in \E _+(\Omega )\) und \(\varphi _n \nearrow f\). Es gilt \(\int _\Omega \varphi _n d\mu = \sum _{k=1}^n f(\omega _k) \cdot \mu (\{\omega _k\})\). Somit ist \(f \in \L ^1_+(\omega ) \iff \int _\Omega f d\mu = \sum _{k=1}^\infty f(\omega _k) \cdot \mu (\{\omega _k\}) < \infty \).

Für eine beliebige Funktion \(f\) gilt wegen der Messbarkeit \(f \in \L ^1(\mu ) \iff |f| \in \L ^1(\mu )\) \(\iff \sum _{k=1}^\infty |f(\omega _k)| \cdot \mu (\{\omega _k\}) < \infty \iff \sum _{k=1}^\infty f(\omega _k) \cdot \mu (\{\omega _k\}) \text { konvergiert absolut}\).
In diesem Fall gilt \(\int _\Omega f d\mu = \sum _{k=1}^\infty f(\omega _k) \cdot \mu (\{\omega _k\})\).

Mit diesen Beziehungen kann man die Theorie der diskreten W-Räume als Spezialfall der Theorie der kontinuierlichen W-Räume sehen.

Wählt man speziell \(\Omega = \natural \) und \(\mu = \sigma \) das Zählmaß auf \(\natural \), so sind Funktionen \(a\colon \Omega \rightarrow \real \) eigentlich reelle Zahlenfolgen \((a_n)_{n \in \natural }\) mit \(a_n = a(n)\). Nach eben Gesagtem ist \(a\) bzgl. des Zählmaßes Lebesgue-integrierbar genau dann, wenn die Reihe \(\int _\natural a \d \sigma = \sum _{k=1}^\infty a_k\) absolut konvergiert. Daher ist die Theorie der absolut konvergenten Reihen in der Theorie des Lebesgue-Integrals enthalten.

Erwartungswerte von Zufallsvariablen

Erwartungswert:
Seien \((\Omega , \A , P)\) ein W-Raum und \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit \(X \in \L ^1(P)\).
Dann heißt \(\EW (X) := \int _\Omega X dP\) Erwartungswert (EW) von \(X\).

Satz (Rechenregeln für den Erwartungswert): Seien \(X, Y \in \L ^1(P)\) zwei reelle Zufallsvariablen.
Dann gilt:

\(X + Y \in \L ^1(P)\) und \(\EW (X + Y) = \EW (X) + \EW (Y)\)
Für \(\alpha \in \real \) gilt \(\alpha X \in \L ^1(P)\) und \(\EW (\alpha \cdot X) = \alpha \cdot \EW (X)\).
Für \(A \in \A \) ist \(\1_A \in \L ^1(P)\) eine reelle Zufallsvariable und \(\EW (\1_A) = P(A)\).
Aus \(X \le Y\) folgt \(\EW (X) \le \EW (Y)\).
\(|X| \in \L ^1(P)\) ist eine reelle Zufallsvariable und \(|\EW (X)| \le \EW (|X|)\).

Satz (Transformationssatz für Erwartungswerte): Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable und \(P_X\) ihre Verteilung.
Dann ist \(X \in \L ^1(P) \iff \id _\real \in \L ^1(P_X)\). In diesem Fall gilt \(\EW (X) = \int _\Omega X dP = \int _\Omega (\id _\real \circ X) dP = \int _\real \id _\real dP_X\).
Hat \(P_X\) die Dichtefunktion \(f\), dann gilt außerdem \(\EW (X) = \int _\real x \cdot f(x) d\lambda \).

Satz (Erwartungswert von elementaren Verteilungen): Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit \(X \in \L ^1(P)\) und \(P_X\) ihre Verteilung. Dann gilt:

Ist \(P_X = \U ([a, b])\) (d. h. \(X\) ist gleichverteilt), dann gilt \(\EW (X) = \frac {a + b}{2}\).
Ist \(P_X = \Exp (\lambda )\) mit \(\lambda > 0\) (d. h. \(X\) ist exponentialverteilt), dann gilt \(\EW (X) = \frac {1}{\lambda }\).
Ist \(P_X = \N (\mu , \sigma ^2)\) mit \(\mu , \sigma \in \real \) und \(\sigma ^2 > 0\) (d. h. \(X\) ist normalverteilt), dann gilt \(\EW (X) = \mu \).

(stochastisch) unabhängig: Seien \((\Omega , \A , P)\) ein W-Raum, \((E_i, \A _i)\) Messräume und
\(X_i\colon \Omega \rightarrow E_i\) Zufallsvariablen für \(i \in I\). Dann heißt die Folge \((X_i)_{i \in I}\) (stochastisch) unabhängig, falls für jede Wahl von \(B_i \in \A _i’\) (\(i \in I\)) die Ereignisse \(\{X_i \in B_i\} = X_i^{-1}\) stochastisch unabhängig sind.

Lemma (Kriterium für Unabhängigkeit von Zufallsvariablen): Seien \(X_1, X_2\colon \Omega \rightarrow \real \) zwei reelle Zufallsvariablen, \(X := (X_1, X_2)\colon \Omega \rightarrow \real ^2\) und \(P_{X_1}, P_{X_2}, P_X\) die Verteilungen dieser Zufallsvariablen.
Dann sind \(X_1\) und \(X_2\) unabhängig genau dann, wenn \(P_X = P_{X_1} \otimes P_{X_2}\).

Satz (EW von Produkt von unabhängigen ZV ist Produkt der EW):
Seien \((\Omega , \A , P)\) ein W-Raum und \(X_1, \dotsc , X_n\colon \Omega \rightarrow \real \) reelle Zufallsvariablen mit \(X_1, \dotsc , X_n \in \L ^1(P)\), die unabhängig sind. Dann ist auch \(X_1 \dotsm X_n \in \L ^1(P)\) und \(\EW (X_1 \dotsm X_n) = \EW (X_1) \dotsm \EW (X_n)\).

k-te Momente, Varianz und Streuung von Zufallsvariablen

\(p\)-fach Lebesgue-integrierbar: Seien \((\Omega , \A , \mu )\) ein Maßraum, \(f \in \M (\Omega )\) und \(p > 0\).
Dann heißt \(f\) \(p\)-fach Lebesgue-integrierbar (\(f \in \L ^p(\mu )\)), falls \(|f| \in \L ^1(\mu )\).
In diesem Fall definiert man \(\norm {f}_p := (\int _\Omega |f|^p d\mu )^{1/p}\).

Bemerkung: \(\L ^p(\mu )\) ist ein reeller Vektorraum.
\(\norm {\cdot }_p\) ist im Allgemeinen keine Norm auf \(\L ^p(\mu )\), sondern nur eine Halbnorm. Es gilt also \(\norm {f}_p \ge 0\), \(\norm {c f}_p = |c| \norm {f}_p\) (Homogenität) und \(\norm {f + g}_p = \norm {f}_p + \norm {g}_p\) (Dreiecksungleichung, in diesem Fall als Minkowski-Ungleichung bekannt), aber aus \(\norm {f}_p = 0\) folgt nicht unbedingt \(f = 0\) (sondern nur \(f \underset {\mu }{=} 0\)). In der Tat ist \(\norm {\cdot }_p\) eine Norm genau dann, wenn \(\emptyset \) die einzige \(\mu \)-Nullmenge in \(\A \) ist.

Satz (Höldersche Ungleichung): Seien \(p, q, r > 0\) mit \(\frac {1}{p} + \frac {1}{q} = \frac {1}{r}\) sowie \(f \in \L ^p(\mu )\) und \(g \in \L ^q(\mu )\). Dann ist \(f \cdot g \in \L ^r(\mu )\) und es gilt \(\norm {f \cdot g}_r \le \norm {f}_p \cdot \norm {g}_q\).

Folgerung: Seien \((\Omega , \A , P)\) ein W-Raum und \(0 < p < q < \infty \).
Dann gilt \(\L ^q(P) \subset \L ^p(P)\) (es gilt sogar \(\norm {f}_p \le p \cdot \norm {f}_q\) für \(f \in \L ^q(P)\)).

(zentriertes) \(k\)-tes Moment: Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \extreal \) eine Zufallsvariable und \(k \in \natural \). Für \(X \in \L ^k(P)\) oder \(X^k \ge 0\) heißt \(\EW (X^k)\) \(k\)-tes Moment und \(\EW ((X - \EW (X))^k)\) zentriertes \(k\)-tes Moment von \(X\).

Varianz:
Das zentrierte 2. Moment \(\Var (X) := \EW ((X - \EW (X))^2) = \EW (X^2) - \EW (X)^2\) heißt Varianz von \(X\).

Standardabweichung:
Die Wurzel \(\sigma _X := \sqrt {\Var (X)}\) der Varianz heißt Standardabweichung von \(X\).

Satz (Transformationssatz für Momente): Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable, \(P_X\) ihre Verteilung und \(k \in \natural \).
Dann ist \(X^k \in \L ^1(P) \iff x^k \in \L ^1(P_X)\) mit \(x^k\colon \real \rightarrow \real \), \(x \mapsto x^k\).
In diesem Fall gilt \(\EW (X^k) = \int _\real x^k dP_X\) und \(\EW ((X - E(X))^k) = \int _\real (x - \EW (X))^k dP_X\).

Satz (Varianz von elementaren Verteilungen): Sei \(X\colon \Omega \rightarrow \real \) eine reelle Zufallsvariable mit \(X \in \L ^1(P)\) und \(P_X\) ihre Verteilung. Dann gilt:

Ist \(P_X = \U ([a, b])\) (d. h. \(X\) ist gleichverteilt), dann gilt \(\Var (X) = \frac {1}{12} (b - a)^2\).
Ist \(P_X = \Exp (\lambda )\) mit \(\lambda > 0\) (d. h. \(X\) ist exponentialverteilt), dann gilt \(\Var (X) = \frac {1}{\lambda ^2}\).
Ist \(P_X = \N (\mu , \sigma ^2)\) mit \(\mu , \sigma \in \real \) und \(\sigma ^2 > 0\) (d. h. \(X\) ist normalverteilt), dann gilt \(\Var (X) = \sigma ^2\).

Satz (Rechenregeln für die Varianz): Seien \((\Omega , \A , P)\) ein W-Raum und \(X, X_1, \dotsc , X_n\colon \Omega \rightarrow \real \) reelle Zufallsvariablen mit \(\Var (X), \Var (X_i) < \infty \) für \(i = 1, \dotsc , n\). Dann gilt:

Für \(\alpha , c \in \real \) ist \(\Var (\alpha \cdot X) = \alpha ^2 \cdot \Var (X)\) und \(\Var (X + c) = \Var (X)\).
Sind die Zufallsvariablen \(X_1, \dotsc , X_n\) unabhängig, so gilt
\(\Var (X_1 + \dotsb + X_n) = \Var (X_1) + \dotsb + \Var (X_n)\).
Für \(\Var (X) = 0\) gilt \(X \underset {P}{=} \EW (X)\).

Bemerkung: Aussage (b) gilt auch schon, wenn die Bildung der Erwartungswerte irgendwelcher der beteiligten Zufallsvariablen mit der Multiplikation verträglich ist. Daher kann man diese Aussage verallgemeinern.

unkorreliert: Seien \((\Omega , \A , P)\) ein W-Raum und \((X_i)_{i \in I}\) eine Familie von reellen Zufallsvariablen mit \(X_i \in \L ^1(P)\) mit \(I \not = \emptyset \). Dann heißt die Familie \((X_i)_{i \in I}\) unkorreliert, falls für jede endliche Teilmenge \(K \subset I\) mit \(K \not = \emptyset \) gilt, dass \(\EW (\prod _{i \in K} X_i) = \prod _{i \in K} \EW (X_i)\).

Bemerkung: Nach einem vorherigen Satz ist jede unabhängige Familie von Zufallsvariablen auch unkorelliert. Daher ist der folgende Satz eine Verallgemeinerung der Aussage (b) von eben.

Satz (Satz von  Bienaymé): Seien \((\Omega , \A , P)\) ein W-Raum und \(X_1, \dotsc , X_n\colon \Omega \rightarrow \real \) unkorrelierte, reelle Zufallsvariablen mit \(\Var (X_k) < \infty \) für \(k = 1, \dotsc , n\). Dann gilt \(\Var (X_1 + \dotsb + X_n) = \Var (X_1) + \dotsb + \Var (X_n)\).

Bemerkung: Für eine reelle Zufallsvariable \(X \in \L ^1(P)\) gilt
\(P(|X| \ge t = P_X((-\infty , -t] \cup [t, \infty )) \xrightarrow {t \to \infty } 0\) wegen der Stetigkeit von oben. Die folgende Ungliehcung ergibt eine Abschätzung der Konvergenzgeschwindigkeit in Abhängigkeit vom Grad der Integrierbarkeit von \(X\).

Satz (Markovsche Ungleichung): Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \extreal \) eine Zufallsvariable und \(q > 0\). Dann gilt:

Für \(X \in \L ^q(P)\) gilt \(P(|X| \ge t) \le \frac {\EW (|X|^q)}{t^q}\) für jedes \(t > 0\)
(Markovsche Ungleichung, für \(q = 2\) Tschebyscheff-Ungleichung).
Wenn es ein \(c > 0\) gibt mit \(P(|X| \ge t) \le \frac {c}{t^q}\) für jedes \(t > 0\), dann gilt \(X \in \L ^{q - \varepsilon }(P)\) für jedes \(\varepsilon \in (0, q)\).

Folgerung:
Seien \((\Omega , \A , P)\) ein W-Raum, \(X\colon \Omega \rightarrow \extreal \) eine Zufallsvariable mit \(X \in \L ^2(P)\) und \(\varepsilon > 0\).
Dann gilt \(P(|X - \EW (X)| \ge \varepsilon ) \le \frac {\Var (X)}{\varepsilon ^2}\).