Die erweiterte Zahlengerade extreal

erweiterte Zahlengerade:  Die erweiterte Zahlengerade ist definiert als R^:=R{±}. Die Operationen + und werden auf R^ erweitert durch +:=, ()+():=, <a<+ für alle aR usw. Für cR sei c:= für c>0, c:= für c<0 und c:=0 für c=0. Damit ist das Produkt ab für alle a,bR^ definiert.
Ausdrücke wie werden undefiniert gelassen.

Intervalle und Umgebungen:  Intervalle [,a), [,a], (a,] und [a,] sind definiert durch [,a):={}(,a) usw. mit aR^. Für ε>0 sind ε-Umgebungen von ± definiert durch Uε():=(1ε,] und Uε():=[,1ε). Dadurch sind auch offene und abgeschlossene Teilmengen von R^ definiert.

Bemerkung: Eine Teilmenge von R ist offen in R^ genau dann, wenn sie offen in R ist. Mit „abgeschlossen“ statt „offen“ stimmt die Aussage nicht mehr: Es gibt Teilmengen von R, die zwar abgeschlossen in R, aber nicht in R^ abgeschlossen sind (z. B. M=[0,)).

Die Borel-sigma-Algebra

erzeugte σ-Algebra:  Seien Ω eine nicht-leere Menge und EP(Ω) ein System von Teilmengen. Dann gibt es eine kleinste σ-Algebra σ(E), die E enthält. Sie heißt die von E erzeugte σ-Algebra.

Beispiel: Sei Ω eine nicht-leere Menge.

  • Für AΩ ist σ({A})={,A,ΩA,Ω}.

  • Für eine Partition (An)nN von Ω (d. h. AnΩ paarweise disjunkt und nNAn=Ω) gilt σ({A1,A2,})={kKAk|KN}.

Satz (Abschluss der σ-Algebra): Seien Ω eine nicht-leere Menge, EP(Ω) ein System von Teilmengen und A,A1,A2,E. Dann ist ΩA,n=1An,n=1Anσ(E).

Borel-σ-Algebra auf R:  Sei E(R):={(a,b]|<ab<}.
Dann heißt B(R):=σ(E(R)) die Borel-σ-Algebra auf R.
Die Elemente von B(R) heißen Borel-Mengen.

Beispiel: Beispiele für Borel-Mengen von R sind

  • die offenen und abgeschlossenen Intervalle (a,b)=n=1(a,b1n] und [a,b]=n=1(a1n,b+1n),

  • die Elementarereignisse {a}=[a,a] (d. h. jede abzählbare Teilmenge von R),

  • alle offenen und abgeschlossenen Teilmengen von R (jede offene Menge ist eine höchstens abzählbare Vereinigung offener Intervalle) und

  • alle höchstens abzählbaren Vereinigungen oder Schnitte von offenen und/oder abgeschlossenen Teilmengen von R (z. B. das Cantorsche Diskontinuum).

Bemerkung: B(R) hat auch andere Erzeugendensysteme:

  • {[a,b)|<ab<}

  • {(a,b)|<ab<}

  • {[a,b]|<ab<}

  • {(,b]|bR}

  • {OR|O offen}

  • {AR|A abgeschlossen}

Borel-σ-Algebra auf R^:  Sei E(R^):={(a,b]|ab}.
Dann heißt B(R^):=σ(E(R^)) die Borel-σ-Algebra auf R^

Borel-σ-Algebra auf Rn:  Sei E(Rn):={I1××In|I1,,InE(R)}.
Dann heißt B(Rn):=σ(E(Rn)) die Borel-σ-Algebra auf Rn

Spur-σ-Algebra:  Sei (Ω,A) ein Messraum und MΩ eine nicht-leere Teilmenge.
Dann ist AM:={AM|AA} eine σ-Algebra auf M, die sog. Spur-σ-Algebra.
Ist M eine Teilmenge von R, R^ oder Rn, dann heißt die Spur-σ-Algebra B(R)M, B(R^)M oder B(Rn)M die Borel-σ-Algebra B(M) auf M.

Fortsetzung von Maßen

Halbring:  Sei Ω. Dann heißt HP(Ω) Halbring über Ω, falls

  • H

  • A,BHABH

  • Für alle A,BH mit AB existieren C1,,CnH paarweise disjunkt mit
    BA=k=1nCk.

Beispiel:

  • Jede σ-Algebra über Ω ist ein Halbring.

  • Für Ω ist H:={AΩ||A|1}={}{{x}|xΩ} ein Halbring über Ω.

  • E(Rn) ist ein Halbring über Rn.

Satz (Vereinigung von zwei Mengen im Halbring): Sei H ein Halbring über Ω und A,BH.
Dann gibt es paarweise disjunkte Mengen C1,,CnH mit AB=k=1nCk.

Prämaß:  Sei H ein Halbring über Ω.
Dann heißt eine Abbildung μ0:H[0,] Prämaß auf H, falls

  • μ0()=0 (Nulltreue)

  • μ0(n=1An)=n=1μ0(An) für AnA paarweise disjunkt mit n=1AnH
    (σ-Additivität)

Falls es zusätzlich Mengen (An)nN mit μ0(An)< für alle nN und n=1An=Ω gibt, so heißt μ0 σ-endlich.

Beispiel:

  • Jedes Maß ist auch ein Prämaß.

  • Für Ω und den Halbring H={AΩ||A|1} ist μ0:H[0,] mit A0 für A= und A1 sonst ein Prämaß. Es ist σ-endlich genau dann, wenn Ω höchstens abzählbar ist.

  • E(Rn)={(a1,b1]××(an,bn]|aibi} ist ein Halbring. Die Abbildung λ0n:E(Rn)[0,] mit (a1,b1]××(an,bn]i=1n(biai) ist ein σ-endliches Prämaß und heißt Lebesgue-Prämaß.

Satz (Fortsetzungssatz von  Carathéodory):
Seien H ein Halbring über Ω und μ0:H[0,] ein σ-endliches Prämaß.
Dann gibt es genau ein Maß μ:σ(H)[0,] mit μ|H=μ0.
Außerdem gilt für Aσ(H) beliebig μ(A)=inf{n=1μ0(Bn)|BnH,An=1Bn}.

Folgerung: Seien H ein Halbring über Ω und μ,ν:σ(H)[0,] zwei σ-endliche Maße mit μ|H=ν|H. Dann gilt μ=ν.

Beispiel: Seien wieder Ω, H={AΩ||A|1} und μ0:H[0,] wie oben. Wenn Ω höchstens abzählbar ist, dann gibt es genau ein Maß auf σ(H)=P(Ω) mit μ|H=μ0.
Weil das Zählmaß auch diese Eigenschaft hat, muss μ nach dem Fortsetzungssatz von Carathéodory gleich dem Zählmaß sein (d. h. μ(A)=|A|N0{}).

Lebesgue-Maß:  Das Lebesgue-Prämaß λ0n lässt sich nach Carathéodory eindeutig zu einem Maß λn:B(Rn)[0,] fortsetzen. λn heißt Lebesgue-Maß.
Es gilt λn((a1,b1]××(an,bn])=i=1n(biai) bzw. insbesondere gilt für
λ:=λ1:B(R)[0,], dass λ((a,b])=ba.

Beispiel: Für ΩB(Rn) mit 0<λn(Ω)< definiert P:B(Ω)[0,1] mit Aλn(A)λn(Ω) ein W-Maß auf (Ω,B(Ω)). P heißt kontinuierliche Gleichverteilung.

Satz (Aussagen über das Lebesgue-Maß):

  • Für ARn höchstens abzählbar gilt λn(A)=0, d. h. A ist eine Nullmenge.

  • Es gilt λn([0,1]n)=1.

  • Für ORn offen mit O gilt λn(O)>0.

  • Sei AB(Rn) mit λn(A)<. Dann gilt λn(A)=sup{λn(K)|KA kompakt}
    (Regularität von innen).

  • Sei AB(Rn). Dann gilt λn(A)=inf{λn(O)|OA offen}
    (Regularität von außen).

  • Für jede Isometrie f:RnRn (d. h. f(x)=Lx+b mit LRn×n orthogonal und bRn) und alle Mengen AB(Rn) gilt f(A)B(Rn) sowie λn(f(A))=λn(A)
    (Bewegungsinvarianz des Lebesgue-Maßes).

Bemerkung: Es gibt kein bewegungsinvariantes Maß μ:P(R)[0,] mit μ([0,1])=1
(Unlösbarkeit des Maßproblems). Mithilfe des Auswahlaxioms kann man zeigen, dass es Mengen (sog. Vitali-Mengen) gibt, die nicht messbar sind.

Konstruktion von Wahrscheinlichkeitsmaßen auf ℝ

Verteilungsfunktion:  Eine Verteilungsfunktion auf R ist eine Funktion F:RR mit

  • F monoton wachsend und rechtsstetig (d. h. limyx+0F(y)=F(y))

  • limxF(x)=0 und limx+F(x)=1

Beispiel: Die Funktion F:RR mit F(x)=0 für x<0, F(x)=1 für x>1 und F(x)=x für x[0,1] ist eine Verteilungsfunktion.

Satz (von Verteilungsfunktion zu W-Maß): Sei F:RR.
Dann existiert genau ein W-Maß P auf (R,B(R)) mit P((,x])=F(x) für alle xR.

Beispiel: Die Funktion F von oben erzeugt ein W-Maß P mit P((,x])=F(x). Es gilt P(A)=λ(A[0,1]).

Dichte:  Eine Dichte ist eine nicht-negative, integrierbare Funktion f:R[0,) mit +f(u)du=1. Ein W-Maß P auf R besitzt die Dichte f:R[0,), falls f eine Dichte ist und P((,x])=xf(u)du gilt (das ist äquivalent zu P([a,b])=abf(u)du).

Bemerkung: In den meisten praktischen Anwendungen ist f stückweise stetig, sodass
f Riemann-integrierbar ist. Später wird ein weiterer Integrationsbegriff eingeführt
(das Lebesgue-Integral), sodass man die Integrierbarkeit auf diesen Begriff erweitern kann.

Beispiele für Wahrscheinlichkeitsmaße mit Dichte

Gleichverteilung:  Für a<b ist f(x):=1ba𝟙[a,b](x) eine Dichte. Sie erzeugt ein W-Maß U([a,b]), die Gleichverteilung auf [a,b]. Die Verteilungsfunktion ist F(x)=x1ba𝟙[a,b](u)du, d. h. F(x)=0 für x<a, F(x)=xaba für axb und F(x)=1 für x>b. Für die Gleichverteilung gilt U([a,b])(A)=λ(A[a,b])1ba.

Exponentialverteilung:  Für λ>0 ist f(x):=λeλx𝟙[0,)(x) eine Dichte, denn
xf(u)du=0xλeλudu=[eλu]0x=1eλxx+1 für x0. Die zugehörige Verteilungsfunktion ist F(x)=1eλx. Die Dichte erzeugt ein W-Maß Exp(λ), die Exponentialverteilung zum Parameter λ.

Bemerkung: Die Exponentialverteilung ist das kontinuierliche Pendant zur geometrischen Verteilung im diskreten Fall. Zum Beispiel kann durch die Exponentialverteilung atomarer Zerfall durch Radioaktivität modelliert werden. Die Exponentialverteilung ist wie die geometrische Verteilung gedächtnislos, d. h. P({x>s+t}|{x>t})=P({x>s}).

Normalverteilung:  Für μ,σR mit σ0 ist φμ,σ2(x):=12πσ2exp((xμ)22σ2) eine Dichte, denn +φμ,σ2(u)du=12π+exp(x22)dx=12π2π=1 für μ=0 und σ=1 (sonst führt man eine Koordinatensubstitution durch). Die Dichte φμ,σ2 definiert ein W-Maß N(μ,σ2), die Normalverteilung mit Erwartungswert μ und Varianz σ2. Φμ,σ2(x)=12πσ2xexp((uμ)22σ2)du ist die Verteilungsfunktion zu N(μ,σ2).

Satz (Aussagen zu Normalverteilung):

  • Ψμ,σ2(x)=Ψ0,1(xμσ)

  • Ψμ,σ2(2μx)=1ψμ,σ2(x)

Messbare Abbildungen

messbare Abbildung:  Seien (Ω,A) und (Ω,A) zwei Messräume. Dann heißt eine Abbildung f:ΩΩ messbar, falls f1(A)A für alle AA. Die Menge M(Ω,Ω) sei die Menge der messbaren Abbildungen von Ω nach Ω. Die Menge M(Ω) sei definiert als M(Ω,R^).

Satz (Erzeugendensystem überprüfen): Seien (Ω,A) und (Ω,A) zwei Messräume, E ein Erzeugendensystem für A und f:ΩΩ. Dann ist f messbar genau dann, wenn f1(A)A für alle AE.

Beispiel:

  • Ist (Ω,P(Ω)) diskret, so ist jede Abbildung f:ΩΩ messbar.

  • Für f:RR stetig mit der Borel-σ-Algebra und g:RmRn stetig, so sind f und g messbar. Für h:RR monoton ist h ebenfalls messbar.

Satz (messbare Funktionen):

  • Für f:(Ω,A)(Ω,A) messbar und g:(Ω,A)(Ω,A) messbar ist gf auch messbar.

  • Für X=(X1,,Xn):ΩRn mit X(ω)=(X1(ω),,Xn(ω)) und Xk:ΩR gilt, dass X messbar ist genau dann, wenn X1,,Xn messbar sind.

Satz (messbare Funktionen):
Seien Xk:ΩR^ messbare Funktionen für kN. Dann sind ebenfalls messbar:

  • c1X1++cnXn für nN und c1,,cnR

  • X1Xn für nN

  • supkNXk

  • infkNXk

  • lim supkXk

  • lim infkXk

  • limkXk (wenn Xk punktweise konvergiert)

Bildmaß:  Seien (Ω,A) und (Ω,A) zwei Messräume und f:ΩΩ eine messbare Abbildung. Ist μ ein Maß auf (Ω,A), so ist μf:A[0,], μf(A):=μ(f1(A)) ein Maß auf (Ω,A). μf heißt Bildmaß von μ unter f.
μf ist ein W-Maß genau dann, wenn μ ein W-Maß ist.

μ-maßerhaltend:  Sei (Ω,A,μ) ein Maßraum. Eine messbare Abbildung T:ΩΩ heißt μ-maßerhaltend, falls μT=μ mit μT dem Bildmaß von μ unter T gilt.

Zufallsvariablen und ihre Verteilungen

Zufallsvariable:  Seien (Ω,A,P) ein W-Raum und (E,A) ein Messraum. Dann heißt eine messbare Abbildung X:ΩE Zufallsvariable auf Ω mit Werten in E.

Verteilung:  Sei X:ΩE eine Zufallsvariable. Dann heißt PX:A[0,1], PX(B):=P(XB)=P(X1(B)) die Verteilung von X.

Verteilungsfunktion:  Sei X:ΩR eine reelle Zufallsvariable. Dann heißt FX:R[0,1], FX(x):=P(Xx)=PX((,x]) die Verteilungsfunktion von X.

Beispiel: Beim „gebrochenen Stab“ mit Ω=[0,L] kann man die Zufallsvariable betrachten, die jedem Ergebnis die Länge der kürzeren Bruchstücks zuordnet, also X:ΩR mit X(ω)=min{ω,Lω}. Für die Verteilungsfunktion FX gilt FX(x)=P(Xx)=P([0,x][Lx,L])=2x für x[0,L2], FX(x)=P()=0 für x<0 und FX(x)=P(Ω)=1 für x>L2. Also ist PX die Gleichverteilung auf [0,L2].

Satz (Aussagen über Verteilungsfunktionen):
Sei X:ΩR eine reelle Zufallsvariable mit Verteilungsfunktion FX. Dann gilt:

  • FX ist monoton wachsend und rechtsseitig stetig.

  • limxFX(x)=0 und limx+FX(x)=1

  • Für alle xR gilt FX(x)limyx0FX(y)=P(X=x), wobei FX(x)=limyx+0FX(y) aufgrund der rechtsseitigen Stetigkeit.
    Somit ist FX stetig genau dann, wenn für alle xR P(X=x)=0 gilt.

Bemerkung: Nach (a) und (b) stimmt also obige Definition der Verteilungsfunktion mit der Definition im diskreten Fall überein.

diskret verteilt/mit Dichte verteilt:  Eine reelle Zufallsvariable X:ΩR heißt diskret verteilt, falls PX diskret verteilt ist. X heißt mit Dichte verteilt oder absolutstetig verteilt, falls PX eine Dichte besitzt.

Das Lebesgue-Integral

Bemerkung: Im Folgenden sei (Ω,A,μ) ein Maßraum.

Lebesgue-Integral für Indikatorfunktionen:  Seien AA und 𝟙A:ΩR^ mit
𝟙A(x)=1 für xA und 𝟙A(x)=0 für xA die zugehörige Indikatorfunktion.
Dann ist 𝟙AM(Ω) messbar und Ω𝟙Adμ:=μ(A) das Lebesgue-Integral von 𝟙A.

Elementarfunktion:  Seien ckR{0} und AkA paarweise disjunkt für kN. Dann heißt φ=k=1nck𝟙Ak Elementarfunktion über Ω. E(Ω) sei der Raum der Elementarfunktionen über Ω (ein R-Vektorraum). E+(Ω) sei der Raum aller nicht-negativen Elementarfunktionen.

Lebesgue-Integral für Elementarfunktionen: 
Sei φ=k=1nck𝟙Ak eine Elementarfunktion.
Dann ist Ωφdμ:=k=1nckΩ𝟙Akdμ=k=1nckμ(Ak) das Lebesgue-Integral von φ.

Bemerkung: Man kann zeigen, dass dieses Integral wohldefiniert ist, d. h. der Wert des Integrals hängt nicht von der Zerlegung in die Ak ab. Mit dieser Definition ist das Lebesgue-Integral für Elementarfunktionen linear (d. h. Ω(aφ+bψ)dμ=aΩφdμ+bΩψdμ für φ,ψE(Ω) mit a,bR) und monoton (d. h. ΩφdμΩψdμ für φ,ψE(Ω) mit φψ).

Lebesgue-Integral für nicht-negative Funktionen:  Sei fM(Ω) mit f0. Dann ist Ωfdμ:=sup{Ωφdμ|φE+(Ω),φf}[0,] das Lebesgue-Integral von f0.
f heißt positiv Lebesgue-integrierbar (fL+1(μ)), falls Ωfdμ<.

Bemerkung: Damit gilt eine gewisse „Linearität“ (nämlich Ω(af+bg)dμ=aΩfdμ+bΩgdμ für f,gL+1(μ) und a,b0) und Monotonie (genauer fL+1(μ) und ΩfdμΩgdμ für fM(Ω) und gL+1(μ) mit 0fg).

punktweise Konvergenz von unten:  Seien fn,f:ΩR^ Funktionen. (fn)nN konvergiert punktweise von unten gegen f (fnf), falls xΩf1(x)f2(x)f(x) und
limnfn(x)=f(x).

Satz (Existenz einer Folge von Treppenfunktionen und Grenzwertsatz):
Sei fM(Ω) mit f0. Dann gilt:

  • Es gibt eine Folge (φn)nN mit φnE+(Ω) und φnf.

  • Ist (φn)nN eine Folge mit φnE+(Ω) und φnf, dann gilt
    Ωfdμ=limn(Ωφndμ).

Nullmenge, μ-fast überall: 

  • Eine Menge NA heißt Nullmenge, falls μ(N)=0.

  • Eine Aussage A(x) mit xΩ gilt μ-fast überall (für μ-fast alle xΩ), falls es eine Nullmenge NA gibt mit xΩN¬A(x).

  • Für zwei Funktionen f,g:ΩR mit f(x)=g(x) für μ-fast alle xΩ schreibt man f=μg (analog sind auch fμg, f<μg, fμg usw. definiert).

Satz (Lebesgue-Integral invariant auf Nullmenge): Seien fL+1(μ) und gM(Ω) mit g0, sodass N:={xΩ|f(x)g(x)}A eine Nullmenge ist.
Dann gilt gL+1(μ) und Ωgdμ=Ωfdμ.

positiver/negativer Anteil:  Sei f:ΩR^ eine Funktion.
Dann heißt f+:=max(f,0) positiver Anteil und f:=max(f,0) negativer Anteil von f.

Bemerkung: Es gilt f=f+f und |f|=f++f.

Lebesgue-Integral:  Sei fM(Ω).
f heißt Lebesgue-integrierbar (fL1(μ)), falls f+L+1(μ) und fL+1(μ).
In diesem Fall ist Ωfdμ:=Ωf+dμΩfdμ das Lebesgue-Integral von f.

Satz (Aussagen über das Lebesgue-Integral):

  • L1(μ) ist ein R-Vektorraum und es gilt Ω(af+bg)dμ=aΩfdμ+bΩgdμ für alle f,gL1(μ) und a,bR (Linearität).

  • Für f,gL1(μ) mit fg gilt ΩfdμΩgdμ (Monotonie).

  • Für fL1(μ) gilt |f|L1(μ) und |Ωfdμ|Ω|f|dμ.

  • Für hM(Ω) und fL1(μ) mit |h|f gilt hL1(μ).

  • Für fL1(μ) ist A:={xΩ||f(x)|=} eine Nullmenge.

Satz (allgemeiner Transformationssatz): Seien (Ω,A,μ) ein Maßraum, (Ω,A) ein Messraum, TM(Ω,Ω), μT das Bildmaß von T auf Ω und fM(Ω).
Dann gilt fL1(μT)fTL1(μ). In diesem Fall gilt ΩfdμT=Ω(fT)dμ.

Grenzwertsätze für das Lebesgue-Integral

Satz (Satz von Beppo-Levi zur monotonen Konvergenz):
Sei (fn)nN eine Folge mit fnM(Ω) und 0f1f2.
Dann gibt es ein fM(Ω) mit f0 und fn()f und es gilt Ωfdμ=limn(Ωfndμ).

Satz (Satz von Lebesgue zur majorisierten Konvergenz):
Seien (fn)nN eine Folge mit fnM(Ω), fM(Ω) mit fn()f und hL1(μ) mit |fn|h.
Dann gilt fL1(μ) und Ωfdμ=limn(Ωfndμ).

Lemma (Lemma von Fatou): Seien (fn)nN eine Folge mit fnM(Ω) und fn0.
Dann gilt Ω(lim infnfn)dμlim infn(Ωfndμ).

Integration in ℝ und ℝⁿ

Satz (Riemann-integrierbar Lebesgueintegrierbar):
Sei f:[a,b]R messbar und Riemann-integrierbar.
Dann ist fL1(λ) und [a,b]fdλ=abf(x)dx.

Satz (uneigentliche Riemann-Integrierbarkeit): Seien IR ein Intervall und f:IR messbar, sodass f|K für jede kompaktes Intervall KI Riemann-integrierbar ist.
Dann gilt fL1(λ)|f| ist über I uneigentlich Riemann-integrierbar.
In diesem Fall gilt Ifdλ=abf(x)dx.

Satz (Integration bzgl. W-Maßen mit Dichte):
Seien (R,B(R),P) ein W-Raum, P ein W-Maß mit Dichtefunktion f:RR und gM(R).
Dann gilt gL1(P)gfL1(λ).
In diesem Fall gilt RgdP=Rgfdλ (es gilt außerdem [a,b]gdP=[a,b]gfdλ).

Satz (Satz von Fubini):
Seien (Ω1,A1,μ1) und (Ω2,A2,μ2) zwei σ-endliche Maßräume und fM(Ω1×Ω2).
Zusätzlich gilt mindestens einer der beiden folgenden Fälle:

  • f0

  • fL1(μ1μ2)

Dann gilt Ω1×Ω2fd(μ1μ2)=Ω2(Ω1f(ω1,ω2)dμ1(ω1))dμ2(ω2)
=Ω1(Ω2f(ω1,ω2)dμ2(ω2))dμ1(ω1).

Integration auf diskreten Maßräumen

Bemerkung: Sei (Ω,P(Ω),μ) ein diskreter Maßraum, d. h. Ω={ω1,ω2,} ist abzählbar. Jede Funktion f:ΩR^ ist automatisch messbar. Was ist das Lebesgue-Integral Ωfdμ einer solchen Funktion?

f lässt sich als Reihe f=k=1f(ωk)𝟙{ωk} darstellen. Für f0 gilt für die Folge (φn)nN mit φn:=k=1nf(ωk)𝟙{ωk}, dass φnE+(Ω) und φnf. Es gilt Ωφndμ=k=1nf(ωk)μ({ωk}). Somit ist fL+1(ω)Ωfdμ=k=1f(ωk)μ({ωk})<.

Für eine beliebige Funktion f gilt wegen der Messbarkeit fL1(μ)|f|L1(μ) k=1|f(ωk)|μ({ωk})<k=1f(ωk)μ({ωk}) konvergiert absolut.
In diesem Fall gilt Ωfdμ=k=1f(ωk)μ({ωk}).

Mit diesen Beziehungen kann man die Theorie der diskreten W-Räume als Spezialfall der Theorie der kontinuierlichen W-Räume sehen.

Wählt man speziell Ω=N und μ=σ das Zählmaß auf N, so sind Funktionen a:ΩR eigentlich reelle Zahlenfolgen (an)nN mit an=a(n). Nach eben Gesagtem ist a bzgl. des Zählmaßes Lebesgue-integrierbar genau dann, wenn die Reihe Nadσ=k=1ak absolut konvergiert. Daher ist die Theorie der absolut konvergenten Reihen in der Theorie des Lebesgue-Integrals enthalten.

Erwartungswerte von Zufallsvariablen

Erwartungswert: 
Seien (Ω,A,P) ein W-Raum und X:ΩR eine reelle Zufallsvariable mit XL1(P).
Dann heißt E(X):=ΩXdP Erwartungswert (EW) von X.

Satz (Rechenregeln für den Erwartungswert): Seien X,YL1(P) zwei reelle Zufallsvariablen.
Dann gilt:

  • X+YL1(P) und E(X+Y)=E(X)+E(Y)

  • Für αR gilt αXL1(P) und E(αX)=αE(X).

  • Für AA ist 𝟙AL1(P) eine reelle Zufallsvariable und E(𝟙A)=P(A).

  • Aus XY folgt E(X)E(Y).

  • |X|L1(P) ist eine reelle Zufallsvariable und |E(X)|E(|X|).

Satz (Transformationssatz für Erwartungswerte): Seien (Ω,A,P) ein W-Raum, X:ΩR eine reelle Zufallsvariable und PX ihre Verteilung.
Dann ist XL1(P)idRL1(PX). In diesem Fall gilt E(X)=ΩXdP=Ω(idRX)dP=RidRdPX.
Hat PX die Dichtefunktion f, dann gilt außerdem E(X)=Rxf(x)dλ.

Satz (Erwartungswert von elementaren Verteilungen): Sei X:ΩR eine reelle Zufallsvariable mit XL1(P) und PX ihre Verteilung. Dann gilt:

  • Ist PX=U([a,b]) (d. h. X ist gleichverteilt), dann gilt E(X)=a+b2.

  • Ist PX=Exp(λ) mit λ>0 (d. h. X ist exponentialverteilt), dann gilt E(X)=1λ.

  • Ist PX=N(μ,σ2) mit μ,σR und σ2>0 (d. h. X ist normalverteilt), dann gilt E(X)=μ.

(stochastisch) unabhängig:  Seien (Ω,A,P) ein W-Raum, (Ei,Ai) Messräume und
Xi:ΩEi Zufallsvariablen für iI. Dann heißt die Folge (Xi)iI (stochastisch) unabhängig, falls für jede Wahl von BiAi (iI) die Ereignisse {XiBi}=Xi1 stochastisch unabhängig sind.

Lemma (Kriterium für Unabhängigkeit von Zufallsvariablen): Seien X1,X2:ΩR zwei reelle Zufallsvariablen, X:=(X1,X2):ΩR2 und PX1,PX2,PX die Verteilungen dieser Zufallsvariablen.
Dann sind X1 und X2 unabhängig genau dann, wenn PX=PX1PX2.

Satz (EW von Produkt von unabhängigen ZV ist Produkt der EW):
Seien (Ω,A,P) ein W-Raum und X1,,Xn:ΩR reelle Zufallsvariablen mit X1,,XnL1(P), die unabhängig sind. Dann ist auch X1XnL1(P) und E(X1Xn)=E(X1)E(Xn).

k-te Momente, Varianz und Streuung von Zufallsvariablen

p-fach Lebesgue-integrierbar:  Seien (Ω,A,μ) ein Maßraum, fM(Ω) und p>0.
Dann heißt f p-fach Lebesgue-integrierbar (fLp(μ)), falls |f|L1(μ).
In diesem Fall definiert man fp:=(Ω|f|pdμ)1/p.

Bemerkung: Lp(μ) ist ein reeller Vektorraum.
p ist im Allgemeinen keine Norm auf Lp(μ), sondern nur eine Halbnorm. Es gilt also fp0, cfp=|c|fp (Homogenität) und f+gp=fp+gp (Dreiecksungleichung, in diesem Fall als Minkowski-Ungleichung bekannt), aber aus fp=0 folgt nicht unbedingt f=0 (sondern nur f=μ0). In der Tat ist p eine Norm genau dann, wenn die einzige μ-Nullmenge in A ist.

Satz (Höldersche Ungleichung): Seien p,q,r>0 mit 1p+1q=1r sowie fLp(μ) und gLq(μ). Dann ist fgLr(μ) und es gilt fgrfpgq.

Folgerung: Seien (Ω,A,P) ein W-Raum und 0<p<q<.
Dann gilt Lq(P)Lp(P) (es gilt sogar fppfq für fLq(P)).

(zentriertes) k-tes Moment:  Seien (Ω,A,P) ein W-Raum, X:ΩR^ eine Zufallsvariable und kN. Für XLk(P) oder Xk0 heißt E(Xk) k-tes Moment und E((XE(X))k) zentriertes k-tes Moment von X.

Varianz: 
Das zentrierte 2. Moment Var(X):=E((XE(X))2)=E(X2)E(X)2 heißt Varianz von X.

Standardabweichung: 
Die Wurzel σX:=Var(X) der Varianz heißt Standardabweichung von X.

Satz (Transformationssatz für Momente): Seien (Ω,A,P) ein W-Raum, X:ΩR eine reelle Zufallsvariable, PX ihre Verteilung und kN.
Dann ist XkL1(P)xkL1(PX) mit xk:RR, xxk.
In diesem Fall gilt E(Xk)=RxkdPX und E((XE(X))k)=R(xE(X))kdPX.

Satz (Varianz von elementaren Verteilungen): Sei X:ΩR eine reelle Zufallsvariable mit XL1(P) und PX ihre Verteilung. Dann gilt:

  • Ist PX=U([a,b]) (d. h. X ist gleichverteilt), dann gilt Var(X)=112(ba)2.

  • Ist PX=Exp(λ) mit λ>0 (d. h. X ist exponentialverteilt), dann gilt Var(X)=1λ2.

  • Ist PX=N(μ,σ2) mit μ,σR und σ2>0 (d. h. X ist normalverteilt), dann gilt Var(X)=σ2.

Satz (Rechenregeln für die Varianz): Seien (Ω,A,P) ein W-Raum und X,X1,,Xn:ΩR reelle Zufallsvariablen mit Var(X),Var(Xi)< für i=1,,n. Dann gilt:

  • Für α,cR ist Var(αX)=α2Var(X) und Var(X+c)=Var(X).

  • Sind die Zufallsvariablen X1,,Xn unabhängig, so gilt
    Var(X1++Xn)=Var(X1)++Var(Xn).

  • Für Var(X)=0 gilt X=PE(X).

Bemerkung: Aussage (b) gilt auch schon, wenn die Bildung der Erwartungswerte irgendwelcher der beteiligten Zufallsvariablen mit der Multiplikation verträglich ist. Daher kann man diese Aussage verallgemeinern.

unkorreliert:  Seien (Ω,A,P) ein W-Raum und (Xi)iI eine Familie von reellen Zufallsvariablen mit XiL1(P) mit I. Dann heißt die Familie (Xi)iI unkorreliert, falls für jede endliche Teilmenge KI mit K gilt, dass E(iKXi)=iKE(Xi).

Bemerkung: Nach einem vorherigen Satz ist jede unabhängige Familie von Zufallsvariablen auch unkorelliert. Daher ist der folgende Satz eine Verallgemeinerung der Aussage (b) von eben.

Satz (Satz von  Bienaymé): Seien (Ω,A,P) ein W-Raum und X1,,Xn:ΩR unkorrelierte, reelle Zufallsvariablen mit Var(Xk)< für k=1,,n. Dann gilt Var(X1++Xn)=Var(X1)++Var(Xn).

Bemerkung: Für eine reelle Zufallsvariable XL1(P) gilt
P(|X|t=PX((,t][t,))t0 wegen der Stetigkeit von oben. Die folgende Ungliehcung ergibt eine Abschätzung der Konvergenzgeschwindigkeit in Abhängigkeit vom Grad der Integrierbarkeit von X.

Satz (Markovsche Ungleichung): Seien (Ω,A,P) ein W-Raum, X:ΩR^ eine Zufallsvariable und q>0. Dann gilt:

  • Für XLq(P) gilt P(|X|t)E(|X|q)tq für jedes t>0
    (Markovsche Ungleichung, für q=2 Tschebyscheff-Ungleichung).

  • Wenn es ein c>0 gibt mit P(|X|t)ctq für jedes t>0, dann gilt XLqε(P) für jedes ε(0,q).

Folgerung:
Seien (Ω,A,P) ein W-Raum, X:ΩR^ eine Zufallsvariable mit XL2(P) und ε>0.
Dann gilt P(|XE(X)|ε)Var(X)ε2.