Grenzwertsätze

Gesetz der großen Zahlen

Vorbemerkung

Gesetze der großen Zahlen haben die Konvergenz von ${\frac {1}{n}}((X_{1}-\mu _{1})+...+(X_{n}-\mu _{n}))$ gegen 0 zum Inhalt, wenn $X_{1},X_{2},...$ eine Folge von Zufallsvariablen ist und $\mu _{i}=E(X_{i})$ .

Beispiel

Sind $X_{1},X_{2},...$ unabhängige, $B(n,p)$ -verteilte Zufallsvariablen, so vermutet man eine Konvergenz von ${\frac {1}{n}}\sum _{i=1}^{n}X_{i}$ ('relative Häufigkeit') gegen $p$ ('Auftrittswahrscheinlichkeit'). Dabei müssen Konvergenzbegriffe der Stochastik eingeführt werden.

Definition

Wir sagen, dass eine Folge $Y_{1},Y_{2},...$ ( $X_{1},X_{2},...$ ) von Zufallsvariablen (auf einem Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {S}},P)$ )
a) stochastisch gegen eine Zufallsvariable Y konvergiert, falls

\forall \epsilon >0:P(|Y_{n}-Y|\geq E)\to 0,(n\to \infty )

gilt. Man schreibt dafür $Y_{n}{\stackrel {P}{\to }}Y$ .

b) mit existierendem Erwartungswert $\mu _{i}=E(X_{i})$ das schwache Gesetz der großen Zahlen erfüllt, falls eine Folge

Y_{n}={\frac {1}{n}}[(X_{1}-\mu _{1})+...+(X_{n}-\mu _{n})],n=1,2,...

von Zufallsvariablen stochastsich gegen 0 konvergiert.

Y_{n}{\stackrel {p}{\to }}0

Schwaches Gesetz der großen Zahlen (Satz)

Sind $X_{1},X_{2}$ paarweise unkorrelierte Zufallsvariablen (auf dem Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {S}},P)$ ) mit $X_{i}\in {\mathcal {L}}_{2}$ und mit ${\frac {1}{n^{2}}}\sum _{i=1}^{n}Var(X_{i})\to 0$ , ( $n\to \infty$ ), so erfüllt diese Folge $X_{1},X_{2},...$ das schwache Gesetz der großen Zahlen.

Beweis

Für die Zufallsvariablen $Y_{n}={\frac {1}{n}}\sum (X_{i},\mu _{i})$ gilt $EY_{n}=0$ und $Var(Y_{n})={\frac {1}{n^{2}}}\sum _{i=1}^{n}Var(X_{i})\to 0$ , ( $n\to \infty$ ) liefert die Tschebyscheff-Ungleichung

P(|Y_{n}=E(Y_{n})|\geq \epsilon )\leq {\frac {Var(Y_{n})}{\epsilon ^{2}}}\to 0,

(

n\to \infty

)

Korollar

Sind $X_{1}$ und $X_{2}$ unabhängige Zufallsvariablen aus ${\mathcal {L}}_{2}$ mit gleichmäßig beschränkten Varianzen (d.h. $Var(X_{i})\leq M<\infty$ $\forall i=1,2,...$ ), dann erfüllt dies Folge das schwache Gesetz der großen Zahlen.

Beispiel

Ist $X^{n}=X_{1}+...+X_{n}$ $B(n,p)$ -verteilt ( $X_{1},X_{2},...$ unabhängig $B(1,p)$ -verteilt), so gilt:

{\frac {1}{n}}X^{n}{\stackrel {P}{\to }}p'

Umgangssprachlich: die relativen Häufigkeiten des Ereignisses '1' konvergieren stochastisch gegen $w$ .

Bemerkung

Die stochstische Konvergenz stellt einen relativ schwachen Konvergenzbegriff dar. So braucht für kein $w\in \Omega$ gewöhnliche Konvergenz $Y_{n}(w)\to Y(w)$ , ( $n\to \infty$ ), stattzufinden, wie das folgende Beispiel zeigt.

Beispiel (1)

Sei $(\Omega ,{\mathcal {U}},P)=([0,1],[0,1]\cap {\mathcal {B}}^{1},{\text{Gleichverteilung}})$ . Man definiere die Folge $Y_{n}=1_{A_{n}},n\geq 1$ , durch
$A_{n}=\lbrace w\to [0,1]:\exists m\in \mathbb {N} \,{\text{mit}}\,w+m\to [a_{n-1},a_{n}]\rbrace$ ,

wobei $A_{0}=0$ und $a_{n}=1+{\frac {1}{2}}+...+{\frac {1}{n}}$ , ( $w\in [a_{n-1},a_{n}]{\text{mod}}1$ ).

Beispiel (2)

Es gilt

1. $Y_{n}{\stackrel {P}{\to }}0$ , denn für $\epsilon \in (0,1)$ ist $P(|Y_{n}-0|>\epsilon )=P(Y_{n}=1)=P(A_{n})={\frac {1}{n}}\to 0$ .

2. Die Folge $Y_{n}(w)$ konvergiert für kein $w\in [0,1]$ , wegen der Konvergenz der harmonischen Reihe.

Der Konvergenzberiff $Y_{n}(w)=Y(w)$ $\forall w\in \Omega$ ist für die Stochastik unbrauchbar. So ist für $Y_{n}={\frac {1}{n}}X^{n}$ , $X^{n}$ $B(n,p)$ -verteilt:

$Y_{n}(w)$ nicht konvergent für viele $w$ .

Wir nehmen die Sprechweise wieder auf: Eine Aussage gilt ' $P$ fast überal' oder ' $P$ fast sicher' (synonym), wenn die Menge $A$ aller $w$ für die die Aussage richtig ist, die Wahrscheinlichkeit 1 hat: $P(A)=1$ .

Definition

a) Eine Folge $Y_{1},Y_{2},...$ von Zufallsvariablen (auf einem Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {S}},P)$ ) konvergiert fast sicher gegen die Zufallsvariable $Y$ , falls

P\lbrace w:lim_{n\to \infty }Y_{n}(w)=Y(w)\rbrace =1.

Man schreibt kürzer: $P(lim_{n}Y_{n}=Y)=1$ bzw. $Y_{n}\to Y$ $P$ fast sicher.

b) Man sagt, dass eine Folge $X_{1},X_{2},...$ von Zufallsvariablen auf $(\Omega ,{\mathcal {S}},P)$ mit existierenden Erwartungswerten $\mu _{i}\equiv E(X_{i})$ das starke Gesetz der großen Zahlen erfüllt, falls die Folge $Y_{n}={\frac {1}{n}}[(X_{1}-\mu _{1})+...+(X_{n}-\mu _{n})]$ , $n=1,2,...$ , $P$ -f.s. gegen 0 konvergiert: $Y_{n}\to 0$ $P$ -f.s.

Bemerkung

Aus $Y_{n}\to Y$ $P$ -f.s. folgt $Y_{m}{\stackrel {P}{\to }}Y$ (ohne Beweis). Das obige Beispiel zeigt, dass die Umkehrung nicht (vereinfachtes Beispiel siehe später) gilt. Das wichtigste Hilfsmittel zum Beweis eines starken Gesetzes der großen Zahlen ist das folgende Lemma von Borel-Cantelli, das auch sonst wichtig ist.

Lemma (von Borel-Cantelli)

Sei $(\Omega ,{\mathcal {U}},P)$ ein Wahrscheinlichkeitsraum und $A_{1},A_{2},...$ eine Folge von Ereignissen aus ${\mathcal {U}}$ . Sei $A^{*}$ das Ereignis, dass unendlich viele der $A$ 's eintreten:

A^{*}=\lbrace w\in \Omega :w\in A_{i};\,{\text{für unendlich viele}}\,i\in \mathbb {N} \rbrace

a) Gilt $\sum _{i=1}^{\infty }P(A_{i})\leq \infty$ , dann ist $P(A^{*})=0$ .

b) Sind die $A_{1},A_{2},...$ unabhängig und ist $\sum _{i=1}^{\infty }$ , dann ist $P(A^{*})=1$ .

Beweis (1)

a) Es ist $w\in A^{*}$ genau dann, wenn es $\forall n\in \mathbb {N}$ ein $i\geq n$ gibt, $w\in A_{i}$ . D.h.

A^{*}=\bigcap _{n=1}^{\infty }\bigcup _{i\geq n}A_{i}.

Da $A^{*}\subset \cup _{i\geq n}A_{i}$ für jedes $n\in \mathbb {N}$ ist, gilt:

P(A^{*})=P(\bigcup _{i\geq n}A_{i}\leq \sum _{i\geq n}P(A_{i})\to 0

für $n\to \infty$ .

Beweis (2)

b) Wir benutzen die Ungleichung $1-x\leq e^{-x},\forall x\in \mathbb {R}$ und die Unabhängigkeit der ${\bar {A}}_{1},{\bar {A}}_{2},...$ . Es gilt für alle $n$ und $N\geq n$ :

P(\bigcap _{i=1}^{\infty }{\bar {A}}_{i})\leq P(\bigcap _{i=n}^{N}{\bar {A}}_{i})=\Pi _{i=n}^{N}(1-P(A_{i})\leq \Pi _{i=n}^{N}e^{-P(A_{i})}=exp(-\sum _{i=n}^{N}P(A_{i}))\to 0

für $N\to \infty$ , wegen der Divergenz der Reihe. Also $P({\bar {A}}_{i})=0$ für jedes $n$ :

P({\bar {A}}_{i}^{*})=P(\bigcup _{n=1}^{\infty }\bigcap _{i\geq n}{\bar {A}}_{i})\leq \sum _{n=1}^{\infty }P(\bigcap {\bar {A}}_{i})=0

d.h. $P(A^{*})=1$ .

Bemerkungen (1)

1. Teil b) rechtfertigt den populären Ausdruck: "Ein Ereignis, das (mit positiver Wahrscheinlichkeit) eintreten kann, tritt mit ( $P$ )- Sicherheit einmal ein (sogar beliebig oft), wenn nur genügend (unabhängige) Versuche durchgeführt werden".

2. Teil b) lässt sich als weiteres Beispiel einer Folge $Y_{n},n\geq 1$ angeben, die stochastisch konvergiert, aber nicht fast sicher. Seien $Y_{1},Y_{2},...$ unabhängige $B(1,{\frac {1}{n}})$ -verteilte Zufallsvariablen. Dann gilt $Y_{n}{\stackrel {P}{\to }}0$ , denn für ein $0<\epsilon <1$ ist $P(|Y_{n}|>\epsilon )=P(Y_{n}=1)={\frac {1}{n}}\to 0$ , ( $n\to \infty$ ).

Bemerkungen (2)

3. Anderseits konvergiert die Folge für $P$ fast alle $w^{2}$ nicht! Denn wegen $\sum _{n}P(Y_{n}=1)=\sum _{n}{\frac {1}{n}}\to \infty$ folgt

P(limsupY_{n}=1)=mp(A^{*})=1

und wegen $\sum _{n}mp(Y_{n}=0)=\sum _{n}(1-{\frac {1}{n}})=\infty$ folgt

P(liminfY_{n}=0)=mp(B^{*})=1.

Starkes Gesetz der großen Zahlen (Satz)

Bilden $X_{1},X_{2},...$ eine Folge paarweise unkorrelierter Zufallsvariablen auf einem Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {U}},P)$ , aus ${\mathcal {L}}_{2}$ mit beschränkter Varianz (d.h. $Var(X_{i})\leq M<\infty$ für alle $i$ ), so erfüllt die Folge das starke Gesetz der großen Zahlen.

Beweis (1)

Definiere $Y_{n}={\frac {1}{n}}\sum _{i=1}^{n}X'_{i}$ , $X'_{i}=X_{i}-E(X_{i})$ .

Wir zeigen zunächst, dass $Y_{n^{2}}={\frac {1}{n^{2}}}\sum _{i=1}^{n^{2}}X'_{i}\to 0$ $P$ -f.s.

Gemäß der Formel von Bienaymé ist

Var(Y_{n^{2}})={\frac {1}{n^{4}}}\sum _{i=k}^{n^{2}}Var(X_{i})\leq {\frac {1}{n^{2}}}M

so dass Tschebyschoff für alle $\epsilon >0$ und für die Menge $A_{k}^{\epsilon }=\lbrace w:|Y_{n^{2}}(w)|\geq \epsilon \rbrace$ gilt:

P(A_{k}^{\epsilon })\leq {\frac {1}{\epsilon }}Var(Y_{n^{2}})\leq {\frac {M}{n^{2}\epsilon ^{2}}}

sowie

\sum _{n=1}^{\infty }P(A_{n}^{\epsilon })<\infty .

Beweis (2)

Borel-Cantelli-Lemma Teil a) liefert für $A^{*\epsilon }=\lbrace w:|Y_{n^{2}}(w)|\geq \epsilon$ , für $\infty$ viele $n\rbrace$ :

P(A^{*\epsilon })=0

Es folgt:

P(\bigcup _{k=1}^{\infty }A^{*{\frac {1}{k}}})\leq \sum _{k=1}^{\infty }P(A^{*{\frac {1}{k}}}=0

bzw.

P(\bigcap _{k=1}^{\infty }A^{*{\frac {1}{k}}})=1,

denn für $w\in \bigcap _{k=1}^{\infty }A^{*{\frac {1}{k}}}$ gilt $Y_{n^{2}}(w)\geq {\frac {1}{k}}$ nur für endliche viele $n$ (für alle $k$ ), d.h. für $P$ fast sicher (für alle $w$ ) gilt: $\forall \epsilon >0\exists m_{0}=m_{0}(w,\epsilon )$ , so dass

(*)

|Y_{n^{2}}(w)|\leq \epsilon \forall n^{2}\geq m_{0}.

Beweis (3)

Für beliebige $m\in \mathbb {N}$ sei $n=n(m)$ diejenige natürliche Zahl, für welche $n^{2}\leq m<(n+1)^{2}$ ist. Mit analogen Methoden wie in (1) zeigt man für die Menge

B^{*\epsilon }=\lbrace w:|{\frac {m}{n^{2}}}>_{m}(w)-Y_{n^{2}}(w)|\geq \epsilon \,{\text{ für}}\,\infty \,{\text{ viele}}\,m\rbrace

dass

P(\bigcap _{n=1}^{\infty }B^{*\epsilon })=1

Folglich gilt für $P$ fast sicher: $\forall \epsilon >0\exists m_{0}\equiv m_{0}(w,\epsilon )$ mit

(**)

|{\frac {m}{n^{2}}}Y_{m}(w)-Y_{n^{2}}(w)|\leq \epsilon

für alle

m\leq m_{0}.

Beweis (4)

Die beiden Gleichungen (*) und (**) liefern für $P$ fast sicher: $\forall \epsilon >0\exists m_{0}\equiv m_{=}(w,\epsilon )$ mit

|Y_{m}(w)|\leq {\frac {m}{n^{2}}}|Y_{m}(w)|\leq |{\frac {m}{n^{2}}}Y_{m}(w)-Y_{n^{2}}(w)|+|Y_{n^{2}}(w)|\leq 2\epsilon

für alle $m\geq m_{0}$ . Das heißt aber $Y_{n}\to 0$ $P$ fast sicher.

Bemerkung

Entsprechend der starken Aussage benötigt der Satz auch eine stärkere Voraussetzung als der Satz zum schwachen Gesetz der großen Zahlen.

Beispiel

Ist $X^{n}$ $B(n,p)$ -verteilt, so gilt ${\frac {1}{n}}X^{n}\to p$ $P$ fast sicher. Hierdurch wird die Aussage des Beispiels zum schwachen Gesetz der großen Zahlen verbessert. Dieses Ergebnis bestätigt die Brauchbarkeit unseres wahrscheinlichkeitstheoretischen Konzeptes. Es präzisiert die Intuition, dass sich für große $n$ annähert.

${\frac {1}{n}}(X^{n})$ beobachte relative Häufigkeit eines Ereignisses an $p$ (axiomatisch eingeführte Wahrscheinlichkeit der Ereignisse).

Zentrale Grenzwertsätze

In diesem Abschnitt Verallgemeinerung (und Beweis) des Grenzwertsatzes von DeMoivre-Laplace auf Summen unabhängiger, identisch verteilter Zufallsvariablen (anstatt nur unabhängige Bernoullivariablen). Der Beweis zum zentralen Grenzwertsatz von Lindberg-Lexy (später) benutzt einen Stetigkeitssatz für charakteristische Funktionen und einen dritten Konvergenzbegriff ('Verteilungskonvergenz').

Definition

Seien $X_{1},X_{2},...$ Zufallsvariablen aus ${\mathcal {L}}_{2}$ . Man sagt, dass diese Folge den zentralen Grenzwertsatz erfüllt, falls für die Standardisierten der Partialsummen $S_{n}=X_{1}+...+X_{n}$ mit

S_{n}^{*}={\frac {S_{n}-E(S_{n})}{\sqrt {Var(S_{n})}}}

(

\equiv

Standardisieren) gilt:

lim_{n\to \infty }P(a<S_{n}\leq b)\to \Phi (b)-\Phi (a)\forall a<b;a,b\in \mathbb {R}

Dabei ist $\Phi (x),x\in \mathbb {R}$ , die Verteilungsfunktion der $N(0,1)$ -Verteilung. Es reicht, $lim_{n\to \infty }P(S_{n}^{*}\leq x)=\Phi (x)\forall x\in \mathbb {R}$ zu zeigen.

Bemerkungen (1)

1. Die Gültigkeit des zentralen Grenzwertsatzes eröffnet die Möglichkeit, unter Umständen nicht (oder nur schwer) berechenbare Wahrscheinlichkeiten $P(a<S^{*}\leq b)$ durch die Werte der $N(0,1)$ -Verteilung zu approximieren.

2. Sind $X_{1},X_{2},...$ unabhängig, mit identischen Erwartungswerten $\mu =E(X_{i})$ und identischen Varianzen $\sigma ^{2}=Var(X_{i})$ , so wird aus der Standardisierten oben

S_{n}^{z}={\frac {S_{n}-n\mu }{{\sqrt {n}}\sigma }}={\frac {1}{\sqrt {n}}}\sum _{i=1}^{n}({\frac {X_{i}-\mu }{\sigma }})={\sqrt {n}}{\frac {{\bar {X}}_{n}-\mu }{\sigma }}\neq {\bar {X}}_{m}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.

Bemerkungen (2)

3. Um einen zentralen Grenzwertsatz zu beweisen, müssen wir zeigen:

F_{n}^{*}(x)\to \Phi (x),\forall x\in \mathbb {R} ,n\to \infty

wenn $F_{n}^{*}(x)$ die Verteilungsfunktion von $S_{n}^{*}(x)$ ist.

Diese Aussage stellt einen dritten Konvergenzbegriff dar (Verteilungskonvergenz).

Allgemein wird Folgendes definiert:

Verteilungskonvergenz (Definition)

Eine Folge $Y_{n},n\geq 1$ von Zufallsvariablen heißt Verteilungskonvergenz gegen die Zufallsvariable $Y_{0}$ , falls bei $n\to \infty$

F_{n}(x)\to F_{0}(x)\forall x\in {\mathcal {C}}(F_{0}),

dabei bezeichnet $F_{n}$ und $F_{0}$ die Verteilungsfunktion von $Y_{n}$ und $F_{0}$ und ${\mathcal {C}}(F_{0})\subset \mathbb {R}$ die Menge alle Stetigkeitsstellen von $F_{0}$ . Man schreibt kurz:

Y_{n}{\stackrel {\mathcal {D}}{\to }}Y

(oder auch $Y_{n}{\stackrel {\mathcal {B}}{\to }}Y$ ), wobei ${\mathcal {D}}$ hier 'Distribution' bedeutet.

Bemerkungen (1)

1. Der Begriff der Verteilungskonvergenz verlangt nicht, das alle $Y_{n},Y_{0}$ auf demselben Wahrscheinlichkeitsraum definiert sind.

2. Für stetige Verteilungsfunktionen $F_{0}$ , wie zum Beispiel $\Phi$ ist ${\mathcal {C}}(F_{0})=\mathbb {R}$ . Die Forderung

F_{n}(x)\to F_{0}(x)\forall x\in \mathbb {R}

erweist sich als zu restriktiv.

Bemerkungen (2)

So gilt im folgenden Beispiel diese Forderung nicht, sondern lediglich jene aus der Definition. $Y_{n},Y_{0}$ seien 'entartete' Zufallsvariablen mit $P(Y_{n}={\frac {1}{n}})=1,P(Y_{0}\to 0)=1$ .

Für $F_{n}(x)=1_{[{\frac {1}{n}},\infty [}$ und $F_{0}(x)=1_{[0,\infty )}$ gilt:

${\mathcal {C}}(F_{0})=\mathbb {R} \setminus \lbrace 0\rbrace$ und $\lim F_{n}(x)=\left\{{\begin{array}{ll}1,&x>0\\0,&x<0\end{array}}\right.=F_{0}(x)$

Bei $x=0$ gilt: $0=lim_{n\to \infty }F_{n}(x)\neq F_{0}(0)=1$

3. Der nächste Satz zeigt, dass aus stochastischer Konvergenz die Verteilungskonvergenz folgt. Zusammen mit der Konvergenz von Folgen von Zufallsvariablen folgt: $Y_{n}\to Y$ $P$ fast sicher $\Rightarrow Y_{n}{\stackrel {P}{\to }}Y_{0}\to Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0}$ .

Satz

Sind $Y_{n},n\geq 1$ , und $Y_{0}$ Zufallsvariablen (auf einem Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {U}},P)$ ), mit $Y_{n}{\stackrel {P}{\to }}Y_{0}$ , so gilt $Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0}$ .

Beweis

Sei $x\in \mathbb {R}$ und $\epsilon >0$ beliebig. Dann folgt aus der Alternative " $Y_{0}-Y_{n}Y_{\epsilon }$ " die Inklusion

\lbrace w:Y_{n}(w)\leq x\rbrace \subset \lbrace w:Y_{0}(w)\leq x+\epsilon \rbrace \cap \lbrace w:Y_{0}(w)-Y_{n}(w)>\epsilon \rbrace

und damit

P(Y_{n}\leq x)\leq P(Y_{0}\leq x+\epsilon )+P(Y_{0}-Y_{n}>\epsilon ).

Wegen $Y_{n}\to Y_{0}$ konvergiert der zweite Summand gegen 0, so dass

limsup_{n\to \infty }P(Y_{n}\leq x)\leq P(Y_{0}\leq x+\epsilon )\equiv F_{0}(x+\epsilon ).

Analog: $liminf_{n\to \infty }P(Y_{n}\leq x)\geq F_{0}(x-\epsilon )$ .

Ist also $x\in {\mathcal {C}}(F_{0})$ , so folgt mit $F_{n}(x)=P(Y_{n}\leq x)$ :

limsup_{n}F_{n}(x)\leq F_{0}(x)\leq liminf_{n}F_{n}(x),

d.i.

limF_{n}(x)=F_{0}(x)

Die Umkehrung ist nicht richtig!

Beispiele

Sei $Y_{0}$ $B(1,{\frac {1}{2}})$ -verteilt und $Y_{n}=1-Y_{0}$ für alle $n\geq 1$ . Dann ist jedes $Y_{n}$ wieder $B(1,{\frac {1}{2}})$ -verteilt und damit $Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0}$ (sogar $Y_{n}{\stackrel {\mathcal {D}}{=}}Y_{0}$ ). $Y_{n},n\geq 1$ konvergiert aber nicht stochastisch gegen $Y_{0}$ , denn für $\epsilon \in (0,1)$ ist

P(|Y_{n}-Y_{0}|>\epsilon ){\stackrel {Y_{n}=1-Y_{0}}{=}}P(|1-2\cdot Y_{0}|>\epsilon )=1\,\forall n\geq 1.

Der Stetigkeitssatz für diskrete Wahrschenlichkeitsverteilungen besagt, dass der Limes einer Folge von Wahrscheinlichkeitsfunktionen, d.h.

a_{n}=lim_{n\to \infty }\rho _{k}^{n},k=0,1,...

genau dann ist, wenn der Limes der zugehörenden erzeugenden Funktionen existiert. Zunächst stellen wir fest, das die Aussage eine Verteilungskonvergenz bedeutet.

Lemma von Schiffé

Sind $Y_{n},n\geq 1$ , und $Y_{0}$ $\mathbb {Z} _{+}$ -wertige Zufallsvariablen und setzt man $\rho _{k}^{n}=P(Y_{n}=k),k\in \mathbb {Z} _{+},n=1,2,...$ so gilt $\rho _{k}^{0}=lim_{n}\rho _{k}^{n}$ genau dann, wenn

P(Y_{o}\in {\mathcal {U}})=lim_{n\to \infty }P(Y_{n}\in {\mathcal {U}})

in allen $A\in \mathbb {Z}$ .

Bemerkung

Setzt man $A=(-\infty ,x]$ , so hat man $Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0},n\to \infty$ .

In der allgemeinen Wahrscheinlichkeitstheorie wird der Stetigkeitssatz mit Hilfe der zugehörigen charakteristischen Funktionen $\phi (n)=E(e^{itY_{n}}),t\in \mathbb {R}$ formuliert.

Stetigkeitssatz

Seien $Y_{n},n\geq 1$ , eine Folge von Zufallsvariablen und $\phi _{n}$ die Folge der zugehörenden charakteristischen Funktionen. $Y_{n}$ ist verteilungskonvergent gegen eine Zufallsvariable $Y_{0}$ genau dann, wenn $\phi _{n}$ gegen eine Funktion $\phi _{0}$ konvergiert, die an der Stelle 0 stetig ist. $\phi _{0}$ ist dann charakteristische Funktion von $Y_{0}:\phi (0)=E(e^{itY_{0}}),t\in \mathbb {R}$ .

Kurzfassung

$Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0}\Leftrightarrow \phi (t)=\phi _{0}(t),\forall t\in \mathbb {R}$ . Die Stetigkeit von $\phi _{0}$ bei 0 garantiert erst, dass $\phi _{0}$ wieder charakteristiche Funktion einer Zufallsvariablen ist.

Im folgenden Beispiel ist das nicht der Fall.

Beispiel (1)

$Y_{n}$ sei gleichverteilt auf $(-n,n)$ . Dann gilt

\phi _{n}(t)=\left\{{\begin{array}{ll}{\frac {sin(nt)}{nt}},&t\neq 0\\1,&t=0\end{array}}\right.

und

lim\phi _{n}(t)=\left\{{\begin{array}{ll}0,&t\neq 0\\1,&t=0\end{array}}\right.

mit bei 0 unstetigen Grenzfunktionen.

Beipiel (2)

Für die Verteilungsfunktion $F_{n}(x)$ von $Y_{0}$ gilt:

limF_{n}(x)=lim_{n\to \infty }\left\{{\begin{array}{ll}0,&x<-n\\{\frac {n+x}{2n}},&x\in (-n,n)\\1,&x>n\end{array}}\right\}={\frac {1}{2}},

was keine Verteilungsfunktion darstellt. Es gibt kein $Y_{0}$ mit $Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0}$ . Statt $Y_{n}{\stackrel {\mathcal {D}}{\to }}Y_{0}$ , $Y_{0}$ $N(0,1)$ -verteilt, schreibt man auch 'gemischt':

Y_{n}{\stackrel {\mathcal {D}}{\to }}N(0,1)

Nun zeigen wir, dass die standardisierten Partialsummen $S_{n}^{*}$ (nehmen jetzt die Rolle von $Y_{n}$ ein) verteilungskonvergent gegen die $N(0,1)$ -Verteilung sind.

Zentraler Grenzwertsatz von Lindberg-Lexy (Satz)

Gegebn sei eine Folge $X_{1},X_{2},...$ von unabhängigen, identisch verteilten Zufallsvariablen aus ${\mathcal {L}}_{2}$ ( $\mu \equiv E(X),\sigma ^{2}\equiv Var(X_{i})>0$ ). Dann gilt für die Folge

S_{n}^{*}={\frac {(X_{1}+...+X_{n})n\mu }{{\sqrt {n}}\sigma }}

der standardisierten Partialsummen von $X_{n},n\geq 1$ , die Verteilungskonvergenz

S_{n}^{*}{\stackrel {\mathcal {D}}{\to }}N(0,1)\,\,n\to \infty

.

Beweis (1)

Ist $\phi (t)$ die charakteristische Funktion von $X_{i}-\mu$ (für alle $i$ dieselbe), so lautet die charakteristische Funktion

\phi _{S_{n}^{*}}=\phi _{n}^{*}={\frac {1}{{\sqrt {n}}\sigma }}\sum _{i=1}^{n}X_{i}-\mu

\phi _{n}^{*}(t)=\phi _{\sum _{i=1}^{n}X_{i}-\mu }({\frac {t}{{\sqrt {n}}\sigma }})=\Pi _{i=1}^{n}\phi ({\frac {t}{{\sqrt {n}}\sigma }})=(\phi ({\frac {t}{{\sqrt {n}}\sigma }}))^{n}

Beweis (2)

Taylorentwicklung von $\phi (t)$ an der Stelle $t=0$ :

\phi (t)=1+\phi '(0)\cdot t+{\frac {1}{2}}\phi ''(0)\cdot t^{2}+r_{2}(t)

mit ${\frac {r_{2}(t)}{t^{2}}}\to 0$ bei $t\to \infty$ .

Nach dem Satz zur Berechnung von Momenten ist

\phi '(0)=i\cdot E(X_{i}-\mu )=0

(*) $\phi ''(0)=-E(X_{i}-\mu )^{2}=\sigma ^{2}$ ,

so dass

\phi (t)=1-{\frac {1}{2}}\sigma ^{2}t^{2}+r_{2}(t).

Beweis (3)

Das $\phi _{n}^{*}$ aus Teil (1) lautet mit Formel (*):

\phi _{n}^{*}(t)=[1-{\frac {1}{2}}{\frac {t^{2}}{n}}+r_{2}({\frac {t}{{\sqrt {n}}\sigma }})]^{n}=(1-{\frac {t^{2}}{2}}(1+a(t)))^{n}

mit

a(t)={\frac {r_{2}({\frac {t}{{\sqrt {n}}\sigma }})}{\frac {t^{2}}{2n}}}\to 0

für

t\to \infty .

Es folgt mit einem $\epsilon$ -Argument

\phi _{n}^{*}(t){\stackrel {n\to \infty }{\to }}\epsilon ^{\frac {t^{2}}{2}}\,\,\forall t\in \mathbb {R} .

Die charakteristische Funktion der $N(0,1)$ -Verteilung ist so, dass der Stetigkeitssatz zusammen mit dem Eindeutigkeitssatz die Behauptung liefern.

Bemerkungen (1)

1. Im Spezialfall unabhängiger, $N(\mu ,\sigma ^{2})$ -verteilter $X_{i}$ ist gemäß dem Beispiel zum Faltungssatz jede $S_{n}^{*}$ $N(0,1)$ -verteilt, so dass hier sogar Gleichheit $F_{S_{n}}=\Phi$ für jedes $n$ gilt.

2. Im zentralen Grenzwertsatz kann die unabhängig-Voraussetzung nicht ersatzlos gestrichen werden. Als Gegenbeispiel wähle man identische $X_{1}=X_{2}=...$ .

Bemerkungen (2)

3. Anwendungsbeispiel: Gewinnung von $N(0,1)$ -verteilten Zufallsvariablen aus $U[0,1]$ -verteilten Zufallsvariablen.

Sind $X_{1},X_{2},...$ unabhängig und $U[0,1]$ gleichverteilt, so ist wegen $\mu ={\frac {1}{2}},\sigma ^{2}={\frac {1}{12}}$

{\frac {S_{n}-{\frac {n}{2}}}{\sqrt {\frac {n}{12}}}}

approximiert $N(0,1)$ -verteilt ( $S_{n})=X_{1}+...x_{n}$ ).
Für $n=48$ ist ${\frac {S_{n}-24}{2}}$ angenähert $N(0,1)$ -verteilt.

Siehe auch