3 Induktive Statistik

Transcription

3 Induktive Statistik
3 Induktive Statistik
Oft ist die Wahrscheinlichkeitsverteilung einer Zufallsvariablen X zwar vom Typ
her bekannt (z.B. Normalverteilung), enthält jedoch noch unbekannte statistische Parameter (z.B. µ und σ 2 ). In Abschnitt 3.1 wollen wir diese Parameter in
Form von Zahlen unter Verwendung einer Stichprobe schätzen. Da der Schätzwert einem Punkt auf der Zahlengeraden entspricht, nennt man diese Art der
Parameterschätzung auch Punktschätzung .
Alternativ kann man Intervalle schätzen, in dem die unbekannten Parameter
mit einer vorgegebenen Wahrscheinlichkeit vermutet werden. Man nennt diese
Intervalle Konfidenz- oder Vertrauensintervalle und spricht von einer Intervalloder Bereichsschätzung . Dazu mehr in Abschnitt 3.2.
Eine dritte Aufgabe der induktiven Statistik besteht darin, mit Hilfe einer Stichprobe zu kontrollieren, ob eine Grundgesamtheit mit großer Wahrscheinlichkeit vorgegebene statistische Parameter einhält. Dazu definiert man
Intervalle, die die vorgegebenen Parameter enthalten, und prüft, ob die durch
Punktschätzung gewonnenen empirischen Werte in den jeweiligen Intervallen
liegen. Man spricht von Parametertests , siehe Abschnitt 3.3.
3.1 Punktschätzungen für die unbekannten Parameter einer
Wahrscheinlichkeitsverteilung
Literatur: [Papula Bd. 3, Kap. III.3.2], [Benning, Kap. 4.2]
Bsp 1 Ist der Erwartungswert µ einer Zufallsgröße X der gesuchte Parameter,
dann lässt sich dieser durch den Mittelwert
n
µ̂ = x =
1X
xi
n
i=1
der Stichprobe x1 , . . . , xn schätzen. Dieser Mittelwert ist eine Realisierung der
Stichprobenfunktion
n
1X
X=
Xi
n
i=1
der stochastisch unabhängigen Zufallsgrößen X1 , . . . , Xn .
Def 2 Schätzfunktionen für einen unbekannten statistischen Parameter θ sind
spezielle Stichprobenfunktionen,
Θ = g(X1 , . . . , Xn ),
die für jede konkrete Stichprobe x1 , . . . , xn einen Schätzwert
θ̂ = g(x1 , . . . , xn )
für den Parameter θ liefern. Dabei sind X1 , . . . , Xn unabhängige Zufallsvariable,
die alle die gleiche Verteilungsfunktion besitzen.
3.1 – 1
Bsp 3 Für die Varianz verwendet man die Schätzfunktion
n
S2 =
1X
(Xi − µ)2 ,
n
i=1
falls der Erwartungswert µ bekannt ist, und
n
S2 =
1 X
(Xi − X)2 ,
n−1
i=1
falls der Erwartungswert µ unbekannt ist. In der Hausaufgabe sollen Sie unter1
suchen, warum der Faktor n−1
statt n1 in der letzten Formel gewählt werden
sollte.
Def 4 Eine Schätzfunktion heißt
erwartungstreu (unverzerrt), wenn der Erwartungswert der Schätzfunktion gleich dem gesuchten Parameter der Grundgesamtheit ist.
konsistent (übereinstimmend, passend), wenn die Schätzfunktion mit
Wahrscheinlichkeit Eins mit zunehmenden Stichprobenumfang n gegen
den gesuchten Parameter der Grundgesamtheit strebt.
effizient (wirksam), wenn es bei gleichem Stichprobenumfang n keine andere erwartungstreue Schätzfunktion mit kleinerer Varianz gibt.
erschöpfend (hinreichend), wenn keine andere Schätzfunktion aus den
Stichprobenwerten weitergehende Informationen über den gesuchten Parameter liefert.
robust, wenn die Wahrscheinlichkeitsverteilung der Schätzfunktion unempfindlich gegenüber kleinen Änderungen der Verteilung der Stichprobe
ist.
Bsp 5 Die Schätzfunktion
n
1X
X=
Xi
n
i=1
für den Erwartungswert µ ist erwartungstreu, denn
!
n
n
1X
1X
1
Xi =
E(Xi ) = · nµ = µ.
E(X) = E
n
n
n
i=1
i=1
Bsp 6 Die Schätzfunktion
n
S2 =
1X
(Xi − µ)2
n
i=1
für die Varianz σ 2 ist erwartungstreu, denn
!
n
n
X
1
1X
1
2
2
E(S ) = E
(Xi − µ)
=
E[(Xi − µ)2 ] = · nσ 2 = σ 2 .
n
n
n
i=1
i=1
3.1 – 2
Ü 7 Zeigen Sie, dass bei unbekannter Varianz die Schätzfunktion
n
1 X
(Xi − X)2
S =
n−1
2
i=1
erwartungstreu ist, während dies für die Schätzfunktion
n
S2 =
1X
(Xi − X)2
n
i=1
nicht gilt. Letztere ist nur in der Grenze n → ∞ erwartungstreu, man sagt
asymptotisch erwartungtreu.
Bem 8 Schätzfunktionen kann man u.a. nach der Maximum-Likelihood-Methode
(Methode der maximalen Mutmaßlichkeit ) konstruieren.
Betrachten wir den einfachsten Fall einer stetigen Zufallsgröße X mit der
Dichtefunktion f (x; θ), bei der nur ein Parameter θ unbekannt ist. Man wählt
denjenigen Parameterwert θ̂, der die Dichtefunktion
L(x1 , . . . , xn ; θ) =
n
Y
f (xi ; θ)
i=1
für die gegebene Stichprobe x1 , . . . , xn maximiert, siehe auch [Papula Bd. 3,
Kap. 3.3] und [Benning, Kap. 4.2.5].
3.1 – 3