Induktive Schlussweise Schätzfunktionen und Schätzverfahren
Transcription
Induktive Schlussweise Schätzfunktionen und Schätzverfahren
Auswertung univariater Datenmengen - induktiv - Induktive Schlussweise Schätzfunktionen und Schätzverfahren Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 1 Bibliografie ¾ Prof. Dr. Kück Universität Rostock Statistik, Vorlesungsskript Abschnitt 7.1.1; 7.1.2 ¾ Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler ¾ MM*Stat. Eine interaktive Einführung in die Welt der Statistik PC Pool WISO-Fakultät \\zeus\statistik\MMstat\start ¾ Dr. Roland Jeske, Universität Konstanz http://www.wiwi.uni-konstanz.de/heiler/os2/ ¾ Dr. H.-J. Mittag, Fernuniversität Hagen http://www.fernuni-hagen.de/newstatistics Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 2 1 Induktive Schlussweise - Beispiel Beispiel : (Durchmesser der Welle) In einer Maschinenbaufabrik werden Wellen mit einem Nennmaß von 40 mm Durchmesser (Merkmal X) gedreht. Um die Zuverlässigkeit der Produktion zu überprüfen, werden aus der Tagesproduktion von 1.000 Wellen 50 zufällig ausgewählte exakt gemessen und deren mittlerer Durchmesser berechnet. Auf Grund der Differenz zwischen dem Sollwert und dem berechneten mittleren Durchmesser wird auf die Zuverlässigkeit der Tagesproduktion zurück geschlossen. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 3 Gemeinsamkeiten bei Anwendung der Methoden der induktiven Statistik ¾ Gegeben ist eine statistische Masse (z. B. 1.000 Wellen Tagesproduktion). Über ein bei dieser Masse untersuchtes Merkmal (Durchmesser der Welle) möchte man bestimmte Aussagen machen (Ausschussanteil). ¾ Eine Untersuchung der vollständigen statistischen Masse ist nicht möglich, zu teuer, nicht zweckmäßig. Man beschränkt sich deshalb auf einen ausgewählten Teil der Gesamtmasse, eine Stichprobe (z. B. 50 zufällig ausgewählte Wellen). ¾ Aus den Ergebnissen der statistischen Untersuchung der ausgewählten Stichprobe soll auf die Gesamtmasse zurückgeschlossen werden. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 4 2 Gegenstand der induktiven Statistik Wie man aus den Ergebnissen der statistischen Untersuchung einer Stichprobe (Teilmasse) auf die übergeordnete Grundgesamtheit (Gesamtmasse) schließen kann, ist der Gegenstand der induktiven oder schließenden Statistik. Die wichtigsten Teile der induktiven Statistik sind: ¾Schätzverfahren ¾Testverfahren Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 5 Grundlagen des Schätzens Gesucht wird ein Wert, ein Parameter für eine unbekannte Grundgesamtheit. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 6 3 Testverfahren ¾ Statistische Tests sind Verfahren zur Überprüfung von Annahmen bzw. Hypothesen über unbekannte Parameterwerte einer Verteilung bzw. über die unbekannte Verteilung eines Merkmals in der Grundgesamtheit auf der Basis der Ergebnisse einer Zufallsstichprobe. ¾ Solche Annahmen können auf theoretischen Überlegungen, früheren Beobachtungen, Sollwerten, Güteanforderungen, Erfahrungen, Behauptungen usw. basieren. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 7 Induktive Schlussweise -ProblemstellungZufallsstichprobe Grundgesamtheit X: untersuchtes Merkmal in d. GG x1, x2, x3, . . . xn Parameter und Verteilungsfunktion µ, σ², θ, F(x) Für GG i. Allg. unbekannt Schätzen Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Induktion ⎯x, s², p, Fi Für SP bekannt Testen (Hypothesen prüfen) Schätzung I 8 4 Schätzung von Lage- und Streuungsparametern -Aufgabenstellung¾ Das Interesse richtet sich hier auf die unbekannten Parameter q (wie z. B. Erwartungswert µ, Varianz σ2 oder Anteilswert θ) einer Verteilung in der Grundgesamtheit (Parameterschätzung). ¾ Der Wert dieses Parameters q ist unbekannt und soll mittels einer Zufallsstichprobe geschätzt werden. ¾ Dabei unterscheidet man zwei Arten von Schätzungen: Punktschätzung und Intervallschätzung. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 9 Parameterschätzung Beispiel: Es soll das Merkmal X: Einkommen aller 4-Personen-Haushalte der Hansestadt Rostock untersucht werden. Dabei interessiert vor allem, wie hoch das Durchschnittseinkommen µ sowie die entsprechende Streuung σ² dieses Merkmals für diesen Haushaltstyp in Rostock sind. Dazu befragt man 100 zufällig ausgewählte 4-Personen Haushalte. Man kann je Parameter einen Schätzwert angeben oder ein Intervall, welches den zu schätzenden Parameter mit einer bestimmten Sicherheit einschließt bzw. überdeckt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 10 5 Punktschätzung ¾ Als Punktschätzung wird die Ermittlung eines einzelnen Schätzwertes für den Parameter q der Grundgesamtheit aufgrund der Ergebnisse einer Zufallsstichprobe bezeichnet. ¾ Eine Aufgabe der Schätzungstheorie ist es, „gute“ Schätzfunktionen, Schätzer genannt, zu ermitteln. Diese Schätzfunktionen sollen einen „möglichst guten“ Näherungswert für den unbekannten Parameter liefern. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 11 Punktschätzung, Schätzer, Schätzungen Grundgesamtheit Zufallsstichproben X 1 3 F(x) Parameter q z. B. µ, σ², θ Schätzer 2 Schätzungen q̂ n = g(x 11 , x 12 , K , x 1 n ) Einfache Zufallsstichprobe Realisationen q̂n = g(x21, x 22 ,K, x2n ) X1, X2, . . . , Xn x11, x12, . . . ,x1n Fi(x)=F (x) x21, x22, . . . , x2n i=1, 2, ... , n x31, x32, . . . , x3n q̂ n = g(x 31 , x 32 ,K , x 3 n ) Q̂ n = g(X 1 , X 2 , K , X n ) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 12 6 Schätzer bzw. Schätzfunktion als Zufallsgröße ¾Ein Schätzer Q̂ n = g(X 1 , X 2 , K , X n ) eines Parameters q ist eine Funktion der Zufallsvariablen (der Stichprobenvariablen) und deshalb selbst wieder eine Zufallsvariable. ¾Als Zufallsvariable besitzt er eine Verteilung, Stichprobenverteilung genannt. ¾Für die Verteilung der Schätzfunktion (des Schätzers) kann - der Erwartungswert E( Q̂ n ) - die Varianz Var( Q̂ n ) und - die Standardabweichung σ(Q̂ n ) ermittelt werden. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 13 Schätzer für µ - Beispiele Für den Erwartungswert µ einer symmetrischen Verteilung in der Grundgesamtheit können unterschiedliche Schätzer oder Schätzfunktionen konstruiert werden. ¾ Das Stichprobenmittel als arithmetisches Mittel der SP µ̂ n = X n = 1 n ∑ Xi n i =1 ¾ Das Stichprobenmittel als Median der SP µ̂ n = Me{X1 , X 2 ,K, X n } Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 14 7 Schätzer für σ2 - Beispiele Für die Varianz σ2 der Grundgesamtheit können unterschiedliche Schätzer verwendet werden. ¾ Die gewöhnliche Stichprobenvarianz 2 σ̂ 2n = S* n = 2 σ̂ 2n = S' n = 1 n ∑ (X i − µ) 2 n i =1 Anzuwenden, wenn µ für GG bekannt ist. 1 n ∑ (X i − X) 2 n i =1 Anzuwenden, wenn µ für GG unbekannt ist. ¾ Die modifizierte Stichprobenvarianz σ̂ 2n = S2n = 1 n ∑ (X i − X) 2 n − 1 i =1 Anzuwenden, wenn µ für GG unbekannt ist. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 15 „Gute“ Eigenschaften eines Schätzers Da für jeden Parameter der Grundgesamtheit mehrere, verschiedene Schätzer anwendbar sind, sucht man den Schätzer (Stichprobenfunktion) mit den besten Eigenschaften. Gute Eigenschaften eines Schätzers sind: ¾ Erwartungstreue ¾ Effizienz ¾ Konsistenz Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 16 8 Erwartungstreue Ein Schätzer oder Schätzfunktion für den unbekannten Parameter q heißt erwartungstreu oder unverzerrt (unbiased), wenn der Erwartungswert des Schätzers existiert und mit dem wahren Parameter übereinstimmt. Die Differenz zwischen Erwartungswert des Schätzers und Parameterwert wird Verzerrung (bias) genannt. Für erwartungstreue Schätzer ist die Verzerrung gleich Null. E(Q̂ n ) = q Verzerrung (Q̂ n ) = E(Q̂ n ) − q = 0 E(Q̂ n ) q Die Eigenschaft der Erwartungstreue besagt, dass sich bei einer hinreichend großen Anzahl von Stichproben des Umfangs n die positiven und negativen Schätzfehler gegenseitig aufheben (d. h. zu Null addieren) und dass die Schätzfunktion tendenziell den wahren Parameter weder überschätzt noch unterschätzt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 17 Erwartungstreue Schätzer von µ - Beispiele Eine Grundgesamtheit X hat den Mittelwert µ und die Varianz σ2. Es sei (X1, X2, X3) eine einfache Zufallsstichprobe aus dieser Grundgesamtheit, d. h. jede der Stichprobenvariablen Xi (i=1, 2, 3) hat E(Xi) = µ und Var(Xi) = σ2. Folgende drei Schätzer von µ sind erwartungstreu. (Beispiele aus MM*Stat) (a) µ̂ 1 = 1 (X 1 + X 2 + X 3 ) 3 1 1 E( µ̂ 1 ) = E[ (X 1 + X 2 + X 3 )] = (µ + µ + µ) = µ 3 3 (b) µ̂ 2 = 1 (2 X 1 + 2 X 3 ) 4 1 1 E( µ̂ 2 ) = E[ (2 X 1 + 2 X 3 )] = (2 µ + 2 µ) = µ 4 4 1 3 1 1 E( µ̂ 3 ) = E[ (2 X 1 + X 3 )] = (2 µ + µ) = µ 3 3 (c) µ̂ 3 = (2 X 1 + X 3 ) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 18 9 Mittlere quadratische Abweichung (Mean Square Error) - MSE Der mittlere quadratische Fehler bzw. Mean Square Error (Abkürzung: MSE) eines Schätzers ist der mittlere quadratische Abstand zwischen der Schätzfunktion und dem wahren Parameter in der Grundgesamtheit: MSE(Q̂ n ) = E(Q̂ n − q)² E(Q̂ n ) q q Verzerrung (Q̂ n ) = E(Q̂ n ) − q > 0 Verzerrung (Q̂ n ) = E(Q̂ n ) − q < 0 D. h. sie liefert im Durchschnitt Unterschätzungen von q. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik E(Q̂ n ) D. h. sie liefert im Durchschnitt Überschätzungen von q. Schätzung I 19 Zusammenhang zwischen MSE, Verzerrung und Varianz MSE( Q̂ n ) = E(Q̂ n − q)² Es gilt: mit MSE(Q̂ n ) = [Verzerrung(Q̂ n )]² + Var(Q̂ n ) Verzerrung(Q̂ n ) = E(Q̂ n ) − q ¾ Für erwartungstreue Schätzer gilt: Verzerrung (Q̂ n ) = E( Q̂ n ) − q = 0 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I MSE(Q̂ n ) = Var(Q̂ n ) 20 10 Zusammenhang zwischen MSE, Verzerrung und Varianz -Beweis MSE(Q̂ n ) = [Verzerrung(Q̂ n )]² + Var(Q̂ n ) MSE(Q̂ n ) = E(Q̂ n − q)² = E[Q̂ n − E(Q̂ n ) + E(Q̂ n ) − q]² = E{[Q̂ n − E(Q̂ n )]² + 2[Q̂ n − E(Q̂ n )][E(Q̂ n ) − q] + [E(Q̂ n ) − q]²} = E[Q̂ n − E(Q̂ n )]² + 2[E(Q̂ n ) − E(Q̂ n )][E(Q̂ n ) − q] + [E(Q̂ n ) − q]² = Var(Q̂ n ) + 0 + [Verzerrung(Q̂ n )]² = [Verzerrung(Q̂ n )]² + Var(Q̂ n ) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 21 Vergleich von Schätzern - Beispiel (a) µ̂ 1 = 1 (X 1 + X 2 + X 3 ) 3 Var( µ̂ 1 ) = Var[ (b) µ̂ 2 = Var( µ̂ 2 ) = Var[ (c) µ̂ 3 = 1 1 (X 1 + X 2 + X 3 )] = Var(X 3 3² 1 (2 X1 + 2 X 3 ) 4 MSE(µ̂1 ) = Var(µ̂1 ) E( µ̂ 1 ) = µ E( µ̂ 2 ) = µ 1 + X 2+ X3) = 3σ ² σ² = 9 3 MSE(µ̂ 2 ) = Var(µ̂ 2 ) 1 1 4σ ² + 4σ ² 8σ ² σ ² (2 X 1 + 2 X 3 )] = Var(2 X 1 + 2 X 3 ) = = = 4 4² 16 16 2 1 (2 X 1 + X 3 ) 3 E( µ̂ 3 ) = µ MSE(µ̂ 3 ) = Var(µ̂ 3 ) 1 1 4σ ² + σ ² 5σ ² Var( µ̂ 3 ) = Var[ (2 X 1 + X 3 )] = Var(2 X 1 + X 3 ) = = 3 3² 9 9 Var(µ̂1 ) < Var(µ̂ 2 ) < Var(µ̂ 3 ) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik µ1 ist der beste Schätzer von µ Schätzung I 22 11 Effizienz Ein erwartungstreuer Schätzer für den Parameter q einer Grundgesamtheit heißt effizient (wirksam), wenn er eine endliche Varianz hat und wenn es für q keinen anderen erwartungstreuen Schätzer gibt, der eine kleinere Varianz besitzt. Effizient bedeutet dann Erwartungstreue und minimale Varianz. Diese Eigenschaft bei einem Schätzer zu beweisen ist nicht leicht, da die Varianzen der anderen denkbaren Schätzer unbekannt sind. Verzerrung(Q̂ n ) = E(Q̂ n ) − q = 0 Var(Q̂ n ) ≤ Var(Q̂*n ) für alle anderen erwartungstreuen Schätzer Q̂*n des Parameters q Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 23 Konsistenz Man nennt eine Schätzfunktion konsistent, wenn der von ihr erzeugte Schätzwert bei laufender Vergrößerung des Stichprobenumfanges (n→ ∞) mit den zu schätzenden Parameter zusammenfällt und die Varianz gegen Null strebt. Ein Schätzer eines unbekannten Parameters q heißt dann konsistent, wenn die beiden Bedingungen gelten: 1. 2. lim [E(Q̂ n→∞ lim n→∞ n ) − q] = 0 Var(Q̂ n ) = 0 Asymptotisch unverzerrt Asymptotisch effizient MSE(Q̂ n ) = E(Q̂ n − q)² = [E(Q̂ n ) − q]² + Var(Q̂ n ) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I lim n →∞ E(Q̂ n − q)² = 0 24 12 Erwartungswert und Varianz der modifizierten Stichprobenvarianz Sei X eine Grundgesamtheit mit dem Mittelwert µ und der Varianz σ2. Es sei (X1, X2, . . . , Xn) eine einfache Zufallsstichprobe aus dieser Grundgesamtheit, d. h. jede der Stichprobenvariablen Xi (i=1, 2, . . . , n) hat den Erwartungswert E(Xi) = µ und die Varianz Var(Xi) = σ2. Für die modifizierte Stichprobenvarianz S²n gilt: E(S2n ) = E[ 1 n 1 n 2 σ4 (Xi − X)²] = σ ² und Var(S2n ) = Var[ ∑(Xi − X)²] = ∑ n−1 i=1 n−1 n−1 i=1 Der Beweis dieser Eigenschaften erfordert mathematische Kenntnisse, die den Rahmen dieses Kurses überschreitet. Einen ausführlichen Beweis können Sie bei http://www.wiwi.uni-konstanz.de/heiler/os2/ Kapitel 9 und 10 finden. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 25 Eigenschaften der modifizierten Stichprobenvarianz Die modifizierte Stichprobenvarianz ist unverzerrt und konsistent. unverzerrt E(S2n ) = E[ 1 n ∑ (Xi − X)²] = σ ² n − 1 i=1 E(S2n ) − σ ² = 0 konsistent 1 n 2 σ4 Var(S2n ) = Var[ (X X )²] − = ∑ i n−1 i=1 n−1 MSE(S 2n ) = [E(S2n ) − σ ²]² + Var(S2n ) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I lim n→∞ Var(S2n ) = 0 lim MSE[S − σ n →∞ 2 n 2 ]² = 0 26 13 Erwartungswert und Varianz der gewöhnlichen Stichprobenvarianz Sei X eine Grundgesamtheit mit dem Mittelwert µ und der Varianz σ2. Es sei (X1, X2, . . . , Xn) eine einfache Zufallsstichprobe aus dieser Grundgesamtheit, d. h. jede der Stichprobenvariablen Xi (i=1, 2, . . . , n) hat den Erwartungswert E(Xi) = µ und die Varianz Var(Xi) = σ2. Für die gewöhnlichen Stichprobenvarianz S´²n gilt: 2 E(S' n ) = E[ 1 n n−1 (Xi − X)²] = σ² ∑ n i=1 n 2 Var(S ' n ) = Var[ = 1 n 2 und Var(S' n ) = Var[ n ∑ (X i =1 − X )²] = Var[ i (n − 1)² Var(S 2 ) = (n − 1)² ⋅ 2 σ 4 n n² n−1 n² Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik = 2(n − 1) σ 4 1 n (X i − X )²] = ∑ n² n i =1 n−1 1 n ⋅ ∑ (X i − X )²] n n − 1 i =1 2 (n − 1) σ 4 n² Schätzung I 27 Eigenschaften der gewöhnlichen Stichprobenvarianz Die gewöhnliche Stichprobenvarianz ist nicht unverzerrt aber konsistent. Verzerrung E(S´2n ) σ2 Verzerrung(S´2n ) = E(S´2n ) − σ 2 = n−1 σ ² − σ2 n 1 = − σ ² < 0 ⇒ E(S´2n ) < σ 2 n konsistent lim 2 MSE(S' n ) = n→∞ = lim n→∞ Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik lim [E(S n→∞ 1 (− σ 2 ) + n D. h. sie liefert im Durchschnitt Unterschätzungen von σ², aber sie ist für große Stichprobenumfänge kein schlechter Schätzer. lim n→∞ Schätzung I '2 n ) − σ ²]² + 2(n − 1) σ 4 n² lim 2 Var(S' n ) n→∞ =0 28 14 Prinzipien zur Erzeugung guter Schätzer Bisher ist dargestellt worden, was eine Schätzfunktion ist und welche wichtigsten Anforderungen (Eigenschaften) an sie zu stellen sind. Behandelt werden jetzt noch die Prinzipien, nach denen sich sinnvolle Schätzungen für Parameter explizit erzeugen lassen. Die folgenden Prinzipien werden zur Erzeugung von guten Schätzern angewandt: ¾Das Prinzip der kleinsten Quadrate ¾Das Likelihood-Prinzip Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 29 Das Prinzip der kleinsten Quadrate Wir werden dieses Prinzip anhand des Erwartungswertes µ einer Grundgesamtheit X erläutern. Es sei (X1, X2, . . . , Xn) eine einfache Zufallsstichprobe aus dieser Grundgesamtheit, d. h. jede der Stichprobenvariablen Xi (i=1, 2, . . . , n) hat E(Xi) = µ. Sei (x1, x2, . . . , xn) eine Realisation der Zufallsstichprobe. Es wird ein Schätzer von µ (Funktion der Stichprobenvariablen Xi), µn-Dach, so gewählt, dass die Summe der quadrierten Abweichungen zwischen den Stichprobenwerten und dem Schätzwert des unbekannten Parameters µ möglichst klein wird. Das bedeutet, dass µn-Dach so zu bestimmen ist, dass für alle anderen möglichen Parameterschätzer µ*n-Dach gilt: ∑ (x i − µ̂ n )² ≤ ∑ (x i − µ̂*n )² n n i =1 i =1 Bei der Lösung dieser Aufgabe handelt es sich um ein einfaches Extremwertproblem. Man benutzt dafür die Differentialrechnung. Man muss das Minimum der Funktion Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I f( µ̂ *n ) = ∑ (x n i =1 i ) − µ̂ *n ² bestimmen. 30 15 KQ-Schätzer des Erwartungswertes µ ( n ( n df(µ̂ *n ) = −2∑ x i − µ̂ *n * dµ̂ n i =1 ) f(µ̂ ) = ∑ x i − µ̂ ² * n * n i =1 ) Wenn f zweimal ableitbar ist und an der Stelle µ̂ n ein Minimum besitzt, dann gelten: df(µ̂ *n ) dµ̂ *n 1. 2. ( n µ̂ n d ² f(µ̂ *n ) dµ̂ *n ² ∑ (x − µ̂ ) = ∑ x − n µ̂ ) n = −2∑ x i − µ̂ n = 0 i =1 i =1 n µ̂ n = −2∑1 = −2 n < 0 i n µ̂ n = X n = i =1 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik n i i =1 n =0 1 n ∑ Xi n i =1 Schätzung I 31 Das Likelihood-Prinzip Die Maximum - Likelihood - Methode zur Konstruktion von Schätzfunktionen besteht darin, denjenigen Wert q-Dach zu finden, für den die Likelihood - Funktion L(q) bzw. ihr Logarithmus ln L(q) für eine einfache Zufallstichproben (x1, x2, . . . , xn) ihr Maximum annimmt: n L(q) = f(x1 , x 2 , K , x n | q) = f(x1 | q) ⋅ f(x 2 | q) K f(x n | q) = ∏ f(x i | q) i =1 n n i =1 i =1 lnL(q) = ln ∏ f(x i | q) = ∑ lnf(x i | q) L(q̂ n ) = maxL(q) für alle q Die Likelihood – Funktion ist das Produkt der Dichte- bzw. Wahrscheinlichkeitsfunktionen. Da die Logarithmische Funktion monoton wachsend ist, haben L(q) und lnL(q) das Maximum an der gleichen Stelle. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 32 16 ML- Schätzer für die Parameter der Normalverteilung Dichtefunktion f(x | µ, σ) = − 1 ⋅e σ 2π µ̂ n = X n = Erwartungswert E(X) = µ (x −µ)² σ² Varianz Var(X)= σ ² 1 n ∑ Xi n i =1 σ̂ 2n = S*n = 1 n ∑ (X i − µ) 2 n i =1 Anzuwenden, wenn µ für GG bekannt σ̂ 2n = S2n = 1 n ∑ (X i − X) 2 n − 1 i =1 Anzuwenden, wenn µ für GG unbekannt 2 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 33 ML- Schätzer für die Parameter anderer Verteilungen ¾Poissonverteilte Grundgesamtheit µ x −µ f(x | µ) = ⋅e x! µ̂ n = X n = E(X) = Var(X) = µ 1 n ∑ Xi n i =1 ¾Exponentialverteilte Grundgesamtheit ⎧ λe − λx für x ≥ 0 f(x | λ) = ⎨ für x < 0 ⎩0 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik E(X) = 1 λ Schätzung I Var(X) = 1 λ² λ̂ n = X n = 1 n ∑ Xi n i =1 34 17 Unzulänglichkeit der Punktschätzung ¾ Bei einer Punktschätzung erhält man für den unbekannten Parameter einen Schätzwert. Bei jeder konkret ausgewählten Stichprobe erhält man einen entsprechenden Schätzwert des Parameters. ¾ Selbst wenn die Schätzfunktion „gute“ Eigenschaften aufweist, ist die Wahrscheinlichkeit, dass der Schätzwert mit dem wahren Wert des Parameters in der Grundgesamtheit übereinstimmt, im Allgemeinen gleich Null oder sehr klein. ¾ Um diese Unzulänglichkeit abzuschwächen und die Genauigkeit des Schätzverfahrens einzubeziehen, geht man meist zu einer Intervallschätzung über. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 35 Intervallschätzung Mit einer Intervallschätzung wird ein unbekannter Parameter der Grundgesamtheit derart geschätzt, dass ¾ein Intervall entsteht und ¾die Wahrscheinlichkeit dafür angegeben werden kann, dass der wahre Parameterwert der Grundgesamtheit in diesem Intervall liegt. Diese Aussage erfolgt unter dem Vorbehalt einer Irrtumswahrscheinlichkeit α. Ein solches Intervall wird als Konfidenz- oder Vertrauensintervall bezeichnet. Die Wahrscheinlichkeit 1 - α heißt Konfidenzniveau. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 36 18 Vielen Dank!!! Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Schätzung I 37 19