Lösung Aufgabe 1 (a) stetig, metrisch/kardinalskaliert
Transcription
Lösung Aufgabe 1 (a) stetig, metrisch/kardinalskaliert
Lösung Aufgabe 1 (a) stetig, metrisch/kardinalskaliert/verhältnisskaliert (b) Man berechnet 16 G = Gmed = 1 X 132.40 Gi = = 8.275 16 16 i=1 1 G(8) + G(9) = 8.55 (da n = 16 gerade) 2 Es ergeben sich drei Modi bei 7.1, 9.1, 9.2 mit jeweils 2 Beobachtungen. Damit ist Gmod = 9.15 als Mittelwert zweier nebeneinander liegender Modi ein sinnvoller Modus. Da G < Gmed < Gmod , handelt es sich also entsprechend der Lageregel um eine rechtssteile Verteilung. (c) Bei dem in (b) berechneten Wert handelt es sich um das ungewichtete arithmetische Mittel. Um einen Schätzer für ganz Deutschland zu erhalten, muss aber die unterschiedliche Bevölkerungszahl in den Bundesländern berücksichtigt werden, was wohl für den publizierten Wert von 8.7 geschehen ist. Man müsste also in (b) das gewichtete arithmetische Mittel Gw = 16 X wi Gi mit wi = i=1 Bevölkerung in Bundesland i Bevölkerung in Deutschland verwenden. (d) Allgemein ergibt sich bei einem Histogramm mit relativer Häufigkeit fj sowie Breite dj der j-ten Klasse die Blockhöhe fe(x) = fj /dj . Setzt man dj = 1 für alle Klassen, so ist ein Histogramm mit einem einfachen Säulendiagramm identisch. Für die vorliegenden Daten ergibt sich damit folgende Arbeitstabelle Klassen (6,7] (7,8] (8,9] (9,10] Damit ergibt sich folgendes Histogramm dj 1 1 1 1 hj 2 4 4 6 fj 0.125 0.250 0.250 0.375 fej 0.125 0.250 0.250 0.375 Lösung Aufgabe 2 Gegeben sind seXY = −5.4 und se2Y = 4 =⇒ seY = 2. Das Bestimmtheitsmaß R2 gibt den Anteil der durch eine lineare (Einfach-)Regression erklärten Streuung an der Gesamtstreuung an. Es gilt 2 R2 = rXY . Hier ist gegeben, dass R2 = 0.81. Gesucht ist die Standardabweichung des Alters seX . Lösung: Da beide Merkmale X und Y kardinalskaliert sind, verwenden wir den Bravais-PearsonKorrelationskoeffizienten rXY = ⇐⇒ seX = = se q XY se2X se2Y seXY rXY seY −5.4 . rXY · 2 Für den Korrelationskoeffizienten erhalten wir 2 R2 = rXY ⇐⇒ rXY = 0.81 √ = ± 0.81 (1) = −0.9 (2) rXY = +0.9. ⇐⇒ rXY Da die Varianz und damit die Standardabweichung per Definition stets nicht-negativ sind, erfüllt nur (1) rXY = −0.9 die Gleichung. Damit beträgt die Standardabweichung des Alters (X) seX = −5.4 = 3. 2 · (−0.9) Lösung Aufgabe 3 Sei E das Ereignis, dass die Suche in Region 1 erfolglos war und Ri das Ereignis, dass sich das Flugzeug in Region i, i = 1, 2, 3 befindet. Gesucht ist P (Ri |E), i = 1, 2, 3. Aufgabe a) Lösung: Bekannt ist, dass P (E|R1 ) = β1 , P (E|R2 ) = P (E|R3 ) = 1, sowie P (Ri ) = 31 , i = 1, 2, 3. Nach der Bayes-Formel gilt P (Ri |E) = P (Ri ∩ E) P (E|Ri ) · P (Ri ) = , i = 1, 2, 3. P (E) P (E) P (E) berechnen wir mit der Formel für die totale Wahrscheinlichkeit P (E) = 3 X P (E|Ri )P (Ri ) i=1 = β1 · = 1 1 1 +1· +1· 3 3 3 1 (β1 + 2). 3 Damit erhalten wir P (R1 |E) = P (R2 |E) = P (R3 |E) = Aufgabe b) Da für 0 < β1 < 1 P (Ri |E) = β1 β1 + 2 1 β1 + 2 1 . β1 + 2 1 1 > = P (Ri ), i = 2, 3 β1 + 2 3 bzw. P (R1 |E) = 1 β1 < = P (R1 ), β1 + 2 3 ändern sich die Wahrscheinlichkeiten für den Aufenthalt des Flugzeuges. Die erfolglose Suche hat die Aufenthaltswahrscheinlichkeiten für die Regionen 2 und 3 erhöht und damit zu einem Informationsgewinn geführt. Lösung Aufgabe 4 Sei X die Anzahl der Alarmmeldungen während der sechsstündigen Dienstzeit. Wenn in einer Stunde durchschnittlich 0.5 Alarmmeldungen empfangen werden, dann sind es in sechs Stunden durchschnittlich 6 · 0.5 = 3 Alarmmeldungen. X ist approximativ poissonverteilt mit Parameter λ = 3, also P (X = k) = eλ λk , k = 0, 1, 2, . . . . k! Aufgabe a) Die Wahrscheinlichkeit, dass in 6 Stunden kein Alarm gegeben wird beträgt P (X = 0) = e−3 30 = e−3 ≈ 0.0498. 0! Die Wahrscheinlichkeit, dass in 6 Stunden mindestens dreimal Alarm gegeben wird beträgt 0 31 32 −3 3 P (X ≥ 3) = 1 − P (X = 0) − P (X = 1) − P (X = 2) = 1 − e + + 0! 1! 2! = 1 − e−3 (1 + 3 + 4.5) = 1 − 8.5e−3 ≈ 0.5768. Die Wahrscheinlichkeit, dass in 6 Stunden höchstens siebenmal Alarm gegeben wird beträgt P (X ≤ 7) = 7 X k=0 −3 λ e k k! −3 = e 30 31 32 33 34 35 36 37 + + + + + + + 0! 1! 2! 3! 4! 5! 6! 7! 2187 = e 1 + 3 + 4.5 + 4.5 + 3.375 + 2.025 + 1.0125 + 5040 2187 = e−3 17.3875 + ≈ 0.9881. 5040 −3 Aufgabe b) Sei T die Wartezeit bis zum ersten Alarm in Stunden (also [t = 1 Std.]). Wenn pro Stunde durchschnittlich 0.5 Alarmmeldungen eingehen, dann beträgt die durchschnittliche Wartezeit bis zum ersten Alarm 1 E(T ) = 2. T ist exponentialverteilt mit Parameter λ = 0.5 = E(T ). Die Wahrscheinlichkeit, dass innerhalb der ersten Dienststunde der erste Alarm eingeht beträgt P (T ≤ 1) = F (1) = 1 − e−0.5 ≈ 0.3935. Die Wahrscheinlichkeit, dass die Feuerwehrmannschaft länger als 2 Stunden auf den ersten Alarm warten muss beträgt P (T > 2) = 1 − F (2) = e−0.5·2 = e−1 ≈ 0.3679. Die Wahrscheinlichkeit dafür, ausgerechnet in der letzten Dienststunde den ersten Alarm zu bekommen beträgt aufgrund der Gedächtnislosigkeit der Exponentialverteilung P (T ≤ 6|T > 5) = P (T ≤ 5 + 1|T > 5) = P (T ≤ 1) = F (1) = 1 − e−0.5 ≈ 0.3935. Aufgabe c) Gesucht ist die Zeitspanne t, nach der mit 95%iger Wahrscheinlichkeit der erste Alarm eingeht, also P (T ≤ t) = 0.95 =⇒ 1 − e−0.5·t = 0.95 −0.5·t ⇐⇒ e | − 1 · (−1) | ln(·) = 0.05 ⇐⇒ −0.5t = ln 0.05 | : −0.05 =⇒ t = 5.9915. Da t = 5.9915 < 6 fällt mit 95%iger Wahrscheinlichkeit der erste Alarm noch in die Dienstzeit. Der Oberbrandmeister liegt daher mit seiner Behauptung richtig. Lösung Aufgabe 5 Aufgabe a Die Eigenschaft der Nichtnegativität f (x) ≥ 0 ist mit λ > 0 offensichtlich erfüllt. Aus der Normierungsbedingung Z ∞ Z ∞ ! f (x)dx = λe−λx dx = 1 −∞ erhält man Z ∞ −λx λe 0 0 1 −λx ∞ = 1 − lim e−λx = 1 dx = λ · · e x→∞ λ 0 | {z } =0, für λ>0 d.h. für λ > 0 ist auch die Normierungseigenschaft erfüllt. Aufgabe b Mit Hilfe der partiellen Integration berechnet man Z ∞ E(X) = xλe−λx dx 0 h i∞ Z ∞ −e−λx dx 0 1 −λx ∞ −λx = 0 − lim xe + − ·e x→∞ λ 0 | {z } = −λx) x · (−e 0 − =0, für λ>0 = 1 1 1 − lim e−λx = λ λ x→∞ λ | {z } =0, für λ>0 Lösung Aufgabe 6 Aufgabe a) Sei PXY (X = x, Y = y) mit x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}. Dann ist 1 PX (X = x) = , x ∈ {1, . . . , 5} 5 und 1 , x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}. x Aufgrund der Formel für die bedingte Wahrscheinlichkeit P (A ∩ B) = P (B|A)P (A) ergibt sich PY |X (Y = y|X = x) = PXY (X = x, Y = y) = PY |X (Y = y|X = x)PX (X = x) = 1 , x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}. 5x Aufgabe b) Es gilt PXY (X = x, Y = y) PY (Y = y) 5 5 X X 1 PY (Y = y) = PXY (X = x, Y = y) = 5x x=1 x=1 1 1 1 1 1 1+ + + + = 5 2 3 4 5 1 60 + 30 + 20 + 15 + 12 = 5 60 137 = 300 1 300 5x = , x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}. =⇒ PX|Y (X = x|Y = y) = 137 685x 300 PX|Y (X = x|Y = y) = Aufgabe c) X und Y sind genau dann unabhängig, wenn für alle x ∈ {1, . . . , 5}, y ∈ {1, . . . , x} gilt PXY (X = x, Y = y) = PX (X = x) · PY (Y = y). Hier gilt z.B. PXY (X = 1, Y = 1) = Damit sind X und Y abhängig. 1 1 137 6= PX (X = 1)PY (Y = 1) = · . 5 5 300 Lösung Aufgabe 7 Da aufgrund ihrer Definition für die absolute Häufigkeit ein Wertebereich von 0 ≤ hij ≤ n gegeben ist und dieser Wertebereich definitionsbedingt auch für die Randhäufigkeiten hi• und h•j gilt, ist χ2 stets nicht-negativ. Für den Wertebereich von χ2 überlegt man sich folgendes: Der χ2 -Koeffizient ist ein Zusammenhangsmaß, d.h. er besitzt als Extremfälle die (vollständige) Unabhängigkeit und die (vollständige) Abhängigkeit zweier Merkmale. Unter Unabhängigkeit gilt für alle k · ` Kombinationen von Merkmalsausprägungen hij = hi• h•j = eij , n i = 1, . . . , k, j = 1, . . . , `. Der χ2 -Koeffizient wäre in diesem Fall gleich null. Für den Fall der vollständigen Abhängigkeit überlegt man sich folgendes. Sei o.B.d.A. k ≤ `. Dann gilt hij = h•j , ∀ i = 1, . . . , k, j = 1, . . . , `. Damit ergibt sich χ2 k X ` 2 X hij − 1 = n hi• h•j i=1 j=1 k X ` X hij h•j = n − 1 hi• h•j i=1 j=1 k X = n( i=1 ` 1 X hij −1) hi• j=1 | {z } =hi• = n k X hi• i=1 hi• = n(k − 1). ! −1