Lösung Aufgabe 1 (a) stetig, metrisch/kardinalskaliert

Transcription

Lösung Aufgabe 1 (a) stetig, metrisch/kardinalskaliert
Lösung Aufgabe 1
(a) stetig, metrisch/kardinalskaliert/verhältnisskaliert
(b) Man berechnet
16
G =
Gmed =
1 X
132.40
Gi =
= 8.275
16
16
i=1
1
G(8) + G(9) = 8.55 (da n = 16 gerade)
2
Es ergeben sich drei Modi bei 7.1, 9.1, 9.2 mit jeweils 2 Beobachtungen. Damit ist Gmod = 9.15 als
Mittelwert zweier nebeneinander liegender Modi ein sinnvoller Modus.
Da G < Gmed < Gmod , handelt es sich also entsprechend der Lageregel um eine rechtssteile Verteilung.
(c) Bei dem in (b) berechneten Wert handelt es sich um das ungewichtete arithmetische Mittel. Um
einen Schätzer für ganz Deutschland zu erhalten, muss aber die unterschiedliche Bevölkerungszahl
in den Bundesländern berücksichtigt werden, was wohl für den publizierten Wert von 8.7 geschehen
ist. Man müsste also in (b) das gewichtete arithmetische Mittel
Gw =
16
X
wi Gi
mit
wi =
i=1
Bevölkerung in Bundesland i
Bevölkerung in Deutschland
verwenden.
(d) Allgemein ergibt sich bei einem Histogramm mit relativer Häufigkeit fj sowie Breite dj der j-ten
Klasse die Blockhöhe fe(x) = fj /dj . Setzt man dj = 1 für alle Klassen, so ist ein Histogramm mit
einem einfachen Säulendiagramm identisch.
Für die vorliegenden Daten ergibt sich damit folgende Arbeitstabelle
Klassen
(6,7]
(7,8]
(8,9]
(9,10]
Damit ergibt sich folgendes Histogramm
dj
1
1
1
1
hj
2
4
4
6
fj
0.125
0.250
0.250
0.375
fej
0.125
0.250
0.250
0.375
Lösung Aufgabe 2
Gegeben sind seXY = −5.4 und se2Y = 4 =⇒ seY = 2. Das Bestimmtheitsmaß R2 gibt den Anteil der durch
eine lineare (Einfach-)Regression erklärten Streuung an der Gesamtstreuung an. Es gilt
2
R2 = rXY
.
Hier ist gegeben, dass R2 = 0.81.
Gesucht ist die Standardabweichung des Alters seX .
Lösung: Da beide Merkmale X und Y kardinalskaliert sind, verwenden wir den Bravais-PearsonKorrelationskoeffizienten
rXY
=
⇐⇒ seX
=
=
se
q XY
se2X se2Y
seXY
rXY seY
−5.4
.
rXY · 2
Für den Korrelationskoeffizienten erhalten wir
2
R2 = rXY
⇐⇒ rXY
= 0.81
√
= ± 0.81
(1)
= −0.9
(2)
rXY
= +0.9.
⇐⇒ rXY
Da die Varianz und damit die Standardabweichung per Definition stets nicht-negativ sind, erfüllt nur
(1)
rXY = −0.9 die Gleichung. Damit beträgt die Standardabweichung des Alters (X)
seX =
−5.4
= 3.
2 · (−0.9)
Lösung Aufgabe 3
Sei E das Ereignis, dass die Suche in Region 1 erfolglos war und Ri das Ereignis, dass sich das Flugzeug
in Region i, i = 1, 2, 3 befindet.
Gesucht ist P (Ri |E), i = 1, 2, 3.
Aufgabe a)
Lösung: Bekannt ist, dass P (E|R1 ) = β1 , P (E|R2 ) = P (E|R3 ) = 1, sowie P (Ri ) = 31 , i = 1, 2, 3. Nach
der Bayes-Formel gilt
P (Ri |E) =
P (Ri ∩ E)
P (E|Ri ) · P (Ri )
=
, i = 1, 2, 3.
P (E)
P (E)
P (E) berechnen wir mit der Formel für die totale Wahrscheinlichkeit
P (E) =
3
X
P (E|Ri )P (Ri )
i=1
= β1 ·
=
1
1
1
+1· +1·
3
3
3
1
(β1 + 2).
3
Damit erhalten wir
P (R1 |E) =
P (R2 |E) =
P (R3 |E) =
Aufgabe b)
Da für 0 < β1 < 1
P (Ri |E) =
β1
β1 + 2
1
β1 + 2
1
.
β1 + 2
1
1
> = P (Ri ), i = 2, 3
β1 + 2
3
bzw.
P (R1 |E) =
1
β1
< = P (R1 ),
β1 + 2
3
ändern sich die Wahrscheinlichkeiten für den Aufenthalt des Flugzeuges. Die erfolglose Suche hat die
Aufenthaltswahrscheinlichkeiten für die Regionen 2 und 3 erhöht und damit zu einem Informationsgewinn
geführt.
Lösung Aufgabe 4
Sei X die Anzahl der Alarmmeldungen während der sechsstündigen Dienstzeit. Wenn in einer Stunde
durchschnittlich 0.5 Alarmmeldungen empfangen werden, dann sind es in sechs Stunden durchschnittlich
6 · 0.5 = 3 Alarmmeldungen. X ist approximativ poissonverteilt mit Parameter λ = 3, also
P (X = k) = eλ
λk
, k = 0, 1, 2, . . . .
k!
Aufgabe a)
Die Wahrscheinlichkeit, dass in 6 Stunden kein Alarm gegeben wird beträgt
P (X = 0) = e−3
30
= e−3 ≈ 0.0498.
0!
Die Wahrscheinlichkeit, dass in 6 Stunden mindestens dreimal Alarm gegeben wird beträgt
0
31 32
−3 3
P (X ≥ 3) = 1 − P (X = 0) − P (X = 1) − P (X = 2) = 1 − e
+
+
0!
1!
2!
= 1 − e−3 (1 + 3 + 4.5)
= 1 − 8.5e−3 ≈ 0.5768.
Die Wahrscheinlichkeit, dass in 6 Stunden höchstens siebenmal Alarm gegeben wird beträgt
P (X ≤ 7) =
7
X
k=0
−3 λ
e
k
k!
−3
= e
30 31 32 33 34 35 36 37
+
+
+
+
+
+
+
0!
1!
2!
3!
4!
5!
6!
7!
2187
= e
1 + 3 + 4.5 + 4.5 + 3.375 + 2.025 + 1.0125 +
5040
2187
= e−3 17.3875 +
≈ 0.9881.
5040
−3
Aufgabe b)
Sei T die Wartezeit bis zum ersten Alarm in Stunden (also [t = 1 Std.]). Wenn pro Stunde durchschnittlich 0.5 Alarmmeldungen eingehen, dann beträgt die durchschnittliche Wartezeit bis zum ersten Alarm
1
E(T ) = 2. T ist exponentialverteilt mit Parameter λ = 0.5 = E(T
).
Die Wahrscheinlichkeit, dass innerhalb der ersten Dienststunde der erste Alarm eingeht beträgt
P (T ≤ 1) = F (1) = 1 − e−0.5 ≈ 0.3935.
Die Wahrscheinlichkeit, dass die Feuerwehrmannschaft länger als 2 Stunden auf den ersten Alarm warten
muss beträgt
P (T > 2) = 1 − F (2) = e−0.5·2 = e−1 ≈ 0.3679.
Die Wahrscheinlichkeit dafür, ausgerechnet in der letzten Dienststunde den ersten Alarm zu bekommen
beträgt aufgrund der Gedächtnislosigkeit der Exponentialverteilung
P (T ≤ 6|T > 5) = P (T ≤ 5 + 1|T > 5) = P (T ≤ 1) = F (1) = 1 − e−0.5 ≈ 0.3935.
Aufgabe c)
Gesucht ist die Zeitspanne t, nach der mit 95%iger Wahrscheinlichkeit der erste Alarm eingeht, also
P (T ≤ t) = 0.95
=⇒ 1 − e−0.5·t = 0.95
−0.5·t
⇐⇒ e
| − 1 · (−1)
| ln(·)
= 0.05
⇐⇒ −0.5t = ln 0.05
| : −0.05
=⇒ t = 5.9915.
Da t = 5.9915 < 6 fällt mit 95%iger Wahrscheinlichkeit der erste Alarm noch in die Dienstzeit. Der
Oberbrandmeister liegt daher mit seiner Behauptung richtig.
Lösung Aufgabe 5
Aufgabe a
Die Eigenschaft der Nichtnegativität f (x) ≥ 0 ist mit λ > 0 offensichtlich erfüllt. Aus der Normierungsbedingung
Z ∞
Z ∞
!
f (x)dx =
λe−λx dx = 1
−∞
erhält man
Z
∞
−λx
λe
0
0
1 −λx ∞
= 1 − lim e−λx = 1
dx = λ · · e
x→∞
λ
0
| {z }
=0, für λ>0
d.h. für λ > 0 ist auch die Normierungseigenschaft erfüllt.
Aufgabe b
Mit Hilfe der partiellen Integration berechnet man
Z ∞
E(X) =
xλe−λx dx
0
h
i∞
Z
∞
−e−λx dx
0
1 −λx ∞
−λx
= 0 − lim xe
+ − ·e
x→∞
λ
0
| {z }
=
−λx)
x · (−e
0
−
=0, für λ>0
=
1
1
1
− lim e−λx =
λ λ x→∞
λ
| {z }
=0, für λ>0
Lösung Aufgabe 6
Aufgabe a)
Sei PXY (X = x, Y = y) mit x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}. Dann ist
1
PX (X = x) = , x ∈ {1, . . . , 5}
5
und
1
, x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}.
x
Aufgrund der Formel für die bedingte Wahrscheinlichkeit P (A ∩ B) = P (B|A)P (A) ergibt sich
PY |X (Y = y|X = x) =
PXY (X = x, Y = y) = PY |X (Y = y|X = x)PX (X = x) =
1
, x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}.
5x
Aufgabe b)
Es gilt
PXY (X = x, Y = y)
PY (Y = y)
5
5
X
X
1
PY (Y = y) =
PXY (X = x, Y = y) =
5x
x=1
x=1
1 1 1 1
1
1+ + + +
=
5
2 3 4 5
1 60 + 30 + 20 + 15 + 12
=
5
60
137
=
300
1
300
5x
=
, x ∈ {1, . . . , 5}, y ∈ {1, . . . , x}.
=⇒ PX|Y (X = x|Y = y) = 137
685x
300
PX|Y (X = x|Y = y) =
Aufgabe c)
X und Y sind genau dann unabhängig, wenn für alle x ∈ {1, . . . , 5}, y ∈ {1, . . . , x} gilt
PXY (X = x, Y = y) = PX (X = x) · PY (Y = y).
Hier gilt z.B.
PXY (X = 1, Y = 1) =
Damit sind X und Y abhängig.
1
1 137
6= PX (X = 1)PY (Y = 1) = ·
.
5
5 300
Lösung Aufgabe 7
Da aufgrund ihrer Definition für die absolute Häufigkeit ein Wertebereich von 0 ≤ hij ≤ n gegeben ist
und dieser Wertebereich definitionsbedingt auch für die Randhäufigkeiten hi• und h•j gilt, ist χ2 stets
nicht-negativ.
Für den Wertebereich von χ2 überlegt man sich folgendes: Der χ2 -Koeffizient ist ein Zusammenhangsmaß,
d.h. er besitzt als Extremfälle die (vollständige) Unabhängigkeit und die (vollständige) Abhängigkeit
zweier Merkmale. Unter Unabhängigkeit gilt für alle k · ` Kombinationen von Merkmalsausprägungen
hij =
hi• h•j
= eij ,
n
i = 1, . . . , k, j = 1, . . . , `.
Der χ2 -Koeffizient wäre in diesem Fall gleich null.
Für den Fall der vollständigen Abhängigkeit überlegt man sich folgendes. Sei o.B.d.A. k ≤ `. Dann gilt
hij = h•j ,
∀ i = 1, . . . , k, j = 1, . . . , `.
Damit ergibt sich
χ2


k X
`
2
X
hij
− 1
= n
hi• h•j
i=1 j=1


k X
`
X
hij h•j
= n
− 1
hi• h•j
i=1 j=1
k
X
= n(
i=1
`
1 X
hij −1)
hi•
j=1
| {z }
=hi•
= n
k
X
hi•
i=1
hi•
= n(k − 1).
!
−1