Life expectancy II

Transcription

Life expectancy II
Methoden der Empirische Wirtschaftsforschung I
Online-Exercise: Life expectancy II
Herbert Stocker
Arbeiten Sie mit dem Datensatz der letzten Online Übung weiter (‘World Development
Indicators’ WDI: http://databank.worldbank.org/). Die Angabe, für welches Land Sie
die Berechnungen durchführen sollen, sowie alle weiteren Angaben, finden Sie im LoginBereich der Kursseite http://www.hsto.info/econometrics/login.php.
Die benötigten Datenreihen für ‘Ihr’ Land sind wieder
• Life expectancy at birth, total (years)
→
• GDP per capita (constant 2005 US$)
GDPpC
→
LE
Legen Sie wieder eine Trendvariable T60 an, die im Jahr 1960 den Wert 1960 hat und bis
zum letzten Jahr läuft (T60 = 1960, 1961, . . .).
Link: zur Berechnung der Lebenserwartung (klicken).
1. Berechnen Sie einen Regression LE = βb1 + βb2 T60 + ε̂ und prognostizieren Sie mit Hilfe
dieser Regression die Lebenserwartung für Ihr Prognosejahr (‘Ihr’ Prognosejahr finden
Sie im Login-Bereich der Kursseite).
2. Berechnen Sie die Varianz des
P Prognosefehlers für die Prognose aus Frage 1. Achtung:
verwenden Sie für T60 und i (T60i − T60)2 nur die Beobachtungen von T60, über die
die Gleichung geschätzt wurde! Wenn die Lebenserwartung nur für die Jahre 1965 –
2013 verfügbar ist, dann verwenden Sie für die Berechnungen nur die Beobachtungen
von T60 für diesen Zeitraum.
Hinweis: In R erhalten Sie mit deviance(eq1 ) die Quadratsumme der Residuen für
das Gleichungsobjekt eq1. Eine
können Sie mit dem Befehl
P beliebige Quadratsumme
2
crossprod berechnen, z.B. i (T60i − T60) mit crossprod(T60 - mean(T60)).
Für Stata fällt mir im Moment keine einfache Lösung ein, aber so könnte man
P
2
i (T60i − T60) (etwas umständlich) berechnen
sum T60
gen mT60sq = (T60 - r(mean))^2
sum mT60sq
dis r(sum)
3. Berechnen Sie den unteren Wert des Prognoseintervalls für die Prognose aus Frage 1.
4. Berechnen Sie den oberen Wert des Prognoseintervalls für die Prognose aus Frage 1.
5. Die Zu- bzw. Abnahme der durchschnittlichen Lebenserwartung könnte auch auf
Veränderungen des pro Kopf Einkommens zurückzuführen sein. Schätzen Sie
LE = βb1 + βb2 log(GDPpC) + ε̂
(1)
wobei log den natürlichen Logarithmus bezeichnet. Geben Sie Ihre Schätzung des
Koeffizienten von log(GDPpC) ein. Wie interpretieren Sie diesen Koeffizienten?
Hinweis:
6. Schätzen Sie nun eine multiple Regression
LE = βb1 + βb2 Trend + βb3 log(GDPpC) + ε̂
(2)
(mit Trend = 0, 1, 2, . . .)
Vergleichen Sie die Koeffizienten von log(GDPpC) in Gleichungen (1) und (2).
Geben Sie Ihre Schätzung des Koeffizienten von log(GDPpC) der Gleichung (2) ein
(d.h. βb3 ).
7. Als nächstes interessieren wir uns für die Nullhypothese H0 : β2 = 2β3 . Für die Berechnung der t-Statistik benötigen wir die Varianz von βb2 − 2βb3 .
Geben Sie Varianz var(βb2 − 2βb3 ) ein.
Hinweis: Beachten Sie, dass Sie für die Berechnung dieser Varianz die Kovarianzmatrix
der Koeffizienten benötigen!
8. Testen Sie für Gleichung (2) mittels t-Test die Nullhypothese H0 : β2 = 2β3 und geben
Sie den empirischen Wert dieser t-Statistik ein.
9. Geben Sie den p-Wert für den Test obiger Nullhypothese ein.
10. Testen Sie nun mittels Chow-Test für Gleichung (2), ob am Jahresanfang des Jahres
‘Strukturbruchjahr’ (für ‘Ihren’ Wert siehe Kursseite) ein Strukturbruch stattgefunden
hat.
Achtung: Angenommen ‘Ihr’ Strukturbruchjahr wäre 1985 und Sie haben Daten für
1960 – 2012, dann schätzen Sie die erste Gleichung über 1960 – 1984 und die zweite
Gleichung über die Periode 1985 – 2012.
Geben Sie zuerst die nicht-restringierte Quadratsumme der Residuen ein.
Hinweis: Die Quadratsumme der Residuen einer Gleichung eq1 erhalten Sie mit
EViews: eq1 .@ssr,
R: deviance(eq1 )
Stata: nach der Schätzung der Gleichung mit e(rss)
11. Geben Sie die restringierte Quadratsumme der Residuen ein.
Achtung: Achten Sie darauf, dass die Regressionen für das restringierte und nichtrestringierte Modell auf der gleichen Beobachtungszahl beruht!
12. Geben Sie den empirischen Wert der entsprechenden Chow-Statistik (F-Wert) ein.
13. Geben Sie die Anzahl der Zählerfreiheitsgrade der entsprechenden F-Statistik ein.
14. Geben Sie die Anzahl der Nennerfreiheitsgrade der entsprechenden F-Statistik ein.
15. Geben Sie den kritischen Wert der F-Statistik für diese Nullhypothese ein.
16. Fertigen Sie eine Grafik wie die Abbildung 1 für ‘Ihr’ Land an und laden Sie diese als
JPG-Datei auf den Server hoch.
Die linke Abbildung zeigt ein einfaches Streudiagramm zwischen Lebenserwartung
und pro Kopf Einkommen, und die rechte Abbildung den gleichen Zusammenhang
für die ‘trendbereinigten’ Variablen (d.h. den Residuen nach einer Regression auf
2
Morocco
(H. Stocker)
Normal Correlation r = 0.9595
Partial Correlation: rp = -0.6105
75
1.5
1.0
70
0.5
RES_LE
LE
65
60
0.0
-0.5
55
-1.0
50
45
600
-1.5
800
1,000
1,200
1,400
1,600
-2.0
-150
1,800
GDPPC
-100
-50
0
50
100
150
200
RES_GDPPC
Abbildung 1: Zusammenhang zwischen Lebenserwartung und pro Kopf Einkommen ohne
(links) und mit (rechts) Trendbereinigung.
den Trend; weitere Hinweise finden Sie im Kapitel 7, Abschnitt 7.3.1 (Seite 19ff);
http://www.uibk.ac.at/econometrics/einf/kap03.pdf ).
Ordnen Sie die beiden Grafiken nebeneinander an und schreiben Sie über diese
Grafik den Namen des Landes und Ihren Namen.
Wie erklären Sie sich diese Grafik?
3