Life expectancy II
Transcription
Life expectancy II
Methoden der Empirische Wirtschaftsforschung I Online-Exercise: Life expectancy II Herbert Stocker Arbeiten Sie mit dem Datensatz der letzten Online Übung weiter (‘World Development Indicators’ WDI: http://databank.worldbank.org/). Die Angabe, für welches Land Sie die Berechnungen durchführen sollen, sowie alle weiteren Angaben, finden Sie im LoginBereich der Kursseite http://www.hsto.info/econometrics/login.php. Die benötigten Datenreihen für ‘Ihr’ Land sind wieder • Life expectancy at birth, total (years) → • GDP per capita (constant 2005 US$) GDPpC → LE Legen Sie wieder eine Trendvariable T60 an, die im Jahr 1960 den Wert 1960 hat und bis zum letzten Jahr läuft (T60 = 1960, 1961, . . .). Link: zur Berechnung der Lebenserwartung (klicken). 1. Berechnen Sie einen Regression LE = βb1 + βb2 T60 + ε̂ und prognostizieren Sie mit Hilfe dieser Regression die Lebenserwartung für Ihr Prognosejahr (‘Ihr’ Prognosejahr finden Sie im Login-Bereich der Kursseite). 2. Berechnen Sie die Varianz des P Prognosefehlers für die Prognose aus Frage 1. Achtung: verwenden Sie für T60 und i (T60i − T60)2 nur die Beobachtungen von T60, über die die Gleichung geschätzt wurde! Wenn die Lebenserwartung nur für die Jahre 1965 – 2013 verfügbar ist, dann verwenden Sie für die Berechnungen nur die Beobachtungen von T60 für diesen Zeitraum. Hinweis: In R erhalten Sie mit deviance(eq1 ) die Quadratsumme der Residuen für das Gleichungsobjekt eq1. Eine können Sie mit dem Befehl P beliebige Quadratsumme 2 crossprod berechnen, z.B. i (T60i − T60) mit crossprod(T60 - mean(T60)). Für Stata fällt mir im Moment keine einfache Lösung ein, aber so könnte man P 2 i (T60i − T60) (etwas umständlich) berechnen sum T60 gen mT60sq = (T60 - r(mean))^2 sum mT60sq dis r(sum) 3. Berechnen Sie den unteren Wert des Prognoseintervalls für die Prognose aus Frage 1. 4. Berechnen Sie den oberen Wert des Prognoseintervalls für die Prognose aus Frage 1. 5. Die Zu- bzw. Abnahme der durchschnittlichen Lebenserwartung könnte auch auf Veränderungen des pro Kopf Einkommens zurückzuführen sein. Schätzen Sie LE = βb1 + βb2 log(GDPpC) + ε̂ (1) wobei log den natürlichen Logarithmus bezeichnet. Geben Sie Ihre Schätzung des Koeffizienten von log(GDPpC) ein. Wie interpretieren Sie diesen Koeffizienten? Hinweis: 6. Schätzen Sie nun eine multiple Regression LE = βb1 + βb2 Trend + βb3 log(GDPpC) + ε̂ (2) (mit Trend = 0, 1, 2, . . .) Vergleichen Sie die Koeffizienten von log(GDPpC) in Gleichungen (1) und (2). Geben Sie Ihre Schätzung des Koeffizienten von log(GDPpC) der Gleichung (2) ein (d.h. βb3 ). 7. Als nächstes interessieren wir uns für die Nullhypothese H0 : β2 = 2β3 . Für die Berechnung der t-Statistik benötigen wir die Varianz von βb2 − 2βb3 . Geben Sie Varianz var(βb2 − 2βb3 ) ein. Hinweis: Beachten Sie, dass Sie für die Berechnung dieser Varianz die Kovarianzmatrix der Koeffizienten benötigen! 8. Testen Sie für Gleichung (2) mittels t-Test die Nullhypothese H0 : β2 = 2β3 und geben Sie den empirischen Wert dieser t-Statistik ein. 9. Geben Sie den p-Wert für den Test obiger Nullhypothese ein. 10. Testen Sie nun mittels Chow-Test für Gleichung (2), ob am Jahresanfang des Jahres ‘Strukturbruchjahr’ (für ‘Ihren’ Wert siehe Kursseite) ein Strukturbruch stattgefunden hat. Achtung: Angenommen ‘Ihr’ Strukturbruchjahr wäre 1985 und Sie haben Daten für 1960 – 2012, dann schätzen Sie die erste Gleichung über 1960 – 1984 und die zweite Gleichung über die Periode 1985 – 2012. Geben Sie zuerst die nicht-restringierte Quadratsumme der Residuen ein. Hinweis: Die Quadratsumme der Residuen einer Gleichung eq1 erhalten Sie mit EViews: eq1 .@ssr, R: deviance(eq1 ) Stata: nach der Schätzung der Gleichung mit e(rss) 11. Geben Sie die restringierte Quadratsumme der Residuen ein. Achtung: Achten Sie darauf, dass die Regressionen für das restringierte und nichtrestringierte Modell auf der gleichen Beobachtungszahl beruht! 12. Geben Sie den empirischen Wert der entsprechenden Chow-Statistik (F-Wert) ein. 13. Geben Sie die Anzahl der Zählerfreiheitsgrade der entsprechenden F-Statistik ein. 14. Geben Sie die Anzahl der Nennerfreiheitsgrade der entsprechenden F-Statistik ein. 15. Geben Sie den kritischen Wert der F-Statistik für diese Nullhypothese ein. 16. Fertigen Sie eine Grafik wie die Abbildung 1 für ‘Ihr’ Land an und laden Sie diese als JPG-Datei auf den Server hoch. Die linke Abbildung zeigt ein einfaches Streudiagramm zwischen Lebenserwartung und pro Kopf Einkommen, und die rechte Abbildung den gleichen Zusammenhang für die ‘trendbereinigten’ Variablen (d.h. den Residuen nach einer Regression auf 2 Morocco (H. Stocker) Normal Correlation r = 0.9595 Partial Correlation: rp = -0.6105 75 1.5 1.0 70 0.5 RES_LE LE 65 60 0.0 -0.5 55 -1.0 50 45 600 -1.5 800 1,000 1,200 1,400 1,600 -2.0 -150 1,800 GDPPC -100 -50 0 50 100 150 200 RES_GDPPC Abbildung 1: Zusammenhang zwischen Lebenserwartung und pro Kopf Einkommen ohne (links) und mit (rechts) Trendbereinigung. den Trend; weitere Hinweise finden Sie im Kapitel 7, Abschnitt 7.3.1 (Seite 19ff); http://www.uibk.ac.at/econometrics/einf/kap03.pdf ). Ordnen Sie die beiden Grafiken nebeneinander an und schreiben Sie über diese Grafik den Namen des Landes und Ihren Namen. Wie erklären Sie sich diese Grafik? 3