Vorlesung zur Volkswirtschaftspolitik
Transcription
Vorlesung zur Volkswirtschaftspolitik
Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik Prof. Dr. Isabel Schnabel Lehrstuhl für Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universität Mainz Wintersemester 2007/2008 Vorlesung 3 6. November 2007 1 / 33 II. Ökonometrische Methoden II.1 Grundlagen (Wiederholung) II.2 Validität einer empirischen Studie II.3 Daten II.4 Panelmethoden II.5 Instrumentvariablenschätzung 2 / 33 II.4 Panelmethoden - Fortgeschrittene Methoden Literatur: Wooldridge, Kapitel 14 2 zentrale Panelmethoden, die in der Praxis häufig Anwendung finden: 1. Fixed-effects-Schätzung (FE) 2. Random-effects-Schätzung (RE) Zentraler Unterschied zwischen den beiden Methoden: Eine konsistente Schätzung mit RE erfordert, dass der unbeobachtete Effekt ai nicht mit den eingeschlossenen x-Variablen korreliert ist 4 / 33 II.4.3 Fixed-effects-Schätzung Wir haben im letzten Abschnitt gesehen, dass der fixe Effekt ai durch Differenzenbildung verschwindet Dasselbe Prinzip unterliegt der Fixed-effects-Schätzung Statt einer Differenzenbildung wird eine sog. Within-Transformation durchgeführt: Berechne die Abweichungen aller Variablen vom individuenspezifischen Mittelwert über die Zeit Auch hierdurch verschwindet der fixe Effekt, so dass das Modell mit Pooled OLS geschätzt werden kann 5 / 33 Within-Transformation Betrachte das folgende Regressionsmodell: yit = β0 + β1 xit + ai + uit , t = 1, 2, ...T , i = 1, ...N Einschluss eines Absolutgliedes in Abweichung von Wooldridge Annahme: ai hat einen Mittelwert von 0 Erweiterung auf mehrere x-Variablen ist einfach Durchschnittsbildung über die Zeit: ȳi = β0 + β1 x̄i + ai + ūi , wobei T yit ȳi = t=1 , analog für x̄i und ūi T Within-Transformation: yit − ȳi = β1 (xit − x̄i ) + (uit − ūi ), t = 1, 2, ...T , i = 1, 2, ...N 6 / 33 Fixed-effects-Schätzer (Within-Schätzer) Beachte: Der fixe Effekt ai ist durch die Within-Transformation verschwunden! Folge: Das Modell kann nach der Within-Transformation mit Pooled OLS geschätzt werden → Sog. Fixed-effects-Schätzer oder Within-Schätzer Warum “within”? Zur Schätzung werden nicht die Niveauunterschiede zwischen den Individuen verwendet, sondern nur die Abweichungen vom individuenspezifischen Mittelwert Beachte: Für die Konsistenz des Schätzers sind keinerlei Annahmen bezüglich der Korrelation zwischen ai und xit erforderlich! Typischerweise werden auch bei einer Fixed-effects-Schätzung zusätzlich Zeitdummies eingefügt 7 / 33 Between-Schätzer Im Gegensatz dazu nennt man den Schätzer, der nur die Niveauunterschiede zwischen den Individuen berücksichtigt, den Between-Schätzer Der Between-Schätzer ergibt sich aus einer OLS-Regression der Mittelwerte (2. Gleichung auf Folie 6), wobei ai als Teil des Fehlerterms behandelt wird Beachte: Hierbei werden nur N Beobachtungen (statt N · T ) verwendet, d. h. reine Querschnittsschätzung! Schätzer ist nur dann konsistent, wenn ai in allen Zeitperioden nicht mit xit korreliert ist In diesem Fall gibt es jedoch bessere Schätzer → Between-Schätzer ist in der Praxis unbedeutend 8 / 33 Eigenschaften des Fixed-effects-Schätzers Bedingung für die Konsistenz des FE-Schätzers: E (uit − ūi |xit − x̄i ) = 0 → Idiosynkratischer Fehlerterm uit muss unkorreliert sein mit den xit aller Zeitperioden (strikte Exogenität, vergl. vorne) Eine Korrelation zwischen ai und xit ist hingegen zulässig Beachte: Die Darstellung der Schätzergebnisse erfolgt typischerweise in Niveaus (1. Gleichung auf Folie 6), nicht in Abweichungen von individuenspezifischen Mittelwerten Grund: Vereinfachte Interpretation (Koeffizienten sind identisch) Einzige Ausnahme: Konstante (wird typischerweise mit ausgegeben) 9 / 33 Eigenschaften des Fixed-effects-Schätzers Beachte: Die Anzahl der Freiheitsgrade einer FE-Schätzung beträgt N · T − k − N (und nicht N · T − k) Intuition: Bei der Schätzung der N individuenspezifischen Mittelwerte gehen N Freiheitsgrade “verloren” Freiheitsgradekorrektur ist wichtig z. B. für die Schätzung des Standardfehlers der Regression (SER) und damit für die Standardfehler der Schätzer Frage: Wie berechnet man das R 2 der Schätzung? R 2 wird typischerweise auf Basis des mittelwertbereinigten Modells berechnet Allein die Mittelwerte “erklären” bereits einen großen Teil der Variation in yit , das ist aber nicht das, was wir wissen wollen 10 / 33 Eigenschaften des Fixed-effects-Schätzers Auch hier gilt wieder, dass Effekte von zeitkonstanten Variablen (z. B. Geschlecht, Kohorte) nicht geschätzt werden können Zeitkonstante Variablen können jedoch mit anderen Variablen interagiert werden, die nicht zeitkonstant sind, z. B. mit den Zeitdummies So können Veränderungen des Effekts einer zeitkonstanten Variable über die Zeit geschätzt werden, auch wenn der Effekt selbst nicht geschätzt werden kann Zusätzliches Problem beim Einschluss von Zeitdummies (für alle Perioden außer der ersten): Nun kann der Effekt von Variablen, die jedes Jahr um denselben Betrag steigen (oder sinken), nicht mehr geschätzt werden Beispiel: Alter Dasselbe würde passieren, wenn wir statt der Zeitdummies einen linearen Zeittrend einführen würden 11 / 33 Dummyvariablen-Regression Alternative Darstellung der Fixed-effects-Schätzung: Die ai sind Parameter, die geschätzt werden (ein Parameter für jedes Individuum i ) Dies bedeutet, dass es für jedes Individuum einen eigenen Achsenabschnitt gibt (dieser beträgt β0 + ai ) Schätzung: Einfügung von Dummyvariablen für jedes Individuum → Sog. Dummyvariablen-Regression Beachte: Bei dieser Schätzung müssen sehr viele Parameter geschätzt werden (N + k zu schätzende Parameter) Für die Schätzung benötigen wir mindestens 2 Zeitpunkte 12 / 33 Eigenschaften der Dummyvariablen-Regression Beachte: Schätzung liefert exakt dieselben Schätzer β̂ und Standardfehler wie die Fixed-effects-Schätzung Freiheitsgrade werden hier direkt korrekt berechnet (vorprogrammierte FE-Schätzer tun dies aber auch, Stata: xtreg,fe) FE-Schätzung kann gesehen werden als zweite Stufe einer partitionierten Regression, in deren erster Stufe zunächst auf die N Dummyvariablen regressiert wurde Aber: Dummyvariablen-Regression liefert typischerweise ein sehr hohes R 2 Grund: Hier wird berücksichtigt, dass ein Teil der Variation von yit durch die Dummyvariablen erklärt wird 13 / 33 Interpretation der geschätzten fixen Effekte Dummyvariablen-Regression liefert direkt die Schätzer âi , i = 1, ...N Schätzer können aber auch leicht auf Basis der Fixed-effects-Schätzung ermittelt werden: âi = ȳi − β̂0 − β̂1 x̄i , i = 1, ...N Ein positives âi zeigt an, dass ein Individuum (unabhängig von den x-Variablen) ein hohes y hat ... negatives âi ... niedriges y ... Die ausgegebene Konstante der Fixed-effects-Schätzung entspricht bei den meisten ökonometrischen Softwarepaketen dem durchschnittlichen Achsenabschnitt aller Individuen (und damit β̂0 ) 14 / 33 Interpretation der geschätzten fixen Effekte In den meisten Fällen interessiert man sich in erster Linie für die β-Parameter und nicht für die ai Problem bei der Interpretation von âi : Schätzer âi sind nicht konsistent Grund: Asymptotik läuft bei Panelmethoden über N Eine Erhöhung von N führt aber lediglich zu zusätzlichen zu schätzenden Parametern und verbessert die Schätzung der übrigen âi nicht Nur eine Erhöhung von T könnte die Schätzung der ai verbessern Typischerweise ist T in Paneldatensätzen jedoch relativ klein 15 / 33 Fixed-effects-Schätzung vs. Schätzung in ersten Differenzen Für T = 2 führen beide Schätzungen zu identischen Ergebnissen Für T ≥ 3 sind die Schätzer nicht identisch Aber: Beide sind unter Annahme der strikten Exogenität (und den weiteren üblichen Annahmen) unverzerrt und konsistent (für N → ∞) Faustregeln: Wenn die uit unkorreliert sind über die Zeit, ist der FE-Schätzer effizienter (d. h., er hat eine kleinere Varianz) Wenn die uit einem Random Walk folgen (d. h., wenn gilt: uit = uit−1 + νit , wobei νit ein White-noise-Fehlerterm ist), dann ist eine Schätzung in ersten Differenzen besser In allen anderen Fällen ist die Entscheidung schwierig Im Zweifel sollte man beide Schätzungen durchführen und gucken, ob die Ergebnisse sich in größerem Maße unterscheiden 16 / 33 Sonstige Probleme des Fixed-effects-Schätzers Fixed-effects-Schätzer bei großem T : Wenn T groß ist, sollte man vorsichtig sein bei der Verwendung des FE-Schätzers (vor allem dann, wenn N nicht besonders groß ist) Möglicherweise bekommen wir typische Zeitreihenprobleme (z. B. sog. spurious regression) In diesem Fall ist eine Schätzung in ersten Differenzen häufig besser Messfehlerprobleme und der FE-Schätzer: Ähnlich wie bei einer Schätzung in ersten Differenzen wird das Messfehlerproblem durch die Within-Transformation verschärft In diesem Fall ist der FE-Schätzer jedoch tendenziell vorzuziehen, weil er für T ≥ 3 im Allgemeinen eine kleinere Verzerrung aufweist 17 / 33 Fixed-effect-Schätzung mit einem “unbalanced panel” In den seltensten Fällen beobachtet man alle Individuen zu allen Zeitpunkten Fixed-effects-Schätzung lässt sich auch in einem “unbalanced panel” unproblematisch durchführen Beachte jedoch, dass nun bei der Mittelwertbildung das individuenspezifische Ti verwendet werden muss Die Gesamtzahl der Beobachtungen ist nun T1 + T2 + ... + TN (statt N · T ) Individuen, für die nur eine Beobachtung verfügbar ist, fallen aus der Analyse heraus Entscheidende Frage: Ist das Herausfallen von Beobachtungen zufällig, oder kommt es möglicherweise zu einer Stichprobenselektion (hierzu später mehr)? Beachte: Eine Korrelation der “sample attrition” mit zeitkonstanten Faktoren (dem fixen Effekt) ist im Rahmen einer FE-Schätzung unproblematisch 18 / 33 II.4.4 Random-effects-Schätzung Bei den bisher betrachteten Schätzverfahren haben wir eine Transformation der Daten verwendet, die dazu geführt hat, dass die ai verschwinden Jetzt wird angenommen, dass dies gar nicht nötig ist, weil ai in allen Zeitperioden nicht mit den x-Variablen korreliert ist (= zentrale Annahme der Random-effects-Schätzung) 19 / 33 Annahmen des Random-effects-Modells Betrachte das folgende Regressionsmodell: yit = β0 + β1 xit + νit = β0 + β1 xit + ai + uit , i = 1, ...N Annahme: ai hat einen Mittelwert von 0 Auch hier ist eine Erweiterung auf mehrere x-Variablen leicht möglich Zentrale Annahme der RE-Schätzung: Cov (xit , ai ) = 0, t = 1, 2, ...T , t = 1, 2, ...T , i = 1, ...N Zusätzlich treffen wir alle Annahmen der FE-Schätzung 20 / 33 Mögliche Schätzverfahren Das Modell erfüllt die zentrale OLS-Annahme MLR.4: E (νit |xit ) = 0 Daher kann das Modell mit Pooled OLS konsistent geschätzt werden Andere Schätzverfahren, die zu konsistenten Schätzern führen: Typischerweise werden zusätzlich Zeitdummies verwendet, um für Veränderungen des Erwartungswerts von y über die Zeit zu kontrollieren OLS eines einzelnen Querschnitts Schätzung in ersten Differenzen Fixed-effects-Schätzung Between-Schätzung Aber: All diese Schätzverfahren führen zu ineffizienten Schätzern 21 / 33 Autokorrelation des Fehlerterms Grund für Ineffizienz: Fehlerterm νit weist Autokorrelation auf Kovarianz des Fehlerterms über zwei Zeitpunkte t und s mit t = s: Zusätzliche Annahme: Cov (ai , uit ) = 0 für alle i, t Cov (νit , νis ) = Cov (ai + uit , ai + uis ) = Var (a) = σa2 > 0 Also: Es besteht eine positive Autokorrelation des Fehlerterms Folge: Der Pooled-OLS-Schätzer ist ineffizient, da er diese Autokorrelation ignoriert Beachte: Wenn die Autokorrelation bei der Berechnung der Standardfehler nicht berücksichtigt wird, werden falsche Standardfehler verwendet 22 / 33 GLS-Schätzung Bei Vorliegen von Heteroskedastie oder Autokorrelation gibt es einen Schätzer, der BLUE ist (best linear unbiased estimator = bester linearer unverzerrter Schätzer): Sog. GLS-Schätzer (generalized least squares = verallgemeinerter KQ-Schätzer) Idee: Das Modell wird so transformiert, dass der Fehlerterm des transformierten Modells die Annahmen des Klassischen Linearen Regressionsmodells erfüllt OLS-Schätzer des transformierten Modells = GLS-Schätzer des ursprünglichen Modells In der Praxis muss die Form der Heteroskedastie bzw. Autokorrelation geschätzt werden → Feasible GLS (FGLS) Der Feasible-GLS-Schätzer ist konsistent und asymptotisch effizient 23 / 33 Der Random-effects-Schätzer Der RE-Schätzer ist der FGLS-Schätzer des oben beschriebenen Regressionsmodells, der die Autokorrelation des Fehlerterms berücksichtigt Wichtige Annahme: N ist groß, T ist relativ klein GLS-Transformation: yit − λȳi = β0 (1 − λ) + β1 (xit − λx̄i ) + (νit − λν̄i ), λ=1−[ σu2 σu2 + T σa2 1 ]2 , wobei wobei 0<λ<1 Man spricht hier von “quasi-demeaned data” (quasi, weil λ = 1) RE-Schätzer = Pooled-OLS-Schätzer der transformierten Gleichung Herleitung relativ schwierig 24 / 33 Feasible GLS λ muss geschätzt werden σa2 und σu2 werden ersetzt durch konsistente Schätzer σ̂a2 und σ̂u2 σa2 kann z. B. geschätzt werden als Kovarianz der Residuen der Pooled-OLS-Schätzung (ν̂it ) über die Zeit σu2 kann geschätzt werden als σ̂ν2 − σ̂a2 , wobei σ̂ν2 der Standardfehler der Regression (SER) der Pooled-OLS-Schätzung ist Schätzung wird von den meisten ökonometrischen Softwarepaketen standardmäßig durchgeführt FGLS-Schätzer ist konsistent, asymptotisch effizient und asymptotisch normalverteilt (für N groß, T klein) 25 / 33 Eigenschaften des Random-effects-Schätzers Im Gegensatz zur Fixed-effects-Schätzung können hier auch Effekte von zeitkonstanten Variablen geschätzt werden Zentraler Vorteil der RE-Schätzung (neben der größeren Effizienz) Dies “erkauft” man sich jedoch mit der Annahme, dass der unbeobachtete Effekt nicht mit den x-Variablen korreliert ist Folge: Man kann für diese unbeobachtete Heterogenität nicht kontrollieren. In der Praxis spielt der Fixed-effects-Schätzer eine viel größere Rolle als der Random-effects-Schätzer, da man häufig nicht bereit ist, Unkorreliertheit von ai und x anzunehmen Man kann jedoch testen, welches der Verfahren angemessener ist (hierzu unten mehr) 26 / 33 Vergleich der verschiedenen Schätzer Für λ → 0 erhält man den Pooled-OLS-Schätzer Für λ → 1 erhält man den Fixed-effects-Schätzer Dies ist dann der Fall, wenn die Varianz von a relativ zu der von u vernachlässigbar ist In diesem Fall spielt der unbeobachtete Effekt keine Rolle Dies ist dann der Fall, wenn die Varianz von a relativ zu der von u sehr groß ist Außerdem nähern sich der RE- und der FE-Schätzer aneinander an, wenn T groß wird 27 / 33 Vergleich der verschiedenen Schätzer Wenn die zentrale RE-Annahme verletzt ist, ist der RE-Schätzer inkonsistent Aber: Die Verzerrung ist im Allgemeinen kleiner als beim Pooled-OLS-Schätzer: νit − λν̄i = (1 − λ)ai + uit − λūi Unbeobachteter Effekt geht nur mit einem Faktor (1 − λ) ein Verzerrung geht für λ → 1 gegen 0 (Konvergenz gegen FE-Schätzer) Wenn die zentrale Annahme erfüllt ist, ist der RE-Schätzer besser als die anderen Schätzer, da er effizienter ist 28 / 33 Fixed effects vs. Random effects Man kann testen, ob FE oder RE die angemessene Schätzmethode darstellt Idee des Hausman-Tests: Unter der Nullhypothese (keine Korrelation von ai und x) sind beide Schätzer konsistent, aber der RE-Schätzer ist effizienter Unter der Alternativhypothese ist hingegen nur der FE-Schätzer konsistent → In diesem Fall sollten die beiden Schätzer voneinander abweichen Frage: Ist die Abweichung zwischen den beiden Schätzern groß genug, um schließen zu können, dass eine Korrelation zwischen ai und x besteht? 29 / 33 Fixed effects vs. Random effects Wird die Nullhypothese des Hausman-Tests verworfen, so sollte der FE-Schätzer verwendet werden Wird die Nullhypothese nicht verworfen, so sind entweder der FE- und der RE-Schätzer sehr nah beieinander (dann ist es egal, welcher Schätzer verwendet wird) oder die Abweichungen sind groß, aber die Schätzung ist relativ unpräzise (dann sollte der RE-Schätzer verwendet werden, die Ergebnisse sind aber relativ unzuverlässig) 30 / 33 Andere Datenstrukturen Panelmethoden können auch dann verwendet werden, wenn es keine Zeitdimension gibt Beispiel: Datensatz mit eineiigen Zwillingen Unbeobachteter Effekt = Familieneffekt “Zeit” = erster Zwilling, zweiter Zwilling,... Anwendung der Methoden ist vollkommen analog Methoden können bei beliebigen Arten von “Clustern” verwendet werden Beachte: Wenn Pooled OLS verwendet wird, müssen die Standardfehler korrigiert werden, um die Korrelation der Fehlerterme innerhalb der Cluster (= Autokorrelation) zu berücksichtigen (Autokorrelations-konsistente Standardfehler, man spricht auch von clustered standard errors) 31 / 33 Fazit Zentraler Vorteil von Paneldaten: Man kann man für zeitkonstante unbeobachtete Heterogenität kontrollieren und so eine Verzerrung durch ausgelassene Variablen vermeiden Fixer Effekt ai verschwindet durch Differenzenbildung (Schätzung in ersten Differenzen) oder Mittelwertbereinigung (Fixed-effects-Schätzung) Beachte: Wenn die unbeobachtete Heterogenität über die Zeit variiert, kann die Verzerrung nicht vollständig beseitigt werden! Der Random-effects-Schätzer ist in der Praxis aufgrund seiner restriktiven Annahmen nur wenig gebräuchlich Fixed-effects-Schätzungen sind hingegen sehr verbreitet 32 / 33 Programm der nächsten Woche II.5 Instrumentvariablenschätzung (z. T. Wiederholung) Zweistufige KQ-Schätzung Simultanität Literatur: Wooldridge, Kapitel 15–16 33 / 33