Vorlesung zur Volkswirtschaftspolitik

Transcription

Vorlesung zur Volkswirtschaftspolitik
Empirical Banking and Finance
Vorlesung zur Volkswirtschaftspolitik
Prof. Dr. Isabel Schnabel
Lehrstuhl für Volkswirtschaftslehre, insb. Financial Economics
Johannes Gutenberg-Universität Mainz
Wintersemester 2007/2008
Vorlesung 3
6. November 2007
1 / 33
II. Ökonometrische Methoden
II.1 Grundlagen (Wiederholung)
II.2 Validität einer empirischen Studie
II.3 Daten
II.4 Panelmethoden
II.5 Instrumentvariablenschätzung
2 / 33
II.4 Panelmethoden - Fortgeschrittene Methoden
Literatur: Wooldridge, Kapitel 14
2 zentrale Panelmethoden, die in der Praxis häufig
Anwendung finden:
1. Fixed-effects-Schätzung (FE)
2. Random-effects-Schätzung (RE)
Zentraler Unterschied zwischen den beiden Methoden:
Eine konsistente Schätzung mit RE erfordert, dass der
unbeobachtete Effekt ai nicht mit den eingeschlossenen
x-Variablen korreliert ist
4 / 33
II.4.3 Fixed-effects-Schätzung
Wir haben im letzten Abschnitt gesehen, dass der fixe Effekt
ai durch Differenzenbildung verschwindet
Dasselbe Prinzip unterliegt der Fixed-effects-Schätzung
Statt einer Differenzenbildung wird eine sog.
Within-Transformation durchgeführt:
Berechne die Abweichungen aller Variablen vom
individuenspezifischen Mittelwert über die Zeit
Auch hierdurch verschwindet der fixe Effekt, so dass das
Modell mit Pooled OLS geschätzt werden kann
5 / 33
Within-Transformation
Betrachte das folgende Regressionsmodell:
yit = β0 + β1 xit + ai + uit ,
t = 1, 2, ...T ,
i = 1, ...N
Einschluss eines Absolutgliedes in Abweichung von Wooldridge
Annahme: ai hat einen Mittelwert von 0
Erweiterung auf mehrere x-Variablen ist einfach
Durchschnittsbildung über die Zeit:
ȳi = β0 + β1 x̄i + ai + ūi , wobei
T
yit
ȳi = t=1 , analog für x̄i und ūi
T
Within-Transformation:
yit − ȳi = β1 (xit − x̄i ) + (uit − ūi ),
t = 1, 2, ...T ,
i = 1, 2, ...N
6 / 33
Fixed-effects-Schätzer (Within-Schätzer)
Beachte: Der fixe Effekt ai ist durch die
Within-Transformation verschwunden!
Folge: Das Modell kann nach der Within-Transformation mit
Pooled OLS geschätzt werden
→ Sog. Fixed-effects-Schätzer oder Within-Schätzer
Warum “within”?
Zur Schätzung werden nicht die Niveauunterschiede zwischen
den Individuen verwendet, sondern nur die Abweichungen vom
individuenspezifischen Mittelwert
Beachte: Für die Konsistenz des Schätzers sind keinerlei
Annahmen bezüglich der Korrelation zwischen ai und xit
erforderlich!
Typischerweise werden auch bei einer Fixed-effects-Schätzung
zusätzlich Zeitdummies eingefügt
7 / 33
Between-Schätzer
Im Gegensatz dazu nennt man den Schätzer, der nur die
Niveauunterschiede zwischen den Individuen berücksichtigt,
den Between-Schätzer
Der Between-Schätzer ergibt sich aus einer OLS-Regression
der Mittelwerte (2. Gleichung auf Folie 6), wobei ai als Teil
des Fehlerterms behandelt wird
Beachte: Hierbei werden nur N Beobachtungen (statt N · T )
verwendet, d. h. reine Querschnittsschätzung!
Schätzer ist nur dann konsistent, wenn ai in allen Zeitperioden
nicht mit xit korreliert ist
In diesem Fall gibt es jedoch bessere Schätzer
→ Between-Schätzer ist in der Praxis unbedeutend
8 / 33
Eigenschaften des Fixed-effects-Schätzers
Bedingung für die Konsistenz des FE-Schätzers:
E (uit − ūi |xit − x̄i ) = 0
→ Idiosynkratischer Fehlerterm uit muss unkorreliert sein mit
den xit aller Zeitperioden (strikte Exogenität, vergl. vorne)
Eine Korrelation zwischen ai und xit ist hingegen zulässig
Beachte: Die Darstellung der Schätzergebnisse erfolgt
typischerweise in Niveaus (1. Gleichung auf Folie 6), nicht in
Abweichungen von individuenspezifischen Mittelwerten
Grund: Vereinfachte Interpretation
(Koeffizienten sind identisch)
Einzige Ausnahme: Konstante
(wird typischerweise mit ausgegeben)
9 / 33
Eigenschaften des Fixed-effects-Schätzers
Beachte: Die Anzahl der Freiheitsgrade einer FE-Schätzung
beträgt N · T − k − N (und nicht N · T − k)
Intuition: Bei der Schätzung der N individuenspezifischen
Mittelwerte gehen N Freiheitsgrade “verloren”
Freiheitsgradekorrektur ist wichtig z. B. für die Schätzung des
Standardfehlers der Regression (SER) und damit für die
Standardfehler der Schätzer
Frage: Wie berechnet man das R 2 der Schätzung?
R 2 wird typischerweise auf Basis des mittelwertbereinigten
Modells berechnet
Allein die Mittelwerte “erklären” bereits einen großen Teil der
Variation in yit , das ist aber nicht das, was wir wissen wollen
10 / 33
Eigenschaften des Fixed-effects-Schätzers
Auch hier gilt wieder, dass Effekte von zeitkonstanten
Variablen (z. B. Geschlecht, Kohorte) nicht geschätzt werden
können
Zeitkonstante Variablen können jedoch mit anderen Variablen
interagiert werden, die nicht zeitkonstant sind, z. B. mit den
Zeitdummies
So können Veränderungen des Effekts einer zeitkonstanten
Variable über die Zeit geschätzt werden, auch wenn der Effekt
selbst nicht geschätzt werden kann
Zusätzliches Problem beim Einschluss von Zeitdummies
(für alle Perioden außer der ersten):
Nun kann der Effekt von Variablen, die jedes Jahr um
denselben Betrag steigen (oder sinken), nicht mehr geschätzt
werden
Beispiel: Alter
Dasselbe würde passieren, wenn wir statt der Zeitdummies
einen linearen Zeittrend einführen würden
11 / 33
Dummyvariablen-Regression
Alternative Darstellung der Fixed-effects-Schätzung:
Die ai sind Parameter, die geschätzt werden
(ein Parameter für jedes Individuum i )
Dies bedeutet, dass es für jedes Individuum einen eigenen
Achsenabschnitt gibt (dieser beträgt β0 + ai )
Schätzung: Einfügung von Dummyvariablen für jedes
Individuum
→ Sog. Dummyvariablen-Regression
Beachte: Bei dieser Schätzung müssen sehr viele Parameter
geschätzt werden (N + k zu schätzende Parameter)
Für die Schätzung benötigen wir mindestens 2 Zeitpunkte
12 / 33
Eigenschaften der Dummyvariablen-Regression
Beachte: Schätzung liefert exakt dieselben Schätzer β̂ und
Standardfehler wie die Fixed-effects-Schätzung
Freiheitsgrade werden hier direkt korrekt berechnet
(vorprogrammierte FE-Schätzer tun dies aber auch, Stata:
xtreg,fe)
FE-Schätzung kann gesehen werden als zweite Stufe einer
partitionierten Regression, in deren erster Stufe zunächst auf
die N Dummyvariablen regressiert wurde
Aber: Dummyvariablen-Regression liefert typischerweise ein
sehr hohes R 2
Grund: Hier wird berücksichtigt, dass ein Teil der Variation von
yit durch die Dummyvariablen erklärt wird
13 / 33
Interpretation der geschätzten fixen Effekte
Dummyvariablen-Regression liefert direkt die Schätzer âi ,
i = 1, ...N
Schätzer können aber auch leicht auf Basis der
Fixed-effects-Schätzung ermittelt werden:
âi = ȳi − β̂0 − β̂1 x̄i ,
i = 1, ...N
Ein positives âi zeigt an, dass ein Individuum (unabhängig von
den x-Variablen) ein hohes y hat
... negatives âi ... niedriges y ...
Die ausgegebene Konstante der Fixed-effects-Schätzung
entspricht bei den meisten ökonometrischen Softwarepaketen
dem durchschnittlichen Achsenabschnitt aller Individuen
(und damit β̂0 )
14 / 33
Interpretation der geschätzten fixen Effekte
In den meisten Fällen interessiert man sich in erster Linie für
die β-Parameter und nicht für die ai
Problem bei der Interpretation von âi :
Schätzer âi sind nicht konsistent
Grund: Asymptotik läuft bei Panelmethoden über N
Eine Erhöhung von N führt aber lediglich zu zusätzlichen zu
schätzenden Parametern und verbessert die Schätzung der
übrigen âi nicht
Nur eine Erhöhung von T könnte die Schätzung der ai
verbessern
Typischerweise ist T in Paneldatensätzen jedoch relativ klein
15 / 33
Fixed-effects-Schätzung vs. Schätzung in ersten
Differenzen
Für T = 2 führen beide Schätzungen zu identischen
Ergebnissen
Für T ≥ 3 sind die Schätzer nicht identisch
Aber: Beide sind unter Annahme der strikten Exogenität
(und den weiteren üblichen Annahmen) unverzerrt und
konsistent (für N → ∞)
Faustregeln:
Wenn die uit unkorreliert sind über die Zeit, ist der
FE-Schätzer effizienter (d. h., er hat eine kleinere Varianz)
Wenn die uit einem Random Walk folgen (d. h., wenn gilt:
uit = uit−1 + νit , wobei νit ein White-noise-Fehlerterm ist),
dann ist eine Schätzung in ersten Differenzen besser
In allen anderen Fällen ist die Entscheidung schwierig
Im Zweifel sollte man beide Schätzungen durchführen und
gucken, ob die Ergebnisse sich in größerem Maße
unterscheiden
16 / 33
Sonstige Probleme des Fixed-effects-Schätzers
Fixed-effects-Schätzer bei großem T :
Wenn T groß ist, sollte man vorsichtig sein bei der
Verwendung des FE-Schätzers
(vor allem dann, wenn N nicht besonders groß ist)
Möglicherweise bekommen wir typische Zeitreihenprobleme
(z. B. sog. spurious regression)
In diesem Fall ist eine Schätzung in ersten Differenzen häufig
besser
Messfehlerprobleme und der FE-Schätzer:
Ähnlich wie bei einer Schätzung in ersten Differenzen wird das
Messfehlerproblem durch die Within-Transformation verschärft
In diesem Fall ist der FE-Schätzer jedoch tendenziell
vorzuziehen, weil er für T ≥ 3 im Allgemeinen eine kleinere
Verzerrung aufweist
17 / 33
Fixed-effect-Schätzung mit einem “unbalanced panel”
In den seltensten Fällen beobachtet man alle Individuen zu
allen Zeitpunkten
Fixed-effects-Schätzung lässt sich auch in einem “unbalanced
panel” unproblematisch durchführen
Beachte jedoch, dass nun bei der Mittelwertbildung das
individuenspezifische Ti verwendet werden muss
Die Gesamtzahl der Beobachtungen ist nun T1 + T2 + ... + TN
(statt N · T )
Individuen, für die nur eine Beobachtung verfügbar ist, fallen
aus der Analyse heraus
Entscheidende Frage: Ist das Herausfallen von Beobachtungen
zufällig, oder kommt es möglicherweise zu einer
Stichprobenselektion (hierzu später mehr)?
Beachte: Eine Korrelation der “sample attrition” mit
zeitkonstanten Faktoren (dem fixen Effekt) ist im Rahmen
einer FE-Schätzung unproblematisch
18 / 33
II.4.4 Random-effects-Schätzung
Bei den bisher betrachteten Schätzverfahren haben wir eine
Transformation der Daten verwendet, die dazu geführt hat,
dass die ai verschwinden
Jetzt wird angenommen, dass dies gar nicht nötig ist, weil ai
in allen Zeitperioden nicht mit den x-Variablen korreliert ist
(= zentrale Annahme der Random-effects-Schätzung)
19 / 33
Annahmen des Random-effects-Modells
Betrachte das folgende Regressionsmodell:
yit = β0 + β1 xit + νit
= β0 + β1 xit + ai + uit ,
i = 1, ...N
Annahme: ai hat einen Mittelwert von 0
Auch hier ist eine Erweiterung auf mehrere x-Variablen leicht
möglich
Zentrale Annahme der RE-Schätzung:
Cov (xit , ai ) = 0,
t = 1, 2, ...T ,
t = 1, 2, ...T ,
i = 1, ...N
Zusätzlich treffen wir alle Annahmen der FE-Schätzung
20 / 33
Mögliche Schätzverfahren
Das Modell erfüllt die zentrale OLS-Annahme MLR.4:
E (νit |xit ) = 0
Daher kann das Modell mit Pooled OLS konsistent geschätzt
werden
Andere Schätzverfahren, die zu konsistenten Schätzern führen:
Typischerweise werden zusätzlich Zeitdummies verwendet, um
für Veränderungen des Erwartungswerts von y über die Zeit zu
kontrollieren
OLS eines einzelnen Querschnitts
Schätzung in ersten Differenzen
Fixed-effects-Schätzung
Between-Schätzung
Aber: All diese Schätzverfahren führen zu ineffizienten
Schätzern
21 / 33
Autokorrelation des Fehlerterms
Grund für Ineffizienz: Fehlerterm νit weist Autokorrelation
auf
Kovarianz des Fehlerterms über zwei Zeitpunkte t und s mit
t = s:
Zusätzliche Annahme: Cov (ai , uit ) = 0 für alle i, t
Cov (νit , νis ) = Cov (ai + uit , ai + uis )
= Var (a) = σa2 > 0
Also: Es besteht eine positive Autokorrelation des Fehlerterms
Folge: Der Pooled-OLS-Schätzer ist ineffizient, da er diese
Autokorrelation ignoriert
Beachte: Wenn die Autokorrelation bei der Berechnung der
Standardfehler nicht berücksichtigt wird, werden falsche
Standardfehler verwendet
22 / 33
GLS-Schätzung
Bei Vorliegen von Heteroskedastie oder Autokorrelation gibt
es einen Schätzer, der BLUE ist (best linear unbiased
estimator = bester linearer unverzerrter Schätzer):
Sog. GLS-Schätzer (generalized least squares =
verallgemeinerter KQ-Schätzer)
Idee: Das Modell wird so transformiert, dass der Fehlerterm
des transformierten Modells die Annahmen des Klassischen
Linearen Regressionsmodells erfüllt
OLS-Schätzer des transformierten Modells = GLS-Schätzer
des ursprünglichen Modells
In der Praxis muss die Form der Heteroskedastie bzw.
Autokorrelation geschätzt werden
→ Feasible GLS (FGLS)
Der Feasible-GLS-Schätzer ist konsistent und asymptotisch
effizient
23 / 33
Der Random-effects-Schätzer
Der RE-Schätzer ist der FGLS-Schätzer des oben
beschriebenen Regressionsmodells, der die Autokorrelation des
Fehlerterms berücksichtigt
Wichtige Annahme: N ist groß, T ist relativ klein
GLS-Transformation:
yit − λȳi = β0 (1 − λ) + β1 (xit − λx̄i ) + (νit − λν̄i ),
λ=1−[
σu2
σu2
+
T σa2
1
]2 ,
wobei
wobei
0<λ<1
Man spricht hier von “quasi-demeaned data”
(quasi, weil λ = 1)
RE-Schätzer = Pooled-OLS-Schätzer der transformierten
Gleichung
Herleitung relativ schwierig
24 / 33
Feasible GLS
λ muss geschätzt werden
σa2 und σu2 werden ersetzt durch konsistente Schätzer σ̂a2 und
σ̂u2
σa2 kann z. B. geschätzt werden als Kovarianz der Residuen der
Pooled-OLS-Schätzung (ν̂it ) über die Zeit
σu2 kann geschätzt werden als σ̂ν2 − σ̂a2 , wobei σ̂ν2 der
Standardfehler der Regression (SER) der
Pooled-OLS-Schätzung ist
Schätzung wird von den meisten ökonometrischen
Softwarepaketen standardmäßig durchgeführt
FGLS-Schätzer ist konsistent, asymptotisch effizient und
asymptotisch normalverteilt (für N groß, T klein)
25 / 33
Eigenschaften des Random-effects-Schätzers
Im Gegensatz zur Fixed-effects-Schätzung können hier auch
Effekte von zeitkonstanten Variablen geschätzt werden
Zentraler Vorteil der RE-Schätzung (neben der größeren
Effizienz)
Dies “erkauft” man sich jedoch mit der Annahme, dass der
unbeobachtete Effekt nicht mit den x-Variablen korreliert ist
Folge: Man kann für diese unbeobachtete Heterogenität nicht
kontrollieren.
In der Praxis spielt der Fixed-effects-Schätzer eine viel größere
Rolle als der Random-effects-Schätzer, da man häufig nicht
bereit ist, Unkorreliertheit von ai und x anzunehmen
Man kann jedoch testen, welches der Verfahren angemessener
ist (hierzu unten mehr)
26 / 33
Vergleich der verschiedenen Schätzer
Für λ → 0 erhält man den Pooled-OLS-Schätzer
Für λ → 1 erhält man den Fixed-effects-Schätzer
Dies ist dann der Fall, wenn die Varianz von a relativ zu der
von u vernachlässigbar ist
In diesem Fall spielt der unbeobachtete Effekt keine Rolle
Dies ist dann der Fall, wenn die Varianz von a relativ zu der
von u sehr groß ist
Außerdem nähern sich der RE- und der FE-Schätzer
aneinander an, wenn T groß wird
27 / 33
Vergleich der verschiedenen Schätzer
Wenn die zentrale RE-Annahme verletzt ist, ist der
RE-Schätzer inkonsistent
Aber: Die Verzerrung ist im Allgemeinen kleiner als beim
Pooled-OLS-Schätzer:
νit − λν̄i = (1 − λ)ai + uit − λūi
Unbeobachteter Effekt geht nur mit einem Faktor (1 − λ) ein
Verzerrung geht für λ → 1 gegen 0 (Konvergenz gegen
FE-Schätzer)
Wenn die zentrale Annahme erfüllt ist, ist der RE-Schätzer
besser als die anderen Schätzer, da er effizienter ist
28 / 33
Fixed effects vs. Random effects
Man kann testen, ob FE oder RE die angemessene
Schätzmethode darstellt
Idee des Hausman-Tests:
Unter der Nullhypothese (keine Korrelation von ai und x)
sind beide Schätzer konsistent, aber der RE-Schätzer ist
effizienter
Unter der Alternativhypothese ist hingegen nur der
FE-Schätzer konsistent
→ In diesem Fall sollten die beiden Schätzer voneinander
abweichen
Frage: Ist die Abweichung zwischen den beiden Schätzern groß
genug, um schließen zu können, dass eine Korrelation zwischen
ai und x besteht?
29 / 33
Fixed effects vs. Random effects
Wird die Nullhypothese des Hausman-Tests verworfen, so
sollte der FE-Schätzer verwendet werden
Wird die Nullhypothese nicht verworfen, so sind entweder der
FE- und der RE-Schätzer sehr nah beieinander (dann ist es
egal, welcher Schätzer verwendet wird) oder die
Abweichungen sind groß, aber die Schätzung ist relativ
unpräzise (dann sollte der RE-Schätzer verwendet werden, die
Ergebnisse sind aber relativ unzuverlässig)
30 / 33
Andere Datenstrukturen
Panelmethoden können auch dann verwendet werden, wenn es
keine Zeitdimension gibt
Beispiel: Datensatz mit eineiigen Zwillingen
Unbeobachteter Effekt = Familieneffekt
“Zeit” = erster Zwilling, zweiter Zwilling,...
Anwendung der Methoden ist vollkommen analog
Methoden können bei beliebigen Arten von “Clustern”
verwendet werden
Beachte: Wenn Pooled OLS verwendet wird, müssen die
Standardfehler korrigiert werden, um die Korrelation der
Fehlerterme innerhalb der Cluster (= Autokorrelation) zu
berücksichtigen (Autokorrelations-konsistente Standardfehler,
man spricht auch von clustered standard errors)
31 / 33
Fazit
Zentraler Vorteil von Paneldaten: Man kann man für
zeitkonstante unbeobachtete Heterogenität kontrollieren
und so eine Verzerrung durch ausgelassene Variablen
vermeiden
Fixer Effekt ai verschwindet durch Differenzenbildung
(Schätzung in ersten Differenzen) oder Mittelwertbereinigung
(Fixed-effects-Schätzung)
Beachte: Wenn die unbeobachtete Heterogenität über die Zeit
variiert, kann die Verzerrung nicht vollständig beseitigt
werden!
Der Random-effects-Schätzer ist in der Praxis aufgrund seiner
restriktiven Annahmen nur wenig gebräuchlich
Fixed-effects-Schätzungen sind hingegen sehr verbreitet
32 / 33
Programm der nächsten Woche
II.5 Instrumentvariablenschätzung (z. T. Wiederholung)
Zweistufige KQ-Schätzung
Simultanität
Literatur: Wooldridge, Kapitel 15–16
33 / 33

Documents pareils