¨Okonometrisches Modellieren mit EViews 4.1 2 Implementierung

Transcription

¨Okonometrisches Modellieren mit EViews 4.1 2 Implementierung
Ökonometrisches Modellieren mit EViews 4.1
Unterlagen für LVen des Instituts für Angewandte Statistic (IFAS)
Johannes Kepler Universität Linz
Stand: 10. Dezember 2004, Redaktion: Frühwirth-Schnatter
2
Implementierung des multiplen Regressionsmodells
2.1
Modellformulierung und OLS-Schätzung
Wie Sie am einfachsten starten
Das multiple Regressionsmodell
yi = β1 + β2 x2,i + . . . + βK xK,i + εi
wird in EViews folgendermaßen implementiert:
• Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann
die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as
Equation.
• Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell
aufnimmt.
• Weiters sehen Sie den Beobachtungszeitraum (sample) und die gewählte Schätzmethode (Least Squares). Sie können vor der Schätzung den Beobachtungsrahmen in
sample verändern.
• Klicken von OK führt die OLS-Schätzung durch.
Andere Startmöglichkeiten
• Sind die Daten als object vom Typ group vorhanden, können Sie die Gruppe öffnen,
und über Procs/Make Equation starten.
• Sie können von der Eviews Menuleiste mit Quick/Estimate Equation eine leere
Box Equation Specification erstellen.
Objekte vom Typ equation
• Sobald Sie OK geklickt haben, erstellt EViews ein neues Objekt vom Typ equation.
Ökonometrische Modelle und ihre Anwendung auf einen bestimmten Datensatz sind
in EViews prinzipiell in dieser Form organisiert.
• Das neue Objekt vom Typ equation wird nicht automatisch im workfile directory eingetragen wird, sondern zunächst in einem namenlosen Equation-Window
5
(untitled) in einem defaultmäßigen View dargestellt wird. Das verhindert ein Ausufern der Ergebnisse. Abgespeichert wird nur, was Sie wirklich aufzuheben möchten.
Sie können die noch namenlose Schätzung über den Button Name abspeichern. Die
Schätzung wird im workfile directory unter dem gewählten Namen abgespeichert,
und durch das Zeichen = als Schätzung charakterisiert ist.
2.1.1
Ändern der Modellformulierung
• Wollen Sie ein anderes Modell schätzen, ohne die alte Schätzung zu zerstören, so
klicken Sie zuerst den Button Objects/Copy Objects. Sie erhalten eine Kopie des
alten Modells, das Sie über den Button Estimate verändern und über den Button
Name unter einer neuen Bezeichnung abspeichern können.
• Sie können nun die Equation Specification editieren, z.B. eine Prädiktorvariable
entfernen. Sie können aber auch einzelne oder alle Variablen transformieren, indem
z.B. die Variable predictor durch eine Formel, z.B. log(predictor) ersetzen.
2.1.2
Modellformulierung eines log-linearen Modells
Beim log-linearen Modell
log(yi ) = β1 + β2 log(x2,i ) + . . . + βK log(xK,i ) + εi
wird wie oben beschrieben zunächst ein lineares Model gestartet, vor dem Schätzen werden
die Variablen folgendermaßen editiert:
log(responsevariable) log(predictor2) log(predictor3)
2.1.3
... log(predictorK) c
Definition von weiteren Prädiktorvariablen
• Enthält das Regressionsmodell Potenzen von beobachteten Prädiktorvariablen, z.B.
x3,i = x22,i , so wird die zugehörige Prädiktorvariable mit der Funktion predictorˆ0.5
definiert.
• Enthält das Regressionsmodell Interaktionsterme von beobachteten Prädiktorvariablen, z.B. x4,i = x2,i x3,i , so wird die zugehörige Prädiktorvariable mit der Funktion
predictor2*predictor3 definiert.
• Enthält das Regressionsmodell eine Trendvariable, z.B. x2,i = i (bzw. in Zeitreihennotation x2,t = t), so lautet die zugehörige Prädiktorvariable @trend(beginn). Bei
undatierten Beobachtungen wählt man am besten @trend(1), bei datieren Daten
den Zeitpunkt unmittelbaren vor der ersten Beobachtung, z.B. @trend(1964:12),
wenn die Daten mit 1965:1 beginnen.
• Saisonale Dummyvariablen werden in EViews unter Verwendung der vordefinierten saisonalen Variablen definiert. Die Variable
@seas(1)
6
ist eine vordefinierte Variable, die in der ersten Periode den Wert 1 und sonst 0
annimmt, d.h. für Quartalsdaten im ersten Quartal, für Monatsdaten im ersten
Monat. Allgemein ist die Variable
@seas(s)
ist eine vordefinierte Variable, die nur in der s-ten Periode den Wert 1 und sonst 0
annimmt, d.h. für Quartalsdaten im s.ten Quartal, für Monatsdaten im s-ten Monat.
Hinweis:
• Über den button procs/Make regressor group kann man die tatsächlichen Werte
der Variable kontrollieren.
2.2
Das Equation-Window
Wie oben beschrieben, wird das Ergebnis der OLS-Schätzung in einem zunächst namenlosen Equation-Window in einem defaultmäßigen View dargestellt. Daraus läßt sich folgendes ablesen:
1. der Name der Responsevariable (Dependent Variable) aus der 1. Zeile;
2. der Beobachtungszeitraum (Sample) aus der 4. Zeile;
3. die Anzahl der verwendeten Beobachtungen (Included Observations) aus der 5.
Zeile;
4. die Reihennamen der Prädiktorvariablen (Variable) aus der ersten Spalte der Tabelle, wobei c für die Konstante steht;
5. die geschätzen Parameter β̂k (Coefficient) aus der zweiten Spalte der Tabelle;
6. die statistische Schwankungsbreite SDk des OLS-Schätzers (Std. Error) aus der
dritten Spalte der Tabelle;
7. Der tk -Wert der OLS-Schätzung β̂k , k = 1, . . . , K (T-Statistics) aus der vierten
Spalte der Tabelle.
8. Der dem tk -Wert entsprechende p-Wert (Prob) aus der letzten Spalte der Tabelle.
9. Die minimale Fehlerquadratsumme SSR (Sum squared resid).
10. Das Bestimmtheitsmaß R2 (R-squared)
2
11. Der unverzerrte Schätzwert σ̂ 2 für die Varianz
√ σ , allerdings nicht direkt. Unter
2
(S.E. of regression) kann die Wurzel σ̂ = σ̂ abgelesen werden.
12. AIC und SC (Schwarz criterion) zur Modellwahl
Weitere Views eines equation-Windows werden weiter unten besprochen, zum oben
beschriebenen Standardoutput kann jederzeit über den button Stats zurückgekehrt werden.
7
2.3
2.3.1
Weitere Auswertungen im Regressionsmodell
Ermitteln und Darstellen des geschätzten Modells
Will man für das geschätzte Regressionsmodell den geschätzten Strukturanteil (Fit)
ŷi = β̂1 + β̂2 x2,i + . . . + β̂K xK,i ,
i = 1, . . . , n
ermitteln, so geht das am einfachsten über den button resids im Equation Window. Es
ist der Fit im Vergleich zu yi über der Beobachtungsnummer aufgetragen. Eine tabellarische Darstellung dieser Ergebnisse erhält man über den Button View/Actual, Fitted,
Residual/Table. Über den Button Forecast mit anschliessendem OK erhält man ein
Objekt des Typs series mit den gefitteten Werten. Der Name dieser series wird von
EViews durch ein Anhängen des Buchstabens f an den Namen der Responsevariablen
gewählt, kann aber in der Dialogbox verändert werden.
2.3.2
Parametertests
• Testen, ob ein bestimmter Parameter gleich 0 direkt mit dem t-Wert und dem p-Wert
in der Tabelle des Standardoutputs.
• Mit View/Coefficient Tests/Redundant Variables kann man testen, ob mehrere Koeffizienten den Wert 0 annehmen. In die Dialogbox werden die Namen der
zugehörigen Prädiktoren eingetippt. EViews berechnet eine passende F-Statistik
und bestimmt den p-Wert dieser Statistik.
• Testen von Restriktionen über View/Coefficient Tests/Wald-Coefficient restrictions. In die Dialogbox werden die Restriktionen unter Verwendung der Zeilennummer des Parameters im Standardoutput eingetippt. Möchte man testen, ob
der Parameter in der zweiten Zeile den Wert 1 annimmt, so lautet die Restriktion:
c(2)=1.
2.3.3
Residuendiagnose
Wenn Sie im equation-Window eines Regressionsmodells den Button View/Actual,
Fitted, Residual/Residual Graph anklicken, so erhalten Sie einen Zeitreihenplot der
OLS-Residuen mit den Schwankungsbändern ±2 · σ̂. Da diese Schwankungsbänder für
kleinere Datenumfänge zu schmal sind, werden auch bei einem korrekten Modell mehr als
5% der Residuen aus dem Band herausfallen.
Wenn Sie noch andere Darstellungen mit den OLS-Residuen durchführen wollen, so
können Sie im Equation Window über den Button Procs/Make Residual Series ein
Objekt des typs series mit den Residuen erzeugen. EViews wechselt automatisch in
den Spreadsheet View dieser Reihe und vergibt einen Defaultnamen. Wenn Sie in diesem
Window den Button Name anklicken, können Sie die Reihe umbenennen.
Zur Überprüfung der Annahme A2 erstellen Sie einen Scatterplots zwischen Prädiktorvariable und Residuenreihe.
Ein Test auf Normalverteilung der Residuen kann über den Button View/Residual
Tests/ Histogram-Normality Test durchgeführt werden.
8
2.3.4
Modellvergleich mit AIC und Schwarz Criterion
Der Standardoutput eines Regressionsmodells im Equation Window weist sowohl ein AIC
als auch ein Schwarz Criterion aus. Leider stimmen die Formeln, die dabei verwendet
wurden, nicht den Formeln der Vorlesung überein. Es besteht folgender Zusammenhang
zwischen dem mit EViews berechneten AIC? und SC? mit dem AIC und SC der Vorlesung:
AIC
+ constant
n
SC
+ constant
SC? =
n
AIC? =
Da die Zahl der Beobachtungen für alle Modelle gleich ist, ist die Reihung der Modelle,
die mit den in EViews modifizierten Kriterien entsteht, identisch mit der Reihung nach
den Formeln der Vorlesung.
Wenn Sie das AIC und SC eines log-linearen Modells transformieren wollen, um es mit
dem AIC und SC eines linearen Modells zu vergleichen, brauchen Sie den Mittelwert der
logarithmierten Variable yi . Den Wert finden Sie unter Mean dependent var im unteren
Teil des Standard Eviews Output.
2.4
Vorhersage für Prädiktorvariablen ohne Responsevariable
• Erweitern Sie den maximalen Bearbeitungsrahmen (Range), indem Sie im Workfile
Window den Button Procs/Change Workfile Range anklicken. Im Dialogfenster,
das nun erscheint, kann der maximalen Bearbeitungsrahmen über end date erweitert werden. Es bewährt sich, auch im Workfile den aktuellen Bearbeitungsrahmen
über den Button Sample zu erweitern.
• Schätzen Sie für die vollständigen Beobachtungen ein Regressionsmodell.
• Eröffnen Sie im equation-Window, das dem geschätzten Regressionsmodell entspricht, eine Gruppe mit der Response- und den Prädiktorvariablen über Proc/Make
Regressor Group. EViews eröffnet dann ein neues group-Window im spreadsheetView. Der range dieser Gruppe entspricht dem erweiterten Workfile-Range. Wurde
der Workfile-Range nach Durchführung der Regression erweitert, kann der Rahmen
über den Button Smpl+/- erweitert werden.
• Die künftigen Prädiktorvariablen sind undefiniert (NA). Nun müssen Sie EViews die
künftigen Werte der Prädiktorvariablen mitteilen. Dazu gibt es drei Möglichkeiten:
– vordefinierte Variablen wie Trend oder saisonale Komponenten werden mit
genr nochmals definiert, der Rahmen ist automatisch der erweiterte Rahmen.
– die Variablen können aus einem anderen Modell vorhergesagt werden
– die Prädiktoren werden durch Eintippen im spreadsheet-View erweitert:
∗ Betätigen Sie im group-Window der Prädiktoren den button Edit+/-, es
erscheint ein Eingabefenster in der Kopf-Zeile.
∗ Markieren Sie mit der Maus die Zellen der einzelnen Prädiktorvariablen,
tippen Sie den gewünschten Werte in die Kopfzeile, und bestätigen Sie mit
der Enter-Taste die Eingabe.
9
∗ Wiederholen Sie diesen Vorgang, bis alle Werte eingegeben sind.
• Kehren Sie zum equation-Window des geschätzten Regressionsmodells zurück. Mit
dem button forecast wird nun die Vorhersage für die vorgegebenen Prädiktorvariablen erstellt. Mit anschliessendem OK erhält man ein Objekt des Typs series
mit den gefitteten Werten. Der Name dieser series wird von EViews durch ein
Anhängen des Buchstabens f an den Namen der Responsevariablen gewählt, kann
aber in der Dialogbox verändert werden.
• Wenn Sie zum group-Window der Prädiktoren zurückkehren, können Sie die vorhergesagten Werte als Spalte aufnehmen. Klicken Sie dazu den button View/Group
Members. Sie erhalten eine Liste mit der Responsevariablen in der ersten und allen
weiteren Variablen in den folgenden Zeilen. Sie können diese Liste editieren, indem
Sie in der zweiten Zeile den Name der vorhersagten Reihe eintippen. Mit dem button UpdateGroup wird die Liste aktualisiert. Mit dem button View/Spreadsheet
kehren Sie zum Spreadsheet-View zurück. In der Spalte, die der Vorhesage entspricht, ist für die vollständigen Beobachtungen der mit dem Modell gefittete Wert
eingetragen, für alle Prädiktorvariablen ohne Responsevariable die Vorhersage.
2.5
Modelle mit heteroskedastischen Fehlern
Das multiple Regressionsmodell
yi = β1 + β2 x2,i + . . . + βK xK,i + εi ,
mit heteroskedastischen Fehlern εi ∼ N (0, σ 2 Zi ) kann in EViews folgendermaßen implementiert werden:
√
• Definieren Sie die Gewichte 1/ Zi mittels Genr, e.g. weight= 1/predictorJˆ.5.
• Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann
die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as
Equation. Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c)
ins Modell aufnimmt.
• Editieren Sie das Modell, indem Sie alle Variable, einschließlich der Responsevariablen und der Konstanten mit weight multiplizieren. Die Konstante muss durch 1
ersetzt werden, bevor sie multipliziert wird.
• Mit OK wird die Schätzung durchgeführt.
Um AIC and SC zu transformieren, brauchen wir den Mittelwert von log predictorJ.
Definieren Sie Genr ein Objekt vom Typ series, das die entsprechenden Werte enthält.
Mit Doppelklick wird ein series-Window eröffnet, aus dem über View/Descriptive
Statistics/Stats Table der Mittelwert der logarithmierten Reihe abgelesen werden
kann.
10
Ökonometrisches Modellieren mit EViews 4.1
Unterlagen für LVen des Instituts für Angewandte Statistic (IFAS)
Johannes Kepler Universität Linz
Stand: 10. Dezember 2004, Redaktion: Frühwirth-Schnatter
3
Implementierung von Regressionsmodellen für diskrete Responsevariablen
3.1
Regressionsmodelle mit Zählvariablen als Response
Das multiple Regressionsmodell
E(yi |x2,i , . . . , xK,i ) = exp (β1 + β2 x2,i + . . . + βK xK,i )
wird in EViews folgendermaßen implementiert:
• Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann
die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as
Equation.
• Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell
aufnimmt.
• Weiters sehen Sie den Beobachtungszeitraum (sample) und die gewählte Schätzmethode (Least Squares). Sie können vor der Schätzung den Beobachtungsrahmen in
sample verändern.
• Steigen Sie bei methods von LS (least square estimation) auf COUNT - Integer
Count Data um. Bei count estimation method ist die Poisson Verteilung (Poisson)
voreingestellt. Man kann aber auf die negative Binomialverteilung (Negative Binomial)
oder die Normalverteilung mit nichtlinearem Erwartungswert (Normal/NLS) umsteigen.
• Klicken von OK führt die Schätzung (ML/NLS) durch.
Alle anderen Auswertungen (Testen von einzelnen oder mehreren Koeffizienten, Vorhersage, AIC und Schwrz Kriterion) wie beim klassischen Regressionsmodell.
3.2
Regressionsmodelle mit binären Responsevariablen
Das multiple Regressionsmodell
log
Pr(yi = 1|x2,i , . . . , xK,i )
= β1 + β2 x2,i + . . . + βK xK,i
1 − Pr(yi = 1|x2,i , . . . , xK,i )
wird in EViews folgendermaßen implementiert:
11
• Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann
die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as
Equation.
• Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell
aufnimmt.
• Weiters sehen Sie den Beobachtungszeitraum (sample) und die gewählte Schätzmethode (Least Squares). Sie können vor der Schätzung den Beobachtungsrahmen in
sample verändern.
• Steigen Sie bei methods von LS (least square estimation) auf BINARY - Binary
Choice um. Bei binary estimation method ist das logit model Logit voreingestellt. Man kann aber auf das Probit-Modell (probit) umsteigen.
• Klicken von OK führt die ML-Schätzung durch.
Alle anderen Auswertungen (Testen von einzelnen oder mehreren Koeffizienten, Vorhersage, AIC und Schwrz Kriterion) wie beim klassischen Regressionsmodell. Das Bestimmtheitsmaß ist durch das McFadden-Bestimmtheitsmaß ersetzt.
12