¨Okonometrisches Modellieren mit EViews 4.1 2 Implementierung
Transcription
¨Okonometrisches Modellieren mit EViews 4.1 2 Implementierung
Ökonometrisches Modellieren mit EViews 4.1 Unterlagen für LVen des Instituts für Angewandte Statistic (IFAS) Johannes Kepler Universität Linz Stand: 10. Dezember 2004, Redaktion: Frühwirth-Schnatter 2 Implementierung des multiplen Regressionsmodells 2.1 Modellformulierung und OLS-Schätzung Wie Sie am einfachsten starten Das multiple Regressionsmodell yi = β1 + β2 x2,i + . . . + βK xK,i + εi wird in EViews folgendermaßen implementiert: • Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as Equation. • Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell aufnimmt. • Weiters sehen Sie den Beobachtungszeitraum (sample) und die gewählte Schätzmethode (Least Squares). Sie können vor der Schätzung den Beobachtungsrahmen in sample verändern. • Klicken von OK führt die OLS-Schätzung durch. Andere Startmöglichkeiten • Sind die Daten als object vom Typ group vorhanden, können Sie die Gruppe öffnen, und über Procs/Make Equation starten. • Sie können von der Eviews Menuleiste mit Quick/Estimate Equation eine leere Box Equation Specification erstellen. Objekte vom Typ equation • Sobald Sie OK geklickt haben, erstellt EViews ein neues Objekt vom Typ equation. Ökonometrische Modelle und ihre Anwendung auf einen bestimmten Datensatz sind in EViews prinzipiell in dieser Form organisiert. • Das neue Objekt vom Typ equation wird nicht automatisch im workfile directory eingetragen wird, sondern zunächst in einem namenlosen Equation-Window 5 (untitled) in einem defaultmäßigen View dargestellt wird. Das verhindert ein Ausufern der Ergebnisse. Abgespeichert wird nur, was Sie wirklich aufzuheben möchten. Sie können die noch namenlose Schätzung über den Button Name abspeichern. Die Schätzung wird im workfile directory unter dem gewählten Namen abgespeichert, und durch das Zeichen = als Schätzung charakterisiert ist. 2.1.1 Ändern der Modellformulierung • Wollen Sie ein anderes Modell schätzen, ohne die alte Schätzung zu zerstören, so klicken Sie zuerst den Button Objects/Copy Objects. Sie erhalten eine Kopie des alten Modells, das Sie über den Button Estimate verändern und über den Button Name unter einer neuen Bezeichnung abspeichern können. • Sie können nun die Equation Specification editieren, z.B. eine Prädiktorvariable entfernen. Sie können aber auch einzelne oder alle Variablen transformieren, indem z.B. die Variable predictor durch eine Formel, z.B. log(predictor) ersetzen. 2.1.2 Modellformulierung eines log-linearen Modells Beim log-linearen Modell log(yi ) = β1 + β2 log(x2,i ) + . . . + βK log(xK,i ) + εi wird wie oben beschrieben zunächst ein lineares Model gestartet, vor dem Schätzen werden die Variablen folgendermaßen editiert: log(responsevariable) log(predictor2) log(predictor3) 2.1.3 ... log(predictorK) c Definition von weiteren Prädiktorvariablen • Enthält das Regressionsmodell Potenzen von beobachteten Prädiktorvariablen, z.B. x3,i = x22,i , so wird die zugehörige Prädiktorvariable mit der Funktion predictorˆ0.5 definiert. • Enthält das Regressionsmodell Interaktionsterme von beobachteten Prädiktorvariablen, z.B. x4,i = x2,i x3,i , so wird die zugehörige Prädiktorvariable mit der Funktion predictor2*predictor3 definiert. • Enthält das Regressionsmodell eine Trendvariable, z.B. x2,i = i (bzw. in Zeitreihennotation x2,t = t), so lautet die zugehörige Prädiktorvariable @trend(beginn). Bei undatierten Beobachtungen wählt man am besten @trend(1), bei datieren Daten den Zeitpunkt unmittelbaren vor der ersten Beobachtung, z.B. @trend(1964:12), wenn die Daten mit 1965:1 beginnen. • Saisonale Dummyvariablen werden in EViews unter Verwendung der vordefinierten saisonalen Variablen definiert. Die Variable @seas(1) 6 ist eine vordefinierte Variable, die in der ersten Periode den Wert 1 und sonst 0 annimmt, d.h. für Quartalsdaten im ersten Quartal, für Monatsdaten im ersten Monat. Allgemein ist die Variable @seas(s) ist eine vordefinierte Variable, die nur in der s-ten Periode den Wert 1 und sonst 0 annimmt, d.h. für Quartalsdaten im s.ten Quartal, für Monatsdaten im s-ten Monat. Hinweis: • Über den button procs/Make regressor group kann man die tatsächlichen Werte der Variable kontrollieren. 2.2 Das Equation-Window Wie oben beschrieben, wird das Ergebnis der OLS-Schätzung in einem zunächst namenlosen Equation-Window in einem defaultmäßigen View dargestellt. Daraus läßt sich folgendes ablesen: 1. der Name der Responsevariable (Dependent Variable) aus der 1. Zeile; 2. der Beobachtungszeitraum (Sample) aus der 4. Zeile; 3. die Anzahl der verwendeten Beobachtungen (Included Observations) aus der 5. Zeile; 4. die Reihennamen der Prädiktorvariablen (Variable) aus der ersten Spalte der Tabelle, wobei c für die Konstante steht; 5. die geschätzen Parameter β̂k (Coefficient) aus der zweiten Spalte der Tabelle; 6. die statistische Schwankungsbreite SDk des OLS-Schätzers (Std. Error) aus der dritten Spalte der Tabelle; 7. Der tk -Wert der OLS-Schätzung β̂k , k = 1, . . . , K (T-Statistics) aus der vierten Spalte der Tabelle. 8. Der dem tk -Wert entsprechende p-Wert (Prob) aus der letzten Spalte der Tabelle. 9. Die minimale Fehlerquadratsumme SSR (Sum squared resid). 10. Das Bestimmtheitsmaß R2 (R-squared) 2 11. Der unverzerrte Schätzwert σ̂ 2 für die Varianz √ σ , allerdings nicht direkt. Unter 2 (S.E. of regression) kann die Wurzel σ̂ = σ̂ abgelesen werden. 12. AIC und SC (Schwarz criterion) zur Modellwahl Weitere Views eines equation-Windows werden weiter unten besprochen, zum oben beschriebenen Standardoutput kann jederzeit über den button Stats zurückgekehrt werden. 7 2.3 2.3.1 Weitere Auswertungen im Regressionsmodell Ermitteln und Darstellen des geschätzten Modells Will man für das geschätzte Regressionsmodell den geschätzten Strukturanteil (Fit) ŷi = β̂1 + β̂2 x2,i + . . . + β̂K xK,i , i = 1, . . . , n ermitteln, so geht das am einfachsten über den button resids im Equation Window. Es ist der Fit im Vergleich zu yi über der Beobachtungsnummer aufgetragen. Eine tabellarische Darstellung dieser Ergebnisse erhält man über den Button View/Actual, Fitted, Residual/Table. Über den Button Forecast mit anschliessendem OK erhält man ein Objekt des Typs series mit den gefitteten Werten. Der Name dieser series wird von EViews durch ein Anhängen des Buchstabens f an den Namen der Responsevariablen gewählt, kann aber in der Dialogbox verändert werden. 2.3.2 Parametertests • Testen, ob ein bestimmter Parameter gleich 0 direkt mit dem t-Wert und dem p-Wert in der Tabelle des Standardoutputs. • Mit View/Coefficient Tests/Redundant Variables kann man testen, ob mehrere Koeffizienten den Wert 0 annehmen. In die Dialogbox werden die Namen der zugehörigen Prädiktoren eingetippt. EViews berechnet eine passende F-Statistik und bestimmt den p-Wert dieser Statistik. • Testen von Restriktionen über View/Coefficient Tests/Wald-Coefficient restrictions. In die Dialogbox werden die Restriktionen unter Verwendung der Zeilennummer des Parameters im Standardoutput eingetippt. Möchte man testen, ob der Parameter in der zweiten Zeile den Wert 1 annimmt, so lautet die Restriktion: c(2)=1. 2.3.3 Residuendiagnose Wenn Sie im equation-Window eines Regressionsmodells den Button View/Actual, Fitted, Residual/Residual Graph anklicken, so erhalten Sie einen Zeitreihenplot der OLS-Residuen mit den Schwankungsbändern ±2 · σ̂. Da diese Schwankungsbänder für kleinere Datenumfänge zu schmal sind, werden auch bei einem korrekten Modell mehr als 5% der Residuen aus dem Band herausfallen. Wenn Sie noch andere Darstellungen mit den OLS-Residuen durchführen wollen, so können Sie im Equation Window über den Button Procs/Make Residual Series ein Objekt des typs series mit den Residuen erzeugen. EViews wechselt automatisch in den Spreadsheet View dieser Reihe und vergibt einen Defaultnamen. Wenn Sie in diesem Window den Button Name anklicken, können Sie die Reihe umbenennen. Zur Überprüfung der Annahme A2 erstellen Sie einen Scatterplots zwischen Prädiktorvariable und Residuenreihe. Ein Test auf Normalverteilung der Residuen kann über den Button View/Residual Tests/ Histogram-Normality Test durchgeführt werden. 8 2.3.4 Modellvergleich mit AIC und Schwarz Criterion Der Standardoutput eines Regressionsmodells im Equation Window weist sowohl ein AIC als auch ein Schwarz Criterion aus. Leider stimmen die Formeln, die dabei verwendet wurden, nicht den Formeln der Vorlesung überein. Es besteht folgender Zusammenhang zwischen dem mit EViews berechneten AIC? und SC? mit dem AIC und SC der Vorlesung: AIC + constant n SC + constant SC? = n AIC? = Da die Zahl der Beobachtungen für alle Modelle gleich ist, ist die Reihung der Modelle, die mit den in EViews modifizierten Kriterien entsteht, identisch mit der Reihung nach den Formeln der Vorlesung. Wenn Sie das AIC und SC eines log-linearen Modells transformieren wollen, um es mit dem AIC und SC eines linearen Modells zu vergleichen, brauchen Sie den Mittelwert der logarithmierten Variable yi . Den Wert finden Sie unter Mean dependent var im unteren Teil des Standard Eviews Output. 2.4 Vorhersage für Prädiktorvariablen ohne Responsevariable • Erweitern Sie den maximalen Bearbeitungsrahmen (Range), indem Sie im Workfile Window den Button Procs/Change Workfile Range anklicken. Im Dialogfenster, das nun erscheint, kann der maximalen Bearbeitungsrahmen über end date erweitert werden. Es bewährt sich, auch im Workfile den aktuellen Bearbeitungsrahmen über den Button Sample zu erweitern. • Schätzen Sie für die vollständigen Beobachtungen ein Regressionsmodell. • Eröffnen Sie im equation-Window, das dem geschätzten Regressionsmodell entspricht, eine Gruppe mit der Response- und den Prädiktorvariablen über Proc/Make Regressor Group. EViews eröffnet dann ein neues group-Window im spreadsheetView. Der range dieser Gruppe entspricht dem erweiterten Workfile-Range. Wurde der Workfile-Range nach Durchführung der Regression erweitert, kann der Rahmen über den Button Smpl+/- erweitert werden. • Die künftigen Prädiktorvariablen sind undefiniert (NA). Nun müssen Sie EViews die künftigen Werte der Prädiktorvariablen mitteilen. Dazu gibt es drei Möglichkeiten: – vordefinierte Variablen wie Trend oder saisonale Komponenten werden mit genr nochmals definiert, der Rahmen ist automatisch der erweiterte Rahmen. – die Variablen können aus einem anderen Modell vorhergesagt werden – die Prädiktoren werden durch Eintippen im spreadsheet-View erweitert: ∗ Betätigen Sie im group-Window der Prädiktoren den button Edit+/-, es erscheint ein Eingabefenster in der Kopf-Zeile. ∗ Markieren Sie mit der Maus die Zellen der einzelnen Prädiktorvariablen, tippen Sie den gewünschten Werte in die Kopfzeile, und bestätigen Sie mit der Enter-Taste die Eingabe. 9 ∗ Wiederholen Sie diesen Vorgang, bis alle Werte eingegeben sind. • Kehren Sie zum equation-Window des geschätzten Regressionsmodells zurück. Mit dem button forecast wird nun die Vorhersage für die vorgegebenen Prädiktorvariablen erstellt. Mit anschliessendem OK erhält man ein Objekt des Typs series mit den gefitteten Werten. Der Name dieser series wird von EViews durch ein Anhängen des Buchstabens f an den Namen der Responsevariablen gewählt, kann aber in der Dialogbox verändert werden. • Wenn Sie zum group-Window der Prädiktoren zurückkehren, können Sie die vorhergesagten Werte als Spalte aufnehmen. Klicken Sie dazu den button View/Group Members. Sie erhalten eine Liste mit der Responsevariablen in der ersten und allen weiteren Variablen in den folgenden Zeilen. Sie können diese Liste editieren, indem Sie in der zweiten Zeile den Name der vorhersagten Reihe eintippen. Mit dem button UpdateGroup wird die Liste aktualisiert. Mit dem button View/Spreadsheet kehren Sie zum Spreadsheet-View zurück. In der Spalte, die der Vorhesage entspricht, ist für die vollständigen Beobachtungen der mit dem Modell gefittete Wert eingetragen, für alle Prädiktorvariablen ohne Responsevariable die Vorhersage. 2.5 Modelle mit heteroskedastischen Fehlern Das multiple Regressionsmodell yi = β1 + β2 x2,i + . . . + βK xK,i + εi , mit heteroskedastischen Fehlern εi ∼ N (0, σ 2 Zi ) kann in EViews folgendermaßen implementiert werden: √ • Definieren Sie die Gewichte 1/ Zi mittels Genr, e.g. weight= 1/predictorJˆ.5. • Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as Equation. Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell aufnimmt. • Editieren Sie das Modell, indem Sie alle Variable, einschließlich der Responsevariablen und der Konstanten mit weight multiplizieren. Die Konstante muss durch 1 ersetzt werden, bevor sie multipliziert wird. • Mit OK wird die Schätzung durchgeführt. Um AIC and SC zu transformieren, brauchen wir den Mittelwert von log predictorJ. Definieren Sie Genr ein Objekt vom Typ series, das die entsprechenden Werte enthält. Mit Doppelklick wird ein series-Window eröffnet, aus dem über View/Descriptive Statistics/Stats Table der Mittelwert der logarithmierten Reihe abgelesen werden kann. 10 Ökonometrisches Modellieren mit EViews 4.1 Unterlagen für LVen des Instituts für Angewandte Statistic (IFAS) Johannes Kepler Universität Linz Stand: 10. Dezember 2004, Redaktion: Frühwirth-Schnatter 3 Implementierung von Regressionsmodellen für diskrete Responsevariablen 3.1 Regressionsmodelle mit Zählvariablen als Response Das multiple Regressionsmodell E(yi |x2,i , . . . , xK,i ) = exp (β1 + β2 x2,i + . . . + βK xK,i ) wird in EViews folgendermaßen implementiert: • Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as Equation. • Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell aufnimmt. • Weiters sehen Sie den Beobachtungszeitraum (sample) und die gewählte Schätzmethode (Least Squares). Sie können vor der Schätzung den Beobachtungsrahmen in sample verändern. • Steigen Sie bei methods von LS (least square estimation) auf COUNT - Integer Count Data um. Bei count estimation method ist die Poisson Verteilung (Poisson) voreingestellt. Man kann aber auf die negative Binomialverteilung (Negative Binomial) oder die Normalverteilung mit nichtlinearem Erwartungswert (Normal/NLS) umsteigen. • Klicken von OK führt die Schätzung (ML/NLS) durch. Alle anderen Auswertungen (Testen von einzelnen oder mehreren Koeffizienten, Vorhersage, AIC und Schwrz Kriterion) wie beim klassischen Regressionsmodell. 3.2 Regressionsmodelle mit binären Responsevariablen Das multiple Regressionsmodell log Pr(yi = 1|x2,i , . . . , xK,i ) = β1 + β2 x2,i + . . . + βK xK,i 1 − Pr(yi = 1|x2,i , . . . , xK,i ) wird in EViews folgendermaßen implementiert: 11 • Markieren Sie im Directory des Workfiles zuerst die Responsevariable Y , dann die erklärenden Variablen X2 , . . . , XK . Doppelklick, und wählen Sie dann Open/as Equation. • Es erscheint eine Box, die bei Equation Specification zuerst die Responsevariable, dann die erklärenden Variabeln und schließlich die Konstante (c) ins Modell aufnimmt. • Weiters sehen Sie den Beobachtungszeitraum (sample) und die gewählte Schätzmethode (Least Squares). Sie können vor der Schätzung den Beobachtungsrahmen in sample verändern. • Steigen Sie bei methods von LS (least square estimation) auf BINARY - Binary Choice um. Bei binary estimation method ist das logit model Logit voreingestellt. Man kann aber auf das Probit-Modell (probit) umsteigen. • Klicken von OK führt die ML-Schätzung durch. Alle anderen Auswertungen (Testen von einzelnen oder mehreren Koeffizienten, Vorhersage, AIC und Schwrz Kriterion) wie beim klassischen Regressionsmodell. Das Bestimmtheitsmaß ist durch das McFadden-Bestimmtheitsmaß ersetzt. 12