Introduction aux modèles économétriques

Transcription

Introduction aux modèles économétriques
U. Paris Ouest,
M1 - Cours de Modélisation Appliquée
Introduction aux modèles
économétriques
Laurent Ferrara
Février 2013
U. Paris Ouest
L. Ferrara, 20122012-13
Plan de la présentation
1. Concepts
2. Modèles statistiques
3 Exemples
3.
E
l de
d modèles
dèl
U. Paris Ouest
L. Ferrara, 20122012-13
1 C
1.
Concepts
t
Objectif
Prendre des décisions à partir de l’observation d’un ensemble de
données
Méthode
Construction d’un modèle économétrique pour chaque type
d’étude
Outils
1) Théorie de l ’information et concepts d’optimalité
→ construction dd’une
une population exhaustive : pas tjs facile ….
→Ouest
Solution : échantillonnage
U. Paris
L. Ferrara, 20122012-13
2) Modèles économétriques:
Modèles probabilistes : loi de distribution de l’échantillon
Modèles paramétriques : modèles de régression linéaire et nonnon
linéaire, modèles de séries chronologiques, ….
→ Chaque type de modèle fait appel à des paramètres (de la loi
et / ou du modèle), a priori inconnus qu
qu’il
il faudra estimer.
On peut identifier de 2 types de paramètres : paramètres de
loi de distribution ou pparamètres de structure.
3)) Estimation et tests :
Inférence statistique basée sur l’échantillon observé
→ Co
Contrôle
ô e de laa qualité
qua é de l ’information
o a o et
e de laa décision
déc s o prise
p se
associée au test
U. Paris Ouest
L. Ferrara, 20122012-13
Exemples :
- Etude d’une ppopulation
p
par
p sondage
g ((élections,, enquêtes
q
d’opinion auprès des ménages et des industriels…)
- Explication de phénomènes macro-économiques et microéconomiques
q
- Prévision
év s o (variables
(va ab es macro,
ac o, tau
taux de cchange,
a ge, actifs
act s
financiers, …)
- Prise de décision de politique économique par le
ggouvernement et la banque
q centrale
U. Paris Ouest
L. Ferrara, 20122012-13
2 Modèles
2.
M dèl économétriques
é
ét i
Définition formelle
On appelle modèle au sens statistique la donnée dd’un
un triplet
(Ω, F , IP)
où :
Ω est l’ensemble (les données)
F est une tribu sur Ω
IP est une famille de lois de proba. sur (Ω, F) tq : IP→ (IPθ )θ ∈Θ
θ ∈ Θ ⊂ ℜk
qui dépend d’un paramètre vectoriel
U. Paris Ouest
L. Ferrara, 20122012-13
Hypothèse clé de travail :
Les individus interrogés sont identifiés à des variables
aléatoires X1 , …, Xn , à valeurs dans Ω (Ω = R ou Rd ),
)
indépendantes et de même loi de distribution Pθ (i.i.d.)
Remarques :
R1: En général, Ω ⊂ Rd , on travaille alors avec la tribu des
boréliens B d
R
d
R2 : Quand Θ ⊂ ( R , BRd ) on parle de modèle paramétrique
probabiliste. On connaît la loi Pθ mais θ est inconnu.
→ On va donc se servir de l’échantillon qu ’on aura
construit à partir des individus pour identifier ce paramètre θ.
U. Paris Ouest
L. Ferrara, 20122012-13
Définition:
On appelle n-échantillon, le vecteur aléatoire :
X = (X1 , …, Xn ) de loi Pθn , suite finie de v.a.
v a indépendantes
et identiquement distribuées (iid) de loi Pθ .
Définition:
On appelle observation une réalisation du vecteur aléatoire X,
X
notée : x = (x1 , …, xn ).
Remarques :
n
n
n
R1: Le modèle statistique associé à X est : (Ω , F , IPθ )
U. Paris Ouest
L. Ferrara, 20122012-13
R2: La famille de lois Pθ est supposée posséder une densité
continue fθ (x)
ou discrète p( x,θ ) (abus de language)
R3 : Δθ = {x; fθ ( x) > 0}
est le support de la loi Pθ .
R4 : Sous l’hypothèse
l hypothèse dd’indépendance
indépendance :
U. Paris Ouest
Pθn = Pθ ×...
× × Pθ
L. Ferrara, 20122012-13
Définition:
On appelle statistique toute fonction mesurable f tq:
f: (X1 , …, Xn ) → f(X1 , …, Xn ) ∈ Rk ,
k étant la dimension de la statistique.
Exemples
E
l :
• (X1 , …, Xn ) statistique de dimension n
• (X(1) , …, X(n) ) statistique de dimension n
• X1 statistique de dimension 1
• 1/n ∑i Xi statistique de dimension 1
U. Paris Ouest
L. Ferrara, 20122012-13
3 E
3.
Exemples
l de
d modèles
dèl
Modèle Binomial
Ω = {données} = {réponses à une question binaire (oui/non)}
On interroge n individus,
individus Xi est la réponse de l ’individu
individu i :
Xi = 1 si oui et Xi = 0 si non
→ Xi est une v.a.
v a qui suit une loi de Bernouilli de paramètre
θ inconnu tq :
θ = probabilité que ll’individu
individu réponde oui
Le modèle statistique associé au vecteur aléatoire X est :
n
n
{
}
( 0,1 , F , B(θ , n))
Exemples ?
U. Paris Ouest
θ?
L. Ferrara, 20122012-13
Modèle Multinomial
Ω = {données} = {réponses à une question à plusieurs
modalités} = {Aj , j = 1, …, J }
θj = probabilité que l’individu i réponde Aj
On suppose
pp
qqu ’il n ’yy a pas
p de non réponses
p
((= abstention))
ie : ∑j θj = 1
On interroge
g n individus,, Xi est la réponse
p
de l ’individu i :
Xi ∈ {Aj , j = 1, …, J }
Le modèle statistique associé au vecteur aléatoire X est :
({A1 ,..., AJ } , F n , M n (θ1 ,...,θ J ))
n
Exemples ?
Rem : L
L’estimation
estimation de J-1paramètres suffit
U. Paris Ouest
L. Ferrara, 20122012-13
Modèle Log-Normal
g
Sur n individus, on mesure une variable Ri .
On suppose
pp
qqu ’il s ’agit
g d ’une variable continue ppositive
Ri ~ LogN (m,σ2 )
ie
Log(
g(Ri ) ~ N (m,
( σ2 )
On a 2 paramètres d ’intérêt
intérêt m et σ2
Le modèle statistique associé au vecteur aléatoire X est :
( R n , BRn , ( LogN
L N) n )
Exemples ?
U. Paris Ouest
L. Ferrara, 20122012-13
Modèle linéaire
Sur n individus, on mesure les variables Xi et Yi ,
On suppose
pp
qqu’il existe une relation linéaire entre elles,, ie:
pour chaque i :
Yi = a Xi + b
Les paramètres (a,b) sont inconnus
La relation n’est pas forcément déterministe, ie: il existe la va
e telle
e e que : ei ~ N ((0,σ
,σ2 ) eet
Yi = a Xi + b + ei
Les paramètres (a,b,
(a b σ2) sont inconnus
U. Paris Ouest
L. Ferrara, 20122012-13
Exemple: Ramey and Ramey (AER)
Modèles de séries chronologiques
gq
Indice de la production industrielle en zone euro
130
120
110
100
90
80
70
60
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
0.015
0 010
0.010
0.005
0.000
-0.005
-0.010
-0.015
-0.020
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
U. Paris Ouest
L. Ferrara, 20122012-13
Modèles de séries chronologiques
gq
Les n individus i deviennent n dates t,
On mesure une variable Rt ppour t = 1,, …,, T
Pb:
b: Qu’en
Qu e est-il
es de l’hypothèse
ypo èse i.i.d.
. .d. ?
1/ Indépendance : Hypothèse pas raisonnable
2/ Identiquement distribué : Hypothèse nécessaire
U. Paris Ouest
L. Ferrara, 20122012-13
Modèles de séries chronologiques
gq
Les n individus i deviennent n dates t,
On suppose
pp
qqu’il existe une relation linéaire entre elles,, ie:
pour chaque i :
Yt = a Yt-1
t1 +b
Les paramètres (a,b) sont inconnus
La relation n’est pas forcément déterministe, ie: il existe la va
e telle
e e que : ei ~ N ((0,σ
,σ2 ) eet
Yt = a Yt-1
t 1 + b + ei
Les paramètres (a,b,
(a b σ2) sont inconnus
U. Paris Ouest
L. Ferrara, 20122012-13
Modèles de séries chronologiques
gq
déterministes
On suppose qu’il existe une relation non forcément linéaire
entre elles, ie:
pour chaque i :
Yt = f ( θ, Ytt-11 )
Les paramètres (θ ) sont inconnus
Exemples: Chaos logistique, Rossler, Henon
com nn = 10000
com aa = 3.75
com xx(1) = 0.8
do ii=2,nn
2,nn
com xx(i) = aa*xx(i-1)*(1-xx(i-1))
enddo i
U. Paris Ouest
L. Ferrara, 20122012-13
Modèles de séries chronologiques
gq
déterministes ((Rossler))
U. Paris Ouest
L. Ferrara, 20122012-13
Remarques
• Quel est le but du jjeu de toute tentative de modélisation
d’une variable Y ?
→ Minimiser la variance résiduelle
Y = partie déterministe + partie aléatoire
Y = f(X)
( )+ε
Par indépendance, V(Y) = V(f(X)) + V(ε)
U. Paris Ouest
L. Ferrara, 20122012-13
Conclusion
→Un
U modèle
dèl économétrique
é
ét i
permett de
d faire
f i un choix
h i
économique à partir d’un ensemble d’information
Algorithme de modélisation statistique:
• Définir
Défi i l’ensemble
l’
bl d’information
d’i f
i
• Spécifier le modèle statistique (= identifier Pθn )
• Construire une statistique pour le paramètre à estimer
• Etude de cette statistique (estimation et distribution)
• Validation / Contrôle
• Prise de décision / Prévision
U. Paris Ouest
L. Ferrara, 20122012-13
Conclusion
Outils:
O
til
• Eléments de la théorie des probabilités
• Construction
i d’échantillon
d h ill
• Choix de la classe de modèle paramétrique
• Méthodes de spécification du modèle
• Estimation des paramètres
• Tests d’hypothèses
U. Paris Ouest
L. Ferrara, 20122012-13

Documents pareils