Le modèle de régression multiple

Transcription

Le modèle de régression multiple
Économétrie
Francesco Quatraro
M1 EFM – 2010/2011
Économétrie
Francesco Quatraro – 2010/2011
1
Le modèle de régression multiple
• Nous avons considéré le cas où une variable
endogène est expliquée par une seule variable
exogène
• C’est extrêmement rare qu’un phénomène
économique puisse être expliqué par une seule
variable
• Le modèle linéaire général est une généralisation
du modèle de régression dans lequel figurent
plusieurs variables explicatives
Économétrie
Francesco Quatraro – 2010/2011
2
Le modèle de régression multiple
•
yt=a0+a1x1t+a2x2t+…+akxkt +
–
–
–
–
–
–
–
–
t
Pour t=1,…n
yt= variable à expliquer
x1t= Variable explicative 1
x2t= variable explicative 2
xkt= variable explicative k
a0 a1a2ak= paramètres du modèle
t = erreur de spécification
n = nombre d’observations
Économétrie
Francesco Quatraro – 2010/2011
3
Le modèle de régression multiple
• Afin d’alléger l’écriture et de faciliter l’expression
de certains résultats, on a habituellement recours
aux notation matricielles
• En écrivant le modèle observation par
observation, nous obtenons:
y1=a0+a1x11+a2x21+…+akxk1 +
y2=a0+a1x12+a2x22+…+akxk2 +
…
yn=a0+a1x1n+a2x2n+…+akxkn +
Économétrie
Francesco Quatraro – 2010/2011
1
2
n
4
Le modèle de régression multiple
• Sous forme matricielle:
Y=Xa+
• Nous remarquons que la première colonne de la matrice X,
composée de 1, qui correspond au coefficient a0
• La dimension de la matrice est donc de n lignes et k + 1
colonnes (k étant le nombre de variables explicatives réelles)
Économétrie
Francesco Quatraro – 2010/2011
5
Le modèle de régression multiple
• Soit le modèle sous forme matricielle à k variables
explicatives et n observations:
– Y=Xa+
• Afin d’estimer le vecteur a composé des coefficients
a1, a2, …, ak, nous appliquons le méthode des
Moindres Carrés Ordinaires (MCO) qui consiste à
minimiser la somme des carrés des erreurs:
• Avec ’ transposé du vecteur
Économétrie
Francesco Quatraro – 2010/2011
6
Le modèle de régression multiple
• Pour minimiser la fonction il faut différencier S par
rapport à a:
• Cette solution est réalisable si la matrice carrée X’X
est inversible. La matrice X’X est la matrice des
produits croisés des variables explicatives
• En cas de colinéarité parfaite entre deux variables
explicatives, la matrice X’X est singulière et la
méthode des MCO défaillante
Économétrie
Francesco Quatraro – 2010/2011
7
Le modèle de régression multiple
• On appelle équations normales les équations
issues de la relation:
• Le modèle estimé s’écrit:
– Où
• Si nous raisonnons sur des données centrées,
l’estimateur de a peut s’écrire en fonction des
matrices des variances et covariances empiriques
Économétrie
Francesco Quatraro – 2010/2011
8
Le modèle de régression multiple
• Soit le modèle:
• Si la variable x2 passe de la valeur x2 à (x2+ x2),
toutes choses étant égales par ailleurs, alors la
variable à expliquer varie:
• Les coefficients s’interprètent donc directement
en terme de propension marginale.
Économétrie
Francesco Quatraro – 2010/2011
9
Le modèle de régression multiple
• Par construction, le modèle est linéaire en X, et nous
distinguons les hypothèses stochastiques (liées à l’erreur)
des hypothèses structurelles:
• H1: les valeurs xi,t sont observés sans erreur
• H2: E( )=0, l’espérance mathématique de l’erreur est
nulle
• H3: E( ²)= ², la variance de l’erreur est constante
(homoscédasticité)
• H4: E( t t+1), les erreurs sont non corrélées (ou
indépendants)
• H5: Cov(xi,t t), l’erreur est indépendante de la variable
explicative
Économétrie
Francesco Quatraro – 2010/2011
10
Le modèle de régression multiple
• Hypothèses structurelles
• H6: absence de colinéarité entre les variables
explicatives, cela implique que la matrice (X’X)
est régulière et que la matrice inverse (X’X)-1
existe.
• H7: (X’X)/n tend vers une matrice finie non
singulière.
• H8: n>k+1 le nombre d’observations est
supérieur au nombre de séries explicatives
Économétrie
Francesco Quatraro – 2010/2011
11
Le modèle de régression multiple
•
•
•
•
Propriétés des estimateurs:
L’estimateur est sans biais:
L’estimateur est convergent:
L’estimateur est qualifié de BLUE (best linear
unbiased estimator), car il s’agit du meilleur
estimateur linéaire sans biais
Économétrie
Francesco Quatraro – 2010/2011
12
Le modèle de régression multiple
• Comme pour le modèle de régression simple
nous avons:
• De ces deux relations, nous en déduisons
l’équation fondamentale de l’analyse de la
variance:
Économétrie
Francesco Quatraro – 2010/2011
13
Le modèle de régression multiple
• Cette équations va nous permettre de juger de la
qualité de l’ajustement d’un modèle
• Plus la variance expliquée est proche de la variable
totale, meilleur est l’ajustement global du modèle
• R² est appelé le coefficient de détermination, et R le
coefficient de corrélation multiple
• R² mesure la proportion de la variance de Y
expliquée par la régression de Y sur X
Économétrie
Francesco Quatraro – 2010/2011
14
Le modèle de régression multiple
• Dans le cas de données centrées (moyenne
nulle) le coefficient de détermination est égale à:
• Lorsque le degré de liberté est faible, il faut
corriger le R² afin de tenir compte du
relativement faible nombre d’observations
comparé au nombre de facteurs explicatives:
Économétrie
Francesco Quatraro – 2010/2011
15
Le modèle de régression multiple
• Suit une loi du ² à n-k-1 degrés de liberté
• Il en résulte que l’écart type empirique suit un loi
de Student à n-k-1 degrés de liberté:
Économétrie
Francesco Quatraro – 2010/2011
16
Le modèle de régression multiple
• Comme pour le modèle de régression simple,
nous pouvons mettre en place un certain
nombre de tests statistiques:
• Comparaison d’un paramètre à une valeur fixée:
– Test d’hypothèse
• Nous savons que:
• Si
alors nous rejetons l’hyp. H0.
Économétrie
Francesco Quatraro – 2010/2011
17
Le modèle de régression multiple
• Une variable indicatrice est une variable explicative
particulière qui n’est composée que de 0 ou que de
1.
• Cette variable est utilisée lorsque nous désirons
intégrer un facteur explicatif binaire ou bien lorsque
le facteur explicatif est qualitatif
• Le modèle de régressions diffère selon l’apparition
du phénomène seulement par la valeur d’un seul
coefficient alors que les autres paramètres sont
identiques
Économétrie
Francesco Quatraro – 2010/2011
18
Le modèle de régression multiple
• Le phénomène existe:
• Le phénomène n’existe pas:
• Ces deux équations peuvent se ramener à une
équation unique:
• D= 1: le phénomène n’existe pas
Économétrie
Francesco Quatraro – 2010/2011
19