Le modèle de régression multiple
Transcription
Le modèle de régression multiple
Économétrie Francesco Quatraro M1 EFM – 2010/2011 Économétrie Francesco Quatraro – 2010/2011 1 Le modèle de régression multiple • Nous avons considéré le cas où une variable endogène est expliquée par une seule variable exogène • C’est extrêmement rare qu’un phénomène économique puisse être expliqué par une seule variable • Le modèle linéaire général est une généralisation du modèle de régression dans lequel figurent plusieurs variables explicatives Économétrie Francesco Quatraro – 2010/2011 2 Le modèle de régression multiple • yt=a0+a1x1t+a2x2t+…+akxkt + – – – – – – – – t Pour t=1,…n yt= variable à expliquer x1t= Variable explicative 1 x2t= variable explicative 2 xkt= variable explicative k a0 a1a2ak= paramètres du modèle t = erreur de spécification n = nombre d’observations Économétrie Francesco Quatraro – 2010/2011 3 Le modèle de régression multiple • Afin d’alléger l’écriture et de faciliter l’expression de certains résultats, on a habituellement recours aux notation matricielles • En écrivant le modèle observation par observation, nous obtenons: y1=a0+a1x11+a2x21+…+akxk1 + y2=a0+a1x12+a2x22+…+akxk2 + … yn=a0+a1x1n+a2x2n+…+akxkn + Économétrie Francesco Quatraro – 2010/2011 1 2 n 4 Le modèle de régression multiple • Sous forme matricielle: Y=Xa+ • Nous remarquons que la première colonne de la matrice X, composée de 1, qui correspond au coefficient a0 • La dimension de la matrice est donc de n lignes et k + 1 colonnes (k étant le nombre de variables explicatives réelles) Économétrie Francesco Quatraro – 2010/2011 5 Le modèle de régression multiple • Soit le modèle sous forme matricielle à k variables explicatives et n observations: – Y=Xa+ • Afin d’estimer le vecteur a composé des coefficients a1, a2, …, ak, nous appliquons le méthode des Moindres Carrés Ordinaires (MCO) qui consiste à minimiser la somme des carrés des erreurs: • Avec ’ transposé du vecteur Économétrie Francesco Quatraro – 2010/2011 6 Le modèle de régression multiple • Pour minimiser la fonction il faut différencier S par rapport à a: • Cette solution est réalisable si la matrice carrée X’X est inversible. La matrice X’X est la matrice des produits croisés des variables explicatives • En cas de colinéarité parfaite entre deux variables explicatives, la matrice X’X est singulière et la méthode des MCO défaillante Économétrie Francesco Quatraro – 2010/2011 7 Le modèle de régression multiple • On appelle équations normales les équations issues de la relation: • Le modèle estimé s’écrit: – Où • Si nous raisonnons sur des données centrées, l’estimateur de a peut s’écrire en fonction des matrices des variances et covariances empiriques Économétrie Francesco Quatraro – 2010/2011 8 Le modèle de régression multiple • Soit le modèle: • Si la variable x2 passe de la valeur x2 à (x2+ x2), toutes choses étant égales par ailleurs, alors la variable à expliquer varie: • Les coefficients s’interprètent donc directement en terme de propension marginale. Économétrie Francesco Quatraro – 2010/2011 9 Le modèle de régression multiple • Par construction, le modèle est linéaire en X, et nous distinguons les hypothèses stochastiques (liées à l’erreur) des hypothèses structurelles: • H1: les valeurs xi,t sont observés sans erreur • H2: E( )=0, l’espérance mathématique de l’erreur est nulle • H3: E( ²)= ², la variance de l’erreur est constante (homoscédasticité) • H4: E( t t+1), les erreurs sont non corrélées (ou indépendants) • H5: Cov(xi,t t), l’erreur est indépendante de la variable explicative Économétrie Francesco Quatraro – 2010/2011 10 Le modèle de régression multiple • Hypothèses structurelles • H6: absence de colinéarité entre les variables explicatives, cela implique que la matrice (X’X) est régulière et que la matrice inverse (X’X)-1 existe. • H7: (X’X)/n tend vers une matrice finie non singulière. • H8: n>k+1 le nombre d’observations est supérieur au nombre de séries explicatives Économétrie Francesco Quatraro – 2010/2011 11 Le modèle de régression multiple • • • • Propriétés des estimateurs: L’estimateur est sans biais: L’estimateur est convergent: L’estimateur est qualifié de BLUE (best linear unbiased estimator), car il s’agit du meilleur estimateur linéaire sans biais Économétrie Francesco Quatraro – 2010/2011 12 Le modèle de régression multiple • Comme pour le modèle de régression simple nous avons: • De ces deux relations, nous en déduisons l’équation fondamentale de l’analyse de la variance: Économétrie Francesco Quatraro – 2010/2011 13 Le modèle de régression multiple • Cette équations va nous permettre de juger de la qualité de l’ajustement d’un modèle • Plus la variance expliquée est proche de la variable totale, meilleur est l’ajustement global du modèle • R² est appelé le coefficient de détermination, et R le coefficient de corrélation multiple • R² mesure la proportion de la variance de Y expliquée par la régression de Y sur X Économétrie Francesco Quatraro – 2010/2011 14 Le modèle de régression multiple • Dans le cas de données centrées (moyenne nulle) le coefficient de détermination est égale à: • Lorsque le degré de liberté est faible, il faut corriger le R² afin de tenir compte du relativement faible nombre d’observations comparé au nombre de facteurs explicatives: Économétrie Francesco Quatraro – 2010/2011 15 Le modèle de régression multiple • Suit une loi du ² à n-k-1 degrés de liberté • Il en résulte que l’écart type empirique suit un loi de Student à n-k-1 degrés de liberté: Économétrie Francesco Quatraro – 2010/2011 16 Le modèle de régression multiple • Comme pour le modèle de régression simple, nous pouvons mettre en place un certain nombre de tests statistiques: • Comparaison d’un paramètre à une valeur fixée: – Test d’hypothèse • Nous savons que: • Si alors nous rejetons l’hyp. H0. Économétrie Francesco Quatraro – 2010/2011 17 Le modèle de régression multiple • Une variable indicatrice est une variable explicative particulière qui n’est composée que de 0 ou que de 1. • Cette variable est utilisée lorsque nous désirons intégrer un facteur explicatif binaire ou bien lorsque le facteur explicatif est qualitatif • Le modèle de régressions diffère selon l’apparition du phénomène seulement par la valeur d’un seul coefficient alors que les autres paramètres sont identiques Économétrie Francesco Quatraro – 2010/2011 18 Le modèle de régression multiple • Le phénomène existe: • Le phénomène n’existe pas: • Ces deux équations peuvent se ramener à une équation unique: • D= 1: le phénomène n’existe pas Économétrie Francesco Quatraro – 2010/2011 19