Cours : droite de régression par la méthode des moindres carrés

Transcription

Cours : droite de régression par la méthode des moindres carrés
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Cours : droite de régression par la méthode des moindres carrés
Hervé Gurgey
5 octobre 2007
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 1
On considère une série statistique double définie par la donnée de p valeurs
xi et de p valeurs yi .
On considère un repère R du plan .
On appelle nuage de points de la série statistique l’ensemble des points
Mi de coordonnées (xi , yi ) .
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 2
On considère une série statistique double définie par la donnée de p valeurs
xi et de p valeurs yi .
On considère un repère R du plan .
On appelle nuage de points de la série statistique l’ensemble des points
Mi de coordonnées (xi , yi ) .
y
M6
M5
M4
M2
M1 M3
x
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
y
M6
M5
M4
M2
G
M1 M3
x
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
y
M6
M5
M4
M2
G
M1 M3
x
Définition 4
On note x la moyenne de la série statistique
des valeurs xi . On note y la moyenne de
la série statistique des valeurs yi . Le point
G (x; y ) est appelé point moyen du nuage
de points
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
y
P6 (D)
M5 M6
M4 P 5
G
MP
23
P4
M1 P
2
M3
P1
x
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 6
y
P6
M5 M6
M4 P 5
G
MP
23
P4
M1 P
2
M3
P1
On appelle droite de régression de y en x par
la méthode des moindres carrés toute droite
d’équation y = ax + b qui rend minimale la
(D)
somme suivante :
i=n
X
Mi Pi2
i=1
c’est à dire ;
x
i=p
X
i=1
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
(yi − (axi + b))2
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 1
Il existe une et une seule droite de régression de y en x par la méthode des
moindres carrés ( ADMISE) )
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 3
Il existe une et une seule droite de régression de y en x par la méthode des
moindres carrés ( ADMISE) )
Propriété 4
Le point moyen est un point de la droite de régression ( ADMISE) )
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Mesure de la q
Propriété 5
Il existe une et une seule droite de régression de y en x par la méthode des
moindres carrés ( ADMISE) )
Propriété 6
Le point moyen est un point de la droite de régression ( ADMISE) )
Remarque 3
Les calculatrices et les tableurs possédent des programmes intégrés donnant
l’équation de la droite de régression.
C’est d’ailleurs le plus souvent avec ces outils que l’on déterminera les équation
de droite de régression
(voir travaux dirigés)
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 7
La droite de regression de y en x a pour équation y = a × x + b où :
cov (x, y )
a=
[σx ]2
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 8
La droite de regression de y en x a pour équation y = a × x + b où :
cov (x, y )
a=
[σx ]2
avec :
i=p
1X
(xi − x) (yi − y )
cov (x, y ) =
n i=1
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 9
La droite de regression de y en x a pour équation y = a × x + b où :
cov (x, y )
a=
[σx ]2
avec :
i=p
1X
(xi − x) (yi − y )
cov (x, y ) =
n i=1
Remarque 8
Le nombre cov (x, y ) est appelé covariance de x , y
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 10
La droite de regression de y en x a pour équation y = a × x + b où :
cov (x, y )
a=
[σx ]2
avec :
i=p
1X
(xi − x) (yi − y )
cov (x, y ) =
n i=1
Remarque 10
Le nombre cov (x, y ) est appelé covariance de x , y
Remarque 11
Pour déterminer b il suffit d’utiliser le fait que la droite de régression passe par
le point moyen
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Propriété 11
La droite de regression de y en x a pour équation y = a × x + b où :
cov (x, y )
a=
[σx ]2
avec :
i=p
1X
(xi − x) (yi − y )
cov (x, y ) =
n i=1
Remarque 12
Le nombre cov (x, y ) est appelé covariance de x , y
Remarque 13
Pour déterminer b il suffit d’utiliser le fait que la droite de régression passe par
le point moyen
Exemple 5
Voir exercices
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
y
Q6
M4
(D)
M5 M6
Q5
M2 QG4
QM
3 1 Q2
M3
Q1
x
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 8
y
M4
M2
QM
3 1 Q2
M3
Q1
M5 M6
Q5
On appelle droite de régression de x en y par
la méthode des moindres carrés toute droite
d’équation x = a0 y + b 0 qui rend minimale la
Q6
(D)
somme suivante :
i=n
X
QG4
Mi Qi2
i=1
c’est à dire ;
x
i=p
X
xi − a0 yi + b 0
2
i=1
Remarque 15
Pour établir les calculs il suffit d’échanger le rôle de x et y dans les formules
ci-dessus
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 9
On appelle coefficient de corrélation de la série statistique double le nombre
défini par :
cov (x, y )
r=
σx × σy
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 10
On appelle coefficient de corrélation de la série statistique double le nombre
défini par :
cov (x, y )
r=
σx × σy
Remarque 17
On a : a × a0 =
cov (x, y )
cov (y , x)
×
σy 2
σx2
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 11
On appelle coefficient de corrélation de la série statistique double le nombre
défini par :
cov (x, y )
r=
σx × σy
Remarque 18
On a : a × a0 =
cov (x, y )
cov (y , x)
cov (x, y )2
×
Donc : a × a0 =
= r2
2
σy 2
σx
σx2 × σy2
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 12
On appelle coefficient de corrélation de la série statistique double le nombre
défini par :
cov (x, y )
r=
σx × σy
Remarque 19
On a : a × a0 =
cov (x, y )
cov (y , x)
cov (x, y )2
×
Donc : a × a0 =
= r2
2
σy 2
σx
σx2 × σy2
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Définition 13
On appelle coefficient de corrélation de la série statistique double le nombre
défini par :
cov (x, y )
r=
σx × σy
Remarque 20
On a : a × a0 =
cov (x, y )
cov (y , x)
cov (x, y )2
×
Donc : a × a0 =
= r2
2
σy 2
σx
σx2 × σy2
Propriété 16
−1 6 r 6 1 ADMISE
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
I
si r 2 = 1 alors a × a0 = 1.
Les droites D et D’ sont alors confondues ; on dit que l’ajustement affine
est parfait.
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
I
si r 2 = 1 alors a × a0 = 1.
Les droites D et D’ sont alors confondues ; on dit que l’ajustement affine
est parfait.
I
si 0.7 < |x| < 1
alors les deux droites D et D’ sont proches l’une de l’autre (en fait l’angle
entre les deux est inférieur à 45˚) ; on dit que l’ajustement affine est
justifié.
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
I
si r 2 = 1 alors a × a0 = 1.
Les droites D et D’ sont alors confondues ; on dit que l’ajustement affine
est parfait.
I
si 0.7 < |x| < 1
alors les deux droites D et D’ sont proches l’une de l’autre (en fait l’angle
entre les deux est inférieur à 45˚) ; on dit que l’ajustement affine est
justifié.
I
si |r | < 0, 7 alors l’angle entre les deux droites est supérieur à 45˚.
L’ajustement affine ne se justifie pas.
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
I
si r 2 = 1 alors a × a0 = 1.
Les droites D et D’ sont alors confondues ; on dit que l’ajustement affine
est parfait.
I
si 0.7 < |x| < 1
alors les deux droites D et D’ sont proches l’une de l’autre (en fait l’angle
entre les deux est inférieur à 45˚) ; on dit que l’ajustement affine est
justifié.
I
si |r | < 0, 7 alors l’angle entre les deux droites est supérieur à 45˚.
L’ajustement affine ne se justifie pas.
I
Pour davantage d’informations voir livre page 163
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q
Nuage de points Point moyen d’un nuage d’un point Droite de régression de y en x Les formules de calcul La droite de régression de x en y
Hervé Gurgey
Cours : droite de régression par la méthode des moindres carrés
Mesure de la q