Méthode des moindres carrés

Transcription

Méthode des moindres carrés
Méthode des moindres carrés
Situation
Le lancer de poids
Dix adolescents droitiers s’exercent à lancer le poids, du bras droit puis du bras gauche.
Les résultats (distances en mètres) obtenus sont les suivants :
Adolescent
1
2
3
4
5
6
7
8
9
10
Bras droit
5.5
7.1
5.8
6.4
6
6.2
7.2
5.6
6.8
5.6
Bras gauche
4.1
6.2
4
5.5
4.9
4.7
6
4.9
5
3.9
Un adolescent qui lance à 6,5 m du bras droit peut espérer lancer à combien de mètres avec le bras gauche ?
Un adolescent lance le poids à 4,2 m du bras gauche. Quelle sera sa performance avec le bras droit ?
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p1/16
Méthode
Ajustement linéaire par la méthode des moindres carrés
Soit une série statistique double représentée par un nuage de n points Mi (xi ; yi) et une droite D d’équation y = ax + b.
La méthode de Mayer nous a permis de trouver une équation de droite mais ne nous a pas permis de calculer les écarts des points à la droite
ainsi définie. Nous proposons une autre méthode qui va permettre de mesurer ses écarts.
L’ajustement de la droite D au nuage de points sera d’autant meilleur que les points Mi seront les plus rapprochés de la droite D.
Pour trouver l’équation de D on devra chercher la somme minimale des distances des points à la droite D
Comment mesurer cette distance ?
La solution qui au départ paraît la plus naturelle car c’est la « vraie distance » du
point à la droite n’est pas retenue par les statisticiens pour différentes raisons.
Cette méthode est géométriquement facile mais très compliquée à faire par le calcul.
D’autre part si les unités n’étaient pas les mêmes comme dans cet exemple, cela
n’aurait aucun sens.
Une deuxième solution aurait été d’additionner les deux distances (horizontale et verticale) du
point à la droite.
Pour les mêmes raisons d’unités, on ne peut pas utiliser cette méthode.
De plus ce qui nous intéresse est lié à un problème orienté. On cherche l’influence d’une variable
sur l’autre. Ces deux variables ne jouent pas un rôle symétrique.
Par exemple, pour un droitier connaissant ses performances du bras droit peut-on pronostiquer
ses performances du bras gauche ?
De même pour un gaucher peut-on pronostiquer ses performances du bras droit connaissant
celles du bras gauche ?
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p2/16
Finalement on est ramené à calculer les distances orientées, on compare la valeur calculée à la
valeur observée en calculant l’écart entre ces deux valeurs. Si le point est au dessus de la
droite l’écart aura une valeur négative, s’il est en dessous, l’écart aura une valeur positive.
Deux choix restaient encore possible : additionner les valeurs absolues ou les carrés de ces écarts .Là encore le 1er choix qui consisterait à
prendre les valeurs absolues et à les sommer, tout en étant licite, se révèle difficile à calculer.
Par contre le calcul des carrés conduira à un calcul algébrique utilisant uniquement l’algèbre du second degré qui se révèlera facile à mettre en
œuvre ( cf : calcul de l’écart type dans les statistiques à une variable)
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p3/16
La droite d’ajustement a pour équation générale y = ax + b.
Le point Mi a comme coordonnée xi et y i
Le point Pi est le point de la droite à l’abscisse xi. Son ordonnée est axi + b
yi
y − (ax + b)
Mi
i
i
La distance entre Mi et Pi est égale à
Quand le point Mi est au dessus de la droite l’expression yi –(axi + b) est
positive.
Quand le point Mi est en dessous de la droite l’expression yi –(axi + b) est
négative.
axi+b
Pi
Comme pour le calcul de l’écart type on fait la somme des carrés des
distances et il faut déterminer les coefficients a et b pour que cette somme soit
minimale.
1
On note cette somme
0
1
xi
CUEEP Département Mathématiques
∑ [y
i
− ( ax i + b)]²
C’est pour cela que cette méthode s’appelle « la méthode des moindres
carrés.
T902 : Méthode des moindres carrés
p4/16
Plan de travail
Animation
L’activité proposée est la suivante :
Un nuage de points est tracé à l’écran, vous devez actionner une droite par rotation et déplacement afin que cette droite passe au mieux parmi
le nuage. La somme des carrés des écarts des points à la droite s’affiche ainsi que la somme minimale.
Pour déplacer la droite vous avez le choix entre :
un déplacement manuel d’un point P de la droite à l’aide de la petite main ! et une rotation à l’aide du symbole !
une modification des coefficients a et b avec les touches + et - .
Animation
Utilisation du tableur
Calcul du carré des écarts
Dans le classeur1 les données du problème sont rentrées, en fixant une valeur de a pour le coefficient de la droite, et en faisant varier le
coefficient b le tableau fournit automatiquement la somme des carrés des écarts, le graphique de la somme en fonction de b s’affiche ainsi que
la formule associée.
Donner à a la valeur 1 et faites varier b de -2 à -0,5 avec un pas de 0,05.
Quelle est la nature de la courbe obtenue ? (droite, parabole, hyperbole, autre..)
ATTENTION : il faut que toute la colonne soit remplie pour que la courbe et l’équation s’affichent correctement.
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p5/16
La courbe est bien une parabole dont l’équation générale est y = ax ² + bx + c et dont le minimum correspond à l’abscisse du sommet de la
parabole x = −
b
2a
Attention ici y représente la somme S, x le coefficient b ce la droite, a b et c ne sont pas les constantes de l’équation de la droite mais les
constantes de l’équation de la parabole .Pour éviter toute ambiguïté, on pourrait les nommer A, B, C ou α , β, γ .
L’équation de la parabole devient S = Aa ² + Ba + C et l’abscisse du sommet est
b=−
B
2A
En déduire la valeur de b qui fournit la somme minimale.
Vérifier que la droite d’équation y = ax + b ainsi déterminée passe par le point G de coordonnées x et y .
( x : moyenne des xi et y : moyenne des y i )
Recommencer en donnant une autre valeur à a et en faisant varier b de telle façon que la courbe obtenue passe par un minimum.
Vérifier que cette nouvelle droite ainsi déterminée par ses coefficients a et b passe encore par le point G.
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p6/16
Changement de repère
Vous avez découvert que la meilleure droite passe par le point G de coordonnées x et y .
Reprendre l’animation précédente, faites apparaître le point G sur le graphique et faites coïncider le point P avec G.
Faites tourner la droite autour de ce point G pour obtenir la somme minimale et noter les valeurs de a et de b correspondantes.
Dans le classeur2, on a calculé les nouvelles coordonnées X i et Yi
des points quand on place l’origine du repère en G.
Dans ce nouveau repère l’équation de la droite d’ajustement est de la forme Y = aX . En faisant varier le coefficient a le tableau fournit
automatiquement la somme des carrés des écarts, le graphique de la somme en fonction de a s’affiche ainsi que la formule associée.
Comme précédemment trouver la valeur de a correspondant à la somme minimale.
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p7/16
Calcul de a et de b
Calcul algébrique des coefficients a et b de la droite d’ajustement y = ax + b .
En effectuant un changement de repère en G, on simplifie l’équation de la droite et on est ramené à déterminer le coefficient a de la meilleure
droite d’ajustement qui est de la forme Y = aX
1ère étape : se ramener au centre du nuage :
Y
X i = xi - x
Yi = y i - y
2
Yi
On obtient ainsi de nouvelles données.
Mi
2ème étape : chercher la pente de la droite Y = aX qui minimise la somme des
carrés des écarts entre les points Mi et Pi,
Ce qui revient à calculer la somme des valeurs (Yi − aX i )² que l’on note, :
∑ (Y
aXi
i
Pi
1G
Xi
CUEEP Département Mathématiques
− aX i )²
Cette somme est fonction de a. C’est une expression du second degré dont la
représentation graphique est une parabole et dont on peut déterminer l’abscisse
du sommet (qui correspond au minimum de la somme)
2
X
T902 : Méthode des moindres carrés
p8/16
Organisation des calculs
Compléter le tableau suivant :
Nouvelle
abscisse
Nouvelle
ordonnée
Ordonnée du point Pi
(en fonction de a)
Ecart entre les points
Mi et Pi (en fonction de a)
Carré de l’écart
(en fonction de a)
X i = xi − x
Yi = y i − y
aX i
Yi − aX i
(Yi − aX i )²
E =
CUEEP Département Mathématiques
∑ (Y
T902 : Méthode des moindres carrés
i
− aX i )²
p9/16
E est une expression du second degré en a
E (a ) = α a ² + β a + γ
E(a) sera minimum pour a = −
β
2α
On obtient ainsi la valeur de a et l’équation Y = aX
−
β
2α
Dans le repère initial l’équation de la droite est y = ax + b .
On vient de déterminer a et on sait que la droite passe par le point G de coordonnée x et y .
y = ax + b
d’où
b = y − ax
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p10/16
Corrigé
Le point G a comme coordonnée x = 6,22 et y = 4,92
Nouvelle
abscisse
Nouvelle
ordonnée
Ordonnée du point Pi
(en fonction de a)
Ecart entre les points
Mi et Pi (en fonction de a)
Carré de l’écart
(en fonction de a)
X i = xi − x
Yi = y i − y
aX i
Yi − aX i
(Yi − aX i )²
-0,72
0,88
-0,42
0,18
-0,22
-0,02
0,98
-0,62
0,58
-0,62
-0,82
1,28
-0,92
0,58
-0,02
-0,22
1,08
-0,02
0,08
-1,02
-0.72a
0.88a
-0.42a
0.18a
-0.22a
-0.02a
0.98a
-0.62a
0.58a
-0.62a
-0.82+0.72a
1.28-0.88a
-0.92+0.42a
0.58-0.18a
-0.02+0.22a
-0.22+0.02a
1.08-0.98a
-0.02+0.62a
0.08-0.58a
-1.02+0.62a
0.6724 - 1.1808a + 0.5184a²
1.6384 - 2.2528a + 0.7744a²
0.8464 - 0.7728a +0.1764a²
0.3364 - 0.2088a +0.0324a²
0.0004 - 0.0088a + 0.0484a²
0.0484 - 0.0088a + 0.0004a²
1.1664 - 2.1168a + 0.9604a²
0.0004 - 0.0248a + 0.3844a²
0.0064 - 0.0928a + 0.3364a²
1.0404 -1.2648a + 0.3844a²
∑ (Y
− aX )²
i
i
E =
=
5.756 - 7.932 a + 3.616 a²
E = 3,616a ² − 7,932a + 5,756
α = 3,616
(−7,932) 7,932
a=−
=
≈ 1,097
β = −7,932
2 × 3,616 7,232
L’équation de la droite d’ajustement est :
CUEEP Département Mathématiques
b = 4,92 – 1,097 x 6.22 ≈ -1,90
y = 1,097 x − 1,90
T902 : Méthode des moindres carrés
p11/16
Un adolescent qui lance à 6,5 m du bras droit peut espérer lancer à combien de mètres avec le bras gauche ?
En remplaçant x (lancer du bras droit) par 6,5 dans l’équation de la droite d’ajustement on trouve y (lancer du bras gauche)
y = 1,097 x 6,5 – 1,90 = 5,23
Un adolescent lance le poids à 4,2 m du bras gauche. Quelle sera sa performance avec le bras droit ?
En remplaçant y (lancer du bras gauche) par 6,5 dans l’équation de la droite d’ajustement on trouve x (lancer du bras droit)
x=
4,2 + 1,90
= 5,56
1,097
Les résultats ne sont pas très différents de ceux trouvés avec la méthode de Mayer.
Dans cette situation, on n’a pas besoin d’une grande précision, la méthode intuitive aurait même suffi (voir approche graphique).
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p12/16
Formules
Dans les manuels scolaires on trouve les formules suivantes qui permettent de déterminer a et b, ce sont ces formules qui sont utilisées dans
les calculatrices et dans les tableurs pour le calcul de ces deux coefficients.
a=
∑ ( x − x )( y − y )
∑ (x − x)
i
b = y − ax
i
2
i
Après avoir déterminé x (moyenne des xi) et y (moyenne des yi) les calculs s’organisent ainsi dans un tableau que l’on peut réaliser
facilement sur un tableur.
xi
∑ (x
yi
i
(xi – x )
(yi – y )
(xi – x )(yi – y )
(xi – x )²
(yi – y )²
− x )( y i − y )
est la somme des termes de la colonne ( xi − x)( y i − y )
∑ (x
i
− x )²
est la somme des termes de la colonne ( xi − x)²
Voir covariance
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p13/16
Calculatrice
Vous pouvez déterminer la droite d’ajustement avec une calculatrice
Consulter la notice de votre calculatrice pour vous aider à rentrer vos données et à déterminer les coefficients a et b (si celle-ci le permet)
Tableur
Comment déterminer la droite d’ajustement avec le tableur
Excel ?
Remplir le tableau de données et le sélectionner.
Appeler l’assistant graphique
Sélectionner dans les types standard « Nuage de points «
Sous type points non reliés entre eux.
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p14/16
Avec le bouton droit de la souris cliquer sur un des points, tous les points doivent apparaître en surbrillance et dans la fenêtre qui s’ouvre
cliquer sur « ajouter une courbe de tendance »
La nouvelle fenêtre « insertion d’une courbe de tendance »
propose plusieurs types d’ajustement. Choisir le linéaire,
cliquer sur l’onglet option et cocher « afficher l’équation sur le
graphique »
Sur le graphique la droite sera tracée et son équation sera
affichée.
y = 1,0968x - 1,902
6,5
6
5,5
5
4,5
4
3,5
3
5
CUEEP Département Mathématiques
5,5
T902 : Méthode des moindres carrés
6
6,5
7
7,5
p15/16
Exercice d’application
Maintenant ce sont dix adolescents gauchers qui s’exercent à lancer le poids, du bras gauche puis du bras droit.
Les résultats (distances en mètres) obtenus sont les suivants :
Adolescent
1
2
3
4
5
6
7
8
9
10
Bras gauche
5,1
6,2
6,8
5,5
6,6
5,8
7,2
5,5
5,7
6,7
Bras droit
4,5
5,5
5,2
4,3
5,1
4,6
6
4,5
4,5
5,8
Déterminer la droite d’ajustement du lancer du bras droit en fonction du lancer du bras gauche.
Que se passe t-il si on mélange les deux populations droitiers et gauchers ?
Contacter votre enseignant pour la correction
CUEEP Département Mathématiques
T902 : Méthode des moindres carrés
p16/16