L`ajustement linéaire et la corrélation

Transcription

L`ajustement linéaire et la corrélation
précédents
Leschapilres
ontmontré
comment
étudier
unesériestatistique,
maisdeuxséries
oudeuxcaractèresenregistrés
à I'intérieur
d'unemême
sériepeuvent
êtrereliés
entre
eux.Onexaminera
lesplussimples
de
cesrelations
: lesrelations
linéaires.
Figure
3
1.Données,
nuages
depoints
Onnole'.lxùi, Vz,yz),
...,(xr,r,yr,r)
lasérie
desobservations
quantitatifs
relevanl
deuxcaractères
x et y pour
lesN individus
population.
Exemples
d'une
: lataille
etle
Figure
4
poids
le PNBparhabitant
d'ungroupe
d'étudiants,
et le
pays
tauxd'alphabétisation
de
envoiededéveloppement,
lerevenu
etlaconsommation
ménages,
dedifférents
etc.
Desunités
étantconvenablement
choisies
surchacun
O
X
desaxes,
onpeutreprésenter
I'individu
I delapopulation
précédente
parle point: (x,,y,lduplanx x y. Figurant Lespoints
1 sontpresque
dunuage
alignés,
tandis
ainsilesN individus,
lenuage
onobtienl
depolnts
2 laisse
asso- quelenuage
simplement
apparaître
unedirection
privilégiée.
ciéà lasérie
statistioue.
Danscesdeuxcas,onditque
d'allongement
présente
le nuage
linéaire.
Lenuage
uncaractère
3 ne
Lesnuages
depoints
associés
à desséries
statistiques
pasdestructure
particulière;
manileste
lenuage
4,enfin,
peuvent
présenter
à deux
formes
:
caractères
diftérenles
semble
seplacer
approximalivement
selonunecourbe
régulière.
L'ajustement
linéaire
résuestlarecherche
deladroite
mantlemieux
lastructure
dunuage.
Unetellerecherche
Figure1
quepourdesnuages
n'adoncd'intérêt
del'undesdeux
premiers
types.
2.Ajustement
linéaire
Figure2
graphique
a) Ajustement
présente
Lorsque
le nuage
linéaire,
uncaractère
on
. à mainlevée
" ladroite
peuttenter
quirésume
detracer
lemieux
lastructure
Lasubjectivité
dunuage.
duprocédé
estévidente.
iiiif.f:Ëlii'i
LINÉAIRE.
AJUSTEMENT
CORRÉLATION
iirf'fftrjÏAJUSTEM
i::i:iIi+]Itïii::.
liriiiiiiiiiiiREPERES
queladroite
pasæparle
relation
Cette
dernière
signifie
b) tlléthodedesmoindrescanés
point
moyen
t(7,y\, cequipermet
decalculer
ô après
a.
Droltede Égressionde Yen X
Pratiquement,
calcul
ces
calculs
s'apparentent
au
queI'undescaractères,
le plusæuvent
Onconsidère
Siondoitutiliser
unecalculaliæ,
onpeut
(parexemple,
la d'unevariance.
ouI'une
desvariables,
dépend
deI'autre
les
moyennes
1
x el y,
calculer
successivement
etl
de
consommation
dépend
durevenu)
; soitY le premier les
à la moyenne,
la sériedesprodeuxséries
d'écarts
caractère,
ou variable
à expliquer,
ou
et X le second,
: (4 -tl .Ut - 7); cette
: (xi- f )z; et,
descanés
variable
explicallve.
Oncherche
uneexpression
deY en duits
la
leur
rapporl.
enfin,
æmme
de
ces
séries
et
" le
lonctionde
X,delaforme
l= â. x+ ô,quiapproche
lenumérateur
" lesdonnées.
danslecasdelavarianæ,
etle
Comme
mieux
ducoefficient
a s'expriment
sousuneautre
D'unpointdevuegéométrique,
celarevient
à chercher dénominateur
quipeutsimplilier
lecalcul
à lamain:
la droite
i f = a . x + b,quitraduit
le mieux forme
d'équation
points.
I'aspect
linéaire
dunuage
de
lxi.fi-N.I.Y
a=
o Critère
desmoindres
:
canés
retenue
lesdéfiSoit: y= a. x + b,ladroite
; ondonne
(fig.5):
nitions
o x;êstlâ valeur
X
observée
delavariable
explicative
pourl'individu
i;
. yrestla valeur
Y
observée
delavariable
à expliquer
pourl'individu
I;
. l'; = a. x;+ b estla valeur
héoiqtnouajustée
& la
y associée
variable
x,delavariable
X;
à lavaleur
obærvée
o €;= yt- y'ieg,l'effeur
l'écart
d'ajustenent,
c'est-à-dire
lavaleur
entre
obærvée
ellavaleur
théorique
ælculée
deY.
pr,'- ru. r'
L'emploi
decetteexpression
dispense
ducalcul
des
écarts
auxmoyennes.
quesoitI'expression
dea utilisée,
Quelle
cesælculs
quepeuinstructifs.
llssefonten
sontaussifastidieux
quand
revanche
ilsne
trèssimplemenl
suruntableur,
sontpasdéjàprogrammés,
comme
surlescalculatriæs
statistiques
ou mathématiques;
danscecas,il suflit
lesséries
d'entrer
d'observations
dex et y puisd'utiliær
pourlancer
lacommande
lecalcul.
appropriée
c) Droitede régressionde X en Y
Ona notéquelarégression
dey enx donne
desrôles
différents
auxdeuxvariables.
Onpeutrenverær
cesrôles
la variable
et régresser
X enY.Oncherche
uneexpression: x = c. | + d deX enfonction
deY optimale
au
sens
desmoindres
carrés.
précédentes,
Lasimple
transposition
desformules
lesvaleurs
donnant
dea etD,donne
c etd :
I ( x r- r ) . ( y ; - y )
LU; - yl
et 1=c.y+d.
" droite
quirend
La" meilleure
relenue
(deYenXetdeXenY)
estenfaitcelle
Lesdeuxdroites
derégression
minimale
lasomme
descanés
deserreurs
représentées
d'aiustement.
dansle mêmerepère
x x y ne sont
quesilespoints
Onl'appelle
drcitedesmoindres
canésdey enx, ou confondues
dunuage
sonlexactement
droitederégression
dey enx.
alignés.
plusquele nuage
Elles
d'autant
diffèrent
s'éloigne
de
o Calculs
:
I'alignement.
Lescoefficients
a etô deladroile
desmoindres
canés
deY enX s'expriment
enfonction
desobservalions
:
(xi,h.
quea etô sontdonnés
par:
Onmonlre
a=
I(r,-tl.(r,-V)
>{''- t)'
et l=a.1+ b.
3.Corrélation
a) CoefficientR'
quela sériedesvaleurs
yi, dans
Onmontre
aiustées
la régression
y surx, a lamême
delavariable
moyenne
initiale
des)1.
tquelasérie
i:1:triiiii:iii:ir
'lii:iii:..\lt:i;:i;il.:i::
r:::::l{::::jI:::r::jit:::
'j:r:.tt:.t:.tij:.t4 jl
ilir'iiiii:iliiiiiii:
rÉLAroN
i#f4l
CORRÉLATION
LINÉAIRE,
AJUSTEMENT
REPÈREI
îf$ïï#ïifi
', en
" coefficient
deconélation
appelé
R estsouvent
qualificatif
".
"
linéaire
le
omettant
notéR2:
Ondéfinitlecoefficient
^_ ,2= _> ( y ' , - h '
Z-
>Ut- Y)
" parla
expliquée
Cerapport
entrela " variation
" mesure
laqualité
dela
totale
régression
etia. variation
lesy;
lesy'rapprochent
: sicelle-ci
estbonne,
régression
de1.
el R2estproche
c) Autes formules
sanspasser
R peutêtrecalculé
la variance,
Comme
parlesécarts
:
à I'aide
delaformule
auxmoyennes,
2x,.fi-N.r.t
R =
linéaireR
de corrélation
b) Coelîicient
desdeux
liantRauxpentes
larelation
Ona également
(de
Y
XetdeXsurY):
régression
sur
de
droites
plusfréquemment
le coelficient
de
Enfait,oncalcule
linéaire,
nolêR (onmontre
eneffetqu'ilest
corrélation
H-=â.C.
Rz
près,à la racine
delaquantité
canée
égal,ausigne
précédente)
:
R =
l. Élargissements
èles exponentlels
4 ûnod
quelesvariables
X et Y
onvoilsurcelteexpression
pourêtresimples
à
linéaire,
Lesrelations
denature
jouent
symétriques.
desrôles
quipuissent
exister
entre
nesontpaslesseules
étudier,
la qualité
de deuxgrandeurs.
nonseulement
Lecoefficient
R mesure
peuvent
cependant
s'yramener.
D'autres
le
mais,plusgénéralement,
régression,
I'uneouI'autre
par
Y =A . Bx,
delaforme
etXæntliés unerelation
l'inlen- SiYque
ouencore
linéaire
depoints,
caractère
dunuage
X.Cetterelade
Y
exponentiellement
dit
dépend
on
(en
linéaire
entrelesdeuxvariables
sitédela liaison
leslogarithmes,
mais,
enprenant
" expli' tionn'estpaslinéaire,
particulier
devoir
lorsqu'aucune
desdeuxneparaît
0
n
a
:
querDl'autre,
machines
à
en
ainsidulauxd'équipement
In(Y)=ln(B).X+ln(A),
enréfrigérateurs).
laver
etdutauxd'équipement
parlespropriétés
:
suivantes
estprécisé
Sonemploi
linéaire
lavariable
transforentre
c'est-à-dire
unerelation
- 1et+ 1;
. Resttoujours
entre
compris
= a . X + B,en
: In(Y)
X,quis'écrit
encore
mée,In(Y),
et
lespoints notant= In(B)
l) lorsque
o R vaut+ 1 (respectivement
etF = In(A).
d
une
ascendante,
traduisant
sontalignés
surunedroite
parrégresrelation
s'effectue
Uétude
de
cette
dernière
(resvariation
dansle même
sensdesdeuxcaractères
la
forme
exponentielle
revient
ensuite
à
linéaire;
on
sion
pectivement
pour
desens
descendante, unevariation
dedépart.
contraire)
;
1)lorsque
les
. Restproche
de+ 1 (respectivemenl
multiple
linéaire
marquée
elcrois- b) Régression
montrent
uneliaison
caraclères
Ence cas,la
(respectivement
décroissante).
sante
plusélaborés,
veulent
une
expliquer
modèles,
Cerlains
de grandeur
intéressanle,
etlesdeuxdroites
régression
esta p/iorl
(parexemple,
la
autres
deplusieurs
enfonction
guère
régression
neseront
éloignées;
pounadépendre
deson
d'unménage
consommation
linéaire revenu,
. R estoroche
deliaison
de0 enI'absence
mais
desoneffectif).
également
peujustifiée.
linéaire
larégression
estalors
apparente,
lesmêmes,
la
soient
Bienquelesidéesdedépart
graphique
n'estpluspossible
lieu(c'est-à-dire
avant représentation
; lescalculs
R peutêtrecalculé
enpremier
estplus
lesdroiles
dansleder- nesefontplusà la mainet leurinterprétation
derégression)
et- parexemple
pas
délicate.
niercas ne donner
suite
à unerégression.