L`ajustement linéaire et la corrélation
Transcription
L`ajustement linéaire et la corrélation
précédents Leschapilres ontmontré comment étudier unesériestatistique, maisdeuxséries oudeuxcaractèresenregistrés à I'intérieur d'unemême sériepeuvent êtrereliés entre eux.Onexaminera lesplussimples de cesrelations : lesrelations linéaires. Figure 3 1.Données, nuages depoints Onnole'.lxùi, Vz,yz), ...,(xr,r,yr,r) lasérie desobservations quantitatifs relevanl deuxcaractères x et y pour lesN individus population. Exemples d'une : lataille etle Figure 4 poids le PNBparhabitant d'ungroupe d'étudiants, et le pays tauxd'alphabétisation de envoiededéveloppement, lerevenu etlaconsommation ménages, dedifférents etc. Desunités étantconvenablement choisies surchacun O X desaxes, onpeutreprésenter I'individu I delapopulation précédente parle point: (x,,y,lduplanx x y. Figurant Lespoints 1 sontpresque dunuage alignés, tandis ainsilesN individus, lenuage onobtienl depolnts 2 laisse asso- quelenuage simplement apparaître unedirection privilégiée. ciéà lasérie statistioue. Danscesdeuxcas,onditque d'allongement présente le nuage linéaire. Lenuage uncaractère 3 ne Lesnuages depoints associés à desséries statistiques pasdestructure particulière; manileste lenuage 4,enfin, peuvent présenter à deux formes : caractères diftérenles semble seplacer approximalivement selonunecourbe régulière. L'ajustement linéaire résuestlarecherche deladroite mantlemieux lastructure dunuage. Unetellerecherche Figure1 quepourdesnuages n'adoncd'intérêt del'undesdeux premiers types. 2.Ajustement linéaire Figure2 graphique a) Ajustement présente Lorsque le nuage linéaire, uncaractère on . à mainlevée " ladroite peuttenter quirésume detracer lemieux lastructure Lasubjectivité dunuage. duprocédé estévidente. iiiif.f:Ëlii'i LINÉAIRE. AJUSTEMENT CORRÉLATION iirf'fftrjÏAJUSTEM i::i:iIi+]Itïii::. liriiiiiiiiiiiREPERES queladroite pasæparle relation Cette dernière signifie b) tlléthodedesmoindrescanés point moyen t(7,y\, cequipermet decalculer ô après a. Droltede Égressionde Yen X Pratiquement, calcul ces calculs s'apparentent au queI'undescaractères, le plusæuvent Onconsidère Siondoitutiliser unecalculaliæ, onpeut (parexemple, la d'unevariance. ouI'une desvariables, dépend deI'autre les moyennes 1 x el y, calculer successivement etl de consommation dépend durevenu) ; soitY le premier les à la moyenne, la sériedesprodeuxséries d'écarts caractère, ou variable à expliquer, ou et X le second, : (4 -tl .Ut - 7); cette : (xi- f )z; et, descanés variable explicallve. Oncherche uneexpression deY en duits la leur rapporl. enfin, æmme de ces séries et " le lonctionde X,delaforme l= â. x+ ô,quiapproche lenumérateur " lesdonnées. danslecasdelavarianæ, etle Comme mieux ducoefficient a s'expriment sousuneautre D'unpointdevuegéométrique, celarevient à chercher dénominateur quipeutsimplilier lecalcul à lamain: la droite i f = a . x + b,quitraduit le mieux forme d'équation points. I'aspect linéaire dunuage de lxi.fi-N.I.Y a= o Critère desmoindres : canés retenue lesdéfiSoit: y= a. x + b,ladroite ; ondonne (fig.5): nitions o x;êstlâ valeur X observée delavariable explicative pourl'individu i; . yrestla valeur Y observée delavariable à expliquer pourl'individu I; . l'; = a. x;+ b estla valeur héoiqtnouajustée & la y associée variable x,delavariable X; à lavaleur obærvée o €;= yt- y'ieg,l'effeur l'écart d'ajustenent, c'est-à-dire lavaleur entre obærvée ellavaleur théorique ælculée deY. pr,'- ru. r' L'emploi decetteexpression dispense ducalcul des écarts auxmoyennes. quesoitI'expression dea utilisée, Quelle cesælculs quepeuinstructifs. llssefonten sontaussifastidieux quand revanche ilsne trèssimplemenl suruntableur, sontpasdéjàprogrammés, comme surlescalculatriæs statistiques ou mathématiques; danscecas,il suflit lesséries d'entrer d'observations dex et y puisd'utiliær pourlancer lacommande lecalcul. appropriée c) Droitede régressionde X en Y Ona notéquelarégression dey enx donne desrôles différents auxdeuxvariables. Onpeutrenverær cesrôles la variable et régresser X enY.Oncherche uneexpression: x = c. | + d deX enfonction deY optimale au sens desmoindres carrés. précédentes, Lasimple transposition desformules lesvaleurs donnant dea etD,donne c etd : I ( x r- r ) . ( y ; - y ) LU; - yl et 1=c.y+d. " droite quirend La" meilleure relenue (deYenXetdeXenY) estenfaitcelle Lesdeuxdroites derégression minimale lasomme descanés deserreurs représentées d'aiustement. dansle mêmerepère x x y ne sont quesilespoints Onl'appelle drcitedesmoindres canésdey enx, ou confondues dunuage sonlexactement droitederégression dey enx. alignés. plusquele nuage Elles d'autant diffèrent s'éloigne de o Calculs : I'alignement. Lescoefficients a etô deladroile desmoindres canés deY enX s'expriment enfonction desobservalions : (xi,h. quea etô sontdonnés par: Onmonlre a= I(r,-tl.(r,-V) >{''- t)' et l=a.1+ b. 3.Corrélation a) CoefficientR' quela sériedesvaleurs yi, dans Onmontre aiustées la régression y surx, a lamême delavariable moyenne initiale des)1. tquelasérie i:1:triiiii:iii:ir 'lii:iii:..\lt:i;:i;il.:i:: r:::::l{::::jI:::r::jit::: 'j:r:.tt:.t:.tij:.t4 jl ilir'iiiii:iliiiiiii: rÉLAroN i#f4l CORRÉLATION LINÉAIRE, AJUSTEMENT REPÈREI îf$ïï#ïifi ', en " coefficient deconélation appelé R estsouvent qualificatif ". " linéaire le omettant notéR2: Ondéfinitlecoefficient ^_ ,2= _> ( y ' , - h ' Z- >Ut- Y) " parla expliquée Cerapport entrela " variation " mesure laqualité dela totale régression etia. variation lesy; lesy'rapprochent : sicelle-ci estbonne, régression de1. el R2estproche c) Autes formules sanspasser R peutêtrecalculé la variance, Comme parlesécarts : à I'aide delaformule auxmoyennes, 2x,.fi-N.r.t R = linéaireR de corrélation b) Coelîicient desdeux liantRauxpentes larelation Ona également (de Y XetdeXsurY): régression sur de droites plusfréquemment le coelficient de Enfait,oncalcule linéaire, nolêR (onmontre eneffetqu'ilest corrélation H-=â.C. Rz près,à la racine delaquantité canée égal,ausigne précédente) : R = l. Élargissements èles exponentlels 4 ûnod quelesvariables X et Y onvoilsurcelteexpression pourêtresimples à linéaire, Lesrelations denature jouent symétriques. desrôles quipuissent exister entre nesontpaslesseules étudier, la qualité de deuxgrandeurs. nonseulement Lecoefficient R mesure peuvent cependant s'yramener. D'autres le mais,plusgénéralement, régression, I'uneouI'autre par Y =A . Bx, delaforme etXæntliés unerelation l'inlen- SiYque ouencore linéaire depoints, caractère dunuage X.Cetterelade Y exponentiellement dit dépend on (en linéaire entrelesdeuxvariables sitédela liaison leslogarithmes, mais, enprenant " expli' tionn'estpaslinéaire, particulier devoir lorsqu'aucune desdeuxneparaît 0 n a : querDl'autre, machines à en ainsidulauxd'équipement In(Y)=ln(B).X+ln(A), enréfrigérateurs). laver etdutauxd'équipement parlespropriétés : suivantes estprécisé Sonemploi linéaire lavariable transforentre c'est-à-dire unerelation - 1et+ 1; . Resttoujours entre compris = a . X + B,en : In(Y) X,quis'écrit encore mée,In(Y), et lespoints notant= In(B) l) lorsque o R vaut+ 1 (respectivement etF = In(A). d une ascendante, traduisant sontalignés surunedroite parrégresrelation s'effectue Uétude de cette dernière (resvariation dansle même sensdesdeuxcaractères la forme exponentielle revient ensuite à linéaire; on sion pectivement pour desens descendante, unevariation dedépart. contraire) ; 1)lorsque les . Restproche de+ 1 (respectivemenl multiple linéaire marquée elcrois- b) Régression montrent uneliaison caraclères Ence cas,la (respectivement décroissante). sante plusélaborés, veulent une expliquer modèles, Cerlains de grandeur intéressanle, etlesdeuxdroites régression esta p/iorl (parexemple, la autres deplusieurs enfonction guère régression neseront éloignées; pounadépendre deson d'unménage consommation linéaire revenu, . R estoroche deliaison de0 enI'absence mais desoneffectif). également peujustifiée. linéaire larégression estalors apparente, lesmêmes, la soient Bienquelesidéesdedépart graphique n'estpluspossible lieu(c'est-à-dire avant représentation ; lescalculs R peutêtrecalculé enpremier estplus lesdroiles dansleder- nesefontplusà la mainet leurinterprétation derégression) et- parexemple pas délicate. niercas ne donner suite à unerégression.