Mathématiques Financières :
Transcription
Mathématiques Financières :
1 Mathématiques Financières : Les Mathématiques financières sont une branche des mathématiques appliquées ayant pour but la modélisation, la quantification et la compréhension des phénomènes régissant les marchés financiers. Elles utilisent principalement des outils issus de la théorie des probabilités, du calcul stochastique, des statistiques et du calcul différentiel. Historiquement, il est possible de faire remonter la naissance de la théorie moderne des marchés financiers à l'étude du problème de valorisation des options. Nature aléatoire des marchés. L'observation empirique du cours des actifs financiers montre que ceux-ci ne sont pas déterminés de façon certaine par leur histoire. En effet, les nombreuses opérations d'achat ou de vente ne sont pas prévisibles, font souvent intervenir des éléments n'appartenant pas à l'historique, et modifie le cours de l'actif. Celui-ci est donc souvent représenté par un processus chaotique (Benoît Mandelbrot a établi par des considérations statistiques qu'un modèle aléatoire ordinaire, par exemple gaussien, ne pouvait convenir). L'aléa reste cependant parfois modélisé par un mouvement brownien, mais des modèles plus élaborés (par exemple, le modèle de Bates) tiennent compte de la non continuité des cours (présence de chocs), ou de la non symétrie des mouvements à la baisse et à la hausse. Hypothèse de non arbitrage. L'une des hypothèses fondamentales des modèles usuels est qu'il n'existe aucune stratégie financière permettant, pour un coût initial nul, d'acquérir une richesse certaine dans une date future. Cette hypothèse est appelée absence d'opportunités d'arbitrage, et est justifiée par l'existence d'arbitragistes, acteurs sur les marchés dont le rôle est de détecter ce type d'opportunités et d'en profiter. Ceux-ci créent alors une force qui tend à faire évoluer le prix de l'actif vers son prix de non arbitrage. Hypothèse de complétude des marchés. Une autre hypothèse, beaucoup plus remise en question, est que tout flux à venir peut être répliqué exactement, et quel que soit l'état du monde, par un portefeuille d'autres actifs bien choisis. Les modèles ne comprenant pas les hypothèses de non arbitrage et de complétude des marchés sont dits modèles de marchés imparfaits. Probabilité Martingale. Une des conséquences des hypothèses de non arbitrage et de complétude des marchés est l'existence et l'unicité d'une mesure de probabilité dite probabilité martingale ou « probabilité risque neutre » telle que le processus de prix des actifs ayant une source de risque commune est une martingale sous cette probabilité. Cette probabilité peut s'interpréter comme celle qui régirait le processus de prix des sous-jacents de ces actifs si l'espérance du taux de rendement de ceux-ci était le taux d'intérêt sans risque (d'où le terme risque neutre: aucune prime n'est attribuée à la prise de risque). 2 Un processus stochastique est une martingale par rapport à un ensemble d'information si son espérance en date t conditionnelle à l'information disponible en date s < t, est égale à la valeur du processus en date s, c'est-à-dire qu'un processus est une martingale si l'espérance de A(t) en date s est de A(s Le problème de valorisation des produits dérivés. La valorisation (on dit aussi pricing) des produits dérivés se ramène souvent au calcul du prix aujourd'hui d'un actif dont on ne connait le prix qu'à une date future. Il se ramène donc au calcul d'une espérance conditionnelle. Le Modèle Black-Scholes est un exemple de solution analytique au problème de valorisation des options d'achat (call) ou de vente (put) d'un actif sous jacent. Dans le cas d'un call, le problème s'écrit: , où St est le cours de l'actif, K est le prix d'exercice (ou Strike), r(s) est le taux d'intérêt instantané sans risque à la date s , t est la maturité de l'option, c'est à dire la date à laquelle la décision d'exercice peut être prise. La formule de Black et Scholes est un exemple de solution analytique à ce problème, sous des hypothèses restrictives sur la dynamique du sous-jacent. Voir aussi option. A noter qu'une obligation convertible peut s'évaluer comme un lot comprenant une option d'achat et une obligation classique Taux d'intérêt et dérivés de taux d'intérêt. Les modèles simples supposent que le taux d'intérêt, c'est-à-dire le loyer de l'argent est constant. Cette hypothèse est centrale, car sous l'hypothèse d'absence d'opportunités d'arbitrage, un portefeuille non risqué rapporte ce taux d'intérêt. Or cette approximation n'est évidemment plus admissible dès que le cours de l'actif est essentiellement lié au niveau du taux d'intérêt (par exemple, le cours des obligations à taux variable, des swaptions...) ne peuvent être expliqués par un modèle à taux d'intérêt fixe. On modélisera donc le taux d'intérêt par un processus aléatoire, auquel on demandera: d'être au mieux compatible avec l'ensemble des courbes des taux observables - d'avoir des propriétés réalistes, comme de ne pas autoriser des taux négatifs, de rendre compte de l'effet de retour à la moyenne (mean reversion),... Les travaux de Vasicek ont permis d'exhiber un processus, dérivé du processus d'OrnsteinUhlenbeck, cohérent, dont le loyer de l'argent ne dépend que du taux instantané (overnight) mais autorisant des taux négatifs. Des modèles plus élaborés (CIR, ...), faisant partie de la famille dite des modèles affines de taux court, ont permis de remédier à cette lacune, mais ne satisfont pas vraiment les spécialistes du fait de la difficulté d'interprétation financière des paramètres de diffusion et de leur incapacité à épouser exactement la courbe des taux zéro coupon spot. Heath, Jarrow et Morton ont proposé une famille de modèles cohérents, dont la dynamique ne dépend que d'une fonction facilement interprétable (la volatilité du taux 3 forward), et capables de rendre compte de n'importe quelle courbe de taux donnée. Des modèles dits de marché (BGM ou Libor Forward) connaissent un certain succès dans l'explication du prix des caps et des floors. Toutefois, à la différence du marché des dérivés d'options où le modèle de Black et Scholes, plus ou moins arrangé pour le débarrasser de ses imperfections (volatilité constante, taux d'intérêt constant,...) occupe une place prépondérante, aucun modèle de taux ne fait l'unanimité des spécialistes. Les taux d'intérêts sont en effet soumis à des pressions exogènes très importantes, qui rendent caducs très rapidement toutes les calibrations possibles. À l'heure actuelle, les publications et les recherches à ce sujet sont abondantes Définition de Cap et de Floors Un cap est un produit financier correspondant à une option sur taux d'intérêt. L'acheteur du cap vise à se prémunir contre une hausse des taux d'intérêt, en s'assurant un niveau maximal. L'achat simultané d'un cap et d'un floor constitue un collar, tandis que l'achat d'un cap et la vente d'un floor revient à un swap. Un floor est un produit financier correspondant à une option sur taux d'intérêt. L'acheteur du floor vise à se prémunir contre une baisse des taux d'intérêt, en s'assurant un niveau minimal. L'achat simultané d'un cap et d'un floor constitue un collar, tandis que l'achat d'un cap et la vente d'un floor reviennent à un swap. Dérivés de crédit Les dérivées de crédit sont des produits dérivés dont les flux dépendent d'événements de crédits intervenant sur un sous-jacent. Ces produits servent à prévenir la dégradation de la qualité de signature d'une contrepartie, c'est-à-dire son aptitude à assumer ses obligations de paiement ("CDS"'ou Crédit default swap, "CLN" ou "Crédit linked Notes". Ils peuvent servir également à améliorer la qualité de signature d'une partie d'un panier d'actifs ("CDOs" ou "Collateralized debt obligations»). Dérivés climatiques. Les dérivés climatiques sont des produits financiers dont les flux dépendent d'un événement totalement indépendant de la structure des marchés financiers, lié à un événement climatique. Par exemple, un produit peut assurer à son détenteur une rente dans le cas où la température relevée dans une location fixée par contrat dépasse ou reste en dessous d'une température de référence considérée comme normale. Ces produits — récents— ont pour vocation de permettre à des entreprises touristiques ou agricoles de se prémunir contre des aléas climatiques. Ils s'apparentent donc à des produits d'assurance, négociés directement sur les marchés financiers. Peut-être plus que pour les autres, la valorisation de ces produits nécessite des outils statistiques. 4 Martingale. Une martingale est une technique permettant d'augmenter les chances de gain aux jeux de hasard. Le principe dépend complètement du type de jeu qui en est la cible, mais le terme est accompagné d'une aura de mystère qui voudrait que certains joueurs connaissent des techniques secrètes mais efficaces pour tricher avec le hasard. Par exemple, de nombreux joueurs (ou candidats au jeu) cherchent LA martingale qui permettra de battre la banque dans les jeux les plus courants dans les casinos (des institutions dont la rentabilité repose presque entièrement sur la différence - même faible - qui existe entre les chances de gagner et celles de perdre. Les différentes martingales De nombreuses martingales ne sont que le rêve de leur auteur, certaines sont en fait inapplicables, quelques-unes permettent effectivement de tricher un peu. Les jeux d'argent sont en général inéquitables : quel que soit le coup joué, la probabilité de gain du casino (ou de l'État dans le cas d'une loterie) est plus importante que celle du joueur. Dans ce type de jeu, il n'est pas possible d'inverser les chances, seulement de minimiser la probabilité de ruine du joueur. La grande martingale. Elle consiste à jouer une chance simple à la roulette (noir ou rouge, pair ou impair) de façon à gagner, par exemple, une unité dans une série de coups en doublant sa mise si l'on perd, et cela jusqu'à ce que l'on gagne. Exemple : le joueur mise 1 unité sur le rouge, si le rouge sort, il arrête de jouer et il a gagné 1 unité (2 unités de gain moins l'unité de mise), si le noir sort, il double sa mise en pariant 2 unités sur le rouge et ainsi de suite jusqu'à ce qu'il gagne. Cette martingale est théoriquement sûre. Mais elle présente deux inconvénients majeurs : • • elle est limitée par les mises que le joueur peut faire car il faut doubler la mise à chaque coup tant que l'on perd : si on perd 10 fois de suite, on doit pouvoir avancer plus de 500 fois sa mise initiale ! de plus, pour paralyser cette stratégie, les casinos proposent des tables de jeu par tranche de mise : de 1 à 100 euros, de 2 à 200, de 5 à 500, etc. Impossible donc d'utiliser cette méthode sur un grand nombre de coups, ce qui augmente le risque de tout perdre L 'Alembert (Référence à Jean le Rond d'Alembert, mathématicien du XVIIIè siècle) 5 Le principe consiste à augmenter la mise d'une unité après une perte et à diminuer la mise d'une unité après un gain. La contre d'Alembert Cette martingale reprend le principe de celle d'Alembert mais les mises se font dans l'autre sens : il faut donc ici diminuer la mise d'1 unité lorsque l'on perd et augmenter la mise d'1 unité lorsque l'on gagne. Martingales et mathématiques Une martingale est destinée à optimiser l'espérance mathématique d'une stratégie de jeu. Espérance : indicateur de chance ou de risque moyen L'espérance mathématique est une valeur numérique permettant de mesurer le degré d'équité d'un jeu de hasard. Elle est égale à la somme des gains (et des pertes) pondérés par la probabilité du gain (ou de la perte). Exemple de la roulette : en jouant un numéro plein, vous avez 1 chance sur 37 (les numéros vont de 0 à 36) de toucher 36 fois votre mise initiale. En misant 10 euros, votre espérance de gain est donc : (Les 10 euros de mise sont dépensés avec une probabilité égale à 1) Ce score indique qu'en moyenne, vous perdrez 27 centimes à chaque partie au profit du casino. Lorsque l'espérance est égale à 0, on dit que le jeu est équitable. Espérance mathématique et choix rationnel Dans certains cas, les indications de l'espérance mathématique ne coïncident pas avec un choix rationnel. Imaginons par exemple qu'on vous fasse la proposition suivante : si vous arrivez à faire un double six avec deux dés, vous gagnez un million d'euros, sinon vous perdez 10 000 euros. Il est probable que vous refuserez de jouer. Pourtant l'espérance de ce jeu vous est très favorable : la probabilité de tirer un double 6 est de 1/36, on obtient donc : à chaque partie vous gagnez en moyenne 18 000 euros. Le problème tient justement sur ce « en moyenne » : si les gains sont extrêmement importants, ils n'interviennent que relativement rarement, et pour avoir une garantie raisonnable de ne pas finir ruiné, il faut donc avoir suffisamment d'argent pour participer à un grand nombre de parties. Si les mises sont trop importantes pour permettre un grand nombre de parties, le critère de l'espérance mathématique n'est donc pas suffisant 6 Incidence de la prime de risque Ce sont ces considérations de risque de ruine qui conduisirent, à partir de son « paradoxe du mendiant de Saint Petersbourg », le mathématicien Daniel Bernoulli à introduire en 1738 l'idée d'aversion au risque qui conduit à assortir l'espérance mathématique d'une prime de risque pour son application dans les questions de choix. Applications particulières (économie, assurance, finance) La notion de prime de risque appliquée à l'espérance mathématique fut en économie à l'origine du concept d'utilité (et d'utilité dite « marginale »). • • • les primes d'assurance sont d'un coût supérieur à l'espérance mathématique de perte du souscripteur du contrat. Mais c'est ce risque de forte perte en cas d'évènement rare qui l'incite à le souscrire. L'espérance mathématique, comme d'autres concepts probabilistes, est utilisée dans les calculs d'évaluation en finance, par exemple pour l'évaluation d'entreprise. La finance comportementale aborde, entre autres, les aspects émotionnels et cognitifs, qui vont au-delà de la simple prime de risque, et qui peuvent interférer avec le concept rationnel d'espérance mathématique à l'heure du choix. Aspect mathématique L'espérance mathématique d'une variable aléatoire est l'équivalent en probabilité de la moyenne d'une série statistique en statistiques. Elle se note E(X) et se lit espérance de X. L'espérance se calcule, comme la variance, à partir des moments d'une variable aléatoire. Formules L'espérance est définie pour les variables aléatoires à valeurs dans R (ou C) de la manière suivante : • Cas d'une variable discrète : o Si X prend un nombre fini n de valeurs réelles : x1, x2, ..., xn avec les probabilités p1, p2, ..., pn alors o Si X prend un nombre dénombrable de valeurs réelles : x0, x1, ..., xi, .... avec les probabilités p0, p1, ..., pi, .... alors si la série converge. • Cas d'une variable à densité de probabilité : 7 o • Si X a pour densité de probabilité f alors à condition que cette intégrale existe. Cas d'une application mesurable sur un espace de probabilité o Si X est une application mesurable de (Ω, B, p) dans R, positive ou mesurable, Estimation La loi des grands nombres permet de dire que la moyenne empirique de N observations (N grand) de la variable aléatoire X est une bonne estimation de l'espérance de X. Caractère central On considère fréquemment l'espérance comme le centre de la variable aléatoire, c'est-à-dire la valeur autour de laquelle se dispersent les autres valeurs. En particulier, si X et 2a - X ont même loi de probabilité, alors E(X) = a. Ce point de vue est parfois infondé, comme le prouve l'exemple suivant d'une loi geométrique, une loi particulièrement dissymétrique. L'espérance mathématique du nombre de tentatives nécessaires pour obtenir un 6 en lançant un dé cubique est égale à 6. Pourtant, la probabilité que 5 essais ou moins suffisent vaut près de 0,6. Loi de Dubins et Savage Mathématiquement, Lester Dubins et Leonard Savage ont démontré en 1956 que la meilleure façon de jouer dans un jeu où les probabilités sont défavorables au joueur consiste à miser toujours ce qui permet d'approcher le plus rapidement le but visé. Intuitivement ce résultat semble évident: si à chaque partie on a plus de chances de perdre que de gagner, autant minimiser le nombre de parties jouées. Ce résultat signifie également, qu'à moins de disposer d'une mise de départ infinie, il n'existe pas de stratégies permettant de renverser les probabilités en votre faveur dans un jeu qui vous est défavorable. Il faut noter que même dans le cas d'un jeu équitable, le joueur le plus fortuné est favorisé, tout simplement car il a plus de chances de ruiner son adversaire et donc de l'empêcher de continuer à jouer. Probabilités Il existe cependant certains jeux de hasard qui ne sont pas systématiquement défavorables au joueur. On peut citer par exemple le cas de William Jaggers qui gagna un forte somme à Monte Carlo au XIXe siècle en étudiant systématiquement les fréquences de sortie des numéros à la roulette. Il put ainsi déterminer certains numéros qui avaient une probabilité de sortie qui lui était favorable. Aujourd'hui les casinos se protègent contre ce genre de pratiques en entretenant soigneusement leur matériel, si bien que les dispersions sont extrêmement faibles. Ceci signifie que les probabilités de sortie d'un numéro donné sont au mieux très 8 légèrement favorables au joueur. Il faudrait donc parier un nombre immense (souvent pendant plusieurs mois) de fois des petites sommes pour espérer un gain probablement très loin de rémunérer les efforts consentis. Le black jack est un jeu qui possède des stratégies gagnantes : plusieurs techniques de jeu, qui nécessitent généralement de mémoriser les cartes, permettent de renverser les chances en faveur du joueur. Le mathématicien Edward Thorp a ainsi publié en 1962 un livre Beat the Dealer qui fut à l'époque un véritable best-seller. Mais toutes ces méthodes demandent de longues semaines d'entraînement et sont facilement décelables par le croupier (les brusques changements de montant des mises sont caractéristiques). Le casino a alors tout loisir d'écarter de son établissement ces joueurs inopportuns. Le black jack reste pourtant le jeu le moins défavorable au joueur : l'avantage du casino n'est que de 0,66 % face à un bon joueur, il est de 2,7 % à la roulette et jusqu'à 10 % pour les machines à sous. Les méthodes miraculeuses Un certain nombre de revues ou de sites internet prétendent vous renseigner sur la « forme » des numéros, c'est-à-dire leur probabilité de sortir dans les prochains tirages. Voici par exemple un tirage de 50 boules de loto: 39, 38, 42, 29, 18, 48, 40, 36, 9, 24, 49, 33, 47, 9, 45, 7, 11, 49, 16, 28, 27, 25, 16, 27, 22, 48, 5, 24, 16, 6, 4, 14, 17, 44, 46, 9, 37, 22, 39, 12, 33, 9, 21, 44, 11, 33, 19, 20, 37, 18. On s'aperçoit que la boule 9 est sortie 4 fois alors que la boule 8 n'est jamais sortie. Suite à des calculs savants, les auteurs de ces « méthodes » vous diront alors que le chiffre 9 est en forme et qu'il va donc sortir dans les prochains tirages ou au contraire que la loi des grands nombres implique que le 8 à une probabilité plus forte de sortir pour combler son retard. Il s'agit bien entendu là d'une erreur à la limite de l’escroquerie caractérisée. Les boules de loto ne s'amusent pas à compter le nombre de fois où elles sont sorties de la machine, d'autant plus qu'il faudrait qu'elles soient suffisamment coquettes pour ne pas prendre en compte les tirages de tests ou de calibration des machines. Si chaque boule a en moyenne une chance sur 49 de sortir, cette probabilité n'est vraie que pour un nombre infiniment grand de tirages. Le fait que la boule 9 soit sortie 4 fois de plus que la boule 8 n'a donc aucune importance puisque les probabilités ne garantissent pas que chaque boule va sortir le même nombre de fois, mais simplement que la différence du nombre de sorties de deux boules sera très petite par rapport au nombre total de tirages : rien ne dit que la boule huit va finalement rattraper son retard. Par exemple, si au bout de dix mille tirages la boule 9 est sortie 206 fois et la boule 8 est sortie 202 fois, on obtiendra une fréquence de 1,01/49 et 0,99/49. Au millionième tirage si la boule 9 est sortie 20410 fois et la boule 8 est sortie 20406 fois on obtiendra respectivement 1,0001/49 et 0,9999/49. Les fréquences s'approchent de plus en plus de la probabilité théorique de 1/49, pourtant la boule 9 conserve son avance de quatre sorties sur la boule 8. Il faut noter qu'il existe également d'autres méthodes un peu plus évoluées. L'une d'elles repose sur les combinaisons les moins jouées. Dans les jeux où le gain dépend du nombre de joueurs gagnants (Loto...), jouer les combinaisons les moins jouées optimisera les gains. D'ailleurs si la Française des Jeux publie largement les statistiques sur les numéros tirés, les statistiques sur les numéros joués sont jalousement gardées. C'est ainsi que certaines personnes vendent des combinaisons qui seraient statistiquement très rarement utilisées par les autres joueurs. 9 D'autres reposent sur le pari d'un biais systématique : les tirages ne sont pas exactement équiprobables, suite par exemple à d'infimes différences de poids des boules. Même si le calcul de l’espérance mathématique de ce type de martingale est beaucoup plus complexe, le bon sens indique que si l'auteur de la recette trouve plus rentable de la vendre que de l'utiliser pour son compte, c'est probablement que son efficacité est à peu près nulle. Loi des grands nombres : Essentiellement, la loi des grands nombres indique que lorsque l'on fait un tirage aléatoire dans une série de grande taille, plus on augmente la taille de l'échantillon plus les caractéristiques mathématique du tirage (l'échantillon) se rapprochent des caractéristiques statistiques de la population. Mais il est intéressant de noter que le taille de l'échantillon à prendre pour approcher les caractéristiques de la population initiale ne dépend que faiblement voire pas du tout de la taille de la série initiale : pour un sondage au Luxembourg ou aux États-Unis, il suffit, pour obtenir une précision égale de prendre un échantillon de même taille. C'est sur cette loi que reposent la plupart des sondages (en tout cas ceux qui n'utilisent pas spécifiquement la règle des quotas). Ils interrogent un nombre suffisamment important de personnes pour connaître l'opinion (probable) de la population entière. La loi des grands nombres sert aussi en statistique inférentielle, pour deviner une loi de probabilité à partir d'une série d'expériences. Les mathématiciens distinguent deux énoncés, appelés respectivement loi faible des grands nombres et loi forte des grands nombres 1/° Loi faible des grands nombres : Si l'on considère n variables aléatoires indépendantes qui suivent la même loi de probabilité et dont l’espérance est E(X), la loi faible des grands nombres stipule que, pour tout réel ε strictement positif, la probabilité que la moyenne empirique s'éloigne de l'espérance de plus de ε, tend vers 0 pour les grandes valeurs de n. Elle se démontre en utilisant l'inégalité de Pafnouti Tchebychev: 10 Et en remarquant que la variable pour variance a pour espérance E(X) et donc On dit aussi que Yn converge en probabilité vers E(X) Loi forte des grands nombres : La loi forte des grands nombres précise que converge vers E(X) « presque partout ». C’est-à-dire que : Convergence vers une loi de probabilité : La même loi des grands nombres permet de dire que la répartition de la population de l'échantillon converge vers la loi de probabilité de X pour n assez grand. Pour prouver que la fréquence fn(i) de la valeur xi converge vers la probabilité pi, il suffit d'utiliser la variable aléatoire qui prend la valeur 1 si X(ω) = xi et la valeur 0 sinon. Cette variable aléatoire a pour espérance pi. La fréquence fn(i) converge alors en probabilité et aussi presque sûrement, vers pi Variable aléatoire : Une variable aléatoire est une fonction dont les valeurs ou les intervalles de valeurs sont associés à des probabilités. Les variables aléatoires sont très utilisées en théorie des probabilités et en statistiques. Dans les applications, les variables aléatoires sont utilisées pour modéliser le résultat d'un mécanisme non déterministe ou encore comme le résultat d'une expérience non déterministe qui génère un résultat aléatoire. 11 • La variable aléatoire la plus simple est donnée par le résultat d'un lancé au jet de pile ou face, qui vaut pile ou face. Un autre exemple simple est donnée par le résultat d'un jet de dés, pour lequel les valeurs possibles sont 1, 2, 3, 4, 5, 6. De telles variables aléatoires sont qualifiées de discrètes car elles prennent des valeurs bien séparées. A contrario, la mesure de la taille d'un individu pris au hasard dans une population ressemble davantage à un nombre réel positif (cela n'est pas tout à fait vrai non plus, car des questions ergonomiques rendent d'autant plus improbable l'énoncé d'un nombre qu'il comporte de décimales significatives; l'attracteur est en fait un fractal). Cette variable aléatoire est alors qualifiée par convention de continue. L'étude de la répartition des valeurs prises par une variable aléatoire conduit à la notion de loi de probabilité. • En mathématiques, et plus précisément en théorie des probabilités, une variable aléatoire est une fonction mesurable définie sur un espace de probabilités. La mesure image correspondante est appelée loi de la variable aléatoire. Ce type de fonction permet de modéliser un phénomène aléatoire, comme par exemple le résultat d'un jet de dés. Une propriété intéressante de l'intégrale de Lebesgue fait qu'un événement de probabilité strictement nulle n'est pas nécessairement impossible au sens strict du terme (ainsi, la probabilité qu'un réel tiré au hasard soit un entier est nulle, mais les entiers n'en existent pas moins dans l'ensemble des réels) Quelques variables aléatoires En guise d'introduction aux définitions concernant les variables aléatoires, il semble intéressant de présenter brièvement une famille de variables très utilisées. Outre la variable certaine qui prend une valeur donnée avec une probabilité égale à 1, la variable aléatoire la plus simple est appelée variable de Bernoulli. Celle-ci peut prendre deux états, qu'il est toujours possible de coder 1 et 0, avec les probabilités p et 1-p. Une interprétation simple concerne un jeu de dé dans lequel on gagnerait un euro en tirant le six (p = 1/6). Sur une séquence de parties, la moyenne des gains tend vers p lorsque le nombre de parties tend vers l'infini. Si on considère qu'une partie est constituée par n tirages au lieu d'un seul, le total des gains est une réalisation d'une variable binomiable qui peut prendre toutes les valeurs entières de 0 à n. Cette variable a pour moyenne le produit np. On obtient un exemple moins futile en considérant le score d'un candidat dans un sondage électoral. Si n est assez grand et p pas trop petit, on peut trouver une approximation convenable en utilisant la variable de Gauss. Dans les sondages cela permet d'associer un intervalle de confiance au résultat brut. Ainsi, il y a 95 chances sur 100 pour qu'une enquête portant sur 1000 personnes donne un résultat correct à ± 3 % près. Toujours avec n grand, l'approximation de Poisson est préférable si p est assez petit pour que la moyenne np ne soit pas trop grande, de l'ordre de quelques unités. Dans un sondage ce serait la loi applicable aux « petits » candidats. C'est surtout la loi utilisée dans des problèmes de files d'attente. 12 La somme des carrés de ν variables de Gauss indépendantes est une variable de χ2 à ν degrés de liberté (la variable exponentielle en est un cas particulier). Le test du χ2 est utilisé pour apprécier la valeur de l'adéquation d'une loi de probabilité sur une distribution empirique. Si on divise une variable de Gauss par une variable de χ (racine carrée de la précédente), on obtient une variable de Student. Le rapport de deux variables de χ2 indépendantes définit une variable de Snedecor. Ces deux lois sont utilisées dans l'analyse de populations supposées gaussiennes. Notions de base : Fonction de répartition. Il serait possible d'introduire cette notion à partir de l'une quelconque des variables précédemment considérées mais il paraît plus clair d'étudier le cas du dé sous un angle différent. En effet, il définit une variable aléatoire X qui prend avec la même probabilité d'apparition (1/6) des valeurs dans l'ensemble {1, 2, 3, 4, 5,6}. On peut alors associer à toute valeur réelle x la probabilité d'obtenir un tirage inférieur à x, ce qui définit une courbe en escalier dont les marches ont une hauteur égale à 1/6. Formellement, cela conduit à une fonction de répartition Dans celle-ci, la majuscule X représente la variable aléatoire, ensemble de valeurs numériques, et la minuscule x représente la variable d'état, variable au sens usuel du terme. Si les événements ne sont plus équiprobables, cela ne fait que déformer la courbe. Pour introduire une notion nouvelle, on peut commencer par remplacer le dé par une roulette à six numéros, ce qui conduit à un problème rigoureusement identique. Ensuite, on ne change rien de fondamental si on remplace les six nombres entiers par les repères décentres d'arcs de 60 degrés. À partir de là il est possible d'augmenter le nombre de secteurs en réduisant leur taille : les échelons deviendront de plus en plus petits jusqu'à être indiscernables sur un dessin. Le passage à la limite remplace la variable discrète par une variable continue qui prend toutes les valeurs réelles dans l’intervalle] 0,360] : c'est une variable uniforme. 13 Finalement toute fonction définie et non décroissante entre 0 (l'impossibilité) et 1 (la certitude) sur l’intervalle]-∞, +∞ [peut être considérée comme fonction de répartition d'une variable aléatoire. L'intérêt de la fonction de répartition réside dans le fait qu'elle est valable aussi bien pour les variables continues définies sur un ensemble continu que pour les variables discrètes définies sur un ensemble dénombrable (dans la plupart des cas pratiques il se réduit à un ensemble de valeurs équidistantes que l'on peut ramener à un ensemble d'entiers). Le remplacement progressif de courbes en escaliers par des courbes continues permet de voir intuitivement comment une variable continue peut fournir une approximation souvent plus facile à manipuler que la variable discrète originale. Malheureusement ces avantages de la fonction de répartition, intéressants pour la visualisation des phénomènes, disparaissent dès que l'on veut approfondir les problèmes. Dans ce cas, il est généralement plus commode d'utiliser les notions décrites dans les paragraphes suivants. Fonction de probabilité d'une variable discrète : Une variable discrète est décrite tout simplement par l'ensemble de ses probabilités. Si on suppose qu'elle prend des valeurs entières, cela s'écrit On reconstruit la fonction de répartition par Si alors qui tend vers 1 lorsque x tend vers l'infini. 14 Densité de probabilité d'une variable continue : Une variable continue possède en général une fonction de répartition dérivable par morceaux. Il est alors commode de la dériver pour obtenir la densité de probabilité. qui est définie et non négative de à . On reconstruit la fonction de répartition par qui tend vers 1 lorsque x tend vers l'infini. Dans les raisonnements généraux il est souvent commode d'écrire ces formules sous forme différentielle : Si on effectue un changement de variable selon la formule de probabilité se calcule par , la nouvelle densité 15 Espérances mathématiques : Définition L'espérance mathématique d'une variable aléatoire se définit comme les valeurs prises par cette variable pondérée par leurs probabilités. Dans le cas d'une variable discrète que l'on suppose prendre les valeurs entières, elle se définit simplement par Pour une variable continue, la formule différentielle donnée précédemment s'intègre en Généralisation X étant une variable aléatoire, une fonction f supposée régulière définit une nouvelle variable aléatoire f(X) dont l'espérance s'écrit en remplaçant x par f(x) dans les formules précédentes. En particulier, il est intéressant de considérer la fonction à valeurs complexes dont l'espérance mathématique définit la transformée de Fourier inverse de la densité de probabilité : Si la densité de probabilité est une fonction suffisamment régulière, l'exponentielle se développe en série : ou : Les définissent les moments de la variable aléatoire. S'ils existent, on constate que celle-ci peut être caractérisée par sa fonction de répartition, sa densité de probabilité (ou sa fonction de probabilité), sa fonction caractéristique ou la suite de ses moments 16 Moments centrés : Le moment d'ordre 1, noté représente la moyenne, valeur centrale. En ce qui concerne les moments d'ordre supérieur il est généralement plus commode d'utiliser les moments centrés : Le plus utile est la variance, valeur de dispersion : Pour obtenir une grandeur homogène à la grandeur de base et à la moyenne, on considère l'écart type σX Moyenne arithmétique La moyenne arithmétique est la moyenne ordinaire, c'est-à-dire la somme d'une distribution d'un caractère statistique quantitatif par le nombre de valeurs. Sa formulation mathématique peut se faire comme suit: Médiane. On appelle médiane d'une variable aléatoire X, un réel m tel que Dans le cas d'une variable aléatoire discrète, cette définition est peu intéressante car elle permet l'existence de plusieurs médianes si X est le numéro apparaissant sur la face supérieure d'un dé à 6 faces parfaitement équilibré, pour tout réel m strictement compris entre 3 et 4, on a : ou bien l'existence d'une médiane qui ne donne pas une probabilité de 0,5 Si X est la somme obtenue en lançant deux dés à 6 faces parfaitement équilibré. X ne possède qu'une seule médiane 7 mais 17 Dans le cas d'une variable continue, dont la fonction de répartition est strictement croissante, la définition est équivalente à la suivante : m est la médiane de X ssi Le fait que la fonction de répartition soit une fonction continue, strictement croissante, à valeurs dans [0 ; 1] assure l'existence et l'unicité de la médiane. Écart type : En statistique élémentaire, L'écart type (ou déviation standard) est un critère de dispersion. Il mesure l'écart à la moyenne observée (et non à la moyenne théorique) et correspond à la moyenne quadratique des écarts entre les valeurs observées et la moyenne de ces valeurs observées. Il se note avec la lettre de l'alphabet grec, σ (sigma minuscule). Formules : on trouve les formules suivantes dans le cas d'une série discrète • non regroupée. dans le cas d'une série • discrète regroupée. dans le cas d'une série • continue. Où xi sont les valeurs du caractère, ni les effectifs, fi les fréquences, mi les milieux des classes et la moyenne En probabilité, L'écart type mesure la dispersion d'une variable aléatoire autour de son espérance E(X). Il se calcule sous plusieurs formes • si la variable aléatoire est discrète. 18 lorsque la variable • aléatoire est continue de densité de probabilité f. En théorie des sondages, Lorsqu'il s'agit d'estimer la dispersion autour de la moyenne d'un caractère statistique dans une population de grande taille à partir d'un échantillon de taille n, on utilise pour l'écart type la valeur suivante . On peut remarquer que Pourquoi n-1 ? La question que l'on se pose généralement est « Pourquoi n - 1 ? ». La raison pour laquelle on divise par n - 1 au lieu de n est un bel exemple de l'interaction permanente entre les statistiques et les probabilités. Le sondage de n individus correspond à une série de n variables aléatoires xi indépendante d’espérance E (X) et de variance V (X). La moyenne de l'échantillon est une variable aléatoire d'espérance E(X) et de variance (la moyenne de n variables aléatoires fluctue moins qu'une seule variable aléatoire). La variance v de l'échantillon est une variable aléatoire dont on veut calculer l'espérance. . est une variable aléatoire d'espérance E(X)2 + V(X). est une variable aléatoire d'espérance E(X)2 + V(X). est une variable aléatoire d'espérance . donc égale à 19 Donc . La variance v de l'échantillon fluctue donc autour de V(X) comme on aurait pu s'y attendre. et non autour de Pour obtenir une estimation de V(X), il est donc nécessaire de prendre Et pour obtenir une estimation de l'écart type σ(X), il est nécessaire de prendre . . Aspect qualitatif Plus communément appelée ECART-TYPE, la déviation standard caractérise la largeur de la distribution. Elle est exprimée mathématiquement comme étant la racine carrée de la variance, celle-ci mesurant la distribution des valeurs autour du centre de la courbe. Écart-type (S) = Racine carrée de la variance • L'écart-type est la mesure de dispersion, ou étalement, la plus couramment utilisée en statistique lorsqu'on emploie la moyenne pour calculer une tendance centrale. Il mesure donc la dispersion autour de la moyenne. En raison de ses liens étroits avec la moyenne, l'écart-type peut être grandement influencé si cette dernière donne une mauvaise mesure de tendance centrale. • Contrairement à l'étendue et aux quartiles, la variance permet de combiner toutes les valeurs à l'intérieur d'un ensemble de données afin d'obtenir la mesure de dispersion. La variance (symbolisée par S2) et l'écart-type (la racine carré de la variance, symbolisée par S) sont les mesures de dispersion les plus couramment utilisées. La variance est définie comme étant la moyenne arithmétique des carrés des différences entre les valeurs observées et la moyenne. C'est une mesure du degré de dispersion d'un ensemble de données. On la calcule sous la forme de l'écart au carré moyen de chaque nombre par rapport à la moyenne d'un ensemble de données. Répartition de la population, Lorsque la variable étudiée est gaussienne (répartition selon une courbe en cloche), l'écarttype permet de déterminer la répartition de la population autour de la valeur moyenne. Par exemple : Si par convention, la déviation standard par rapport à un échantillon équivaut à 15 points de QI de différence, cela signifie que les 2/3 environ de la population d'une classe d'âge ont un QI compris entre 85 et 115 --> Voir QI et intervalle de confiance 20 Interprétation d'un écart type élevé, Généralement, plus les valeurs sont largement distribuées, plus l'écart-type est élevé. Imaginez, par exemple, que nous devons séparer deux ensembles différents de résultats d'examens de 30 élèves; les notes du premier examen varient de 31 % à 98 % et celles du second, de 82 % à 93 %. Compte tenu de ces étendues, l'écart-type serait plus grand pour les résultats du premier examen. Cependant, il n'est pas toujours facile d'évaluer l'importance que doit avoir l'écart-type pour que les données soient largement dispersées. L'importance de l'écart-type dépend aussi de l'importance de la valeur moyenne de l'ensemble des données. Lorsque vous mesurez quelque chose en millions, le fait d'avoir des mesures qui se rapprochent de la valeur moyenne n'a pas la même signification que si vous mesurez le poids de deux personnes. Par exemple, si après avoir mesuré les recettes annuelles de deux grandes entreprises, vous constatez un écart de 100 000 euros, la différence est considérée comme étant peu significative, alors que si vous mesurez le poids de deux personnes, dont l'écart est de 30 kilogrammes, la différence est considérée comme étant très significative. Voilà pourquoi il est parfois utile de travailler, dans certains cas, sur l’écart type relatif (écarttype quotité par la moyenne). Ecart type relatif, Pour comparer deux séries statistiques qui n'ont pas le même ordre de grandeur, il est parfois bon de comparer l'écart type et la moyenne en en faisant le quotient, on obtient alors l'écart type relatif Variance, On nomme variance le carré de l'écart type : V(X) = σ2 La formule de l'écart type peut se révéler compliquée. On a donc défini la variance. La variance V est le carré de l'écart type. dans le cas d'une série discrète non triée. • dans le cas d'une série discrète • regroupée. • dans le cas d'une série continue. La disparition des racines carrées permet des calculs plus simples. On démontre que la variance peut se calculer plus simplement par les formules suivantes: 21 dans le cas d'une série discrète non triée. • dans le cas d'une série discrète • regroupée. • dans le cas d'une série continue.