Mathématiques Financières :

Transcription

Mathématiques Financières :
1
Mathématiques Financières :
Les Mathématiques financières sont une branche des mathématiques appliquées ayant pour
but la modélisation, la quantification et la compréhension des phénomènes régissant les
marchés financiers. Elles utilisent principalement des outils issus de la théorie des
probabilités, du calcul stochastique, des statistiques et du calcul différentiel. Historiquement,
il est possible de faire remonter la naissance de la théorie moderne des marchés financiers à
l'étude du problème de valorisation des options.
Nature aléatoire des marchés.
L'observation empirique du cours des actifs financiers montre que ceux-ci ne sont pas
déterminés de façon certaine par leur histoire. En effet, les nombreuses opérations d'achat ou
de vente ne sont pas prévisibles, font souvent intervenir des éléments n'appartenant pas à
l'historique, et modifie le cours de l'actif. Celui-ci est donc souvent représenté par un
processus chaotique (Benoît Mandelbrot a établi par des considérations statistiques qu'un
modèle aléatoire ordinaire, par exemple gaussien, ne pouvait convenir). L'aléa reste cependant
parfois modélisé par un mouvement brownien, mais des modèles plus élaborés (par exemple,
le modèle de Bates) tiennent compte de la non continuité des cours (présence de chocs), ou de
la non symétrie des mouvements à la baisse et à la hausse.
Hypothèse de non arbitrage.
L'une des hypothèses fondamentales des modèles usuels est qu'il n'existe aucune stratégie
financière permettant, pour un coût initial nul, d'acquérir une richesse certaine dans une date
future. Cette hypothèse est appelée absence d'opportunités d'arbitrage, et est justifiée par
l'existence d'arbitragistes, acteurs sur les marchés dont le rôle est de détecter ce type
d'opportunités et d'en profiter. Ceux-ci créent alors une force qui tend à faire évoluer le prix
de l'actif vers son prix de non arbitrage.
Hypothèse de complétude des marchés.
Une autre hypothèse, beaucoup plus remise en question, est que tout flux à venir peut être
répliqué exactement, et quel que soit l'état du monde, par un portefeuille d'autres actifs bien
choisis. Les modèles ne comprenant pas les hypothèses de non arbitrage et de complétude des
marchés sont dits modèles de marchés imparfaits.
Probabilité Martingale.
Une des conséquences des hypothèses de non arbitrage et de complétude des marchés est
l'existence et l'unicité d'une mesure de probabilité dite probabilité martingale ou « probabilité
risque neutre » telle que le processus de prix des actifs ayant une source de risque commune
est une martingale sous cette probabilité. Cette probabilité peut s'interpréter comme celle qui
régirait le processus de prix des sous-jacents de ces actifs si l'espérance du taux de rendement
de ceux-ci était le taux d'intérêt sans risque (d'où le terme risque neutre: aucune prime n'est
attribuée à la prise de risque).
2
Un processus stochastique est une martingale par rapport à un ensemble d'information si son
espérance en date t conditionnelle à l'information disponible en date s < t, est égale à la valeur
du processus en date s, c'est-à-dire qu'un processus est une martingale si l'espérance de A(t)
en date s est de A(s
Le problème de valorisation des produits dérivés.
La valorisation (on dit aussi pricing) des produits dérivés se ramène souvent au calcul du prix
aujourd'hui d'un actif dont on ne connait le prix qu'à une date future. Il se ramène donc au
calcul d'une espérance conditionnelle. Le Modèle Black-Scholes est un exemple de solution
analytique au problème de valorisation des options d'achat (call) ou de vente (put) d'un actif
sous jacent. Dans le cas d'un call, le problème
s'écrit:
, où St est le cours de l'actif, K est le
prix d'exercice (ou Strike), r(s) est le taux d'intérêt instantané sans risque à la date s , t est la
maturité de l'option, c'est à dire la date à laquelle la décision d'exercice peut être prise. La
formule de Black et Scholes est un exemple de solution analytique à ce problème, sous des
hypothèses restrictives sur la dynamique du sous-jacent. Voir aussi option.
A noter qu'une obligation convertible peut s'évaluer comme un lot comprenant une option
d'achat et une obligation classique
Taux d'intérêt et dérivés de taux d'intérêt.
Les modèles simples supposent que le taux d'intérêt, c'est-à-dire le loyer de l'argent est
constant. Cette hypothèse est centrale, car sous l'hypothèse d'absence d'opportunités
d'arbitrage, un portefeuille non risqué rapporte ce taux d'intérêt. Or cette approximation n'est
évidemment plus admissible dès que le cours de l'actif est essentiellement lié au niveau du
taux d'intérêt (par exemple, le cours des obligations à taux variable, des swaptions...) ne
peuvent être expliqués par un modèle à taux d'intérêt fixe.
On modélisera donc le taux d'intérêt par un processus aléatoire, auquel on demandera: d'être au mieux compatible avec l'ensemble des courbes des taux observables - d'avoir des
propriétés réalistes, comme de ne pas autoriser des taux négatifs, de rendre compte de l'effet
de retour à la moyenne (mean reversion),...
Les travaux de Vasicek ont permis d'exhiber un processus, dérivé du processus d'OrnsteinUhlenbeck, cohérent, dont le loyer de l'argent ne dépend que du taux instantané (overnight)
mais autorisant des taux négatifs. Des modèles plus élaborés (CIR, ...), faisant partie de la
famille dite des modèles affines de taux court, ont permis de remédier à cette lacune, mais ne
satisfont pas vraiment les spécialistes du fait de la difficulté d'interprétation financière des
paramètres de diffusion et de leur incapacité à épouser exactement la courbe des taux zéro
coupon spot. Heath, Jarrow et Morton ont proposé une famille de modèles cohérents, dont la
dynamique ne dépend que d'une fonction facilement interprétable (la volatilité du taux
3
forward), et capables de rendre compte de n'importe quelle courbe de taux donnée. Des
modèles dits de marché (BGM ou Libor Forward) connaissent un certain succès dans
l'explication du prix des caps et des floors.
Toutefois, à la différence du marché des dérivés d'options où le modèle de Black et Scholes,
plus ou moins arrangé pour le débarrasser de ses imperfections (volatilité constante, taux
d'intérêt constant,...) occupe une place prépondérante, aucun modèle de taux ne fait
l'unanimité des spécialistes. Les taux d'intérêts sont en effet soumis à des pressions exogènes
très importantes, qui rendent caducs très rapidement toutes les calibrations possibles. À
l'heure actuelle, les publications et les recherches à ce sujet sont abondantes
Définition de Cap et de Floors
Un cap est un produit financier correspondant à une option sur taux d'intérêt. L'acheteur du
cap vise à se prémunir contre une hausse des taux d'intérêt, en s'assurant un niveau maximal.
L'achat simultané d'un cap et d'un floor constitue un collar, tandis que l'achat d'un cap et la
vente d'un floor revient à un swap.
Un floor est un produit financier correspondant à une option sur taux d'intérêt. L'acheteur du
floor vise à se prémunir contre une baisse des taux d'intérêt, en s'assurant un niveau minimal.
L'achat simultané d'un cap et d'un floor constitue un collar, tandis que l'achat d'un cap et la
vente d'un floor reviennent à un swap.
Dérivés de crédit
Les dérivées de crédit sont des produits dérivés dont les flux dépendent d'événements de
crédits intervenant sur un sous-jacent. Ces produits servent à prévenir la dégradation de la
qualité de signature d'une contrepartie, c'est-à-dire son aptitude à assumer ses obligations de
paiement ("CDS"'ou Crédit default swap, "CLN" ou "Crédit linked Notes". Ils peuvent servir
également à améliorer la qualité de signature d'une partie d'un panier d'actifs ("CDOs" ou
"Collateralized debt obligations»).
Dérivés climatiques.
Les dérivés climatiques sont des produits financiers dont les flux dépendent d'un événement
totalement indépendant de la structure des marchés financiers, lié à un événement climatique.
Par exemple, un produit peut assurer à son détenteur une rente dans le cas où la température
relevée dans une location fixée par contrat dépasse ou reste en dessous d'une température de
référence considérée comme normale. Ces produits — récents— ont pour vocation de
permettre à des entreprises touristiques ou agricoles de se prémunir contre des aléas
climatiques. Ils s'apparentent donc à des produits d'assurance, négociés directement sur les
marchés financiers. Peut-être plus que pour les autres, la valorisation de ces produits nécessite
des outils statistiques.
4
Martingale.
Une martingale est une technique permettant d'augmenter les chances de gain aux jeux de
hasard. Le principe dépend complètement du type de jeu qui en est la cible, mais le terme est
accompagné d'une aura de mystère qui voudrait que certains joueurs connaissent des
techniques secrètes mais efficaces pour tricher avec le hasard. Par exemple, de nombreux
joueurs (ou candidats au jeu) cherchent LA martingale qui permettra de battre la banque dans
les jeux les plus courants dans les casinos (des institutions dont la rentabilité repose presque
entièrement sur la différence - même faible - qui existe entre les chances de gagner et celles
de perdre.
Les différentes martingales
De nombreuses martingales ne sont que le rêve de leur auteur, certaines sont en fait
inapplicables, quelques-unes permettent effectivement de tricher un peu. Les jeux
d'argent sont en général inéquitables : quel que soit le coup joué, la probabilité de gain
du casino (ou de l'État dans le cas d'une loterie) est plus importante que celle du joueur.
Dans ce type de jeu, il n'est pas possible d'inverser les chances, seulement de minimiser
la probabilité de ruine du joueur.
La grande martingale.
Elle consiste à jouer une chance simple à la roulette (noir ou rouge, pair ou impair) de façon à
gagner, par exemple, une unité dans une série de coups en doublant sa mise si l'on perd, et
cela jusqu'à ce que l'on gagne. Exemple : le joueur mise 1 unité sur le rouge, si le rouge sort, il
arrête de jouer et il a gagné 1 unité (2 unités de gain moins l'unité de mise), si le noir sort, il
double sa mise en pariant 2 unités sur le rouge et ainsi de suite jusqu'à ce qu'il gagne.
Cette martingale est théoriquement sûre. Mais elle présente deux inconvénients majeurs :
•
•
elle est limitée par les mises que le joueur peut faire car il faut doubler la mise à
chaque coup tant que l'on perd : si on perd 10 fois de suite, on doit pouvoir avancer
plus de 500 fois sa mise initiale !
de plus, pour paralyser cette stratégie, les casinos proposent des tables de jeu par
tranche de mise : de 1 à 100 euros, de 2 à 200, de 5 à 500, etc. Impossible donc
d'utiliser cette méthode sur un grand nombre de coups, ce qui augmente le risque de
tout perdre
L 'Alembert
(Référence à Jean le Rond d'Alembert, mathématicien du XVIIIè siècle)
5
Le principe consiste à augmenter la mise d'une unité après une perte et à diminuer la mise
d'une unité après un gain.
La contre d'Alembert
Cette martingale reprend le principe de celle d'Alembert mais les mises se font dans l'autre
sens : il faut donc ici diminuer la mise d'1 unité lorsque l'on perd et augmenter la mise d'1
unité lorsque l'on gagne.
Martingales et mathématiques
Une martingale est destinée à optimiser l'espérance mathématique d'une stratégie de jeu.
Espérance : indicateur de chance ou de risque moyen
L'espérance mathématique est une valeur numérique permettant de mesurer le degré d'équité
d'un jeu de hasard. Elle est égale à la somme des gains (et des pertes) pondérés par la
probabilité du gain (ou de la perte).
Exemple de la roulette : en jouant un numéro plein, vous avez 1 chance sur 37 (les numéros
vont de 0 à 36) de toucher 36 fois votre mise initiale. En misant 10 euros, votre espérance de
gain est donc :
(Les 10 euros de mise sont dépensés avec une probabilité égale à 1)
Ce score indique qu'en moyenne, vous perdrez 27 centimes à chaque partie au profit du
casino. Lorsque l'espérance est égale à 0, on dit que le jeu est équitable.
Espérance mathématique et choix rationnel
Dans certains cas, les indications de l'espérance mathématique ne coïncident pas avec un
choix rationnel. Imaginons par exemple qu'on vous fasse la proposition suivante : si vous
arrivez à faire un double six avec deux dés, vous gagnez un million d'euros, sinon vous perdez
10 000 euros. Il est probable que vous refuserez de jouer. Pourtant l'espérance de ce jeu vous
est très favorable : la probabilité de tirer un double 6 est de 1/36, on obtient donc :
à chaque partie vous gagnez en moyenne 18 000 euros.
Le problème tient justement sur ce « en moyenne » : si les gains sont extrêmement importants,
ils n'interviennent que relativement rarement, et pour avoir une garantie raisonnable de ne pas
finir ruiné, il faut donc avoir suffisamment d'argent pour participer à un grand nombre de
parties. Si les mises sont trop importantes pour permettre un grand nombre de parties, le
critère de l'espérance mathématique n'est donc pas suffisant
6
Incidence de la prime de risque
Ce sont ces considérations de risque de ruine qui conduisirent, à partir de son « paradoxe du
mendiant de Saint Petersbourg », le mathématicien Daniel Bernoulli à introduire en 1738
l'idée d'aversion au risque qui conduit à assortir l'espérance mathématique d'une prime de
risque pour son application dans les questions de choix.
Applications particulières (économie, assurance, finance)
La notion de prime de risque appliquée à l'espérance mathématique fut en économie à
l'origine du concept d'utilité (et d'utilité dite « marginale »).
•
•
•
les primes d'assurance sont d'un coût supérieur à l'espérance mathématique de perte du
souscripteur du contrat. Mais c'est ce risque de forte perte en cas d'évènement rare qui
l'incite à le souscrire.
L'espérance mathématique, comme d'autres concepts probabilistes, est utilisée dans les
calculs d'évaluation en finance, par exemple pour l'évaluation d'entreprise.
La finance comportementale aborde, entre autres, les aspects émotionnels et cognitifs,
qui vont au-delà de la simple prime de risque, et qui peuvent interférer avec le concept
rationnel d'espérance mathématique à l'heure du choix.
Aspect mathématique
L'espérance mathématique d'une variable aléatoire est l'équivalent en probabilité de la
moyenne d'une série statistique en statistiques. Elle se note E(X) et se lit espérance de X.
L'espérance se calcule, comme la variance, à partir des moments d'une variable aléatoire.
Formules
L'espérance est définie pour les variables aléatoires à valeurs dans R (ou C) de la manière
suivante :
•
Cas d'une variable discrète :
o Si X prend un nombre fini n de valeurs réelles : x1, x2, ..., xn avec les
probabilités p1, p2, ..., pn alors
o
Si X prend un nombre dénombrable de valeurs réelles : x0, x1, ..., xi, .... avec les
probabilités p0, p1, ..., pi, .... alors
si la série converge.
•
Cas d'une variable à densité de probabilité :
7
o
•
Si X a pour densité de probabilité f alors
à condition que cette intégrale existe.
Cas d'une application mesurable sur un espace de probabilité
o Si X est une application mesurable de (Ω, B, p) dans R, positive ou mesurable,
Estimation
La loi des grands nombres permet de dire que la moyenne empirique de N observations (N
grand) de la variable aléatoire X est une bonne estimation de l'espérance de X.
Caractère central
On considère fréquemment l'espérance comme le centre de la variable aléatoire, c'est-à-dire la
valeur autour de laquelle se dispersent les autres valeurs.
En particulier, si X et 2a - X ont même loi de probabilité, alors E(X) = a.
Ce point de vue est parfois infondé, comme le prouve l'exemple suivant d'une loi
geométrique, une loi particulièrement dissymétrique. L'espérance mathématique du nombre
de tentatives nécessaires pour obtenir un 6 en lançant un dé cubique est égale à 6. Pourtant, la
probabilité que 5 essais ou moins suffisent vaut près de 0,6.
Loi de Dubins et Savage
Mathématiquement, Lester Dubins et Leonard Savage ont démontré en 1956 que la meilleure
façon de jouer dans un jeu où les probabilités sont défavorables au joueur consiste à miser
toujours ce qui permet d'approcher le plus rapidement le but visé. Intuitivement ce résultat
semble évident: si à chaque partie on a plus de chances de perdre que de gagner, autant
minimiser le nombre de parties jouées. Ce résultat signifie également, qu'à moins de disposer
d'une mise de départ infinie, il n'existe pas de stratégies permettant de renverser les
probabilités en votre faveur dans un jeu qui vous est défavorable. Il faut noter que même dans
le cas d'un jeu équitable, le joueur le plus fortuné est favorisé, tout simplement car il a plus de
chances de ruiner son adversaire et donc de l'empêcher de continuer à jouer.
Probabilités
Il existe cependant certains jeux de hasard qui ne sont pas systématiquement défavorables au
joueur. On peut citer par exemple le cas de William Jaggers qui gagna un forte somme à
Monte Carlo au XIXe siècle en étudiant systématiquement les fréquences de sortie des
numéros à la roulette. Il put ainsi déterminer certains numéros qui avaient une probabilité de
sortie qui lui était favorable. Aujourd'hui les casinos se protègent contre ce genre de pratiques
en entretenant soigneusement leur matériel, si bien que les dispersions sont extrêmement
faibles. Ceci signifie que les probabilités de sortie d'un numéro donné sont au mieux très
8
légèrement favorables au joueur. Il faudrait donc parier un nombre immense (souvent pendant
plusieurs mois) de fois des petites sommes pour espérer un gain probablement très loin de
rémunérer les efforts consentis.
Le black jack est un jeu qui possède des stratégies gagnantes : plusieurs techniques de jeu, qui
nécessitent généralement de mémoriser les cartes, permettent de renverser les chances en
faveur du joueur. Le mathématicien Edward Thorp a ainsi publié en 1962 un livre Beat the
Dealer qui fut à l'époque un véritable best-seller. Mais toutes ces méthodes demandent de
longues semaines d'entraînement et sont facilement décelables par le croupier (les brusques
changements de montant des mises sont caractéristiques). Le casino a alors tout loisir d'écarter
de son établissement ces joueurs inopportuns. Le black jack reste pourtant le jeu le moins
défavorable au joueur : l'avantage du casino n'est que de 0,66 % face à un bon joueur, il est de
2,7 % à la roulette et jusqu'à 10 % pour les machines à sous.
Les méthodes miraculeuses
Un certain nombre de revues ou de sites internet prétendent vous renseigner sur la « forme »
des numéros, c'est-à-dire leur probabilité de sortir dans les prochains tirages. Voici par
exemple un tirage de 50 boules de loto: 39, 38, 42, 29, 18, 48, 40, 36, 9, 24, 49, 33, 47, 9, 45,
7, 11, 49, 16, 28, 27, 25, 16, 27, 22, 48, 5, 24, 16, 6, 4, 14, 17, 44, 46, 9, 37, 22, 39, 12, 33, 9,
21, 44, 11, 33, 19, 20, 37, 18. On s'aperçoit que la boule 9 est sortie 4 fois alors que la boule 8
n'est jamais sortie. Suite à des calculs savants, les auteurs de ces « méthodes » vous diront
alors que le chiffre 9 est en forme et qu'il va donc sortir dans les prochains tirages ou au
contraire que la loi des grands nombres implique que le 8 à une probabilité plus forte de sortir
pour combler son retard.
Il s'agit bien entendu là d'une erreur à la limite de l’escroquerie caractérisée. Les boules de
loto ne s'amusent pas à compter le nombre de fois où elles sont sorties de la machine, d'autant
plus qu'il faudrait qu'elles soient suffisamment coquettes pour ne pas prendre en compte les
tirages de tests ou de calibration des machines. Si chaque boule a en moyenne une chance sur
49 de sortir, cette probabilité n'est vraie que pour un nombre infiniment grand de tirages. Le
fait que la boule 9 soit sortie 4 fois de plus que la boule 8 n'a donc aucune importance puisque
les probabilités ne garantissent pas que chaque boule va sortir le même nombre de fois, mais
simplement que la différence du nombre de sorties de deux boules sera très petite par rapport
au nombre total de tirages : rien ne dit que la boule huit va finalement rattraper son retard. Par
exemple, si au bout de dix mille tirages la boule 9 est sortie 206 fois et la boule 8 est sortie
202 fois, on obtiendra une fréquence de 1,01/49 et 0,99/49. Au millionième tirage si la boule
9 est sortie 20410 fois et la boule 8 est sortie 20406 fois on obtiendra respectivement
1,0001/49 et 0,9999/49. Les fréquences s'approchent de plus en plus de la probabilité
théorique de 1/49, pourtant la boule 9 conserve son avance de quatre sorties sur la boule 8.
Il faut noter qu'il existe également d'autres méthodes un peu plus évoluées. L'une d'elles
repose sur les combinaisons les moins jouées. Dans les jeux où le gain dépend du nombre de
joueurs gagnants (Loto...), jouer les combinaisons les moins jouées optimisera les gains.
D'ailleurs si la Française des Jeux publie largement les statistiques sur les numéros tirés, les
statistiques sur les numéros joués sont jalousement gardées. C'est ainsi que certaines
personnes vendent des combinaisons qui seraient statistiquement très rarement utilisées par
les autres joueurs.
9
D'autres reposent sur le pari d'un biais systématique : les tirages ne sont pas exactement
équiprobables, suite par exemple à d'infimes différences de poids des boules. Même si le
calcul de l’espérance mathématique de ce type de martingale est beaucoup plus complexe, le
bon sens indique que si l'auteur de la recette trouve plus rentable de la vendre que de l'utiliser
pour son compte, c'est probablement que son efficacité est à peu près nulle.
Loi des grands nombres :
Essentiellement, la loi des grands nombres indique que lorsque l'on fait un tirage aléatoire
dans une série de grande taille, plus on augmente la taille de l'échantillon plus les
caractéristiques mathématique du tirage (l'échantillon) se rapprochent des caractéristiques
statistiques de la population. Mais il est intéressant de noter que le taille de l'échantillon à
prendre pour approcher les caractéristiques de la population initiale ne dépend que faiblement
voire pas du tout de la taille de la série initiale : pour un sondage au Luxembourg ou aux
États-Unis, il suffit, pour obtenir une précision égale de prendre un échantillon de même
taille.
C'est sur cette loi que reposent la plupart des sondages (en tout cas ceux qui n'utilisent pas
spécifiquement la règle des quotas). Ils interrogent un nombre suffisamment important de
personnes pour connaître l'opinion (probable) de la population entière.
La loi des grands nombres sert aussi en statistique inférentielle, pour deviner une loi de
probabilité à partir d'une série d'expériences.
Les mathématiciens distinguent deux énoncés, appelés respectivement loi faible des grands
nombres et loi forte des grands nombres
1/° Loi faible des grands nombres :
Si l'on considère n variables aléatoires indépendantes qui suivent la même loi de probabilité et
dont l’espérance est E(X), la loi faible des grands nombres stipule que, pour tout réel ε
strictement positif, la probabilité que la moyenne empirique
s'éloigne de l'espérance de plus de ε, tend vers 0 pour les grandes valeurs de n.
Elle se démontre en utilisant l'inégalité de Pafnouti Tchebychev:
10
Et en remarquant que la variable
pour variance
a pour espérance E(X) et
donc
On dit aussi que Yn
converge en probabilité vers E(X)
Loi forte des grands nombres :
La loi forte des grands nombres précise que
converge vers E(X) « presque partout ».
C’est-à-dire que :
Convergence vers une loi de probabilité :
La même loi des grands nombres permet de dire que la répartition de la population de
l'échantillon converge vers la loi de probabilité de X pour n assez grand.
Pour prouver que la fréquence fn(i) de la valeur xi converge vers la probabilité pi, il suffit
d'utiliser la variable aléatoire qui prend la valeur 1 si X(ω) = xi et la valeur 0 sinon.
Cette variable aléatoire a pour espérance pi.
La fréquence fn(i) converge alors en probabilité et aussi presque sûrement, vers pi
Variable aléatoire :
Une variable aléatoire est une fonction dont les valeurs ou les intervalles de valeurs sont
associés à des probabilités. Les variables aléatoires sont très utilisées en théorie des
probabilités et en statistiques. Dans les applications, les variables aléatoires sont utilisées pour
modéliser le résultat d'un mécanisme non déterministe ou encore comme le résultat d'une
expérience non déterministe qui génère un résultat aléatoire.
11
•
La variable aléatoire la plus simple est donnée par le résultat d'un lancé au jet de pile
ou face, qui vaut pile ou face. Un autre exemple simple est donnée par le résultat d'un
jet de dés, pour lequel les valeurs possibles sont 1, 2, 3, 4, 5, 6. De telles variables
aléatoires sont qualifiées de discrètes car elles prennent des valeurs bien séparées. A
contrario, la mesure de la taille d'un individu pris au hasard dans une population
ressemble davantage à un nombre réel positif (cela n'est pas tout à fait vrai non plus,
car des questions ergonomiques rendent d'autant plus improbable l'énoncé d'un
nombre qu'il comporte de décimales significatives; l'attracteur est en fait un fractal).
Cette variable aléatoire est alors qualifiée par convention de continue. L'étude de la
répartition des valeurs prises par une variable aléatoire conduit à la notion de loi de
probabilité.
•
En mathématiques, et plus précisément en théorie des probabilités, une variable
aléatoire est une fonction mesurable définie sur un espace de probabilités. La mesure
image correspondante est appelée loi de la variable aléatoire. Ce type de fonction
permet de modéliser un phénomène aléatoire, comme par exemple le résultat d'un jet
de dés. Une propriété intéressante de l'intégrale de Lebesgue fait qu'un événement de
probabilité strictement nulle n'est pas nécessairement impossible au sens strict du
terme (ainsi, la probabilité qu'un réel tiré au hasard soit un entier est nulle, mais les
entiers n'en existent pas moins dans l'ensemble des réels)
Quelques variables aléatoires
En guise d'introduction aux définitions concernant les variables aléatoires, il semble
intéressant de présenter brièvement une famille de variables très utilisées.
Outre la variable certaine qui prend une valeur donnée avec une probabilité égale à 1, la
variable aléatoire la plus simple est appelée variable de Bernoulli. Celle-ci peut prendre deux
états, qu'il est toujours possible de coder 1 et 0, avec les probabilités p et 1-p. Une
interprétation simple concerne un jeu de dé dans lequel on gagnerait un euro en tirant le six (p
= 1/6). Sur une séquence de parties, la moyenne des gains tend vers p lorsque le nombre de
parties tend vers l'infini.
Si on considère qu'une partie est constituée par n tirages au lieu d'un seul, le total des gains est
une réalisation d'une variable binomiable qui peut prendre toutes les valeurs entières de 0 à n.
Cette variable a pour moyenne le produit np. On obtient un exemple moins futile en
considérant le score d'un candidat dans un sondage électoral.
Si n est assez grand et p pas trop petit, on peut trouver une approximation convenable en
utilisant la variable de Gauss. Dans les sondages cela permet d'associer un intervalle de
confiance au résultat brut. Ainsi, il y a 95 chances sur 100 pour qu'une enquête portant sur
1000 personnes donne un résultat correct à ± 3 % près.
Toujours avec n grand, l'approximation de Poisson est préférable si p est assez petit pour que
la moyenne np ne soit pas trop grande, de l'ordre de quelques unités. Dans un sondage ce
serait la loi applicable aux « petits » candidats. C'est surtout la loi utilisée dans des problèmes
de files d'attente.
12
La somme des carrés de ν variables de Gauss indépendantes est une variable de χ2 à ν degrés
de liberté (la variable exponentielle en est un cas particulier). Le test du χ2 est utilisé pour
apprécier la valeur de l'adéquation d'une loi de probabilité sur une distribution empirique.
Si on divise une variable de Gauss par une variable de χ (racine carrée de la précédente), on
obtient une variable de Student. Le rapport de deux variables de χ2 indépendantes définit une
variable de Snedecor. Ces deux lois sont utilisées dans l'analyse de populations supposées
gaussiennes.
Notions de base :
Fonction de répartition.
Il serait possible d'introduire cette notion à partir de l'une quelconque des variables
précédemment considérées mais il paraît plus clair d'étudier le cas du dé sous un angle
différent. En effet, il définit une variable aléatoire X qui prend avec la même probabilité
d'apparition (1/6) des valeurs dans l'ensemble {1, 2, 3, 4, 5,6}. On peut alors associer à toute
valeur réelle x la probabilité d'obtenir un tirage inférieur à x, ce qui définit une courbe en
escalier dont les marches ont une hauteur égale à 1/6.
Formellement, cela conduit à une fonction de répartition
Dans celle-ci, la majuscule X représente la variable aléatoire, ensemble de valeurs
numériques, et la minuscule x représente la variable d'état, variable au sens usuel du terme.
Si les événements ne sont plus équiprobables, cela ne fait que déformer la courbe. Pour
introduire une notion nouvelle, on peut commencer par remplacer le dé par une roulette à six
numéros, ce qui conduit à un problème rigoureusement identique. Ensuite, on ne change rien
de fondamental si on remplace les six nombres entiers par les repères décentres d'arcs de 60
degrés. À partir de là il est possible d'augmenter le nombre de secteurs en réduisant leur
taille : les échelons deviendront de plus en plus petits jusqu'à être indiscernables sur un dessin.
Le passage à la limite remplace la variable discrète par une variable continue qui prend toutes
les valeurs réelles dans l’intervalle] 0,360] : c'est une variable uniforme.
13
Finalement toute fonction définie et non décroissante entre 0 (l'impossibilité) et 1 (la
certitude) sur l’intervalle]-∞, +∞ [peut être considérée comme fonction de répartition d'une
variable aléatoire.
L'intérêt de la fonction de répartition réside dans le fait qu'elle est valable aussi bien pour les
variables continues définies sur un ensemble continu que pour les variables discrètes définies
sur un ensemble dénombrable (dans la plupart des cas pratiques il se réduit à un ensemble de
valeurs équidistantes que l'on peut ramener à un ensemble d'entiers). Le remplacement
progressif de courbes en escaliers par des courbes continues permet de voir intuitivement
comment une variable continue peut fournir une approximation souvent plus facile à
manipuler que la variable discrète originale.
Malheureusement ces avantages de la fonction de répartition, intéressants pour la visualisation
des phénomènes, disparaissent dès que l'on veut approfondir les problèmes. Dans ce cas, il est
généralement plus commode d'utiliser les notions décrites dans les paragraphes suivants.
Fonction de probabilité d'une variable discrète :
Une variable discrète est décrite tout simplement par l'ensemble de ses probabilités. Si on
suppose qu'elle prend des valeurs entières, cela s'écrit
On reconstruit la fonction de répartition par
Si
alors
qui tend vers 1 lorsque x tend vers l'infini.
14
Densité de probabilité d'une variable continue :
Une variable continue possède en général une fonction de répartition dérivable par morceaux.
Il est alors commode de la dériver pour obtenir la densité de probabilité.
qui est définie et non négative de
à
.
On reconstruit la fonction de répartition par
qui tend vers 1 lorsque x tend vers l'infini.
Dans les raisonnements généraux il est souvent commode d'écrire ces formules sous forme
différentielle :
Si on effectue un changement de variable selon la formule
de probabilité se calcule par
, la nouvelle densité
15
Espérances mathématiques :
Définition
L'espérance mathématique d'une variable aléatoire se définit comme les valeurs prises par
cette variable pondérée par leurs probabilités. Dans le cas d'une variable discrète que l'on
suppose prendre les valeurs entières, elle se définit simplement par
Pour une variable continue, la formule différentielle donnée précédemment s'intègre en
Généralisation
X étant une variable aléatoire, une fonction f supposée régulière définit une nouvelle variable
aléatoire f(X) dont l'espérance s'écrit en remplaçant x par f(x) dans les formules précédentes.
En particulier, il est intéressant de considérer la fonction à valeurs complexes
dont
l'espérance mathématique définit la transformée de Fourier inverse de la densité de
probabilité :
Si la densité de probabilité est une fonction suffisamment régulière, l'exponentielle se
développe en série :
ou :
Les
définissent les moments de la variable aléatoire. S'ils existent, on constate que
celle-ci peut être caractérisée par sa fonction de répartition, sa densité de probabilité (ou sa
fonction de probabilité), sa fonction caractéristique ou la suite de ses moments
16
Moments centrés :
Le moment d'ordre 1,
noté
représente la moyenne, valeur centrale.
En ce qui concerne les moments d'ordre supérieur il est généralement plus commode d'utiliser
les moments centrés :
Le plus utile est la variance, valeur de dispersion :
Pour obtenir une grandeur homogène à la grandeur de base et à la moyenne, on considère
l'écart type σX
Moyenne arithmétique
La moyenne arithmétique est la moyenne ordinaire, c'est-à-dire la somme d'une distribution
d'un caractère statistique quantitatif par le nombre de valeurs.
Sa formulation mathématique peut se faire comme suit:
Médiane.
On appelle médiane d'une variable aléatoire X, un réel m tel que
Dans le cas d'une variable aléatoire discrète, cette définition est peu intéressante car elle
permet l'existence de plusieurs médianes
si X est le numéro apparaissant sur la face supérieure d'un dé à 6 faces parfaitement
équilibré, pour tout réel m strictement compris entre 3 et 4, on a :
ou bien l'existence d'une médiane qui ne donne pas une probabilité de 0,5
Si X est la somme obtenue en lançant deux dés à 6 faces parfaitement équilibré. X ne
possède qu'une seule médiane 7 mais
17
Dans le cas d'une variable continue, dont la fonction de répartition est strictement croissante,
la définition est équivalente à la suivante :
m est la médiane de X ssi
Le fait que la fonction de répartition soit une fonction continue, strictement croissante, à
valeurs dans [0 ; 1] assure l'existence et l'unicité de la médiane.
Écart type :
En statistique élémentaire,
L'écart type (ou déviation standard) est un critère de dispersion. Il mesure l'écart à la
moyenne observée (et non à la moyenne théorique) et correspond à la moyenne quadratique
des écarts entre les valeurs observées et la moyenne de ces valeurs observées. Il se note avec
la lettre de l'alphabet grec, σ (sigma minuscule).
Formules : on trouve les formules suivantes
dans le cas d'une série discrète
•
non regroupée.
dans le cas d'une série
•
discrète regroupée.
dans le cas d'une série
•
continue.
Où xi sont les valeurs du caractère, ni les effectifs, fi les fréquences, mi les milieux des classes
et la moyenne
En probabilité,
L'écart type mesure la dispersion d'une variable aléatoire autour de son espérance E(X). Il se
calcule sous plusieurs formes
•
si la variable aléatoire est discrète.
18
lorsque la variable
•
aléatoire est continue de densité de probabilité f.
En théorie des sondages,
Lorsqu'il s'agit d'estimer la dispersion autour de la moyenne d'un caractère statistique dans
une population de grande taille à partir d'un échantillon de taille n, on utilise pour l'écart type
la valeur suivante
.
On peut remarquer que
Pourquoi n-1 ?
La question que l'on se pose généralement est « Pourquoi n - 1 ? ». La raison pour laquelle on
divise par n - 1 au lieu de n est un bel exemple de l'interaction permanente entre les
statistiques et les probabilités.
Le sondage de n individus correspond à une série de n variables aléatoires xi
indépendante d’espérance E (X) et de variance V (X).
La moyenne de l'échantillon est une variable aléatoire d'espérance E(X) et de
variance
(la moyenne de n variables aléatoires fluctue moins qu'une seule
variable aléatoire).
La variance v de l'échantillon est une variable aléatoire dont on veut calculer
l'espérance.
.
est une variable aléatoire d'espérance
E(X)2 + V(X).
est une variable aléatoire d'espérance E(X)2 + V(X).
est une variable aléatoire d'espérance
.
donc égale à
19
Donc
.
La variance v de l'échantillon fluctue donc autour de
V(X) comme on aurait pu s'y attendre.
et non autour de
Pour obtenir une estimation de V(X), il est donc nécessaire de prendre
Et pour obtenir une estimation de l'écart type σ(X), il est nécessaire de
prendre
.
.
Aspect qualitatif
Plus communément appelée ECART-TYPE, la déviation standard caractérise la largeur de
la distribution. Elle est exprimée mathématiquement comme étant la racine carrée de la
variance, celle-ci mesurant la distribution des valeurs autour du centre de la courbe.
Écart-type (S) = Racine carrée de la variance
•
L'écart-type est la mesure de dispersion, ou étalement, la plus couramment utilisée en
statistique lorsqu'on emploie la moyenne pour calculer une tendance centrale. Il
mesure donc la dispersion autour de la moyenne. En raison de ses liens étroits avec la
moyenne, l'écart-type peut être grandement influencé si cette dernière donne une
mauvaise mesure de tendance centrale.
•
Contrairement à l'étendue et aux quartiles, la variance permet de combiner toutes les
valeurs à l'intérieur d'un ensemble de données afin d'obtenir la mesure de dispersion.
La variance (symbolisée par S2) et l'écart-type (la racine carré de la variance,
symbolisée par S) sont les mesures de dispersion les plus couramment utilisées.
La variance est définie comme étant la moyenne arithmétique des carrés des différences entre
les valeurs observées et la moyenne. C'est une mesure du degré de dispersion d'un ensemble
de données. On la calcule sous la forme de l'écart au carré moyen de chaque nombre par
rapport à la moyenne d'un ensemble de données.
Répartition de la population,
Lorsque la variable étudiée est gaussienne (répartition selon une courbe en cloche), l'écarttype permet de déterminer la répartition de la population autour de la valeur moyenne.
Par exemple : Si par convention, la déviation standard par rapport à un échantillon équivaut à
15 points de QI de différence, cela signifie que les 2/3 environ de la population d'une classe
d'âge ont un QI compris entre 85 et 115 --> Voir QI et intervalle de confiance
20
Interprétation d'un écart type élevé,
Généralement, plus les valeurs sont largement distribuées, plus l'écart-type est élevé.
Imaginez, par exemple, que nous devons séparer deux ensembles différents de résultats
d'examens de 30 élèves; les notes du premier examen varient de 31 % à 98 % et celles du
second, de 82 % à 93 %. Compte tenu de ces étendues, l'écart-type serait plus grand pour les
résultats du premier examen.
Cependant, il n'est pas toujours facile d'évaluer l'importance que doit avoir l'écart-type pour
que les données soient largement dispersées.
L'importance de l'écart-type dépend aussi de l'importance de la valeur moyenne de l'ensemble
des données. Lorsque vous mesurez quelque chose en millions, le fait d'avoir des mesures qui
se rapprochent de la valeur moyenne n'a pas la même signification que si vous mesurez le
poids de deux personnes.
Par exemple, si après avoir mesuré les recettes annuelles de deux grandes entreprises, vous
constatez un écart de 100 000 euros, la différence est considérée comme étant peu
significative, alors que si vous mesurez le poids de deux personnes, dont l'écart est de 30
kilogrammes, la différence est considérée comme étant très significative.
Voilà pourquoi il est parfois utile de travailler, dans certains cas, sur l’écart type relatif (écarttype quotité par la moyenne).
Ecart type relatif,
Pour comparer deux séries statistiques qui n'ont pas le même ordre de grandeur, il est parfois
bon de comparer l'écart type et la moyenne en en faisant le quotient, on obtient alors l'écart
type relatif
Variance,
On nomme variance le carré de l'écart type : V(X) = σ2
La formule de l'écart type peut se révéler compliquée. On a donc défini la variance. La
variance V est le carré de l'écart type.
dans le cas d'une série discrète non triée.
•
dans le cas d'une série discrète
•
regroupée.
•
dans le cas d'une série continue.
La disparition des racines carrées permet des calculs plus simples. On démontre que la
variance peut se calculer plus simplement par les formules suivantes:
21
dans le cas d'une série discrète non triée.
•
dans le cas d'une série discrète
•
regroupée.
•
dans le cas d'une série continue.

Documents pareils