L`inégalité de Tchebychev
Transcription
L`inégalité de Tchebychev
Préparation au CAPES Strasbourg, février 2007 Inégalité de Tchebychev Un complément pour les leçons sur les variables aléatoires et le schéma de Bernouilli On se place ici dans un espace probabilisé (Ω, T , P ) où l’univers Ω est fini et la tribu T est l’ensemble des parties P(Ω) de Ω. Par conséquent toute variable aléatoire sur Ω admet une espérance et une variance. 1. Une inégalité théorique L’inégalité de Tchebychev (voir [FF] page 90) donne un moyen d’évaluer la distance entre les valeurs prises par une variable aléatoire X et son espérance. Plus précisément elle donne une majoration de la probabilité que l’écart soit grand. Lemme 1. Soit Y une variable aléatoire positive définie sur un espace probabilisé (Ω, T , P ). On note E(Y ) l’espérance de Y . Alors, pour tout a > 0 E(Y ) . P Y >a 6 a Démonstration. Bien que ce résultat soit vrai dans un cadre plus général nous nous contenterons d’en donner une démonstration dans le cas où Ω est fini. Notons (yi )i=1,...,N l’ensemble (fini) des valeurs prises par la variable Y . On peut alors écrire X P Y >a = P Y = yi . i∈{1,...,N }yi >a Et en utilisant l’inégalité 0 < a 6 yi on obtient X aP Y > a 6 yi P (Y = yi ) . i∈{1,...,N } yi >a Comme, par hypothèse, Y ne prend que des valeurs positives, cette dernière expression est inférieure ou égale à X yi P (Y = yi ) , i∈{1,...,N } qui est, par définition, l’espérance de Y . Théorème 2 (Inégalité de Tchebychev). Soit X une variable aléatoire définie sur un espace probabilisé (Ω, T , P ) et qui admet une espérance E(X) et une variance V (X). Alors pour tout a>0 V (X) . P |X − E(X)| > a 6 a2 Démonstration. Il suffit d’appliquer le lemme 1 à la variable aléatoire Y = (X − E(X))2 en remarquant que {|X − E(X)| > a} = {(X − E(X))2 > a2 } et que par définition 2 = V (X) . E(Y ) = E X − E(X) 2 Nicole Bopp 2. Cas d’un schéma de Bernouilli e n où Ω e est un ensemble à 2.1. Rappels. Dans ce modèle1, on prend pour Ω l’espace produit Ω e deux éléments notés S (pour succès) et E (pour échec). Sur Ω une probabilité Pe est déterminée par la donnée de Pe({S}) = p ∈ [0, 1] . e Pe) est appelé épreuve de Bernouilli de paramètre p. L’espace probabilisé (Ω, On choisit sur Ω la probabilité Pn définie comme le produit des probabilités Pe c’est-à-dire Pn ({(x1 , . . . , xn )}) = n Y i=1 Pe({xi }) où xi ∈ {S, E} . L’espace probabilisé (Ω, Pn ) est appelé schéma de Bernouilli de paramètres (n, p). On note (Xi )i=1,...,n les variables aléatoire définies par Xi : Ω −→ {0, 1} ( 1 si xi = S , (x1 , . . . , xn ) 7−→ 0 si xi = E . On démontre qu’elles sont indépendantes (c’est-à-dire mutuellement indépendantes) et que pour i = 1, . . . , n on a E(Xi ) = p et V (Xi ) = p(1 − p) . La variable aléatoire qui nous intéresse est la variable Sn = X1 + X2 + · · · + Xn . Proposition. La loi de la variable Sn est une loi binomiale de paramètre (n, p) c’est-à-dire n k Pn Sn = k = p (1 − p)n−k pour k = 0, . . . , n . k On a de plus E(Sn ) = np et V (Sn ) = np(1 − p) . Rappelons que l’espérance estPlinéaire d’où la formule pour E(Sn ) mais que la variance ne l’est pas. On obtient V (Sn ) = V (Xi ) car les variables Xi étant mutuellement indépendantes sont a fortiori deux à deux indépendantes. 2.2. Le résultat. Appliquons l’inégalité de Tchebychev à la variable aléatoire X = Sn , en prenant a = nb avec b > 0. D’une part on a X + X + · · · + X 1 2 n − p > b . Pn |Sn − E(Sn )| > nb = Pn n D’autre part, par la proposition rappelée ci-dessus, V (Sn ) = np(1 − p) . On en déduit le 1Pour une justification de l’introduction de la probabilité P voir le paragraphe « Probabilités définies par n des probabilités conditionnelles » de [FF] page 56. Inégalité de Tchebychev 3 Corollaire 3. Soient (Xj )j=1,...,n les variables aléatoires définies au paragraphe 2.1. Alors pour tout b > 0 on a p(1 − p) X + X + · · · + X 1 2 n − p > b 6 . Pn n nb2 3. Application au problème du chevalier de Méré La question posée : A-t-on plus (ou moins) d’une chance sur deux d’obtenir au moins un 6 en lançant 4 dés ? 3.1. Modélisation d’un lancer de 4 dés. On fait l’hypothèse que lancer 4 dés revient à lancer successivement 4 fois un dé et que ces lancers successifs sont mutuellement indépendants. Il est donc raisonnable de modéliser cette expérience aléatoire par un schéma de Bernouilli 1 de paramètre (4, ). 6 En effet l’univers de l’expérience est {6, 6}4 où {6} est le succès « apparition d’un 6 » et {6} est l’échec « apparition d’une des autres faces du dé ». On a évidemment fait l’hypothèse que le dé n’est pas pipé c’est-à-dire que la probabilité d’apparition d’un 6 en lançant un dé est 1 égale à . 6 Il est facile maintenant de calculer la probabilité de l’évènement « aucun 6 n’est apparu » car cette probabilité est égale (avec les notations ci-dessus) à P4 (X1 + X2 + X3 + X4 = 0). La proposition implique que 1 4 5 4 P4 (X1 + X2 + X3 + X4 = 0) = 1 − = ∈]0, 48 ; 0, 49[ . 6 6 5 4 La probabilité d’apparition d’au moins un 6 est donc égale à 1 − . 6 Les calculs faits dans le modèle choisi permettent par conséquent de conclure que la probabilité 1 d’apparition d’au moins un 6 lors du lancer de 4 dés est supérieure à . 2 3.2. Simulation. Pour vérifier que la modélisation choisie correspond bien à l’expérience, on peut lancer 4 dés, noter s’il apparaı̂t au moins un 6 et recommencer. C’est ce que faisait le chevalier de Méré. Comme nous n’avons pas l’intention, d’y consacrer autant de temps que lui, on peut utiliser un programme ou un tableur pour simuler ces lancers. On déterminera la fréquence d’apparition d’au moins un 6 lors de n lancers de 4 dés. Bien entendu, pour que cela présente un intérêt, il faut faire confiance au générateur aléatoire de nombres de sa machine et admettre que ce générateur est capable de faire apparaı̂tre chaque entier appartenant à {1, . . . , 6} avec la même probabilité (il n’est déjà pas facile de donner un sens précis à cela). Combien faut-il simuler de lancers de 4 dés pour avoir une chance raisonnable que la fréquence 1 obtenue soit supérieure à ? 2 3.3. Utilisation de l’inégalité de Tchebychev. En utilisant 3.1, on peut considèrer un 5 4 . lancer de 4 dés comme une épreuve de Bernouilli de paramètre 1 − 6 La simulation consiste en une suite de n épreuves de Bernouilli. On les suppose indépendantes 5 4 pour les modéliser par un schéma de Bernouilli de paramètre (n, 1 − ). 6 4 Nicole Bopp Le nombre de succès lors de la répétition de n épreuves de Bernouilli est compté par la variable aléatoire Sn (avec les notations du paragraphe 2). Pour préciser le résultat du 5 4 on calcule corollaire 3 dans le cas où p = 1 − 6 5 4 5 4 419375 = ∈]0, 24 ; 0, 25[ p(1 − p) = 1 − 6 6 1679616 et 23 1 5 4 1 = ∈]0, 01 ; 0, 02[ . p− −= − 2 2 6 1296 On a alors X1 + X2 + · · · + Xn 1 X1 + X2 + · · · + Xn 1 < =⇒ p − > p − > 0, 01 n 2 n 2 X + X + · · · + X 1 2 n =⇒ − p > 0, 01 . n En appliquant le corollaire 3 avec b = 0, 01 on obtient 104 p(1 − p) X + X + · · · + X 0, 25 × 104 1 2 n − p > 0, 01 6 6 , Pn n n n d’où X + X + · · · + X 1 104 1 2 n Pn 6 < . n 2 4n Sn . La fréquence d’apparition d’au moins un 6 lors de n tirages de 4 dés est donnée par n 1 Sn est inférieur à » soit faible, par exemple inférieure à 5%, Pour que la probabilité que « n 2 il suffit de faire n tirages avec 104 5 6 . 4n 100 Il suffit ( !) donc de faire 50 000 tirages pour obtenir, avec une probabilité supérieure à 95%, 1 une fréquence supérieure à . 2 Références [E] J. Escoffier (2006), Probabilités et statistiques pour le CAPES et l’agrégation interne, Ellipses. [FF] D. Foata & A. Fuchs (1996), Calcul des probabilités, Masson.