Format pdf

Transcription

Format pdf
Enseignement des statistiques et
des probabilités en LP dan le
cadre du nouveau programme
Bac pro 3 ans
30.0%
25.0%
20.0%
1
5.0%
1
0.0%
5.0%
0.0%
1
3
5
7
9
1
1
1
3
1
5
1
7
1
9
21
23
25
Rappel des objectifs du stage…
Objectif :
- Mettre en œuvre les nouveaux programmes.
- Savoir utiliser un tableur pour : traiter, résoudre, représenter,
simuler des expériences aléatoires et illustrer les lois de probabilités.
Contenu :
- Apports théoriques sur les probabilités : vocabulaire probabiliste,
variables aléatoires, lois de probabilités, fluctuation d’échantillonnage
- Etude et réflexion sur des cas concrets.
- Utilisation de tableur comme outil privilégié de traitement des
problèmes liés au hasard.
Les objectifs principaux
seconde
Première
terminale
- exploiter des données ;
- apprendre à identifier, classer, hiérarchiser l'information ;
- interpréter un résultat statistique ;
- gérer des situations simples relevant des probabilités.
Le calcul d’indicateurs, la construction de graphiques et la simulation
d’expériences aléatoires à l’aide des TIC sont indispensables et constituent
une obligation de formation.
Classe de seconde
Statistique à une variable
L’objectif de ce module est de consolider les acquis du collège en s’appuyant sur des
exemples (…) L'utilisation des TIC est nécessaire.
Classe de première
Statistique à une variable
Réactiver les capacités et connaissances de seconde professionnelle en statistique et les
compléter par les notions d’écart type et d’écart interquartile. (…).
L’usage des TIC est nécessaire pour les calculs des indicateurs et les graphiques.
Classe de terminale
Statistique à deux variables
Etudier un lien éventuel entre deux caractères d’une même population et,
lorsqu’il
est pertinent, de déterminer une équation de droite d’ajustement;
Représentations graphiques.
TP n° 0 : Représentations graphiques.
25000 lancers
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
9
10
5
10
15
20
25
30
35
11
Simulation PILE OU FACE
0.515
0.51
0.505
0.5
0.495
0.49
0.485
0.48
0.475
0.47
0.465
0.6
0.5
0.4
0.3
FACE
0.53
0.2
0.1
PILE
0.47
PILE
0.524
FACE
0.476
PILE
0.486
FACE
0.514
0
1
2
3
4
6
CD artisanalement piratés
CD
industriellement
1 5, 25%
1 3, 53%
5
71, 2%
C
D non pi tatés
7
8
100 s im ulations
250 s im ulations
1000 s im ulations
40
Boîte à moustaches.
Une boîte à moustaches (ou boîte de distribution ou boîte à pattes) est une
représentation graphique d’une variable numérique. Elle peut être considérée
comme une vue aérienne des principales caractéristiques de la distribution d’un.
ou de plusieurs échantillons.
90
Maximum
80
Troisième quartile 70
Moyenne
60
59
Médiane
50
Le premier quartile 40
Minimum
30
1
Exemple d’activité
Comment sont calculer les quartiles?
Un pépiniériste veut établir les prix de vente auprès d’une grande enseigne de
jardinerie. Il constitue un échantillon de 40 arbuste de la même espèce.
Le prix est fonction de la taille de l’arbuste. Il les range par taille croissante :
0,80; 0,80; 0,85; 0,85; 0,85; 0,90;0,90;0,95;1,00;1,00;1,05;1,05;1,10;1,15
1,15; 1,15; 1,20; 1,20; 1,20; 1,20;1,20;1,25; 1,25; 1,25; 1,25; 1,25; 1,25;1,30
1,30; 1,30 ; 1,35 ; 1,35 ; 1,35 ; 1,40 ; 1,40 ; 1,40 ; 1,40 ; 1,45; 1,45 ; 1,45 ;
1,50
1.Calculer l’étendue de la série (écart entre la + grande et la plus + arbuste)
2. Répartir la série en 4 groupes de même effectifs en suivant un ordre croissant.
3.Quelle est la valeur Q1 du 1er quartile (taille du plus grand arbuste du 1er groupe) ?
4.Quelle est le pourcentage d’arbustes mesurant moins que Q1 ?
5.Quelle est la valeur Q3 du 3ème quartile (taille du plus grand arbuste du 3 èmegroupe) ?
Boîte à moustaches et paramètres de position
-La boîte à moustache utilisent principalement cinq valeurs :
Q1 Q2 Q3 Max
Min
1.80
1.75
1.70
1.65
1.60
1.55
1.50
1.45
1.40
1.35
1.30
1.25
1.20
1.15
1.10
1.05
1.00
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
0.45
0.40
MAX
3ème quartile
médiane
moyenne
1er quartile
MIN
Bien que la distribution soit partagée en quatre zones de même effectif
1
les plages des valeurs des tailles ne sont
pas égales.
Avec Sine qua non.
-On considère une série de 9 valeurs : 1 , 3, 4 , 5 , 6 , 7 , 9 , 10 , 15
Déterminer une valeur médiane, les valeurs des premier et troisième quartiles, et
l'étendue de cette série statistique. Également la moyenne , l’écart type ….
avec Sine qua non
y
6
5
4
3
2
1
-4.5 -3 -1.5 0
-1
-2
1.5
D1
3
4.5 6
7.5
Q1
Med
9 10.5 12 13.5 15 16.5 18 x
Q3
D9
Sous Excel.
Poids
Parameters de positions et de
dispersions
Q1
QUARTILE(taille;1)
Min
MIN (taille)
Médiane
MEDIANE (taille)
Moyenne
MOYENNE (taille)
Max
MAX(taille)
Q3
QUARTILE(taille;3)
Effet placebo
Cinquante malades ayant tous des problèmes d’hypertension artérielle sont
répartis en deux groupes.
- Un groupe est traité avec un nouveau médicament sensé abaisser la tension
- l’autre groupe est traité avec un produit placebo
Les résultats après traitement sont dans le fichier (effet placebo.xls)
1) Le médicament administré au groupe 1 a-t-il eu un effet ?
2) Quel est le pourcentage de malades du groupe1 (resp groupe2) dont on est
sûr que la tension est inférieur à 14 ?
3) Ce médicament est-il efficace ?
Comparer deux série statistiques .
La répartition par sexe et par âge des salariés d’une entreprise est le suivant :
Ages
Homme
Femme
]20 ; 30 [
30
50
]30 ; 40[
70
80
]40 ; 50[
50
70
]50 ; 60[
10
40
Quels renseignements peut-on tirer de la comparaison de ces deux séries statistiques?
y
0
y
Homme
10
20
Femme
Pourcentage
40%
Pourcentage
60%
moyenne
37,5
moyenne
39,17
Ecat type
8,29
Ecat type
9,90
étendue
40
étendue
40
30
40
50
D1 Q1 Med Q3 D9
60
70
80
x 0
10
20
30
40
50
60
D1 Q1 Med Q3 D9
70
- Les hommes sont en moyenne plus jeunes que les femmes
- Les âges des hommes sont plus resserrés autour de la moyenne
- Les âges des femmes sont mieux réparties sur son étendue
- La moyenne des âges des hommes est plus représentative que la moyenne des
âges des femmes
80
x
TP n° 4 : Ajustement affine .
Le tableau ci-dessous fournit, pour la France, la vitesse moyenne des
véhicules légers, ainsi que le nombre de morts sur les routes (1986-2006)
Année
Vitesse moyenne des
véhicules légers (km/h)
Nombre de morts
1998
88,7
8 437
1999
88,6
8 029
2000
90,1
7 643
2001
89,4
7 720
2002
89,2
7 242
2003
86,8
5 731
2004
84,5
5 593
2005
82,9
5 318
2006
82
4 703
(Source www.securiteroutiere.gouv.fr).
Résolution avec un tableur….
Les deux graphiques sont très semblables, avec une tendance générale à la baisse
Ce qui conduit à l’idée d’une corrélation entre la vitesse et le nombre de morts
ajustement affine du nuage
La droite indique la « tendance » du nuage :
lorsque la vitesse augmente, le nombre de morts à tendance à augmenter.
y = 485.97x + 4283.1
Résolution avec Sine qua non
Le nuage de points est ajusté par une droite de régression par la méthode des
moindres carrés. Ceci n’est possible évidemment que si le tableau comporte
au moins 2 points différents !
Résolution avec Sine qua non
Avec Sine qua non, on peut faire afficher le point moyen
y
2400
2200
2000
1800
1600
1400
1200
1000
800
600
400
200
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 x
Probabilité dans le nouveau
programme..
seconde
Introduire la notion des fluctuations d’échantillonnage par le biais de
l’expérimentation (lancers de pièces, de dés, ou tirages dans une urne…), puis par
simulation à l’aide du générateur de nombres aléatoires, d’un tableur …
Première
Reprendre et approfondir l’étude des fluctuations d’échantillonnage menée en
seconde en quantifiant la variabilité et préparer le calcul des probabilités en ter.
Terminale
En terminale, la notion de probabilité est introduite en s’appuyant sur
l’observation de la fluctuation d’échantillonnage d’une fréquence et sur la
relative stabilité de cette fréquence lorsque l’expérience est répétée un grand
nombre de fois.
En 3ème DP6
B.O. 19 Avril 2007
Classe de seconde bac pro
Fluctuations d’une fréquence selon les échantillons, notion de
probabilité, approche fréquentiste des probabilités.
Classe de première bac pro
Consolider et d’approfondir l’étude, initiée en seconde professionnelle, de la
variabilité lors d’une prise d’échantillon, pour favoriser la prise de décision
dans un conteste aléatoire.
Classe de terminale bac pro
La notion de probabilité est introduite en s’appuyant sur l’observation de la
fluctuation d’échantillonnage d’une fréquence
Entrainer les élèves à décrire quelques expériences aléatoires simples
, et à calculer des probabilités. Tout développement théorique est exclu.
Simulation d’une expérience aléatoire
Comment simuler un lancer de pièce, un lancer de dé ???
La fonction ALEA() sur un tableur ou RND sur une calculatrice permettent de
générer des nombres aléatoires (suivant la loi uniforme…)
Attention, la fonction alea() est dite volatile !
Activer la touche F9
Sous Excel : menu Outils Options, dans l’onglet « calcul » cocher « sur ordre »
Simulation d’une expérience aléatoire
Pour simuler un nombre aléatoire selon une loi uniforme
- ALEA() (générateur de nombres aléatoires entre 0 et 1)
- ALEA() + 0.8 donne un nombre entre 0,8 et 1,8
- ENT(ALEA() + 0.8) donne
0 avec une fréquence de 20%
Pour simuler un lancer de pièce on peut utiliser ENT(ALEA()+0,5)
On peut ensuite coder les 0 et les 1 par :
SI((A1=1); "pile"; "face")
Simulation d’une expérience aléatoire
Pour simuler un tirage de boules dans une urne, il suffit de connaître la proportion p des
boules « rouges »
=ENT(ALEA()+p)
Urne
Simulation d’une expérience aléatoire
Pour simuler un lancer de dé équilibrer, on utilisera la fonction :
ENT(ALEA()*6)+1
qui retourne un entier (ici entre 1 et 6)
On peut aussi utiliser la fonction
ALEA.ENTRE.BORNES(1;6))
après avoir coché l’option « utilitaire d’analyse » dans le menu Outils puis Macro
complémentaires…
TP n° 1 : LANCER D’UNE PIECE
TP n° 1 : Fluctuation des fréquences
Simulons 200 échantillons de taille 50 et remarquons qu’environ plus de 95% des
fréquences observées se situent dans l’intervalle [ p −
1
n
,p+
1
n
]
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
20
40
60
80
100
120
LANCER D’UNE PIECE
TP n° 1 : stabilisation des fréquences
Simulons trois échantillons de taille 100, 250 «et 1000 et remarquons la
stabilisation
des
fréquences quand la taille de l’échantillon croît.
Simulation PILE OU FACE
0.6
0.5
0.4
0.3
0.2
0.1
0
PILE
0.47
PILE
0.524
FACE
0.53
100 sim ulations
Exemple
FACE
0.476
250 sim ulations
http://www-sop.inria.fr/mefisto/java/tutorial1/node8.html#SECTION00031020000000000000
PILE
0.486
FACE
0.514
1000 sim ulations
Infographie
On peut également visualiser sous forme d’histogramme ou BAM
0.5
0.50
0.50
0.45
0.45
0.45
0.40
0.40
0.35
0.35
0.30
0.30
0.25
0.25
0.20
0.20
0.4
0.35
0.3
0.25
0.2
0.15
0.15
0.15
0.10
0.10
0.1
20
40
60
80
100
0.13
0.00
0.00
0
0.17
0.05
0.05
0.05
0.20
0
50
simuler avec la touche F9….
100
150
200
Tail e30
Répartition des fréquences
Le programme suivant calcule 500 nombres selon une loi normale.
Il simule aussi les répartitions dans les intervalles
[m - s , m - s], [m - 2s , m - 2s] et [m - 3s , m - 3s].
[m - s , m + s]
[m - 2s , m + 2s]
[m - 3s , m + 3s]
434
610
646
Simulation
66.26%
93.13%
98.63%
Théorie
68.27%
95.45%
99.73%
88.04707
0
1
1
89.23014
0
1
1
96.67043
1
1
1
100.7929
1
1
1
88.19658
0
1
1
93.56121
1
1
1
114.4339
0
1
1
100.3341
1
1
1
101.1911
1
1
1
simuler avec la touche F9….
Lancer d’un dé équilibrer
TP n° 2 : Lancer d’un dé équilibrer
Simulons 1000 échantillons de taille 25 et remarquons que les fréquences se
stabilise et tendent une valeur limite
5000 lancers
•
0.2
0.15
0.1
0.05
0
1
2
3
4
5
6
Les élèves peuvent facilement manipuler un dé puis les résultats de l’ensemble seront
Centralisés dans un tableau (rapidement on a une approche de la probabilité
Lancer d’un dé non équilibrer
TP n° 3 : Lancer d’un dé non équilibrer
Simulons un échantillons de taille 1000 et remarquons les fréquences se stabilisent
7
6
0.50
5
0.40
4
0.30
3
2
0.20
1
0.10
0
0
50
100
150
200
250
0.00
1
2
3
4
5
6
Jeu de Craps
Le Craps est un jeu d’argent Américain qui se jeu avec deux dés à six faces
Les paris portent sur les combinaisons successives obtenus avec la somme
desle lanceur perd s’il fait un Craps.
faces des deux dés. Au premier lancer,
Un Craps désigne un total des points des 2 faces dont il n’existe qu’une
Manière de les obtenir : 2(1 + 1) ou 3(2 + 1) ou 12(6 + 6)
Peut-on prévoir que le plus difficile à obtenir est le 12 ?
25000 lancers
0.25
0.2
0.15
0.1
0.05
0
21
32
43
54
65
76
87
89
9
10
10
11
11
12
Le juge et statisticien
En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida était
condamné à huit ans de prison. Il attaqua ce jugement au motif que la
désignation des jurés de ce comté était discriminante à l’égard des Américains
d’origine mexicaine. Alors que 79,1% de la population de ce comté était
d’origine mexicaine, sur les 870 personnes convoqués pour être jurés lors d’une
certaine période de référence, il n’y eut que 339 personnes d’origine mexicaine.
1. Quelle est la fréquence des jurés d’origine mexicaine dans ce comté ?
2. Simuler sur un tableur un échantillons de taille n = 870 dans une population
où la fréquence des habitants d’origine mexicaine est p = 0,791.
Le juge et le statisticien
339
= 0,39
La fréquence observée des jurés d’origine mexicaine est
870
On a [0,791 –
0,82]. 0.85
1
;
870
0,791 +
1
870 ]
c’est-à-dire environ [0,76 ;
0.84
0.83
0.82
0.81
0.80
0.79
0.78
0.77
0.76
0.75
0.74
0.73
0.72
0.71
0.70
0
20
40
60
80
100
120
140
4 points sont en dehors de l’intervalle précédent, soit 4 % des cas.
La fréquence observée 0,39 est très loin des valeurs obtenues sur les simulations.
Devenez sourcier, devenez savant
TP n° 7 : d’après G. Charpak et H. Broch
Un sourcier prétend posséder des pouvoirs, lui permettant de détecter la
présence d’eau à l’aide d’une baguette en bois. On met en place un
dispositif permettant de tester les prétendus pouvoirs du sourcier. Cinq.
canalisations sont masquées dont une seule contient (aléatoirement) de
l’eau. Le sourcier doit désigner la canalisation contenant de l’eau.
E répondant au hasard,
Est-il rare, d’obtenir au moins 25% de bonnes réponses?
Peut-on, d’obtenir 40% de bonnes réponses?
Si, oui, est-ce rare ?
Contrôle de fabrication
TP n° 4 : contrôle de fabrication
Une usine de la région rouennaise fabrique des billes métalliques de
diamètre nominal 0,8 cm . Une étude statistique sur un échantillon montre
que les erreurs de diamètres ont une moyenne nulle et un écart 0,001 par
rapport à cette moyenne.
Lors du contrôle sont soumis à rebut toutes les billes qui passent dans une
bague de diamètre 0,812 cm.
Quelle est la probabilité qu'une bille prise au hasard soit rejetée ?
Contrôle de fabrication
TP n° 4 : contrôle de fabrication
0.100
Tailles
Pièces accéptées
Fréquences
0.080
100
3
0.030
500
15
0.030
1000
34
0.034
2000
81
0.041
3000
128
0.043
5000
211
0.042
10000
415
0.042
0.060
0.040
0.020
0.000
1
2
3
4
5
6
7
Feux de circulations
TP n° 5 : Feu tricolore
Un boulevard contient 10 intersections, dans chaque intersection se
trouve un feu de circulation. Les habitants sont courtois, ils s'arrêtent
lorsque le feu est jaune, comme s'il est rouge.
Un ingénieur civil a évalué que lorsque un véhicule arrive à une
Un ingénieur civil a évalué que lorsque un véhicule arrive à une
intersection, la probabilité que le feu soit rouge est 1/3 et la probabilité
que le feu soit vert est 2/3.
Quelle est la probabilité qu'un véhicule s'arrête au 10ème feu ?
Réussir un concours par hasard
TP n° 6 : Questions aux choix multiples (QCM)
Un concours d'entrée dans une administration consiste à une série de 4
questions indépendantes comptant chacune pour le même nombre de
points. A chaque question, quatre réponses sont proposées dont une seule
est exacte.
Quelle est ma chance de cocher plus de la moitié des questions si je répond
au hasard ?
Notion de probabilité
Définition Soit une expérience aléatoire et Ω l’univers associé.
A chaque événement A, on fait correspondre un nombre réel P(A) appelé
probabilité de A :
0 ≤ P( A) ≤ 1
P(φ ) = 0
P (Ω ) = 1
Pour deux événements quelconque : P( A ∪ B) = P( A) + P( B) − P( A ∩ B)
Si deux événements sont incompatibles, alors :
P( A ∪ B) = P( A) + P( B)
Si deux événements sont indépendants :
P( A ∩ B) = P( A) × P( B)
La probabilité p(A) de l’événement A est donnée par la relation :
P( A) =
Où card (A) est d’éléments de A
card ( A)
card (Ω )
Au programme
Connaissance
A∩ A = φ
A
et
A
et
A∪ A = Ω
Événements contraires
A∩ B = φ
A
et
B
Exemple
A∩ A
Tirer une carte rouge et noire
A∪ A
Tirer une carte rouge ou noire
A∩ B
Tirer une carte noire et un cœur
sont incompatibles
A∪ B
Tirer une carte noire ou un cœur
A∩ B = φ
A et B
A∩ B
Tirer une carte noire et un pique
sont incompatibles
A∪ B
Tirer une carte noire ou un pique
Calculs
P( A ∩ A) = P(φ ) = 0
P( A ∪ A) = P(Ω ) = 1
P( A ∩ B) = P(φ ) = 0
P( A ∪ B) = P( A) + P( B) − P( A ∩ B)
16
8
+
−0
32 32
P( A ∩ B) = P( B) =
8
32
P( A ∪ B) = P( A) + P( B) − P( A ∩ B)
16
8
8
+
−
32 32 32
Défauts d’un appareil
TP probabilité
Exercice
3ème année
Un appareil peut-être défectueux à cause de deux, désignés par A et B.
Dans un lot de 1000 appareils, on a constaté que :
- 100 appareils présentaient le défaut A (peut-être le défaut B),
- 80 appareils présentaient le défaut B (peut-être le défaut A)
- 40 appareils présentaient simultanément les deux défauts A et B.
Un client achète un des appareils produits.
1. Calculer la probabilité p A pour que cet appareil ne présente que le défaut A
2. Calculer la probabilité p B pour que cet appareil ne présente que le défaut B
Défauts d’un appareil
réponse
B
A
40
A
80 − 40 = 40
Total
80
Total
B
100 − 40 = 60
900 − 40 = 860
1000 − 80 = 920
100
1000 − 100 = 900
1000
Le nombre d’appareils ne présentant que le défaut A (case AB )
60
= 0,6
100
Le nombre d’appareils ne présentant que le défaut B (case AB)
pA =
pB =
40
= 4%
1000
Naissances à pile ou face
TP probabilité
Garçon ou fille ?
3ème année
Supposons que l'on a la même chance d'avoir garçon ou une fille.
Quelle est la probabilité d'observer deux garçons dans une famille de quatre enfants ?
Quelle est la probabilité d'observer trois garçons dans une famille de quatre enfants ?
Voir simulation
Naissances à pile ou face
G
G
G
G
G
G
G
G
G
G
G
F
G
G
F
G
G
G
G
F
F
G
F
F
F
F
G
F
G
G
F
G
G
F
G
F
F
G
F
G
G
F
G
F
G
F
G
F
F
F
G
F
G
F
F
G
G
G
F
G
G
F
F
F
G
F
G
G
F
F
G
F
F
G
F
F
G
G
P ( x = 2) = 6 × (0,5) 2 × (1 − 0,5) 2 = 0,375
F
F
F
G
F
F
G
F
F
F
G
F
F
F
F
F
Tableau de dénombrement
Utiliser un tableau pour dénombrer les événements
Tableau de dénombrement
réponse
Hommes
Infirmiers
libéraux
Infirmiers
hospitaliers
180 − 162 = 18
Femmes
180 ×
90
= 162
100
909 − 765 = 144 1030 − 265 = 765
Autres
salariés
123 − 103 = 20
Total
1212 − 1030 = 182
Total
180
1212 ×
75
= 909
100
10
1030 ×
= 103 1212 − 1089 = 123
100
1030
1212
Loterie
Parfois il est utile d’utiliser l’union des événements
Dans un loterie de 1000 billets, un des billet gagne 500€, 10 billets 100 €
Chacun, 50 billets 20€ chacun et 100 billets 5 € chacun. Tous les autres ne
gagne rien.
Si j’achète un billet quelle est la probabilité pour que je gagne au moins 20 €
Soit A20 l’événement « gagner 20 euros »
Soit A100 l’événement « gagner 100 euros »
Soit A500 l’événement « gagner 500 euros »
Soit A l’événement « gagner au moins 20 euros »
Il est clair que A = A20 ∪ A100 ∪ A500 et que A = A20 ∩ A100 ∩ A500
D’où
P ( A) = P ( A20 ) + P ( A100 ) + P ( A500 ) =
50
10 1
+
= 0,061
1000 1000 1000
Rater la cible
Parfois il est utile d’utiliser l’événement contraire
Une cible contient trois zones I, II et III.
La probabilité d’atteindre la zone I est 0,15,
la probabilité d’atteindre la zone II est 0,23
la probabilité d’atteindre la zone III est 0,17
Calculer la probabilité de rater la cible
Rater la cible
Soit A l’événement « coup la cible »
Soit A l’événement « atteindre la cible »
Comme
alors
A = AI ∪ AII ∪ AIII
et
AI ∩ AII ∩ AIII = φ
P( A) = P( AI ) + P( AII ) + P( AIII )
P( A) = 0,15 + 0,23 + 0,17 = 0,55
Or
d’où
P( A) = 1 − P( A)
P( A) = 1 − 0,55 = 0,45
Tableau ou arbre
Un sondage est effectué dans une entreprise comprenant 20% de cadres et 80%
d’employés. On sait que 40% des cadres et 15 % des employés parlent anglais
On choisi au hasard une personne de l’entreprise. On appelle :
C : l’événement « être cadre »
E : l’événement « être employé »
A : l’événement « parler anglais »
- Faire un arbre pondéré(ou un tableau) représentant cette situation
- Calculer la probabilité des événements : A∩ C A∩ E
- En déduire la probabilité de l’événement A
Hors programme
Connaissance
Exemple
Tirages successifs avec remise
A
A
et
B sont indépendants
et
B sont dépendants
Calculs
A∩ B
P( A ∩ B) = P( A) × P( B)
16 16
×
32 32
Tirer une carte rouge puis une carte noire
Tirages successifs sans remise
A∩ B
P( A ∩ B) = P( A) × P( B)
16 16
×
32 31
Tirer une carte rouge puis une carte noire
Formule de combinaison
Cnk =
n!
k!× (n − k )!
Sous ensembles non ordonnés de trois cartes
Formule d’arrangement
n!
Ank =
(n − k )!
Sous ensembles ordonnés de trois cartes
C323 =
A323 =
32!
= 4960
3!× (32 − 3)!
32!
= 29760
(32 − 3)!
EXEMPLE ÉVALUATION METTANT EN
ŒUVRE LES TIC
Surréservation.
Niveau : seconde professionnelle.
Thématique : jouer avec le hasard (vie sociale et loisirs).
Deux énoncés sont proposés.
- Dans le premier, l’élève est guidé dans la démarche de résolution
- Dans le second il peut faire preuve de son autonomie et de sa prise d’initiative
dans la résolution d’un problème.
EXEMPLE ÉVALUATION METTANT EN
ŒUVRE LES TIC
Énoncé 1 Une compagnie aérienne dispose d’un avion de 100 places et vend
(possède 107 options d’chat) 07 réservations.
L’objectif est d’évaluer la probabilité de surréservation de cette compagnie,
autrement dit le risque que plus de 100 passagers se présentent à l’embarquement.
On suppose que toute personne réservant une place dans un avion a une
chance sur 10 de ne pas se présenter à l’embarquement.
Réaliser une simulation du nombre de 100 places pour 107 réservations, sur
un échantillon aléatoire à l’aide d’un tableur.
Pour cela, dans une feuille de calcul du tableur :
1. saisir « =ENT(ALEA()+0,9) » dans la cellule A1 et recopier cette formule
jusqu’en DC1 pour obtenir 107 réalisations
saisir « =SOMME(A1:DC1) » dans la cellule DD1.
Appel n° 1 EXEMPLE ÉVALUATION METTANT EN
ŒUVRE LES TIC
2. Réaliser une simulation du nombre de personnes se présentant à
l’embarquement de 1 000 vols de 100 places pour 107 réservations à chaque vol
Appel n° 2 3. Déterminer, pour cette simulation de 1 000 vols, la proportion des cas où
l’effectif des passagers à l’embarquement est supérieur à 100. Pour cela :
- dans une cellule de votre choix, saisir « =NB.SI(DD1:DD1000;">100") »,
- dans une cellule de votre choix, en déduire la fréquence demandée.
Appel n° 3 a) En utilisant la touche F9, réaliser plusieurs simulations, puis évaluer la
b) Évaluer, en pourcentage, le risque de surréservation pour la compagnie aérien
Appel n° 4 EXEMPLE ÉVALUATION METTANT EN
ŒUVRE LES TIC
Énoncé 2 On suppose qu’une personne réservant une place d’avion a une chance sur
10 de ne pas se présenter à l’embarquement. Une compagnie dispose d’un avion de
100 places et vend 107 réservations.
Le but de l’exercice est d’évaluer la probabilité de surréservation.
1. Sur un tableur, réaliser une simulation du nombre de personnes se présentant à
l’embarquement lorsqu’il y a 107 réservations.
2. Sur un tableur, réaliser une simulation sur un échantillon de taille 1 000 de
l’expérience aléatoire précédente et déterminer, pour cette simulation, la
fréquence des cas où plus de 100 personnes se présentent à l’embarquement.
On pourra utiliser la formule
=NB.SI(plage).
3. À l’aide des simulations réalisées, est-il possible d’évaluer le risque de
surréservation que prend la compagnie ? On peut utiliser la touche F9.
Compétences évaluées
L’élève est capable, en tirant profit des aides éventuelles, de réaliser
la simulation de la question 1.
L’élève comprend le sens de l’affichage 1 ou 0 de l’instruction
=ENT(ALEA()+0,9) et ne confond pas le rôle des valeurs 100 et 107
L’élève est capable, en tirant profit des aides éventuelles, de réaliser
la simulation d’un échantillon de taille 1 000.
L’élève prend l’initiative de compter les sommes strictement
supérieures à 100.
L’élève connaît la différence de sens entre effectif et fréquence.
L’élève comprend le sens de la question 3.
L’élève identifie la probabilité comme l’invariant autour duquel
fluctuent les fréquences observées.
L’élève donne une estimation convenable du risque de
surréservation.
L’élève tire profit des indications éventuellement données à l’oral ;
ces indications peuvent être des aides logicielles nécessaires pour
réaliser ce qu’il a prévu.
Éléments permettant de
situer l’élève
Remarques
En seconde et première professionnelle
- Pas de théorie
- Les élèves doivent manipuler, observer, expliquer, déduire, utiliser ou
construire des fichiers pour augmenter le nombre d’expériences…
En troisième année professionnelle
- Les probabilités sont traitées de façon assez classique… en s’appuyant sur
des représentations graphiques pertinentes (arbres, tableaux, diagrammes)…
Un peu de vocabulaire
Expérience aléatoire Une expérience est dite aléatoire si les résultats sont dus au
hasard uniquement
Exemple : jeter un dé, prélever une pièce dans une production …
Univers l’univers ou l’inventaire, des possibles, est l’ensemble des résultats ou
événements élémentaires pour une expérience aléatoire. On le note Ω
Exemple : Pour le jeu de dés. l’univers est Ω = {1, 2, 3…6}
Pour le tirage de cartes, l’univers est l’ensemble des 32 cartes.
Evénements Un événement A est une partie de l’ensemble des événements
élémentaires.
Exemple :Pour le jeu de dés.
L’événement A « obtenir un chiffre pair » A = {2 ; 4 ; 6}
Evénement certain : événement toujours réalisé
Exemple : « Obtenir pile ou face » est un événement certain
Evénement impossible : événement jamais réalisé
Exemple : « Tirer une carte qui soit à la fois trèfle et carreau »
Evénements incompatibles : événements qui ne peuvent se réaliser
simultanément
Evénements contraires : A et A A ∪ A = Ω
A∩ A = φ
Exemple : « Obtenir au jeu de dés un chiffre pair » est l’événement contraire de
l’événement « obtenir un chiffre impair »
Réunion de deux événements : A ∪ B est réalisé si l’un au moins des deux
événements est réalisé.
Exemple : « Tirer une noire ou pique » est la réunion des événements A = «tirer
une carte noire » et B = «tirer un pique »
Intersection de deux événement : A ∩ B événement est réalisé si les événements
Exemple : « être cadre et parler anglais couramment»
Evénements indépendants : quand l’issue de l’un ne dépend pas de l’issue de
l’autre
Variable aléatoire
Définition :
Une variable aléatoire X est une fonction définie sur l’univers d’une expérience
Ω = (e1; ....; en }
aléatoire à valeurs réels :
X : Ω = (e1; ....; en } → IR
Notons( x1;....xn } les valeurs prises par X.
L’événement « X prend la valeur x » est noté par X = xi avec P ( X = xi ) = pi
i
L’ensemble des couple ( xi ; pi ) est par définition la loi de probabilité de X
Dans le cas discret, on peut la présenter sous forme d’un tableau
Exemple de variable aléatoire
On lance en l’air, trois fois de suite, une pièce de monnaie dont les faces sont P
et F. La pièce est supposée équilibrée.
Après chaque lancer, on gagne 10 € si on obtient P et on perd 5 € sinon.
Ω = { PPP; PPF ; PFP; FPP; FPF ; FFP; PFF ; FFF }
X : Ω → {− 15;0;15;30}
ω →
X (ω )
X (ω ) désigne le gain possible à la fin des trois lancers.
sorties (ω i ) PPP PPF
PFP
FPP
FPF
FFP
PFF
FFF
0
0
-15
3
8
3
8
1
8
gains ( xi )
30
15
15
15
0
probabilité
s (p )
1
8
3
8
3
8
3
8
3
8
i
Paramètres d’une variable aléatoire
Espérance mathématique d’une variable aléatoire discrète :
E( X ) =
∑
xi pi = 30 ×
∑
xi pi =
i
E( X ) =
i
1
3
3
3
3
1
+ 15 × + 15 × + 15 × + 3 × 0 × − 15 ×
8
8
8
8
8
8
150
= 18,75
8
Variance :
σ ²=
∑
( xi − E ( X ))² P( X = xi )
i
1
1
1
σ ² = (30 − 18,17)² + 3 × (15 − 18,17)² + 3 × 3 × (− 18,17)² = 416,6
8
8
8
Ecart type :
σ = 416,6 = 20,4
Loi normale
La loi normale est caractérisée par sa densité de probabilité qui peut s’écrire
de la forme :
( x − m )²
−
1
f ( x) =
e 2σ ²
σ 2π
0.014
1
0.012
σ
0.01
2π
0.008
0.006
0.004
0.002
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
La courbe de la loi normale a la forme d’une cloche symétrique.
∑ a P( X = a ) = m
σ ² = ∑ (a − m)² P( X = x )
E( X ) =
i
i
i
i
i
i
E ( X ) = ∫ XdP
Ω
σ ² = ∫ ( x − m)²dP
Fonction de répartition d’une loi normale
La fonction de répartition d’une loi normale de moyenne et d’écart-type est
donnée par :
x
( t − m )²
1
F ( x) =
σ 2π
∫e
−
2σ ²
dt
−∞
F est une fonction croissante
y
F (− ∞ ) = 0
F (+ ∞ ) = 1
0.36
0.32
0.28
F (x)
0.9750021
0.24
0.2
0.16
0.12
0.08
0.04
-8
-7
-6
-5
-4
-3
-2
-1
0
-0.04
Exemple :
1
x
2
3
4
5
6
7
8
x
-0.08
avec un tableur F (1,96) = LOI.NORMALE(1,96;0;1;VRAI) = 0,9750021
Fonction de répartition d’une loi normale
=
F (− x)
y
F (− x)
1 − F ( x)
y
0.36
1 − F ( x)
0. 36
0.32
0. 32
0.28
0. 28
0.24
0. 24
0.2
0 .2
0.16
0. 16
0.12
0. 12
0.08
0. 08
0.04
0. 04
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
8
x
-8
- 0.04
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
8
x
- 0. 04
- 0.08
- 0. 08
F ( x) − F (− x)
F (x)
y
0.36
0.36
0.36
0.32
0.32
0.32
0.28
0.28
0.28
0.24
0.24
=
0.2
0.16
0.12
0.08
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
8
x
0.16
0.12
-8
-7
-6
-5
-4
-3
-2
y
_
0.2
0.04
-8
F (− x)
y
0.24
0.2
0.16
0.12
0.08
0.08
0.04
0.04
-1
0
1
2
3
4
5
6
7
8
x
-8
-7
-6
-5
-4
-3
-2
-1
0
-0.04
-0.04
-0.04
-0.08
-0.08
-0.08
1
2
3
4
5
6
7
8
x
Fonction de répartition d’une loi normale
Calcul de
P(− x ≤ X ≤ x)
P(− x ≤ X ≤ x) = F ( x) − F (− x)
D’après ce qui précède :
Par exemple, déterminerx pour que :
P (− x ≤ X ≤ x) = 95%
y
0.36
0.32
0.28
0,95
0.24
0.2
0.16
0.12
?
0.08
?
0.04
-8
-7
-6
-5
-4
-3
-2
-1
0
-0.04
1
2
3
4
5
6
7
8
x
Fonction de répartition d’une loi normale
P (− x ≤ X ≤ x) = F ( x ) − [1 − F ( x)] = 2 F ( x) − 1
On a vu que F (1,96) = 0,9750 , donc :
P (− 1,96 ≤ X ≤ 1,96) = 2 F (1,96) − 1
P (− 1,96 ≤ X ≤ 1,96) = 2 × 0,9750 = 0,95
On démontre aussi que :
P (− 1,645 ≤ X ≤ 1,645) = 0,90
et que :
P (− 2,575 ≤ X ≤ 2,575) = 0,99
Exemple d’application de la loi normale
La quantité de lait produite quotidiennement par une vache est
une variable aléatoire normale de moyenne 36 litres et
d'écart-type 5 litres. D'après les statistiques 5% des vaches
normandes produisent moins que la normale et 5% plus que la
normale.
A partir de quelles productions journalières peut-on dire qu'une
vache normande est une mauvaise laitière ou excellente
productrice ?
y
0 .0 72
0 .0 64
0 .0 56
B
0 .0 48
0. 04
0 .0 32
A
C
0 .0 24
0 .0 16
0 .0 08
-4
1
6
11
16
21
x1
26
31
0
36
41
-0 .0 08
-0 .0 16
x2
46
51
56
61
Résoudre ce problème revient à trouver deux valeurs
66
71
76
x
x1 et x2 telle que :
- 5 % des vaches ont une production à inférieure à x1
- 5 % des vaches ont une production supérieur à x 2
On définit ainsi trois catégories A, B et C de vaches :
- A : Les mauvaise productrice :
P ( X ≤ x1 ) = 0,05
- B : Les vaches qui produisent normalement : P( x1 ≤ X ≤ x2 ) = 0,90
- C : Les excellentes productrice : P ( X ≥ x2 ) = 0,05
Cherchons
x1
P ( X ≤ x1 ) = 0,05
x1 = LOI .NORMALE.INVERSE. (0,05;36;5) = 27,7775
Ainsi :
x1 = 27,7775
x1 + x 2
) = 36
Comme x1 et x2 Sont symétriques par rapport à m = 36 (
2
x2 = 36 × 2 − 27,7775 = 44,22
Finalement
- Si la production est inférieur à 27.7 litres par jours la vache est une
mauvaises laitière.
- Si la production est supérieur à 44,22 litres par jours la vache est une
d'excellente productrice.
Loi binomiale
- n est un entier naturel
≥ 1 et 0 ≤ p ≤ 1
- La loi binomiale de paramètres n et p est la loi de probabilité de la
variable aléatoire X qui prend les valeurs 0;1;2...; n avec la probabilité :
P( X = k ) = C nk p k q n − k
où q = 1 − p
P( X = k ) représente la probabilité d’obtenir k succès quand on effectue n
épreuves répétées indépendantes
On a bien
∑
P( X = k ) =
∑
-
C nk p k q n − k = ∑ ( p + q) n = 1
Cette loi est notée B(n, p)
(par exemple un tirage avec remise ou non exhaustif)
Conditions
Trois conditions doivent donc être vérifiées pour utiliser une loi binomiale :
répétition, indépendance et alternance
On peut représenter la situation par un arbre pondéré à n niveau :
q
p
p
n=3
p
q
p
q
p
q
3
2
2
1
3
2
2
p
p q
p q
pq
p
2
2
2
p q
q
q
p
1
pq
1
pq 2
2
xi
0
1
2
3
pi
q3
3pq2
3p2q
p3
q
0
q3
Ici, n=3, donc :
P( x = 0) = C p = p
0
n
3
P( x = 1) = C n1 p 2 q = 3 p 2 q
3
P( x = 3) = C n3 q 3 = q 3
P( x = 2) = C pq ² = 3 pq ²
2
n
Espérance mathématique pour une loi binomiale : E ( x) = n × p
(Résultat intuitif, on répète n épreuves avec à chaque fois la probabilité p
d’avoir un succès, le nombre moyen de succès est n p)
Variance et écart-type :
V ( x) = n × p × q
∑
kP( X = k ) =
n. p.q
n!
C =
k!.(n − k )!
P( X = k ) = C nk p k q n − k
E( X ) =
σ ( x) =
k
n
∑
k .C nk p k q n − k
Exemple d’application
On tire 7 fois une carte avec remise dans un jeu de 32 cartes.
La variable aléatoire X qui compte le nombre de cœurs obtenus suit
1
B
(
7
;
)
La loi binomiale
4
: : Quelle est la probabilité d’obtenir 3 cœurs
Question
Réponse : P(X=3) =
4
3
 1  3
3
C7  4   4   0.17
   
En moyenne, on obtient 1.75 cœur
Approximation d’une loi binomiale par une loi normale
D’après le théorème de Moivre-Laplace :
On peut approximer une loi binomiale par une loi normale dès que n est assez grand
On donne en général comme conditions d’approximations :
n  30 , n × p  5 et n × (1 − p)  5
Exemple : On lance 50 fois une pièce de monnaie équilibrée (n = 50 et p = 0,5).
X est la variable aléatoire qui compte le nombre de « face » obtenu.
X suit la loi binomiale B(50;0,5), approchée par la loi normale N (np; npq ) = N (25;3,54)
Approximation d’une loi binomiale par une loi normale
n = 10 et p =0,1
4 5 .0%
n= 10 et p =0,4
n = 10 et p =0,5
30.0%
30.0%
25.0%
25.0%
n = 10 et p =0,9
45.0%
40.0%
4 0.0%
35.0%
3 5 .0%
3 0.0%
20.0%
20.0%
15.0%
15.0%
30.0%
25.0%
2 5 .0%
20.0%
2 0.0%
10.0%
1 5 .0%
15.0%
10.0%
10.0%
1 0.0%
5.0%
5.0%
5.0%
5 .0%
0.0%
0.0%
1
2
3
4
5
6
7
8
9
10 11
12
13
14
15
0.0%
0.0%
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37
1
3
5
7
9 11 13 15 17 19 21 23 25
1
2
3
4
5
6
7
8
9
1
11
Fluctuation des fréquences
On effectue n épreuves répétées indépendantes, avec deux issues possibles à
chaque épreuve. On note p est la probabilité du succès à une épreuve.
Par exemple, on effectue n tirages au hasard et avec remise dans une urne contenant
des boules noires et des boules blanches et on compte les boules noires tirées
p est la proportion de boules noires dans l’urne, la variable aléatoire S qui
compte les succès (nombre de boules noires tirées) suit la loi binomiale B(n, p),
qu’on approxime (pour n assez grand) par la loi normale N (np; npq )
Pour pouvoir comparer des tirages dont les nombres d’épreuves sont différents
(ou des échantillons de tailles différentes), on considère la variable aléatoire
Y=
1
S
n
qui mesure la fréquence des succès des tirages
Fluctuation des fréquences
C’est la loi de probabilité de cette variable aléatoire qui mesure les fluctuations
d’échantillonnage des fréquences sur les échantillons de taille n
D’après l’approximation précédente, Y suit alors la loi normale :
1
1
E (Y ) = E ( S ) = × np = p
n
n
σ (Y ) =
1
1
σ ( S ) = × npq =
n
n
pq
n
y
0.36
0.32
On démontre (loi normale) :
0.28
0,95
0.24
0.2
0.16
0.12
0,95 = P( p − 1,96σ ≤ Y ≤ p + 1,96σ )
0.08
0.04
-8
On majore par 2 :
-7
-6
-5
-4
-3
-2
-1
-1,96
0
-0.04
-0.08
0,95 ≤ P( p − 2σ ≤ Y ≤ p + 2σ )
1
2
1,96
3
4
5
6
7
8
x
Fluctuation des fréquences
p(1 − p)
n
On remplace σ par
pq
pq
0,95 ≤ P( p − 2
≤ Y ≤ p+ 2
)
n
n
1
Comme la fonction f ( x) = x(1 − x) est bornée sur [0 ; 1] par
4
0,25
y
0.2
0.1
1
alors pq ≤
d’où
4
0
pq ≤
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1 x
1
1
1
0
,
95
≤
P
(
p
−
≤
Y
≤
p
+
)
, par suite :
2
n
n
environ plus de 95 % des tirages fournissent une fréquence de succès dans l’intervalle
I = [p −
1
n
;p+
1
n
]
Stabilisation des fréquences
Voici une version de la loi faible des grands nombre :
Pour tout entier n >0 et pour tout réel t >0 P ( Y − p  t
p(1 − p) 1
)≤
n
t²
Ce théorème indique que la variable aléatoire Y qui mesure la fréquence d’apparition
d’un événement A de probabilité p prend une valeur extérieur à l’intervalle
[p − t
p (1 − p )
p (1 − p )
); p + t
]
n
n
Avec une probabilité inférieur à
1
t²
Ce qui justifie la définition fréquentiste de la probabilité d’un événement comme étant
une valeur autour de laquelle la fréquence d’apparition de cet événement se stabilise
.
lorsque t devient assez grand.
Stabilisation des fréquences
Cette loi est d’une grande importance théorique, mais elle produit numériquement
un résultat qui semble faible.
Par exemple
pour t = 1,96, la probabilité pour Y soit dans l’intervalle est supérieure à 0.74
En effet, d’après la loi faible des grands nombre :
p(1 − p)
P( Y − p  1,96
) ≤ 0,26
n
p(1 − p)
p(1 − p )
P( Y − p ≤ 1,96
) = 1 − P( Y − p  1,96
)
n
n
p(1 − p)
p (1 − p )
P( p − 1,96
≤ Y ≤ p + 1,96
) ≥ 0,74
n
n
.
On est très loin de 95%