Présentation d`applications statistiques et de simulations sous

Transcription

Présentation d`applications statistiques et de simulations sous
PRÉSENTATION D'APPLICATIONS STATISTIQUES ET DE SIMULATIONS
SOUS GEOPLAN-GEOSPACE
Daniel MULLER
Professeur agrégé de mathématique
Formateur en formation continue
à l' I.U.F.M. d' Aix-Marseille
Jas "Le Château" 04230 CRUIS
[email protected]
Résumé :
Ces applications statistiques et ces simulations, sous le logiciel "Géoplan-Géospace", ont
pour but de rendre vivants et animés les concepts abstraits de l'enseignement de la
statistique. Il s'agit d'habituer les élèves et les étudiants à fréquenter l'aléatoire, ses lois, ses
modèles expérimentaux et ses paradoxes au travers de simulations ( distributions, jeux,
sondages, graphes…).Conçues comme des travaux pratiques d'observation et non comme
des séances de calcul, ces applications doivent pousser l'utilisateur à rechercher les bases
théoriques des phénomènes observés (fluctuation d'échantillonnage, distribution de
probabilité, densité, caractéristiques, erreur, intervalles de confiance, tests…).
Mots-clés : enseigner la statistique, simulations, lois de probabilité, tests, modèles, marche
aléatoire, billard.
Abstract :
These statistical applications and simulations, with the software "Géoplan-Géospace", aim at
making lively and animated the abstract concepts of teaching statistics. It is a matter of
getting the pupils and the students into the habit of handling random trial, its rules, its
experimental models and its paradoxes through simulations (distributions, games,
samplings, graphs…). Conceived as tutorials of observation and not as periods of calculus,
these applications must egg users on to search for theoretical bases of observed phenomena
(sampling fluctuations, probability distributions, densities, characteristics, error, confidence
intervals, tests…).
Keywords : teaching statistics, simulations, probability distributions, tests, models, random
walking, billiards.
Dans le cadre de la session "Enseignement de la statistique", le but de la présente communication
est de présenter des illustrations animées de concepts de statistique-probabilités et de simulations en
utilisant le logiciel Géoplan-Géospace [0] et [1].
Ces applications sont extraites d'un enseignement de la statistique destiné aux professeurs de
mathématique des lycées dans le cadre de la formation continue des enseignants (nouveaux
programmes des lycées [2]). Elles sont utilisées devant ou par les élèves pour illustrer des situations
théoriques ou pour manipuler des expériences aléatoires.
1°) Simulations [4] à [12]:
Destinées à observer la formation d'échantillons, la production de moyennes ou de fréquences
observées accompagnées d'intervalles de confiances, à illustrer la notion de modèle et à conjecturer
une distribution de probabilité liée à des expériences aléatoires dans des domaines variés :
•
Jets simultanés de pièces (fluctuation d'échantillonnage)
1
•
•
Paradoxe de Bertrand (mise en évidence du choix d'un modèle)
Aiguille de Buffon (jet aléatoire d'une aiguille de longueur donnée sur un réseau de lignes
parallèles et équidistantes)
Méthode de Monte-Carlo pour l'estimation d'une aire plane ou d'un volume
Répartition du p.g.c.d. de deux entiers naturels
Choix de deux points aléatoires sur un quadrillage fini et fréquence des carrés obtenus
Jeu de "franc carreau" (jet aléatoire d'un disque sur un quadrillage)
Sondage anonyme (à propos du nombre de fumeurs dans un lycée)
Graphes probabilistes (processus markoviens) : utilisation des matrices de transition et
convergence vers un état stable) [13]
Simulation de la loi génétique de Hardy-Weinberg.
•
•
•
•
•
•
•
2°) Illustration de quelques lois de probabilité [3] à [12] :
Il s'agit d'illustrer et de simuler diverses lois de probabilité de variables aléatoires discrètes ou
continues ainsi que d'étudier sur deux exemples des distributions de probabilité particulières. La
production de nombreux échantillons permettra de mettre en évidence le théorème de la limite
centrée.
•
•
•
•
•
•
•
Distribution de Poisson
Distribution hypergéométrique
Expérience de Galton (distribution binomiale et convergence vers la loi normale)
Loi exponentielle
Loi de l'arcsinus
Loi de Weibull
Passage du discret au continu : distribution géométrique et loi exponentielle
Deux exemples de distribution de probabilité sont étudiées en détail :
•
Distance au point de départ après une marche aléatoire de p pas réguliers dans le plan (pour 2
pas : loi de l'arcsinus ; pour p pas (p > 5) loi de Weibull).
• Distance au point de départ d'une boule lancée aléatoirement sur un billard rectangulaire après
un, deux ou trois rebonds (choix de différents modèles de simulation).
Illustration du théorème de la limite centrée sur ces deux exemples.
Exemple du problème du billard rectangulaire :
M
1
M
3
M
2
a = 1.23 radians
M
1
a = 0.37 radians
M
3
O
O
M
2
2
π
(6)
2
OM
1
=
M(a)
3
arctan
OM
2
(5)
=
3
(4)
OM
4
M
M
1
2
tan(a)
2
π
1
sin (a)
3
=
2
1+
tan (a)
π
6
3
1
arctan
(3)
a = 1.18 radians
2
1
arctan
4
1
arctan
(2)
(1)
6
0 (0)
O
M
2
Une bille part de O sur un billard rectangulaire ((longueur 2, largeur 1) suivant un angle aléatoire
avec l'horizontale de mesure a ( 0< a < /2 ).
Elle tape une première fois un bord du billard en M1 , une deuxième fois en M2 et une troisième fois
en M3 .
On demande d'étudier la distribution de d = OM1 , OM2 et OM3 .
Ci-dessus on donne d en fonction de a lorsque a est compris entre arctan(3/2) et π/2. Le logiciel
actualise d = f(a) pour les autres valeurs de a. Ci-dessous l'étude de d= OM1
n:16000 N:16000
m':1.537636
µ = 1.531745
M
s:0.456728
σ ≈ 0.447478
1
O
d
5
J
2
1
1
0.5
0
π
2
a
2
0
0.5
1
1.5
2
5
3
Le modèle choisi pour cette simulation génère le point M1 par l'angle a (loi uniforme sur ] 0; π/2[ ).
N est le nombre de simulations désiré.
n est un compteur du nombre de simulations déjà réalisées.
L'histogramme indique la distribution des distances d = OM1 au cours des n simulations.
Le graphique de gauche donne les variations de d en fonction de l'angle a.
m est la moyenne observée des distances au cours des n simulations.
s est l'écart-type observé des distances au cours des n simulations.
µ est la moyenne théorique.
σ est l'écart-type théorique.
3°) Tests de comparaison :
Il sont effectués sur des échantillons aléatoires ou non de tailles différentes (inférieurs ou supérieurs
à 30) et permettent également de faire varier les divers paramètres en cause (tailles, moyennes,
variances, risque).
•
•
•
•
Test t de Student (comparaison des moyennes de "petits" échantillons)
Test F de Snédécor-Fisher (comparaison des variances)
Test de l'écart-réduit (comparaison des moyennes de "grands" échantillons)
Test U non paramétrique de Mann et Whitney.
Conclusion.
Le logiciel "Géoplan-Géospace" n'est pas a priori un outil de calcul, cependant il a été utilisé ici
comme support pour développer une approche expérimentale de l'étude de la statistique. Choisir un
modèle, voir se constituer un échantillon, constater les fluctuations d'échantillonnage, tester une
estimation, visualiser les constituants d'une loi de probabilité, suivre l'évolution d'un intervalle de
confiance, conjecturer une distribution de probabilité, constater la répartition normale des moyennes
d'un grand nombre d'échantillons conformément au théorème de la limite centrée sont autant
d'objectifs pédagogiques propres à pousser l'expérimentateur à rechercher les bases théoriques de ce
qu'il a constaté.
Références :
[0] D. Muller (2003) Géoplan-Géospace au lycée, outils pour les élèves et pour la
formation des professeurs. Edition privée : [email protected] .
[1]AID-CREEM et M.E.N.(2003) Logiciel Géoplan-Géospace
http://www2.cnam.fr/creem
[2] Scérén-cndp (2002) Documents d'accompagnement des programmes de
mathématique des lycées. Accessible sur le site www.cndp.fr/lycee.
[3] SEL. Formation en statistique (2001). A télécharger sur : www.inrialpes.fr/sel/
Bibliographie :
[4] J.J. Droesbeke (1997). Éléments de statistique ( 3ème édition). Ellipses. Paris
[5] G. Saporta (1990). Probabilités-Analyse des données et statistique. Technip.
Paris.
[6] T. et R. Wonnacott (1995). Statistique. Economie-Gestion-Sciences-Médecine.
Economica . Paris.
[7] Carnec-Dagoury-Seroux-Thomas (2000). Itinéraires en statistiques et
probabilités. Ellipses. Paris
[8] D. Schwartz (1995). Méthodes statistiques à l’usage des médecins et des
biologistes. Flammarion. Paris
4
[9] Lellouch et Lazar (1999). Méthodes statistiques en expérimentation biologique.
Flammarion. Paris
[10] Jean-Pierre Lecoutre (2003). Statistique et probabilités. Manuel et exercices
corrigés. Dunod . Paris
[11] Commission inter-IREM Statistique et Probabilités (1997).Enseigner les
probabilités au lycée. IREM de Reims. Diffusion : réseau des I.R.E.M. Reims.
[12] Encyclopaedia Universalis (1998). Dictionnaire des mathématiques :
fondements, probabilités et applications (tome 1). Albin Michel . Paris
[13] V.Girardin et N. Limnios (2001). Probabilités. Vuibert . Paris
5