statistiques - Maths learning
Transcription
statistiques - Maths learning
C L A S S E D E 1 S T G S T A T I S T I Q U E S . S TAT I S T I Q U E S 1. Les indicateurs de tendance centrale. 1.1 La moyenne. 1.1.1 Détermination de la moyenne. Plusieurs cas peuvent se présenter : 1° La moyenne de n nombres x1 , x2 , ............., xn se calcule par la relation x= x1 + x2 + ....... + xn n 2° Si la valeur n°i est prise n fois, on dira que ni est l’effectif de xi et on calculera alors : p ∑n x 1 i x= i =1 p ∑n i i =1 3° S’il y a trop de valeurs, on les regroupe en classes, c'est-à-dire en intervalles [ ai ; bi [ , et pour les calculs on prendra comme valeurs de la variable les centres des classes. Pour chaque classe le centre se calcule selon la relation : ci = ai + bi 2 On calculera alors : p ∑n c 1 i x= i =1 p ∑n i i =1 En résumé, les méthodes de calcul sont : x Si peu de valeurs x + x2 + ....... + xn x= 1 n Si nombreuses valeurs et n1 x1 + n2 x2 + .... + n p x p plusieurs fois la même valeur x = N N étant l’effectif total Si les valeurs sont n c + n2 c2 + ..... + n p c p x= 1 1 regroupées par classes N Notation avec x= 1 ∑ xi n i =1 x= 1 N ∑n x 1 N ∑n c x= ∑ p p i i i =1 p i i i =1 Inconvénient de la 3ème méthode : il faut que les effectifs soient également répartis à l’intérieur des classes, ce qui est rarement le cas. A rédiger. EXERCICE 1 1 – Calculer la moyenne d’un élève qui a obtenu les 5 notes suivantes : 9 , 11, 7, 12, 10 JMD - Classe de 1 STG www.maths-learning.fr 1 C L A S S E D E 1 E R E S T G C O U R S D E S T A T I S T I Q U E S 2 – Les 31 élèves d’une classe de première ont obtenu les notes suivantes : Notes : xi 7 8 9 10 11 12 13 14 Effectifs : ni 1 5 4 12 5 3 0 1 Total ni × xi Compléter ce tableau et calculer la moyenne. 3 – On effectue une enquête auprès de 120 magasins afin de déterminer la prix de vente moyen d’un pantalon. On relève ces résultats dans le tableau suivant : Prix de vente en euros xi Nombres de magasins ni [ 20 , 25[ 24 [ 25 , 30[ 32 [30 , 35[ 48 [35 , 40[ 12 [ 40 , 45[ 4 Centre des classes ci Produit ni × ci Total Compléter ce tableau et calculer le prix de vente moyen. Donner en pourcentage de l’effectif global, le nombre de magasins ayant un prix supérieur ou égal au prix moyen (arrondir à l’unité). 1.1.2 Les propriétés de la moyenne. a) Linéarité. • Si on multiplie toutes les valeurs de la série par un même nombre a, alors la moyenne est multipliée par a. Ainsi : si la série x1 , x2 ,............ xn a pour moyenne x , alors la série ax1 , ax2 ,............axn a pour moyenne ax • Si on ajoute le même nombre b à chacune des valeurs de la série, alors la moyenne est augmentée de b. www.maths-learning.fr 2 C L A S S E D E 1 S T G S T A T I S T I Q U E S . Ainsi : si la série x1 , x2 ............xn a pour moyenne x , alors la série x1 + b, x2 + b,............xn + b a pour moyenne x+b Exemples : 1. Dans une classe la moyenne du contrôle de SVT a été de 8 sur 20. Le professeur a décidé d’augmenter toutes les notes de 10% Calculer la nouvelle moyenne. 2. Dans cette classe la moyenne du contrôle d’hist-géo a été de 7,8. Le professeur décide d’ajouter un point à chaque élève. Calculer la nouvelle moyenne. b) La moyenne des sous-groupes. Soit une série statistique séparée en deux sous-groupes distincts d’effectifs respectifs n et p Le premier sous-groupe a pour moyenne z , et le second sous-groupe a pour moyenne y Dans ce cas la moyenne de la série statistique est : x= nz + p y n+ p EXERCICE 8 A chercher Dans une classe de seconde, la moyenne générale des 12 élèves ayant choisi l’option MPI est 12,74 et la moyenne générale des 18 élèves ayant choisi l’option SES est 11,86 Calculer la moyenne générale de la classe. c) Moyenne élaguée. Lorsque les valeurs extrêmes, maximum ou minimum semblent douteuses, ou ne rentrent pas dans le cadre de l’étude, on peut faire un calcul de moyenne élaguée en retirant ces valeurs de la série. EXERCICE 9 A chercher Observer la série suivante de la répartition des salaires dans une entreprise. Salaires (en €) Effectifs JMD - Classe de 1 STG www.maths-learning.fr 1000 1200 1500 2000 19 000 7 8 3 2 1 3 C L A S S E D E 1 E R E S T G C O U R S D E S T A T I S T I Q U E S La situation est-elle adaptée au calcul d’une moyenne élaguée ? Pourquoi ? Calculer cette moyenne. Autre exemple : La série 7, 9, 10, 11, 15, 17, 51 a pour moyenne : Refaisons ce calcul en éliminant la valeur 51. 1.2 Le mode. C’est la valeur du caractère correspondant au plus grand effectif. On parlera de classe modale, pour la classe correspondant au plus grand effectif. Remarque : On peut trouver dans une population statistique plusieurs modes, ou plusieurs classes modales. 1.3 La médiane. 1.3.1 Définition : C’est la valeur du caractère qui partage la série ordonnée en deux parties de même effectif. 1.3.2 Détermination : 1.3.2.1 MÉDIANE D’UNE SÉRIE DISCRÈTE 1.3.2.1.1 Méthode de la liste. On range les valeurs du caractère par ordre croissant. 4° Si l’effectif total est impair, N = 2n + 1 alors la médiane (Me) est la valeur de rang n + 1 www.maths-learning.fr 4 C L A S S E D E 1 S T G S T A T I S T I Q U E S . 5° Si l’effectif total est pair, N = 2n alors la médiane est la demi somme des valeurs du caractère de rang n et n + 1 EXERCICE 6 A chercher. Donner, en justifiant, la médiane des séries suivantes : 6° Série 1 7 ; 9 ; 10 ; 11 ; 15 ; 17 ; 51 7° Série 2 8 ; 10 ; 12 ; 15 1.3.2.1.2 Méthode en utilisant les effectifs cumulés croissants On utilisera cette méthode lorsque les valeurs à recopier sont trop nombreuses. Calculons la note médiane de la série ci-dessous. On commence par calculer les effectifs cumulés croissants (ou les fréquences cumulées croissantes), que l’on regroupe dans un tableau. On obtient : (complète ce tableau) Note ( xi ) 2 5 8 9 10 11 12 14 16 19 Total Nombres d’élèves ( ni ) 1 3 4 6 6 4 3 2 3 2 34 1 4 Effectifs cumulés croissants Rappel : 1 signifie que 1 élève a une note inférieure ou égale à 2 4 signifie que élèves ont une note inférieure ou égale à 5 etc…… JMD - Classe de 1 STG www.maths-learning.fr 5 C L A S S E D E 1 E R E S T G C O U R S D E S T A T I S T I Q U E S Il y a 34 élèves au total, donc la note médiane est située ………………………………………………………… Conclusion : en observant le tableau ci-dessus, on en conclut que la note médiane est : 1.3.2.2 MÉDIANE D’UNE SÉRIE À CARACTÈRE CONTINU. On se propose de déterminer la taille médiane de la série ci-dessous. Comme précédemment, on va utiliser le polygone des fréquences cumulées croissantes : • Soit par simple lecture : c’est l’abscisse de l’intersection des polygones des fréquences cumulées croissantes et décroissantes. • Soit en faisant un calcul en supposant que la répartition est homogène dans les intervalles. 1.3.2.2.1 Méthode par lecture graphique On construit d’abord le tableau des fréquences cumulées croissantes : Taille (en cm) [115 ; 135[ [135 ; 145[ [145 ; 155[ [155 ; 165[ [165 ; 185[ [185 ; 195[ Nombre d’élèves ( ni ) 3 11 Fréquences ( fi ) en % 9 33 Fréquences cumulées croissantes en % 1 9 42 8 7 Fréquences cumulées décroissantes en %2 3 1 Total 33 3 1° Compléter le tableau ci-dessus. 2° Dans quel intervalle à ton avis se trouve la valeur médiane ? 3° On suppose que la répartition est homogène à l’intérieur de cet intervalle. En déduire la valeur médiane par un calcul de proportionnalité. 1 Ici, 9 signifie que 9 % des élèves ont une taille strictement inférieure à 135 cm 33 signifie que 33 % des élèves ont une taille strictement inférieure à 145 cm 2 3 signifie que 3% des élèves ont une taille supérieure ou égale à 185 www.maths-learning.fr 6 C L A S S E D E 1 S T G S T A T I S T I Q U E S . 4° Construire les polygones des fréquences cumulées croissantes et décroissantes. L’abscisse de leur point d’intersection est la médiane. Déterminer cette médiane par lecture graphique. y 110 100 90 80 70 60 50 40 30 20 10 0 115 -10 120 125 130 135 140 145 150 155 160 165 170 175 180 185 190 Tailles Par lecture graphique, on en déduit que la médiane est égale à environ : 2. Les indicateurs de dispersion. 2.1 La variance. 2.1.1 Définition : La variance V est la moyenne des carrés des écarts à la moyenne. Ainsi : (x − x ) V= + ....... + ( xn − x ) 2 2 1 n De la même manière qu’avec le calcul de la moyenne, on pourra distinguer les trois cas suivants : V Si peu de valeurs Notation avec (x − x ) 2 1 + ....... + ( xn − x ) 2 V= 2 1 xi − x ) ( ∑ n i =1 V= 1 N n Si nombreuses valeurs et plusieurs fois la même valeur n1 ( x1 − x ) + ....... + n p ( x p − x ) 2 2 N N étant l’effectif total Si les valeurs sont regroupées par classes n1 (c1 − x ) + n2 (c2 − x ) + ..... + n p (c p − x ) 2 2 N JMD - Classe de 1 STG www.maths-learning.fr ∑ p 2 V= 1 N p ∑ n ( x − x) 2 i i i =1 p ∑ n (c − x ) 2 i i i =1 7 C L A S S E D E 1 E R E S T G C O U R S 2.1.2 D E S T A T I S T I Q U E S Formule à utiliser dans les calculs. On calculera V selon la formule suivante, qui est plus commode à utiliser : p V= ∑n x 2 i i i =1 N −x 2 Dans le cas d’une série continue, on remplacera xi par le centre des classes ci . Ainsi : p ∑n c 2 i i V= i =1 N −x 2 Il est bien sûr attendu que vous soyez capables d’obtenir ces résultats à l’aide de la calculatrice. 2.1.3 L’écart-type Il représente la moyenne des écarts à la moyenne. On le note σ , et on calcule : σ = V A chercher EXERCICE 5 Au tennis, l’entraîneur d’un joueur de haut niveau a relevé la vitesse de son premier service au cours d’un match. Vitesse en km/h [132 ; 140[ [140 ; 148[ [148 ; 156[ [156 ; 164[ [164 ; 172[ [172 ; 180[ [180 ; 188[ [188 ; 196[ Nombre de services. 4 7 13 24 53 30 9 5 1° Calculer la vitesse moyenne du premier service. Vitesse en km/h xi [132 ; 140[ [140 ; 148[ [148 ; 156[ Nombre de services. ni 4 7 13 [156 ; 164[ [164 ; 172[ [172 ; 180[ [180 ; 188[ 24 53 30 9 [188 ; 196[ 5 ci ni × ci ni × ci 2 On calcule : p ∑n c i i x= i =1 N = www.maths-learning.fr 8 Total C L A S S E D E 1 S T G S T A T I S T I Q U E S . 2° Déterminer l’écart-type de la série, d’abord à l’aide du tableau complété, puis à l’aide de la calculatrice. On calcule : p V= ∑n c 2 i i i =1 N 2 −x = Puis : l’écart-type , σ = 3° On refait les calculs à l’aide de la calculatrice en entrant les centres des classes en tant que valeurs xi du caractère, et les effectifs correspondants. Les valeurs lues sont : x= σ= 2.2 Les quartiles. 2.2.1 Situation. On partage une série statistique dont les termes sont rangés par ordre croissant, en 4 parties de même effectifs. Q1 Q2 Q3 14444 4244444 3 14444 4244444 3 14444 4244444 3 14444 4244444 3 25% 25% 25% 25% Les nombres Q1 , Q2 , Q3 sont les quartiles. 2.2.2 Définitions. Q1 est le plus petit terme de la série tel qu’au moins 25 % des données soient inférieures ou égales à Q1 Q2 est le plus petit terme de la série tel qu’au moins 50 % des données soient inférieures ou égales à Q2 Remarque : On peut assimiler Q2 à Me, bien que ces deux nombres puissent être parfois très légèrement différents (voir cidessous) Q3 est le plus petit terme de la série tel qu’au moins 75 % des données soient inférieures ou égales à Q3 JMD - Classe de 1 STG www.maths-learning.fr L’intervalle interquartile est [Q1 , Q3 ] L’écart interquartile est Q3 − Q1 9 C L A S S E D E 1 E R E S T G C O U R S D E S T A T I S T I Q U E S A chercher. EXERCICE 6 On considère une série de 16 notes, classées par ordre croissant : 4 − 6 − 8 − 8 − 914 −10 10 −3 11−11 −12244 −13 −3 15 −15 −16244 −18 −3 19 4− 244 144 144 14243 En utilisant les définitions ci-dessus, donner : Q1 = Q2 = Q3 = L’intervalle interquartile est : L’écart interquartile est : Remarque : Il y a un nombre pair de valeurs, donc selon la définition, Me est la moyenne des valeurs situées au 8ème et 9ème rang. ...... + ...... 2 Ainsi : Me = On note qu’ici, Me = Q2 A chercher. EXERCICE 7 On considère la série de 14 notes suivantes classées par ordre croissant : 414243 − 6 − 8 − 8 − 914 −10 10 −3 11−11 −12244 −13 −3 16 −18 −19 4− 244 144 Ici, 14 n’étant pas un multiple de 4, il n’est pas possible de répartir ces notes en 4 parties de même effectif. D’après la définition : Q1 = Q2 = Q3 = L’intervalle interquartile est : L’écart interquartile est : Remarque : Selon la définition de la médiane, puisqu’il y a un nombre pair de valeurs (14), la Médiane (Me) est la moyenne des valeurs situées au 7ème et 8ème rang. Ainsi : Me = 10 + 11 = 10,5 2 www.maths-learning.fr 10 C L A S S E D E 1 S T G S T A T I S T I Q U E S . On remarque qu’ici, Me ≠ Q2 La règle générale, est de considérer que Me = Q2 . Cela ne change rien pour des séries constituées d’un grand nombre de valeurs, car il n’y a pas de saut important entre deux valeurs consécutives. 2.3 Les déciles. On considère une série statistique dont les termes sont classés par ordre croissant. Le premier décile D1 est le plus petit terme tel qu’au moins 10% des données soient inférieures ou égales à D1 Le deuxième décile D2 , le troisième décile D3 ,……..est le plus petit terme tel qu’au moins 20%, 30%,……des données soient inférieures ou égales à D2 , D3 …….. L’intervalle inter décile est [ D1 , D9 ] L’écart inter décile est D9 − D1 On résume tous ces résultats dans un diagramme en boîte (ou à moustaches) Voici le diagramme en boîte correspondant à l’exercice 7. Les valeurs Min et Max sont représentées par les petits ronds à gauche et à droite du graphique. D1 Q1 Med Q3 D9 A chercher. EXERCICE 8 Les résultats d’une enquête sur le prix de la baguette de pain dans les 30 boulangeries d’une ville sont regroupés dans le tableau suivant : Prix en centimes d’euros 68 70 72 74 75 76 78 80 85 90 92 Nombre de boulangeries 1 1 2 4 7 3 3 4 2 2 1 Effectifs cumulés croissants 1° Compléter la ligne des effectifs cumulés croissants. 2° En déduire la médiane, les 1er et 3ème quartiles, et les 1er et 9ème déciles de la série. 30 = 15 2 La médiane est donc la moyenne des valeurs observées au 15ème et au 16ème rang. Médiane : on calcule Me = JMD - Classe de 1 STG www.maths-learning.fr 11 C L A S S E D E 1 E R E S T G C O U R S Quartiles : on calcule D E S T A T I S T I Q U E S 30 = 7,5 4 Le 1er quartile est la valeur observée au rang 8. Ainsi Q1 = Pour le 3ème quartile, on calcule : 3× 30 = 22,5 4 Le 3ème quartile est donc la valeur observée au rang 23. Ainsi : Q3 = Déciles : on calcule 30 =3 10 Le 1er décile est la valeur observée au rang 3. Ainsi D1 = Pour le 9ème décile, on calcule : 9 × 30 = 27 10 Le 9ème décile est donc la valeur observée au rang 27 Ainsi : D9 = 3° Résumer la série par un diagramme en boîte. Préciser l’écart interquartile. En résumé, les indicateurs à marquer sur le diagramme en boîte sont : Valeur minimum = 1er décile = 1er quartile = Médiane = 3ème quartile = 9éme décile = Valeur maximum = www.maths-learning.fr 12 C L A S S E D E 1 S T G S T A T I S T I Q U E S . EXERCICE 9 Détermination des quartiles d’une série à caractère continu. Voici le récapitulatif des distances parcourues chaque jour pendant un mois par un livreur. Distance en Km Nombre de jours [0 ; 10[ 1 [10 ; 20[ 1 [ 20 ; 30[ 3 [30 ; 40[ 2 [ 40 ; 50[ 4 [50 ; 60[ 5 [60 ; 70[ 8 [70 ; 80[ 3 [80 ; 90[ 1 [90 ; 100[ 2 1. Effectifs cumulés croissants a) Compléter la ligne des effectifs cumulés croissants. b) Compléter le polygone des effectifs cumulés croissants (placer les lignes de rappel) y 30 25 20 15 10 5 0 10 JMD - Classe de 1 STG www.maths-learning.fr 20 30 40 50 60 70 80 90 100 110x 13 C L A S S E D E 1 E R E S T G C O U R S 2. D E S T A T I S T I Q U E S a) Déterminer graphiquement la médiane, les premiers et troisièmes quartiles et les premiers et neuvièmes déciles. On indiquera leur position sur l’axe des abscisses et les pourcentages correspondant sur l’axe des ordonnées. b) Résumer ces résultats à l’aide d’un diagramme en boîte en utilisant l’axe des abscisses du graphique précédent. y 0 3. 10 20 30 40 50 60 70 80 90 100 110x Vérifier tous vos résultats à l’aide de la calculatrice, et retrouvez l’aspect du diagramme en boîte. 3. Tableaux croisés d’effectifs. 3.1 Rappels. On considère le tableau relatif au montant des achats en euros de 2000 personnes dans un magasin un certain jour. Classe montant des achats [0 ; 200[ [ 200 ; 400[ [ 400 ; 600[ [600 ; 800[ ni fi Se souvenir que : ni N fi = f A∪ B = f A + f B − f A∩ B Si A et B disjoints, alors : f A∩ B = 0 , donc : f A∪ B = f A + f B www.maths-learning.fr 14 C L A S S E D E 1 S T G S T A T I S T I Q U E S . 3.2 Fréquence conditionnelle. On complète les données du tableau précédent par des infos concernent l’heure des achats. Montants des achats en € [0 ; 200[ [ 200 ; 400[ [ 400 ; 600[ [600 ; 800[ Total [9 ; 12[ 230 400 140 30 800 [14 ; 16[ 100 290 70 20 480 [16 ; 19[ 190 410 90 30 720 Total 520 1100 300 80 2000 Heure des achats On note A l’ensemble des achats dans la tranche [ 200 ; 400[ , donc : f A = On note B l’ensemble des achats effectués entre 9h et 12h, donc : f B = 1100 = 0,55 2000 800 = 0, 4 2000 A ∩ B est l’ensemble des achats dans la tranche [ 200 ; 400[ , effectués entre 9h et 12h : il y en a 400 Donc : f A∩ B = 400 = 0, 2 . 2000 C’est la fréquence conjointe de A et B. On s’intéresse maintenant à la fréquence des achats dont le montant est dans la tranche [ 200 ; 400[ sachant qu’ils ont été effectués entre 9h et 12h. Selon le tableau : 400 achats ont été effectués dans la tranche [ 200 ; 400[ 800 achats ont été effectués entre 9h et 12h. On écrira que : f B ( A) = 400 = 0,5 800 Il s’agit d’une fréquence conditionnelle. C’est la fréquence de A (achats dans la tranche [ 200 ; 400[ ) sachant B (achats effectués entre 9h et 12h). On remarque que : f B ( A) = f B ( A) est une fréquence conditionnelle. f ( A∩ B ) est une fréquence conjointe f ( B ) est la fréquence marginale de B. f A∩ B fB EXERCICE 10 JMD - Classe de 1 STG www.maths-learning.fr 15 C L A S S E D E 1 E R E S T G C O U R S D E S T A T I S T I Q U E S En reprenant les données du tableau précédent, calculer : 1. La fréquence des achats effectués entre 16h et 19h sachant que leur montant est compris entre 600€ inclus et 800€ exclus. On note A l’ensemble des achats dont le montant est dans la tranche [ 600 ; 800[ , et B l’ensemble des achats effectués entre 16h et 19h. f A∩ B = f ( A) = 2. On calcule : f A ( B ) = f( A∩ B) f ( A) = La fréquence des achats dont le montant est compris entre 600€ inclus et 800€ exclus, sachant qu’ils ont été effectués entre 16h et 19h. f A∩ B = f ( B) = On calcule : f B ( A) = f( A∩ B) f ( B) = www.maths-learning.fr 16