Statistiques.. .
Transcription
Statistiques.. .
STATISTIQUES La statistique étudie des « p……………………….. » suivant de ses valeurs. • certains caractères • L’étendue de la série statistique est la différence entre la plus ……………… valeur du caractère et la plus …………………………. Rappels : • • Le caractère étudié peut être la taille ; la longueur ; la couleur , ect… Lorsque les valeurs du caractère sont numériques on dit que ce caractère est ……………………… Lorsque les valeurs du caractère ne sont pas numériques on dit que ce caractère est …………………. Le mode est la valeur qui a le plus grand ………………………... • Médiane : On appelle médiane tout réel me tel que : au moins 50% des termes de la série ont une valeur inférieure ou égale à me et au moins 50% des termes de la série ont une valeur supérieure ou égale à me Dans la suite on note x1 ; x2 ..........; x p les différentes valeurs possibles du Rq : Lorsque que plusieurs choix sont possibles l’usage veut que l’on prenne la moyenne des termes extrêmes possibles caractère étudié Ex 1° ) Trouver la médiane de la série suivante : 5 ; 5 ; 8 ; 15 ; 18 ; 19 ;19 ;21 L’effectif de la valeur xi est le nombre d’apparitions de xi : on le note ni • L’effectif total N est la somme des effectifs : N = n1 + n2 + n3 + n4 + ............... + n p En maths on utilise le symbole somme ∑ du coup avec ce symbole • N = …………………… La fréquence f i de la valeur xi est le quotient : .... .................................. = ..... ................................................ Ex 2 °) Trouver la médiane de la série suivante : 100 ; 110 ;110 ; 119 ; 120 ;120 ;121 Ex 3°) Trouver la médiane de la série suivante : 9 ;9 ;9 ;12 ; 16 ;18 ; 7 exemple 4°) On a relevé les notes dans une classe Notes 3 6 4 8 10 12 effectifs 1 1 2 2 4 3 Fréquences a) Compléter le tableau. b) Calculer l’étendue . c) Déterminer le mode La somme des fréquences vaut ……… • La fréquence cumulée jusqu’à la valeur xk est : f1 + f 2 + ..... + f k …………….. ……………. d) Calculer la médiane …………………………….. 16 2 17 1 • Quartile : Le premier quartile est le plus petit élément Q1 des valeurs des termes de la série, tel qu’au moins 25 % des données soient inférieures ou égales à Q1. Le troisième quartile Q3 est le plus petit élément Q3 des valeurs des termes de la série, tel qu’au moins 75 % des données soient inférieures ou égales à Q3. • La distance entre Q1 et Q3 s’appelle l’écart interquartile. La moyenne, désignée par x , est le quotient de la somme des valeurs du caractère (pondérées par les effectifs) divisé par l’effectif total : x= n1 x1 + n2 x2 + ...... + n p x p N p Ceci se note aussi : ∑ i=1 ..................... ........ Compléter : La moyenne peut aussi se calculer avec les fréquences : x = ......................................................... p Q1 , M et Q3 permettent de couper la population en 4 groupes contenant le même nombre d’éléments x = ∑ ................. i =1 d) Calculer Q1 et Q3 . ( pour l’exemple 4 ) …………………………………………….. Bien sûr on ne peut pas calculer de moyenne lorsque le caractère est • ……………………… Faire le Diagramme en boite Lorsque que la série est continue ( et les données réparties en classe) on utilise en générale le centre de la classe pour calculer la moyenne. Valeurs [ 130 ; 150[ [150 ; 170[ tailles en cm effectif 2 3 Sur l’exemple ci–dessus la moyenne est : • Décile Le premier décile est le plus petit élément D1 des valeurs des termes de la série, tel qu’au moins 10 % des données soient inférieures ou égales à D1. Le Neuvième Décile est le plus petit élément D9 des valeurs des termes de la série, tel qu’au moins 90 % des données soient inférieures ou égales à D9. e) Calculer D1 et D9 . ( pour l’exemple 4 ) ………………. [170 ; 190 [ 2 × .................. + 3 × .................... + 5 × .................... = ………. 10 e) Calculer la moyenne de l’exemple 4 : 5 • Variance La variance d’une série statistique est la moyenne des carrés des écarts à la moyenne. Elle permet de mesurer la dispersion des valeurs autour de la moyenne. a (...........................................................) .................... + N N ………….. Variance = Soit a et b deux réels fixés et une série statistique ( x1 ; x2 ; ….. ; xN ) de médiane Me alors la série statistique ( y1 ; y2 ; …. ; yn ) avec yi = axi + b . ........................................................................................................................... N 1 on note Variance V = N ......... ∑ ................................. y= a pour médiane ……………… Autre formule de la variance : 2 1 p V = ∑ nk x 2 k − x = ( x 2 ) − x N k =1 () () Elle représente la différence entre la moyenne des carrées et le carré de la moyenne 2 .......... • Écart Type L’écart type « s » d’une série statistique est la racine carrée de la variance s= V f) Calculer la variance et l’écart type de l’exemple 4 Propriété : Pour la suite on considère une série statistique avec p valeurs x1 ; x2 ; ….. ; xp et on note ni l’effectif de la valeur xi et N désigne l’effectif total. Soit a et b deux réels fixés et une série statistique ( x1 ; x2 ; ….. ; xp ) de moyenne x alors la série statistique ( y1 ; y2 ; …. ; yn ) où avec yi = axi + b = Démonstration : 2 2 1 p 2 V = ∑ nk xk − x ² or on sait que xk − x = xk + x − .2 xk x.. N k =1 donc 2 1 p 1 p 1 p 2 V = ∑ nk xk + ∑ ..nk .. × x − ∑ .2nk xk x. N k =1 N k =1 N k =1 ( ( ) ) () 1 V = N ( x ) − ( x) 2 () + x 2 1 N () .( x 2 ). V= V= 2 ..nk xk .. ∑ k =1 p p ∑ ..nk .. k =1 2 + ... x .... − 2x 1 N p ∑ ..n x .. k =1 k k () 2 − 2.. x .. 2 .. a pour moyenne …………….. preuve : x = n1 x1 + n2 x2 + ...... + n p x p et N .................................................................................... y = N Soit a et b deux réels fixés et une série statistique ( x1 ; x2 ; ….. ; xp ) d’écart type « s » alors la série statistique ( y1 ; y2 ; …. ; yn ) où avec yi = axi + b pour écart type …………….. a Tableau à double entrée : • Moyenne mobile ( lissage ) Soit une série chronologique date 1 2 valeur x1 x2 Répartition en effectifs des salariés d’une entreprise suivant le sexe et le type d’emploi. ….. x3 n xn B A La série de moyenne d’ordre 3 est définie de la façon suivante : Y2= (x1+x2+x3)/3 ; y3=(x2+x3+x4)/n La série de moyenne d’ordre 5 est définie de la façon suivante : z3= (x1+x2+x3+x4+x5) /5 Jours 1 2 Prix Moy odre 3 moy ordre5 7 5 5,7 3 4 5 6 7 5 2 9 4 5,3 7 5,6 6,2 8,6 10 12 11 17 15 12 8 9 10 18 5 13 9,7 11 6 Cadre moyen « Cm » Employé «E» Total Homme ( H) 15 30 60 105 Femme (F) 3 42 150 195 18 72 210 300 Total exemple Cadre supérieur « Cs » Les lignes et colonnes totales sont les marges des tableau. Table des fréquences par rapport à l’ensemble : B A Cadre supérieur « Cs » Cadre moyen « Cm » Employé «E» Total Homme ( H) 5% 10% 20% 35% Femme (F) 1% 14% 50% 65% 6% 24% 70% 100% Total Les lignes et colonnes totales sont les Fréquences marginales B°) Fréquences conditionnels : Parmis les Hommes 60 sont employés. La fréquence ( conditionnelle) des employé parmis les hommes est : 60/105 = 4/7 = 57,1 % On dit aussi la fréquence de E sachant H et on la note fH(E) = 57,1% Calculer fCM( F) = 58 ,33 Arbre : puis fF( CM) = 21,5%