Statistiques.. .

Transcription

Statistiques.. .
STATISTIQUES
La statistique étudie des « p……………………….. » suivant
de ses valeurs.
•
certains caractères
•
L’étendue de la série statistique est la différence entre la plus
……………… valeur du caractère et la plus ………………………….
Rappels :
•
•
Le caractère étudié peut être la taille ; la longueur ; la couleur ,
ect…
Lorsque les valeurs du caractère sont numériques on dit que ce caractère
est ………………………
Lorsque les valeurs du caractère ne sont pas numériques on dit que ce
caractère est ………………….
Le mode est la valeur qui a le plus grand ………………………...
• Médiane :
On appelle médiane tout réel me tel que :
au moins 50% des termes de la série ont une valeur inférieure ou égale à
me
et
au moins 50% des termes de la série ont une valeur supérieure ou égale à
me
Dans la suite on note x1 ; x2 ..........; x p les différentes valeurs possibles du
Rq : Lorsque que plusieurs choix sont possibles l’usage veut que l’on prenne la
moyenne des termes extrêmes possibles
caractère étudié
Ex 1° ) Trouver la médiane de la série suivante :
5 ; 5 ; 8 ; 15 ; 18 ; 19 ;19 ;21
L’effectif de la valeur xi est le nombre d’apparitions de xi : on le note
ni
•
L’effectif total N est la somme des effectifs :
N = n1 + n2 + n3 + n4 + ............... + n p
En maths on utilise le symbole somme ∑
du coup avec ce symbole
•
N = ……………………
La fréquence f i de la valeur xi est le quotient :
....
..................................
=
.....
................................................
Ex 2 °) Trouver la médiane de la série suivante :
100 ; 110 ;110 ; 119 ; 120 ;120 ;121
Ex 3°) Trouver la médiane de la série suivante :
9 ;9 ;9 ;12 ; 16 ;18 ; 7
exemple 4°) On a relevé les notes dans une classe
Notes
3
6
4
8
10
12
effectifs
1
1
2
2
4
3
Fréquences
a) Compléter le tableau.
b) Calculer l’étendue .
c) Déterminer le mode
La somme des fréquences vaut ………
•
La fréquence cumulée jusqu’à la valeur xk est : f1 + f 2 + ..... + f k
……………..
…………….
d) Calculer la médiane ……………………………..
16
2
17
1
• Quartile :
Le premier quartile est le plus petit élément Q1 des valeurs des termes de
la série, tel qu’au moins 25 % des données soient inférieures ou égales à
Q1.
Le troisième quartile Q3 est le plus petit élément Q3 des valeurs des
termes de la série, tel qu’au moins 75 % des données soient inférieures
ou égales à Q3.
•
La distance entre Q1 et Q3 s’appelle l’écart interquartile.
La moyenne, désignée par x , est le quotient de la somme des valeurs
du caractère (pondérées par les effectifs) divisé par l’effectif total :
x=
n1 x1 + n2 x2 + ...... + n p x p
N
p
Ceci se note aussi :
∑
i=1
.....................
........
Compléter : La moyenne peut aussi se calculer avec les fréquences :
x = .........................................................
p
Q1 , M et Q3 permettent de couper la population en 4 groupes
contenant le même nombre d’éléments
x = ∑ .................
i =1
d) Calculer Q1 et Q3 . ( pour l’exemple 4 )
……………………………………………..
Bien sûr on ne peut pas calculer de moyenne lorsque le caractère est
•
………………………
Faire le Diagramme en boite
Lorsque que la série est continue ( et les données réparties en classe) on
utilise en générale le centre de la classe pour calculer la moyenne.
Valeurs
[ 130 ; 150[
[150 ; 170[
tailles en cm
effectif
2
3
Sur l’exemple ci–dessus la moyenne est :
• Décile
Le premier décile est le plus petit élément D1 des valeurs des termes de
la série, tel qu’au moins 10 % des données soient inférieures ou égales à
D1.
Le Neuvième Décile est le plus petit élément D9 des valeurs des termes
de la série, tel qu’au moins 90 % des données soient inférieures ou
égales à D9.
e) Calculer D1 et D9 . ( pour l’exemple 4 ) ……………….
[170 ; 190 [
2 × .................. + 3 × .................... + 5 × ....................
= ……….
10
e) Calculer la moyenne de l’exemple 4 :
5
• Variance
La variance d’une série statistique est la moyenne des carrés des écarts à
la moyenne. Elle permet de mesurer la dispersion des valeurs autour de
la moyenne.
a (...........................................................) ....................
+
N
N
…………..
Variance =
Soit a et b deux réels fixés et une série statistique
( x1 ; x2 ; ….. ; xN ) de médiane Me
alors la série statistique ( y1 ; y2 ; …. ; yn ) avec yi = axi + b
. ...........................................................................................................................
N
1
on note Variance V =
N
.........
∑ .................................
y=
a pour médiane ………………
Autre formule de la variance :
2
1 p

V =  ∑ nk x 2 k  − x = ( x 2 ) − x
 N k =1

()
()
Elle représente la
différence entre la
moyenne des carrées et le
carré de la moyenne
2
..........
• Écart Type
L’écart type « s » d’une série statistique est la racine carrée de la
variance
s= V
f) Calculer la variance et l’écart type de l’exemple 4
Propriété : Pour la suite on considère une série statistique avec p
valeurs x1 ; x2 ; ….. ; xp et on note ni l’effectif de la valeur xi et N
désigne l’effectif total.
Soit a et b deux réels fixés et une série statistique ( x1 ; x2 ; ….. ; xp )
de moyenne x
alors la série statistique ( y1 ; y2 ; …. ; yn ) où avec yi = axi + b
=
Démonstration :
2
2
1 p
2
V = ∑ nk xk − x ² or on sait que xk − x = xk + x − .2 xk x..
N k =1
donc
2
1 p
1 p
1 p
2
V =  ∑ nk xk 
+ ∑ ..nk .. × x
− ∑ .2nk xk x.
N k =1
N k =1
 N k =1

(
(
)
)
()
1
V =
N
( x ) − ( x)
2
()
+ x
2
1
N
()
.( x 2 ).
V=
V=
2 
..nk xk .. 
∑
k =1

p
p
∑ ..nk ..
k =1
2
+ ... x ....
− 2x
1
N
p
∑ ..n x ..
k =1
k k
()
2
− 2.. x ..
2
..
a pour moyenne ……………..
preuve : x =
n1 x1 + n2 x2 + ...... + n p x p
et
N
....................................................................................
y =
N
Soit a et b deux réels fixés et une série statistique ( x1 ; x2 ; ….. ; xp )
d’écart type « s »
alors la série statistique ( y1 ; y2 ; …. ; yn ) où avec yi = axi + b
pour écart type ……………..
a
Tableau à double entrée :
• Moyenne mobile ( lissage )
Soit une série chronologique
date
1
2
valeur
x1
x2
Répartition en effectifs des salariés d’une entreprise suivant le sexe et le type d’emploi.
…..
x3
n
xn
B
A
La série de moyenne d’ordre 3 est définie de la façon suivante :
Y2= (x1+x2+x3)/3 ; y3=(x2+x3+x4)/n
La série de moyenne d’ordre 5 est définie de la façon suivante :
z3= (x1+x2+x3+x4+x5) /5
Jours
1
2
Prix
Moy odre 3
moy ordre5
7
5
5,7
3
4
5
6
7
5
2
9
4 5,3
7
5,6 6,2 8,6
10
12
11
17
15
12
8
9
10
18
5
13 9,7
11
6
Cadre
moyen
« Cm »
Employé
«E»
Total
Homme
( H)
15
30
60
105
Femme
(F)
3
42
150
195
18
72
210
300
Total
exemple
Cadre
supérieur
« Cs »
Les lignes et colonnes totales sont les marges des tableau.
Table des fréquences par rapport à l’ensemble :
B
A
Cadre
supérieur
« Cs »
Cadre
moyen
« Cm »
Employé
«E»
Total
Homme
( H)
5%
10%
20%
35%
Femme
(F)
1%
14%
50%
65%
6%
24%
70%
100%
Total
Les lignes et colonnes totales sont les Fréquences marginales
B°) Fréquences conditionnels :
Parmis les Hommes 60 sont employés.
La fréquence ( conditionnelle) des employé parmis les hommes est :
60/105 = 4/7 = 57,1 %
On dit aussi la fréquence de E sachant H et on la note fH(E) = 57,1%
Calculer fCM( F) = 58 ,33
Arbre :
puis fF( CM) = 21,5%