MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes

Transcription

MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
TERMINOLOGIE
Chap. 2 Statistique descriptive et graphiques
anglais – français
Steam-and-leaf display ……….. histogramme de Tukey
diagramme tige – feuilles
ƒ Terminologie anglais - français
ƒ Représentations graphiques : - histogramme de Tukey
- histogramme
ƒ Indicateurs de centralité et position
ƒ Indicateurs de variabilité
ƒ Autres diagrammes : - diagramme de Tukey
Box-Plot ………………………….. diagramme de Tukey
- diagramme quantile - quantile
ƒ 2 variables : - diagramme de dispersion conjointe
- droite de moindres carrés
- coefficient de corrélation linéaire
Cumulative frequency ………….. effectif cumulé
Q-Q plot ………………………….. diagramme quantile - quantile
Tally ……………………………… décompte
Frequency ………………………… effectif
Relative frequency ………………. fréquence ( fréquence relative )
Relative cumulative frequency … fréquence cumulée
Standardized value ……………… valeur centrée – réduite
Frequency distribution …………. tableau d’effectifs
/ distribution d’effectifs / tableau de fréquences
1
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
Histogramme de Tukey : histogramme avec le détail des valeurs numériques
données observées de la variable
MTH 2301 Méthodes statistiques en ingénierie
Histogramme pour une variable X continue
aperçu de la forme distribution, centre, données suspectes ,…
Exemple:
valeurs de X : x 1 , x 2 , ……., x n
X
223 241 245 265 268 267 228 301 300 301 321 282 286 288
n au moins 50
Procédure
1. Déterminer valeur minimale et la valeur maximale des X
tige
feuille
effectif
22
3 8
2
2
24
1 5
2
4
26
5 7 8
3
7
28
2 6 8
3
10
4. Calculer les fréquences relatives : n i / n
30
0 1 1
3
13
5. Calculer la somme progressive des n i
32
1
total
effectif cumulé
2. Choisir entre 10 et 20 intervalles contigus
3. Recenser les effectifs n i de chaque classe
14
:
effectifs cumulés
6. Calculer la somme progressive des n i / n
14
3
Bernard CLÉMENT, P h D
2
Bernard CLÉMENT, P h D
4
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
tableau d'effectifs
effectif
cumul
de
à
%
-1.00000<x<=-.80
1
1
0.7
10
11
6.7
-.800000<x<=-.60
24
35
16.0
-.600000<x<=-.40
39
74
26.0
-.400000<x<=-.20
26
100
-.200000<x<=.666
17.3
15
115
.666E-15<x<=.200
10.0
.2000000<x<=.400
10.0
15
130
.4000000<x<=.600
6.0
9
139
.6000000<x<=.800
4.0
6
145
2
147
.8000000<x<=1.00
1.3
0
147
1.000000<x<=1.20
0.0
1.200000<x<=1.40
1.3
2
149
1
150
1.400000<x<=1.60
0.7
Exemple :
écart = longueur – 50
sur 3 machines
observations
toutes les heures:
échantillon de
5 pièces
MACH_1
MACH_2
MACH_3
% cumul
0.7
7.3
23.3
49.3
66.7
76.7
86.7
92.7
96.7
98.0
98.0
99.3
100.0
5
Bernard CLÉMENT, P h D
6
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Exemple 2 : données = d’écarts de 50 longueurs p. r. à valeur nominale
Histogrammes : exemples
de 50 - production sur 3 machines
Exemple 1 : données d’écarts de 150 longueurs p. r. à valeur nominale de 50 unités
Histogram (_KolarikMeterStick(2) [Hist & QQ].sta 10v*150c)
MACH_1 = 50*0.2*normal(x; 0.0839; 0.4346)
MACH_2 = 50*0.2*normal(x; -0.2896; 0.1915)
MACH_3 = 50*0.2*normal(x; -0.0678; 0.5288)
Histogram ( 1v*150c)
ecart = 150*0.2*normal(x; -0.0911; 0.4357)
45
22
20
35
18
30
16
14
25
No of obs
No of obs
40
20
15
12
10
8
10
6
5
4
MACH_1
MACH_2
MACH_3
2
0
-1.2
-0.8
-0.4
0.0
0.4
ecart
Bernard CLÉMENT, P h D
0.8
1.2
1.6
7
0
-1.2
Bernard CLÉMENT, P h D
-0.8
-0.4
0.0
0.4
0.8
1.2
1.6
8
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Indicateurs de centralité et de position
machine 2
Machine 1
8
8
7
7
6
6
5
No of obs
No of obs
5
4
4
3
3
2
2
1
1
0
0
-0.6685
-0.4718
-0.2751
-0.0784
0.1182
0.3149
0.5116
0.7082
-0.7889
-0.6758
-0.5627
-0.4496
MACH_1
-0.3364
-0.2233
-0.1102
0.0029
MACH_2
Machine 3
toutes les données
35
9
8
30
7
25
No of obs
No of obs
6
5
4
3
remarque
20
15
Il y a plusieurs
façons de
calculer les
quantiles
10
2
5
1
0
0
-0.8615
-0.5436
-0.2257
0.0923
0.4102
0.7281
1.0460
-0.8615
1.3640
-0.5436
-0.2257
0.0923
0.4102
0.7281
1.0460
1.3640
ecart
MACH_3
9
Bernard CLÉMENT, P h D
10
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Indicateurs de variabilité
indicateurs de centralité et position : MACH_1
mesures d’écarts sur la machine 1
moy
n
médiane
mode
min
max
Xbar
50
0,084
0,112
pas
unique
1er
quartile
=
25 ième
percentile
3ième
quartile
=
75 ième
percentile
Étendue échantillonnale
R = max { x i } - min { x i }
Étendue interquartile
IQR = x 0.75 - x 0.25
Écart type échantillonnal
s = [ ∑ ( xi - x ) / (n – 1) ] 0.5
Règle empirique
68% obs. dans
x – s et x + s
95% obs. dans
x - 2s et x + 2s
99,9% obs. dans
x - 3s et x + 3s
Valeur centrée réduite
-0,668
0,807
-0,271
0,424
zi =( xi- x )/ s
Propriétés
11
Bernard CLÉMENT, P h D
z =0
sz = 1
12
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
Indicateurs de variabilité : MACH_1
MTH 2301 Méthodes statistiques en ingénierie
MACH_2 MACH_3
Règle
Machine
n
x
min
max
R
IQR
x- s à x+s
MACH_1
50
0,084
-0,668
0,807
1,475
0,695
0,435
MACH_2
50
-0,290
-0,789
0,059
0,848
0,257
0,191
-0,068
-0,862
1,523
2,384
0,553
x- 3s à x+ 3s
- 0,351 à 0,518
-1,220 à 1,388
33
50
sur 50
2
- 0,864
- 0,481 à 0,098
sur 50
50
x- 2s à x + 2s
s
1
MACH_3
empirique ?
36
à 0,285
50
0,529
3
- 0,597 à 0,461
-1,654 à 1,519
39
50
sur 50
13
Bernard CLÉMENT, P h D
14
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Diagramme de Tukey : exemple longueurs sur 3 machines
Diagramme de Tukey ou boîte à moustaches ( « Box Plot » )
rectangle avec quartiles
Q1
Q2
L1 = min ( Q 1 - 1.5 * IQR , x ( 1
)
L 3 = min (Q 1 - 3 * IQR , x ( 1
)
)
)
Q3
+ segments droites longueurs
L2 = min ( Q 3 + 1.5 * IQR , x ( n ) )
L4 = min ( Q 3 + 3 * IQR , x ( n ) )
Box Plot (Machines.sta 10v*150c)
1.8
1.6
1.4
1.2
1.0
0.8
suspectes
L1
0.6
L2
0.4
0.2
Q1
L3
Q2
Q3
0.0
L4
-0.2
-0.4
-0.6
utilité
- variabilité
- symétrie
- données suspectes
- comparaison de plusieurs groupes
-0.8
-1.0
MACH_1
MACH_3
Median
25%-75%
Non-Outlier Range
Outliers
MACH_2
15
Bernard CLÉMENT, P h D
16
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
Exemple : diagramme quantile – quantile - distributions des 3 machines
Diagramme quantile – quantile
0.1
M2_ORD
0.0
Méthode graphique pour comparer 2 séries de données :
-0.1
et
y1 y2 y3
…… y n
0.4
M2_ORD
…… x m
0.8
-0.3
M2_ORD
x1 x2 x 3
M1_ORD
droite Y = X
M2_ORD vs M2_ORD
-0.2
même forme ? mêmes moyennes ? mêmes écart types ? mêmes quantiles ?
vs
1.2
-0.4
-0.5
0.0
-0.6
-0.4
cas 1 :
-0.7
graphique des points ( x ( i ) , y ( i ) ) des valeurs ordonnées
m=n
-0.8
-0.9
-0.9
cas 2 :
m<n
graphique des points ( x ( i
)
, y ( pi ) )
pi = i/ (m+1)
-0.8
-0.8
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2
-0.1
0.0
-0.8
0.1
-0.4
-0.2
1.8
i = 1 ,2 ,3… , m
1.8
1.4
1.6
1.0
0.6
0.8
1.0
0.8
M3_ORD
M3_ORD
Bernard CLÉMENT, P h D
0.8
1.0
0.4
0.2
0.6
0.4
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
17
0.6
1.2
0.6
-1.0
-0.9
0.4
1.4
0.8
alignement le long d’une droite
0.2
Scatterplot (MachinesV5.sta 10v*150c)
1.6
1.2
échantillons provenant de populations ayant la même forme :
0.0
M1_ORD
1.0
-0.8
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2
-0.1
0.0
0.1
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
M1_ORD
M2_ORD
18
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
2 VARIABLES : diagramme de dispersion – droite de moindres
carrés – coefficient de corrélation linéaire
modèle
Bernard CLÉMENT, P h D
-0.6
M2_ORD
poids ( lbs)
MPG (ville)
2 VARIABLES : diagramme de dispersion – droite de moindres carrés
coefficient de corrélation linéaire
Matrix Plot (ch2-V5.sta 10v*100c)
prix
camry
3345
14
19900
grand Am
3035
12
14000
intrepid
3325
14
21100
mazda
2970
18
14300
saturn
2650
20
12000
talon
3225
14
17800
paseo
2190
24
10800
prelude
2865
19
20000
probe
2865
19
15200
sable
3325
13
18400
POIDS
MPG
PRIX
19
20
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
2 VARIABLES : diagramme de dispersion – droite de moindres carrés
coefficient de corrélation linéaire
2 VARIABLES : diagramme de dispersion – droite de moindres
carrés coefficient de corrélation linéaire
21
Bernard CLÉMENT, P h D
22
Bernard CLÉMENT, P h D
MTH 2301 Méthodes statistiques en ingénierie
MTH 2301 Méthodes statistiques en ingénierie
2 VARIABLES : diagramme de dispersion – droite de moindres
carrés coefficient de corrélation linéaire
2 VARIABLES : diagramme de dispersion – droite de moindres
carrés coefficient de corrélation linéaire
Scatterplot (ch2.sta 10v*100c)
mpg = 45.4288-0.0096*x; 0.95 Conf.Int.
26
24
22
mpg
20
18
16
14
12
10
2000
2200
2400
2600
2800
3000
3200
3400
poids:mpg: r 2 = 0.8277; r = -0.9098, p = 0.0003; y poids
= 45.4287916 - 0.0096421519*x
23
Bernard CLÉMENT, P h D
24
Bernard CLÉMENT, P h D