MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes
Transcription
MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes
MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie TERMINOLOGIE Chap. 2 Statistique descriptive et graphiques anglais – français Steam-and-leaf display ……….. histogramme de Tukey diagramme tige – feuilles Terminologie anglais - français Représentations graphiques : - histogramme de Tukey - histogramme Indicateurs de centralité et position Indicateurs de variabilité Autres diagrammes : - diagramme de Tukey Box-Plot ………………………….. diagramme de Tukey - diagramme quantile - quantile 2 variables : - diagramme de dispersion conjointe - droite de moindres carrés - coefficient de corrélation linéaire Cumulative frequency ………….. effectif cumulé Q-Q plot ………………………….. diagramme quantile - quantile Tally ……………………………… décompte Frequency ………………………… effectif Relative frequency ………………. fréquence ( fréquence relative ) Relative cumulative frequency … fréquence cumulée Standardized value ……………… valeur centrée – réduite Frequency distribution …………. tableau d’effectifs / distribution d’effectifs / tableau de fréquences 1 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie Histogramme de Tukey : histogramme avec le détail des valeurs numériques données observées de la variable MTH 2301 Méthodes statistiques en ingénierie Histogramme pour une variable X continue aperçu de la forme distribution, centre, données suspectes ,… Exemple: valeurs de X : x 1 , x 2 , ……., x n X 223 241 245 265 268 267 228 301 300 301 321 282 286 288 n au moins 50 Procédure 1. Déterminer valeur minimale et la valeur maximale des X tige feuille effectif 22 3 8 2 2 24 1 5 2 4 26 5 7 8 3 7 28 2 6 8 3 10 4. Calculer les fréquences relatives : n i / n 30 0 1 1 3 13 5. Calculer la somme progressive des n i 32 1 total effectif cumulé 2. Choisir entre 10 et 20 intervalles contigus 3. Recenser les effectifs n i de chaque classe 14 : effectifs cumulés 6. Calculer la somme progressive des n i / n 14 3 Bernard CLÉMENT, P h D 2 Bernard CLÉMENT, P h D 4 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie tableau d'effectifs effectif cumul de à % -1.00000<x<=-.80 1 1 0.7 10 11 6.7 -.800000<x<=-.60 24 35 16.0 -.600000<x<=-.40 39 74 26.0 -.400000<x<=-.20 26 100 -.200000<x<=.666 17.3 15 115 .666E-15<x<=.200 10.0 .2000000<x<=.400 10.0 15 130 .4000000<x<=.600 6.0 9 139 .6000000<x<=.800 4.0 6 145 2 147 .8000000<x<=1.00 1.3 0 147 1.000000<x<=1.20 0.0 1.200000<x<=1.40 1.3 2 149 1 150 1.400000<x<=1.60 0.7 Exemple : écart = longueur – 50 sur 3 machines observations toutes les heures: échantillon de 5 pièces MACH_1 MACH_2 MACH_3 % cumul 0.7 7.3 23.3 49.3 66.7 76.7 86.7 92.7 96.7 98.0 98.0 99.3 100.0 5 Bernard CLÉMENT, P h D 6 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie Exemple 2 : données = d’écarts de 50 longueurs p. r. à valeur nominale Histogrammes : exemples de 50 - production sur 3 machines Exemple 1 : données d’écarts de 150 longueurs p. r. à valeur nominale de 50 unités Histogram (_KolarikMeterStick(2) [Hist & QQ].sta 10v*150c) MACH_1 = 50*0.2*normal(x; 0.0839; 0.4346) MACH_2 = 50*0.2*normal(x; -0.2896; 0.1915) MACH_3 = 50*0.2*normal(x; -0.0678; 0.5288) Histogram ( 1v*150c) ecart = 150*0.2*normal(x; -0.0911; 0.4357) 45 22 20 35 18 30 16 14 25 No of obs No of obs 40 20 15 12 10 8 10 6 5 4 MACH_1 MACH_2 MACH_3 2 0 -1.2 -0.8 -0.4 0.0 0.4 ecart Bernard CLÉMENT, P h D 0.8 1.2 1.6 7 0 -1.2 Bernard CLÉMENT, P h D -0.8 -0.4 0.0 0.4 0.8 1.2 1.6 8 MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie Indicateurs de centralité et de position machine 2 Machine 1 8 8 7 7 6 6 5 No of obs No of obs 5 4 4 3 3 2 2 1 1 0 0 -0.6685 -0.4718 -0.2751 -0.0784 0.1182 0.3149 0.5116 0.7082 -0.7889 -0.6758 -0.5627 -0.4496 MACH_1 -0.3364 -0.2233 -0.1102 0.0029 MACH_2 Machine 3 toutes les données 35 9 8 30 7 25 No of obs No of obs 6 5 4 3 remarque 20 15 Il y a plusieurs façons de calculer les quantiles 10 2 5 1 0 0 -0.8615 -0.5436 -0.2257 0.0923 0.4102 0.7281 1.0460 -0.8615 1.3640 -0.5436 -0.2257 0.0923 0.4102 0.7281 1.0460 1.3640 ecart MACH_3 9 Bernard CLÉMENT, P h D 10 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie Indicateurs de variabilité indicateurs de centralité et position : MACH_1 mesures d’écarts sur la machine 1 moy n médiane mode min max Xbar 50 0,084 0,112 pas unique 1er quartile = 25 ième percentile 3ième quartile = 75 ième percentile Étendue échantillonnale R = max { x i } - min { x i } Étendue interquartile IQR = x 0.75 - x 0.25 Écart type échantillonnal s = [ ∑ ( xi - x ) / (n – 1) ] 0.5 Règle empirique 68% obs. dans x – s et x + s 95% obs. dans x - 2s et x + 2s 99,9% obs. dans x - 3s et x + 3s Valeur centrée réduite -0,668 0,807 -0,271 0,424 zi =( xi- x )/ s Propriétés 11 Bernard CLÉMENT, P h D z =0 sz = 1 12 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie Indicateurs de variabilité : MACH_1 MTH 2301 Méthodes statistiques en ingénierie MACH_2 MACH_3 Règle Machine n x min max R IQR x- s à x+s MACH_1 50 0,084 -0,668 0,807 1,475 0,695 0,435 MACH_2 50 -0,290 -0,789 0,059 0,848 0,257 0,191 -0,068 -0,862 1,523 2,384 0,553 x- 3s à x+ 3s - 0,351 à 0,518 -1,220 à 1,388 33 50 sur 50 2 - 0,864 - 0,481 à 0,098 sur 50 50 x- 2s à x + 2s s 1 MACH_3 empirique ? 36 à 0,285 50 0,529 3 - 0,597 à 0,461 -1,654 à 1,519 39 50 sur 50 13 Bernard CLÉMENT, P h D 14 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie Diagramme de Tukey : exemple longueurs sur 3 machines Diagramme de Tukey ou boîte à moustaches ( « Box Plot » ) rectangle avec quartiles Q1 Q2 L1 = min ( Q 1 - 1.5 * IQR , x ( 1 ) L 3 = min (Q 1 - 3 * IQR , x ( 1 ) ) ) Q3 + segments droites longueurs L2 = min ( Q 3 + 1.5 * IQR , x ( n ) ) L4 = min ( Q 3 + 3 * IQR , x ( n ) ) Box Plot (Machines.sta 10v*150c) 1.8 1.6 1.4 1.2 1.0 0.8 suspectes L1 0.6 L2 0.4 0.2 Q1 L3 Q2 Q3 0.0 L4 -0.2 -0.4 -0.6 utilité - variabilité - symétrie - données suspectes - comparaison de plusieurs groupes -0.8 -1.0 MACH_1 MACH_3 Median 25%-75% Non-Outlier Range Outliers MACH_2 15 Bernard CLÉMENT, P h D 16 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie Exemple : diagramme quantile – quantile - distributions des 3 machines Diagramme quantile – quantile 0.1 M2_ORD 0.0 Méthode graphique pour comparer 2 séries de données : -0.1 et y1 y2 y3 …… y n 0.4 M2_ORD …… x m 0.8 -0.3 M2_ORD x1 x2 x 3 M1_ORD droite Y = X M2_ORD vs M2_ORD -0.2 même forme ? mêmes moyennes ? mêmes écart types ? mêmes quantiles ? vs 1.2 -0.4 -0.5 0.0 -0.6 -0.4 cas 1 : -0.7 graphique des points ( x ( i ) , y ( i ) ) des valeurs ordonnées m=n -0.8 -0.9 -0.9 cas 2 : m<n graphique des points ( x ( i ) , y ( pi ) ) pi = i/ (m+1) -0.8 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 -0.8 0.1 -0.4 -0.2 1.8 i = 1 ,2 ,3… , m 1.8 1.4 1.6 1.0 0.6 0.8 1.0 0.8 M3_ORD M3_ORD Bernard CLÉMENT, P h D 0.8 1.0 0.4 0.2 0.6 0.4 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 17 0.6 1.2 0.6 -1.0 -0.9 0.4 1.4 0.8 alignement le long d’une droite 0.2 Scatterplot (MachinesV5.sta 10v*150c) 1.6 1.2 échantillons provenant de populations ayant la même forme : 0.0 M1_ORD 1.0 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 M1_ORD M2_ORD 18 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie 2 VARIABLES : diagramme de dispersion – droite de moindres carrés – coefficient de corrélation linéaire modèle Bernard CLÉMENT, P h D -0.6 M2_ORD poids ( lbs) MPG (ville) 2 VARIABLES : diagramme de dispersion – droite de moindres carrés coefficient de corrélation linéaire Matrix Plot (ch2-V5.sta 10v*100c) prix camry 3345 14 19900 grand Am 3035 12 14000 intrepid 3325 14 21100 mazda 2970 18 14300 saturn 2650 20 12000 talon 3225 14 17800 paseo 2190 24 10800 prelude 2865 19 20000 probe 2865 19 15200 sable 3325 13 18400 POIDS MPG PRIX 19 20 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie 2 VARIABLES : diagramme de dispersion – droite de moindres carrés coefficient de corrélation linéaire 2 VARIABLES : diagramme de dispersion – droite de moindres carrés coefficient de corrélation linéaire 21 Bernard CLÉMENT, P h D 22 Bernard CLÉMENT, P h D MTH 2301 Méthodes statistiques en ingénierie MTH 2301 Méthodes statistiques en ingénierie 2 VARIABLES : diagramme de dispersion – droite de moindres carrés coefficient de corrélation linéaire 2 VARIABLES : diagramme de dispersion – droite de moindres carrés coefficient de corrélation linéaire Scatterplot (ch2.sta 10v*100c) mpg = 45.4288-0.0096*x; 0.95 Conf.Int. 26 24 22 mpg 20 18 16 14 12 10 2000 2200 2400 2600 2800 3000 3200 3400 poids:mpg: r 2 = 0.8277; r = -0.9098, p = 0.0003; y poids = 45.4287916 - 0.0096421519*x 23 Bernard CLÉMENT, P h D 24 Bernard CLÉMENT, P h D