Graphique de dispersion de la variance

Transcription

Graphique de dispersion de la variance
 Document Support Technique Minitab® Statistical Software : Graphique de dispersion de la variance Le graphique de dispersion de la variance et les plans d’expérience Le graphique de dispersion de la variance est utile pour sélectionner le plan d’expérience (DOE) adéquat. Cette représentation graphique montre, dans l’espace du plan, la variance de prédiction échelonnée d’un plan d’expérience. Le graphique de dispersion de la variance est en général utilisé pour comparer des plans de surface de réponse, cependant il peut aussi être exploité pour évaluer les performances d’un plan ou comparer celles de plusieurs plans pour un modèle spécifique, tels le modèle linéaire, le modèle linéaire avec termes d’interaction, le modèle linéaire avec termes quadratiques ou le modèle quadratique complet. Ce document vise à expliciter la définition et l’interprétation d’un graphique de dispersion de la variance mais aussi la création d’une telle représentation à l’aide d’un fichier exécutable appelé « Macro Minitab ». Enfin, il vous montre comment ce graphe peut vous permettre de comparer deux plans ou plus et d’évaluer l’effet de l’ajout de points centraux. Histoire et contexte Le graphique de dispersion de la variance a été développé par Giovannitti‐Jensen et Myers (1989), puis Myers et al. (1992) pour obtenir un instantané de la stabilité de la variance de prédiction échelonnée dans l’espace du plan. Mathématiquement, la variance de prédiction échelonnée peut être estimée à l’aide de l’équation suivante : où v(x) est la variance de prédiction échelonnée au point x sachant, comme le prouve l’équation, que cette variance de pédiction ne dépend pas de la variable de réponse mais de la matrice du plan X. En d’autres termes, la variance de prédiction échelonnée est fonction du nombre d’essais, de la matrice de covariance et du point à compter duquel vous la calculez. Etant donné que la variance de prédiction échelonnée affichée par le graphique en question ne dépend pas de la variable de réponse, le graphique de dispersion de la variance vous aide à évaluer le bien‐fondé d’un plan, a priori. De manière générale, un graphique de dispersion de la variance est construit à partir de quatre éléments :  Une courbe représentant la variance sphérique en fonction du rayon r. La variance sphérique correspond à v(x) rayon r. intégré à la surface d’une sphère de  Une courbe représentant la variance de prédiction maximale sur un rayon r pour des valeurs multiples de r à partir de l’origine jusqu’à l’extrémité du plan (r prend la valeur zéro et augmente pas à pas par incréments plus éloigné de l’origine). faibles pour atteindre le point du plan le Bureau Téléphone Courriel Site internet Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/ 

Une courbe représentant la variance de prédiction minimale sur un rayon r pour des valeurs multiples de r à partir de l’origine. Une ligne horizontale pour la variance égale à v(x) = p, où p est le nombre de paramètres dans le modèle pour l’ajustement. Si la variance de prédiction maximale est inférieure ou égale à p pour chaque point de l’espace du plan, alors, il s’agit d’un plan “optimal”. L’exemple d’un graphique de dispersion de la variance pour un plan Box‐Behnken à trois facteurs construit à l’aide d’un modèle quadratique est illustré à la figure 1. Graphique de dispersion de la variance pour un plan Box-Behnken
k = 3 facteurs, N = 15
Variance de prédiction échelonnée
15,0
Variable
minimum v (x)
moy v(x)
maximum v(x)
Paramètres
12,5
10,0
7,5
5,0
0,0
0,2
0,4
0,6
0,8
1,0
Distance de l'origine
1,2
1,4
Figure 1 : graphique de dispersion de la variance pour un modèle quadratique Le graphique de dispersion de la variance indique les variances de prédiction échelonnée moyenne, maximale et minimale pour chaque valeur de r, ce qui représente concrètement la distance de tout point par rapport à l’origine ou au centre du plan. Créer un graphique de dispersion de la variance à l’aide d’une macro Minitab Vous pouvez lancer une macro pour créer un graphique de dispersion de la variance puis comparer deux plans ou plus à l’aide de cette représentation graphique. 1. Téléchargez la macro appelée VDG.mac [Variance Dispersion Graph en anglais], mis à notre disposition gratuitement dans la bibliothèque de macros Minitab en ligne (pages Internet en anglais) et sauvegardez‐la dans le répertoire de vos fichiers exécutables Minitab (soit, par défaut, C:\Program Files\Minitab\Minitab 16\French\Macros). 2. Lancez Minitab. Dans la même feuille de travail également appelée fenêtre des données, saisissez les plans que vous voulez comparer, comme illustré à la figure 2. Bureau Téléphone Courriel Site internet Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/ Figure 2 : plans saisis dans une feuille de travail unique 3. Sélectionnez Données > Copier > Colonnes dans matrice [Data > Copy > Columns to Matrix]. Dans le champ Copier à partir des colonnes [Copy from columns], indiquez les colonnes qui définissent le plan. Dans la section Stocker les données copiées [Store copied data], renseignez la matrice utilisée pour stocker le plan. (Remarque : Toutes les matrices stockées ont un identifiant unique propre commençant par m (m1, m2, m3, etc.). La figure 3 vous montre la copie d’écran d’une boîte de dialogue ainsi complétée. Dans notre exemple, le plan composite centré défini en colonnes C1, C2, C3 de la feuille de travail de la figure 2 apparaîtra dans la matrice m1. Figure 3 : stocker un plan sous la forme d’une matrice Bureau Téléphone Courriel Site internet Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/ 4. Répétez le point 3 de ces instructions pour chaque plan de la feuille de travail. Ainsi, pour sauvegarder le plan Box‐Behnken des colonnes C5‐C7 de la feuille de travail représentée à la figure 2, sélectionnez Données > Copier > Colonnes dans matrice, puis, dans la boîte de dialogue, entrez C5‐C7 et stockez‐la en tant que matrice m2. Lorsque les matrices sont sauvegardées, vous pouvez lancer la macro et afficher le graphique comme suit : 1. Sélectionnez Editeur > Editeur de ligne de commande [Edit > Command Line Editor]. 2. Tapez la commande %VDG m1 m2 comme indiqué ci‐dessous à la figure 4. Vous pouvez utiliser des sous‐
commandes pour préciser certaines options telles que le type de modèle (cf la remarque à la page suivante). Figure 4 : lignes de commande à saisir pour créer un graphique de dispersion de la variance 3. Cliquer sur le bouton Soumettre les commandes [Submit Commands]. Remarque : vous pouvez utiliser les sous‐commandes listées ci‐après pour préciser le type de modèle, la résolution, etc. Sous‐
commande MODEL
Valeur par défaut Interaction Description Spécifie le modèle à tester quand l’expérience est réalisée. Vous pouvez indiquer des modèles multiples, tels que ‘linéaire’, ‘quadratique’, ‘interaction’, ‘quadratique pur’. Chaque modèle comprend les termes suivants : linéaire termes linéaires et constants interaction termes linéaires, constants et leur produit croisé quadratique interactions et termes carrés quadratique pur termes linéaires, constants et termes carrés RESOLUTION
500 points du plan INCREMENT
0,1 unité codée Bord du plan MAXDIST
Bureau Téléphone Courriel Site internet Indique le nombre de points du plan échantillonnés pour estimer la variance de prédiction minimale, maximale et moyenne à chaque valeur distincte du rayon. Pour les plans sujets à rotation, vous pouvez sélectionner une faible résolution. Pour les autres plans, il sera peut‐être nécessaire d’augmenter la résolution à chaque fois que le nombre de facteurs augmente. Spécifie l’incrémentation du rayon. Vous pouvez modifier cette valeur pour afficher le graphique avec une résolution plus faible ou plus forte. Indique la distance maximale du rayon. Par défaut, elle est définie comme la distance la plus grande au point le plus éloigné du centre du plan. Pour un graphique de dispersion de la variance basé sur des plans multiples, la MAXDIST est la distance la plus grande de tous les plans. Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/ La figure 5 montre le graphique de dispersion de la variance ainsi créé. Vous remarquerez que le plan composite centré (PCC) fournit une variance de prédiction plus faible pour l’ensemble de l’espace du plan que le plan Box‐Behnken (PBB). Le plan composite centré est le meilleur choix si l’objectif est de déterminer une équation pour calculer la prédiction. Graphiques superposés de la dispersion de la variance pour deux plans
Variable
minPlan1
moy Plan1
maxPlan1
minPlan2
moy Plan2
maxPlan2
Paramètres
Variance de prédiction échelonnée
30
25
20
15
10
5
0
0,0
0,2
0,4
0,6
0,8
1,0
1,2
Distance de l'origine
1,4
1,6
1,8
Figure 5 : graphique de dispersion de la variance pour les plans composite centrés et Box Benkhen Utiliser un graphique de dispersion de la variance pour comprendre d’autres aspects du plan Le graphique de dispersion de la variance peut vous permettre d’évaluer la performance d’un plan en ce qui concerne sa variance de prédiction. Comme nous l’avons décrit précédemment, le graphique de dispersion de la variance permet aussi de comparer deux plans ou plus. Enfin, il met en avant l’effet éventuel de l’ajout de points centraux au plan. Graphiques de dispersion de la variance pour 5 plans
Variable
min(1PointCentral)
moy (1PointC entral)
max(1PointC entral)
min(2PC x)
moy (2PC x)
max(2PCx)
min(3PC x)
moy (3PC x)
max(3PCx)
min(4PC x)
moy (4PC x)
max(4PCx)
min(5PC x)
moy (5PC x)
max(5PCx)
Paramètres
Variance de prédiction échelonnée
25
20
15
10
5
0,0
0,5
1,0
1,5
Distance de l'origine
2,0
Figure 6 : graphiques de dispersion de la variance pour un plan composite centré avec 1 à 5 points centraux (PCx) Bureau Téléphone Courriel Site internet Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/ Vous remarquerez que la variance de prédiction diffère selon le nombre de points centraux. Lorsque la distance par rapport à l’origine est inférieure à 1,5, la variance de prédiction est plus importante si le plan a un point central mais diminue à chaque fois qu’un point central est ajouté. Le graphique de dispersion de la variance indique également si un plan peut effectuer une rotation auquel cas les trois lignes (valeurs minimale, moyenne et maximale) coïncideront. Si nous supposons que le plan composite centré avec 5 points centraux est altéré parce que la valeur d’une distance axiale est fixée à 1, le plan devient alors un plan facial centré dont le graphique de dispersion de la variance est représenté à la figure 7. Vous remarquerez que la variance de prédiction est très élevée dans certaines régions de l’espace du plan. Etant donné que les lignes minimale, moyenne et maximale ne coïncident pas, les rotations sont impossibles pour ce plan facial centré. Graphique de dispersion de la variance pour un plan facial centré
avec 5 points centraux
Variance de prédiction échelonnée
200
Variable
minimum v(x)
moy. v(x)
maximum v(x)
Paramètres
150
100
50
0
0,0
0,5
1,0
1,5
Distance de l'origine
2,0
Figure 7 : Plan facial centré avec 5 points centraux Simulation de Monte Carlo pour estimer la variance de prédiction Le paragraphe qui suit décrit les méthodes mathématiques utilisées pour estimer les variances de prédiction minimale moyenne et maximale affichées par le graphique de dispersion de la variance. Ignorez cette partie du document si vous souhaitez seulement savoir comment créer et interpréter le graphique de dispersion de la variance. Comme nous vous l’avons indiqué précédemment, lorsque la valeur rayon est prédéterminée, une recherche approfondie est nécessaire pour trouver la variance de prédiction échelonnée minimale, moyenne et maximale. La méthode sélectionnée pour la macro Minitab est basée sur une simulation de Monte Carlo et la possibilité de lancer une recherche uniformément à des points équidistants du centre x = (0,0,…,0)T du plan. Trois éléments doivent être calculés à différentes distances de l’origine ie. la variance de prédiction, la variance de prédiction maximale et la variance de prédiction moyenne. Bureau Téléphone Courriel Site internet Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/ Il existe multiple façons pour trouver ces éléments. L’une de ces méthodes consiste à exploiter un algorithme non linéaire pour trouver la variance de prédiction minimale et maximale. Toutefois, la méthode que nous avons choisie pour estimer ces trois éléments est un échantillonnage uniforme et la recherche d’un large ensemble de points distincts équidistants du centre du plan pour des valeurs différentes du rayon r. En observant l’espace formé par ce groupe de points, l’estimation exacte de la variance de prédiction minimale et maximale peut être garantie si deux conditions sont remplies : d’une part, l’échantillonnage uniforme des points équidistants, ce qui signifie que les points ne doivent pas être choisis dans certaines régions du plan plutôt que d’autres. D’autre part, le nombre de points doit être suffisamment important pour couvrir tout l’espace du plan. Parce que tous les points de l’échantillon sont équidistants, réaliser cet échantillonnage revient à trouver une bonne façon d’obtenir des points d’une hypersphère pour un rayon donné. La procédure est détaillée dans l’ouvrage de Marsaglia (1972) et résumée ci‐dessous : 1. Générez un vecteur de dimension n de variables aléatoires (par exemple à partir d’une distribution normale standard). Ce vecteur sera défini comme suit x = (x1, x2,…,xn). Puis, répétez cette opération afin de créer de multiples vecteurs x. 2. Calculez le rayon  pour tous les points x générés.
3. Transformez chacun des points du plan obtenus à l’étape 1 en multipliant chaque entrée du vecteur x par , où r représente le rayon de l’hypersphère utilisée pour échantillonner. Figure 8 : points du plan échantillonnés d’une hypersphère au rayon constant Nous avons ainsi illustré comment prélever un échantillon de points d’une hypersphère de rayon r constant. Nous pouvons exploiter cette technique d’échantillonnage pour estimer la variance de prédiction minimale ou maximale. A l’aide de ces exemples, en tenant compte de la loi des grands nombres, la variance de prédiction moyenne des points prélevés peuvent permettre d’estimer la variance de prédiction moyenne réelle si l’effectif n est suffisant. Références bibliographiques ‐ Marsaglia G. “Choosing a Point from the Surface of a Sphere”. The Annals of Mathematical Statistics, Vol. 43, numéro 2 (1972), pages 645 et 646. ‐ Myers R, Montgomery D. (2002). Response Surface Methodology – Process and Product Optimization Using Designed Experiments, deuxième édition. John Wiley & Sons, Inc. Bureau Téléphone Courriel Site internet Etats‐Unis – Minitab Inc. +1‐814‐231‐2682 [email protected]
http://www.minitab.com/support/ Royaume‐Uni – Minitab Ltd +44 (0) 24 7643 7507 [email protected] http://www.minitab.co.uk/ France – Minitab SARL
+33 (0) 1 55 33 12 64
[email protected]
http://www.minitab.fr/