Chapitre 10 ´Elements de planification d`expérience

Transcription

Chapitre 10 ´Elements de planification d`expérience
Chapitre 10
Élements de planification d’expérience
Ce chapitre traite de la planification des expériences qui produisent les données traitées avec
des modèles vus dans ce cours. Une bonne planification permet de réaliser les objectifs de
l’étude avec les tests d’hypothèses classiques de l’analyse de variance.
10.1
Schéma à randomisation complète
Supposons qu’on veut investiguer l’effet d’un facteur à I modalités sur une variable réponse.
L’unité expérimentale est le sujet ou l’entité physique qui reçoit le traitement et sur lequel
on mesure la réponse à ce traitement. On dispose de N unités expérimentales. Supposons
que N est multiple de I, N = nI. Une randomisation complète, complete randomized
design en anglais, consiste à répartir, au hazard, les N unités expérimentales en I groupes
de n individus chacun. Ainsi chaque répartition des N unités expérimentales en I groupes
possède la même probabilité d’être choisie.
Exemple 10.1 On désire comparer 4 types d’essence pour tondeuses à gazon {A, B, C, D}.
On dispose de 12 tondeuses numérotées de 1 à 12. Choisissons une permutation aléatoire
de l’ensemble {1, 2, · · · , 12}. Par exemple {8, 6, 4, 3, 1, 10, 12, 9, 2, 7, 5, 11}. Cette permutation
suggère d’affecter les tondeuses numéros 8, 6 et 4 à l’essence du type A, les tondeuses numéros
3, 1 et 10 à l’essence du type B, les tondeuses numéros 12, 9 et 2 à l’essence du type C et les
1
tondeuses numéros 7, 5 et 11 à l’essence du type D. L’expérience consiste à verser un gallon
d’essence dans chaque tondeuse et mesure la surface tondue avec cette quantité d’essence.
Lemme 10.1 La commande R sample(1 : N )permet d’obtenir une permutation aléatoire de
l’ensemble {1, 2, · · · , N }.
Cette randomisation complète n’est possible que si tous les facteurs à l’étude sont contrôlable
par l’expérimentateur. En effet, certaines modalités de facteurs comme le sexe ou le revenu
sont des attributs liés intrinséquement à l’unité expérimentale qui ne peuvent pas être randomisés. L’expérimentateur randomise alors le restant des facteurs. On parle de randomisation partielle, partial randomized design en anglais.
Type d’essence
Observations
A
45 43
51
B
47 46
52
C
48 50
55
D
42 37
49
Tableau 10.1: Surface tondue selon le type d’essence utilisée.
Exemple 10.2 On continue avec l’exemple des tondeuses. Les résultats sont donnés au
tableau 9.1. On veut tester l’hypothèse H0 : les essences ont le même rendement versus H1
il y a une différence entre les 4 types d’essence. On obtient la table ANOVA du tableau 9.2
qui pemet de conclure que les 4 types d’essence ont un rendement similaire.
10.2
Plan à bloc aléatoires
Continuons avec l’exemple des tondeuses.
Exemple 10.3 Supposons maintenant que les douzes tondeuses dont on dispose sont de 3
marques différentes {a, b, c}, quatres de chacune des marques. Le fait d’avoir des tondeuses
2
Source
d.f.
SS
MS
F
p-value
Type d’essence
3
110.917
36.972
1.92
0.2048
Erreur
8
154.000
19.250
Total
11
264.917
Tableau 10.2: Table ANOVA pour un modèle à un facteur
de marques différentes induit un élément additionnel à l’expérience. En effet, l’efficacité de
l’essence peut dépendre de la marque de la tondeuse. On est alors en présence d’un deuxième
facteur, marque de tondeuse, qu’il serait souhaitable de contrôler lors de la planification
de l’expérience. On va donc s’assurer que les types d’essence soient testés avec les quatre
marques de tondeuses disponibles. Le facteur tondeuse est appelé bloc. Ce n’est pas un facteur
intéressant a priori; il faut le contrôler pour obtenir des conclusions précises. Pour ce faire,
on procède comme suit: On prend les 4 tondeuses de marque a. On choisit une permutation
de l’ensemble {1, 2, 3, 4}, par exemple {4, 3, 1, 2}. On verse alors de l’essence du type A à la
tendance numéro 4, du type B à la tendance numéro 3, du type C à la tendance numéro 1
et du type D à la tendance numéro 2. On prend ensuite les 4 tondeuses de marque b et on
refait la même choses, avec une permutation différente biensûr ... etc.
Ce qu’on vient de faire est équivalent à procéder à un plan complètement randomisé pour
chaque modalité du facteur bloc. On parle alors d’un plan randomisé à blocs aléatoires,
randomized block design en anglais.
On a donc un modèle à deux facteurs sans interaction. Généralement, le facteur bloc est
considéré aléatoire. La nature du deuxième facteur dépend du contexte. Le modèle considéré
est alors
Yij = µ + αi + βj + eij ,
i = 1, · · · , I,
J = 1, · · · , B.
Exemple 10.4 Les données pour l’expérience précédente se présentent tel qu’indiqué au
Tableau 9.3 On est en présence d’un plan à deux facteurs avec une observation par cellule
(voir chap. 8). Le facteur marque de tondeuse est un facteur de nuisance. Notre objectif est
3
Tondeuse
Type d’essence
a
b
c
A
45 43
51
B
47 46
52
C
48 50
55
D
42 37
49
Tableau 10.3: Données pour l’expérience avec blocs
de déterminer si le type de l’essence a un impact sur la surface tondue. On obtient la table
ANOVA du tableau 9.4.
Maintenant, l’essence a un effet sur la performance de la tondeuse. Ne pas tenir compte
des blocs peut nous induire à une mauvaise conclusion. En fait les différences inter blocs
sont telles que tenir compte lors de la planfication de l’expérience permet de réduire de beaucoup la variance de l’erreur résiduelle σ 2 et donc d’obtenir un test d’homogénéité des quatre
sortes d’essence beaucoup plus puissant que celui associé à une expérience complètement
randomisée.
Source
d.f.
Type d’essence
3
Tondeuse
SS
MS
F
p-value
110.917 36.972
11.78
0.0063
2
135.167 67.583
21.53
0.0018
Erreur
6
18.833
Total
11
264.917
3.139
Tableau 10.4: Table ANOVA de l’analyse du schéma avec blocs
10.3
Plan en carrés latins
Supossons qu’on veut maintenant comparer l’effet du type d’essence sur la performance d’une
voiture. On dispose de 16 voitures, numérotées de 1 à 16. On choisit alors une permutation
4
de l’ensemble {1, 2, · · · , 16}. On utilise cette permutation pour affecter un type d’essence à
chaque voiture. C’est un plan complètement randomisé.
Suposons maintenant qu’on dispose de 4 pilotes pour effectuer les tests sur les voitures.
On assigne 4 voitures à chaque pilote au hasard. On randomise ces 4 voitures pour affecter
un type d’essence à chacune de ces quatre voitures. Les pilotes forment les blocs. C’est un
plan à blocs aléatoires. Les facteurs sont essence et pilote et les unités expérimentales
sont les voitures
Supposons maintenant qu’on dispose de 64 voitures de 4 marques différentes, seize de
chacune des marques. Chaque ensemble de seize voitures de même marque est réparti
aléatoirement en 4 groupes de 4 voitures, chaque groupe pour un conducteur. Enfin, chacune
des 4 voitures sera assignée à un type d’essence. Ainsi, on est en présence de deux facteur
de blocage: marque de voiture et pilote. Notre objectif est toujours de comparer les quatre sortes d’essence entre elles mais la marque de voiture et le pilote interviennent dans
l’expérience. Pour planifier cette expérience il faut faire quatre schémas randomisés avec
blocs, un par marque de voiture. On a donc un modèle à trois facteurs, sans interaction,
avec une observation par cellule:
Yijk = µ + essencei + pilotej + marquek + eijk
Notons que dans ce schéma il est possible d’avoir une interaction essence*marque car la
performance des types d’essence peut dépendre de la marque de voiture. Pour l’instant, on
suppose qu’il n’y a pas d’interaction.
Notre budget est limité et on ne dispose que de seize voitures, quatre de chaque marque
pour réaliser l’expérience. Une solution à cette problématique est le plan d’expérience en
carré latin. On considére les seize combinaisons pilote×marque. On attribue l’essence du
type A à quatre combinaisons, l’essence du type B à quatre combinaisons, l’essence du type
C à quatre combinaisons et l’essence du type D à quatre combinaisons. Cette attribution
est faite de façon à ce que chaque chauffeur fasse exactement un test routier avec chaque
sorte d’essence et de façon à ce que pour chaque modéle de voiture, il y ait une voiture pour
chaque sorte d’essence. Soit par exemple l’attribution suivante:
5
Marque
Pilote
I
II
III
IV
A
a
b
c
d
B
b
c
d
a
C
c
d
a
b
D
d
a
b
c
Tableau 10.5: Détermination du type d’essence en fonction de marque de voiture et du
pilote dans un plan en carré latin
On remarque que chaque lettre apparaı̂t une fois sur chaque ligne et une fois sur chaque
colonne. Un tel tableau s’appelle un carré latin 4 × 4 ou carré latin de dimension 4. Le
modèle s’écrit alors
Yijk = µ + essencei + pilotej + marquek + eijk
où la valeur de i, le type d’essence, est une fonction de j et k définie au tableau 9.5.
Idéalement, on aurait bien aimé disposer de 4×4×4 = 64 voitures pour réaliser une expérience
factorielle complète. Le carré latin permet d’étudier simultanément les trois facteurs avec
seulement 16 autos. Evidemment les interactions ne sont pas estimables; en fait ces dernières
sont confondues avec les effets fixes. Par exemple une interaction essence×marque est en
partie confondue avec l’effet du facteur pilote. Ainsi un plan en carré latin fait implicitement l’hypothèse que les facteurs à l’étude n’interagissent pas.
D’une façon générale, si on a 3 facteurs (facteur traitement, facteurs blocage ligne et
colonne) à t niveaux chacun. La somme des carrés des erreurs s’écrit:
SST =
∑
(Yijk − Ȳ... )2
t2 termes
Ce terme possède t2 − 1 degrés de liberté. Il se décompose selon
SST = SStr + SSbloc1 + SSbloc2 + SSE
où
6
∑
(Y¯i.. − Y¯... )2
ttermes
∑
SSbloc1 = t
(Y¯.j. − Y¯... )2
ttermes
∑
SSbloc2 = t
(Y¯..k − Y¯... )2
ttermes
SSE = SST − (SStr + SSbloc1 + SSbloc2 )
SStr = t
Le nombres de degrés de liberté associés à ces sommes sont t−1, t−1, t−1 et t2 −3t+2 =
(t − 1) × (t − 2) respectivement. On en déduit la table d’ANOVA suivante:
Source
d.d.l.
Sommes
Moyennes
Fobs
Facteur
t−1
SStr
M Str
M Str/M SE
Bloc 1
t−1
SSbloc1
M Sbloc1
M Sbloc1 /M SE
Bloc 2
t−1
SSbloc2
M Sbloc2
M Sbloc2 /M SE
Erreur
(t − 1)(t − 2)
SSE
M SE
Total
t −1
SST
2
Au fait, dans l’exemple précédent, nous avons trouvé les résultats suivants:
Modèle
Chauffeur
I
II
15.5 b
33.9
A
a
B
b 16.3
C
c
D
d 14.7
c
III
c
13.2 d 29.1
26.6 d 19.4
10.8 d
31.1
a
a
IV
a
22.8
17.1 b 30.3
34.0 b 19.7
c
21.6
On peut facilement construire la table ANOVA et faire les tests d’homogénéité pour les
trois facteurs à l’étude.
7
La randomisation d’un plan en carrés latin est un peu compliquée. En principe elle se
fait en deux phases
1. On choisit un carré latin standard (c’est-à-dire avec les lignes et les colonnes numérotées
de 1 à t
2. On assigne au hasard les modalités de chacun des facteurs à un entier entre 1 et t.
Cette procédure soulève la question du nombre de carrés latins standard pour un t fixé. Pour
chaque carré standard il existe t! × (t − 1)! façon de randomiser les modalités des facteurs
dans les dimension des carrés. Notons finalement que lorsque t ≥ 4, il est possible d’inclure
simultanément quatre facteurs dans un carré latin. En fait l’assignation des deux derniers
facteurs aux lignes et aux colonnes se fait comme au tableau 9.5. L’utilisation de carrés latins
“orthogonaux” fait en sorte que les effets simples des deux derniers facteurs sont estimables.
La génération des carrés latins est un problème de mathématiques combinatoire.
Taille t
3
4
5
6
Nb carrés standard 1
4
56
9408
Tableau 10.6: Nombres de carrés latins standard en fonction de t la taille du carré
10.4
Plans en parcelles partagées (schéma split plot)
Un schéma split plot est une généralisation d’un plan randomisé avec blocs. Pour introduire
cette notion, il est utilise d’utiliser une expérience en agriculture.
On veut étudier simultanément les types de plant (I = 3 modalités) et la concentration d’engrais (K = 3 modalités) sur la production (Y ) de fraise. Pour ce faire on dispose
disons de J = 3 champs ( ou blocs). Il y a en tout 9 traitements (plants, concentration)
et on dispose de 3 blocs pour réaliser l’expérience.
Pour planifier cette expérience on pourrait utiliser un plan randomisé avec blocs. On
diviserait chaque champ en 9 parcelles et on randomiserait les 9 traitements dans chaque
bloc.
8
Supposons maintenant qu’un des deux facteurs, disons concentration, est plus important et que l’on aimerait réduire au maximum l’erreur expérimentale pour ce facteur. On
pourrait procéder en deux temps:
1. On divise chaque bloc en 3 grandes parcelles et on randomise les modalités de plant
dans chaque grande parcelle. On dispose ainsi de 9 grandes parcelles et un schéma avec
blocs est utilisé pour comparer les modalités de plant (unité d’observation=grande
parcelle).
2. Pour assigner la modalité de concentration, on traite chaque grande parcelle comme
un bloc. On la divise en 3 et on assigne au hasard une concentration à chaque sousparcelle (unité d’observation=sous-parcelle).
Avec ce type d’expérience il y a deux niveaux d’analyse. Pour le facteur plant les unités
d’observation sont les grandes parcelles et on a un plan avec blocs ordinaire. Par contre,
pour concen, et l’interaction plant×concen les unitées sont les sous parcelles. Donc il
y a deux parties à l’analyse; une est intra grande parcelles l’autre est inter grande parcelles.
En général, l’erreur expérimentale est plus petite pour l’analyse intra grande parcelles. Le
modèle pour les données s’écrit:
Yijk = µ + αi + βj + (αβ)ij + γk + (αγ)ik + ϵijk ,
avec
i = 1, 2, 3 représente la modalité de plant
j = 1, 2, 3 est associé aux blocs
k = 1, 2, 3 représente la modalité de concen.
2
) et ϵijk ∼ N (0, σ 2 ). En
Les facteurs aléatoires sont βj ∼ N (0, σβ2 ), (αβ)ij ∼ N (0, σαβ
général, on utilise un modèle non restreint qui n’impose aucune contrainte aux paramètres
d’interaction. La table ANOVA pour ce modèle est donnée au tableau 10.7
À faire: Calculer les espérances des sommes de carrés moyens pour le modèle split plot.
9
Source
d.d.l.
Sommes de carrés
bloc
J −1
KI
plant
I −1
bloc×plant
(J − 1)(I − 1)
concen
K −1
plant×concen
(K − 1)(I − 1)
Erreur
I(J − 1)(K − 1)
∑
K
J
∑
KJ
∑
∑
IJ
∑
i,k (Ȳi·k
i,j,k (Ȳijk
j (Ȳ·j·
− Ȳ··· )2
M SBloc/M Sb ∗ p
i (Ȳi··
− Ȳ··· )
M Splants/M Sb ∗ p
∑
i,j (Ȳij·
F
2
− Ȳ·j· − Ȳi·· + Ȳ··· )2
i (Ȳ··K
− Ȳ··· )2
M Sconcen/M SE
− Ȳ··k − Ȳi·· + Ȳ··· )
2
M Sp ∗ c/M SE
− Ȳi·k − Ȳij· + Ȳi·· )2
Tableau 10.7: Table ANOVA pour un schéma split-plot
Noter que la somme de carrés Bloc× plant est est la somme de carrés erreur pour
l’analyse inter grandes parcelles. Notons que la somme de carrés des erreurs peut être
décomposé en SSBloc×concen+ SSBloc×plant×concen.
La première somme de
carré peut être utilisé comme terme d’erreur pour concen et la deuxième pour l’interaction
plant×concen.
10.5
Expériences avec facteurs croisés et emboı̂tés
Pour présenter ce type de modèles, considérons une expérience en psychologie qui étudie
l’impact de trois types de leadership et de deux types de projets sur Y une mesure de
la performance d’une personne. L’expérience se déroule de la façon suivante. Disons que
15 personnes sont disponibles pour l’expérience. Au départ, on les divise au hasard en trois
groupes de 5. Chaque groupe se voit attribuer un chef; un des groupes a un chef autoritaire,
un autre un chef démocrate et le dernier un chef qui n’exerce pas son autorité. Le type de
chef définit la modalité du facteur leadership. Une fois les groupes formés, chaque membre
se voit attribuer des projets qu’il doit mener à terme. Deux de ces projets sont évalués,
un simple et un complexe. Les données sont donc 30 = 15 × 2 évaluation de projets réalisés
par les participants à l’expérience.
On reconnaı̂t les deux facteurs fixes de l’expérience, leadership et projet. Il y aussi
un facteur aléatoire sujet. On dispose de 15 sujets qui sont séparés au hasard en 3 groupes;
10
chaque groupe est ensuite assigné à une modalité de leadership. On dit que sujet est
emboı̂té dans leadership car chaque modalité de leadership reçoit son propre échantillon
de sujets. Le facteur sujet serait croisé avec leadership si on obtenait, pour chaque
sujet, des observations à chaque modalité de leadership. Ce n’est pas le cas ici. Deux
mesures sont prises sur chaque sujet; on est donc en présence d’une expérience à mesures
répétées.
Cette expérience est semblable à un schéma split-plot. Les sujets jouent le même rôle que
les grandes parcelles. La table ANOVA va avoir deux parties: une composante inter-sujet
où on fait de l’inférence concernant le facteur leadership et une partie intra-sujet pour
étudier projet et leadership×projet. Il y a tout de même une différence importante
avec un schéma split-plot: il n’y a pas de blocs dans une expérience à mesures répétées. De
plus le facteur aléatoire est emboı̂té dans le facteur inter-sujets. On écrit ceci comme:
sujet(leadership).
Dans la construction du modèle on applique la règle suivante: si B (avec J modalités) est
emboı̂té dans A (avec I modalités) on ne met pas d’intercation A×B dans le modèle. On
aura une composante B(A) qui dit que B est emboité dans A, avec I(J − 1) degrés de liberté.
Le modèle pour les données s’écrit:
Yijk = µ + αi + βj(i) + γk + (αγ)ik + ϵijk ,
avec
i = 1, 2, 3 représente la modalité de leadership
j = 1, · · · , 5 est associé aux sujets dans leadership
k = 1, 2 représente la modalité de projet.
Les facteurs aléatoires sont , βj(i) ∼ N (0, σβ2 ) et ϵijk ∼ N (0, σ 2 ). Le paramètre σβ2 représente
la variabilité inter-sujets. La table ANOVA pour ce modèle est donnée au tableau 10.2. On
pourrait ajouter au modèle la composante γ×βkj(i) pour l’interaction projet×sujet(leadership).
11
La somme de carrés pour ce terme coı̈ciderait alors avec la somme de carrés pour les erreurs
dans le tableau 10.8.
Une règle utile pour calculer les degrés de liberté pour une somme de carrés avec termes
croisés et emboités: il faut former un produit où une composante de la somme de carrés
contribue son nombre de modalités si un facteur est emboité dans cette composante et son
nombre de modalités moins 1 sinon.
Source
d.d.l.
Sommes de carrés
leader
I −1
sujet(leader)
I(J − 1)
K
projet
K −1
IJ
leader×projet
(K − 1)(I − 1)
Erreur
I(J − 1)(K − 1)
KJ
J
∑
∑
∑
i (Ȳi··
∑
i,k (Ȳi·k
i,j,k (Ȳijk
− Ȳ··· )
i,j (Ȳij·
− Ȳi·· )2
i (Ȳ··K
− Ȳ··· )2
∑
F
2
M Sleader/M Ssujet(l)
M Sprojet/M SE
− Ȳ··k − Ȳi·· + Ȳ··· )
2
M Sp ∗ c/M SE
− Ȳi·k − Ȳij· + Ȳi·· )2
Tableau 10.8: Table ANOVA pour un schéma avec mesures répétées (note leadership
est parfois écrit leader ou l)
À faire: Calculer les espérances des sommes de carrés moyens pour le modèle avec mesures
répétées.
12