Analyse de variance - Modèles mixtes

Transcription

Analyse de variance - Modèles mixtes
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Analyse de variance - Modèles mixtes
Mathieu Emily
Laboratoire de mathématiques appliquées
Agrocampus Ouest, Rennes
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
1
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
2
Modèles à effets aléatoires
3
Modèles mixtes
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
2
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
3
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple des eaux minérales vu au TD1
Que pensez-vous de la nature des variables juge et produit et de
leurs effets sur l’intensité ?
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
4
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple des compotes vu au TD2
Comment interprétez-vous les effets produit et juge ?
Peut-on utiliser le modèle pour faire de la prévision ?
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
5
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Autre exemple sur le Rendement Technologique Napole chez le porc
289 mesures de RTN à partir de 16 pères.
Faites-vous une différence entre les effets Sexe et Pere ?
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
6
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
7
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Echantillonage
Soit P une population d’étude de grande taille.
Dans certains cas, l’étude de P se fait par un échantillonnage à 2
degrés :
1
2
Prendre un échantillon de sous-population.
Dans chaque sous-population, prendre un échantillon.
Exemples :
I
Attaque d’un parasite sur un espèce d’arbre.
Etudier tous les arbres est impossible.
On étudie I arbres choisis au hasard et pour chaque arbre on mesure J
feuilles.
Le facteur arbre n’est pas contrôlé : c’est l’espèce qui est étudiée mais
pas les arbres choisis au hasard.
I
Rendement des exploitations agricoles
Etudier toutes les exploitations est impossible.
On étudie I exploitations choisies au hasard et pour chaque exploitation
on mesure J parcelles.
Le facteur exploitation n’est pas contrôlé : c’est l’ensemble qui est étudié
mais pas les exploitations choisies au hasard.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
8
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Effet fixe vs effet aléatoire
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
9
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Effet fixe vs effet aléatoire
Pour un effet fixe :
I
I
I
Les différents niveaux du facteurs sont fixés une fois pour toute.
Tous ces niveaux sont mesurés dans l’expérience.
On cherche à estimer la moyenne de chaque niveaux : on s’intéresse
à l’effet de tel ou tel niveau.
Pour un effet aléatoire :
I
Le facteur comporte a priori beaucoup de niveaux.
Seuls certains niveaux, choisis aléatoirement, sont mesurés.
On ne s’intéresse pas aux effets des niveaux mesurés du facteur :
I
On s’intéresse à la variabilité induite par le facteur.
I
I
L’effet ne serait pas exportable aux autres facteurs non mesurés
Hypothèses de modélisation sur les facteurs aléatoires
Les niveaux observés d’un facteur aléatoire sont modélisés comme des
observations d’une variable aléatoire A de loi normale telle que :
E[A ] = 0
V[A ] = σ2A inconnue
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
10
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Choix de présentation
Pour des raisons techniques nous traitons le cas de données
équilibrés (sauf mention contraire)
Pour l’estimation des paramètres du modèle et des effets,
plusieurs approches sont possibles :
I
I
Stratégie “à la Fisher” (=“Méthode par sommes de carrés”)
Stratégie par maximum de vraisemblance (restreint) et comparaison
de modèles :
Package R lme4 difficile à manipuler.
Aspect théorique complexe.
Les 2 stratégies ne sont pas équivalentes dans le cas général
(déséquilibré). De plus, il n’y a pas de méthode qui soit
uniformément meilleure que les autres, d’où les difficultés des
modèles aléatoires et mixtes.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
11
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
2
Modèles à effets aléatoires
3
Modèles mixtes
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
12
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
13
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Exemple développé
Nous reprenons ici l’exemple du RTN chez le porc.
I
289 porcs ont été mesurés
Nous nous intéressons uniquement à l’effet du père.
I
16 pères ont été “utilisés”
Objectif : Le facteur Père a-t-il une influence sur le RTN.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
14
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Ecriture du modèle
Yij = µ + Ai + εij
i représente le niveau du facteur (i = 1, . . . , I)
j représente l’indice de répétition (j = 1, . . . , ni )
I
Nous considérons le cas équirépété : ni = J
Hypothèses de modélisation :
I
I
I
Les Ai sont indépendants et de même loi : Ai ∼ N(0, σA )
Les εij sont indépendants et de même loi : εij ∼ N(0, σ)
Les Ai et les εij sont indépendants entre eux
Remarques :
I
I
I
La 2eme hypothèse est forte : la variabilité individuelle est la même
dans toutes les sous-populations.
La 3eme hypothèse est forte : Ai n’influence pas la loi du terme
résiduel.
Ces 2 hypothèses sont faites pour des raisons techniques.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
15
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Remarques générales
V[Yij ] = σ2A + σ2 et Yij ∼ N(µ,
q
σ2A + σ2 )
Cov (Yij , Yi ,j 0 ) = σ2A : (Covariance intagroupe)
ρ = Cor (Yij , Yij 0 ) =
I
I
σ2A
σ2A + σ2
C’est la corrélation intra-groupe.
Elle permet de mesurer la part de σ2A dans la variabilité totale.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
16
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Estimation de µ
Dans le cas équilibré, l’estimateur naturel de µ est donné par :
b
µ = Y.. =
I
J
1 XX
Yij
IJ i =1 j =1
On peut montrer que :
V[b
µ] =
Donc :
σ2A
σ2
+
I
IJ
 s



σ2A
σ2 


b
µ ∼ N µ,
+

I
IJ 
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
17
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Estimation de la variance résiduelle σ
On peut montrer que :
E[SCER ] = (n − I)σ2
Donc, on définit l’estimateur sans biais suivant :
I
J
SCER
1 XX
c
2
σ =
=
(Yij − Yi . )2
n−I
n − I i =1 j =1
Estimation identique dans le cas déséquilibré.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
18
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Estimation de la variance due au facteur A : σA
On peut montrer que dans le cas équilibré :
E[SCEA ] = (I − 1)(σ2 + J σ2A ) =⇒ E[CMA ] = σ2 + J σ2A
Donc, on définit l’estimateur sans biais suivant :
σ2A =
E[CMA ] − σ2
c2 = CMA − CMR
=⇒ σ
A
J
J
Dans le cas déséquilibré on a :
c2 = CMA − CMR
σ
A
n0
avec n0 =
n2 −
PI
i =1
ni2
n(I − 1)
c2 peut prendre des valeurs négatives ! ! Dans ce cas,
Remarque : σ
A
on estimera σA par 0.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
19
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Loi des estimateurs
On peut montrer que :
SCER
σ2
∼ χ2n−I et
SCEA
σ2
+ n0 σ2A
∼ χ2I−1
De plus SCER y SCEA .
c2 n’est pas connue car il est combinaison
Problème : la loi de σ
A
2
linéaire de deux χ .
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
20
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Test
On cherche à tester les hypothèses suivantes :
H0 : σA = 0 vs H0 : σA , 0(> 0)
On a :
CMA
σ2 +n0 σ2A
CMR
∼ FnI−−I1 =⇒
σ2
CMA
∼H0 FnI−−1I
CMR
Remarque : la statistique de test ainsi que la loi sous H0 sont
identiques au cas d’ANOVA à 1 facteur fixe.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
21
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
22
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
23
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Exemple développé
Contexte de l’exemple de Dagnelie “Statistique théorique et appliquée”
Les responsables d’un laboratoire d’analyse chimique par spectrométrie
dans le proche infrarouge se sont intéressés à la variabilité des résultats
qu’ils obtenaient pour les mesures des teneurs en protéines du blé. En
particulier, ils se sont interrogés sur l’importance des différences qui pouvaient découler des étapes successives de préparation des matières à
analyser. Nous considérons ici le problème du broyage, en examinant les
résultats obtenus à l’aide de trois moulins.
Expérience
Cinq échantillons de grains de blé ont été prélevés au hasard dans un arrivage relativement important, et divisés chacun en six sous-échantillons.
Pour chacun des échantillons, les sous échantillons ont ensuite été affectés au hasard à trois moulins qui eux-mêmes ont été choisis au hasard
dans une production de moulins.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
24
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Données
Une analyse chimique a été effectuée dans chaque cas. Le tableau
ci-dessous présente les résultats, à savoir les mesures des teneurs
en protéines, exprimées en pourcentage de la matière sèche.
Moulin/Echantillon
1
2
3
1
13,33
13,43
13,04
13,34
13,24
13,25
2
13,62
13,33
13,26
13,49
13,33
13,46
3
13,53
13,75
13,49
13,59
13,07
13,33
4
13,60
13,44
13,05
13,44
13,47
13,04
5
13,97
13,32
13,28
13,67
13,46
13,32
Quelle est la nature de l’effet associé à la variable Moulin, à la
variable Echantillon ?
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
25
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Ecriture du modèle
Yijk = µ + Ai + Bj + ABij + εijk
i représente le niveau du premier facteur (i = 1, . . . , I)
j représente le niveau du deuxième facteur (j = 1, . . . , J)
k représente l’indice de répétition (k = 1, . . . , nij )
I
Nous considérons le cas équirépété : nij = K
Hypothèses de modélisation :
I
I
I
I
I
Les Ai sont indépendants et de même loi : Ai ∼ N(0, σA )
Les Bj sont indépendants et de même loi : Bj ∼ N(0, σB )
Les ABij sont indépendants et de même loi : ABij ∼ N(0, σAB )
Les εijk sont indépendants et de même loi : εijk ∼ N(0, σ)
Les Ai , Bj , ABij et les εijk sont indépendants entre eux
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
26
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Décomposition de la variabilité
Uniquement dans le cas de données équilibrées on a :
X
(Yijk − Y... )2
=
X
(Yi .. − Y... )2 +
i ,j ,k
i ,j ,k
+
X
(Y.j . − Y... )2
i ,j ,k
X
(Yij . − (Yi .. + Y.j . − Y... ))2 +
=
(Yijk − Yij . )2
i ,j ,k
i ,j ,k
SCET
X
SCEA + SCEB + SCEAB + SCER
On peut également montrer que :
E[CMA ]
= σ2 + K σ2AB + JK σ2A
E[CMB ]
= σ2 + K σ2AB + IK σ2B
E[CMAB ]
E[CMR ]
= σ2 + K σ2AB
= σ2
Comment estimer les différents paramètres de variance ?
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
27
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Estimation des variances
On obtient les estimateurs sans biais suivants :
c2
σ
=
d
2
σ
AB
=
c2
σ
B
=
c2
σ
A
=
CMR
CMAB − CMR
K
CMB − CMAB
IK
CMA − CMAB
JK
d
c2 et σ
c2 peuvent être négatifs.
2
Remarque : les estimateurs σ
,σ
AB
A
B
Dans ce cas, on considère que les variances associées sont nulles.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
28
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Distributions des sommes de carrés
SCEA
σ2 + K σ2AB + JK σ2A
SCEB
σ2 + K σ2AB + IK σ2B
SCEAB
σ2 + K σ2AB
SCER
σ2
∼ χ2I−1
∼ χ2J −1
∼ χ2(I−1)(J −1)
∼
χ2IJ (K −1)
Comment tester les différents effets ?
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
29
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Test de l’effet d’interaction
On cherche à tester les hypothèses suivantes :
H0 : σAB = 0 vs H0 : σAB , 0
Choix de la statistique de test :
FAB =
CMAB
CMR
Sous H0 , on a :
(I−1)(J−1)
FAB ∼H0 FIJ(K−1)
Remarque : le test est rigoureusement identique au test dans le cas
d’un modèle à effets fixes.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
30
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Test d’un effet individuel : celui du facteur A
On cherche à tester les hypothèses suivantes :
H0 : σA = 0 vs H0 : σA , 0
La statistique de test est donnée par :
FA =
CMA
(I−1)
∼H0 F(I−1)(J−1)
CMAB
Remarque : le test est réalisé par rapport à l’interaction et non la
résiduelle.
Si on accepte H0 : σAB = 0, on considère alors le modèle sans
interaction :
Yijk = µ + Ai + Bj + εijk
I
I
Dans ce cas, l’interaction sera “présente” dans la résiduelle.
On retrouve alors la même statistique de test que pour des effets fixes.
FA =
Analyse de variance
CMA
(I−1)
∼H0 Fn−I−J+1
CMR
Mathieu EMILY - Agrocampus Ouest
31
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple des échantillons de blé
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
32
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Tests des effets aléatoires
On commence par regarder l’effet d’interaction :
I
I
Le test est identique à celui des effets fixes.
On peut lire p = 0.91514, donc on “accepte” H0 : σMoulin:Echantillon = 0
On peut regarder le modèle sans interaction.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
33
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Estimation sans interaction
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
34
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Tests des effets aléatoires
On regarde le modèle sans interaction :
I
I
I
Les tests sont identiques à ceux des effets fixes.
On peut lire pMoulin = 0.02789, donc on rejette H0 : σMoulin = 0
On peut lire pEchantillon = 0.233, donc on “accepte” H0 : σEchantillon = 0
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
35
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Modèle à 1 facteur
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
36
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Données déséquilibrées
En déséquilibre tout se complique !
Les espérances des carrés moyens ne s’expriment pas facilement !
Il existe des tests approchés sur le même principe mais :
I
I
I
les sommes des carrés ne sont plus des χ2 ,
les sommes des carrés ne s’additionnent plus pour donner la somme
des carrés totale,
Les résultats sont tout de même interprétés comme pour le cas
équilibré.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
37
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
38
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Ecriture du modèle
Yijk` = µ + Ai + Bj + Ck + ABij + ACik + BCjk + ABCijk + εijk`
Hypothèses de modélisation :
I
I
I
I
I
I
I
I
I
Les Ai sont indépendants et de même loi : Ai ∼ N(0, σA )
Les Bj sont indépendants et de même loi : Bj ∼ N(0, σB )
Les Ck sont indépendants et de même loi : Ck ∼ N(0, σC )
Les ABij sont indépendants et de même loi : ABij ∼ N(0, σAB )
Les ACik sont indépendants et de même loi : ACik ∼ N(0, σAC )
Les BCjk sont indépendants et de même loi : BCjk ∼ N(0, σBC )
Les ABCijk sont indépendants et de même loi : ABCijk ∼ N(0, σABC )
Les εijk ` sont indépendants et de même loi : εijk ` ∼ N(0, σ)
Les Ai , Bj , Ck , ABij , ACik , BCjk , ABCijk et les εijk ` sont indépendants
entre eux
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
39
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Tests de l’effet du facteur A
E[CMA ]
= σ2 + L σ2ABC + JL σ2AC + KL σ2AB + JKL σ2A
E[CMB ]
= σ2 + L σ2ABC + IL σ2BC + KL σ2AB + IKL σ2B
E[CMC ]
= σ2 + L σ2ABC + JL σ2AC + IL σ2BC + IJL σ2C
E[CMAB ]
= σ2 + L σ2ABC + KL σ2AB
E[CMAC ]
= σ2 + L σ2ABC + JL σ2AC
E[CMBC ]
= σ2 + L σ2ABC + IL σ2BC
E[CMABC ]
E[CMR ]
= σ2 + L σ2ABC
= σ2
Pour tester H0 : σA = 0, il faut trouver une base de comparaison.
I
Problème : cette base de comparaison n’existe pas de façon
générale !
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
40
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Tests de l’effet du facteur A
A peut-être testé par rapport à son interaction avec B si et
seulement si son interaction avec le facteur C n’est pas
significative.
I
I
Dans ce cas : E[CMA ] = σ2 + KL σ2AB + JKL σ2A = E[CMAB ] + JKL σ2A
CM
Ainsi sous H0 : σA = 0 : CM A ∼ F(II−−11)(J −1)
AB
Si aucune des 2 interactions AB et AC ne peut-être négligée on
peut faire des regroupements :
E[CMA ] = E[CMAB + CMAC − CMABC ] + JKLσ2A
I
En suivant le principe “à la Fisher”, sous H0 : σA = 0 :
CMA
I−1
∼ Fddl
CMAB + CMAC − CMABC
I
Le problème vient de la définition du ddl du dénominateur.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
41
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Méthode de Satterthwaite pour les ddl
Considérons la combinaison linéaire de carrés moyens :
k1 CM1 + k2 CM2 + · · · + kp CMp
Le nombre de degrés de liberté est donné par :
ddl =
(k1 CM1 + k2 CM2 + · · · + kp CMp )2
CM 2
CM 2
CM 2
k12 ddl11 + k22 ddl22 + · · · + kp2 ddlpp
Pour le cas du facteur A :
ddl =
(CMAB + CMAC − CMABC )2
CM2AB
(I−1)(J−1)
+
Analyse de variance
CM2AC
(I−1)(K−1)
+
CM2ABC
(I−1)(J−1)(K−1)
Mathieu EMILY - Agrocampus Ouest
42
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Tester les effets d’interaction et bilan
Interaction d’ordre 2 :
I
I
Il existe une base de comparaison : l’interaction triple ABC
CM
Par exemple pour AB : FAB = CM AB
ABC
Interaction d’ordre 3 :
FABC =
CMABC
CMR
Remarque : si l’interaction CMABC est absente, il faut remplacer
CMABC par CMR dans les statistiques de test.
Bilan
Il faut commencer par tester les interactions d’ordre le plus élevé
pour raffiner le modèle
On peut généraliser le principe à un modèle k > 3 effets aléatoires.
Il faut toujours rester vigilant à la base de comparaison des effets
testés.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
43
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
2
Modèles à effets aléatoires
3
Modèles mixtes
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
44
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
45
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Exemple introductif
Vos dents en or sont-elles solides ?
Le jeu de données est caractérisé par :
I
I
90 observations
5 variables : Dentiste, Méthode, Alliage, Température et Solidité
On va commencer par évaluer l’effet de la méthode sur la solidité
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
46
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Exemple introductif (2)
D’après les graphiques précédents on semble voir :
I
I
I
Un effet de la méthode
Un effet du dentiste
Une interaction méthode-dentiste
Nature des effets :
I
I
Méthode : effet fixe
Dentiste : effet aléatoire
Un modèle d’ANOVA qui combine un/des effets fixes avec un/des
effets aléatoires est appelé un modèle mixte.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
47
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
48
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Ecriture du modèle
Yijk = µ + αi + Bj + ABij + εijk
αi est l’effet du facteur à effets fixes
Bj est l’effet du facteur aléatoire
ABij est l’effet du facteur interaction (aléatoire)
εijk le résidu du modèle
Hypothèses de modélisation :
I
I
I
I
Les Bj sont indépendants et de même loi : Bj ∼ N(0, σB )
Les ABij sont indépendants et de même loi : ABij ∼ N(0, σAB )
Les εijk sont indépendants et de même loi : εijk ∼ N(0, σ)
Les Bj , ABij et les εijk sont indépendants entre eux
On utilisera la contrainte de nullité de la somme pour l’effet fixe :
I
X
αi = 0
i =1
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
49
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Estimation
La décomposition de la variance est identique à celle des effets
fixes.
On peut alors s’appuyer sur les espérances des carrés moyens.
Dans le cas équilibré :
E[CMA ]
= σ2 + K σ2AB +
E[CMB ]
= σ2 + IK σ2B
E[CMAB ]
= σ2 + K σ2AB
E[CMR ]
I
JK X 2
α
I − 1 i =1 i
= σ2
On peut alors proposer les estimateurs sans biais suivants :
c2
σ
B
=
d
2
σ
AB
=
c2
σ
=
Analyse de variance
CMB − CMR
IK
CMAB − CMR
K
CMR
Mathieu EMILY - Agrocampus Ouest
50
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Test des effets
D’après les espérances précédentes on a :
I
H0 : ∀i αi = 0
FA =
I
∼H0 F(I−1)(J −1)
H0 : σB = 0
FB =
I
(I−1)
CMA
CMAB
CMB
CMR
(J −1)
∼H0 FIJ (K −1)
H0 : σAB = 0
FAB =
CMAB
CMR
(I−1)(J −1)
∼H0 FIJ (K −1)
Remarques :
I
I
I
L’effet fixe est comparé à l’interaction..
L’effet aléatoire est comparé à la résiduelle.
On commence par tester l’effet d’interaction. S’il n’est pas significatif,
l’effet d’interaction est inclus dans la résiduelle.
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
51
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Tableau récapitulatif
Le tableau ci-dessous résume l’apparition des différents termes
dans l’espérance des carrés moyens.
Le symbole + signifie que le terme intervient par sa somme
pondérée.
Les autres symboles correspondent à la pondération du terme.
Carrés
moyens
CMA
CMB
CMAB
CMR
σ2
1
1
1
1
Modèle fixe
(αβ)2ij
β2j
+
+
α2i
σ2
+
1
1
1
1
Analyse de variance
Modèle mixte
σ2AB
σ2B
K
IK
K
α2i
σ2
+
1
1
1
1
Mathieu EMILY - Agrocampus Ouest
Modèle aléatoire
σ2AB
σ2B
K
K
K
IK
σ2A
JK
52
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
53
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Plan
1
Variables à effets aléatoires
Exemples
Caractérisation
2
Modèles à effets aléatoires
Modèle à 1 facteur aléatoire
Modèle
Estimation
Test de l’effet du facteur
Modèle à 2 facteurs aléatoires
Modèle
Estimation et tests
Cas déséquilibré
Modèle à 3 facteurs aléatoires
3
Modèles mixtes
Introduction
Modèle à 2 facteurs avec interaction
Modèle
Estimation et test
Modèle à 3 facteurs
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
54
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Tableau récapitulatif (1)
Carrés
moyens
CMA
CMB
CMC
CMAB
CMAC
CMBC
CMABC
CMR
Carrés
moyens
CMA
CMB
CMC
CMAB
CMAC
CMBC
CMABC
CMR
σ2
1
1
1
1
1
1
1
1
σ2
1
1
1
1
1
1
1
1
Modèle fixe
(αβγ)2ijk
βγjk2
αγik2
αβ2ij
γk2
β2j
α2i
+
+
+
+
+
+
+
σ2abC
Modèle mixte (a et b fixes)
σ2bC
σ2aC
αβ2ij
σ2C
β2j
JL
α2i
+
IL
+
IJL
L
+
JL
IL
L
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
55
Modèles mixtes
Modèles à effets aléatoires
Variables à effets aléatoires
Tableau récapitulatif (2)
Carrés
moyens
CMA
CMB
CMC
CMAB
CMAC
CMBC
CMABC
CMR
Carrés
moyens
CMA
CMB
CMC
CMAB
CMAC
CMBC
CMABC
CMR
σ2
σ2aBC
1
1
1
1
1
1
1
1
L
σ2
σ2aBC
1
1
1
1
1
1
1
1
L
L
L
L
L
L
L
Modèle mixte (a fixe)
σ2BC
σ2aC
σ2aB
JL
KL
IL
IL
σ2C
σ2B
α2i
+
IKL
IJL
L
L
KL
JL
IL
L
Modèle aléatoires
σ2BC
IL
IL
σ2aC
σ2aB
JL
KL
KL
JL
σ2C
σ2B
σ2A
JKL
IKL
IJL
KL
JL
IL
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
56
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Test dans le modèle mixte (a et b fixes)
Chaque effet a une base de comparaison
FA
=
FB
=
FC
=
FAB
=
FAC
=
FBC
=
FABC
=
CMA
(I−1)
∼ F(I−1)(K −1)
CMAC
CMB
(J −1)
∼ F(J −1)(K −1)
CMBC
CMC
(K −1)
∼ FIJK (L −1)
CMR
CMAB
(I−1)(J −1)
∼ F(I−1)(J −1)(K −1)
CMABC
CMAC
(I−1)(K −1)
∼ FIJK (L −1)
CMR
CMBC
(J −1)(K −1)
∼ FIJK (L −1)
CMR
CMABC
(I−1)(J −1)(K −1)
∼ FIJK (L −1)
CMR
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
57
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple
Considérons la température comme effet fixe
On pourrait (devrait ? ?) étudier les modèles sans les effets
non-significatif :
I
Procédure pas à pas en regardant les ordres d’interaction les plus
élevés
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
58
Modèles à effets aléatoires
Variables à effets aléatoires
Modèles mixtes
Test dans le modèle mixte (a fixe)
Le facteur fixe n’a pas de base de comparaison :
FA =
avec ddl =
CMA
(I−1)
∼ Fddl
CMAB + CMAC − CMABC
(CMAB +CMAC −CMABC )2
2
2 /ddl
2
CMAB
AB +CMAC /ddlAC +CMABC /ddlABC
FB
=
FC
=
FAB
=
FAC
=
FBC
=
FABC
=
CMB
(J −1)
∼ F(J −1)(K −1)
CMBC
CMC
(K −1)
∼ F(J −1)(K −1)
CMBC
CMAB
(I−1)(J −1)
∼ F(I−1)(J −1)(K −1)
CMABC
CMAC
(I−1)(K −1)
∼ F(I−1)(J −1)(K −1)
CMABC
CMBC
(J −1)(K −1)
∼ FIJK (L −1)
CMR
CMABC
(I−1)(J −1)(K −1)
∼ FIJK (L −1)
CMR
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
59
Variables à effets aléatoires
Modèles à effets aléatoires
Modèles mixtes
Retour sur l’exemple
Considérons la température comme effet aléatoire
On pourrait (devrait ? ?) étudier les modèles sans les effets
non-significatif :
I
Procédure pas à pas en regardant les ordres d’interaction les plus
élevés
Analyse de variance
Mathieu EMILY - Agrocampus Ouest
60