Analyse de variance - Modèles mixtes
Transcription
Analyse de variance - Modèles mixtes
Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Analyse de variance - Modèles mixtes Mathieu Emily Laboratoire de mathématiques appliquées Agrocampus Ouest, Rennes Analyse de variance Mathieu EMILY - Agrocampus Ouest 1 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires 2 Modèles à effets aléatoires 3 Modèles mixtes Analyse de variance Mathieu EMILY - Agrocampus Ouest 2 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 3 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple des eaux minérales vu au TD1 Que pensez-vous de la nature des variables juge et produit et de leurs effets sur l’intensité ? Analyse de variance Mathieu EMILY - Agrocampus Ouest 4 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple des compotes vu au TD2 Comment interprétez-vous les effets produit et juge ? Peut-on utiliser le modèle pour faire de la prévision ? Analyse de variance Mathieu EMILY - Agrocampus Ouest 5 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Autre exemple sur le Rendement Technologique Napole chez le porc 289 mesures de RTN à partir de 16 pères. Faites-vous une différence entre les effets Sexe et Pere ? Analyse de variance Mathieu EMILY - Agrocampus Ouest 6 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 7 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Echantillonage Soit P une population d’étude de grande taille. Dans certains cas, l’étude de P se fait par un échantillonnage à 2 degrés : 1 2 Prendre un échantillon de sous-population. Dans chaque sous-population, prendre un échantillon. Exemples : I Attaque d’un parasite sur un espèce d’arbre. Etudier tous les arbres est impossible. On étudie I arbres choisis au hasard et pour chaque arbre on mesure J feuilles. Le facteur arbre n’est pas contrôlé : c’est l’espèce qui est étudiée mais pas les arbres choisis au hasard. I Rendement des exploitations agricoles Etudier toutes les exploitations est impossible. On étudie I exploitations choisies au hasard et pour chaque exploitation on mesure J parcelles. Le facteur exploitation n’est pas contrôlé : c’est l’ensemble qui est étudié mais pas les exploitations choisies au hasard. Analyse de variance Mathieu EMILY - Agrocampus Ouest 8 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Effet fixe vs effet aléatoire Analyse de variance Mathieu EMILY - Agrocampus Ouest 9 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Effet fixe vs effet aléatoire Pour un effet fixe : I I I Les différents niveaux du facteurs sont fixés une fois pour toute. Tous ces niveaux sont mesurés dans l’expérience. On cherche à estimer la moyenne de chaque niveaux : on s’intéresse à l’effet de tel ou tel niveau. Pour un effet aléatoire : I Le facteur comporte a priori beaucoup de niveaux. Seuls certains niveaux, choisis aléatoirement, sont mesurés. On ne s’intéresse pas aux effets des niveaux mesurés du facteur : I On s’intéresse à la variabilité induite par le facteur. I I L’effet ne serait pas exportable aux autres facteurs non mesurés Hypothèses de modélisation sur les facteurs aléatoires Les niveaux observés d’un facteur aléatoire sont modélisés comme des observations d’une variable aléatoire A de loi normale telle que : E[A ] = 0 V[A ] = σ2A inconnue Analyse de variance Mathieu EMILY - Agrocampus Ouest 10 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Choix de présentation Pour des raisons techniques nous traitons le cas de données équilibrés (sauf mention contraire) Pour l’estimation des paramètres du modèle et des effets, plusieurs approches sont possibles : I I Stratégie “à la Fisher” (=“Méthode par sommes de carrés”) Stratégie par maximum de vraisemblance (restreint) et comparaison de modèles : Package R lme4 difficile à manipuler. Aspect théorique complexe. Les 2 stratégies ne sont pas équivalentes dans le cas général (déséquilibré). De plus, il n’y a pas de méthode qui soit uniformément meilleure que les autres, d’où les difficultés des modèles aléatoires et mixtes. Analyse de variance Mathieu EMILY - Agrocampus Ouest 11 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires 2 Modèles à effets aléatoires 3 Modèles mixtes Analyse de variance Mathieu EMILY - Agrocampus Ouest 12 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 13 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Exemple développé Nous reprenons ici l’exemple du RTN chez le porc. I 289 porcs ont été mesurés Nous nous intéressons uniquement à l’effet du père. I 16 pères ont été “utilisés” Objectif : Le facteur Père a-t-il une influence sur le RTN. Analyse de variance Mathieu EMILY - Agrocampus Ouest 14 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Ecriture du modèle Yij = µ + Ai + εij i représente le niveau du facteur (i = 1, . . . , I) j représente l’indice de répétition (j = 1, . . . , ni ) I Nous considérons le cas équirépété : ni = J Hypothèses de modélisation : I I I Les Ai sont indépendants et de même loi : Ai ∼ N(0, σA ) Les εij sont indépendants et de même loi : εij ∼ N(0, σ) Les Ai et les εij sont indépendants entre eux Remarques : I I I La 2eme hypothèse est forte : la variabilité individuelle est la même dans toutes les sous-populations. La 3eme hypothèse est forte : Ai n’influence pas la loi du terme résiduel. Ces 2 hypothèses sont faites pour des raisons techniques. Analyse de variance Mathieu EMILY - Agrocampus Ouest 15 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Remarques générales V[Yij ] = σ2A + σ2 et Yij ∼ N(µ, q σ2A + σ2 ) Cov (Yij , Yi ,j 0 ) = σ2A : (Covariance intagroupe) ρ = Cor (Yij , Yij 0 ) = I I σ2A σ2A + σ2 C’est la corrélation intra-groupe. Elle permet de mesurer la part de σ2A dans la variabilité totale. Analyse de variance Mathieu EMILY - Agrocampus Ouest 16 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Estimation de µ Dans le cas équilibré, l’estimateur naturel de µ est donné par : b µ = Y.. = I J 1 XX Yij IJ i =1 j =1 On peut montrer que : V[b µ] = Donc : σ2A σ2 + I IJ s σ2A σ2 b µ ∼ N µ, + I IJ Analyse de variance Mathieu EMILY - Agrocampus Ouest 17 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Estimation de la variance résiduelle σ On peut montrer que : E[SCER ] = (n − I)σ2 Donc, on définit l’estimateur sans biais suivant : I J SCER 1 XX c 2 σ = = (Yij − Yi . )2 n−I n − I i =1 j =1 Estimation identique dans le cas déséquilibré. Analyse de variance Mathieu EMILY - Agrocampus Ouest 18 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Estimation de la variance due au facteur A : σA On peut montrer que dans le cas équilibré : E[SCEA ] = (I − 1)(σ2 + J σ2A ) =⇒ E[CMA ] = σ2 + J σ2A Donc, on définit l’estimateur sans biais suivant : σ2A = E[CMA ] − σ2 c2 = CMA − CMR =⇒ σ A J J Dans le cas déséquilibré on a : c2 = CMA − CMR σ A n0 avec n0 = n2 − PI i =1 ni2 n(I − 1) c2 peut prendre des valeurs négatives ! ! Dans ce cas, Remarque : σ A on estimera σA par 0. Analyse de variance Mathieu EMILY - Agrocampus Ouest 19 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Loi des estimateurs On peut montrer que : SCER σ2 ∼ χ2n−I et SCEA σ2 + n0 σ2A ∼ χ2I−1 De plus SCER y SCEA . c2 n’est pas connue car il est combinaison Problème : la loi de σ A 2 linéaire de deux χ . Analyse de variance Mathieu EMILY - Agrocampus Ouest 20 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Test On cherche à tester les hypothèses suivantes : H0 : σA = 0 vs H0 : σA , 0(> 0) On a : CMA σ2 +n0 σ2A CMR ∼ FnI−−I1 =⇒ σ2 CMA ∼H0 FnI−−1I CMR Remarque : la statistique de test ainsi que la loi sous H0 sont identiques au cas d’ANOVA à 1 facteur fixe. Analyse de variance Mathieu EMILY - Agrocampus Ouest 21 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple Analyse de variance Mathieu EMILY - Agrocampus Ouest 22 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 23 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Exemple développé Contexte de l’exemple de Dagnelie “Statistique théorique et appliquée” Les responsables d’un laboratoire d’analyse chimique par spectrométrie dans le proche infrarouge se sont intéressés à la variabilité des résultats qu’ils obtenaient pour les mesures des teneurs en protéines du blé. En particulier, ils se sont interrogés sur l’importance des différences qui pouvaient découler des étapes successives de préparation des matières à analyser. Nous considérons ici le problème du broyage, en examinant les résultats obtenus à l’aide de trois moulins. Expérience Cinq échantillons de grains de blé ont été prélevés au hasard dans un arrivage relativement important, et divisés chacun en six sous-échantillons. Pour chacun des échantillons, les sous échantillons ont ensuite été affectés au hasard à trois moulins qui eux-mêmes ont été choisis au hasard dans une production de moulins. Analyse de variance Mathieu EMILY - Agrocampus Ouest 24 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Données Une analyse chimique a été effectuée dans chaque cas. Le tableau ci-dessous présente les résultats, à savoir les mesures des teneurs en protéines, exprimées en pourcentage de la matière sèche. Moulin/Echantillon 1 2 3 1 13,33 13,43 13,04 13,34 13,24 13,25 2 13,62 13,33 13,26 13,49 13,33 13,46 3 13,53 13,75 13,49 13,59 13,07 13,33 4 13,60 13,44 13,05 13,44 13,47 13,04 5 13,97 13,32 13,28 13,67 13,46 13,32 Quelle est la nature de l’effet associé à la variable Moulin, à la variable Echantillon ? Analyse de variance Mathieu EMILY - Agrocampus Ouest 25 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Ecriture du modèle Yijk = µ + Ai + Bj + ABij + εijk i représente le niveau du premier facteur (i = 1, . . . , I) j représente le niveau du deuxième facteur (j = 1, . . . , J) k représente l’indice de répétition (k = 1, . . . , nij ) I Nous considérons le cas équirépété : nij = K Hypothèses de modélisation : I I I I I Les Ai sont indépendants et de même loi : Ai ∼ N(0, σA ) Les Bj sont indépendants et de même loi : Bj ∼ N(0, σB ) Les ABij sont indépendants et de même loi : ABij ∼ N(0, σAB ) Les εijk sont indépendants et de même loi : εijk ∼ N(0, σ) Les Ai , Bj , ABij et les εijk sont indépendants entre eux Analyse de variance Mathieu EMILY - Agrocampus Ouest 26 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Décomposition de la variabilité Uniquement dans le cas de données équilibrées on a : X (Yijk − Y... )2 = X (Yi .. − Y... )2 + i ,j ,k i ,j ,k + X (Y.j . − Y... )2 i ,j ,k X (Yij . − (Yi .. + Y.j . − Y... ))2 + = (Yijk − Yij . )2 i ,j ,k i ,j ,k SCET X SCEA + SCEB + SCEAB + SCER On peut également montrer que : E[CMA ] = σ2 + K σ2AB + JK σ2A E[CMB ] = σ2 + K σ2AB + IK σ2B E[CMAB ] E[CMR ] = σ2 + K σ2AB = σ2 Comment estimer les différents paramètres de variance ? Analyse de variance Mathieu EMILY - Agrocampus Ouest 27 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Estimation des variances On obtient les estimateurs sans biais suivants : c2 σ = d 2 σ AB = c2 σ B = c2 σ A = CMR CMAB − CMR K CMB − CMAB IK CMA − CMAB JK d c2 et σ c2 peuvent être négatifs. 2 Remarque : les estimateurs σ ,σ AB A B Dans ce cas, on considère que les variances associées sont nulles. Analyse de variance Mathieu EMILY - Agrocampus Ouest 28 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Distributions des sommes de carrés SCEA σ2 + K σ2AB + JK σ2A SCEB σ2 + K σ2AB + IK σ2B SCEAB σ2 + K σ2AB SCER σ2 ∼ χ2I−1 ∼ χ2J −1 ∼ χ2(I−1)(J −1) ∼ χ2IJ (K −1) Comment tester les différents effets ? Analyse de variance Mathieu EMILY - Agrocampus Ouest 29 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Test de l’effet d’interaction On cherche à tester les hypothèses suivantes : H0 : σAB = 0 vs H0 : σAB , 0 Choix de la statistique de test : FAB = CMAB CMR Sous H0 , on a : (I−1)(J−1) FAB ∼H0 FIJ(K−1) Remarque : le test est rigoureusement identique au test dans le cas d’un modèle à effets fixes. Analyse de variance Mathieu EMILY - Agrocampus Ouest 30 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Test d’un effet individuel : celui du facteur A On cherche à tester les hypothèses suivantes : H0 : σA = 0 vs H0 : σA , 0 La statistique de test est donnée par : FA = CMA (I−1) ∼H0 F(I−1)(J−1) CMAB Remarque : le test est réalisé par rapport à l’interaction et non la résiduelle. Si on accepte H0 : σAB = 0, on considère alors le modèle sans interaction : Yijk = µ + Ai + Bj + εijk I I Dans ce cas, l’interaction sera “présente” dans la résiduelle. On retrouve alors la même statistique de test que pour des effets fixes. FA = Analyse de variance CMA (I−1) ∼H0 Fn−I−J+1 CMR Mathieu EMILY - Agrocampus Ouest 31 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple des échantillons de blé Analyse de variance Mathieu EMILY - Agrocampus Ouest 32 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Tests des effets aléatoires On commence par regarder l’effet d’interaction : I I Le test est identique à celui des effets fixes. On peut lire p = 0.91514, donc on “accepte” H0 : σMoulin:Echantillon = 0 On peut regarder le modèle sans interaction. Analyse de variance Mathieu EMILY - Agrocampus Ouest 33 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Estimation sans interaction Analyse de variance Mathieu EMILY - Agrocampus Ouest 34 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Tests des effets aléatoires On regarde le modèle sans interaction : I I I Les tests sont identiques à ceux des effets fixes. On peut lire pMoulin = 0.02789, donc on rejette H0 : σMoulin = 0 On peut lire pEchantillon = 0.233, donc on “accepte” H0 : σEchantillon = 0 Analyse de variance Mathieu EMILY - Agrocampus Ouest 35 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Modèle à 1 facteur Analyse de variance Mathieu EMILY - Agrocampus Ouest 36 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Données déséquilibrées En déséquilibre tout se complique ! Les espérances des carrés moyens ne s’expriment pas facilement ! Il existe des tests approchés sur le même principe mais : I I I les sommes des carrés ne sont plus des χ2 , les sommes des carrés ne s’additionnent plus pour donner la somme des carrés totale, Les résultats sont tout de même interprétés comme pour le cas équilibré. Analyse de variance Mathieu EMILY - Agrocampus Ouest 37 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 38 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Ecriture du modèle Yijk` = µ + Ai + Bj + Ck + ABij + ACik + BCjk + ABCijk + εijk` Hypothèses de modélisation : I I I I I I I I I Les Ai sont indépendants et de même loi : Ai ∼ N(0, σA ) Les Bj sont indépendants et de même loi : Bj ∼ N(0, σB ) Les Ck sont indépendants et de même loi : Ck ∼ N(0, σC ) Les ABij sont indépendants et de même loi : ABij ∼ N(0, σAB ) Les ACik sont indépendants et de même loi : ACik ∼ N(0, σAC ) Les BCjk sont indépendants et de même loi : BCjk ∼ N(0, σBC ) Les ABCijk sont indépendants et de même loi : ABCijk ∼ N(0, σABC ) Les εijk ` sont indépendants et de même loi : εijk ` ∼ N(0, σ) Les Ai , Bj , Ck , ABij , ACik , BCjk , ABCijk et les εijk ` sont indépendants entre eux Analyse de variance Mathieu EMILY - Agrocampus Ouest 39 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Tests de l’effet du facteur A E[CMA ] = σ2 + L σ2ABC + JL σ2AC + KL σ2AB + JKL σ2A E[CMB ] = σ2 + L σ2ABC + IL σ2BC + KL σ2AB + IKL σ2B E[CMC ] = σ2 + L σ2ABC + JL σ2AC + IL σ2BC + IJL σ2C E[CMAB ] = σ2 + L σ2ABC + KL σ2AB E[CMAC ] = σ2 + L σ2ABC + JL σ2AC E[CMBC ] = σ2 + L σ2ABC + IL σ2BC E[CMABC ] E[CMR ] = σ2 + L σ2ABC = σ2 Pour tester H0 : σA = 0, il faut trouver une base de comparaison. I Problème : cette base de comparaison n’existe pas de façon générale ! Analyse de variance Mathieu EMILY - Agrocampus Ouest 40 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Tests de l’effet du facteur A A peut-être testé par rapport à son interaction avec B si et seulement si son interaction avec le facteur C n’est pas significative. I I Dans ce cas : E[CMA ] = σ2 + KL σ2AB + JKL σ2A = E[CMAB ] + JKL σ2A CM Ainsi sous H0 : σA = 0 : CM A ∼ F(II−−11)(J −1) AB Si aucune des 2 interactions AB et AC ne peut-être négligée on peut faire des regroupements : E[CMA ] = E[CMAB + CMAC − CMABC ] + JKLσ2A I En suivant le principe “à la Fisher”, sous H0 : σA = 0 : CMA I−1 ∼ Fddl CMAB + CMAC − CMABC I Le problème vient de la définition du ddl du dénominateur. Analyse de variance Mathieu EMILY - Agrocampus Ouest 41 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Méthode de Satterthwaite pour les ddl Considérons la combinaison linéaire de carrés moyens : k1 CM1 + k2 CM2 + · · · + kp CMp Le nombre de degrés de liberté est donné par : ddl = (k1 CM1 + k2 CM2 + · · · + kp CMp )2 CM 2 CM 2 CM 2 k12 ddl11 + k22 ddl22 + · · · + kp2 ddlpp Pour le cas du facteur A : ddl = (CMAB + CMAC − CMABC )2 CM2AB (I−1)(J−1) + Analyse de variance CM2AC (I−1)(K−1) + CM2ABC (I−1)(J−1)(K−1) Mathieu EMILY - Agrocampus Ouest 42 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Tester les effets d’interaction et bilan Interaction d’ordre 2 : I I Il existe une base de comparaison : l’interaction triple ABC CM Par exemple pour AB : FAB = CM AB ABC Interaction d’ordre 3 : FABC = CMABC CMR Remarque : si l’interaction CMABC est absente, il faut remplacer CMABC par CMR dans les statistiques de test. Bilan Il faut commencer par tester les interactions d’ordre le plus élevé pour raffiner le modèle On peut généraliser le principe à un modèle k > 3 effets aléatoires. Il faut toujours rester vigilant à la base de comparaison des effets testés. Analyse de variance Mathieu EMILY - Agrocampus Ouest 43 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires 2 Modèles à effets aléatoires 3 Modèles mixtes Analyse de variance Mathieu EMILY - Agrocampus Ouest 44 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 45 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Exemple introductif Vos dents en or sont-elles solides ? Le jeu de données est caractérisé par : I I 90 observations 5 variables : Dentiste, Méthode, Alliage, Température et Solidité On va commencer par évaluer l’effet de la méthode sur la solidité Analyse de variance Mathieu EMILY - Agrocampus Ouest 46 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Exemple introductif (2) D’après les graphiques précédents on semble voir : I I I Un effet de la méthode Un effet du dentiste Une interaction méthode-dentiste Nature des effets : I I Méthode : effet fixe Dentiste : effet aléatoire Un modèle d’ANOVA qui combine un/des effets fixes avec un/des effets aléatoires est appelé un modèle mixte. Analyse de variance Mathieu EMILY - Agrocampus Ouest 47 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 48 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Ecriture du modèle Yijk = µ + αi + Bj + ABij + εijk αi est l’effet du facteur à effets fixes Bj est l’effet du facteur aléatoire ABij est l’effet du facteur interaction (aléatoire) εijk le résidu du modèle Hypothèses de modélisation : I I I I Les Bj sont indépendants et de même loi : Bj ∼ N(0, σB ) Les ABij sont indépendants et de même loi : ABij ∼ N(0, σAB ) Les εijk sont indépendants et de même loi : εijk ∼ N(0, σ) Les Bj , ABij et les εijk sont indépendants entre eux On utilisera la contrainte de nullité de la somme pour l’effet fixe : I X αi = 0 i =1 Analyse de variance Mathieu EMILY - Agrocampus Ouest 49 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Estimation La décomposition de la variance est identique à celle des effets fixes. On peut alors s’appuyer sur les espérances des carrés moyens. Dans le cas équilibré : E[CMA ] = σ2 + K σ2AB + E[CMB ] = σ2 + IK σ2B E[CMAB ] = σ2 + K σ2AB E[CMR ] I JK X 2 α I − 1 i =1 i = σ2 On peut alors proposer les estimateurs sans biais suivants : c2 σ B = d 2 σ AB = c2 σ = Analyse de variance CMB − CMR IK CMAB − CMR K CMR Mathieu EMILY - Agrocampus Ouest 50 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Test des effets D’après les espérances précédentes on a : I H0 : ∀i αi = 0 FA = I ∼H0 F(I−1)(J −1) H0 : σB = 0 FB = I (I−1) CMA CMAB CMB CMR (J −1) ∼H0 FIJ (K −1) H0 : σAB = 0 FAB = CMAB CMR (I−1)(J −1) ∼H0 FIJ (K −1) Remarques : I I I L’effet fixe est comparé à l’interaction.. L’effet aléatoire est comparé à la résiduelle. On commence par tester l’effet d’interaction. S’il n’est pas significatif, l’effet d’interaction est inclus dans la résiduelle. Analyse de variance Mathieu EMILY - Agrocampus Ouest 51 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Tableau récapitulatif Le tableau ci-dessous résume l’apparition des différents termes dans l’espérance des carrés moyens. Le symbole + signifie que le terme intervient par sa somme pondérée. Les autres symboles correspondent à la pondération du terme. Carrés moyens CMA CMB CMAB CMR σ2 1 1 1 1 Modèle fixe (αβ)2ij β2j + + α2i σ2 + 1 1 1 1 Analyse de variance Modèle mixte σ2AB σ2B K IK K α2i σ2 + 1 1 1 1 Mathieu EMILY - Agrocampus Ouest Modèle aléatoire σ2AB σ2B K K K IK σ2A JK 52 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple Analyse de variance Mathieu EMILY - Agrocampus Ouest 53 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Plan 1 Variables à effets aléatoires Exemples Caractérisation 2 Modèles à effets aléatoires Modèle à 1 facteur aléatoire Modèle Estimation Test de l’effet du facteur Modèle à 2 facteurs aléatoires Modèle Estimation et tests Cas déséquilibré Modèle à 3 facteurs aléatoires 3 Modèles mixtes Introduction Modèle à 2 facteurs avec interaction Modèle Estimation et test Modèle à 3 facteurs Analyse de variance Mathieu EMILY - Agrocampus Ouest 54 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Tableau récapitulatif (1) Carrés moyens CMA CMB CMC CMAB CMAC CMBC CMABC CMR Carrés moyens CMA CMB CMC CMAB CMAC CMBC CMABC CMR σ2 1 1 1 1 1 1 1 1 σ2 1 1 1 1 1 1 1 1 Modèle fixe (αβγ)2ijk βγjk2 αγik2 αβ2ij γk2 β2j α2i + + + + + + + σ2abC Modèle mixte (a et b fixes) σ2bC σ2aC αβ2ij σ2C β2j JL α2i + IL + IJL L + JL IL L Analyse de variance Mathieu EMILY - Agrocampus Ouest 55 Modèles mixtes Modèles à effets aléatoires Variables à effets aléatoires Tableau récapitulatif (2) Carrés moyens CMA CMB CMC CMAB CMAC CMBC CMABC CMR Carrés moyens CMA CMB CMC CMAB CMAC CMBC CMABC CMR σ2 σ2aBC 1 1 1 1 1 1 1 1 L σ2 σ2aBC 1 1 1 1 1 1 1 1 L L L L L L L Modèle mixte (a fixe) σ2BC σ2aC σ2aB JL KL IL IL σ2C σ2B α2i + IKL IJL L L KL JL IL L Modèle aléatoires σ2BC IL IL σ2aC σ2aB JL KL KL JL σ2C σ2B σ2A JKL IKL IJL KL JL IL Analyse de variance Mathieu EMILY - Agrocampus Ouest 56 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Test dans le modèle mixte (a et b fixes) Chaque effet a une base de comparaison FA = FB = FC = FAB = FAC = FBC = FABC = CMA (I−1) ∼ F(I−1)(K −1) CMAC CMB (J −1) ∼ F(J −1)(K −1) CMBC CMC (K −1) ∼ FIJK (L −1) CMR CMAB (I−1)(J −1) ∼ F(I−1)(J −1)(K −1) CMABC CMAC (I−1)(K −1) ∼ FIJK (L −1) CMR CMBC (J −1)(K −1) ∼ FIJK (L −1) CMR CMABC (I−1)(J −1)(K −1) ∼ FIJK (L −1) CMR Analyse de variance Mathieu EMILY - Agrocampus Ouest 57 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple Considérons la température comme effet fixe On pourrait (devrait ? ?) étudier les modèles sans les effets non-significatif : I Procédure pas à pas en regardant les ordres d’interaction les plus élevés Analyse de variance Mathieu EMILY - Agrocampus Ouest 58 Modèles à effets aléatoires Variables à effets aléatoires Modèles mixtes Test dans le modèle mixte (a fixe) Le facteur fixe n’a pas de base de comparaison : FA = avec ddl = CMA (I−1) ∼ Fddl CMAB + CMAC − CMABC (CMAB +CMAC −CMABC )2 2 2 /ddl 2 CMAB AB +CMAC /ddlAC +CMABC /ddlABC FB = FC = FAB = FAC = FBC = FABC = CMB (J −1) ∼ F(J −1)(K −1) CMBC CMC (K −1) ∼ F(J −1)(K −1) CMBC CMAB (I−1)(J −1) ∼ F(I−1)(J −1)(K −1) CMABC CMAC (I−1)(K −1) ∼ F(I−1)(J −1)(K −1) CMABC CMBC (J −1)(K −1) ∼ FIJK (L −1) CMR CMABC (I−1)(J −1)(K −1) ∼ FIJK (L −1) CMR Analyse de variance Mathieu EMILY - Agrocampus Ouest 59 Variables à effets aléatoires Modèles à effets aléatoires Modèles mixtes Retour sur l’exemple Considérons la température comme effet aléatoire On pourrait (devrait ? ?) étudier les modèles sans les effets non-significatif : I Procédure pas à pas en regardant les ordres d’interaction les plus élevés Analyse de variance Mathieu EMILY - Agrocampus Ouest 60