Une extension bidimensionnelle du mod`ele de Bradley
Transcription
Une extension bidimensionnelle du mod`ele de Bradley
Une extension bidimensionnelle du modèle de Bradley-Terry pour les comparaisons par paires François Husson1 & David Causeur 1 1,2 : ENSA de Rennes, 65 rue de St-Brieuc, 35042 Rennes cedex, France 2 : CREST-ENSAI, Campus de Ker Lann, Bruz, France Résumé Le modèle de Bradley-Terry est l’outil le plus largement utilisé lorsqu’il s’agit de classer des objets à partir de comparaisons par paires. L’hypothèse sous-jacente qui rend le classement possible est l’existence d’une échelle linéaire latente du mérite ou d’une manière équivalente d’une forme de transitivité de ce mérite. Cependant, dans certaines situations telles que des comparaisons sensorielles de produits alimentaires, cette hypothèse est parfois peu réaliste. Notre but est de proposer une extension à deux dimensions du modèle de Bradley-Terry qui prenne en compte des interactions entre les objets comparés, ou en d’autres termes des ruptures de transitivité de la préférence. D’un point de vue méthodologique, cette proposition peut être vue comme une méthode de positionnement multidimensionnel dans le cadre d’un modèle logistique pour des données binomiales. Les paramètres du modèle sont estimés par maximum de vraisemblance et l’étude des propriétés asymptotiques permet de construire des ellipses de confiance sur la représentation de l’interaction en deux dimensions. Sur un exemple issu de vraies données sensorielles nous construisons le modèle à deux dimensions afin d’éclairer les défauts d’ajustement du modèle de Bradley-Terry à 1 dimension. Mots clés : Modèle de Bradley-Terry, Positionnement multidimensionnel, Comparaison par paires, Modèles à interaction structurée. Abstract The Bradley-Terry model is widely and often beneficially used to rank objects from paired comparisons. The underlying assumption that makes ranking possible is the existence of a latent linear scale of merit or equivalently of a kind of transitiveness of the preference. However, in some situations such as sensory comparisons of products, this assumption can be unrealistic. In these contexts, although the Bradley-Terry model appears to be significantly interesting, the linear ranking does not make sense. Our aim is to propose a 2dimensional extension of the Bradley-Terry model that accounts for interactions between the compared objects. From a methodological point of view, this proposition can be seen as a multidimensional scaling approach in the context of a logistic model for binomial data. Maximum likelihood is investigated and asymptotic properties are derived in order 1 to construct confidence ellipses on the diagram of the 2-dimensional scores. It is shown by an illustrative example based on real sensory data how to use the 2-dimensional model to inspect the lack-of-fit of the Bradley-Terry model. Keywords: Bradley-Terry models, Multidimensional scaling, Paired comparison models, Structured interaction models. 1 Introduction La méthodologie des comparaisons par paires est utilisée dans un grand nombre de domaines d’applications, le plus souvent à des fins de classement des objets comparés. On trouve d’ailleurs une littérature statistique très riche concernant d’une part la mise en œuvre pratique et d’autre part les propriétés statistiques des modèles de comparaisons par paires. Pour plus de détails, on peut citer par exemple le travail de synthèse de David (1988). L’analyse de résultats sportifs est le plus emblématique des exemples d’utilisation des modèles de comparaisons par paires. Dans ce contexte, on cherche à établir un classement de joueurs ou d’équipes de joueurs à partir des résultats, victoires ou défaites, de leurs rencontres par couples. De manière similaire, dans l’analyse des citations proposée par Stigler (1994), les relations entre différentes revues de statistique ou de théorie des probabilités sont examinées à partir d’un tableau collectant le nombre de citations d’une revue par une autre. Enfin, l’exemple utilisé dans notre exposé oral pour illustrer notre contribution à la modélisation des comparaisons par paires émarge au domaine de l’analyse de données sensorielles, consistant notamment à comparer des produits agro-alimentaires à partir de leurs évaluations sensorielles par des dégustateurs. En l’occurence, la comparaison par paires consiste à ne retenir que la préférence exprimée par le dégustateur pour un produit plutôt qu’un autre. L’objectif est d’élaborer, à partir de ces comparaisons, un classement des produits reflétant la préférence des dégustateurs. De manière générale, la procédure de classement par des modèles de comparaisons par paires passe par l’attribution d’un score, reflétant une forme de mérite sur une échelle linéaire, des objets que l’on compare. Le plus ancien, mais aussi le plus populaire, des modèles de comparaisons par paires est celui proposé par Bradley & Terry (1952). Bien que dans sa version originale, le modèle de Bradley-Terry ne soit pas explicitement présenté comme un cas particulier de modèle d’analyse de la variance, Agresti (1990) fait clairement le lien avec les modèles logistiques d’analyse de la variance pour des variables distribuées selon une loi binomiale. Ce point de vue permet d’une part une nouvelle approche des aspects algorithmiques des problèmes d’estimation et d’autre part une définition plus claire des limites d’utilisation de ces modèles. La prise en compte de certaines de ces limites a conduit à la mise en œuvre d’extensions, le plus souvent non-linéaires, du modèle de Bradley-Terry. Davidson & Farquhar (1976) présentent un des premiers travaux de synthèse sur ces prolongements. On peut citer, parmi les extensions les plus marquantes, celles proposées par Rao & Kupper (1967) ou Davidson (1970) 2 qui permettent de tenir compte d’ex-aequo lors des comparaisons. Notons aussi le modèle d’Agresti (1990) qui introduit, dans le contexte d’épreuves sportives, une dissymétrie dans la comparaison par la notion d’avantage de l’équipe qui reçoit. Comme le montre Hunter (2004), la plupart de ces extensions non-linéaires du modèle de Bradley-Terry appartiennent à une même classe de modèles de régression pour variables binomiales, pour laquelle des algorithmes, dits MM pour Minorization-Maximization, permettent une estimation efficace des scores de mérite. Par ailleurs, dans les contextes de l’analyse de données sensorielles ou psychométriques, il faut aussi signaler la prise en compte de covariables par De Soete & Caroll (1983) ou Dittrich et al. (1998) dans le but de modéliser l’interaction entre la préférence et une information externe caractérisant les conditions expérimentales. Le modèle de Bradley-Terry suppose l’existence d’une échelle linéaire de mérite, qui justifie l’objectif de classement des objets comparés. Cependant, cette hypothèse peut s’avérer inappropriée lorsque la relation d’ordre que définit la préférence n’est pas transitive. Par exemple, dans le cas de l’analyse de données sensorielles, on observe parfois qu’un produit A est préféré à un autre produit B, que B est lui-même préféré à C mais que, lorsque A et C sont comparés, C est le plus souvent préféré à A. Comme le suggère Hunter (2004), un graphe orienté dans lequel les distances entre les nœuds traduisent la différence en termes de préférence entre les produits est plus adapté à ce type de situations. De manière similaire, notre objectif est de proposer un modèle qui prolonge celui de Bradley-Terry par la prise en compte de ce type d’interactions entre les objets comparés. 2 Motivations pour une extension bi-dimensionnelle On considère dans la suite la comparaison par paires de n objets par le biais d’expériences indépendantes. La variable réponse observée à chaque comparaison est Nij , le nombre de victoires de l’objet i sur l’objet j, distribué selon une loi binomiale : Nij ∼ B(mij ; πij ), où mij ≥ 1 est le nombre de comparaisons de i et j et 0 ≤ πij ≤ 1 est la probabilité que i gagne contre j. Les méthodes de classement des objets à partir de leurs performances lors de leurs comparaisons avec les autres objets sont fondées sur une modélisation plus ou moins sophistiquée de la probabilité πij . Depuis Bradley & Terry (1952), ce type de démarche repose sur l’existence supposée d’un vecteur de scores λ = (λ1 , λ2 , . . . , λn ), quantifiant le mérite, la propension à gagner, des objets à comparer. Ainsi, le modèle de BradleyTerry peut être vu comme un modèle logistique d’analyse de la variance pour le modèle binomial : logit(πij ) = λi − λj . 3 (1) L’idée qui sous-tend ce modèle est la linéarité de l’échelle de représentation du mérite d’un objet P par les scores. L’identifiabilité des scores est traditionnellement assurée par la contrainte ni=1 λi = 0. Par conséquent, dans certaines situations, alors que le modèle de Bradley-Terry s’ajuste de manière significative aux données de comparaisons par paires, le classement par les scores peut ne pas refléter de manière satisfaisante l’observation. Ce problème remet alors en cause la pertinence d’une échelle linéaire du mérite et donc celle d’un classement global. Notre objectif est de proposer des outils permettant de prendre en compte d’éventuelles interactions entre les objets, affectant la représentation linéaire du mérite. Dans cette optique, on propose le modèle logistique non-linéaire suivant : q (2) logit(πij ) = sij (λi,1 − λj,1 )2 + (λi,2 − λj,2 )2 , où sij = ±1 est un signe reflétant la supériorité ou l’infériorité observée entre i et j, λ1 = 0 (λ1,1 , λ2,1 , . . . , λn,1 )0 et λ2 = (λ1,2 , λ2,2 , . . . , λP de taille n,2 ) sont des Pnn, satisfaisant Pvecteurs n n λ = 0 et λ = les contraintes d’identifiabilité suivantes : i=1 λi,1 λi,2 = 0. i=1 i,2 i=1 i,1 0 0 0 Dans la suite, on note λ le vecteur (λ1 , λ2 ) contenant tous les paramètres du modèle. En d’autres termes, logit(πij ) est modélisé par une distance Euclidienne signée dans 2 R , de type positionnement multidimensionnel, très utilisée dans le cadre de modèles gaussiens. Par analogie avec les modèles de positionnement multidimensionnel, on suppose dans la suite que λ1 et λ2 sont des vecteurs orthogonaux afin d’assurer l’invariance de la vraisemblance par rotation. L’estimation de λ1 et λ2 permet ici de construire un diagramme s’apparentant à une cartographie du mérite au sens où les distances entre les points du diagramme traduisent des différences de mérite entre les objets. Notons que, lorsqu’il existe effectivement une échelle linéaire du mérite, à savoir lorsque λ2 = 0, le modèle (2) donne la même représentation des objets que le modèle de Bradley-Terry. 3 Estimation par maximum de vraisemblance Le choix d’un point de départ à l’algorithme d’estimation, de type Newton-Raphson, est un point important de la procédure. Dans cette optique, on peut s’appuyer sur une approximation normale du modèle binomial. Dans un premier temps, pour de grandes valeurs de mij , on sait que la proportion observée Nij /mij de victoires de i sur j est distribuée selon une loi normale d’espérance πij et de variance πij (1 − πij )/mij . La normalité asymptotique est aussi valide pour logit(Nij /mij ). De plus, on déduit de l’approximation par une série de Taylor au voisinage de πij que : πij (1 − πij ) ∂ 2 logitx Nij −1 E logit = logitπij + (π ) + o m . ij ij mij 2mij ∂x2 4 Par conséquent, logit(Nij /mij ) peut approximativement être considérée comme une variable distribuée selon une loi normale dont l’espérance est une distance Euclidienne signée dans R2 . Il est alors possible de calculer explicitement des estimateurs des paramètres λ1 et λ2 par les techniques de positionnement multidimensionnel. Soit Q la matrice n × n de terme générique qij = [logit(Nij /mij )]2 . Soit Qc = [In − (1/n)Jn ]Q[In −(1/n)Jn ] la matrice obtenue par centrage de Q sur les lignes et les colonnes, où In est la matrice identité n × n et Jn la matrice n × n dont tous les éléments valent 1. Soit aussi q le nombre de valeurs propres positives d1 ≥ d2 ≥ . . . ≥ dq de −1/2 Qc avec 2 ≤ q ≤ n − 1. Soit vi le vecteur propre de norme 1 associé à la valeur propre di , alors on propose le point de départ suivant pour l’estimation de λ: (0) λi 4 = di vi , i = 1, 2. Propriétés asymptotiques de l’estimateur Dans des conditions asymptotiques, à savoir pour de grands nombres mij de comparaisons, l’estimateur λ̂ est distribué selon une loi normale d’espérance λ et de matrice de variancecovariance Vλ̂ , dont la forme explicite est donnée par Causeur & Husson (2004). Ainsi, on peut construire des régions de confiance pour les paramètres (λi,1 , λi,2 ). On peut déduire aussi une procédure de comparaisons multiples visant à tester la nullité des quantités logit πij . Enfin, ces propriétés asymptotiques permettent de construire des tests de la pertinence d’une représentation bi-dimensionnelle par rapport à des sous-modèles uni-dimensionnels, dont le modèle de Bradley-Terry. Compte tenu de l’emboı̂tement de ces modèles, les stratégies de tests s’apparentent à une analyse de la déviance. Il est particulièrement intéressant de comparer le modèle (2) aux sous-modèles suivants : logitπij = 0 logitπij = λi − λj logitπij = sij |λi − λj | (M0 ) (M1 ) (M10 ) Le modèle (M0 ) est le modèle nul obtenu à partir du modèle (2) en supposant λ = 0. (M1 ) est le modèle de Bradley-Terry et (M10 ) est le modèle uni-dimensionnel se déduisant du modèle (2) par l’hypothèse λ2 = 0. La procédure séquentielle de tests d’analyse de la déviance est présentée (tableau 1) avec les degrés de liberté des lois de χ2 correspondantes. 5 Illustration Lors de l’exposé, une application sur des données sensorielles servira d’illustration à l’utilisation du modèle de Bradley-Terry à 2 dimensions. 5 Modèles Déviance Degrés de liberté (M0 ) (M1 ) (M10 ) Modèle (2) −2L(0) + 2Lmax −2L(0) + 2L(λ̂M1 ) −2L(0) + 2L(λ̂M10 ) −2L(λ̂M1 ) + 2L(λ̂) −2L(λ̂M10 ) + 2L(λ̂) −2L(λ̂) + 2Lmax n(n−1) 2 Résiduelle n−1 n−1 n−2 n−2 n(n−1) − (2n − 3) 2 Table 1: Table d’analyse séquentielle de la déviance pour le test de la pertinence du modèle de Bradley-Terry bi-dimensionnel Bibliographie Agresti, A. (1990). Categorical Data Analysis, Wiley, New-York. Bradley, R.A. and Terry, M.A. (1952). Rank analysis of incomplete block designs. Biometrika, 39, 324-345. Causeur, D. & Husson, F. (2004). A 2-dimensional extension of the Bradley-Terry model for paired comparisons. Submitted to Journal of Statistical Planning and Inference. David, H.A. (1988). The method of paired comparisons. 2nd edition. Oxford University Press, New York. Davidson, R.R. (1970). On extending the Bradley-Terry model to accommodate ties in paired comparison experiments. Journal of the American Statistical Association, 65, 317-328. Davidson, R.R. and Farquhar, P.H. (1976). A bibliography on the method of paired comparisons, Biometrics, 32, 241-252. De Soete, G. and Carroll, J.D. (1983). A maximum likelihood method for fitting the wandering vector model. Psychometrika, 48, 553-566. Dittrich, R., Hatzinger, R. and Katzenbeisser, W. (1998). Modelling the effect of subjectspecific covariates in paired comparison studies with an application to university rankings. Applied statistics. 47 (4) 511-525. Hunter, D.R. (2004). MM algorithms for generalized Bradley-Terry models, Annals of Statistics, Vol. 32, No. 1 - February 2004. Ramsay, J.O. (1982). Some statistical approaches to multidimensional scaling data. Journal of the Royal Statistical Society A, 145, 3, 285-312. Rao, P.V. and Kupper, L.L. (1967). Ties in paired-comparison experiments: a generalization of the Bradley-Terry model. Journal of the American Statistical Association, 62, 194-204. Stigler, S.M. (1994). Citation patterns in the journals of statistics and probability. Statistical Science, 9, 94-108. 6