Une extension bidimensionnelle du mod`ele de Bradley

Transcription

Une extension bidimensionnelle du mod`ele de Bradley
Une extension bidimensionnelle du modèle de
Bradley-Terry pour les comparaisons par paires
François Husson1 & David Causeur
1
1,2
: ENSA de Rennes, 65 rue de St-Brieuc, 35042 Rennes cedex, France
2
: CREST-ENSAI, Campus de Ker Lann, Bruz, France
Résumé
Le modèle de Bradley-Terry est l’outil le plus largement utilisé lorsqu’il s’agit de classer des
objets à partir de comparaisons par paires. L’hypothèse sous-jacente qui rend le classement possible est l’existence d’une échelle linéaire latente du mérite ou d’une manière
équivalente d’une forme de transitivité de ce mérite. Cependant, dans certaines situations telles que des comparaisons sensorielles de produits alimentaires, cette hypothèse
est parfois peu réaliste. Notre but est de proposer une extension à deux dimensions du
modèle de Bradley-Terry qui prenne en compte des interactions entre les objets comparés,
ou en d’autres termes des ruptures de transitivité de la préférence. D’un point de vue
méthodologique, cette proposition peut être vue comme une méthode de positionnement
multidimensionnel dans le cadre d’un modèle logistique pour des données binomiales. Les
paramètres du modèle sont estimés par maximum de vraisemblance et l’étude des propriétés asymptotiques permet de construire des ellipses de confiance sur la représentation
de l’interaction en deux dimensions. Sur un exemple issu de vraies données sensorielles
nous construisons le modèle à deux dimensions afin d’éclairer les défauts d’ajustement du
modèle de Bradley-Terry à 1 dimension.
Mots clés : Modèle de Bradley-Terry, Positionnement multidimensionnel, Comparaison
par paires, Modèles à interaction structurée.
Abstract
The Bradley-Terry model is widely and often beneficially used to rank objects from paired
comparisons. The underlying assumption that makes ranking possible is the existence of
a latent linear scale of merit or equivalently of a kind of transitiveness of the preference.
However, in some situations such as sensory comparisons of products, this assumption
can be unrealistic. In these contexts, although the Bradley-Terry model appears to be
significantly interesting, the linear ranking does not make sense. Our aim is to propose a 2dimensional extension of the Bradley-Terry model that accounts for interactions between
the compared objects. From a methodological point of view, this proposition can be seen
as a multidimensional scaling approach in the context of a logistic model for binomial
data. Maximum likelihood is investigated and asymptotic properties are derived in order
1
to construct confidence ellipses on the diagram of the 2-dimensional scores. It is shown
by an illustrative example based on real sensory data how to use the 2-dimensional model
to inspect the lack-of-fit of the Bradley-Terry model.
Keywords: Bradley-Terry models, Multidimensional scaling, Paired comparison models,
Structured interaction models.
1
Introduction
La méthodologie des comparaisons par paires est utilisée dans un grand nombre de domaines d’applications, le plus souvent à des fins de classement des objets comparés. On
trouve d’ailleurs une littérature statistique très riche concernant d’une part la mise en
œuvre pratique et d’autre part les propriétés statistiques des modèles de comparaisons
par paires. Pour plus de détails, on peut citer par exemple le travail de synthèse de David
(1988). L’analyse de résultats sportifs est le plus emblématique des exemples d’utilisation
des modèles de comparaisons par paires. Dans ce contexte, on cherche à établir un classement de joueurs ou d’équipes de joueurs à partir des résultats, victoires ou défaites, de
leurs rencontres par couples. De manière similaire, dans l’analyse des citations proposée
par Stigler (1994), les relations entre différentes revues de statistique ou de théorie des
probabilités sont examinées à partir d’un tableau collectant le nombre de citations d’une
revue par une autre. Enfin, l’exemple utilisé dans notre exposé oral pour illustrer notre
contribution à la modélisation des comparaisons par paires émarge au domaine de l’analyse
de données sensorielles, consistant notamment à comparer des produits agro-alimentaires
à partir de leurs évaluations sensorielles par des dégustateurs. En l’occurence, la comparaison par paires consiste à ne retenir que la préférence exprimée par le dégustateur pour
un produit plutôt qu’un autre. L’objectif est d’élaborer, à partir de ces comparaisons, un
classement des produits reflétant la préférence des dégustateurs.
De manière générale, la procédure de classement par des modèles de comparaisons
par paires passe par l’attribution d’un score, reflétant une forme de mérite sur une
échelle linéaire, des objets que l’on compare. Le plus ancien, mais aussi le plus populaire, des modèles de comparaisons par paires est celui proposé par Bradley & Terry
(1952). Bien que dans sa version originale, le modèle de Bradley-Terry ne soit pas explicitement présenté comme un cas particulier de modèle d’analyse de la variance, Agresti
(1990) fait clairement le lien avec les modèles logistiques d’analyse de la variance pour
des variables distribuées selon une loi binomiale. Ce point de vue permet d’une part une
nouvelle approche des aspects algorithmiques des problèmes d’estimation et d’autre part
une définition plus claire des limites d’utilisation de ces modèles. La prise en compte
de certaines de ces limites a conduit à la mise en œuvre d’extensions, le plus souvent
non-linéaires, du modèle de Bradley-Terry. Davidson & Farquhar (1976) présentent un
des premiers travaux de synthèse sur ces prolongements. On peut citer, parmi les extensions les plus marquantes, celles proposées par Rao & Kupper (1967) ou Davidson (1970)
2
qui permettent de tenir compte d’ex-aequo lors des comparaisons. Notons aussi le modèle
d’Agresti (1990) qui introduit, dans le contexte d’épreuves sportives, une dissymétrie dans
la comparaison par la notion d’avantage de l’équipe qui reçoit. Comme le montre Hunter
(2004), la plupart de ces extensions non-linéaires du modèle de Bradley-Terry appartiennent à une même classe de modèles de régression pour variables binomiales, pour laquelle
des algorithmes, dits MM pour Minorization-Maximization, permettent une estimation
efficace des scores de mérite. Par ailleurs, dans les contextes de l’analyse de données sensorielles ou psychométriques, il faut aussi signaler la prise en compte de covariables par
De Soete & Caroll (1983) ou Dittrich et al. (1998) dans le but de modéliser l’interaction
entre la préférence et une information externe caractérisant les conditions expérimentales.
Le modèle de Bradley-Terry suppose l’existence d’une échelle linéaire de mérite, qui
justifie l’objectif de classement des objets comparés. Cependant, cette hypothèse peut
s’avérer inappropriée lorsque la relation d’ordre que définit la préférence n’est pas transitive. Par exemple, dans le cas de l’analyse de données sensorielles, on observe parfois
qu’un produit A est préféré à un autre produit B, que B est lui-même préféré à C mais
que, lorsque A et C sont comparés, C est le plus souvent préféré à A. Comme le suggère
Hunter (2004), un graphe orienté dans lequel les distances entre les nœuds traduisent la
différence en termes de préférence entre les produits est plus adapté à ce type de situations. De manière similaire, notre objectif est de proposer un modèle qui prolonge celui de
Bradley-Terry par la prise en compte de ce type d’interactions entre les objets comparés.
2
Motivations pour une extension bi-dimensionnelle
On considère dans la suite la comparaison par paires de n objets par le biais d’expériences
indépendantes. La variable réponse observée à chaque comparaison est Nij , le nombre de
victoires de l’objet i sur l’objet j, distribué selon une loi binomiale :
Nij ∼ B(mij ; πij ),
où mij ≥ 1 est le nombre de comparaisons de i et j et 0 ≤ πij ≤ 1 est la probabilité que
i gagne contre j.
Les méthodes de classement des objets à partir de leurs performances lors de leurs
comparaisons avec les autres objets sont fondées sur une modélisation plus ou moins
sophistiquée de la probabilité πij . Depuis Bradley & Terry (1952), ce type de démarche
repose sur l’existence supposée d’un vecteur de scores λ = (λ1 , λ2 , . . . , λn ), quantifiant
le mérite, la propension à gagner, des objets à comparer. Ainsi, le modèle de BradleyTerry peut être vu comme un modèle logistique d’analyse de la variance pour le modèle
binomial :
logit(πij ) = λi − λj .
3
(1)
L’idée qui sous-tend ce modèle est la linéarité de l’échelle de représentation du mérite
d’un objet P
par les scores. L’identifiabilité des scores est traditionnellement assurée par la
contrainte ni=1 λi = 0.
Par conséquent, dans certaines situations, alors que le modèle de Bradley-Terry s’ajuste
de manière significative aux données de comparaisons par paires, le classement par les
scores peut ne pas refléter de manière satisfaisante l’observation. Ce problème remet
alors en cause la pertinence d’une échelle linéaire du mérite et donc celle d’un classement global. Notre objectif est de proposer des outils permettant de prendre en compte
d’éventuelles interactions entre les objets, affectant la représentation linéaire du mérite.
Dans cette optique, on propose le modèle logistique non-linéaire suivant :
q
(2)
logit(πij ) = sij (λi,1 − λj,1 )2 + (λi,2 − λj,2 )2 ,
où sij = ±1 est un signe reflétant la supériorité ou l’infériorité observée entre i et j, λ1 =
0
(λ1,1 , λ2,1 , . . . , λn,1 )0 et λ2 = (λ1,2 , λ2,2 , . . . , λP
de taille
n,2 ) sont des
Pnn, satisfaisant
Pvecteurs
n
n
λ
=
0
et
λ
=
les contraintes d’identifiabilité suivantes :
i=1 λi,1 λi,2 = 0.
i=1 i,2
i=1 i,1
0 0
0
Dans la suite, on note λ le vecteur (λ1 , λ2 ) contenant tous les paramètres du modèle.
En d’autres termes, logit(πij ) est modélisé par une distance Euclidienne signée dans
2
R , de type positionnement multidimensionnel, très utilisée dans le cadre de modèles
gaussiens. Par analogie avec les modèles de positionnement multidimensionnel, on suppose
dans la suite que λ1 et λ2 sont des vecteurs orthogonaux afin d’assurer l’invariance de la
vraisemblance par rotation.
L’estimation de λ1 et λ2 permet ici de construire un diagramme s’apparentant à une
cartographie du mérite au sens où les distances entre les points du diagramme traduisent
des différences de mérite entre les objets. Notons que, lorsqu’il existe effectivement
une échelle linéaire du mérite, à savoir lorsque λ2 = 0, le modèle (2) donne la même
représentation des objets que le modèle de Bradley-Terry.
3
Estimation par maximum de vraisemblance
Le choix d’un point de départ à l’algorithme d’estimation, de type Newton-Raphson,
est un point important de la procédure. Dans cette optique, on peut s’appuyer sur une
approximation normale du modèle binomial. Dans un premier temps, pour de grandes
valeurs de mij , on sait que la proportion observée Nij /mij de victoires de i sur j est distribuée selon une loi normale d’espérance πij et de variance πij (1 − πij )/mij . La normalité
asymptotique est aussi valide pour logit(Nij /mij ). De plus, on déduit de l’approximation
par une série de Taylor au voisinage de πij que :
πij (1 − πij ) ∂ 2 logitx
Nij
−1
E logit
= logitπij +
(π
)
+
o
m
.
ij
ij
mij
2mij
∂x2
4
Par conséquent, logit(Nij /mij ) peut approximativement être considérée comme une variable distribuée selon une loi normale dont l’espérance est une distance Euclidienne signée
dans R2 . Il est alors possible de calculer explicitement des estimateurs des paramètres λ1
et λ2 par les techniques de positionnement multidimensionnel.
Soit Q la matrice n × n de terme générique qij = [logit(Nij /mij )]2 . Soit Qc = [In −
(1/n)Jn ]Q[In −(1/n)Jn ] la matrice obtenue par centrage de Q sur les lignes et les colonnes,
où In est la matrice identité n × n et Jn la matrice n × n dont tous les éléments valent 1.
Soit aussi q le nombre de valeurs propres positives d1 ≥ d2 ≥ . . . ≥ dq de −1/2 Qc avec
2 ≤ q ≤ n − 1. Soit vi le vecteur propre de norme 1 associé à la valeur propre di , alors on
propose le point de départ suivant pour l’estimation de λ:
(0)
λi
4
= di vi , i = 1, 2.
Propriétés asymptotiques de l’estimateur
Dans des conditions asymptotiques, à savoir pour de grands nombres mij de comparaisons,
l’estimateur λ̂ est distribué selon une loi normale d’espérance λ et de matrice de variancecovariance Vλ̂ , dont la forme explicite est donnée par Causeur & Husson (2004).
Ainsi, on peut construire des régions de confiance pour les paramètres (λi,1 , λi,2 ). On
peut déduire aussi une procédure de comparaisons multiples visant à tester la nullité des
quantités logit πij .
Enfin, ces propriétés asymptotiques permettent de construire des tests de la pertinence
d’une représentation bi-dimensionnelle par rapport à des sous-modèles uni-dimensionnels,
dont le modèle de Bradley-Terry. Compte tenu de l’emboı̂tement de ces modèles, les
stratégies de tests s’apparentent à une analyse de la déviance. Il est particulièrement
intéressant de comparer le modèle (2) aux sous-modèles suivants :
logitπij = 0
logitπij = λi − λj
logitπij = sij |λi − λj |
(M0 )
(M1 )
(M10 )
Le modèle (M0 ) est le modèle nul obtenu à partir du modèle (2) en supposant λ = 0.
(M1 ) est le modèle de Bradley-Terry et (M10 ) est le modèle uni-dimensionnel se déduisant
du modèle (2) par l’hypothèse λ2 = 0. La procédure séquentielle de tests d’analyse de la
déviance est présentée (tableau 1) avec les degrés de liberté des lois de χ2 correspondantes.
5
Illustration
Lors de l’exposé, une application sur des données sensorielles servira d’illustration à
l’utilisation du modèle de Bradley-Terry à 2 dimensions.
5
Modèles
Déviance
Degrés de
liberté
(M0 )
(M1 )
(M10 )
Modèle (2)
−2L(0) + 2Lmax
−2L(0) + 2L(λ̂M1 )
−2L(0) + 2L(λ̂M10 )
−2L(λ̂M1 ) + 2L(λ̂)
−2L(λ̂M10 ) + 2L(λ̂)
−2L(λ̂) + 2Lmax
n(n−1)
2
Résiduelle
n−1
n−1
n−2
n−2
n(n−1)
− (2n − 3)
2
Table 1: Table d’analyse séquentielle de la déviance pour le test de la pertinence du
modèle de Bradley-Terry bi-dimensionnel
Bibliographie
Agresti, A. (1990). Categorical Data Analysis, Wiley, New-York.
Bradley, R.A. and Terry, M.A. (1952). Rank analysis of incomplete block designs. Biometrika,
39, 324-345.
Causeur, D. & Husson, F. (2004). A 2-dimensional extension of the Bradley-Terry model
for paired comparisons. Submitted to Journal of Statistical Planning and Inference.
David, H.A. (1988). The method of paired comparisons. 2nd edition. Oxford University
Press, New York.
Davidson, R.R. (1970). On extending the Bradley-Terry model to accommodate ties
in paired comparison experiments. Journal of the American Statistical Association, 65,
317-328.
Davidson, R.R. and Farquhar, P.H. (1976). A bibliography on the method of paired
comparisons, Biometrics, 32, 241-252.
De Soete, G. and Carroll, J.D. (1983). A maximum likelihood method for fitting the
wandering vector model. Psychometrika, 48, 553-566.
Dittrich, R., Hatzinger, R. and Katzenbeisser, W. (1998). Modelling the effect of subjectspecific covariates in paired comparison studies with an application to university rankings.
Applied statistics. 47 (4) 511-525.
Hunter, D.R. (2004). MM algorithms for generalized Bradley-Terry models, Annals of
Statistics, Vol. 32, No. 1 - February 2004.
Ramsay, J.O. (1982). Some statistical approaches to multidimensional scaling data. Journal of the Royal Statistical Society A, 145, 3, 285-312.
Rao, P.V. and Kupper, L.L. (1967). Ties in paired-comparison experiments: a generalization of the Bradley-Terry model. Journal of the American Statistical Association, 62,
194-204.
Stigler, S.M. (1994). Citation patterns in the journals of statistics and probability. Statistical Science, 9, 94-108.
6