Une extension bidimensionnelle du mod`ele de Bradley

Transcription

Une extension bidimensionnelle du modèle de
Bradley-Terry pour les comparaisons par paires
François Husson1 & David Causeur
1
1,2
: ENSA de Rennes, 65 rue de St-Brieuc, 35042 Rennes cedex, France
2
: CREST-ENSAI, Campus de Ker Lann, Bruz, France
Résumé
Le modèle de Bradley-Terry est l’outil le plus largement utilisé lorsqu’il s’agit de classer des
objets à partir de comparaisons par paires. L’hypothèse sous-jacente qui rend le classement possible est l’existence d’une échelle linéaire latente du mérite ou d’une manière
équivalente d’une forme de transitivité de ce mérite. Cependant, dans certaines situations telles que des comparaisons sensorielles de produits alimentaires, cette hypothèse
est parfois peu réaliste. Notre but est de proposer une extension à deux dimensions du
modèle de Bradley-Terry qui prenne en compte des interactions entre les objets comparés,
ou en d’autres termes des ruptures de transitivité de la préférence. D’un point de vue
méthodologique, cette proposition peut être vue comme une méthode de positionnement
multidimensionnel dans le cadre d’un modèle logistique pour des données binomiales. Les
paramètres du modèle sont estimés par maximum de vraisemblance et l’étude des propriétés asymptotiques permet de construire des ellipses de confiance sur la représentation
de l’interaction en deux dimensions. Sur un exemple issu de vraies données sensorielles
nous construisons le modèle à deux dimensions afin d’éclairer les défauts d’ajustement du
modèle de Bradley-Terry à 1 dimension.
Mots clés : Modèle de Bradley-Terry, Positionnement multidimensionnel, Comparaison
par paires, Modèles à interaction structurée.
Abstract
The Bradley-Terry model is widely and often beneficially used to rank objects from paired
comparisons. The underlying assumption that makes ranking possible is the existence of
a latent linear scale of merit or equivalently of a kind of transitiveness of the preference.
However, in some situations such as sensory comparisons of products, this assumption
can be unrealistic. In these contexts, although the Bradley-Terry model appears to be
significantly interesting, the linear ranking does not make sense. Our aim is to propose a 2dimensional extension of the Bradley-Terry model that accounts for interactions between
the compared objects. From a methodological point of view, this proposition can be seen
as a multidimensional scaling approach in the context of a logistic model for binomial
data. Maximum likelihood is investigated and asymptotic properties are derived in order
1
to construct confidence ellipses on the diagram of the 2-dimensional scores. It is shown
by an illustrative example based on real sensory data how to use the 2-dimensional model
to inspect the lack-of-fit of the Bradley-Terry model.
Keywords: Bradley-Terry models, Multidimensional scaling, Paired comparison models,
Structured interaction models.
1
Introduction
La méthodologie des comparaisons par paires est utilisée dans un grand nombre de domaines d’applications, le plus souvent à des fins de classement des objets comparés. On
trouve d’ailleurs une littérature statistique très riche concernant d’une part la mise en
œuvre pratique et d’autre part les propriétés statistiques des modèles de comparaisons
par paires. Pour plus de détails, on peut citer par exemple le travail de synthèse de David
(1988). L’analyse de résultats sportifs est le plus emblématique des exemples d’utilisation
des modèles de comparaisons par paires. Dans ce contexte, on cherche à établir un classement de joueurs ou d’équipes de joueurs à partir des résultats, victoires ou défaites, de
leurs rencontres par couples. De manière similaire, dans l’analyse des citations proposée
par Stigler (1994), les relations entre différentes revues de statistique ou de théorie des
probabilités sont examinées à partir d’un tableau collectant le nombre de citations d’une
revue par une autre. Enfin, l’exemple utilisé dans notre exposé oral pour illustrer notre
contribution à la modélisation des comparaisons par paires émarge au domaine de l’analyse
de données sensorielles, consistant notamment à comparer des produits agro-alimentaires
à partir de leurs évaluations sensorielles par des dégustateurs. En l’occurence, la comparaison par paires consiste à ne retenir que la préférence exprimée par le dégustateur pour
un produit plutôt qu’un autre. L’objectif est d’élaborer, à partir de ces comparaisons, un
classement des produits reflétant la préférence des dégustateurs.
De manière générale, la procédure de classement par des modèles de comparaisons
par paires passe par l’attribution d’un score, reflétant une forme de mérite sur une
échelle linéaire, des objets que l’on compare. Le plus ancien, mais aussi le plus populaire, des modèles de comparaisons par paires est celui proposé par Bradley & Terry
(1952). Bien que dans sa version originale, le modèle de Bradley-Terry ne soit pas explicitement présenté comme un cas particulier de modèle d’analyse de la variance, Agresti
(1990) fait clairement le lien avec les modèles logistiques d’analyse de la variance pour
des variables distribuées selon une loi binomiale. Ce point de vue permet d’une part une
nouvelle approche des aspects algorithmiques des problèmes d’estimation et d’autre part
une définition plus claire des limites d’utilisation de ces modèles. La prise en compte
de certaines de ces limites a conduit à la mise en œuvre d’extensions, le plus souvent
non-linéaires, du modèle de Bradley-Terry. Davidson & Farquhar (1976) présentent un
des premiers travaux de synthèse sur ces prolongements. On peut citer, parmi les extensions les plus marquantes, celles proposées par Rao & Kupper (1967) ou Davidson (1970)
2
qui permettent de tenir compte d’ex-aequo lors des comparaisons. Notons aussi le modèle
d’Agresti (1990) qui introduit, dans le contexte d’épreuves sportives, une dissymétrie dans
la comparaison par la notion d’avantage de l’équipe qui reçoit. Comme le montre Hunter
(2004), la plupart de ces extensions non-linéaires du modèle de Bradley-Terry appartiennent à une même classe de modèles de régression pour variables binomiales, pour laquelle
des algorithmes, dits MM pour Minorization-Maximization, permettent une estimation
efficace des scores de mérite. Par ailleurs, dans les contextes de l’analyse de données sensorielles ou psychométriques, il faut aussi signaler la prise en compte de covariables par
De Soete & Caroll (1983) ou Dittrich et al. (1998) dans le but de modéliser l’interaction
entre la préférence et une information externe caractérisant les conditions expérimentales.
Le modèle de Bradley-Terry suppose l’existence d’une échelle linéaire de mérite, qui
justifie l’objectif de classement des objets comparés. Cependant, cette hypothèse peut
s’avérer inappropriée lorsque la relation d’ordre que définit la préférence n’est pas transitive. Par exemple, dans le cas de l’analyse de données sensorielles, on observe parfois
qu’un produit A est préféré à un autre produit B, que B est lui-même préféré à C mais
que, lorsque A et C sont comparés, C est le plus souvent préféré à A. Comme le suggère
Hunter (2004), un graphe orienté dans lequel les distances entre les nœuds traduisent la
différence en termes de préférence entre les produits est plus adapté à ce type de situations. De manière similaire, notre objectif est de proposer un modèle qui prolonge celui de
Bradley-Terry par la prise en compte de ce type d’interactions entre les objets comparés.
2
Motivations pour une extension bi-dimensionnelle
On considère dans la suite la comparaison par paires de n objets par le biais d’expériences
indépendantes. La variable réponse observée à chaque comparaison est Nij , le nombre de
victoires de l’objet i sur l’objet j, distribué selon une loi binomiale :
Nij ∼ B(mij ; πij ),
où mij ≥ 1 est le nombre de comparaisons de i et j et 0 ≤ πij ≤ 1 est la probabilité que
i gagne contre j.
Les méthodes de classement des objets à partir de leurs performances lors de leurs
comparaisons avec les autres objets sont fondées sur une modélisation plus ou moins
sophistiquée de la probabilité πij . Depuis Bradley & Terry (1952), ce type de démarche
repose sur l’existence supposée d’un vecteur de scores λ = (λ1 , λ2 , . . . , λn ), quantifiant
le mérite, la propension à gagner, des objets à comparer. Ainsi, le modèle de BradleyTerry peut être vu comme un modèle logistique d’analyse de la variance pour le modèle
binomial :
logit(πij ) = λi − λj .
3
(1)
L’idée qui sous-tend ce modèle est la linéarité de l’échelle de représentation du mérite
d’un objet P
par les scores. L’identifiabilité des scores est traditionnellement assurée par la
contrainte ni=1 λi = 0.
Par conséquent, dans certaines situations, alors que le modèle de Bradley-Terry s’ajuste
de manière significative aux données de comparaisons par paires, le classement par les
scores peut ne pas refléter de manière satisfaisante l’observation. Ce problème remet
alors en cause la pertinence d’une échelle linéaire du mérite et donc celle d’un classement global. Notre objectif est de proposer des outils permettant de prendre en compte
d’éventuelles interactions entre les objets, affectant la représentation linéaire du mérite.
Dans cette optique, on propose le modèle logistique non-linéaire suivant :
q
(2)
logit(πij ) = sij (λi,1 − λj,1 )2 + (λi,2 − λj,2 )2 ,
où sij = ±1 est un signe reflétant la supériorité ou l’infériorité observée entre i et j, λ1 =
0
(λ1,1 , λ2,1 , . . . , λn,1 )0 et λ2 = (λ1,2 , λ2,2 , . . . , λP
de taille
n,2 ) sont des
Pnn, satisfaisant
Pvecteurs
n
n
λ
=
0
et
λ
=
les contraintes d’identifiabilité suivantes :
i=1 λi,1 λi,2 = 0.
i=1 i,2
i=1 i,1
0 0
0
Dans la suite, on note λ le vecteur (λ1 , λ2 ) contenant tous les paramètres du modèle.
En d’autres termes, logit(πij ) est modélisé par une distance Euclidienne signée dans
2
R , de type positionnement multidimensionnel, très utilisée dans le cadre de modèles
gaussiens. Par analogie avec les modèles de positionnement multidimensionnel, on suppose
dans la suite que λ1 et λ2 sont des vecteurs orthogonaux afin d’assurer l’invariance de la
vraisemblance par rotation.
L’estimation de λ1 et λ2 permet ici de construire un diagramme s’apparentant à une
cartographie du mérite au sens où les distances entre les points du diagramme traduisent
des différences de mérite entre les objets. Notons que, lorsqu’il existe effectivement
une échelle linéaire du mérite, à savoir lorsque λ2 = 0, le modèle (2) donne la même
représentation des objets que le modèle de Bradley-Terry.
3
Estimation par maximum de vraisemblance
Le choix d’un point de départ à l’algorithme d’estimation, de type Newton-Raphson,
est un point important de la procédure. Dans cette optique, on peut s’appuyer sur une
approximation normale du modèle binomial. Dans un premier temps, pour de grandes
valeurs de mij , on sait que la proportion observée Nij /mij de victoires de i sur j est distribuée selon une loi normale d’espérance πij et de variance πij (1 − πij )/mij . La normalité
asymptotique est aussi valide pour logit(Nij /mij ). De plus, on déduit de l’approximation
par une série de Taylor au voisinage de πij que :
πij (1 − πij ) ∂ 2 logitx
Nij
−1
E logit
= logitπij +
(π
)
+
o
m
.
ij
ij
mij
2mij
∂x2
4
Par conséquent, logit(Nij /mij ) peut approximativement être considérée comme une variable distribuée selon une loi normale dont l’espérance est une distance Euclidienne signée
dans R2 . Il est alors possible de calculer explicitement des estimateurs des paramètres λ1
et λ2 par les techniques de positionnement multidimensionnel.
Soit Q la matrice n × n de terme générique qij = [logit(Nij /mij )]2 . Soit Qc = [In −
(1/n)Jn ]Q[In −(1/n)Jn ] la matrice obtenue par centrage de Q sur les lignes et les colonnes,
où In est la matrice identité n × n et Jn la matrice n × n dont tous les éléments valent 1.
Soit aussi q le nombre de valeurs propres positives d1 ≥ d2 ≥ . . . ≥ dq de −1/2 Qc avec
2 ≤ q ≤ n − 1. Soit vi le vecteur propre de norme 1 associé à la valeur propre di , alors on
propose le point de départ suivant pour l’estimation de λ:
(0)
λi
4
= di vi , i = 1, 2.
Propriétés asymptotiques de l’estimateur
Dans des conditions asymptotiques, à savoir pour de grands nombres mij de comparaisons,
l’estimateur λ̂ est distribué selon une loi normale d’espérance λ et de matrice de variancecovariance Vλ̂ , dont la forme explicite est donnée par Causeur & Husson (2004).
Ainsi, on peut construire des régions de confiance pour les paramètres (λi,1 , λi,2 ). On
peut déduire aussi une procédure de comparaisons multiples visant à tester la nullité des
quantités logit πij .
Enfin, ces propriétés asymptotiques permettent de construire des tests de la pertinence
d’une représentation bi-dimensionnelle par rapport à des sous-modèles uni-dimensionnels,
dont le modèle de Bradley-Terry. Compte tenu de l’emboı̂tement de ces modèles, les
stratégies de tests s’apparentent à une analyse de la déviance. Il est particulièrement
intéressant de comparer le modèle (2) aux sous-modèles suivants :
logitπij = 0
logitπij = λi − λj
logitπij = sij |λi − λj |
(M0 )
(M1 )
(M10 )
Le modèle (M0 ) est le modèle nul obtenu à partir du modèle (2) en supposant λ = 0.
(M1 ) est le modèle de Bradley-Terry et (M10 ) est le modèle uni-dimensionnel se déduisant
du modèle (2) par l’hypothèse λ2 = 0. La procédure séquentielle de tests d’analyse de la
déviance est présentée (tableau 1) avec les degrés de liberté des lois de χ2 correspondantes.
5
Illustration
Lors de l’exposé, une application sur des données sensorielles servira d’illustration à
l’utilisation du modèle de Bradley-Terry à 2 dimensions.
5
Modèles
Déviance
Degrés de
liberté
(M0 )
(M1 )
(M10 )
Modèle (2)
−2L(0) + 2Lmax
−2L(0) + 2L(λ̂M1 )
−2L(0) + 2L(λ̂M10 )
−2L(λ̂M1 ) + 2L(λ̂)
−2L(λ̂M10 ) + 2L(λ̂)
−2L(λ̂) + 2Lmax
n(n−1)
2
Résiduelle
n−1
n−1
n−2
n−2
n(n−1)
− (2n − 3)
2
Table 1: Table d’analyse séquentielle de la déviance pour le test de la pertinence du
modèle de Bradley-Terry bi-dimensionnel
Bibliographie
Agresti, A. (1990). Categorical Data Analysis, Wiley, New-York.
Bradley, R.A. and Terry, M.A. (1952). Rank analysis of incomplete block designs. Biometrika,
39, 324-345.
Causeur, D. & Husson, F. (2004). A 2-dimensional extension of the Bradley-Terry model
for paired comparisons. Submitted to Journal of Statistical Planning and Inference.
David, H.A. (1988). The method of paired comparisons. 2nd edition. Oxford University
Press, New York.
Davidson, R.R. (1970). On extending the Bradley-Terry model to accommodate ties
in paired comparison experiments. Journal of the American Statistical Association, 65,
317-328.
Davidson, R.R. and Farquhar, P.H. (1976). A bibliography on the method of paired
comparisons, Biometrics, 32, 241-252.
De Soete, G. and Carroll, J.D. (1983). A maximum likelihood method for fitting the
wandering vector model. Psychometrika, 48, 553-566.
Dittrich, R., Hatzinger, R. and Katzenbeisser, W. (1998). Modelling the effect of subjectspecific covariates in paired comparison studies with an application to university rankings.
Applied statistics. 47 (4) 511-525.
Hunter, D.R. (2004). MM algorithms for generalized Bradley-Terry models, Annals of
Statistics, Vol. 32, No. 1 - February 2004.
Ramsay, J.O. (1982). Some statistical approaches to multidimensional scaling data. Journal of the Royal Statistical Society A, 145, 3, 285-312.
Rao, P.V. and Kupper, L.L. (1967). Ties in paired-comparison experiments: a generalization of the Bradley-Terry model. Journal of the American Statistical Association, 62,
194-204.
Stigler, S.M. (1994). Citation patterns in the journals of statistics and probability. Statistical Science, 9, 94-108.
6

Une extension bidimensionnelle du mod`ele de Bradley

Transcription

Documents pareils

Impossible à dire de Patricia Reilly Giff Un vrai coup de coeur! C`est

Inscription au Master II Parcours Préparation `a l`Agrégation de

“Mondo et trois autres histoires” de J.M.G. Le Clézio

La Gazette Turf 28 juillet 2016

Attestation de la qualité d`Ayant Droit

Immigration, ici et là - Le 15e jour du mois

BULLETIN DE RÉSERVATION

Proj` Courte

Sujet de partiel d`avril 2004

Câble Téléphonique PTT Série 278 / 298

étude comparative entre six organismes du gouvernement du québec