Prédiction actuarielle et prédiction clinique: le dernier souffle d`une

Transcription

Prédiction actuarielle et prédiction clinique: le dernier souffle d`une
Prédiction actuarielle et prédiction clinique: le dernier
souffle d’une pratique traditionnelle
par Jean-Pierre GUAY*
Résumé
Les intervenants de première ligne dans le milieu correctionnel sont confrontés à un grand
nombre de décisions sur le sort des délinquants. Afin de prendre de telles décisions, ils ont
recours au jugement clinique ou à des instruments actuariels. Dans la présente étude, les résultats sur la comparaison des prédictions cliniques et actuarielles sont présentés, de même que
les principales stratégies cognitives employées par les cliniciens menant presque invariablement à la commission d’erreurs de prédiction. L’évolution des instruments de gestion du risque
est présentée, de même que le LSI-R, un instrument de prédiction de troisième génération.
Abstract
Clinicians working in the correctional system are taking multiple decisions on a daily basis. In
order to take those decisions, many are using validated actuarial instruments while some are
still referring to their clinical judgement only. The present study is presenting findings in the area
of clinical and actuarial prediction, as well as the various heuristics used by clinicians to produce clinical predictions. The evolution of prediction, from informal to actuarial, is presented,
and the LSI-R is described as an example of an efficient third-generation instrument.
Le travail de l’intervenant de première ligne dans le système correctionnel est jalonné de décisions. Constamment, les criminologues, psychologues, travailleurs
sociaux, mais aussi les gardiens, doivent se prononcer sur différents aspects de la
vie quotidienne des délinquants. L’évaluation du risque d’acte de violence est maintenant devenu l’un des jugements les plus importants demandés aux cliniciens. Le
contrevenant est-il susceptible de récidiver si une libération conditionnelle lui est
accordée? Est-il à risque de commettre une tentative de suicide? Est-il envisageable qu’il ait un geste violent à l’égard de ses codétenus ou des agents? En cas
de déplacement hors des établissements carcéraux, devrait-on envisager une
escorte plus musclée? La communauté peut-elle assumer le risque de récidive qu’il
représente? Toutes ces questions simples réfèrent à des mécanismes communs et
font l’objet de réflexions et de travaux empiriques depuis une cinquantaine d’années.
L’évolution de l’évaluation du risque
Dans une recension des travaux portant sur l’évaluation du risque, Bonta (1996)
décrit principalement trois phases dans l’évolution de l’évaluation du risque des
délinquants. La première, la phase clinique, est décrite comme l’utilisation intuitive
de l’entrevue. Un intervenant formé en sciences sociales rencontre un délinquant et
* Ph.D., École de Criminologie, Université de Montréal
Revue internationale de criminologie et de police technique et scientifique
2/06
149
l’interroge sur différents aspects de sa vie. La nature et le contenu de l’entretien
varient selon la perception qu’a le clinicien de ce délinquant. Au besoin, le dossier
sera consulté, et ce sur quoi le clinicien mettra l’accent est aussi fonction du délinquant. Le jugement porté est subjectif, parfois intuitif, et guidé en partie par le «feeling» du clinicien (Andrews et Bonta, 2003).
La deuxième phase dans l’évolution de l’évaluation du risque des délinquants
est celle où la prédiction repose sur une combinaison mécanique des prédicteurs.
Les premiers efforts de systématisation remontent à 1928 avec les travaux de
Burgess. Après avoir déterminé 21variables généralement associées à l’échec en
période de libération de près de 3 000 délinquants suivis en milieu ouvert, il créa
une simple échelle calculant la somme sur 21, chaque critère valant un point. Les
résultats indiquèrent que les sujets obtenant le score le plus élevé avaient un taux
de récidive de 76 %, tandis que ceux ayant le plus bas en avaient un de 1,5 %. De
manière générale, les méthodes issues de la seconde génération d’instruments
d’évaluation du risque utilisent une série de critères, souvent des éléments liés au
passé criminel. La sommation de ces items donne habituellement un score, lequel
donne une prédiction plus significative que l’approche clinique intuitive. Cependant,
la faiblesse de la seconde génération d’instruments est qu’elle ne contient habituellement que des facteurs statiques ou immuables (la nature des délits antérieurs
commis, la durée de la sentence, l’âge du sujet, l’âge aux premiers délits, etc.) et,
par conséquent, ne nous renseigne pas sur les besoins des délinquants, et encore
moins sur leurs besoins criminogènes (Bonta, 2000). Parmi les instruments de gestion du risque les plus connus, on trouve le Salient Factor Score (Hoffman 1983) et
le Statistical Inventory on Recidivism (SIR; Bonta, Harman, Hann et Cormier, 1996).
La troisième génération d’instruments actuariels a su intégrer les facteurs statiques et les facteurs dynamiques, cibles de changement, en des instruments
valides et fidèles. Ils permettent de prédire efficacement la récidive et une multitude d’autres aspects, en plus de déterminer les aspects sur lesquels les interventions devraient porter. Dans ce cadre, il ne s’agit plus d’évaluer la dangerosité (un
état statique), mais bien d’«estimer le risque de comportements violents pour un
individu donné, dans un contexte donné, et selon un temps donné» (Côté, 2001).
Cette nouvelle génération d’instruments s’inscrit dans un élan de professionnalisation des décisions et s’inspire grandement des résultats des méta-analyses. On
entrevoit déjà la quatrième génération d’instruments de gestion du risque, laquelle
devrait tenir compte des facteurs dynamiques et du principe de réceptivité à l’intervention (Hannah-Moffat et Maurutto, 2003). Parmi les instruments de troisième
génération actuellement les plus utilisés en Amérique du Nord, on retrouve
l’Inventaire du niveau de service, communément appelé le LSI-R. Il représente bien
l’état actuel de l’instrumentation actuarielle de troisième génération.
L’Inventaire du niveau de services
L’Inventaire du niveau de services (LSI-R; Andrews et Bonta, 1995) est un instrument de troisième génération visant à estimer le niveau de risque des délinquants
150
2/06
Revue internationale de criminologie et de police technique et scientifique
et à déterminer le degré de supervision requis. Le LSI-R mesure 10 domaines de
la vie des infracteurs qui sont associés à la délinquance: a) l’histoire criminelle, b)
l’éducation et l’emploi, c) les finances personnelles, d) les relations familiales et
conjugales, e) le logement, f) les loisirs, g) la fréquentation des pairs, h) les problèmes de consommation d’alcool et de drogues, i) la santé mentale et psychologique et j) les attitudes. Les 10 domaines fouillés comportent un total de 54 items
dichotomiques (non-oui). Un score est calculé en en faisant la somme. Les résultats qui sont bas indiquent généralement un niveau de risque criminogène et un
besoin de supervision plus faibles, tandis que les scores plus élevés correspondent à un risque et à des besoins plus grands. L’essentiel de l’information obtenue
dans le cadre de l’évaluation faite à l’aide du LSI-R provient de l’entrevue structurée avec le délinquant et de l’étude de son dossier.
En ce qui concerne les qualités psychométriques du LSI-R, celui-ci a montré
une bonne validité, une fidélité plus que satisfaisante ainsi qu’une structure factorielle solide (Loza et Simourd, 1994). Il s’est avéré apte à prédire à la fois les nouvelles arrestations et condamnations et la réincarcération. De plus, il s’est révélé
efficace auprès de différentes clientèles: les délinquants sous ordonnance de probation ou en liberté surveillée (Andrews, 1982; Cumberland et Boyle, 1997; Raynor,
Kynch, Roberts et Merrington, 2000; Rettinger, 1998), les délinquants résidant en
maison de transition (Bonta, Motiuk et Ker 1985; Lowenkamp, Holsinger et
Latessa, 2001) et les délinquants incarcérés (Bonta et Motiuk, 1992; Rettinger,
1998).
Divers travaux de recherche ont aussi démontré qu’on pouvait l’employer avec
des clientèles particulières: les femmes incarcérées (Coulson, Ilacqua, Nutbrown,
Giulekas et Cudjoe, 1996; Kirkpatrick, 1999), les délinquants d’origine autochtone
(Bonta, 1989), les délinquants ayant des problèmes de violence conjugale (Hanson
et Wallace-Capretta, 2000), les délinquants aux prises avec des troubles mentaux
(Harris, Rice et Quinsey, 1993) de même que les délinquants sexuels (Simourd et
Malcolm, 1998). En plus de prévoir la récidive, il s’est avéré utile dans la prédiction
des incidents disciplinaires en milieu carcéral (Andrews et Bonta, 2003) et dans le
choix des délinquants qu’il est préférable de libérer en cas de surpopulation carcérale (Holsinger, Lowenkamp et Latessa, 2004). L’évaluation du risque à l’aide du
LSI-R demande approximativement trois heures. Son utilisation ne requiert pas de
spécialisation particulière et ne demande qu’une formation sommaire.
Les limites des instruments actuariels
Les instruments actuariels et les règles de prédiction ne sont pas sans lacunes. Les
principaux instruments actuariels permettent de faire une prédiction efficace, plus
efficace que la simple prédiction intuitive et clinique. Cependant, en plus de ne
compter qu’un nombre limité de variables (Garb, 1994), ils ne permettent pas d’expliquer le comportement. Par leur nature corrélationelle, les instruments actuariels
sont pour une bonne part athéoriques et n’ont pas pour fonction d’aider à comprendre le comportement. Connaître la précocité de la délinquance ou le volume
Revue internationale de criminologie et de police technique et scientifique
2/06
151
de crimes commis par le passé nous renseigne sur la probabilité que des crimes
soient commis dans le futur, mais ne nous renseigne que bien peu sur la dynamique du délinquant. Néanmoins, alors que les instruments de gestion du risque
de deuxième génération ne donnaient aucune information concernant des facteurs
potentiellement modifiables, les instruments de troisième génération indiquent les
facteurs dynamiques les plus importants, cibles d’intervention potentielles.
Le débat de la prédiction clinique-actuarielle
En 1954, Paul Meehl, un psychologue clinicien, publiait un ouvrage intitulé Clinical
Versus Statistical Prediction: A Theoretical Analysis and a Review of the Evidence.
Cet ouvrage polémique allait marquer l’univers de la prédiction jusqu’à aujourd’hui.
Le «petit livre dérangeant», comme il aimait bien l’appeler, soutenait qu’il valait
souvent mieux se référer à une table de prédiction statistique qu’à son jugement
clinique pour prédire le comportement. Au fil des années, plusieurs chercheurs se
sont spécifiquement préoccupés de la qualité de la prédiction clinique.
Principalement quatre d’entre eux ont mené des études comparatives ou des
méta-analyses sur la question.
Une contribution importante de Meehl (1954) a été d’étudier 22 recherches
visant à mettre en parallèle la méthode clinique (dans laquelle le clinicien se fie à
son jugement et à son expérience pour faire une prédiction) et la méthode actuarielle (dans laquelle on utilise des règles de prédiction statistiques pour établir une
prédiction). En aucun cas la méthode clinique ne s’est avérée franchement supérieure à la méthode actuarielle. Dans approximativement la moitié des cas, les
deux méthodes obtiennent des résultats comparables et, dans l’autre moitié, la
prédiction clinique est bien inférieure à la prédiction actuarielle.
Meehl a fait bien plus que simplement démontrer la valeur des techniques
actuarielles. Pour Grove et Lloyd (sous presse), quatre grandes contributions lui
sont attribuées, dont deux sont pertinentes pour notre propos. La première est que
Meehl a clairement rappelé l’importance de distinguer la collecte des données de
base et la combinaison de celles-ci. En fait, l’auteur indique qu’il existe principalement deux façons de combiner les données: les méthodes actuarielles (mécaniques) et les méthodes cliniques (non mécaniques). Dans le cas des méthodes
mécaniques, il n’y a aucun jugement, inférence ou attribution de poids de la part
du clinicien. Une fois les données réunies (par exemple le nombre et la nature des
antécédents criminels, les problèmes de consommation, l’emploi), le travail de
prédiction est somme toute clérical. Les techniques non mécaniques de combinaison sont le fait d’une logique clinique. Dans son ouvrage, Meehl a clairement
démontré la supériorité des méthodes actuarielles sur les méthodes cliniques pour
combiner les données.
En 1989, Dawes, Faust et Meehl publiaient dans la prestigieuse revue Science
le fruit de leurs recherches sur la prédiction clinique et la prédiction actuarielle.
Dans une recension narrative de la littérature, les auteurs ont étudié différents travaux dans lesquels la prédiction des techniques cliniques et actuarielles était
basée sur différents critères de comparaison: 1) les études devaient utiliser les
152
2/06
Revue internationale de criminologie et de police technique et scientifique
mêmes données et 2) elles devaient appliquer les règles actuarielles à de nouveaux cas afin d’éviter une inflation artificielle de la prédiction actuarielle en mettant l’accent sur la chance. Leurs résultats indiquent que les méthodes fondées sur
des règles actuarielles de prédiction fonctionnaient aussi bien ou surpassaient
notablement les méthodes cliniques, et ce, même lorsque les cliniciens bénéficiaient d’une plus grande quantité d’informations.
Par ailleurs, dans une étude visant entre autres à bonifier les techniques statistiques associées à la prédiction d’événements rares, Mossman (1994) a examiné
58 recherches portant sur la prédiction de la violence. Ces travaux comptaient au
total plus de 16 000 sujets, principalement des patients psychiatriques évalués
dans des contextes sécuritaires. À l’aide des analyses ROC (Receiver Operating
Characteristic; Metz, 1978; Zweig et Campbell, 1993), l’auteur s’est penché sur la
possibilité de prédire les actes de violence. Ses résultats indiquent, entre autres,
que les prédictions actuarielles basées sur les comportements passés sont plus
fiables que les prédictions cliniques. Les résultats soulignent aussi que, quoique
inférieur, le jugement clinique surpassait le hasard. Quelques années plus tard, les
résultats de Gardner, Lidz, Mulvey et Shaw (1996) allaient confirmer ce résultat.
Les travaux de Mossman ont contribué à rendre plus accessibles les techniques
associées à l’analyse ROC. Celle-ci a montré plusieurs avantages par rapport aux
techniques traditionnelles, notamment le fait d’être relativement indépendante des
taux de base et la possibilité d’obtenir un indice (AUC, l’aire sous la courbe) permettant la comparaison de la qualité de différents instruments. Cet avantage a fait
de cet outil une technique de choix dans la prédiction d’événements rares, comme
par exemple la récidive, la rechute ou l’abandon du traitement (Rice, 1997;
Quinsey, Harris, Rice et Cormier, 1998).
Plus récemment, Grove et ses collègues (Grove, Zald, Lebow, Snitz et Nelson,
2000) ont entrepris de refaire une méta-analyse sur les différents travaux portant
sur la prédiction dite clinique et actuarielle. Un total de 136 études fut retenu de la
recension exhaustive de la littérature. Chacune d’elles fut codifiée à l’aide d’un
manuel de codification sur une variété d’aspects pertinents: année de publication,
type de publication, nature du devis de recherche, nombre de sujets, opérationnalisation de la variable dépendante, nature de la formation des cliniciens, nombre
d’années d’expérience, quantité d’informations accessibles pour les cliniciens et
pour la méthode actuarielle, etc. Une procédure visant à estimer l’accord interjuges dans la codification a été mise en oeuvre afin d’éviter que les codificateurs
ne fassent fausse route. Les résultats confirment la tendance de fond des
recherches précédentes. Les tailles de l’effet (effect size) varient de -0,30 (indiquant une prédiction clinique supérieure à une prédiction actuarielle) à 0,74 (signalant la supériorité marquée des méthodes actuarielles). Les résultats favorisent la
méthode actuarielle dans près de la moitié des travaux (46 %, n de tailles de l’effet=63) et près de la moitié indiquent des résultats comparables (48 %, n de tailles
de l’effet=65). Seulement 6 % des études appuient clairement les prédictions cliniques. Plusieurs analyses additionnelles ont été effectuées afin de comprendre
les variables influant sur les tailles d’effet. Les résultats suggèrent que l’année de
publication des travaux n’était pas associée à la taille de l’effet, pas plus que le
Revue internationale de criminologie et de police technique et scientifique
2/06
153
type de publication ou le domaine d’étude. Les résultats indiquent aussi que
lorsque les données d’une interview étaient utilisées afin d’émettre une prédiction,
cette dernière avait tendance à être moins efficace. De plus, ni la formation des
praticiens ni le nombre d’années d’expérience n’influencent significativement les
résultats issus de la prédiction clinique.
En somme, l’ensemble des travaux portant sur la comparaison des méthodes
cliniques et actuarielles favorise nettement ces dernières pour faire une prédiction.
Dans près de la moitié des cas, la prédiction actuarielle et la prédiction clinique
obtiennent des résultats similaires. En outre, dans près de la moitié des cas, la prédiction actuarielle est notablement supérieure. La prédiction clinique s’avère
meilleure que la prédiction actuarielle dans seulement 5 % à 6 % des cas. Ces
résultats sont robustes et, fait à noter, indépendants de la nature de la prédiction,
du domaine d’étude, de l’expérience ou de la formation des cliniciens ainsi que de
la quantité de matériel clinique fournie aux praticiens.
En fait, rares sont les domaines de recherche en psychologie et en criminologie où le corps de la littérature est si constant. Les discussions entourant la prédiction clinique-actuarielle était pour plusieurs un faux débat. Si les preuves sont
si solides, elles n’expliquent en rien pourquoi les cliniciens éprouvent des difficultés à faire une prédiction précise. En fait, l’efficacité moindre de la prédiction clinique est en partie attribuable à l’utilisation fréquente d’heuristiques diverses. Pour
Carré, Dégremont, Gross, Pierrel et Sabah (1991), l’heuristique est une règle qui
est utilisée de manière générale, puisqu’elle conduit fréquemment à une solution,
sans pour autant qu’on ait la certitude de sa validité dans tous les cas. L’utilisation
de telles stratégies cognitives mène presque invariablement à différents biais
cognitifs et explique les erreurs de prédiction (Kleinmuntz, 1990). Les plus communes sont: l’ignorance des taux de base, les corrélations illusoires, la régression
vers la moyenne, l’assignation non optimale de poids aux critères de prédiction, la
confiance exagérée en notre jugement, la probabilité conditionnelle inversée, l’absence de rétroaction systématique ainsi que l’ancrage (voir les travaux de Grove
et collab. 2000; Loza, 2003; Ruscio, 2003; Loza et Dhaliwal, 2005; Mills, 2005, pour
plus de détails). Elles sont brièvement abordées dans les prochains paragraphes.
L’ignorance des taux de base
Certains événements sont extrêmement rares dans le cadre de la pratique clinique.
On dit d’eux qu’ils ont un faible taux de base. Les événements à faible taux de base
sont particulièrement difficiles à prédire. L’ignorance des taux de base fait en sorte
qu’on observe dans la prédiction clinique une prévalence élevée de faux positifs,
c’est-à-dire que l’on identifie faussement des personnes comme étant à haut
risque (Grove et collab. 2000). Dans le cas qui nous occupe, citons le risque élevé
d’acte de violence. Les cliniciens, ignorant les taux de base faibles de récidive violente, auront tendance à voir dans une proportion importante de leurs clients un
risque élevé de violence, impliquant par le fait même des ressources plus importantes pour les superviser et les traiter (Lidz, Mulvey et Gardner, 1993; Loza, 2003).
154
2/06
Revue internationale de criminologie et de police technique et scientifique
Les corrélations illusoires
Une partie importante de la pratique clinique a pour base l’expérience passée. En
effet, le clinicien utilise les cas antérieurs afin de se forger une opinion sur les cas
actuels. Ce que l’on appelle la «corrélation illusoire» (Chapman, 1967) est particulièrement fréquente dans le cadre de la pratique clinique. Elle survient lorsque deux
éléments sont associés sans pour autant que cette corrélation soit réelle.
Généralement, les corrélations perçues sont fonctions de la nature et de la qualité
des données disponibles au clinicien pour se faire un jugement, et à leurs théories
implicites (Jennings, Amabile, & Ross, 1982). En effet, si plusieurs se sont débarrassés des croyances concernant les chats noirs, certaines corrélations illusoires
demeurent particulièrement vivaces. Dans le domaine de la délinquance, référonsnous à l’association que font beaucoup de gens entre les troubles mentaux graves
et la criminalité. Si une relation existe entre ces deux états, elle est non linéaire et
complexe (Monahan et Steadman, 1994; Millaud, 1999).
La régression vers la moyenne
La notion de régression vers la moyenne se rapporte à un principe probabiliste
relativement simple: les états exceptionnels sont généralement suivis d’états communs. L’expression régression vers la moyenne provient des travaux de Galton
(1889) dans lesquels l’auteur observait que les parents de très petite taille avaient
généralement tendance à avoir des enfants plus grands qu’eux et qu’à l’inverse,
les parents de très grande taille avaient tendance à avoir des enfants de moins
grande taille qu’eux. L’auteur, qui croyait initialement qu’une force biologique était
à l’oeuvre, en vint plus tard à la conclusion que le phénomène n’avait rien de biologique et était strictement probabiliste. L’idée est donc que la probabilité qu’un
événement rare soit immédiatement suivi d’un autre événement rare est beaucoup
plus faible que la probabilité qu’un événement fréquent lui succède. Le fait de ne
pas prendre en compte le phénomène de la régression vers la moyenne teinte
beaucoup de décisions humaines (Nisbett et Ross, 1980). Par exemple, prédire
qu’un délinquant vivant des moments particulièrement difficiles en traitement soit
le prélude à des moments meilleurs est une prédiction strictement probabiliste
basée sur ce principe. Une telle prédiction, bien que statistiquement prudente en
regard du phénomène de la régression vers la moyenne, peut facilement laisser
croire en l’efficacité de nos interventions.
L’assignation non optimale de poids aux critères de prédiction
Afin de générer une prédiction fiable, le poids relatif de chacun des critères pris en
compte doit être soupesé. La subjectivité de l’évaluateur peut faire en sorte qu’il
attribue un poids relatif trop grand à certains critères et trop faible à d’autres, et ce,
en raison de sa propre expérience personnelle. Ainsi, les préjugés ou les attitudes,
Revue internationale de criminologie et de police technique et scientifique
2/06
155
favorables ou non, à l’endroit de certains sous-groupes de clients ou de certaines
expériences peuvent facilement influer sur l’attribution de ces poids. Par exemple,
le fait pour un délinquant d’avoir été abusé sexuellement durant l’enfance teinte
pour beaucoup le tableau clinique des délinquants sexuels et influence le jugement des cliniciens dans l’évaluation du risque. Le Syndrome du vampire, comme
certains l’appellent (Worling, 1995) n’est cependant que très faiblement associé au
développement de difficultés importantes chez les délinquants sexuels judiciarisés
(Pellerin, St-Yves et Guay, 2003).
La confiance exagérée dans le jugement personnel
Certains travaux ont examiné la confiance que les personnes ont en leur jugement
(Fischhoff, Slovic et Lichtenstein, 1977; Faust, Hart et Guilmette, 1988). Les résultats démontrent que les cliniciens ont fortement tendance à développer une
confiance exagérée en leur jugement, même lorsqu’ils se trompent, notamment en
raison d’une interprétation fautive des faits a posteriori (Ruscio, 1998). Les éléments confirmant leurs hypothèses et leurs intuitions initiales sont retenus pour justifier leur diagnostic ou leur pronostic. Pour Bishop et Trout (2002), les praticiens qui
résistent à l’utilisation de l’instrumentation actuarielle ont généralement tendance à
admettre qu’à la longue, les règles statistiques de prédictions sont probablement
plus efficaces que les heuristiques cliniques. Cependant, leur confiance en leur
jugement clinique et en leur pouvoir de réflexion les pousse à ne pas prendre en
compte les règles cliniques pour les cas particuliers (appelé le problème de Peirce).
La probabilité conditionnelle inversée
Un autre mécanisme psychologique touchant significativement la qualité du jugement clinique est celui de la probabilité conditionnelle inversée. Ce biais s’apparentant à la corrélation illusoire veut que les praticiens confondent la probabilité
que le comportement A se produise compte tenu du comportement B soit la
même que la probabilité que le comportement B se produise en la présence du
comportement A. L’exemple classique est relatif à l’utilisation parfois abusive d’incidents passés comme indicateurs diagnostiques. Simplement parce que les
clients ayant des difficultés interpersonnelles rapportent des antécédents d’abus
dans leur vie n’implique pas que les présents abus sont indicateurs des mêmes
difficultés dans le futur (Tracey et Rounds, 1999).
L’absence de rétroaction systématique
Dans le cadre de sa pratique professionnelle, l’intervenant de première ligne rencontre un nombre important de personnes contrevenantes. Il formule plusieurs
jugements et prend un nombre presque incalculable de décisions. Une raison fré156
2/06
Revue internationale de criminologie et de police technique et scientifique
quemment évoquée pour expliquer les difficultés rencontrées par les praticiens à
émettre une prédiction et un diagnostic précis est qu’il ne bénéficie pas de rétroaction systématique sur ses décisions antérieures (Loza, 2003; Ruscio, 2003;
Grove et collab., 2000). En fait, peu d’intervenants de première ligne gardent un
registre systématique et à jour de leurs décisions antérieures. Les cliniciens ne
peuvent savoir facilement ce que leurs sujets sont devenus, pas plus qu’ils ne
savent s’ils ont récidivé ou pas. Sans une telle rétroaction, les praticiens ne peuvent correctement confronter leurs cognitions défaillantes et améliorer leur prédiction.
L’ancrage
Un dernier mécanisme pouvant biaiser le jugement est ce que certains appellent
le principe de l’ancrage (Tversky et Kahneman, 1974; Tracey et Rounds, 1999). Il
réfère au mécanisme par lequel le point de vue initial du clinicien teinte fortement
son interprétation des informations ultérieurement obtenues. Par exemple, avoir
des échos de l’attitude d’un délinquant avant même de le rencontrer réoriente
significativement l’interprétation de l’issue d’un entretien avec lui. Les cliniciens ont
parfois tendance à se faire rapidement une opinion de leur client et sont enclins à
garder cette opinion, même en présence d’éléments d’information discordants
(Meehl, 1960).
Ces biais cognitifs, suggèrent certains, pourraient être atténués par l’expérience clinique et le contact avec la clientèle, ou par l’acquisition d’une vision plus globale du délinquant. La prochaine section traite des travaux de recherche sur l’expérience clinique et la compréhension holistique en pratique clinique.
L’expérience, la formation et la prédiction clinique
On prend communément pour acquis que le praticien, une fois ses études universitaires terminées, se trouvera un emploi dans un milieu d’intervention et c’est
dans ce milieu qu’il pourra parfaire ses compétences cliniques au contact de la
clientèle. Les jeunes criminologues, travailleurs sociaux, psychologues ou psychoéducateurs apprendront avec le temps et au contact de collègues plus expérimentés à saisir les dynamiques des délinquants et à parfaire leur jugement clinique. Or, le jugement clinique n’est pas comme un muscle qui a tendance à se
raffermir lorsqu’il est sollicité. En effet, contrairement à la croyance populaire
(croyance profondément enracinée dans les milieux pratiques, il va sans dire), l’expérience clinique ne permet pas au praticien de s’améliorer au fil du temps
(Goldberg, 1968). Plusieurs travaux ont spécifiquement examiné la question de la
valeur du jugement clinique. Cette question est résumée clairement par Garb et
Boyle (2003) dans un chapitre au titre provocateur: Understanding Why some
Clinicians Use Pseudoscientific Methods: Findings from Research on Clinical
Judgement. L’essentiel de leur recension des travaux sur cette question suggère
Revue internationale de criminologie et de police technique et scientifique
2/06
157
qu’il est très difficile d’apprendre de l’expérience clinique. Dans les études où des
cliniciens d’expérience sont comparés à de jeunes cliniciens dans leur compétence pour établir un diagnostic, se prononcer sur une intervention adéquate ou faire
une prédiction, les deux groupes obtiennent des performances similaires.
Plusieurs travaux en sont arrivés aux mêmes conclusions en comparant des
cliniciens d’expérience avec des étudiants du deuxième cycle. Les seules exceptions étaient celles où les étudiants en étaient au tout début de leur formation.
En somme, la synthèse de Garb et Boyle (2003) indique que la formation de
base semble importante afin de poser un diagnostic ou de se prononcer sur le
comportement futur, mais que la pratique clinique ne permet pas de l’améliorer
substantiellement. De fait, certains travaux ont même permis d’observer une détérioration de la qualité du jugement clinique avec les années de pratique. Les raisons pour lesquelles le jugement clinique n’a pas tendance à se bonifier avec le
temps ou l’expérience sont nombreuses. Parmi elles, on trouve différents biais
(citons le biais de confirmation, lequel consiste à aborder un client en quête d’éléments d’information visant la confirmation d’hypothèses préalables) et les erreurs
de pensée. Le manque de rétroaction de même qu’une rétroaction inadéquate et
parfois même fausse peuvent aussi expliquer que les cliniciens apprennent difficilement de leurs erreurs passées (Garb, 1998; Garb et Boyle, 2003).
Les résultats sur l’expérience clinique sont en relation étroite avec la difficulté
qu’éprouvent les praticiens à trouver les principaux problèmes de leurs clients
avec précision et à faire une prédiction. Les idées préconçues, les biais personnels, l’utilisation d’heuristiques cliniques et les défaillances de la mémoire sont
autant d’obstacles qui nuisent à la formation d’une prédiction efficace. De plus, les
cliniciens bénéficient rarement d’une rétroaction précise et systématique concernant les décisions prises par le passé, ce qui a pour effet de cristalliser ces
schèmes de pensée.
Les approches idiographiques et nomothétiques de la prédiction
À la lumière de tels résultats, certains ont évoqué que si l’homme était constamment battu par la règle de prédiction sur des décisions simples, il pouvait utiliser
toute sa faculté d’analyse et montrer sa supériorité dans le cas de tâches plus
complexes. La question relative à la qualité de la prédiction a aussi été abordée
sous l’angle des perspectives idiographiques et nomothétiques (Garb, 1998). Les
tenants d’une vision idiographique soutiennent que pour se prononcer efficacement sur le comportement futur d’un individu, il est souhaitable de connaître en
profondeur ce qui fait de lui une personne unique. En fait, bien connaître cette personne permettra de se prononcer adéquatement sur son comportement futur.
Cette approche plus holistique de la pratique clinique, comme la décrit Ruscio
(2003), réfère donc à une vision selon laquelle le jugement clinique permet la prise
en compte d’une plus grande variété d’informations pertinentes et une intégration
plus sophistiquée et nuancée de celles-ci (Ruscio, 2003). À l’opposé, les tenants
d’une approche nomothétique de la prédiction invoquent que la connaissance de
158
2/06
Revue internationale de criminologie et de police technique et scientifique
certains éléments clefs, généralement issus de travaux empiriques, permet de prédire efficacement. Les travaux qui comparent les prédictions découlant des visions
idiographique et nomothétique favorisent clairement cette dernière (Garb, 1998;
Mossman, 1994; Gardner, Lidz, Mulvey et Shaw, 1996). En somme, lorsque le
temps est venu de poser un diagnostic, de se prononcer sur le traitement le plus
adéquat ou de faire une prédiction, il est préférable de se fier à un petit nombre de
critères fiables que de tenter de saisir toute l’idiosyncrasie du client.
La prédiction actuarielle et l’ajustement clinique
Plusieurs arguments suggèrent une plus grande finesse du jugement clinique par
rapport à la prédiction actuarielle. Parmi les mythes les plus tenaces entourant le
lien entre la prédiction clinique et la prédiction actuarielle on retrouve ce que certains appellent l’ajustement clinique. L’ajustement clinique se base sur le fait que
l’être humain a une grande capacité à détecter les événements dits rares. On réfère ici aux éléments en apparence importants qui ne sont pas pris en compte par
l’instrument actuariel. En fait, le cerveau humain est un instrument beaucoup plus
puissant que n’importe quel autre pour détecter les éléments discordants, rares ou
inusités ou pour détecter les patterns (Friedman et Kandel, 1999; Webb, 1999).
En 2003, à la réputée New York Academy of Sciences, avait lieu une discussion sur la prédiction actuarielle et la gestion du risque chez les délinquants
sexuels. La réunion plénière mettait en scène quatre ténors dans le domaine de la
délinquance violente et sexuelle, soit Neil Malamuth, Howard Barbaree, Vernon
Quinsey et Raymond Knight. Bien que les quatre proposassent différentes visions
et avenues afin d’améliorer la prédiction, tous s’entendaient sur une chose: l’ajustement clinique, soit la modification de la prédiction issue d’un instrument actuariel, n’est pas souhaitable. L’exemple désormais classique relativement à l’ajustement clinique, le Broken leg case, est issu des travaux de Meehl (1954). Sachant
qu’un professeur d’université va tous les vendredis au cinéma depuis plusieurs
années, est-il souhaitable de changer une prédiction sachant que ce dernier vient
tout juste de se casser une jambe et porte un plâtre qui l’empêche de prendre
place au cinéma? Comme le souligne Meehl, un événement improbable en est un
qui ne se produit presque jamais; cependant, quelque chose d’improbable se produit presque tous les jours. Lorsque les praticiens se voient confier des grilles dans
lesquelles on les autorise à ajuster la prédiction, ils ont tendance à voir beaucoup
plus de «jambes cassées» qu’il n’y en a réellement (Dawes et collab., 1989; Bishop
et Trout, 2002). La tendance à déroger de la règle de prédiction est intimement liée
à notre disposition à avoir confiance en notre faculté de raisonnement et d’abstraction. Cette tendance à nous fier à notre intuition plutôt qu’à des stratégies
simples mais éprouvées est attribuable à deux particularités du travail clinique, soit
la trop grande confiance accordée à nos jugements de même que la trop grande
confiance en la fidélité de nos facultés de raisonnement (Bishop et Trout, 2002).
En règle générale, le recours au jugement du clinicien pour ajuster la prédiction
en fonction d’informations nouvelles n’ajoute rien à la précision des résultats
Revue internationale de criminologie et de police technique et scientifique
2/06
159
actuariels, si ce n’est qu’il contribue à diminuer la valeur des instruments en question (Harris et Rice, 1997).
Bref, plusieurs caractéristiques particulières de la prédiction clinique expliquent
sa moins grande précision. Différents mécanismes psychologiques interfèrent
avec une évaluation précise et systématique des différents facteurs de risque utiles
à la formation d’une prédiction juste. Toutes ces lacunes ont d’ailleurs amené le
développement puis le perfectionnement d’une panoplie d’instruments visant à
mesurer le risque et à prédire la récidive.
Conclusion
Certains, comme Quinsey et ses collègues (1998), suggèrent de délaisser complètement l’évaluation clinique traditionnelle pour des raisons pratiques. D’autres
évoquent cette même possibilité pour des raisons de nature éthique (Dawes,
2002). Devrait-on préconiser la prédiction clinique alors que les preuves empiriques indiquent clairement qu’elle ne fonctionne pas bien? Pour Meehl (1986),
«faire une prédiction sur l’avenir d’un étudiant universitaire, un criminel ou un
patient dépressif à l’aide de méthodes inefficaces plutôt qu’efficaces, tout en facturant 10 fois la somme d’argent nécessaire pour faire une prédiction, semble
d’une éthique douteuse». Le simple fait que le clinicien ait le sentiment d’être aussi
efficace que l’instrument actuariel et qu’il trouve déshumanisante l’approche
actuarielle n’a que peu de valeur en comparaison avec les enjeux éthiques qu’implique une telle décision (Ruscio, 2003). Pour Dawes (2002), le praticien aspirant à
une pratique congruente et éthique doit utiliser les règles de prédiction et les techniques actuarielles lorsqu’elles sont disponibles dans son domaine d’intervention.
D’autres arguments de nature éthique plaident en faveur de l’introduction de
techniques actuarielles. La pratique auprès de clientèles correctionnelles a cette
particularité d’être potentiellement perméable aux influences sociales et politiques
des décisions. Selon Schneider, Ervin et Snyder-Joy (1996), lorsque des décisions
délicates sont prises, comme celles impliquant les délinquants, il est possible que
certains fassent des choix les protégeant de la critique populaire. En effet, dans le
doute avec certaines clientèles, on préfère opter pour une évaluation plus sévère,
un plus grand degré de supervision, des coûts plus élevés, donc une efficience
moindre. Il en est ainsi des décisions prises dans des cas fortement médiatisés.
Plusieurs hésitent à faire des recommandations favorables à la suite d’un cas d’espèce médiatisé. De telles décisions, quoique compréhensibles, sont éthiquement
douteuses, onéreuses, et peuvent en partie être évitées à l’aide d’instruments
actuariels.
Pour d’autres (Bishop, 2000), la leçon à tirer n’est pas le total remplacement du
clinicien par des techniques mécaniques. Après tout, les modèles actuariels fonctionnent mieux principalement parce que les chercheurs et les cliniciens ont combiné leurs efforts et leurs expertises pour les créer. L’avenue à envisager est l’utilisation de techniques beaucoup moins coûteuses bénéficiant d’une plus grande
fidélité. Les différentes limites des instruments actuariels permettent cependant de
160
2/06
Revue internationale de criminologie et de police technique et scientifique
nuancer le propos concernant l’utilisation de l’entretien clinique traditionnel.
Néanmoins, il est nécessaire de distinguer la question de la prédiction de celle de
la décision. En effet, si l’instrument actuariel indique un risque élevé, il incombe au
clinicien de faire les choix les plus adéquats en matière de mesures à préconiser.
La maison de transition est-elle un choix judicieux pour un délinquant plutôt qu’un
autre? Quels programmes semblent plus adaptés pour lui? Ces questions relèvent
de la décision, et le clinicien se doit d’exercer son jugement avec professionnalisme.
Pour Meehl (1954), «chaque heure passée à réfléchir et à discuter sur qui
devrait bénéficier de traitements, comment le traiter et pour combien de temps, est
directement soustraite à l’ensemble des heures disponibles à l’intervention proprement dite». Dans un contexte où les praticiens ne bénéficient que d’une plage
horaire très circonscrite pour évaluer leurs clients et intervenir auprès d’eux, il
semble important d’aménager ce précieux temps en fonction des forces et des faiblesses des cliniciens. Les résultats de nombreuses études démontrent très clairement que la prédiction clinique est moins performante, plus coûteuse et demande notablement plus de temps que la prédiction actuarielle. Même lorsqu’elle est
équivalente à la méthode clinique, la méthode actuarielle doit être considérée
comme plus avantageuse, puisqu’elle nécessite bien moins de temps (Grove et
collab., 2000). Les effets sont d’autant plus bénéfiques que le praticien peut investir beaucoup plus d’énergie à intervenir auprès de son client (Dawes et collab.,
1989), démarche qu’aucun instrument, si perfectionné soit-il, n’est arrivé à faire
(Garb, 1994). Bien qu’elle soit comme une chaude couverture pour le sentiment de
compétence du clinicien, la prédiction clinique demeure coûteuse et peu efficace.
Compte tenu de la performance relative de la prédiction clinique et du temps
qu’exige cette démarche, demander au clinicien d’y allouer une partie importante
de ses énergies est une mauvaise utilisation de son temps et de sa compétence,
en plus d’être éthiquement douteux (Meehl, 1954).
Bibliographie
Andrews. D.A. (1982). The Level of Supervision Inventory (LSI): The first follow-up. Toronto, ON,
Ministère des Services correctionnels de l’Ontario.
Andrews, D.A., & Bonta, J. (1995). The Level of Service Inventory-Revised, Toronto, Multi-Health
Systems.
Andrews, D.A., & Bonta, J., (2003). The psychology of criminal conduct, Cincinnati, Anderson.
Bishop, M.A. (2000). In praise of epistemic irresponsibility: How lazy and ignorant can you be?
Synthese, 122, 179-208.
Bishop, M.A., & Trout, J.D. (2002). 50 years of successful predictive modeling should be enough:
Lessons for philosophy of science. Philosophy of Science, 69, S197–S208.
Bonta, J. (1989). Aboriginal offenders: Institutional response, risk, and needs, Revue canadienne de criminologie, 31, 49-61.
Bonta, J. (1996). Risk-needs assessment and treatment, dans A. T. Harland (éd.), Choosing correctional options that work (p. 18-32), Thousand Oaks, Californie.
Bonta, J. (2000). Offender assessment: General issues and considerations. Forum on Corrections, 12,
14-18.
Bonta, J. (2000). Offender rehabilitation: from research to practice. Conférence présentée à
l’Association of Paroling Authorities International, Ottawa, Canada.
Revue internationale de criminologie et de police technique et scientifique
2/06
161
Bonta, J., & Motiuk, L. (1992). Inmate classification. Journal of Criminal Justice, 20, 343-353.
Bonta, J., Harman, W.G., Hann, R.G. & Cormier, R.B. (1996). The prediction of recidivism among federally sentenced offenders: A re-validation of the SIR scale, Revue canadienne de criminologie, 38,
61-79.
Bonta, J., Motiuk, L., & Ker, K. (1985). The Level of Service Inventory (LSI) among incarcerated offenders. Report #1. Toronto: Ministry of Correctional Services (Ontario).
Burgess, E. (1928). “Factors Determining Success or Failure on Parole.” In The Workings of the
Indeterminate-Sentence Law and the Parole System in Illinois. Edité par A. Bruce, A. Harno, E.
Burgess et J. Landesco. Springfield, IL: State Board of Parole.
Carré, R., Dégremont, J.F., Gross, M., Pierrel, J.M., & Sabah, G. (1991). Langage humain et machine,
Presses du CNRS.
Chapman, L.J. (1967). Illusory correlation in observational report. Journal of Verbal Learning and Verbal
Behavior, 6, 151-155.
Côté, G. (2001). De la dangerosité à l’évaluation du risque, Psychologie Québec, Mai.
Coulson, G., Ilacqua, G., Nutbrown, V., Giulekas, D. & Cudjoe, F. (1996). Predictive utility of
the LSI for incarcerated female offenders», Criminal Justice and Behavior, 23, 427-439.
Cumberland, A.K., & Boyle, G.J. (1997). Psychometric prediction of recidivism: Utility of the Risk Needs
Inventory. Australian and New Zealand Journal of Criminology, 30, 72-86.
Dawes, R.M., (2002). The ethics of using or not using statistical prediction rules in psychological practice and related consulting activities. Philosophy of Science, 69, S178–S184.
Dawes, R.M., Faust, D., & Meehl. P.E. (1989). Clinical and actuarial judgment. Science, 243, 1668-1674.
Faust, D., Hart K., & Guilmette, TJ. (1988). Pediatric malingering: the capacity of children to fake believable deficits on neuropsychological testing. Journal of Consulting and Clinical Psychology, 56,
578-582.
Fischhoff, B., Slovic, P. & Lichtenstein, S. (1977). Knowing with certainty: The appropriateness of extreme confidence. Journal of Experimental Psychology, 3, 552-564.
Friedman, M. & Kandel, A. (1999). Introduction to Pattern Recognition, statistical, structural, neural and
fuzzy logic approaches, World Scientific, Signapore.
Galton, F., (1889). Natural Inheritance, New Mexico, Genetics Heritage Press.
Garb, H.N. (1994). Toward a second generation of statistical prediction rules in psychodiagnosis and
personality assessment. Computers in Human Behavior, 10, 377-394.
Garb, H.N. (1998). Studying the clinician: Judgment research and psychological assessment.
Washington, DC: American Psychological Association.
Garb, H.N., & Boyle, P.A. (2003). Understanding why some clinicians use pseudoscientific methods:
Findings from research on clinical judgement. In S.O. Lilienfeld, S.J. Lynn, & J.M. Lohr (éd..),
Science and pseudoscience in clinical psychology (pp.17-38). New York: Guilford Press
Gardner, W., Lidz, C. W., Mulvey, E. P., & Shaw, E. C. (1996). Clinical versus actuarial predictions of violence in patients with mental illnesses. Journal of Consulting and Clinical Psychology, 64, 602-609.
Gardner, W., Lidz, C. W., Mulvey, E. P., & Shaw, E. C. (1996). Comparison of actuarial methods for identifying repetitively violent patients with mental illnesses. Law and Human Behavior, 20, 35-48
Goldberg, L.R. (1968). Simple models or simple processes? American Psychologist, 23, 483-496.
Grove, W.M., & Lloyd, M. (Sous presse). Meehl’s contribution to clinical versus statistical prediction.
Journal of Abnormal Psychology.
Grove, W.M., Zald, D.H., Hallberg, A.M., Lebow, B., Snitz, E., & Nelson, C. (2000). Clinical versus
mechanical prediction: A meta-analysis. Psychological Assessment, 12, 19-30.
Hannah-Moffat, K. & Maurutto, P. (2003). Youth Risk/Need Assessment: An Overview of Issues and
Practices, Canada, Department of Justice.
Hanson, R.K. & S. Wallace-Capretta. (2000). Prédire la récidive chez les hommes violents envers leur
partenaire, Ottawa, Ministère du Solliciteur général du Canada.
Harris, G.T., & Rice, M.E. (1997). Risk appraisal and management of violent behavior. Psychiatric
Services, 48, 1168-1176.
162
2/06
Revue internationale de criminologie et de police technique et scientifique
Harris, G.T., Rice, M.E., & Quinsey, VL. (1993). Violent recidivism of mentally disabled offenders: The
development of a statistical prediction instrument. Criminal Justice and Behaviour, 20,315-35.
Hoffman, P.B. (1983). Screening for risk: A revised salient factor score (SFS81). Journal of Criminal
Justice, 11, 539-547.
Holsinger, A.M., Lowenkamp, C.T. & Latessa, E.J. (2004). Validating the LSI-R on a Sample of Jail
Inmates, The Journal of Offender Monitoring, Winter/Spring, 8-9.
Jennings, D., Amabile, T. & Ross, L. (1982). Informal covariation assessment: Data-based versus theory-based judgments. In D. Kahneman, P. Slovic and A. Tversky (éd..), Judgment Under Uncertainty:
Heuristics and Biases. Cambridge: Cambridge University Press.
Kirkpatrick, B.L. (1999). Exploratory research of female risk prediction and LSI-R. Corrections
Compendium: The National Journal for Corrections. 24, 14-17.
Kleinmuntz, B. (1990). Why we still use our heads instead of formulas: Toward an integrative approach,
Psychological Bulletin, 107, 296-310.
Lidz, C. W., Mulvey, E. P., & Gardner, W. (1993). The accuracy of predictions of violence to others.
Journal of the American Medical Association, 269, 1007-1011.
Lowenkamp, C.T., A.H. Holsinger, & E.J. Latessa (2001). Risk/Need Assessment, Offender
Classification, and the Role of Childhood Abuse. Criminal Justice and Behavior, 28, 543563.
Loza, W. & Dhaliwal, G.K. (2005). Predicting Violence Among Forensic-Correctional populations: The
Past 2 Decades of Advancements and Future Endeavors, Journal of Interpersonal Violence, 20,
188-194.
Loza, W. (2003). Predicting violent and non-violent recidivism of incarcerated male offenders.
Aggression and Violent Behavior, 8, 175-203.
Loza, W., & Simourd, D. J. (1994). Psychometric evaluation of the Level of Supervision Inventory (LSI)
among male Canadian federal offenders. Criminal Justice & Behavior, 21, 468-480
Meehl, P.E. (1954). Clinical Versus Statistical Prediction. University of Minnesota Press, Minneapolis,
MN, USA.
Meehl, P.E. (1960). The cognitive activity of the clinician. American Psychologist, 15, 19-27.
Meehl, P.E. (1986). Causes and effects of my disturbing little book. Journal of Personality Assessment,
50, 370-375.
Metz, C.E. (1978). Basic principles of ROC analysis. Seminars in Nuclear Medicine, 8, 283-298.
Millaud, F. (1999) Maladie mentale et violence: revue de littérature, In Jean Proulx, Maurice Cusson et
Marc Ouimet, Les violences criminelles, (pp. 267-288), Presses de l’Université de Laval.
Mills, J.F. (2005). Advances in the Assessment and Prediction of Interpersonal Violence, Journal of
Interpersonal Violence, 20, 236-241
Monahan, J., & Steadman, H.J. (1994) (Eds.). Violence and mental disorder: Developments in risk
assessment. Chicago: University of Chicago Press
Mossman D. (1994). Assessing predictions of violence: being accurate about accuracy. Journal of
Consulting and Clinical Psychology, 62, 783-792.
Nisbett, R.E. & Ross, L., (1980). Human inference: Strategies and shortcomings of social judgment,
Englewood Cliffs, NJ: Prentice-Hall.
Pellerin, B., St-Yves, M. & Guay, J.P. (2003). La théorie de l’abusé-abuseur en délinquance sexuelle: qui
dit vrai?, Revue Canadienne de Criminologie, 45, p.81-98.
Quinsey, V.L., Harris, G.T., Rice, M.E. & Cormier, C.A. (1998). Violent offenders: Appraising and managing risk. Washington: American Psychological Association.
Raynor, P., Kynch, J., Roberts, C. & Merrington, S. (2000). Risk and Need Assessment in Probation
Services: an Evaluation, Home Office Research Study 211, London: Home Office
Rettinger, J.L. (1998). A Recidivism Follow-up Study Investigating Risk and Need Within a
Sample of Provincially Sentenced Women, Thèse de doctorat, Université Carleton, Ottawa.
Rice, M.E. (1997). Violent offender research and implications for the criminal justice system. American
Psychologist, 52, 414-423.
Ruscio, J. (1998). The perils of post-hockery. Skeptical Inquirer, 22, 44-48.
Revue internationale de criminologie et de police technique et scientifique
2/06
163
Ruscio, J. (2003). Holistic judgment in clinical practice: Utility or futility? Scientific Review of Mental
Health Practice, 2, 38-48.
Schneider, A., L. Ervin, & Z. Snyder-Joy. (1996). Further Exploration of the Flight from Discretion: The
Role of Risk/Need Instruments in Probation Supervision Decisions, Journal of Criminal Justice, 24,
109-121.
Simourd, D.J. & Malcolm, P.B. (1998). Reliability and validity of the Level of Service Inventory-Revised
among federally incarcerated sex offenders. Journal of Interpersonal Violence, 13, 261-74.
Tracey, T.J. & Rounds, J. (1999). Inference and Attribution Errors in Test Interpretation. In R. K. Goodyear
& J. W. Lichtenberg, (éd.), Test interpretation: Integrating science and practice, Boston: Allyn &
Bacon.
Tversky, A., & Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185,
1124-1130.
Webb, A. (1999). Statistical pattern recognition, Oxford University Press Inc., New York.
Worling, J.R. (1995) Adolescent sex offenders against females: Differences based on the age of their
victims. International Journal of Offender Therapy and Comparative Criminology, 39, 276-293.
Zweig, M.H., & Campbell, G. (1993). Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine. Clinical Chemistry, 39, 561-577.
164
2/06
Revue internationale de criminologie et de police technique et scientifique