Prédiction actuarielle et prédiction clinique: le dernier souffle d`une
Transcription
Prédiction actuarielle et prédiction clinique: le dernier souffle d`une
Prédiction actuarielle et prédiction clinique: le dernier souffle d’une pratique traditionnelle par Jean-Pierre GUAY* Résumé Les intervenants de première ligne dans le milieu correctionnel sont confrontés à un grand nombre de décisions sur le sort des délinquants. Afin de prendre de telles décisions, ils ont recours au jugement clinique ou à des instruments actuariels. Dans la présente étude, les résultats sur la comparaison des prédictions cliniques et actuarielles sont présentés, de même que les principales stratégies cognitives employées par les cliniciens menant presque invariablement à la commission d’erreurs de prédiction. L’évolution des instruments de gestion du risque est présentée, de même que le LSI-R, un instrument de prédiction de troisième génération. Abstract Clinicians working in the correctional system are taking multiple decisions on a daily basis. In order to take those decisions, many are using validated actuarial instruments while some are still referring to their clinical judgement only. The present study is presenting findings in the area of clinical and actuarial prediction, as well as the various heuristics used by clinicians to produce clinical predictions. The evolution of prediction, from informal to actuarial, is presented, and the LSI-R is described as an example of an efficient third-generation instrument. Le travail de l’intervenant de première ligne dans le système correctionnel est jalonné de décisions. Constamment, les criminologues, psychologues, travailleurs sociaux, mais aussi les gardiens, doivent se prononcer sur différents aspects de la vie quotidienne des délinquants. L’évaluation du risque d’acte de violence est maintenant devenu l’un des jugements les plus importants demandés aux cliniciens. Le contrevenant est-il susceptible de récidiver si une libération conditionnelle lui est accordée? Est-il à risque de commettre une tentative de suicide? Est-il envisageable qu’il ait un geste violent à l’égard de ses codétenus ou des agents? En cas de déplacement hors des établissements carcéraux, devrait-on envisager une escorte plus musclée? La communauté peut-elle assumer le risque de récidive qu’il représente? Toutes ces questions simples réfèrent à des mécanismes communs et font l’objet de réflexions et de travaux empiriques depuis une cinquantaine d’années. L’évolution de l’évaluation du risque Dans une recension des travaux portant sur l’évaluation du risque, Bonta (1996) décrit principalement trois phases dans l’évolution de l’évaluation du risque des délinquants. La première, la phase clinique, est décrite comme l’utilisation intuitive de l’entrevue. Un intervenant formé en sciences sociales rencontre un délinquant et * Ph.D., École de Criminologie, Université de Montréal Revue internationale de criminologie et de police technique et scientifique 2/06 149 l’interroge sur différents aspects de sa vie. La nature et le contenu de l’entretien varient selon la perception qu’a le clinicien de ce délinquant. Au besoin, le dossier sera consulté, et ce sur quoi le clinicien mettra l’accent est aussi fonction du délinquant. Le jugement porté est subjectif, parfois intuitif, et guidé en partie par le «feeling» du clinicien (Andrews et Bonta, 2003). La deuxième phase dans l’évolution de l’évaluation du risque des délinquants est celle où la prédiction repose sur une combinaison mécanique des prédicteurs. Les premiers efforts de systématisation remontent à 1928 avec les travaux de Burgess. Après avoir déterminé 21variables généralement associées à l’échec en période de libération de près de 3 000 délinquants suivis en milieu ouvert, il créa une simple échelle calculant la somme sur 21, chaque critère valant un point. Les résultats indiquèrent que les sujets obtenant le score le plus élevé avaient un taux de récidive de 76 %, tandis que ceux ayant le plus bas en avaient un de 1,5 %. De manière générale, les méthodes issues de la seconde génération d’instruments d’évaluation du risque utilisent une série de critères, souvent des éléments liés au passé criminel. La sommation de ces items donne habituellement un score, lequel donne une prédiction plus significative que l’approche clinique intuitive. Cependant, la faiblesse de la seconde génération d’instruments est qu’elle ne contient habituellement que des facteurs statiques ou immuables (la nature des délits antérieurs commis, la durée de la sentence, l’âge du sujet, l’âge aux premiers délits, etc.) et, par conséquent, ne nous renseigne pas sur les besoins des délinquants, et encore moins sur leurs besoins criminogènes (Bonta, 2000). Parmi les instruments de gestion du risque les plus connus, on trouve le Salient Factor Score (Hoffman 1983) et le Statistical Inventory on Recidivism (SIR; Bonta, Harman, Hann et Cormier, 1996). La troisième génération d’instruments actuariels a su intégrer les facteurs statiques et les facteurs dynamiques, cibles de changement, en des instruments valides et fidèles. Ils permettent de prédire efficacement la récidive et une multitude d’autres aspects, en plus de déterminer les aspects sur lesquels les interventions devraient porter. Dans ce cadre, il ne s’agit plus d’évaluer la dangerosité (un état statique), mais bien d’«estimer le risque de comportements violents pour un individu donné, dans un contexte donné, et selon un temps donné» (Côté, 2001). Cette nouvelle génération d’instruments s’inscrit dans un élan de professionnalisation des décisions et s’inspire grandement des résultats des méta-analyses. On entrevoit déjà la quatrième génération d’instruments de gestion du risque, laquelle devrait tenir compte des facteurs dynamiques et du principe de réceptivité à l’intervention (Hannah-Moffat et Maurutto, 2003). Parmi les instruments de troisième génération actuellement les plus utilisés en Amérique du Nord, on retrouve l’Inventaire du niveau de service, communément appelé le LSI-R. Il représente bien l’état actuel de l’instrumentation actuarielle de troisième génération. L’Inventaire du niveau de services L’Inventaire du niveau de services (LSI-R; Andrews et Bonta, 1995) est un instrument de troisième génération visant à estimer le niveau de risque des délinquants 150 2/06 Revue internationale de criminologie et de police technique et scientifique et à déterminer le degré de supervision requis. Le LSI-R mesure 10 domaines de la vie des infracteurs qui sont associés à la délinquance: a) l’histoire criminelle, b) l’éducation et l’emploi, c) les finances personnelles, d) les relations familiales et conjugales, e) le logement, f) les loisirs, g) la fréquentation des pairs, h) les problèmes de consommation d’alcool et de drogues, i) la santé mentale et psychologique et j) les attitudes. Les 10 domaines fouillés comportent un total de 54 items dichotomiques (non-oui). Un score est calculé en en faisant la somme. Les résultats qui sont bas indiquent généralement un niveau de risque criminogène et un besoin de supervision plus faibles, tandis que les scores plus élevés correspondent à un risque et à des besoins plus grands. L’essentiel de l’information obtenue dans le cadre de l’évaluation faite à l’aide du LSI-R provient de l’entrevue structurée avec le délinquant et de l’étude de son dossier. En ce qui concerne les qualités psychométriques du LSI-R, celui-ci a montré une bonne validité, une fidélité plus que satisfaisante ainsi qu’une structure factorielle solide (Loza et Simourd, 1994). Il s’est avéré apte à prédire à la fois les nouvelles arrestations et condamnations et la réincarcération. De plus, il s’est révélé efficace auprès de différentes clientèles: les délinquants sous ordonnance de probation ou en liberté surveillée (Andrews, 1982; Cumberland et Boyle, 1997; Raynor, Kynch, Roberts et Merrington, 2000; Rettinger, 1998), les délinquants résidant en maison de transition (Bonta, Motiuk et Ker 1985; Lowenkamp, Holsinger et Latessa, 2001) et les délinquants incarcérés (Bonta et Motiuk, 1992; Rettinger, 1998). Divers travaux de recherche ont aussi démontré qu’on pouvait l’employer avec des clientèles particulières: les femmes incarcérées (Coulson, Ilacqua, Nutbrown, Giulekas et Cudjoe, 1996; Kirkpatrick, 1999), les délinquants d’origine autochtone (Bonta, 1989), les délinquants ayant des problèmes de violence conjugale (Hanson et Wallace-Capretta, 2000), les délinquants aux prises avec des troubles mentaux (Harris, Rice et Quinsey, 1993) de même que les délinquants sexuels (Simourd et Malcolm, 1998). En plus de prévoir la récidive, il s’est avéré utile dans la prédiction des incidents disciplinaires en milieu carcéral (Andrews et Bonta, 2003) et dans le choix des délinquants qu’il est préférable de libérer en cas de surpopulation carcérale (Holsinger, Lowenkamp et Latessa, 2004). L’évaluation du risque à l’aide du LSI-R demande approximativement trois heures. Son utilisation ne requiert pas de spécialisation particulière et ne demande qu’une formation sommaire. Les limites des instruments actuariels Les instruments actuariels et les règles de prédiction ne sont pas sans lacunes. Les principaux instruments actuariels permettent de faire une prédiction efficace, plus efficace que la simple prédiction intuitive et clinique. Cependant, en plus de ne compter qu’un nombre limité de variables (Garb, 1994), ils ne permettent pas d’expliquer le comportement. Par leur nature corrélationelle, les instruments actuariels sont pour une bonne part athéoriques et n’ont pas pour fonction d’aider à comprendre le comportement. Connaître la précocité de la délinquance ou le volume Revue internationale de criminologie et de police technique et scientifique 2/06 151 de crimes commis par le passé nous renseigne sur la probabilité que des crimes soient commis dans le futur, mais ne nous renseigne que bien peu sur la dynamique du délinquant. Néanmoins, alors que les instruments de gestion du risque de deuxième génération ne donnaient aucune information concernant des facteurs potentiellement modifiables, les instruments de troisième génération indiquent les facteurs dynamiques les plus importants, cibles d’intervention potentielles. Le débat de la prédiction clinique-actuarielle En 1954, Paul Meehl, un psychologue clinicien, publiait un ouvrage intitulé Clinical Versus Statistical Prediction: A Theoretical Analysis and a Review of the Evidence. Cet ouvrage polémique allait marquer l’univers de la prédiction jusqu’à aujourd’hui. Le «petit livre dérangeant», comme il aimait bien l’appeler, soutenait qu’il valait souvent mieux se référer à une table de prédiction statistique qu’à son jugement clinique pour prédire le comportement. Au fil des années, plusieurs chercheurs se sont spécifiquement préoccupés de la qualité de la prédiction clinique. Principalement quatre d’entre eux ont mené des études comparatives ou des méta-analyses sur la question. Une contribution importante de Meehl (1954) a été d’étudier 22 recherches visant à mettre en parallèle la méthode clinique (dans laquelle le clinicien se fie à son jugement et à son expérience pour faire une prédiction) et la méthode actuarielle (dans laquelle on utilise des règles de prédiction statistiques pour établir une prédiction). En aucun cas la méthode clinique ne s’est avérée franchement supérieure à la méthode actuarielle. Dans approximativement la moitié des cas, les deux méthodes obtiennent des résultats comparables et, dans l’autre moitié, la prédiction clinique est bien inférieure à la prédiction actuarielle. Meehl a fait bien plus que simplement démontrer la valeur des techniques actuarielles. Pour Grove et Lloyd (sous presse), quatre grandes contributions lui sont attribuées, dont deux sont pertinentes pour notre propos. La première est que Meehl a clairement rappelé l’importance de distinguer la collecte des données de base et la combinaison de celles-ci. En fait, l’auteur indique qu’il existe principalement deux façons de combiner les données: les méthodes actuarielles (mécaniques) et les méthodes cliniques (non mécaniques). Dans le cas des méthodes mécaniques, il n’y a aucun jugement, inférence ou attribution de poids de la part du clinicien. Une fois les données réunies (par exemple le nombre et la nature des antécédents criminels, les problèmes de consommation, l’emploi), le travail de prédiction est somme toute clérical. Les techniques non mécaniques de combinaison sont le fait d’une logique clinique. Dans son ouvrage, Meehl a clairement démontré la supériorité des méthodes actuarielles sur les méthodes cliniques pour combiner les données. En 1989, Dawes, Faust et Meehl publiaient dans la prestigieuse revue Science le fruit de leurs recherches sur la prédiction clinique et la prédiction actuarielle. Dans une recension narrative de la littérature, les auteurs ont étudié différents travaux dans lesquels la prédiction des techniques cliniques et actuarielles était basée sur différents critères de comparaison: 1) les études devaient utiliser les 152 2/06 Revue internationale de criminologie et de police technique et scientifique mêmes données et 2) elles devaient appliquer les règles actuarielles à de nouveaux cas afin d’éviter une inflation artificielle de la prédiction actuarielle en mettant l’accent sur la chance. Leurs résultats indiquent que les méthodes fondées sur des règles actuarielles de prédiction fonctionnaient aussi bien ou surpassaient notablement les méthodes cliniques, et ce, même lorsque les cliniciens bénéficiaient d’une plus grande quantité d’informations. Par ailleurs, dans une étude visant entre autres à bonifier les techniques statistiques associées à la prédiction d’événements rares, Mossman (1994) a examiné 58 recherches portant sur la prédiction de la violence. Ces travaux comptaient au total plus de 16 000 sujets, principalement des patients psychiatriques évalués dans des contextes sécuritaires. À l’aide des analyses ROC (Receiver Operating Characteristic; Metz, 1978; Zweig et Campbell, 1993), l’auteur s’est penché sur la possibilité de prédire les actes de violence. Ses résultats indiquent, entre autres, que les prédictions actuarielles basées sur les comportements passés sont plus fiables que les prédictions cliniques. Les résultats soulignent aussi que, quoique inférieur, le jugement clinique surpassait le hasard. Quelques années plus tard, les résultats de Gardner, Lidz, Mulvey et Shaw (1996) allaient confirmer ce résultat. Les travaux de Mossman ont contribué à rendre plus accessibles les techniques associées à l’analyse ROC. Celle-ci a montré plusieurs avantages par rapport aux techniques traditionnelles, notamment le fait d’être relativement indépendante des taux de base et la possibilité d’obtenir un indice (AUC, l’aire sous la courbe) permettant la comparaison de la qualité de différents instruments. Cet avantage a fait de cet outil une technique de choix dans la prédiction d’événements rares, comme par exemple la récidive, la rechute ou l’abandon du traitement (Rice, 1997; Quinsey, Harris, Rice et Cormier, 1998). Plus récemment, Grove et ses collègues (Grove, Zald, Lebow, Snitz et Nelson, 2000) ont entrepris de refaire une méta-analyse sur les différents travaux portant sur la prédiction dite clinique et actuarielle. Un total de 136 études fut retenu de la recension exhaustive de la littérature. Chacune d’elles fut codifiée à l’aide d’un manuel de codification sur une variété d’aspects pertinents: année de publication, type de publication, nature du devis de recherche, nombre de sujets, opérationnalisation de la variable dépendante, nature de la formation des cliniciens, nombre d’années d’expérience, quantité d’informations accessibles pour les cliniciens et pour la méthode actuarielle, etc. Une procédure visant à estimer l’accord interjuges dans la codification a été mise en oeuvre afin d’éviter que les codificateurs ne fassent fausse route. Les résultats confirment la tendance de fond des recherches précédentes. Les tailles de l’effet (effect size) varient de -0,30 (indiquant une prédiction clinique supérieure à une prédiction actuarielle) à 0,74 (signalant la supériorité marquée des méthodes actuarielles). Les résultats favorisent la méthode actuarielle dans près de la moitié des travaux (46 %, n de tailles de l’effet=63) et près de la moitié indiquent des résultats comparables (48 %, n de tailles de l’effet=65). Seulement 6 % des études appuient clairement les prédictions cliniques. Plusieurs analyses additionnelles ont été effectuées afin de comprendre les variables influant sur les tailles d’effet. Les résultats suggèrent que l’année de publication des travaux n’était pas associée à la taille de l’effet, pas plus que le Revue internationale de criminologie et de police technique et scientifique 2/06 153 type de publication ou le domaine d’étude. Les résultats indiquent aussi que lorsque les données d’une interview étaient utilisées afin d’émettre une prédiction, cette dernière avait tendance à être moins efficace. De plus, ni la formation des praticiens ni le nombre d’années d’expérience n’influencent significativement les résultats issus de la prédiction clinique. En somme, l’ensemble des travaux portant sur la comparaison des méthodes cliniques et actuarielles favorise nettement ces dernières pour faire une prédiction. Dans près de la moitié des cas, la prédiction actuarielle et la prédiction clinique obtiennent des résultats similaires. En outre, dans près de la moitié des cas, la prédiction actuarielle est notablement supérieure. La prédiction clinique s’avère meilleure que la prédiction actuarielle dans seulement 5 % à 6 % des cas. Ces résultats sont robustes et, fait à noter, indépendants de la nature de la prédiction, du domaine d’étude, de l’expérience ou de la formation des cliniciens ainsi que de la quantité de matériel clinique fournie aux praticiens. En fait, rares sont les domaines de recherche en psychologie et en criminologie où le corps de la littérature est si constant. Les discussions entourant la prédiction clinique-actuarielle était pour plusieurs un faux débat. Si les preuves sont si solides, elles n’expliquent en rien pourquoi les cliniciens éprouvent des difficultés à faire une prédiction précise. En fait, l’efficacité moindre de la prédiction clinique est en partie attribuable à l’utilisation fréquente d’heuristiques diverses. Pour Carré, Dégremont, Gross, Pierrel et Sabah (1991), l’heuristique est une règle qui est utilisée de manière générale, puisqu’elle conduit fréquemment à une solution, sans pour autant qu’on ait la certitude de sa validité dans tous les cas. L’utilisation de telles stratégies cognitives mène presque invariablement à différents biais cognitifs et explique les erreurs de prédiction (Kleinmuntz, 1990). Les plus communes sont: l’ignorance des taux de base, les corrélations illusoires, la régression vers la moyenne, l’assignation non optimale de poids aux critères de prédiction, la confiance exagérée en notre jugement, la probabilité conditionnelle inversée, l’absence de rétroaction systématique ainsi que l’ancrage (voir les travaux de Grove et collab. 2000; Loza, 2003; Ruscio, 2003; Loza et Dhaliwal, 2005; Mills, 2005, pour plus de détails). Elles sont brièvement abordées dans les prochains paragraphes. L’ignorance des taux de base Certains événements sont extrêmement rares dans le cadre de la pratique clinique. On dit d’eux qu’ils ont un faible taux de base. Les événements à faible taux de base sont particulièrement difficiles à prédire. L’ignorance des taux de base fait en sorte qu’on observe dans la prédiction clinique une prévalence élevée de faux positifs, c’est-à-dire que l’on identifie faussement des personnes comme étant à haut risque (Grove et collab. 2000). Dans le cas qui nous occupe, citons le risque élevé d’acte de violence. Les cliniciens, ignorant les taux de base faibles de récidive violente, auront tendance à voir dans une proportion importante de leurs clients un risque élevé de violence, impliquant par le fait même des ressources plus importantes pour les superviser et les traiter (Lidz, Mulvey et Gardner, 1993; Loza, 2003). 154 2/06 Revue internationale de criminologie et de police technique et scientifique Les corrélations illusoires Une partie importante de la pratique clinique a pour base l’expérience passée. En effet, le clinicien utilise les cas antérieurs afin de se forger une opinion sur les cas actuels. Ce que l’on appelle la «corrélation illusoire» (Chapman, 1967) est particulièrement fréquente dans le cadre de la pratique clinique. Elle survient lorsque deux éléments sont associés sans pour autant que cette corrélation soit réelle. Généralement, les corrélations perçues sont fonctions de la nature et de la qualité des données disponibles au clinicien pour se faire un jugement, et à leurs théories implicites (Jennings, Amabile, & Ross, 1982). En effet, si plusieurs se sont débarrassés des croyances concernant les chats noirs, certaines corrélations illusoires demeurent particulièrement vivaces. Dans le domaine de la délinquance, référonsnous à l’association que font beaucoup de gens entre les troubles mentaux graves et la criminalité. Si une relation existe entre ces deux états, elle est non linéaire et complexe (Monahan et Steadman, 1994; Millaud, 1999). La régression vers la moyenne La notion de régression vers la moyenne se rapporte à un principe probabiliste relativement simple: les états exceptionnels sont généralement suivis d’états communs. L’expression régression vers la moyenne provient des travaux de Galton (1889) dans lesquels l’auteur observait que les parents de très petite taille avaient généralement tendance à avoir des enfants plus grands qu’eux et qu’à l’inverse, les parents de très grande taille avaient tendance à avoir des enfants de moins grande taille qu’eux. L’auteur, qui croyait initialement qu’une force biologique était à l’oeuvre, en vint plus tard à la conclusion que le phénomène n’avait rien de biologique et était strictement probabiliste. L’idée est donc que la probabilité qu’un événement rare soit immédiatement suivi d’un autre événement rare est beaucoup plus faible que la probabilité qu’un événement fréquent lui succède. Le fait de ne pas prendre en compte le phénomène de la régression vers la moyenne teinte beaucoup de décisions humaines (Nisbett et Ross, 1980). Par exemple, prédire qu’un délinquant vivant des moments particulièrement difficiles en traitement soit le prélude à des moments meilleurs est une prédiction strictement probabiliste basée sur ce principe. Une telle prédiction, bien que statistiquement prudente en regard du phénomène de la régression vers la moyenne, peut facilement laisser croire en l’efficacité de nos interventions. L’assignation non optimale de poids aux critères de prédiction Afin de générer une prédiction fiable, le poids relatif de chacun des critères pris en compte doit être soupesé. La subjectivité de l’évaluateur peut faire en sorte qu’il attribue un poids relatif trop grand à certains critères et trop faible à d’autres, et ce, en raison de sa propre expérience personnelle. Ainsi, les préjugés ou les attitudes, Revue internationale de criminologie et de police technique et scientifique 2/06 155 favorables ou non, à l’endroit de certains sous-groupes de clients ou de certaines expériences peuvent facilement influer sur l’attribution de ces poids. Par exemple, le fait pour un délinquant d’avoir été abusé sexuellement durant l’enfance teinte pour beaucoup le tableau clinique des délinquants sexuels et influence le jugement des cliniciens dans l’évaluation du risque. Le Syndrome du vampire, comme certains l’appellent (Worling, 1995) n’est cependant que très faiblement associé au développement de difficultés importantes chez les délinquants sexuels judiciarisés (Pellerin, St-Yves et Guay, 2003). La confiance exagérée dans le jugement personnel Certains travaux ont examiné la confiance que les personnes ont en leur jugement (Fischhoff, Slovic et Lichtenstein, 1977; Faust, Hart et Guilmette, 1988). Les résultats démontrent que les cliniciens ont fortement tendance à développer une confiance exagérée en leur jugement, même lorsqu’ils se trompent, notamment en raison d’une interprétation fautive des faits a posteriori (Ruscio, 1998). Les éléments confirmant leurs hypothèses et leurs intuitions initiales sont retenus pour justifier leur diagnostic ou leur pronostic. Pour Bishop et Trout (2002), les praticiens qui résistent à l’utilisation de l’instrumentation actuarielle ont généralement tendance à admettre qu’à la longue, les règles statistiques de prédictions sont probablement plus efficaces que les heuristiques cliniques. Cependant, leur confiance en leur jugement clinique et en leur pouvoir de réflexion les pousse à ne pas prendre en compte les règles cliniques pour les cas particuliers (appelé le problème de Peirce). La probabilité conditionnelle inversée Un autre mécanisme psychologique touchant significativement la qualité du jugement clinique est celui de la probabilité conditionnelle inversée. Ce biais s’apparentant à la corrélation illusoire veut que les praticiens confondent la probabilité que le comportement A se produise compte tenu du comportement B soit la même que la probabilité que le comportement B se produise en la présence du comportement A. L’exemple classique est relatif à l’utilisation parfois abusive d’incidents passés comme indicateurs diagnostiques. Simplement parce que les clients ayant des difficultés interpersonnelles rapportent des antécédents d’abus dans leur vie n’implique pas que les présents abus sont indicateurs des mêmes difficultés dans le futur (Tracey et Rounds, 1999). L’absence de rétroaction systématique Dans le cadre de sa pratique professionnelle, l’intervenant de première ligne rencontre un nombre important de personnes contrevenantes. Il formule plusieurs jugements et prend un nombre presque incalculable de décisions. Une raison fré156 2/06 Revue internationale de criminologie et de police technique et scientifique quemment évoquée pour expliquer les difficultés rencontrées par les praticiens à émettre une prédiction et un diagnostic précis est qu’il ne bénéficie pas de rétroaction systématique sur ses décisions antérieures (Loza, 2003; Ruscio, 2003; Grove et collab., 2000). En fait, peu d’intervenants de première ligne gardent un registre systématique et à jour de leurs décisions antérieures. Les cliniciens ne peuvent savoir facilement ce que leurs sujets sont devenus, pas plus qu’ils ne savent s’ils ont récidivé ou pas. Sans une telle rétroaction, les praticiens ne peuvent correctement confronter leurs cognitions défaillantes et améliorer leur prédiction. L’ancrage Un dernier mécanisme pouvant biaiser le jugement est ce que certains appellent le principe de l’ancrage (Tversky et Kahneman, 1974; Tracey et Rounds, 1999). Il réfère au mécanisme par lequel le point de vue initial du clinicien teinte fortement son interprétation des informations ultérieurement obtenues. Par exemple, avoir des échos de l’attitude d’un délinquant avant même de le rencontrer réoriente significativement l’interprétation de l’issue d’un entretien avec lui. Les cliniciens ont parfois tendance à se faire rapidement une opinion de leur client et sont enclins à garder cette opinion, même en présence d’éléments d’information discordants (Meehl, 1960). Ces biais cognitifs, suggèrent certains, pourraient être atténués par l’expérience clinique et le contact avec la clientèle, ou par l’acquisition d’une vision plus globale du délinquant. La prochaine section traite des travaux de recherche sur l’expérience clinique et la compréhension holistique en pratique clinique. L’expérience, la formation et la prédiction clinique On prend communément pour acquis que le praticien, une fois ses études universitaires terminées, se trouvera un emploi dans un milieu d’intervention et c’est dans ce milieu qu’il pourra parfaire ses compétences cliniques au contact de la clientèle. Les jeunes criminologues, travailleurs sociaux, psychologues ou psychoéducateurs apprendront avec le temps et au contact de collègues plus expérimentés à saisir les dynamiques des délinquants et à parfaire leur jugement clinique. Or, le jugement clinique n’est pas comme un muscle qui a tendance à se raffermir lorsqu’il est sollicité. En effet, contrairement à la croyance populaire (croyance profondément enracinée dans les milieux pratiques, il va sans dire), l’expérience clinique ne permet pas au praticien de s’améliorer au fil du temps (Goldberg, 1968). Plusieurs travaux ont spécifiquement examiné la question de la valeur du jugement clinique. Cette question est résumée clairement par Garb et Boyle (2003) dans un chapitre au titre provocateur: Understanding Why some Clinicians Use Pseudoscientific Methods: Findings from Research on Clinical Judgement. L’essentiel de leur recension des travaux sur cette question suggère Revue internationale de criminologie et de police technique et scientifique 2/06 157 qu’il est très difficile d’apprendre de l’expérience clinique. Dans les études où des cliniciens d’expérience sont comparés à de jeunes cliniciens dans leur compétence pour établir un diagnostic, se prononcer sur une intervention adéquate ou faire une prédiction, les deux groupes obtiennent des performances similaires. Plusieurs travaux en sont arrivés aux mêmes conclusions en comparant des cliniciens d’expérience avec des étudiants du deuxième cycle. Les seules exceptions étaient celles où les étudiants en étaient au tout début de leur formation. En somme, la synthèse de Garb et Boyle (2003) indique que la formation de base semble importante afin de poser un diagnostic ou de se prononcer sur le comportement futur, mais que la pratique clinique ne permet pas de l’améliorer substantiellement. De fait, certains travaux ont même permis d’observer une détérioration de la qualité du jugement clinique avec les années de pratique. Les raisons pour lesquelles le jugement clinique n’a pas tendance à se bonifier avec le temps ou l’expérience sont nombreuses. Parmi elles, on trouve différents biais (citons le biais de confirmation, lequel consiste à aborder un client en quête d’éléments d’information visant la confirmation d’hypothèses préalables) et les erreurs de pensée. Le manque de rétroaction de même qu’une rétroaction inadéquate et parfois même fausse peuvent aussi expliquer que les cliniciens apprennent difficilement de leurs erreurs passées (Garb, 1998; Garb et Boyle, 2003). Les résultats sur l’expérience clinique sont en relation étroite avec la difficulté qu’éprouvent les praticiens à trouver les principaux problèmes de leurs clients avec précision et à faire une prédiction. Les idées préconçues, les biais personnels, l’utilisation d’heuristiques cliniques et les défaillances de la mémoire sont autant d’obstacles qui nuisent à la formation d’une prédiction efficace. De plus, les cliniciens bénéficient rarement d’une rétroaction précise et systématique concernant les décisions prises par le passé, ce qui a pour effet de cristalliser ces schèmes de pensée. Les approches idiographiques et nomothétiques de la prédiction À la lumière de tels résultats, certains ont évoqué que si l’homme était constamment battu par la règle de prédiction sur des décisions simples, il pouvait utiliser toute sa faculté d’analyse et montrer sa supériorité dans le cas de tâches plus complexes. La question relative à la qualité de la prédiction a aussi été abordée sous l’angle des perspectives idiographiques et nomothétiques (Garb, 1998). Les tenants d’une vision idiographique soutiennent que pour se prononcer efficacement sur le comportement futur d’un individu, il est souhaitable de connaître en profondeur ce qui fait de lui une personne unique. En fait, bien connaître cette personne permettra de se prononcer adéquatement sur son comportement futur. Cette approche plus holistique de la pratique clinique, comme la décrit Ruscio (2003), réfère donc à une vision selon laquelle le jugement clinique permet la prise en compte d’une plus grande variété d’informations pertinentes et une intégration plus sophistiquée et nuancée de celles-ci (Ruscio, 2003). À l’opposé, les tenants d’une approche nomothétique de la prédiction invoquent que la connaissance de 158 2/06 Revue internationale de criminologie et de police technique et scientifique certains éléments clefs, généralement issus de travaux empiriques, permet de prédire efficacement. Les travaux qui comparent les prédictions découlant des visions idiographique et nomothétique favorisent clairement cette dernière (Garb, 1998; Mossman, 1994; Gardner, Lidz, Mulvey et Shaw, 1996). En somme, lorsque le temps est venu de poser un diagnostic, de se prononcer sur le traitement le plus adéquat ou de faire une prédiction, il est préférable de se fier à un petit nombre de critères fiables que de tenter de saisir toute l’idiosyncrasie du client. La prédiction actuarielle et l’ajustement clinique Plusieurs arguments suggèrent une plus grande finesse du jugement clinique par rapport à la prédiction actuarielle. Parmi les mythes les plus tenaces entourant le lien entre la prédiction clinique et la prédiction actuarielle on retrouve ce que certains appellent l’ajustement clinique. L’ajustement clinique se base sur le fait que l’être humain a une grande capacité à détecter les événements dits rares. On réfère ici aux éléments en apparence importants qui ne sont pas pris en compte par l’instrument actuariel. En fait, le cerveau humain est un instrument beaucoup plus puissant que n’importe quel autre pour détecter les éléments discordants, rares ou inusités ou pour détecter les patterns (Friedman et Kandel, 1999; Webb, 1999). En 2003, à la réputée New York Academy of Sciences, avait lieu une discussion sur la prédiction actuarielle et la gestion du risque chez les délinquants sexuels. La réunion plénière mettait en scène quatre ténors dans le domaine de la délinquance violente et sexuelle, soit Neil Malamuth, Howard Barbaree, Vernon Quinsey et Raymond Knight. Bien que les quatre proposassent différentes visions et avenues afin d’améliorer la prédiction, tous s’entendaient sur une chose: l’ajustement clinique, soit la modification de la prédiction issue d’un instrument actuariel, n’est pas souhaitable. L’exemple désormais classique relativement à l’ajustement clinique, le Broken leg case, est issu des travaux de Meehl (1954). Sachant qu’un professeur d’université va tous les vendredis au cinéma depuis plusieurs années, est-il souhaitable de changer une prédiction sachant que ce dernier vient tout juste de se casser une jambe et porte un plâtre qui l’empêche de prendre place au cinéma? Comme le souligne Meehl, un événement improbable en est un qui ne se produit presque jamais; cependant, quelque chose d’improbable se produit presque tous les jours. Lorsque les praticiens se voient confier des grilles dans lesquelles on les autorise à ajuster la prédiction, ils ont tendance à voir beaucoup plus de «jambes cassées» qu’il n’y en a réellement (Dawes et collab., 1989; Bishop et Trout, 2002). La tendance à déroger de la règle de prédiction est intimement liée à notre disposition à avoir confiance en notre faculté de raisonnement et d’abstraction. Cette tendance à nous fier à notre intuition plutôt qu’à des stratégies simples mais éprouvées est attribuable à deux particularités du travail clinique, soit la trop grande confiance accordée à nos jugements de même que la trop grande confiance en la fidélité de nos facultés de raisonnement (Bishop et Trout, 2002). En règle générale, le recours au jugement du clinicien pour ajuster la prédiction en fonction d’informations nouvelles n’ajoute rien à la précision des résultats Revue internationale de criminologie et de police technique et scientifique 2/06 159 actuariels, si ce n’est qu’il contribue à diminuer la valeur des instruments en question (Harris et Rice, 1997). Bref, plusieurs caractéristiques particulières de la prédiction clinique expliquent sa moins grande précision. Différents mécanismes psychologiques interfèrent avec une évaluation précise et systématique des différents facteurs de risque utiles à la formation d’une prédiction juste. Toutes ces lacunes ont d’ailleurs amené le développement puis le perfectionnement d’une panoplie d’instruments visant à mesurer le risque et à prédire la récidive. Conclusion Certains, comme Quinsey et ses collègues (1998), suggèrent de délaisser complètement l’évaluation clinique traditionnelle pour des raisons pratiques. D’autres évoquent cette même possibilité pour des raisons de nature éthique (Dawes, 2002). Devrait-on préconiser la prédiction clinique alors que les preuves empiriques indiquent clairement qu’elle ne fonctionne pas bien? Pour Meehl (1986), «faire une prédiction sur l’avenir d’un étudiant universitaire, un criminel ou un patient dépressif à l’aide de méthodes inefficaces plutôt qu’efficaces, tout en facturant 10 fois la somme d’argent nécessaire pour faire une prédiction, semble d’une éthique douteuse». Le simple fait que le clinicien ait le sentiment d’être aussi efficace que l’instrument actuariel et qu’il trouve déshumanisante l’approche actuarielle n’a que peu de valeur en comparaison avec les enjeux éthiques qu’implique une telle décision (Ruscio, 2003). Pour Dawes (2002), le praticien aspirant à une pratique congruente et éthique doit utiliser les règles de prédiction et les techniques actuarielles lorsqu’elles sont disponibles dans son domaine d’intervention. D’autres arguments de nature éthique plaident en faveur de l’introduction de techniques actuarielles. La pratique auprès de clientèles correctionnelles a cette particularité d’être potentiellement perméable aux influences sociales et politiques des décisions. Selon Schneider, Ervin et Snyder-Joy (1996), lorsque des décisions délicates sont prises, comme celles impliquant les délinquants, il est possible que certains fassent des choix les protégeant de la critique populaire. En effet, dans le doute avec certaines clientèles, on préfère opter pour une évaluation plus sévère, un plus grand degré de supervision, des coûts plus élevés, donc une efficience moindre. Il en est ainsi des décisions prises dans des cas fortement médiatisés. Plusieurs hésitent à faire des recommandations favorables à la suite d’un cas d’espèce médiatisé. De telles décisions, quoique compréhensibles, sont éthiquement douteuses, onéreuses, et peuvent en partie être évitées à l’aide d’instruments actuariels. Pour d’autres (Bishop, 2000), la leçon à tirer n’est pas le total remplacement du clinicien par des techniques mécaniques. Après tout, les modèles actuariels fonctionnent mieux principalement parce que les chercheurs et les cliniciens ont combiné leurs efforts et leurs expertises pour les créer. L’avenue à envisager est l’utilisation de techniques beaucoup moins coûteuses bénéficiant d’une plus grande fidélité. Les différentes limites des instruments actuariels permettent cependant de 160 2/06 Revue internationale de criminologie et de police technique et scientifique nuancer le propos concernant l’utilisation de l’entretien clinique traditionnel. Néanmoins, il est nécessaire de distinguer la question de la prédiction de celle de la décision. En effet, si l’instrument actuariel indique un risque élevé, il incombe au clinicien de faire les choix les plus adéquats en matière de mesures à préconiser. La maison de transition est-elle un choix judicieux pour un délinquant plutôt qu’un autre? Quels programmes semblent plus adaptés pour lui? Ces questions relèvent de la décision, et le clinicien se doit d’exercer son jugement avec professionnalisme. Pour Meehl (1954), «chaque heure passée à réfléchir et à discuter sur qui devrait bénéficier de traitements, comment le traiter et pour combien de temps, est directement soustraite à l’ensemble des heures disponibles à l’intervention proprement dite». Dans un contexte où les praticiens ne bénéficient que d’une plage horaire très circonscrite pour évaluer leurs clients et intervenir auprès d’eux, il semble important d’aménager ce précieux temps en fonction des forces et des faiblesses des cliniciens. Les résultats de nombreuses études démontrent très clairement que la prédiction clinique est moins performante, plus coûteuse et demande notablement plus de temps que la prédiction actuarielle. Même lorsqu’elle est équivalente à la méthode clinique, la méthode actuarielle doit être considérée comme plus avantageuse, puisqu’elle nécessite bien moins de temps (Grove et collab., 2000). Les effets sont d’autant plus bénéfiques que le praticien peut investir beaucoup plus d’énergie à intervenir auprès de son client (Dawes et collab., 1989), démarche qu’aucun instrument, si perfectionné soit-il, n’est arrivé à faire (Garb, 1994). Bien qu’elle soit comme une chaude couverture pour le sentiment de compétence du clinicien, la prédiction clinique demeure coûteuse et peu efficace. Compte tenu de la performance relative de la prédiction clinique et du temps qu’exige cette démarche, demander au clinicien d’y allouer une partie importante de ses énergies est une mauvaise utilisation de son temps et de sa compétence, en plus d’être éthiquement douteux (Meehl, 1954). Bibliographie Andrews. D.A. (1982). The Level of Supervision Inventory (LSI): The first follow-up. Toronto, ON, Ministère des Services correctionnels de l’Ontario. Andrews, D.A., & Bonta, J. (1995). The Level of Service Inventory-Revised, Toronto, Multi-Health Systems. Andrews, D.A., & Bonta, J., (2003). The psychology of criminal conduct, Cincinnati, Anderson. Bishop, M.A. (2000). In praise of epistemic irresponsibility: How lazy and ignorant can you be? Synthese, 122, 179-208. Bishop, M.A., & Trout, J.D. (2002). 50 years of successful predictive modeling should be enough: Lessons for philosophy of science. Philosophy of Science, 69, S197–S208. Bonta, J. (1989). Aboriginal offenders: Institutional response, risk, and needs, Revue canadienne de criminologie, 31, 49-61. Bonta, J. (1996). Risk-needs assessment and treatment, dans A. T. Harland (éd.), Choosing correctional options that work (p. 18-32), Thousand Oaks, Californie. Bonta, J. (2000). Offender assessment: General issues and considerations. Forum on Corrections, 12, 14-18. Bonta, J. (2000). Offender rehabilitation: from research to practice. Conférence présentée à l’Association of Paroling Authorities International, Ottawa, Canada. Revue internationale de criminologie et de police technique et scientifique 2/06 161 Bonta, J., & Motiuk, L. (1992). Inmate classification. Journal of Criminal Justice, 20, 343-353. Bonta, J., Harman, W.G., Hann, R.G. & Cormier, R.B. (1996). The prediction of recidivism among federally sentenced offenders: A re-validation of the SIR scale, Revue canadienne de criminologie, 38, 61-79. Bonta, J., Motiuk, L., & Ker, K. (1985). The Level of Service Inventory (LSI) among incarcerated offenders. Report #1. Toronto: Ministry of Correctional Services (Ontario). Burgess, E. (1928). “Factors Determining Success or Failure on Parole.” In The Workings of the Indeterminate-Sentence Law and the Parole System in Illinois. Edité par A. Bruce, A. Harno, E. Burgess et J. Landesco. Springfield, IL: State Board of Parole. Carré, R., Dégremont, J.F., Gross, M., Pierrel, J.M., & Sabah, G. (1991). Langage humain et machine, Presses du CNRS. Chapman, L.J. (1967). Illusory correlation in observational report. Journal of Verbal Learning and Verbal Behavior, 6, 151-155. Côté, G. (2001). De la dangerosité à l’évaluation du risque, Psychologie Québec, Mai. Coulson, G., Ilacqua, G., Nutbrown, V., Giulekas, D. & Cudjoe, F. (1996). Predictive utility of the LSI for incarcerated female offenders», Criminal Justice and Behavior, 23, 427-439. Cumberland, A.K., & Boyle, G.J. (1997). Psychometric prediction of recidivism: Utility of the Risk Needs Inventory. Australian and New Zealand Journal of Criminology, 30, 72-86. Dawes, R.M., (2002). The ethics of using or not using statistical prediction rules in psychological practice and related consulting activities. Philosophy of Science, 69, S178–S184. Dawes, R.M., Faust, D., & Meehl. P.E. (1989). Clinical and actuarial judgment. Science, 243, 1668-1674. Faust, D., Hart K., & Guilmette, TJ. (1988). Pediatric malingering: the capacity of children to fake believable deficits on neuropsychological testing. Journal of Consulting and Clinical Psychology, 56, 578-582. Fischhoff, B., Slovic, P. & Lichtenstein, S. (1977). Knowing with certainty: The appropriateness of extreme confidence. Journal of Experimental Psychology, 3, 552-564. Friedman, M. & Kandel, A. (1999). Introduction to Pattern Recognition, statistical, structural, neural and fuzzy logic approaches, World Scientific, Signapore. Galton, F., (1889). Natural Inheritance, New Mexico, Genetics Heritage Press. Garb, H.N. (1994). Toward a second generation of statistical prediction rules in psychodiagnosis and personality assessment. Computers in Human Behavior, 10, 377-394. Garb, H.N. (1998). Studying the clinician: Judgment research and psychological assessment. Washington, DC: American Psychological Association. Garb, H.N., & Boyle, P.A. (2003). Understanding why some clinicians use pseudoscientific methods: Findings from research on clinical judgement. In S.O. Lilienfeld, S.J. Lynn, & J.M. Lohr (éd..), Science and pseudoscience in clinical psychology (pp.17-38). New York: Guilford Press Gardner, W., Lidz, C. W., Mulvey, E. P., & Shaw, E. C. (1996). Clinical versus actuarial predictions of violence in patients with mental illnesses. Journal of Consulting and Clinical Psychology, 64, 602-609. Gardner, W., Lidz, C. W., Mulvey, E. P., & Shaw, E. C. (1996). Comparison of actuarial methods for identifying repetitively violent patients with mental illnesses. Law and Human Behavior, 20, 35-48 Goldberg, L.R. (1968). Simple models or simple processes? American Psychologist, 23, 483-496. Grove, W.M., & Lloyd, M. (Sous presse). Meehl’s contribution to clinical versus statistical prediction. Journal of Abnormal Psychology. Grove, W.M., Zald, D.H., Hallberg, A.M., Lebow, B., Snitz, E., & Nelson, C. (2000). Clinical versus mechanical prediction: A meta-analysis. Psychological Assessment, 12, 19-30. Hannah-Moffat, K. & Maurutto, P. (2003). Youth Risk/Need Assessment: An Overview of Issues and Practices, Canada, Department of Justice. Hanson, R.K. & S. Wallace-Capretta. (2000). Prédire la récidive chez les hommes violents envers leur partenaire, Ottawa, Ministère du Solliciteur général du Canada. Harris, G.T., & Rice, M.E. (1997). Risk appraisal and management of violent behavior. Psychiatric Services, 48, 1168-1176. 162 2/06 Revue internationale de criminologie et de police technique et scientifique Harris, G.T., Rice, M.E., & Quinsey, VL. (1993). Violent recidivism of mentally disabled offenders: The development of a statistical prediction instrument. Criminal Justice and Behaviour, 20,315-35. Hoffman, P.B. (1983). Screening for risk: A revised salient factor score (SFS81). Journal of Criminal Justice, 11, 539-547. Holsinger, A.M., Lowenkamp, C.T. & Latessa, E.J. (2004). Validating the LSI-R on a Sample of Jail Inmates, The Journal of Offender Monitoring, Winter/Spring, 8-9. Jennings, D., Amabile, T. & Ross, L. (1982). Informal covariation assessment: Data-based versus theory-based judgments. In D. Kahneman, P. Slovic and A. Tversky (éd..), Judgment Under Uncertainty: Heuristics and Biases. Cambridge: Cambridge University Press. Kirkpatrick, B.L. (1999). Exploratory research of female risk prediction and LSI-R. Corrections Compendium: The National Journal for Corrections. 24, 14-17. Kleinmuntz, B. (1990). Why we still use our heads instead of formulas: Toward an integrative approach, Psychological Bulletin, 107, 296-310. Lidz, C. W., Mulvey, E. P., & Gardner, W. (1993). The accuracy of predictions of violence to others. Journal of the American Medical Association, 269, 1007-1011. Lowenkamp, C.T., A.H. Holsinger, & E.J. Latessa (2001). Risk/Need Assessment, Offender Classification, and the Role of Childhood Abuse. Criminal Justice and Behavior, 28, 543563. Loza, W. & Dhaliwal, G.K. (2005). Predicting Violence Among Forensic-Correctional populations: The Past 2 Decades of Advancements and Future Endeavors, Journal of Interpersonal Violence, 20, 188-194. Loza, W. (2003). Predicting violent and non-violent recidivism of incarcerated male offenders. Aggression and Violent Behavior, 8, 175-203. Loza, W., & Simourd, D. J. (1994). Psychometric evaluation of the Level of Supervision Inventory (LSI) among male Canadian federal offenders. Criminal Justice & Behavior, 21, 468-480 Meehl, P.E. (1954). Clinical Versus Statistical Prediction. University of Minnesota Press, Minneapolis, MN, USA. Meehl, P.E. (1960). The cognitive activity of the clinician. American Psychologist, 15, 19-27. Meehl, P.E. (1986). Causes and effects of my disturbing little book. Journal of Personality Assessment, 50, 370-375. Metz, C.E. (1978). Basic principles of ROC analysis. Seminars in Nuclear Medicine, 8, 283-298. Millaud, F. (1999) Maladie mentale et violence: revue de littérature, In Jean Proulx, Maurice Cusson et Marc Ouimet, Les violences criminelles, (pp. 267-288), Presses de l’Université de Laval. Mills, J.F. (2005). Advances in the Assessment and Prediction of Interpersonal Violence, Journal of Interpersonal Violence, 20, 236-241 Monahan, J., & Steadman, H.J. (1994) (Eds.). Violence and mental disorder: Developments in risk assessment. Chicago: University of Chicago Press Mossman D. (1994). Assessing predictions of violence: being accurate about accuracy. Journal of Consulting and Clinical Psychology, 62, 783-792. Nisbett, R.E. & Ross, L., (1980). Human inference: Strategies and shortcomings of social judgment, Englewood Cliffs, NJ: Prentice-Hall. Pellerin, B., St-Yves, M. & Guay, J.P. (2003). La théorie de l’abusé-abuseur en délinquance sexuelle: qui dit vrai?, Revue Canadienne de Criminologie, 45, p.81-98. Quinsey, V.L., Harris, G.T., Rice, M.E. & Cormier, C.A. (1998). Violent offenders: Appraising and managing risk. Washington: American Psychological Association. Raynor, P., Kynch, J., Roberts, C. & Merrington, S. (2000). Risk and Need Assessment in Probation Services: an Evaluation, Home Office Research Study 211, London: Home Office Rettinger, J.L. (1998). A Recidivism Follow-up Study Investigating Risk and Need Within a Sample of Provincially Sentenced Women, Thèse de doctorat, Université Carleton, Ottawa. Rice, M.E. (1997). Violent offender research and implications for the criminal justice system. American Psychologist, 52, 414-423. Ruscio, J. (1998). The perils of post-hockery. Skeptical Inquirer, 22, 44-48. Revue internationale de criminologie et de police technique et scientifique 2/06 163 Ruscio, J. (2003). Holistic judgment in clinical practice: Utility or futility? Scientific Review of Mental Health Practice, 2, 38-48. Schneider, A., L. Ervin, & Z. Snyder-Joy. (1996). Further Exploration of the Flight from Discretion: The Role of Risk/Need Instruments in Probation Supervision Decisions, Journal of Criminal Justice, 24, 109-121. Simourd, D.J. & Malcolm, P.B. (1998). Reliability and validity of the Level of Service Inventory-Revised among federally incarcerated sex offenders. Journal of Interpersonal Violence, 13, 261-74. Tracey, T.J. & Rounds, J. (1999). Inference and Attribution Errors in Test Interpretation. In R. K. Goodyear & J. W. Lichtenberg, (éd.), Test interpretation: Integrating science and practice, Boston: Allyn & Bacon. Tversky, A., & Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185, 1124-1130. Webb, A. (1999). Statistical pattern recognition, Oxford University Press Inc., New York. Worling, J.R. (1995) Adolescent sex offenders against females: Differences based on the age of their victims. International Journal of Offender Therapy and Comparative Criminology, 39, 276-293. Zweig, M.H., & Campbell, G. (1993). Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine. Clinical Chemistry, 39, 561-577. 164 2/06 Revue internationale de criminologie et de police technique et scientifique