traitement
Transcription
traitement
TRADUIRE LA RECHERCHE EN ACTION Evaluations aléatoires: les risques sur la validité Luc Behaghel LEA-INRA PSE J-PAL Europe povertyactionlab.org Plan de la semaine 1. 2. 3. 4. 5. 6. 7. 8. Pourquoi évaluer ? Qu’est-ce qu’une évaluation ? Comment mesurer l’impact? Pourquoi tirer au sort? Comment tirer au sort? Comment déterminer la taille de l'échantillon? Collecte des données et pièges Les risques sur la validité L'histoire d'une évaluation de A à Z Après 3 jours… où en sommes-nous? Principe de l’évaluation contrôlée: Comparer du comparable… … grâce à l’affectation aléatoire (tirage au sort)… … sur des échantillons suffisants. (Argument: si un groupe test et un groupe témoin ont été constitués aléatoirement et s’ils sont suffisamment grands, on peut comparer leurs résultats et attribuer la différence au traitement reçu par le groupe test.) povertyactionlab.org Est-ce suffisant? • Vous avez persuadé un décideur d’expérimenter une politique avec affectation aléatoire et de mesurer les résultats par une enquête sur des échantillons suffisants. • L’écart de résultats entre groupe test et groupe témoin mesure-t-il toujours l’effet de la politique qu’on souhaite évaluer? povertyactionlab.org Deux types de problèmes • I: Problèmes de validité interne: = Dans le cadre même de l’évaluation, l’écart de résultat test – témoin ne mesure pas l’impact de la politique. • II: Problèmes de validité externe: = On mesure bien l’impact de la politique dans le cadre spécifique de l’évaluation, mais on ne peut pas généraliser: l’impact de la politique serait différent “dans la vraie vie”. povertyactionlab.org Plan du cours • Effets d'externalité • Conformité partielle et biais de sélection • Intention de Traitement et Traitement sur le Traité • Choix et Résultats • Validité externe • Efficacité économique 6 Exemple : Le déparasitage • Les études précédentes tiraient au sort les élèves qui seraient déparasités dans les écoles – Supposons que le déparasitage empêche la transmission de la maladie ; quels problèmes estce que cela pose pour l’évaluation ? – Supposons que les externalités soient locales ; comment allons-nous mesurer l’impact total ? 7 Externalities Within School Without Externalities School A Treated? Outcome Pupil 1 Yes no worms Pupil 2 No worms Pupil 3 Yes no worms Pupil 4 No worms Pupil 5 Yes no worms Pupil 6 No worms Total in Treatment with Worms Total in Control with Worms Treament Effect With Externalities Suppose, because prevalance is lower, some children are not re-infected with worms School A Pupil 1 Pupil 2 Pupil 3 Pupil 4 Pupil 5 Pupil 6 Treated? Yes No Yes No Yes No Outcome no worms no worms no worms worms no worms worms Total in Treatment with Worms Total in Control with Worms Treatment Effect Comment mesurer l’impact lorsqu'il y a diffusion? • Prévoir l’unité de tirage au sort de telle sorte qu’elle englobe les diffusions • Si nous nous attendons à des externalités qui sont toutes à l’intérieur de l’école : – En tirant au sort au niveau de l’école, il est possible d’estimer l’effet global 9 Mesure de l’impact total en présence de diffusions Ecoles du Groupe TEST Ecoles du groupe TEMOIN EFFET DU PROGRAMME % d’enfants souffrant d’une infection modérée à forte 27% 52% -25%*** % d’enfants malades la semaine précédant l’enquête 41% 45% -4%** % d’enfants souffrant d’anémie 2% 4% -2%* GROUPE 10 Les externalités intra-l’école • Et si nous souhaitons mesurer les externalités ? – Etant donné que les filles de plus de 12 ans ne pouvaient pas être traitées, nous pouvons comparer les filles de plus de 12 ans dans les écoles Test aux filles de plus de 12 ans dans les écoles Témoin. • D’une manière plus générale, nous avons besoin de variations aléatoires dans l’exposition à des personnes traitées (de même que pour l’effet du traitement il faut des variations aléatoires dans l’exposition au traitement) 11 Plan • Effets d'externalité • Conformité partielle et biais de sélection • Intention de Traitement et Traitement sur le Traité • Choix des Résultats • Validité Externe • Efficacité économique 12 Protocole d’une évaluation aléatoire Pas incluse dans l’évaluation Population Ciblée Echantillon de l’évaluation Assignation Aléatoire Groupe Test Participants Groupe Témoin NonParticipants Défections contamination 13 Biais de Sélection • Un biais de sélection peut se produire si l’affectation du programme est influencée par d’autres facteurs que l’assignation aléatoire – Même si l’affectation du programme était prévue de façon aléatoire, il se peut que l’affectation réelle ne le soit pas. – Pourquoi ? 14 Biais de sélection • Il est possible que les personnes affectées au groupe Témoin tentent de passer dans le groupe Test – les parents peuvent essayer de déplacer leurs enfants d’une école du groupe Témoin vers une école du groupe Test • Par ailleurs, il est possible que des personnes affectées au groupe Test ne reçoivent pas le programme – certains élèves affectés au groupe Test dans les écoles Test n’ont pas reçu les médicaments 15 Biais de sélection • Certains élèves des écoles du groupe Test – 78% des élèves affectés au groupe devant recevoir le médicament ont reçu au moins une partie du programme • Certains élèves des écoles du groupe Témoin ont été traités – 5% ont reçu le médicament en dehors du programme • Qu’allez-vous faire ? Biais de Sélection • Partez de l’assignation de départ: – Si un enfant se retrouve dans une école du groupe Test alors qu’au départ, il était affecté au groupe Témoin, vous devez l’affecter au groupe Témoin lorsque vous calculez l’effet du traitement. • Nous obtenons une estimation de l’Intention de Traitement (ITT). 17 Plan • Diffusions • Conformité partielle et biais de sélection • Intention de Traitement et Traitement sur le Traité • Choix de résultats • Validité externe • Efficacité économique 18 Intention de Traitement (ITT) • Que mesure “l’Intention de Traitement” ? “Que s’est-il passé pour l'enfant moyen scolarisé dans une école du groupe Test?” • Est-ce le chiffre que nous devons rechercher ? • Rappelez-vous : dans le cas de l’étude du déparasitage, nombre d’enfants dans les écoles Test n’ont pas été traités et certains enfants des écoles Témoin l’ont été ITT: Un autre exemple Design initial L'échantillon Autres villages ITT: Un autre exemple Design Initial T T T T T T T T T T T T T T T T T T T T T Groupe Test L'échantillon Autres villages ITT: Un autre exemple T T T T T T T T T T T T T T T T T T T T T Groupe Test Traitement L'échantillon autres villages Comment mesurer l'impact ? • Vous ne pouvez pas comparer les villages aux villages • Pourquoi ? – Parce que les villages qui n’auraient pas dû être traités mais qui ont été traités n’ont pas été sélectionnés de manière aléatoire – Dans certains villages, il y a des leaders particulièrement motivés qui se font entendre. Ils risquent d’avoir toujours de meilleurs résultats Comment mesurer l’impact ? • Vous ne pouvez pas comparer les villages T aux villages • Pourquoi ? – Parce que les villages qui auraient dû être traités mais qui N’ONT PAS été traités n’ont pas été sélectionnés de manière aléatoire. – Il existe des villages dont les leaders sont particulièrement négligents. Ils risquent d’avoir toujours les plus mauvais résultats Comment mesurer l’impact ? • Respectez l’assignation initiale ! • Comparez les 20 villages Test initiaux aux 20 villages Témoins initiaux • C’est à dire : [ T + T ] à [ + ] • On obtient le facteur d’estimation ITT : “Intention de Traitement” Dans quels cas l’ITT est utile ? • Peut concerner plusieurs programmes • Par exemple, nous ne sommes peut-être pas intéressés par l’effet médical du déparasitage mais que se passerait-il dans le cadre d’un réel programme de déparasitage ? • Si les élèves sont souvent absents et par conséquent ne reçoivent pas les médicaments vermifuges, l’estimation de l’Intention de Traitement peut en réalité être plus pertinente Intention School 1 to Treat ? Treated? Pupil 1 yes yes Pupil 2 yes yes Pupil 3 yes yes Pupil 4 yes no Pupil 5 yes yes Pupil 6 yes no Pupil 7 yes no Pupil 8 yes yes Pupil 9 yes yes Pupil 10 yes no Avg. Change among Treated A= School 2 Pupil 1 no no Pupil 2 no no Pupil 3 no yes Pupil 4 no no Pupil 5 no no Pupil 6 no yes Pupil 7 no no Pupil 8 no no Pupil 9 no no Pupil 10 no no Avg. Change among Not-Treated B= Observed Change in weight 4 4 4 0 4 2 0 6 6 0 2 1 3 0 0 3 0 0 0 0 A NE PAS FAIRE ! School 1: Avg. Change among Treated School 2: Avg. Change among not-treated (A) (B) A-B 27 De l’ITT à l’effet du Traitement sur les Traités (TOT) • S’il y a des fuites d’un groupe vers un autre, la différence en termes d’impact entre Groupe Test et Groupe Témoin est plus petite… • Mais la différence en termes de probabilité d’être traité est également plus petite • Formellement, on “instrumente” la probabilité de traitement par l’assignation de départ 28 28 Traitement sur les Traités (TOT) • L’effet du Traitement sur les Traités: – On suppose que les enfants qui ont reçu le traitement ont eu un gain de poids A, qu’ils aient été scolarisés dans une école du groupe Test ou du Groupe Témoin – On suppose que les enfants qui n’ont pas reçu le traitement ont eu un gain de poids B, une fois encore, quelle que soit l’école – Nous voulons connaître A-B, soit la différence entre les enfants traités et les enfants non traités 29 Traitement sur le Traité (TOT) • Alors … • Y(T)=A*Prob[traité|T]+B(1-Prob[traité|T]) • Y(C)=A*Prob[traité|C]+B(1-Prob[traité|C]) A-B= (Y(T)-Y(C)) / (Prob[traité|T] – Prob[traité|C]) l’effet du "Traitement sur les Traités" 30 TOT estimator Intention School 1 to Treat ? Pupil 1 yes Pupil 2 yes Pupil 3 yes Pupil 4 yes Pupil 5 yes Pupil 6 yes Pupil 7 yes Pupil 8 yes Pupil 9 yes Pupil 10 yes School 2 Pupil 1 Pupil 2 Pupil 3 Pupil 4 Pupil 5 Pupil 6 Pupil 7 Pupil 8 Pupil 9 Pupil 10 no no no no no no no no no no Treated? yes yes yes no yes no no yes yes no Avg. Change Y(T)= no no yes no no yes no no no no Avg. Change Y(C) = Observed Change in weight 4 4 4 0 4 2 0 6 6 0 2 1 3 0 0 3 0 0 0 0 A = Gain if Treated B = Gain if not Treated ToT Estimator: A-B A-B = Y(T)-Y(C) Prob(Treated|T)-Prob(Treated|C) Y(T) Y(C) Prob(Treated|T) Prob(Treated|C) Y(T)-Y(C) Prob(Treated|T)-Prob(Treated|C) A-B 31 TOT • C’est la technique généralement utilisée lorsque la conformité n’est pas parfaite, par exemple dans un design par encouragement. • Mais, pour le calculer, nous devons observer le nombre de personnes traitées dans les deux groupes : Prob[traité|Test] – Prob[traité|Témoin] • Cela n’est pas toujours facile... 32 TOT : attention! • Ne PAS utiliser la technique TOT lorsque votre « encouragement » a un effet indirect sur le résultat et pas uniquement sur le fait que cela entraîne les gens à demander le traitement. • Pourquoi ? 33 Plan • Effets d'externalité • Conformité partielle et biais de sélection • Intention de Traitement et Traitement sur le Traité • Choix de résultats • Validité externe • Efficacité économique 34 Résultats multiples • Plus vous étudiez d'effets, plus vous avez de chances d’en trouver au moins un qui est significativement affecté par le programme. Rapportez les résultats de tous les effets mesurés, y compris les résultats nuls 35 Résultats par groupe • Utile si le programme a des effets hétérogènes • Deux risques cependant: – « Data mining » – Un autre « choc » que le programme peut affecter les personnes d’un même groupe Rapportez les résultats pour tous les groupes Variables de contrôle • Que contrôler ? – Si l'échantillonnage aléatoire est stratifié: rajouter les effets fixes par strates – Autres variables de contrôle Rapporter les résultats originaux et les résultats des régressions ajustées Plan • Effets d'externalité • Conformité partielle et biais de sélection • Intention de Traitement et Traitement sur le Traité • Choix de résultats • Validité externe • Efficacité économique 38 Validité Externe • La validité interne est une condition nécessaire pour que les résultats d’une expérience aléatoire puissent être généralisés … • ... mais cette condition n’est pas suffisante 39 Réponses comportementales aux évaluations • L’évaluation elle-même (et non le programme) peut modifier les comportements: – lorsque c’est le groupe Test qui modifie son comportement, on parle de l’effet Hawthorne – lorsque c’est le groupe Témoin qui modifie son comportement, on parle de l’effet John Henry 40 Réponses comportementales aux évaluations • Par ailleurs, un programme peut générer des réponses comportementales qui ne se produiraient pas si le programme devait être généralisé 41 Comment généraliser? • Cela va dépendre de trois facteurs : – Mise en œuvre : le programme peut-il être dupliqué à grande échelle (à l’échelle nationale) ? – Echantillon de l’étude : est-il représentatif ? – Sensibilité des résultats : est-ce qu’un programme similaire, mais légèrement différent, pourrait avoir le même impact ? 42 Plan • Effets d'externalité • Conformité partielle et biais de sélection • Intention de Traitement et Traitement sur le Traité • Choix de résultats • Validité externe • Efficacité économique 43 Un outil de comparaison : l’efficacité économique • Pourriez-vous obtenir le même impact, mais à moindre coût ? • Il est important que les résultats des études d’impact soient exprimés en termes d’efficacité économique de telle sorte qu’il soit possible de comparer les programmes entre eux – Programmes d’éducation: coût par année de scolarisation supplémentaire – Programmes de santé: coût par année de vie supplémentaire 44 Analyse coût-bénéfice: exemple • On a essayé de nombreuses approches pour augmenter le nombre d’inscriptions à l’école : quelle est l’approche la plus efficace d’un point de vue économique ? • Très clairement, l’approche qui consiste à faire baisser le coût de l’école est efficace pour augmenter l’assiduité scolaire • Les encouragements à apprendre permettent d’améliorer les résultats des élèves • La santé peut aussi avoir un impact important sur l’éducation 45