Les différentes stratégies de quantification

Transcription

Les différentes stratégies de quantification
Les différentes stratégies de quantification :
Ce chapitre présente les 2 principales stratégies de quantification relative utilisée
classiquement : la méthode des droites standards et celle des ∆∆Ct. Les modèles
mathématiques à la base des méthodes sont détaillés. Une comparaison des 2 méthodes sur un
exemple simple et leurs avantages et inconvénients respectifs sont présentés.
Plus précisément, nous illustrons des exemples de biais introduits par la méthode des ∆∆Ct si
celle-ci est mal utilisée.
Consultez la page WEB : http://www.gene-quantification.info/ voir Relative quantification
1°/ Introduction
Vous pouvez vous référer au Technical Note LC10/2000 de Roche.
La PCR quantitative en temps réel s’appuie sur des mesures faites pendant la phase dite
exponentielle de la PCR.
Les principes de la quantification par PCR en temps réel s’appuient sur deux concepts de
base différents :
- la quantification absolue : en s’appuyant sur des dilutions standards de concentration
connue, la concentration absolue du gène cible est déterminée : ce type de quantification est
utilisé pour déterminer le nombre absolu de particules infectieuses (virus, bactéries) dans des
échantillons biologiques.
On y distingue une quantification absolue faite avec et sans standards externes.
- la quantification relative ou comparative : la concentration du gène cible est exprimée par
rapport à un gène référence (obtenu à partir du même échantillon biologique) : pas besoin de
standards de concentration connue. Cette méthode est recommandée pour les expressions de
gènes et pour le dosage de gène.
On y distingue une quantification relative s’appuyant sur des courbes standards de
calibration (méthode des droites standards) et l’autre s’appuyant sur les efficacités
respectives des gènes référence et cible et les Cp obtenus pour les échantillons et le
calibrateur, sans courbe de calibration (méthode des ∆∆Ct).
2°/ La quantification absolue :
La concentration de la cible est exprimée en valeur absolue déterminée à partir du standard.
Consultez la page WEB : http://www.gene-quantification.info/ voir Absolute quantification
A l’aide d’un standard externe mais sans contrôle interne :
Vous pouvez vous référer au Technical Note n° LC11/2000 de Roche.
Le standard externe permet de créer une courbe standard à partir duquel est calculée la
concentration en molécules cibles des échantillons. L’efficacité PCR doit être la même sur le
standard ou sur les échantillons.
A l’aide d’un standard externe mais avec contrôle interne :
Vous pouvez vous référer au Technical note n° LC12/2000 de Roche.
Le principe est identique à la méthode ci-dessus avec en plus un ARN synthétique, ajouté
après l’extraction de l’échantillon pour contrôler d’éventuels effets inhibiteurs de la PCR et
donc éventuelle détection de faux négatifs.
Les séquences de la cible sur ce contrôle interne et dans l’échantillon biologique leur permet
d’être co-amplifiés avec le même couple d’amorces. Cependant, la détection simultanée et la
différenciation du contrôle interne et de l’échantillon sont possibles à l’aide de sondes
d’hybridation différentes.
3°/ La quantification relative
Vous pouvez vous référer au Technical Note LC13/2001 de Roche.
Consultez surtout la page WEB : http://www.gene-quantification.info/ voir Relative
quantification
La quantification relative fait intervenir un gène de ménage (Housekeeping gene HKG) qui va
servir de normalisateur : ce gène est en effet considéré comme stable dans le modèle présenté,
il ne subira pas de changement d’expression en fonction des conditions analysées. Ce gène de
contrôle va permettre de compenser d’éventuels biais de PCR provenant de :
- variations dans la quantité et la qualité des échantillons
- rendement d’extraction différent entre échantillons
- variations dans les erreurs de pipetage
- variations d’efficacité de RT
La méthode des droites standard (quantification relative avec des standards externes) :
Cette méthode nécessite l’établissement d’une droite standard par gène. Cette droite étalon va
servir à quantifier les concentrations inconnues d’échantillons biologiques à partir
d’échantillons standards (produit de PCR cloné ou non), passés en même temps que les
échantillons inconnus.
On va contrôler l’efficacité PCR de chaque couple, déterminer une gamme de mesure pour
chaque couple permettant de quantifier tous les échantillons.
Concept général :
Pour chaque échantillon, on va donc déterminer la concentration en gène cible (Ncible) et la
concentration en gène de ménage (ou référence : Nréf) en s’appuyant sur les droites standards
de chaque gène (Si, bien sur, les efficacités PCR des gènes cible et de ménage sont
différentes).
On va normaliser la mesure du gène cible par celle du gène référence (Ncible / Nréference)
pour chacun des échantillons.
Le logiciel Data Analysis effectue automatiquement le calcul des concentrations de la cible et
du gène référence. Le calcul du rapport cible/référence doit être fait manuellement ou en
utilisant une feuille de calcul de type Excel.
Les critères de préparation d’une courbe standard sont :
- au moins 4 points pour créer la droite couvrant la gamme de concentration attendue de la
cible.
- pour des concentrations intermédiaires et fortes (Cp inférieur à 25 cycles pour la plupart des
couples PCR), une seule détermination est nécessaire pour chaque dilution ;
- pour quantifier de faibles concentrations (Cp a partir de 25-30 cycles pour la plupart des
couples), on doit dupliquer voire tripliquer les points de mesure pour améliorer la robustesse
du calcul.
L’efficacité PCR du couple choisi doit être la même pour le standard et pour les échantillons.
Si le standard est un plasmide et les échantillons des cDNA, il peut être utile d’effectuer le
calcul de l’efficacité sur une dilution de cDNA afin de le vérifier.
La méthode des ∆∆Ct (quantification relative normalisée par un calibrateur) :
L’expression de gènes cibles et référence est fonction de l’efficacité de la PCR et du Cp
enregistré. Avec cette technique, pas besoin d’une droite standard pour chaque run, il n’est
pas nécessaire de connaître la valeur absolue du nombre de copies des échantillons. Les
résultats sont exprimés par un rapport cible/référence de chaque échantillon normalisé par le
rapport cible/référence d’un échantillon appelé calibrateur. Dans cette méthode, la précision
du résultat dépend des efficacités de PCR des gènes cibles et référence.
Ces 2 efficacités doivent être les plus proches l’une de l’autre. Si elles ne le sont pas :
- Sans correction de cette différence d’efficacité, le résultat obtenu sera approximatif
(introduction de biais de calcul)
-
la différence d’efficacité peut être corrigée pour obtenir un résultat précis.
La PCR est décrite par l’équation suivante : N = N0 x Ecp
N : nombre de molécules au cycle Cp
N0 : nombre initial de molécules
E : efficacité de la PCR
Cp : cycle seuil
Principes :
- dans une première étape, le rapport cible/référence pour chaque échantillon et
l’échantillon calibrateur est calculé. Les biais liés aux différences de qualités et
quantités des échantillons sont éliminés (le biais est le même pour la cible et pour la
référence et donc s’annule).
- Dans une seconde étape, le rapport obtenu pour chaque échantillon est divisé par le
rapport obtenu pour l’échantillon calibrateur. Les biais liés aux différences de
sensibilité dans la détection du gène cible et référence vont alors s’annuler. La
normalisation par l’échantillon calibrateur permet de comparer les échantillons entre
eux.
On pose : T (Target) pour gène Cible et R pour gène Référence.
Au Cp respectif des 2 gènes, on a :
NT = NT0 X ETCPT
NR = NR0 X ERCPR
On pose : S (Sample) pour échantillon et C pour Calibrateur (échantillon calibrateur) .
La méthode des ∆∆Ct va calculer le rapport normalisé suivant :
Rapport = NT(S)/NR(S) / NT(C)/NR(C) = K(S) / K(C) = 1
En effet, au Ct, le nombre de copies détectées des gènes cibles T et référence R ne sont pas
tout a fait les mêmes. Par contre, le rapport K = NT / NR est constant et identique pour le
calibrateur et l’échantillon S.
Autrement dit, sur la ligne de seuil placée sur les profils obtenus pour l’échantillon calibrateur
et pour l’échantillon, le nombre de molécules de gènes cibles (ou de gène référence) est
identique pour les 2 (même si bien sur les valeurs des Ct sont très différentes).
Donc :
K(S) / K(C) = 1
Equation 1
A/ Si l’efficacité des 2 PCR est identique (E = ET = ER),
Le facteur R représente le facteur d’expression du gène cible dans l’échantillon par rapport à
son expression dans le calibrateur.
Rapport = E ∆∆Ct = E CpT(C)-CpT(S)+CpR(S)-CpR(C) = E (CpT(C)- CpR(C)) – (CpT(S)-CpR(S)) =E∆CtC-∆CtS
Avec ∆Ct = CpT-CpR
La formule initiale de calcul était : 2∆∆Ct
Elle suppose que les 2 PCR cible et référence ont toutes deux une efficacité maximale de
100%.
Il est important, pour valider cette méthode de quantification, de prouver que les efficacités de
PCR de la cible et de la référence sont très proches.
Un moyen de le prouver est de calculer les ∆Ct en fonction des dilutions successives d’un
même échantillon.
La valeur absolue de la pente ∆Ct = f (dilution de l’échantillon) doit être inférieure à 0,1. Une
fois validée, on peut utiliser la méthode des ∆∆Ct pour la quantification relative sans avoir à
créer de courbes standards en parallèle.
B/ Si les 2 efficacités sont différentes, le modèle mathématique peut s’écrire :
C’est une autre forme d’expression de l’équation 1 ci-dessus.
C’est la formule utilisée par le logiciel RealQuant de Roche lorsqu’on tient compte des
différences d’efficacités entre les 2 PCR.
Un logiciel appelé REST© (Relative Expression Software Tool) va permettre de comparer
non pas un échantillon contrôle vs un échantillon inconnu mais un groupe d’échantillons
contrôles vs un groupe d’échantillons inconnus.
4°/ Comparaison des 2 méthodes de quantification relative
Pour illustrer l’utilisation des 2 méthodes de quantification relative (droite standard et ∆∆Ct)
et montrer que ces 2 méthodes aboutissent aux mêmes résultats, on va prendre l’exemple
suivant :
On va quantifier l’expression du gène c-myc humain dans différents tissus (foie, poumon,
cerveau, rein). Le gène référence choisi est la GAPDH. Le tissu calibrateur choisi
arbitrairement est le cerveau.
1ère méthode : les droites standards
On a établi à l’aide de dilutions successives d’un AN standard, une courbe standard pour
chacun des 2 gènes. A partir de ces 2 courbes, on a pu établir le nombre de copies de chacun
des 2 gènes dans chaque échantillon. On l’a exprimé en « facteur de dilution du RNA
standard » :
Tissu
Cerveau
Rein
Foie
Poumon
c-myc
0,039
0,41
0,7
0,93
GAPDH
0,54
1,02
0,28
0,81
c-myc / GAPDH
0,07
0,40
2,49
1,15
c-myc / au cerveau
1
5,5
34,2
15,7
2ème méthode : les ∆∆Ct
On a posé l’hypothèse que chacune des 2 PCR est efficace à 100%. On note les Cp obtenus
pour chaque gène dans chaque échantillon.
∆∆Ct ∆Ct = CpT-CpR
∆∆Ct = ∆CtC - ∆CtS
Tissu = C
Cerveau
Rein
Foie
Poumon
c-myc = T
30,39
27,03
26,25
25,83
GAPDH = R
23,63
22,66
24,6
23,01
∆Ct
6,86
4,37
1,65
2,81
∆∆Ct
0
2,5
5,21
4,05
c-myc / au cerveau
1
5,6
37
16,5
Toutes les variables comme les variations dans les quantités d’échantillon par exemple, sont
éliminées par la normalisation sur une référence par rapport à un échantillon calibrateur.
On obtient des résultats identiques pour les 2 méthodes.
Quelle méthode choisir ?
L’utilisation de telle ou telle méthode est dépendante en fait de la précision exigée par vos
mesures. Elle dépend de votre capacité à reproduire vos mesures, également des efficacités de
vos PCR, des concentrations en molécules cibles de vos échantillons inconnus.
La quantification par le standard externe est la méthode la plus simple à mettre en œuvre. Une
fois les primers optimisés, la droite standard doit être reproduite à chaque run de PCR. Elle
peut également être sauvegardée et importée pour des runs ultérieurs. Mais dans ce cas, la
précision des calculs peut en pâtir. En effet :
- Dans le premier cas (droite refaite chaque fois), puisque standard et échantillons inconnus
varient de la même façon, il est possible de détecter des variations d’un facteur 2.
- Dans le second cas (importation d’une droite standard externe), des variations d’un facteur 5
sont détectables mais plus difficilement d’un facteur 2.
Par contre, placer des échantillons standards sur chaque carrousel entraîne un surcoût et
occupe des places prises sur les échantillons.
Des droites standard de différents runs vont nécessairement présenter des variations. Ces
variations dans la reproductibilité des expériences vont dépendre de certains facteurs :
- Un nombre de point élevé dans la droite permettra d’augmenter cette reproductibilité.
- Le mode de conservation du standard doit être optimisé afin d’éviter tout biais liés a son
éventuelle dégradation.
La quantification par les ∆∆Ct va permettre de gagner de la place (de l’argent également) en
ne plaçant que des échantillons sur le carrousel. Si vous travaillez avec des efficacités de PCR
cible et référence éloignées, vous pouvez introduire des biais importants (cf ci-dessous). Dans
ce cas, il est possible d’utiliser le logiciel RealQuant de Roche qui va tenir compte de ces
différences pour quantifier précisément. Son utilisation exige en contre partie un formatage
précis des expériences (cf le paragraphe RealQuant dans la seconde partie). Sinon il est
possible d’utiliser la formule décrite ci-dessus (cf 3°/ B) sous Excell par exemple.
5°/ Les biais introduits par la PCR – attention au ∆∆Ct
Dans de très nombreux cas, une réaction PCR ne permet pas d’amplifier avec une efficacité
de PCR de 100% (par exemple, le pourcentage de GC contenu dans le produit amplifié
intervient largement).
La formule classique de la PCR (N = N0 X Effn) permet de calculer le nombre de molécules
théoriquement obtenues pour des PCR présentant des efficacités différentes.
Imaginons que l’on parte d’une seule molécule cible à l’origine, on peut calculer – en fonction
d’efficacité différente – le nombre de molécules-filles générées au bout de n cycles en
calculant (1+E)n :
Cycles
10
15
20
25
30
Eff 100%
1024
32768
1048575
33,5 106
1,07 109
Eff 90%
Facteur écart
613
1,7
15181
2
375899
2,8
9,3 106
3,6
230 106
4,6
Eff 80%
Facteur écart
357
2,9
6746
4,8
127500
8,2
2,4 106
14
45 106
23
On observe que plus la différence d’efficacités entre les 2 PCR est grande, plus le facteur
d’écart entre l’efficacité maximale et chacune des efficacités (et donc l’erreur introduite) sera
grand.
Afin de bien comprendre les biais que peut introduire la méthode des ∆∆Ct si elle n’est pas
contrôlée, nous avons choisi l’exemple suivant :
Un calibrateur et 6 échantillons présentent des rapports variables « gènes cibles sur gène
référence ».
Le tableau 1 ci-dessous résume les nombres de copies de chaque gène.
Calibrateur
Ech A
Ech B
Ech C
Ech D
Ech E
Ech F
Ech G
Ech H
Ech I
Ech J
Ech K
Gène ref
15000
15000
15000
15000
15000
15000
15000
15000
15000
15000
15000
15000
Gène cible
5000
250000
1000
100
25000
500000
50
5000000
5
300000
1000000
10000000
Qte de cibles dans l’échantillon / calibrateur
50 fois plus
5 fois moins
50 fois moins
5 fois plus
100 fois plus
100 fois moins
1000 fois plus
1000 fois moins
60 fois plus
200 fois plus
2000 fois plus
On pose l’hypothèse que l’efficacité PCR du gène référence (R) est de 100% et celle du gène
cible (T) n’est que de 80% (C pour Calibrateur et S pour Sample)
En utilisant la formule : ET CpT(C)-CpT(S) X ER CpR(S)-CpR(C)
∆Ct cible = CpT(C)-CpT(S)
∆Ct ref = CpR(S)-CpR(C)
On pose ET = 1,8 et ER = 2 avec les résultats de Cp suivants :
Calib
Ech A
Ech B
Ech C
Ech D
Ech E
Ech F
Ech G
Ech H
Ech I
Ech J
Ech K
Ref
19,35
19,35
19,35
19,35
19,35
19,35
19,35
19,35
19,35
19,35
19,35
19,35
Target
24,68
18
27,42
31,34
21,95
16,8
32,52
12,9
36,4
17,7
15,65
11,75
∆Ct cible
∆Ct ref
6,68
-2,74
-6,66
2,73
7,88
-7,84
11,78
-11,72
6,98
9,03
12,93
0
0
0
0
0
0
0
0
0
0
0
∆Ct
50,72
0,19
0,019
4,97
102,69
0,009
1016
0,001
60,5
201
1998
Fact
X50
/5,26
/52,63
X4,97
X102
/111
X1016
/981
X60,5
X200
X2000
Fact : facteur d’expression du gène cible dans l’échantillon par rapport au calibrateur.
Avec ce calcul précis, on obtient les « vrais » facteurs d’expression des échantillons. On
retrouve les valeurs théoriques énoncées dans le tableau 1.
Si on est moins rigoureux et que l’on se contente d’utiliser la même valeur d’efficacité (100%
par exemple) pour les gènes cibles (= target) et référence :
On pose ET = 2 et ER = 2 avec les mêmes valeurs de Cp, on obtient des résultats de facteurs
d’expression différents :
∆Ct cible
Calib
Ech A
Ech B
Ech C
Ech D
Ech E
Ech F
Ech G
Ech H
Ech I
Ech J
Ech K
6,68
-2,74
-6,66
2,73
7,88
-7,84
11,78
-11,72
6,98
9,03
12,93
∆Ct ref
∆Ct
Fact
0
0
0
0
0
0
0
0
0
0
0
102
0,15
0,01
6,63
235
0,004
3517
0,0003
126
522
7804
X102
/6,66
/100
X6,63
X235
/250
X3517
/3333
X126
X522
X7800
Si on compare les résultats obtenus avec les 2 méthodes (efficacités de 80% -correcte- et de
100% -moins précise- pour le gène cible ou target).
Ainsi
vraie valeur
Ech A
Ech B
Ech C
Ech D
Ech E
Ech F
Ech G
Ech H
Ech I
Ech J
Ech K
50
5
50
5
100
100
1000
1000
60
200
2000
ET = 1,8
ET = 2
X50,72
/5,26
/52,63
X4,97
X102
/111
X1016
/981
X60,5
X202
X1998
X102
/6,66
/100
X6,63
X235
/250
X3517
/3333
X126
X522
X7804
Facteur d’écart
2
1,2
2
1,3
2,3
2,5
3,5
3,3
2
2,5
3,5
Si on compare les résultats obtenus entre les 2 méthodes, on observe :
- Des écarts significatifs entre les deux avec des facteurs d’écart entre 1,2 et 3,5 fois
- Des facteurs d’écart qui augmentent avec les valeurs relatives du gène cible dans
l’échantillon par rapport au calibrateur. Ainsi on obtient un facteur d’écart de 1,2-1,3 pour une
quantité de molécules cibles 5 fois plus – et moins – abondante dans les échantillons B et D ;
on obtinet un facteur d’écart de 3,5-3,3 pour une quantité de molécules cibles 1000 fois plus –
et moins – abondante dans les échantillons G et H.
En ne tenant pas compte de l’efficacité réelle de la cible, on estime mal la quantité relative du
nombre de gènes cibles dans chaque échantillon. On perd également toute possibilité
d’information entre chaque échantillon : les échantillons G et K sont différents d’un facteur 2
en tenant compte de l’efficacité correcte et d’un facteur 2,2 avec une estimation de cette
efficacité.
Si les efficacités des gènes cibles et référence sont différentes, on peut effectuer une
quantification relative exacte (avec correction de la différence d’efficacité) a l’aide du logiciel
RealQuant de Roche.
6°/ La reproductibilité des mesures
La reproductibilité des résultats est essentielle afin de valider les résultats obtenus.
Elle dépend des efficacités de PCR, des concentrations de vos échantillons, de la qualité des
échantillons biologiques (présence d’inhibiteurs, défauts dans leur conservation) et bien sur de
la qualité des pipetages. Elle est par contre indépendante du format de fluorescence utilisé.
L’efficacité de PCR est un facteur important pour la reproductibilité des résultats. Plus
l’efficacité PCR est grande, plus la PCR sera robuste, en particulier lorsque l’on travaille avec
des échantillons présentant un faible nombre de copies.
La reproductibilité est directement dépendante de la concentration en cibles initiales. Plus
cette dernière est forte, meilleure sera la reproductibilité. On observe ce phénomène en
dupliquant les points de mesure et en calculant les cœfficients de variation obtenus sur ces
mesures pour des dilutions successives.
Exemple:
sonde d’hybridation, PCR de 131bp TNF alpha humain
6-4 réplicats par points de concentration
Concentration initiale
4
10 copies
3
10 copies
2
10 copies
1
10 copies
CV, Ct
CV, conc.
0,3%
5,1%
0,4%
8,8%
0,7%
16,5%
1,7%
41%
Le CV obtenu pour 10 copies est le plus élevé : a ces concentrations, les distributions
statistiques jouent un grand rôle: ainsi, quand on pipette 10 copies par capillaires en moyenne,
le nombre exact de copies dans le tube va de 7-13 (distribution de Poisson). A cause de ces
distributions statistiques, on doit dupliquer ou tripliquer les points de mesure afin de pouvoir
différencier 10 copies de 20 (plus que pour différencier 1000 de 2000).
De manière générale, pensez a dupliquer vos points de mesure lorsque les Cp obtenus pour
ces mesures se situent vers 25-30 cycles, en particulier si votre efficacité PCR est moyenne.
Le mode de conservation des échantillons biologiques (en particulier l’échantillon standard
utilisé régulièrement) est un élément important de la reproductibilité. Mal conservés
(mauvaise température de conservation, trop faible concentration de conservation, cycles de
congélation-décongélation successifs), l’échantillon va se dégrader au cours du temps et cela
va introduire des biais entre expérience.
La qualité des pipetages est bien sur une condition nécessaire à la reproductibilité des
mesures. En particulier pour les plus faibles volumes (10 ul), un biais de pipetage même faible
peut entraîner des erreurs. Assurez vous des « niveaux » de chaque capillaire avant de lancer
votre carrousel.
En pratique, a quoi peut on s’attendre ? Nous avons récoltés des données d’une utilisatrice du
département d’endocrinologie (Jocelyne Leclerc) qui refait une gamme standard a chaque
carrousel. Elle utilise une aliquote de son ADN standard, qu’elle dilue extemporanément de 2
en 2, avec 5 points de gamme (nommés ici de 1 a 5). Les résultats obtenus (sur 27
expériences) sont les suivants :
Gamme :
Moyenne Cp
Ecart type
1
26,77
0,15
2
27,92
0,18
3
28,98
0,23
4
30,14
0,27
5
31,39
0,47
Ces résultats ne sont pas extrapolables a toutes les expériences bien sur, mais ils donnent un
ordre d’idée de l’écart type que l’on peut obtenir en travaillant dans des conditions
« robustes » (standard concentré, aliquoté) dans des valeurs de Cp comprises entre 26 et 31.
Si pour ces valeurs de Cp de cet ordre, l’écart type des valeurs de Cp est très élevé, on peut se
poser des questions quant a la capacité a reproduire des points expérimentaux avec ce couple.
7°/ La précision des mesures :
Un écart d’un facteur 2 entre 2 échantillons en utilisant une PCR 100% efficace représente un
écart d’un cycle entre leur Ct respectif. De tels écarts ont été décrits sur le Light Cycler pour
des applications de dosages de gènes par exemple.
Mesurer un écart réduit (donc être le plus précis possible) suppose :
- D’utiliser des PCR efficaces, robustes et donc les plus reproductibles possibles (fragments
courts par exemple).
- De travailler dans des gammes de concentration en cibles élevés (Ct faibles, inférieurs à 25
cycles) afin d’être le plus reproductible possible (voir 6°/)
- De dupliquer les points de mesure afin d’être plus précis. En particulier dans des gammes de
concentrations en cibles plus faibles (Ct supérieur à 30 cycles).
- D’être capable de reproduire sur plusieurs jours les mêmes expériences.
C’est à ces conditions que vos mesures seront les plus précises.