BIO 2101 Module 3
Transcription
BIO 2101 Module 3
1 Module 3 La régulation de l'expression des gènes chez les procaryotes Où trouver l'information complémentaire? ☛ MCB-10 et 11, GVII-9, 10, et 11. Les différents types cellulaires qui caractérisent un organisme possèdent tous le même génome, mais se distinguent par la spécificité de leur composition en protéines. Qu'est-ce qui détermine le type et la quantité de ces protéines dans une cellule particulière? Ou, chez un organisme unicellulaire, qu'est-ce qui détermine sa capacité de répondre aux modifications de son environnement? Dans ce chapitre, nous verrons comment la concentration de chaque protéine est contrôlée par la quantité de messagers correspondants transcrits, par son taux de traduction et par la stabilité tant du messager que de la protéine. Lorsque l'on considère les mécanismes de la régulation génique, une différence importante existe entre les organismes unicellulaires et multicellulaires. Chez les organismes unicellulaires, la régulation génique servira principalement à s'ajuster aux modifications de l'environnement, par exemple à la présence de nutriments et à l'optimisation de l'utilisation de la ressource. Chez les organismes pluricellulaires où l'on retrouve une complexité et une diversité de types cellulaires, l'emphase de la régulation génique sera principalement axée sur l'expression du programme génétique nécessaire au développement embryonnaire et à la différentiation cellulaire. ∴ Analyse génétique de l'opéron lactose Induction et répression des enzymes de l'opéron lactose L'analyse génétique de l'opéron lactose par François Jacob et Jacques Monod dans les années 1960 a permis d'émettre et de tester les hypothèses de base sur le contrôle de l'activité génique chez les bactéries. L'opéron est l'unité constituée d'un ensemble de gènes structuraux transcrits en un messager polycistronique ainsi que des régions régulatrices adjacentes qui influencent la transcription de ce messager. Dans le cas de l'opéron lactose, l'opéron inclut les régions POZYA (fig. 10.1 MCB, 10.3 GVII). L'opéron lactose (lac) est constitué de 3 gènes. Le gène Z code pour la β-galactosidase, une enzyme qui coupe le disaccharide lactose en glucose et en galactose. Le gène Y code pour la lactose perméase, une protéine transmembranaire qui permet de pomper le lactose à l'intérieur de la cellule. Enfin, le gène A code pour la thiogalactoside transacétylase, dont le rôle est encore obscur. Il est possible de tester aisément l'activité de la β−galactosidase, de même que celle de la lactose perméase. Le 5-bromo-4-chloro-3-indolyl-β-D-galactoside, ou X-gal pour les intimes, est un substrat chromogénique qui, lorsqu'hydrolysé par la β-galactosidase, donne un précipité insoluble bleu. Pour tester l'action de la perméase, on peut utiliser du lactose radioactif dans le bouillon de culture et déterminer son incorporation dans les bactéries. Les bactéries E. coli cultivées dans un milieu contenant du glucose ne produiront qu'une très faible quantité des enzymes de l'opéron lac. Si les bactéries sont transférées dans un milieu contenant du lactose, l'activité de la β-gal et de la perméase augmentera de 1000 fois en 20 minutes! Cette augmentation d'activité est due à l'augmentation de la quantité des protéines correspondantes. À l'inverse, si ces bactéries sont de nouveau transférées dans un milieu contenant du glucose, l'activité de la β-gal, de même que celle de la perméase, diminuera rapidement dans les cellules. Il en va de même pour la transacétylase, dont la quantité de protéine sera induite ou réprimée selon la présence ou l'absence de l'inducteur, ici le lactose. © Daniel P. Matton, 2002 2 La régulation des 3 gènes est donc coordonnée. [Même si c'est la présence ou l'absence du lactose qui régule l'opéron, en réalité, le vrai inducteur intracellulaire est l'allolactose, un produit mineur de l'activité de la β-gal sur le lactose]. Certaines molécules possédant une structure similaire au lactose peuvent être utilisées pour induire la synthèse des enzymes de l'opéron. Une molécule particulièrement intéressante est l'IPTG (isopropyl-β-D-thiogalactoside). L'IPTG diffuse librement à travers la cellule et n'est pas métabolisé par la β-galactosidase. Puisqu'il n'est pas métabolisé, sa concentration demeure élevée durant l'expérience. L'IPTG est ce qu'on appelle un inducteur gratuit. Mutagénèse et hypothèse sur la présence d'un répresseur, d'un site opérateur et d'un promoteur Les expériences de mutagénèse chimique ont permis de démontrer que, même en présence de glucose, ce qui normalement devrait réprimer l'expression de l'opéron lac, on pouvait obtenir des colonies bactériennes bleues en présence de X-gal. Il y avait donc expression constitutive des gènes de l'opéron lac. Par des expériences de recombinaison, la mutation avait été cartographiée dans la même région que les gènes de l'opéron lac. Jacob et Monod émirent donc l'hypothèse qu'il devait y avoir un répresseur (le produit du gène lacI) qui devait normalement se lier à un site de l'opéron lac et empêcher la transcription des gènes. Le modèle prédit donc qu'il doit y avoir un site normalement occupé par le répresseur en absence de lactose et ce site a été nommé "opérateur". Une mutation au site opérateur qui empêcherait la liaison du répresseur aurait donc le même effet qu'une mutation sur le répresseur qui diminuerait ou abolirait son affinité pour le site opérateur. Lors des expériences de mutagénèse, la majorité des mutants retrouvés étaient de type lac I, car le gène est plus gros que la région de l'opérateur. Donc, une mutagénèse chim- Mutagénèse chimique ique introduisant des mutations ponctuelles E. coli β-gal +++ aura plus de chances de frapper le gène lac I Milieu X-gal + glucose que le site opérateur (O). perméase +++ Mais comment distinguer entre les deux types de mutations puisque le résultat est le même, soit l'expression des gènes de l'opéron lactose? b) mutation O c a) mutation lac I I P O Z Y A Site opérateur normal I P Opérateur constitutif O Z Y A Site opérateur mutant Nous avons vu précédemment que les bactéries possédaient de l'information extrachro- Répresseur inactif Répresseur actif mosomique sous forme de plasmides. Ces ADN circulaires de petite taille comportent une origine de réplication qui leur permet de se multiplier à l'intérieur de la bactérie hôte. De façon à distinguer entre les mutations inactivant le répresseur (gène lac I) et celles affectant le site de l'opérateur (O), Jacob et Monod ont répété les expériences de mutagénèse, mais cette fois sur des bactéries possédant 2 copies de l'opéron lactose complet. Une copie portée par le chromosome bactérien et une copie portée par un plasmide inséré dans la bactérie. Le raisonnement derrière cette expérience était qu'il serait extrêmement improbable d'obtenir par mutagénèse, et ce dans une même bactérie, deux mutations qui affecteraient les 2 copies du gène lac I (le répresseur). Donc, seules les rares bactéries ayant une mutation dans le site opérateur pourraient être distinguées par la coloration bleue sur milieu X-gal. Utilisant cette approche, des mutants possédant un répresseur normal, mais exprimant la β-gal furent obtenus, ce qui démontra la présence du site opérateur. Ce type de mutation est appelé Oc pour opérateur constitutif. Une autre mutation révéla la présence d'un site supplémentaire, le site du promoteur. La plupart des mutations qui empêchent l'activité β-galactosidase se trouvent naturellement à l'intérieur même du gène de la β-gal. © Daniel P. Matton, 2002 3 Ce sont des mutations ponctuelles qui aboliront l'activité soit par l'introduction d'un codon stop, soit par le remplacement d'un acide aminé du site actif, soit par une importante modification structurale. Il existe une autre classe de mutations beaucoup plus rares pouvant affecter l'activité de la β-gal: celle affectant le site du promoteur. Dans ce type de mutation, peu importe s'il y a présence de lactose ou d'IPTG dans le milieu, il n'y aura pas d'induction des trois gènes de l'opéron lac. Ce type de mutation bloque l'accès à l'ARN polymérase et empêche donc la production de l'ARNm polycistronique de l'opéron lac. La régulation de l'opéron lac dépend de séquences d'ADN agissant en cis et de facteurs protéiques agissant en trans L'approche utilisant des bactéries possédant deux copies de l'opéron lac permit de comprendre comment interagissaient les différentes mutations et permit de distinguer deux types de séquences d'ADN: 1) des séquences d'ADN codant pour des produits agissant en trans et 2) des séquences cis non-converties en d'autres formes et n'agissant qu'au niveau de l'ADN lui-même. Toute séquence codant soit pour des protéines, soit des ARNr, ou des ARNt agit en trans car il s'agit d'un produit diffusible qui exerce son action ailleurs qu'à son lieu de synthèse. La notion de séquences cis implique que l'action n'est exercée qu'aux régions contiguës à cette séquence, donc physiquement liées à elle. De façon plus restreinte, ces expériences révélèrent le thème central et fondamental de la régulation génique, tant chez les procaryotes que chez les eucaryotes: la régulation de l'expression des gènes dépendra de l'interaction entre des séquences spécifiques d'ADN agissant en cis et des facteurs protéiques, dits facteurs transcriptionnels, qui agiront en trans. Les exemples suivants, les fig. 10.3, 10.4 MCB, ainsi que 10.7 à 10.9 GVII démontrent l’impact de différents types de mutation sur l’expression de l’opéron lactose. β-gal - IPTG + IPTG - - perméase - IPTG + IPTG - - R I+ P- O+ Z+ Y+ A+ - - I+ P- O+ Z+ Y+ A+ - - Avec IPTG Sans IPTG R R β-gal - IPTG + IPTG + I+ P+ Oc Z+ Y+ A+ + + + + I+ P+ perméase - IPTG + IPTG + Oc Z+ Y+ A+ + + + Avec IPTG Sans IPTG R β-gal + IPTG + P+ O+ Z+ Y+ A+ + + + + I- P+ perméase - IPTG + IPTG + + O+ Z+ Y+ A+ + + + Avec IPTG Sans IPTG R- Dans le cas d’une mutation affectant le site du promoteur, l’ARN pol est ici incapable de s’y lier, il n’y aura donc aucune transcription de l’opéron. Mutant Oc Dans le cas d’une mutation affectant le site de l’opérateur, le répresseur Lac est ici incapable de s’y lier, donc il y aura transcription constitutive de l’opéron. R - IPTG I- + Mutant P- R- Mutant IDans le cas d’une mutation affectant le domaine de liaison à l’ADN du répresseur Lac, il y aura transcription constitutive de l’opéron puisque le répresseur ne peut se lier à son site opérateur. © Daniel P. Matton, 2002 4 Voyons maintenant les interactions entre les différentes mutations dans une bactérie possédant deux copies de l’opéron lactose, soit une portée sur le chromosome bactérien et une sous forme de plasmide. Opérateur Oc et O+ Répresseur I- et I+ β-gal - IPTG + Chromosome bactérien I+ P+ + + I+ P+ - IPTG + O+ Z+ Y+ A+ - - I- P+ Sans IPTG I+ R P+ I+ - + R P+ O+ Z+ Y+ A+ - - P+ O+ Z+ Y+ A+ + + + Sans IPTG R Chromosome bactérien + Plasmide O+ Z+ Y+ A+ - - perméase - IPTG + IPTG + IPTG Chromosome bactérien R R Plasmide Oc Z+ Y+ A+ + + + β-gal perméase - IPTG + IPTG + IPTG R- Plasmide Oc Z+ Y+ A+ + + + I+ R Chromosome bactérien P+ O+ Z+ Y+ A+ + + + I- Avec IPTG P+ Plasmide O+ Z+ Y+ A+ + + + I+ Avec IPTG R R- R Oc est dominant sur O+ L’Opérateur agit en cis R Lac I+ est dominant sur ILac I agit en trans Le répresseur produit par le gène mutant Lac I- est capable de lier l’inducteur mais est incapable de se lier à l’ADN du site opérateur. La mutation affecte son domaine d’interaction avec l’ADN. Répresseur Is et I+ β-gal - IPTG R Chromosome bactérien Is P+ - I+ - - R Plasmide O+ Z+ Y+ A+ - - perméase - IPTG + IPTG + IPTG P+ O+ Z+ Y+ A+ - - Sans IPTG R R R Chromosome bactérien Is P+ I+ Avec IPTG R R Plasmide O+ Z+ Y+ A+ - - - Le répresseur produit par le gène mutant Lac Is est incapable de lier l’inducteur mais est capable de se lier à l’ADN du site opérateur. La mutation affecte son domaine d’interaction avec l’inducteur. L’inducteur est donc sans effet sur le répresseur Is P+ O+ Z+ Y+ A+ - - - Lac Is est dominant sur I+ Lac I agit en trans R © Daniel P. Matton, 2002 5 ∴ L'initiation de la transcription chez les bactéries Le modèle proposé par Jacob et Monod prédit que la croissance des bactéries en présence de lactose induit la production d'ARNm lac en déréprimant la transcription au promoteur lac. Nous avons vu dans les exemples précédents que l'état de base de l'opéron lac était sous une forme réprimée (associé à un répresseur: le produit du gène lac I). En présence d'un inducteur, comme le lactose, le répresseur ne peut plus se lier au site opérateur et laisse le champ libre à l'ARN polymérase pour se lier au site du promoteur et initier la transcription. L'opéron lactose est un exemple de contrôle négatif de la transcription. La transcription implique la synthèse d'un brin d'ARN identique (sauf pour le changement de T→U) à l'un des brins d'ADN, que l'on appelle le brin codant. L'ARN est produit à partir du brin complémentaire qui sert de matrice. La transcription débute lorsque l'ARN pol se lie à une région spéciale, le promoteur. L'unité transcriptionnelle débute au premier nucléotide incorporé dans l'ARN, le site d'initiation de la transcription, et s'arrête à un site de terminaison. Le site d'initiation de la transcription est numéroté +1. Par convention, ce qui se trouve en amont (en 5') du site +1, région qui inclut le promoteur, est numéroté de façon négative (par ex. la région -35). Fig. 9.2 GVII. Chez les eubactéries (comme E. coli) une seule ARN pol effectue la transcription des ARNm, ARNt et ARNr. σ. Voir aussi la fig. Cette ARN pol est constituée de 4 types de sous-unités. Sa composition globale est α2ββ'σ 9.9 GVII. Sous-unité alpha (α) bêta (β) bêta prime (β') sigma (σ)* Gène rpoA rpoB rpoC rpoD Masse (kDa) 40 155 160 32-90 Fonction possible assemblage de l'enzyme liaison des nucléotides liaison à la matrice liaison au promoteur * Il existe plusieurs facteurs σ qui détermineront la spécificité de la liaison aux séquences de divers promoteurs. Des ≈3000 à 7000 ARN pol présentes dans une cellule d'E. coli, la moitié sont activement impliquées dans la transcription de gènes. Les autres ARN polymérases balaient (scan) le chromosome bactérien jusqu'à ce qu'elles rencontrent un promoteur pour s'y fixer. La transcription est la première et généralement la plus importante étape dans la régulation de l'expression d'un gène. Deux questions fondamentales se posent alors: 1) Comment l'ARN polymérase reconnaît-elle un site promoteur? 2) Comment les protéines régulatrices interagissent-elles avec l'ARN pol pour activer ou réprimer l'expression? © Daniel P. Matton, 2002 6 La transcription peut être divisée en 4 étapes: La reconnaissance de la matrice d'ADN débute avec la liaison de l'ARN pol à l'ADN double-brin. Les brins d'ADN sont ensuite séparés de façon à rendre le brin matrice accessible pour la synthèse de l'ARN. Une "bulle de transcription" est donc créée par le désenroulement et la séparation locale des brins d'ADN. La séquence nécessaire à la liaison de l'ARN pol définit le site du promoteur chez les bactéries. L'initiation est la phase représentée par le début de la synthèse de l'ARN. L'ARN pol demeure au site du promoteur lors de la synthèse des ≈9 premiers liens phosphodiester. À cette étape, il y a souvent arrêt et reprise de synthèse, relâchant de courts ARN <9 nt. La phase d'initiation se termine lorsque la polymérase réussit à synthétiser un ARN de plus de 9 nt. L'élongation est la phase durant laquelle l'ARN pol "glisse" sur l'ADN et synthétise activement l'ARN complémentaire à partir du brin matrice d'ADN. Au fur et à mesure que l'enzyme avance, elle sépare les brins d'ADN, ce qui expose une nouvelle région simple brin. La synthèse de l'ARN sur cet ADNss forme un hybride ARN-ADN transitoire dans la région déroulée. Derrière la polymérase, la double hélice d'ADN se reforme. L'ARN émerge du complexe de la polymérase sous une forme simple brin. La synthèse de l'ARN s'effectue à un taux d'environ 40 nt/sec à 37°C chez E. coli. La terminaison implique la reconnaissance d'un point au delà duquel Fig. 9.8 GVII aucun ribonucléotide ne doit être ajouté. La cessation de la synthèse de l'ARN dépend de la reconnaissance d'un site de terminaison. Durant ces différentes phases, l'ARN polymérase couvre un espace plus ou moins grand sur l'ADN. Durant la phase d'initiation, l'holoenzyme (= l'enzyme complet = ARN pol de structure α2ββ' + le facteur σ) couvre la région comprise entre ≈ -55 et +20. Seul l'holoenzyme peut initier la transcription. Puis, le facteur σ est relâché lorsque l'ARN atteint ≈9 nt, laissant l'ARN pol de structure α2ββ' poursuivre l'élongation. Au tout début de la phase d'élongation, l'ARN pol couvre la région de ≈ -35 à +20. Lorsque l'ARN pol est en phase d'élongation, elle ne couvre plus qu'une région ≈ 30 à 40 pb. Fig. 9.11 GVII. © Daniel P. Matton, 2002 7 Les sites de liaison de protéines dans l'opéron lac Comment peut-on déterminer les sites d'interactions protéine-ADN? La technique dite d'empreinte à la DNase I (DNase I footprinting, fig. 10.6 MCB) et l'analyse de mutants ont permis de cerner les régions d'ADN interagissant avec des protéines régulatrices. Prenons l'exemple de l'opéron lactose. Nous avons vu précédemment que plusieurs types de mutants avaient été générés par mutagénèse chimique. Ces séquences mutantes auront plus ou moins d'affinité pour les facteurs protéiques s'y liant, dépendant du type de mutation. En utilisant l'ARN pol purifiée et un fragment d'ADN comprenant l'opéron lac ainsi que ses régions régulatrices, il est possible de déterminer la région couverte par la polymérase. En utilisant l'un ou l'autre des 2 brins marqués radioactivement avec du 32P, il est même possible de déterminer quels nucléotides sur chacun des brins interagissent ou sont protégés par l'ARN pol ou par tout autre protéine s'y liant. Ainsi, l'ARN pol couvre la région allant de ≈-55 à +20. Le répresseur lac (le produit du gène lac I) couvre la région allant de ≈-5 à +25, incluant donc la région de l'opérateur. Dans le contexte d'un génome entier, par exemple les 4 x 106 pb du génome circulaire d'E. coli, comment l'ARN pol trouve-t-elle un site promoteur? L'analyse des séquences de plusieurs centaines d'opérons chez E. coli a permis d'identifier des séquences conservées, i.e. des séquences qui se retrouvent dans la majorité des promoteurs et qui sont le site d'interactions ADN-protéine. La séquence consensus représente la séquence idéale et elle est déterminée par l'alignement de multiples séquences conservées interagissant avec une même protéine, par exemple avec l'ARN polymérase (fig. 10.11 MCB). Deux régions particulièrement importantes ont ainsi été déterminées par la comparaison des séquences protégées par l'ARN polymérase. La région -35 et la région -10 (ou boîte de Pribnow). Pour les promoteurs forts reconnus par le facteurs σ70, la séquence consensus à -35 est T82T84G78A65C54A45T40-50, alors que celle à -10 est T80A95T45A60A50T96. La distance entre ces deux séquences est de plus bien conservée entre les différents promoteurs. Elle est généralement de 16 à 18 pb dans 90% des cas étudiés. Les promoteurs peuvent être classés comme étant forts ou faibles, selon le taux de transcription initié à partir d'eux. La force du promoteur dépend principalement de l'affinité de l'ARN polymérase pour les séquences régulatrices. Généralement, plus les séquences régulatrices seront identiques au consensus, plus le promoteur sera fort et plus le taux de transcription du gène sera élevé (fig. 10.11 MCB). © Daniel P. Matton, 2002 8 Différents facteurs σ reconnaissent différentes séquences consensus C'est le facteur σ qui reconnaît les séquences consensus et agit ainsi comme un facteur d'initiation. La substitution de différents facteurs σ dans l'holoenzyme permet de reconnaître des promoteurs différents possédant des séquences consensus différentes. Ceci permet entre autres choses d'initier la transcription à partir d'une seule polymérase dont la spécificité de la liaison à l'ADN est contrôlée par le facteur σ associé. Le tableau suivant indique les principaux facteurs sigma chez E. coli et leur utilisation. Facteur σ70 σ32 σE Utilisation générale choc thermique flagelle σ54 carence en azote -35 TTGACA CCCTTGAA CTAAA -24 CTGGNA Séparation 16-18 pb 13-15 pb 15 pb 6 pb -10 TATAAT CCCGATNT GCCGATAA -12 TTGCA Les opérons transcrits par l'ARN polymérase associée aux facteurs σ70, σ32 ou σ28 sont régulés par des répresseurs et des activateurs qui se lient à des régions très proches de celles où l'ARN pol se lie. Dans la majorité de ces cas, les répresseurs se lient dans la région [-50, +30], alors que les activateurs se lient à la région [-65, -30]. Par contre, les opérons transcrits par une ARN pol associée au facteur σ54 sont uniquement régulés par des activateurs qui se lient généralement à la région [-160, -80], qui est à l'extérieur de la zone de contact avec l'ARN pol. Les activateurs dépendants de σ54 peuvent activer la transcription même lorsque leur site de liaison se trouve éloigné à plus de 1 kb en amont du site d'initiation de la transcription. De tels sites de liaison sont appelés des "enhancers" ou séquences activatrices. Comment la protéine activatrice peut-elle influencer à distance la transcription? Nous avons vu dans les cas précédents des activateurs ou des répresseurs se positionnant près ou chevauchant le site de liaison de l'ARN pol. Il était donc plausible de penser qu'il y avait contact direct entre les protéines. La flexibilité de la double hélice d'ADN nous permet d'envisager la présence de protéines distantes du site de liaison de l'ARN pol, mais qui, grâce au repliement de l'hélice d'ADN, permettent de rapprocher dans l'espace un activateur lointain et une polymérase (DNA looping). Fig. 10.19 et 10.20 MCB. La liaison du répresseur lac bloque l'initiation de la transcription La liaison du répresseur lac au site opérateur produit une empreinte allant de -5 à +25. Cette empreinte chevauche celle produite par l'ARN pol (entre -5 et +20) en absence du répresseur. On pourrait penser que le mode d'action du répresseur est tout simplement d'empêcher la liaison de l'ARN pol au promoteur. Fig. 10.9 MCB © Daniel P. Matton, 2002 9 En réalité, la présence du répresseur augmente l'affinité de l'ARN pol pour le promoteur! Ceci est dû à des interactions protéine-protéine entre le répresseur et la polymérase (coopérativité de liaison). Dans cette conformation, l'ARN pol, quoique liée à son site du promoteur, demeure sous une forme inactive, incapable d'initier la transcription. C'est ce qu'on appelle le complexe fermé. Sous l'effet de l'inducteur, le répresseur perdra de son affinité pour le site opérateur, se décrochera et permettra la formation d'un complexe ouvert qui initiera la transcription. Structure des répresseurs bactériens La majorité des répresseurs bactériens sont des polypeptides se liant à l'ADN sous la forme d'un homodimère (2 sous-unités identiques). Dans le cas du répresseur lac, chaque homodimère se lie à une moitié du site opérateur. Le répresseur lac interagit donc au site opérateur sous la forme d'un tétramère. L'analyse des séquences de plusieurs sites opérateurs révèle qu'ils sont souvent formés de 2 courtes séquences répétées inversées (inverted repeats). L'exemple suivant est celui de l'opérateur lac: -10 ° +1 +10 +20 +30 ° ° ° ° 1/2 Site 5'-ATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAA-3' 3'-TACAACACACCTTAACACTCGCCTATTGTTAAAGTGTGTCCTT-5' 1/2 Site 5'-TGTGTGGAATTGTGAGC-3' 5'-TGTGTGAAATTGTTATC-3' Une séquence répétée inversée, parfaite sauf pour 3 pb sur 17 pb au total. Pour plusieurs répresseurs bactériens, une hélice α de chacune des 2 sous- Interaction entre une hélice α d’un unités, l'hélice de reconnaissance, interagira directement avec un sillon répresseur et le sillon majeur de l’ADN. majeur du site opérateur (fig. 10.13 MCB). Les atomes des chaînes latérales de ces hélices α établiront des liaisons hydrogène avec des bases spécifiques de la double hélice d'ADN. La spécificité de l'interaction dépendra donc des acides aminés de l'hélice α et de la séquence d'ADN. Dans le cas du répresseur lac, ce dernier se liera à l'opérateur en absence de lactose. Le cas contraire se présente pour le répresseur de l'opéron trp (tryptophane). En présence d'une concentration suffisante de Trp dans la cellule, la liaison du Trp au répresseur modifiera sa structure 4° et provoquera un changement au niveau des hélices de reconnaissance qui pourront alors interagir avec la séquence de l'opérateur trp et inhiber la biosynthèse des enzymes nécessaires à la production de Trp (fig. 10.14 MCB). Nous sommes donc en présence d'un contrôle allostérique, où la liaison d'une petite molécule au répresseur induit un changement conformationnel qui modifie l'affinité de la protéine pour son site normal d'interaction. Il en va de même pour le répresseur de l'opéron lac qui lui, ne peut plus se lier au site opérateur lorsque l'inducteur est présent. Distinction entre contrôle positif et contrôle négatif Nous avons vu jusqu'à présent des exemples de contrôle négatif de la régulation de l'expression. Les gènes sous contrôle négatif sont exprimés, sauf s'ils sont inhibés sous l'effet d'un répresseur. À l'opposé, l'expression des gènes sous contrôle positif ne sera effective que sous l'effet d'un activateur. Au lieu de nuire à la transcription, la protéine activatrice sera essentielle à la transcription. La fig. 10.20 GVII schématise les différentes façons d'obtenir un contrôle positif ou négatif de la répression et de l'induction. La régulation de l'expression d'un gène sous contrôle négatif passera par l'utilisation d'un répresseur à l'origine actif (induction) ou inactif (répression). © Daniel P. Matton, 2002 10 Dans l'induction, le répresseur actif à l'origine, donc dans un état inhibant ou réprimant la transcription, sera rendu inactif sous l'effet d'un inducteur. Induction On dira aussi que le gène est déréprimé. C'est le cas classique de l'opéron lactose. Une autre façon d'obtenir un contrôle de type négatif sera d'avoir un répresseur à l'origine inactif qui, sous l'effet d'un corépresseur, devient actif et réprime la transcription. C'est le mode de répression utilisé, par exemple, par l'opéron tryptophane. Contrôle négatif Activateur actif Répresseur inactif Répresseur actif Activateur inactif Inducteur Réprimé Induit Inducteur Réprimé Induit Répresseur actif Répression La régulation de l'expression d'un gène sous contrôle positif passera par l'utilisation d'un activateur à l'origine inactif (induction) ou actif (répression). Dans l'induction, l'activateur inactif à l'origine, donc n'influençant pas encore la transcription, sera rendu actif suite à l'interaction avec l'inducteur. Sous l'effet de l'inducteur, il y aura donc activation de la transcription. Dans le mode impliquant la répression, l'activateur à l'origine actif, donc activant la transcription, sera rendu inactif sous l'effet d'un corépresseur. Contrôle positif Activateur inactif Répresseur inactif Activateur Corépresseur actif Corépresseur Induit Réprimé Induit Réprimé Fig. 10.20 GVII Un contrôle de la régulation tant positif que négatif pourra donc être obtenu en utilisant les interactions appropriées entre soit le répresseur ou l'activateur (la protéine activatrice), et une petite molécule, soit un inducteur, soit un corépresseur. L'induction de la transcription pourra donc passer par un contrôle de type négatif, lorsqu'on aura un répresseur libre, ou par un contrôle de type positif, lorsqu'on aura un activateur (inactif au départ) lié à un inducteur. La répression de la transcription pourra passer par l'activation d'un répresseur par un corépresseur (contrôle négatif) ou par l'inactivation d'un activateur par une petite molécule corépresseur. Le contrôle positif de l'opéron lac Le glucose est le sucre préférentiellement métabolisé par E. coli. Lorsqu'il entre dans la bactérie, il est directement utilisé, sans induction de nouvelles enzymes. Si, dans un milieu, on retrouve du glucose et du lactose, de l'arabinose ou même du dégueulose (les bactéries bouffent à peu près n'importe quoi!), la bactérie n'induira pas la synthèse des gènes de l'opéron lac, même si le lactose est présent et ce, tant que le glucose n'aura pas été entièrement métabolisé. Il semble donc qu'un produit du catabolisme du glucose, un catabolite, empêche la synthèse des ARNm correspondant à une variété d'enzymes métabolisant divers autres sucres, d'où l'origine de la répresFig. 10.16 MCB sion catabolique (catabolite repression). © Daniel P. Matton, 2002 11 En fait, il ne s'agit pas d'un contrôle négatif passant par un répresseur, mais plutôt d'un contrôle positif. Lorsque E. coli est carencé en glucose, elle produit un nucléotide inhabituel, l'AMP cyclique ou AMPc. L'AMPc se lie à une protéine appelée CAP pour catabolite activator protein. Cette protéine, lorsque liée à l'AMPc, se lie à la région d'ADN immédiatement en amont du site de liaison de l'ARN pol dans l'opéron lac. Le complexe AMPcCAP exercerait son activité en touchant directement les sous-unités a de l'ARN pol. Il y aurait un effet coopératif de liaison entre CAP et l'ARN pol (fig. 10.17 MCB). La présence du facteur CAP permettrait un recrutement plus efficace de l'ARN pol et augmenterait ainsi le taux de transcription. ∴ La terminaison de la transcription chez les bactéries Nous avons déjà vu que les unités transcriptionnelles chez les procaryotes pouvaient être organisées sous forme polycistronique. L'absence de sites de terminaison entre les cistrons permet ce type d'expression. Par contre, puisque les unités transcriptionnelles sont très rapprochées, le contrôle indépendant des unités adjacentes n'est possible que s'il y a des mécanismes contrôlant la terminaison de la transcription des unités mono- ou polycistroniques. La terminaison n'est pas uniquement le mécanisme générant l'extrémité 3' d'un ARN, mais une autre occasion de raffiner la régulation de l'expression d'un gène. Il existe deux principaux modes de terminaison chez les bactéries. L'un ne requiert aucune autre protéine que l'ARN polymérase. C'est la terminaison Rho-indépendante. Le second mécanisme nécessite la présence d'un facteur de terminaison, le facteur Rho (ρ), et la terminaison est dite Rho-dépendante. La terminaison Rho-indépendante ou intrinsèque Les terminateurs intrinsèques se distinguent par deux caractéristiques principales: 1) une série de T (≈6) et, précédant cette série, 2) une région riche en GC, capable de former une structure tige-boucle (stem-loop). L'ARN produit aura donc à son extrémité 3' une série de U précédée de la région tige-boucle. Cette structure interagit avec l'ARN pol et provoque l'arrêt momentané de l'élongation (pause). La présence de la série de U fait en sorte que l'hybride ARN-ADN formé lors de la transcription est facilement dissocié par la faiblesse particulière de cet hybride (U-A), ce qui permet le largage de la chaîne d'ARN. Un exemple de ce type de terminateur est illustré pour l'opéron trp (fig. 11.1 MCB). L'atténuation est aussi Rho-indépendante Nous avons vu que le répresseur de l'opéron trp était régulé par le tryptophane lorsque ce dernier était en quantité suffisante dans la cellule. Cependant, cette répression n'est pas totale et un second mécanisme entre en jeu lorsque le trp est abondant; c'est l'atténuation. L'atténuation dépend de la structure secondaire de l'ARN au niveau d'une région appelée l'atténuateur, un terminateur intrinsèque localisé au début de l'unité transcriptionnelle. Dans le cas de l'opéron trp, l'atténuateur est situé dans la séquence de 162 pb qui précède l'AUG initiateur des 5 premières enzymes codées par l'opéron trp. Cette région est appelée leader. Le leader possède aussi un codon d'initiation et code pour un court polypeptide (fig. 11.2 MCB). Lorsque le trp est abondant, seule une petite quantité d'ARN trp est synthétisée (répresseur lié). L'ARN produit ne correspond qu'à la région leader, et non pas à l'ARN polycistronique complet (≈7kb). © Daniel P. Matton, 2002 12 L'atténuation cause un arrêt prématuré de l'élongation par la formation d'une structure secondaire particulière. La formation de cette structure dépend quant à elle de la vitesse de traduction du leader, cette dernière étant déterminée par la disponibilité des ARNt chargés (ARNt+aa) correspondant aux acides aminés codés par le leader, en particulier le tryptophane. Le leader peut être subdivisé en 4 régions. La séquence de la région 2 peut s'apparier avec celle de la région 1 ou 3, alors que la séquence de la région 3 peut s'apparier avec la région 2 et 4. Dès que la région 2 a été transcrite, elle s'apparie avec la région 1 déjà transcrite. La structure tige-boucle formée interagit alors avec l'ARN pol et provoque un arrêt (une pause) de l'élongation. Puisqu'il n'y a pas une série de U à la suite de cette structure, il n'y a pas terminaison. La polymérase peut donc poursuivre l'élongation. Cette pause aura par contre été suffisamment longue pour s'assurer qu'un ribosome aura initié la traduction (rappel: la traduction est cotranscriptionnelle chez les procaryotes). La région 1 du leader contient 2 codons UGG consécutifs codant pour le trp. Lorsque le trp est en quantité suffisante dans la cellule, le ribosome traduit le leader rapidement et défait la structure 2° entre les régions 1 et 2. Une fois synthétisées, les régions 3 et 4 peuvent alors s'apparier et, comme la structure tige-boucle dans ce cas est suivie d'une série de U, il y a terminaison de la transcription lorsque la concentration de trp est élevée dans la cellule. Lorsque la concentration en trp est insufisante, le ribosome s'arrête à chaque codon trp dans la région 1 du leader. Puisque le ribosome s'arrête à la région 1, il bloque l'appariement possible entre la région 1 et 2 et permet alors l'appariement entre les régions 2 et 3 dès qu'elles auront été synthétisées. Comme dans ce cas il n'y a pas de suite de U après la structure tige-boucle et que la région 3 s'apparie avec la région 2 et non la région 4, il n'y aura pas de terminaison. Fig. 11.3b MCB. La terminaison Rho-dépendante La moitié des sites de terminaison chez E. coli nécessite le facteur protéique Rho, une protéine de 46 kDa possédant une activité ATPase et qui semble agir sous la forme d'un hexamère. Après liaison à l'ARN nouvellement synthétisé, Rho glisserait sur ce dernier jusqu'à ce qu'il "rattrape" l'ARN pol qui se serait arrêtée à un terminateur. Rho provoquerait alors la dénaturation de l'hybride ARN-ADN et le largage de l'ARN (fig.9.29 GVII). La maturation des ARN chez les procaryotes La maturation des ARNm chez les bactéries est très rare. Ils sont traduits tels qu'ils ont été transcrits. Un cas exceptionnel est celui du phage T7 où certains ARN polycistroniques sont clivés pour ainsi libérer des unités monocistroniques. © Daniel P. Matton, 2002 13 Sept opérons codent pour les ARNr chez E. coli (rrnA à rrnG). Les ARNr sont synthétisés sous la forme d'un long précurseur 30S qui devra être clivé pour donner naissance aux ARNr 16S, 23S et 5S (fig. 12.50 GVI). L'enzyme responsable de la maturation de ces ARNr est l'ARNase III (RNase III). Fig. 12.51 GVI. L’ARNase III reconnaît une région de structure secondaire formant une tige boucle de part et d’autre des ARN r et le clivage au niveau de cette tige permet de libérer un ARNr mature. Les ARNt sont aussi synthétisés sous la forme d'un précurseur et subissent une maturation tant en 5' qu'en 3'. Une seule enzyme la RNase P, est responsable de la maturation des extrémités 5' des ARNt procaryotiques. La RNase P est une ribonucléoprotéine composée d'un ARN de 375 nt (≈130 kDa) et d'une partie protéique de 20 kDa! Les deux composantes sont nécessaires à l'activité de l'enzyme, mais c'est l'ARN qui effectue la catalyse. Les mécanismes de la maturation de l'extrémité 3' sont moins bien connus. Chez les bactéries, il existe deux types de précurseurs d'ARNt. Les précurseurs de type I possèdent dans leurs séquences la séquence CCA que l'on retrouve à l'extrémité 3' de tous les ARNt. Cette séquence sert alors de démarcation entre le précurseur et l'ARNt mature lors de la maturation de l'ARNt. Cette extrémité est générée par une ribonucléase (la RNase D) qui s'arrête à la séquence CCA. Dans les ARNt de type II, la maturation implique l'action d'une ribonucléase et d'une ARNt nucléotidyl transférase pour la synthèse de l'extrémité CCA. © Daniel P. Matton, 2002