Notions de biologie Les molécules biologiques
Transcription
Notions de biologie Les molécules biologiques
L’UE Algorithmes pour la bioinformatique Notions de biologie URL : http://www2.lifl.fr/SEQUOIA/mri.php Animée par l’équipe Sequoia (LIFL, INRIA) Intervenants : UE Algorithmes pour la bioinformatique, Master recherche Informatique Maude Pupin Maude Pupin, Maître de Conférences Laurent Noé, Maître de Conférences Hélène Touzet, Directrice de Recherche CNRS Modalités d’examen : Examen écrit Analyse d’articles scientifiques avec soutenance orale Probablement 3 décembre Notions de biologie Qu’est-ce que la bioinformatique ? Quelques liens utiles en bioinformatique La Société Française de BioInformatique (SFBI) L’approche in silico de la biologie Un outil indispensable aux biologistes Trois activités principales : http://sfbi.impg.prd.fr/ Logiciels pour la biologie de l’Institut Pasteur http://bioweb.pasteur.fr/ Acquisition et organisation des données biologiques Conception de logiciels pour l’analyse, la comparaison et la modélisation des données Analyse des résultats produits par les logiciels Le Pôle Bioinformatique Lyonnais (PBIL) http://pbil.univ-lyon1.fr/pbil.html http://npsa-pbil.ibcp.fr/ European Bioinformatics Institute (EBI) http://www.ebi.ac.uk/ Un nouveau domaine de recherche UE Bioinfo Les outils de protéomique d’ExPASy Logiciels souvent accessibles gratuitement via Internet http://www.expasy.org/tools/ National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/ Notions de biologie 3 Notions de biologie Quelques conseils Méfiez-vous des résultats donnés par les logiciels : La qualité des résultats est parfois diminuée au profit de la rapidité Certains problèmes admettent un ensemble infini de possibilités Beaucoup de logiciels ne font que de la prédiction Les molécules biologiques Ce n’est pas toujours la solution la meilleure qui est trouvée Dire ce qu’on prévoit, par raisonnement, devoir arriver. (wiktionnaire) Méfiez-vous des banques de données : Les données se sont pas toujours fiables La mise à jour n’est pas toujours récente La réalité mathématique n’est pas la réalité biologique : Les ordinateurs ne font pas de biologie, ils calculent … vite ! Notions de biologie 5 4 Les lipides Les glucides Ce sont les principaux constituants des membranes cellulaires : Ce sont le soutien de la vie : Source d’énergie Tête polaire Stockage d’énergie Queues non polaires Eléments de structure et de soutient des parois cellulaires et tissus Participation à l’adhésion entre cellules Membrane Protéines Les molécules Ex : glycoprotéines Les molécules Les protéines, un exemple : le collagène Polymère linéaire composé de 20 unités de base : Ex : cellulose (cellules végétales), peptidoglycanne (bactéries) Notions de biologie Les protéines, présentation Ex : amidon (cellules végétales), glycogène (cellules animales) Phospholipide Notions de biologie Ex : glucose, fructose, … les acides aminés (aa) Différentes propriétés physico-chimiques >structure 1D (séquence, enchaînement des aa) PPGPPGPPGITGARGLAGPPGPPGPPGPPG Structure tertiaire (forme de la molécule dans l’espace) Taille moyenne : 400 aa La plus longue connue : 8.797 aa Taylor WR. The classification of amino acid conservation. J Theor Biol. 1986;119(2):205-18. RCSB PDB (http://www.rcsb.org/pdb/) April 2000 Molecule of the Month Notions de biologie Les molécules Notions de biologie Les protéines, leurs fonctions (1/2) Protéines de transport Catalysent les réaction chimiques Protéines régulatrices Actine et myosine (contraction les muscles) Tubuline dans les flagelles (propulsion cellulaire) et cils Protéines de structure Protéines nutritives ou de réserve Protéines de défense Les molécules Hormones Facteurs de transcription (modulent la synthèse des protéines) Activateurs et répresseurs (modulent l’activité des protéines) Protéines contractiles ou motrices D’une cellule à une autre (ex : hémoglobine) A travers la membrane cellulaire (ex : canaux, transport actif) Notions de biologie Les molécules Les protéines, leurs fonctions (2/2) La fonction des protéines est due à leur structure 3D La formation d’un complexe moléculaire (assemblage de plusieurs molécules) peut être nécessaire à l’acquisition d’une fonction Ce sont les outils de la cellule et bien plus encore : Enzymes Collagène (en bleu clair) dans la membrane basale Ex : collagène, kératine, fibroïne (soie, toile d’araignée) Stockées dans les graines ou autre (ex : ovalbumine de l’œuf) Anticorps, Immunoglobulines (système immunitaire) Toxines bactériennes, venin, … Notions de biologie Les molécules Les acides nucléiques : l’ADN (1/2) Acide DésoxyriboNucléique Polymère linéaire composé de 4 unités de base : C’est le support de l’information génétique = Génome les nucléotides (nt, bp) Propriété importante : complémentarité des nt Les acides nucléiques, l’ADN (2/2) Appariement A T Adénine = Thymine Guanine Ξ Cytosine Deux brin d’ADN s’apparient Ensemble des gènes d’un individu Un gène est une portion d’ADN Un gène correspond à l’information pour fabriquer une protéine L’intégralité du génome est dans toutes les cellules La double hélice d’ADN : Plan de construction et de fonctionnement des êtres vivants Régulation de l’expression des gènes en fonction des besoins de la cellule La longueur de l’ADN varie selon les organismes Appariement C G Notions de biologie Les molécules Les acides nucléiques : l’ARN Exemple pour une bactérie : Autres molécules Adénine = Uracile Guanine Ξ Cytosine Peu se replier sur lui-même pour acquérir une structure 3D Nombreuses fonctions : Synthèse des protéines et sa régulation Catalyse de réactions Génome de certains virus Notions de biologie Sous forme simple brin Les molécules Constituants moléculaires d’une cellule Acide RiboNucléique Egalement composé de 4 nt : Notions de biologie Eau Les molécules Notions de biologie Eau : 70 % Protéines : 15 % ARN : 6 % ADN : 1% Glucides : 3 % Lipides : 2 % Autres : 3 % Les molécules Le monde du vivant Les cellules 3,5 millions d’espèces d’êtres vivants : Les plus simples ont une cellule unique sans noyau, l'ADN est nu dans le cytoplasme : Procaryotes. D'autres, plus complexes, ont un noyau qui protège l'ADN : Eucaryotes. Dans ces deux groupes il existe des êtres vivants possédant de la chlorophylle. Ils sont autotrophes grâce à la photosynthèse. Capables de synthétiser les molécules du vivant à partir de composés minéraux et de l’énergie lumineuse Notions de biologie Les cellules Exploitation des ressources terrestres Une entité est vivante si … molécules organiques O2 Elle est capable de croître Elle est capable de métabolisme énergie lumineuse organismes autotrophes organismes hétérotrophes Elle présente une motricité Elle se reproduit Elle répond à des stimulus énergie chimique CO2 H2O Notions de biologie Les cellules Transformation des individus au fil des générations Spéciation : création d’une nouvelle espèce Notions de biologie Les cellules Organismes unicellulaires Eubactéries Archaebactéries Spécialisation des activités Noyau : une membrane isole l’ADN Organismes uni/pluricellulaires Un génome ADN ou ARN Une capsule composée de protéines Eventuellement une enveloppe lipidique Injection du matériel génétique dans la cellule hôte Synthèse des protéines et duplication du génome à l’aide de la machinerie de l’hôte Lyse de l’hôte à cause de la libération des nouveaux virus Plus petits organismes au monde Les cellules Cellule bactérienne Les eucaryotes Eu = vrai / Caryon = noyau Compartiments cellulaires L’ADN est dans le cytoplasme de la cellule Phage lambda Notions de biologie Deux grandes catégories de cellules Les cellules Mode de reproduction Une cellule ne peut survivre que dans un milieu stable Les procaryotes Pro = avant / Caryon = noyau Pas de compartiment cellulaire Le pouvoir de détecter des propriétés de son environnement, et d'agir de façon adaptée. Ils ne sont pas vivants ! Les espèces des organismes vivants évoluent. Création d'autres entités similaires à soi-même Cas particulier des virus Ils contiennent des molécules carbonées. Ils ont besoin à la fois de l'énergie et de la matière afin de continuer à exister. Ils sont composés au moins d'une cellule. Ils se maintiennent grâce à l'homéostasie. Motricité externe (locomotion) ou interne (circulation). Notions de biologie Les organismes vivants Consommation, transformation et stockage d'énergie ou de masse. Unicell : les levures (Saccharomyces cerevisiae), … Pluricell : Animaux et végétaux Génome bactérien : 1 chromosome ADN circulaire Taille moyenne : 3 Mb (106) 0,5 Mb < génome < 9 Mb Des plasmides Petits ADN circulaires Facultatifs (avantage sélectif) Transmis par diffusion d’une espèce à une autre Membrane plasmique Cytoplasme Chromosome Plasmides Flagelle Notions de biologie Les cellules Notions de biologie Les cellules Cellule eucaryote Noyau Contient le génome 1 ou plusieurs chromosomes ADN linéaire Le dogme central Organelles (ont un génome) Mitochondrie (Respiration) Production d’énergie à partir de 02, H2O, molécules organiques Chloroplaste (Photosynthèse) Production d’énergie à partir de la lumière Etc. Notions de biologie Les cellules Le dogme central, principe La réplication ADN Réplication Gène Transcription ARNm CDS Duplication d’une double hélice pour en former deux Recopie stricte d’un brin d’ADN pour former le brin néo-synthétisé par complémentarité des nucléotides Effectué par l’ADN polymérase Parfois des erreurs se glissent : c’est l’évolution Etape préliminaire à toute division cellulaire Traduction Protéine Notions de biologie Le dogme central Notions de biologie La transcription La traduction Le message ADN (gène) est transcrit en message ARN (ARN messager, ARNm) Recopie stricte par complémentarité des nucléotides Effectué par l’ARN polymérase Choix des gènes exprimés et amplification du message Début de la transcription : promoteur Deux séquences courtes (6-10 bp) avec erreurs reconnues par un complexe protéique qui permet la fixation de l’ARN pol. Précède de 25-30 bp le site d’initiation de la transcription (+1) Fin de la transcription : terminateur Forme une épingle à cheveux qui bloque l’ARN polymérase Notions de biologie Le dogme central Le dogme central L’ARNm est traduit en protéine Basé sur le code génétique Correspondance entre un codon et son aa par les ARN de transfert (ARNt) Effectué par les ribosomes (complexes moléculaires composés de protéines et ARN ribosomiques -ARNr-) Début de la traduction : RBS (Ribosome Binding Site) Aussi appelé Shine-Dalgarno Séquence courte avec erreurs reconnue par les ribosomes Précède de environ 10 bp le codon d’initiation (ATG) Fin de la traduction : codons de terminaison Notions de biologie Le dogme central Le code génétique (1/2) Lecture de l’ARNm par mots de 3 nt = les codons Il est universel : partagé par tous les organismes Il est dégénéré : 64 codons codent 20 acides aminés Le code génétique (2/2) Plusieurs codons codent le même acide aminé Un codon code un acide aminé Souvent seule la troisième position du codon diffère entre les codons qui codent un même acide aminé Des codons particuliers 1 codon d’initiation ATG qui code un aa aussi dans les protéines 3 codons de terminaison de la traduction (ne codent aucun aa) Notions de biologie Le dogme central Notions de biologie Les gènes procaryotes Les gènes eucaryotes Terminateur CDS (Coding Sequence) +1 Boite -35 TTGACA Boite -10 TATAAT Exon non codant (5’ et 3’ UTR) Exon codant (CDS) Intron RBS AGGAGGT Promoteur Gènes très longs Gènes morcelés « Peu » de gènes dans les génomes Taille moyenne : 1 kb (1.000 bp) Gènes compacts Gènes courts Régions 5’ et 3’ UTR courtes (UnTranslated Region = non traduites) Nombreux gènes dans un génome En moyenne, 80 % du génome est impliqué dans des CDS Notions de biologie Le dogme central Plusieurs kb Présence d’introns (séquences perdues lors de l’épissage) Homme : seul 3 % du génome est impliqué dans des gènes Notions de biologie Une étape supplémentaire : l’épissage introns exon1 exon2 exon3 exon4 ARN pré-messager Les réseaux cellulaires Epissage exon1 exon2 exon3 exon4 ARN messager La séquence sur le génome n’est pas entièrement présente dans l’ARNm mature L’ADN est transcrit entièrement en ARN pré-messager Puis, les introns sont enlevés (excisés) lors de l’épissage Enfin, la traduction est effectuée Possibilité d’épissage alternatif Ce ne sont pas toujours les même exons qui sont choisis pour être dans l’ARNm mature Concerne environ 30% des gènes humain (estimation) Notions de biologie Le dogme central Le dogme central Le dogme central Les réseaux cellulaires Un exemple d’étude : l’opéron tryptophane Ensemble des réactions et interactions qui ont lieu dans les cellules : Voies métaboliques Voies de régulation Suites de réactions chimiques catalysées par des enzymes Interactions entre facteurs de transcription pour réguler la synthèse des protéines et leur activité Transmission d’un stimulus extérieur à la cellule vers le noyau pour réguler l’expression des gènes Notions de biologie Les réseaux cellulaires Activation/répression de la transcription Atténuation de la transcription Inhibition du produit final (feedbak négatif) Notions de biologie L’opéron Trp Produit à partir de l’acide chorismique Nécessaire à la synthèse des protéines Peu fréquent dans les protéines Besoin d’une régulation fine Régulation à différents niveaux Voies de transduction du signal Le tryptophane est un acide aminé Les réseaux cellulaires La voie de synthèse du tryptophane Opéron Unité de transcription composée de plusieurs gènes. Un seul ARNm code plusieurs protéines Souvent les protéines participent à une même voie cellulaire trpE, trpD Opéron Trp : les 5 gènes codant les protéines impliquées dans la synthèse du tryptophane E1 trpD trpC E2 trpC trpA E3 trpB trpX : protéines EX : enzymes Source : Metacyc http://metacyc.org/ Source : Metacyc Notions de biologie Les réseaux cellulaires Notions de biologie Plusieurs niveaux de régulation possibles Deux catégories de gènes Gènes constitutifs : 1 3 Transcription Traduction Dégradation ARNm Activation protéine Dégradation protéine Notions de biologie Les réseaux cellulaires Gènes induits : 2 4 Indispensables au fonctionnement de toute cellule Exprimés spontanément par les cellules Réprimés par des facteurs de transcription ponctuellement Liés à une fonction spécifique à un type cellulaire (organismes pluricellulaires), à une période de développement donnée, ou en réponse à un stimuli extérieur, … Besoin d’un facteur de transcription pour activer leur expression 5 Les réseaux cellulaires Notions de biologie Les réseaux cellulaires Pourquoi réguler ses gènes ? Toutes les cellules contiennent le génome complet de l’organisme, mais : Régulation de la synthèse du tryptophane (1/2) Chaque cellule a des besoins spécifiques et différents Elles doivent s’adapter aux changements du milieu extérieur trpR Économiser un processus coûteux Inhibition de la synthèse de protéines liées à une activité inutile Economie de matière première et d’énergie Disponibilité de la machinerie cellulaire pour d’autres gènes trpL trpE trpD E1 acide chorismique Notions de biologie Les réseaux cellulaires Régulation de la synthèse du tryptophane (2/2) Action rapide : « Feedback » négatif Action plus lente : répression par le métabolite terminal Inhibition de l’enzyme 1 par le tryptophane Evite la synthèse de trop de tryptophane ; Réversible rapidement Le tryptophane réprime les gènes codants les enzymes de sa voie de synthèse TrpR : apo-répresseur ; Tryptophane : co-répresseur Evite la synthèse d’enzymes inutiles ; Réversible à long terme Autorégulation négative TrpR bloque sa propre transcription en absence de tryptophane Notions de biologie Les réseaux cellulaires Notions de biologie trpC E2 trpB trpA E3 tryptophane Les réseaux cellulaires