Master 1 Biologie Santé UE Expression des génomes et

Transcription

Master 1 Biologie Santé UE Expression des génomes et
Master 1 Biologie Santé
UE Expression des génomes et transcriptomique
Sujet de : Hélène Dauchel
Durée : 2h
******
Les trois questions sont à traitées, elles sont indépendantes :
Question 1 : 4 points, temps conseillé 25 min
Question 2 : 5 points, temps conseillé 35min
Question 3 : 7 points, temps conseillé 45 min
Relecture générale : 15 min
Qualité rédactionnelle générale : 4 points.
Lisez bien les questions et répondez à toutes les parties demandées. Soyez précis
dans le choix de votre vocabulaire, rigoureux et complet sur le plan scientifique
(écrivez même ce qui vous paraît implicite). Adopter toujours un plan pour construire
vos réponses, quelles soient courtes ou plus longues.
******
Question 1 : transcriptomique par hybridation
Le document 1 est un extrait du « material et methods » d'un article traitant d'une analyse de
l'expression différentielle par hybridation chez des patients atteints de polyarthrite rhumatoïde. Les
chercheurs souhaitent comparer la technologie Illumina BeadChips aux technologies Affymetrix et
micro-array déjà utilisées précédemment.
Q : A l'aide de plusieurs indices présents dans le texte, écrivez un petit tableau comparatif
qui permette de situer la technologie Illumina BeadChips (non évoquée en cours) par
rapport aux technologies « Affymetrix » et microarray double couleur (vues en cours).
Document 1:
To complete previous transcriptome studies on Rheumatoid
Arthritis (RA) with Affymetrix or double colour microarrays,
we decided to use microarray Illumina BeadChips technology.
cRNA was synthesized, amplified and purified using the
Illumina TotalPrep RNA Amplification Kit (Ambion Inc.)
following manufacturer recommendations. Briefly, 200 ng of
RNA was reverse transcribed. After second strand synthesis,
the cDNA was transcribed in vitro and cRNA labelled with
biotin-16-UTP.
Illumina’s BeadArray Technology is based on 3-micron silica
beads (billes) that self assemble in microwells on planar silica
slides (http://www.illumina.com) .
Labelled probe hybridization to Illumina BeadChips human-6v2 was carried out using Illumina's
BeadChip 6v2 protocol. These beadchips contain 48,701 unique 50-mer oligonucleotides in total,
with hybridization to each probe assessed at ~30 different beads on average. 22,403 probes (46%)
are targeted at Reference Sequence (RefSeq) transcripts and the remaining 26,298 probes (54%)
are for other transcripts, generally less well characterized (including predicted transcripts).
Beadchips were scanned on the Illumina BeadArray 500GX Reader using Illumina BeadScan
image data acquisition software (version 2.3.0.13).
d'après PLoS One. 2009; 4(8): e6803.
Question 2 : Séquençage de transcrits à haut débit
1. Séquençage et assemblage d'EST. Lisez le document 2.1
a. Que signifie le sigle EST ? Quels sont leur(s) intérêt(s) et leur(s) limitation(s)
technologiques ?
b. Expliquez l'intérêt et succintement le principe d'une méthode d'obtention d'une «
normalized cDNA library ».
c. Expliquez les conséquences de l'expression « were randomly picked ».
d. Shématisez la notion de « contig d'EST » et différenciez-la de celle de « cluster d'EST ».
e. Dans un premier temps, expliquez et commentez la figure (à gauche). Puis, compte-tenu
du protocole d'obtention des EST (2b), vous devriez formuler une forte critique aux auteurs,
laquelle ?
2. Analyse fonctionnelle des « Unigenes ». Lisez le document 2.2
a. Réécrivez (en français) le début de la première phrase et terminez-la à partir du terme
« again » afin de précisez le protocole bioinformatique (type de séquences, programme et
banques).
b. Donnez un titre à la figure de droite (en français). Shématisez le protocole bioinformatique
qui conduit à partir des séquences d'EST assemblées à ce type d'information.
Document 2 :
1. EST sequencing, and assembly
To clarify the molecular mechanism of flower development in upland cotton, ESTs were generated and
assembled into unique sequences from a normalized cDNA library constructed from pooled RNA isolated
from shoot apexes, flowers bud, and flowers. Clones were randomly picked from LB agar plates
supplemented with 30 µg/ml chloramphenicol. […] Plasmids from selected clones were sequenced using
an ABI PRISM 3730xl automated DNA sequencer […].
22,915 ESTs were aligned and assembled into
4,563 contigs and 9,810 singletons […].The
contigs and singletons should thus correspond
to 14,373 sequences of unique genes
(Unigene).
2. Functional annotation of EST
To estimate the number of new ESTs
generated in this work, all the 14,373
assembled unigenes were compared
again.................. As a result, our library
added 5,352 cotton unique sequences,
which therefore represented a new
transcript resource.
D'après PLoS One. 2011;6(12):e28676. Epub 2011 Dec 6.
Question 3 : Séquençage de transcrits à très haut débit
Les technologies de séquençage à très haut débit encore appellé « Next Generation Sequencing »
technologies (NGS) démontrent aujourd'hui leur efficacité par rapport à la technologie de
séquençage avec la traditionnelle chimie Sanger. Les deux documents 3a et 3b en présentent des
illustrations.
1. Concernant les courtes étiquettes 5' : A partir du document n°3a, dégagez les
avantages de la plateforme NGS de type SOLiD (5′SOLiD library, 25pb) comparée à la
technologie plus traditionnelle des séquences 5′SAGE (5'SAGE libraries,19pb). Méthode :
reportez dans un premier temps, votre analyse de chaque figure (description, observation,
conclusion). Puis, vous rédigerez la synthèse de vos analyses avantage par avantage en argumentant
avec les données issues des figures (paragraphe argumenté).
Les expériences concernent le système biologique suivant : « 5′-end transcriptome analysis was
used to study whole genome gene expression within a colon cancer cell line, HT-29, control or
treated with the DNA methyltransferase inhibitor, 5-aza-2′-deoxycytidine (5Aza) ».
Document 3a :
Figure 1 (ci-contre). Comparison of gene expression
patterns between 2 independant experiences of 5′SOLiD
sequencing from the same library. In the graph, each dot
represents one gene, and its x and y coordinates indicate the
numbers of 5’-end tags associated with the gene in each
experiment. Number of 5’-end tags were from sample 1Exp.1= 2,388,068 ; Exp.2= 1,992,160. (Pearson's
correlation coefficient r>0.99) .
Figure n°2 (ci-dessous) : Comparison of gene expression
patterns between 5′SOLiD and 5′SAGE. A Pearson
coefficient (r) was calculated.
Figure 3 :
Comparison of cellcycle
related
gene
profiling between 5′end SAGE and 5′-endSOLiD.
(Extrait
du
seulement)
tableau
Figure 4 :The distribution of 5′-end tags that
correspond to annotated exons and introns of
well-characterized genes .
D'après PLoS ONE 4(1): e4108. doi:10.1371/journal.pone.0004108 Janvier 2009
2. Concernant les EST : A partir du document n°3b, dégagez de façon synt hétique les
avantages de la plateforme NGS de type Roche 454 (250pb) comparée à la technologie plus
traditionnelle des séquences EST obtenue avec le séquençage Sanger (500 à 700pb).
Méthode : Donnez directement votre synthèse.
Les expériences concernent le système biologique suivant : « transcriptome profiling of
Caenorhabditis elegans in its first larval (L1) developmental stage »
Document 3b :
We have generated more than 300,000 novel C.
elegans EST sequences by this highly parallel
sequencing method for this study. We have
analyzed the sequence data to obtain a more
complete C. elegans transcriptome profile.
Figure 5 : Roche 454 ESTs mapping to
Caenorhabditis
elegans
transcripts.
Categorization of genomic 454 EST hits.
Figure 6 : Examples of Roche 454 expressed sequence tags mapping to the genome. (A) An example of
intronic expressed sequence tags (ESTs) mapped to the gene, K09E2.2 (B) An example of a gapped-EST.
Mapped to the gene R119.5 (C) an example of 454 ESTs mapped to predicted ncRNAs (D) an example of
intergenic region on chromosome II with 62 Roche 454 ESTs.
D
D'après BMC Biology 2008, 6:30
3. Conclusion. Rassemblez vos éléments de synthèse des questions 1 et 2 pour formuler
une conclusion générale sur les avantages et potentiels nouveaux des technologies NGS
pour l'exploration du transcriptome.