1 / 66

Introduction aux biopuces et à l’analyse du transcriptome

Introduction aux biopuces et à l’analyse du transcriptome. Emmanuel Prestat. Les différentes puces. Mesures d’expression Etude du nombre de copies Analyse de polymorphisme Puces à tissus, à cellules, à immunoprécipition. Mesures d’expression.

pekelo
Download Presentation

Introduction aux biopuces et à l’analyse du transcriptome

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Introduction aux biopuces et à l’analyse du transcriptome Emmanuel Prestat Transcriptome

  2. Les différentes puces • Mesures d’expression • Etude du nombre de copies • Analyse de polymorphisme • Puces à tissus, à cellules, à immunoprécipition Transcriptome

  3. Mesures d’expression • Biopuces les plus utilisées à ce jour (premières auxquelles on pense, quand on parle de puces à ADN) • Principe : • les sondes, petits fragments d’ADN (20 à 50 nt) complémentaires à chaque gène ciblé, sont déposées sur une lame de verre, type lame de microscope ; • Les cibles, ARNm ou ADNc issus d’ARNm, sont marquées (radioactivité ou fluorescence) puis hybridées avec la lame sur laquelle les sondes sont déposées Transcriptome

  4. Transcription Transcriptome

  5. La technologie des puces bifluorescentes Transcriptome

  6. Dépôt des sondes (« spotting ») Transcriptome

  7. Dépôt des sondes (« spotting ») Transcriptome

  8. Puces à oligo : pas de « spotting » ! Procédé Affymetrix (et NimbleGene…) Transcriptome

  9. Particularités des puces Affymetrix • La fabrication in situ des sondes • Leur ultra-haute densité : jusqu’à 1,3 millions d’objets • Leur design : • Objets carrés • Pas d’espace entre eux • Concept de probeset • Concept de PM et MM Transcriptome

  10. Puces Affymetrix Transcriptome

  11. Préparation des échantillons (cibles) • Extraction d’ARN Kit • Amplification PCR • Marquage • Radioactivité (S35, P32) • Fluorescence (Cy3 - vert, Cy5 - rouge)  En général réalisé en même temps que l’amplification: utilisation d’une amorce de PCR marquée • Digestion (λ-exonucléase)  ADN simple brin Transcriptome

  12. L’hybridation • Séchage des cibles et reprise dans un tampon d’hybridation • Volume d’hybridation : 3 à 50 μl (entre lame et lamelle)  attention à l’évaporation !  à répartir sur l’ensemble de la surface de la puce • Température d’hybridation 45  65°C • + la température ↑, + le signal d’hybridation ↓ • + la température ↓, + l’hybridation aspécifique ↑ • Temps d’hybridation 1h  12h  dans une chambre d’hybridation Transcriptome

  13. Le lavage • Après hybridation, lavage de la lame, pour éviter • L’adsorption de fluorescence sur le support • Les hybridations aspécifiques • Conditions de lavage : • Dans des solutions de plus en plus stringentes • Evaluation de la qualité du lavage (et de l’hybridation) • Témoins positifs et négatifs • Répartition aléatoire sur la lame  vérification : pas d’effet de localisation, de bord Transcriptome

  14. Excitation Laser 1 Laser 2 Émission Fluorescence verte Fluorescence rouge Amplification du signal (PMT) (Ech 2) (Ech 1) Extraction des données Acquisition des images Transcriptome

  15. Acquisition des images Etat excité Etat stable Spectre d’excitation & Spectre d’émission Transcriptome

  16. Choix des fluorochromes Fluorescence verte Fluorescence rouge Transcriptome

  17. « Vrais » images et images d’« interprétation » Transcriptome

  18. Pas si simple… Transcriptome

  19. Pas si simple… Queues de comètes Bavures Mauvais blocage du processus pendant la phase d’hybridation Sondes/Cibles Spotting ? Lavage ? Transcriptome

  20. Pas si simple… …etc Transcriptome

  21. Différences avec les puces radioactives • Marquage radioactif (!) • Une seule condition expérimentale • Le support est une membrane • Maximum : 2400 dépôts par membrane (on les appelle parfois les macroarrays) Transcriptome

  22. Extraction des données à partir de l’image Adressage – Localisation Segmentation Extraction de l’information (pour chaque spot) - signal d’intérêt - bruit local (autour de chaque spot) - morphologie (surface, périmètre…) Transcriptome

  23. Méthodes de segmentation Cercles fixes Transcriptome

  24. Méthodes de segmentation Cercles fixes / rotation & distorsions ! GenePix Pro 4.0 Cercles fixes / variabilité du spot Transcriptome

  25. Méthodes de segmentation Cercles adaptables : modifier position du cercle modifier la taille du cerle Transcriptome

  26. Méthodes de segmentation Dérivée seconde Détection de contours Transcriptome

  27. Méthodes de segmentation Détection de contours vs cercles fixes Transcriptome

  28. Méthodes de segmentation Adams R et Bishof 1994 http://www.ch.embnet.org/….. Détection de régions (graines ou agrégation de pixels) Transcriptome

  29. Méthodes de segmentation Détection de régions (Watershed Function) Morphologie mathématique Détection de régions : seuillage (ou histogrammes) Transcriptome

  30. Mesure du bruit de fond Transcriptome

  31. Quelques chiffres Diamètre des spots : 100-600 µm Capacité totale : 30000 spots / lame ; 2-10 ng ac.nucl./spot Distance entre les spots : 100 µm – 600 µm Durée de conservation : 9 mois Conditions optimum de conservation : 2 – 8 °C Durée totale de préparation : 3 jours Préparation d’un échantillon : 2 jours Hybridation : 16 heures Lavage : 1 heure Scan : 5 - 15 minutes Transcriptome

  32. Normalisation de biopuces : pourquoi ? «Traitement visant à ajuster les données selon les effets des variations dues à la technologie plutôt qu’à des différences biologiques » Yang et al. 2002 Transcriptome

  33. Normalisation de biopuces : pourquoi ? Transcriptome

  34. Effet microplaque (ou aiguille) Normalisation de biopuces : pourquoi ? Transcriptome

  35. Normalisation de biopuces : pourquoi ? Transcriptome

  36. Normalisation de biopuces : pourquoi ? Après normalisation qui tient compte de la variabilité due aux différentes aiguilles du « spotter ». Rmq : la normalisation inter-lames observe le même principe Transcriptome

  37. Analyse de données • Identification de gènes DE • Fold change • Tests statistiques • Identification de gènes DE (plus de 2 conditions) • Répétitions (quel type, combien ?) Transcriptome

  38. Fold change • Avantage : sens pour un biologiste • Fold Change =expression value sample 1/ expression value sample 2 • Décision : • Quel seuil ? • Même pour tous les gènes • Inconvénients • Seulement les valeurs moy, sans tenir compte de la variabilité sont considérées • Les gènes ayant une expression très variable, ont plus de chance de dépasser le seuil aléatoirement Transcriptome

  39. Tests à un facteur Transcriptome

  40. Tests à un facteur • Paramétriques • Condition de normalité Transormation Log => Transformer les données ! Transcriptome

  41. Tests à un facteur • Tests non paramétriques • Ne supposent pas la normalité • Ne supposent pas l’homoscédasticité • L’utilisation des rangs à la place des valeurs d’intensité : • Diminue l’effet des outliers • Ne sont pas affectés par la log-transformation • Pas recommandés si les échantillons ont peu de répétitions Transcriptome

  42. Volcano plot • Combine les p-values et fold changes • Qu’est-ce qui est biologiquement important ? • La significativité des différences • Leur valeur • Quels seuils ? • Combien veut-on identifier de gènes ? • Où sont les contrôles ? • Le t-test modéré fait quelque-chose de similaire Transcriptome

  43. Quel seuil de p-value choisir ? • Dépend du type d’erreur • Type 1 • Faux positifs • => identifie des gènes différentiellement exprimés alors qu’ils ne le sont pas • Type 2 • Faux négatifs • => ne détecte pas certains gènes pourtant différentiellement exprimés dans la réalité Transcriptome

  44. Correction des tests multiples • Le problème… • Ho = l’expression moyenne du gène X est la même pour toutes les populations comparées • Identification des gènes DE : autant de tests à faire que de gènes considérés • Nombre moyen de faux positifs : G. • Exemple • G = 25000 gènes •  = 0.05 => G. = 1250 faux positifs… Transcriptome

  45. Correction des tests multiples • Méthodes de correction des p-values • Correction FWER (Family-Wise Error Rate) • FWER = proba- d’obtenir au moins 1 faux positif • Méthodes utilisées : • Bonferroni • Bonferroni step-down (Holm) • Westfall and Young permutation • Correction FDR (False Discovery Rate) • FDR = taux attendu de faux positifs • Méthode utilisée • Benjamini et Hochberg Transcriptome

  46. Lequel utiliser ? • FWER: ne tolère pas de faux positifs (Ho est difficilement rejeté) => procédure très conservative • FDR : moins conservatif, on estime le pourcentage de FP parmi les gènes « appelés » • Aucun : le pourcentage de FP est estimé sur l’ensemble des gènes testés Transcriptome

  47. Tests bi-facteurs • ANOVA • Comme un t-test avec + de deux conditions • Mesure les effets de différents facteurs ainsi que leurs interactions • ANOVA 2 • Test deux facteurs • 3 tests • Temps • Traitement • Interaction entre les 2 (additif ? Multiplicatif ?) Transcriptome

  48. Importance des répétitions Transcriptome

  49. Classification • But : Regrouper une collection d’objets de façon à ce que les objets d’une partition soient plus liés entre eux qu’avec les objets d’une autre partition • Analyse discriminante (classification supervisée) : les classes sont définies • Classification (non-supervisée) : on ne connaît pas les classes Transcriptome

  50. Classification • Exemples : • Traitement/contrôle, malade/normal, thérapie efficace/sans succès,… • Si on a des informations sur la façon de classer les échantillons, elles devraient être intégrées dans la méthode Transcriptome

More Related