140 likes | 366 Views
Miraflores de la Sierra. Madrid Diciembre 10-11, 2012. Protein Grouping Kerman Aloria. Protein inference. Identificación de proteínas: • Identificación de péptidos • Perdida de la relación directa entre péptido y proteína
Miraflores de la Sierra. Madrid Diciembre 10-11, 2012 Protein Grouping Kerman Aloria
Proteininference • Identificación de proteínas: • • Identificación de péptidos • • Perdida de la relación directa entre péptido y proteína • • Posibles ambigüedades para determinar la presencia de ciertas proteínas en la muestra: • - La presencia de un conjunto de péptidos puede ser explicado por diferentes conjuntos de proteínas (ej. isoformas) • - Diferentes péptidos pueden explicar un mismo espectro (ej. Leu/Ile)
Proteininference Objetivo: Gestionar las ambigüedades inherentes a la tecnología shotgun Posibles opciones: • Elegir la explicación más sencilla (número mínimo de proteínas) • Elegir una proteína representativa por grupo (¿cuál?) • Presentar todas las posibles proteínas clasificadas en base a su evidencia experimental
Proteininference Propuesta de “report” Diferentes escenarios posibles Minimallist of proteins 1- Protein A → Peptides 1, 2 2- Protein B → Peptides 3, 4 3- Protein C → Peptides 5, 6*, 7* 4- Protein D → Peptides 6*, 7*, 8 5- Protein E → Peptides 9*, 10*, 11*, 12* Protein F → Peptides 9*, 10*, 11*, 12* 6- Protein G → Peptides 13, 14*, 15*, 16* 7- Protein I → Peptides 17, 18* 8- Protein K → Peptides19*, 20 9- Proteingroup Protein L → Peptides 21*, 22*, 23*, 24* Protein M → Peptides 21*, 22*, 23* Protein N → Peptides 22*, 23*, 24* Proteincount: 9 No conclusiveevidence 10- Protein H → Peptides 14*, 15*, 16* 11- Protein J → Peptides 18*, 19* 1 2 3 4 5 6 7 8 A C B D 13 14 15 16 9 10 11 12 E G H F 21 22 23 24 17 18 19 20 I L M J N K Nesvizhskii A, Aebersold R: Interpretation of shotgunproteomic data. Mol CellProteomics2005, 4(10):1419–1440 (modificado).
PAnalyzer • PAnalyzer, a software tool to group and report the list of identified proteins into four categories following the recommendations proposed by Nesvizhskii & Aebersold • • Conclusiveprotein: a proteinidentifiedby at leastoneunique (distinct, discrete) peptide* • • Indistinguishableprotein: a member of a group of proteinssharingallpeptides* that are exclusive tothegroup • • Non-conclusiveprotein: a proteinsharingallitsmatchedpeptides* witheitherconclusiveorindistinguishableproteins • • Ambiguousgroupmember: a proteinsharing at leastonepeptide* notmatchedtoeitherconclusiveorindistinguishableproteins • *peptides are considereddifferentonlyifthey can bedistinguishedbyevidence in massspectrum • Prieto G. et al.: PAnalyzer: A software toolforproteininference in shotgunproteomics. BMC Bioinformatics2012
PAnalyzer Propuesta Nesvizhskii & Aebersold PAnalyzer Conclusive Indistinguishable Distinct Differentiable Indistinguishable Group of proteinsidentifiedbysharedpeptidesonly Subset Subsumable Non-conclusive Ambiguousgroup
MASCOT • Para cada una de las entradas debe de haber al menos un péptido diferente • Opciones para exportar resultados de MASCOT
MASCOT • Opciones por defecto Proteínas Péptidos (23 péptidos > identity) Proteincategory Peptidecategory Unique: 1, 3-10, 12-23 Conclusive 1 2 3-10 11 12-19 CH60_HUMAN Shared: 2, 11 Conclusive 2 11 20-21 CH60_DROME Conclusive 2 22 CH60C_CAEEL Conclusive 23 CH60C_XANAC
MASCOT • Includesame-set protein hits Proteínas Péptidos (23 péptidos > identity) Proteincategory Peptidecategory Conclusive 1 2 3-10 11 12-19 CH60_HUMAN Unique: 1, 3-10, 12-22 Shared: 2, 11, 23 Conclusive 2 11 20-21 CH60_DROME Conclusive 2 22 CH60C_CAEEL CH60C_XANAC 23 CH60C_XANC5 23 CH60C_XANC8 23 Indistinguishable CH60C_XANCH 23 CH60C_XANCP 23 CH60C_XANOR 23 CH60C_XANOM 23
MASCOT • Includesame-set protein hits and sub-set protein hits Proteínas Péptidos (23 péptidos > identity) Proteincategory Peptidecategory Conclusive Unique: 8, 20, 21, 22 1-7 8 9-19 CH60_HUMAN Shared: 1-7, 9-19, 23 CH60_CRIGR, MOUSE, RAT 1-2 5-6 9-12 14-19 1-2 4 6 9-14 16-19 CH60_BOVIN 2-7 9-19 CH60_POMPY 6 9-12 1-2 14-19 CH60_CHICK Non conclusive 2 11 CH60C_DROME 2 19 CH60C_ARATH CH60C_CANAL, PARBR, YEAST, VIBPA, VIBVU, VIBVY 2 19 CH60_EUGGR Conclusive 2 11 20-21 CH60_DROME Conclusive 2 22 CH60_CAEEL CH60_XANAC, XANC5, XANC8, XANCH, XANCP, XANOR, XANOM Indistinguishable 23
MASCOT • Es necesario exportar todas las proteínas que contengan algún péptido identificado y agruparlas • Para determinar la evidencia de la presencia de una proteína en la muestra • - Para saber si un péptido es realmente único
Cuestiones a discutir • Dos secuencias que “machean” con un mismo espectro y con el mismo score, uniqueorindistinguishable? score MASCOT PAnalyzer ? TLNDELEIIEGMK 90 Unique Indistinguishable TLNDELELIEGMK 90 Unique • ¿Hay que tener en cuenta los “macheos” secundarios si superan el identitythreshold? péptido score proteína mismo espectro VGGTSDVEVNEK 81 (38) CH60_HUMAN ? VGGSSEVEVNEK 42 (38) CH60_DROME
Cuestiones a discutir • Proteínas indistinguibles con diferentes “non-discriminatingpeptides” Proteínas Péptidos Proteincategory Protein A Conclusive peptide 1 peptide 2 Protein B peptide 2 peptide 3 Indistinguishable Protein C peptide 3 No hay evidencia que determine la presencia de la proteína B respecto a la proteína C