370 likes | 674 Views
Proteomics . ΕΠΛ 450. Proteomics. Ανάλυση συνόλου πρωτεΐνης οργανισμού Δύο κατηγορίες: 1. Expression proteomics : Διαχωρισμός, μέτρηση, χαρακτηρισμός μεγάλου αριθμού πρωτεϊνών Αυτό γίνεται κυρίως με 2D-gel electrophoresis και mass spectrometry
E N D
Proteomics ΕΠΛ 450
Proteomics • Ανάλυση συνόλου πρωτεΐνης οργανισμού • Δύο κατηγορίες: • 1. Expression proteomics: Διαχωρισμός, μέτρηση, χαρακτηρισμός μεγάλου αριθμού πρωτεϊνών • Αυτό γίνεταικυρίως με 2D-gel electrophoresis και mass spectrometry • Υπάρχουν και μεθόδοι με protein chip arrays • Expressionproteomics καταγράφουν τις πρωτεΐνες που εκφράζονται σε ένα τύπο κυττάρων ή ιστού
Proteomics • 2. Cellmapproteomics • Ανάλυση και χαρακτηρισμός της διάδρασης των πρωτεϊνών • Η αναγνώριση της θέσης των πρωτεϊνών και ποιες πρωτεΐνες δημιουργούν συμπλέγματα στο χώρο βοηθά στην • εύρεση της λειτουργίας • αναπαράσταση μονοπατιών κυττάρων • αναπαράσταση του δικτύου στα κύτταρα
Βιοπληροφορική • Χρειάζεται για την ανάλυση και μετάφραση των δεδομένων από πειράματα proteomics • Δημιουργία βάσεων δεδομένων • Αλγόριθμοι και στατιστικά tests • Imaging δεδομένων • Σύγκριση αποτελεσμάτων από μεθόδους 2D-gel και χρήση massspectrometry δεδομένων για αναζήτηση σε βάσεις δεδομένων
Proteome • Ολόκληρη η ποσότητα πρωτεΐνης σε ένα οργανισμό ονομάζεται proteome • Εκατοντάδες χιλιάδες πρωτεΐνες • Αντιστοιχία με το γονιδίωμα (genome) • Proteome είναι πιο πολύπλοκο από το γονιδίωμα • Κάθε γονίδιο μπορεί να πράξει πολλά διαφορετικά mRNAs( διακοπή σε διαφορετικά σημεία, διαφορετική χρήση promoters) • Κάθε mRNA μπορεί να δώσει διαφορετική πρωτεΐνη
Proteome • Οι πρωτεΐνες στη συνέχεια μπορεί να τροποποιηθούν με πολλούς διαφορετικούς τρόπους • posttranslationalmodifications • Πολλές περισσότερες πρωτεΐνες από τα γονίδια • Το σύνολο των πρωτεϊνών σε ένα κύτταρο εξαρτάται από τον τύπο του κυττάρου και το περιβάλλον του • Όλα τα κύτταρα έχουν ένα σύνολο βασικών πρωτεϊνών που είναι απαραίτητες για επιβίωση • και ένα σύνολο από πρωτεΐνες με εξειδικευμένες λειτουργίες
Γιατί μελετάμε το proteome • Οι πρωτεΐνες και όχι το mRNA εκτελούν τις λειτουργίες του γονιδίου • Ακόμα και αν έχουμε διαθέσιμο όλο το γονιδίωμα του οργανισμού πολύ λίγες πληροφορίες μπορούμε να έχουμε για τις πρωτεΐνες που δημιουργούνται • Δεν ξέρουμε πως οι πρωτεΐνες αντιδρούν μεταξύ τους, πως τις επεξεργάζεται το κύτταρο • Για να καταλάβουμε τη λειτουργία τους πρέπει να μελετήσουμε απευθείας τις πρωτεΐνες
Πως γίνεται η μελέτη του proteome • Δύο κατηγορίες μελέτης • Expressionproteomics • Αναγνώριση των πρωτεϊνών στο proteome του οργανισμού • Εφαρμογές: εύρεση περιοχών ασθενειων, drugtargets • Cellmapproteomics • protein-proteininteractions
Τεχνολογικές πλατφόρμες proteomics • Toproteome στα κύτταρα περιέχει χιλιάδες πρωτεΐνες που διαφέρουν σε περιεκτικότητα • Απαραίτητες διαδικασίες είναι: • Διαχωρισμός των πρωτεϊνών που αποτελούν το μείγμα - Τεχνολογίες διαχωρισμού πρωτεϊνών • Χαρακτηρισμός των πρωτεϊνών που αποτελούν το μείγμα - Τεχνολογίες χαρακτηρισμού πρωτεϊνών
Τεχνολογίες διαχωρισμού πρωτεινών • Διαχωρισμός πρωτεϊνών στο μείγμα σε ξεχωριστές πρωτεΐνες • Κάθε πρωτεΐνη βρίσκεται με διαφορετική περιεκτικότητα στο μείγμα • Διαχωρισμός βάση περιεκτικότητας που πρέπει να είναι ευαίσθητος να βρίσκει και πρωτείνες που έχουν πολύ χαμηλή περιεκτικότητα σε σχέση με τις άλλες στο κύτταρο
2D-gel electrophoresis • Τεχνολογία από το 1975 • Το μείγμα πρωτεϊνών τοποθετείται πάνω σε ένα gel και χωρίζεται με isoelectricfocusing στην πρώτη του διάσταση βάσει φόρτισης • Οι πρωτεΐνες μεταναστεύουν σε ένα σημείο όπου δεν είναι πλέον φορτισμένες και χαμηλώνει το ph τους • Οι πρωτεΐνες χωρίζονται περαιτέρω στη δεύτερη διάσταση ανάλογα με τη μοριακή τους μάζα, βάσει μεγέθους • Το gel μετά διαβάζεται και οι πρωτεΐνες αποκαλύπτονται σαν patterns από τελείες
Περιορισμοί • Αν και είναι η πιο διαδεδομένη μέθοδος έχει προβλήματα στην παρουσίαση των αποτελεσμάτων, την ευαισθησία και την αναπαραγωγή του πειράματος • Σε ένα πείραμα δεν μπορούμε να χωρίσουμε όλες τις πρωτεΐνες • Τελείες στο σχήμα μπορεί να αποτελούν μικρότερο μείγμα πρωτεϊνών κι όχι πρωτεΐνες ατομικές • Τα πειράματα δεν μπορούν αν επαναληφθούν για να γίνει σύγκριση μεταξύ διαφορετικών συνθηκών πειράματος
Εφαρμογές πληροφορικής • Δημιουργία βάσης δεδομένων για αυτά τα δεδομένα • Ανάλυση εικόνας για αναγνώριση μέτρηση των spots • Σύγκριση plots για αναγνώριση ίδιων spots • Διασύνδεση των δεδομένων αυτών με άλλες πηγές δεδομένων
Τεχνολογίες χαρακτηρισμού πρωτεινών • Αν και ο διαχωρισμός των πρωτεϊνών γινόταν από το 1975 η επόμενη διαδικασία, του χαρακτηρισμού των πρωτεϊνών δεν ήταν εφικτή • Δεν υπήρχαν μέθοδοι για να χαρακτηρίσουν τις πρωτεΐνες στα 2D gels • Υπήρχαν πολύ λίγες ακολουθίες πρωτεϊνών στις βάσεις δεδομένων για σύγκριση • Το πρόβλημα με τις βάσεις δεδομένων λύθηκε τα τελευταία 20 χρόνια με τα sequencingprojects • Η πιο διαδεδομένη τεχνική για χαρακτηρισμό πρωτεϊνών είναι η τεχνική massspectrometry
Mass spectrometry • Μέτρηση μοριακού φάσματος • Βασική Ιδέα: αναγνώριση μορίων βάσει μετρήσεων ακριβείας του ratio της μάζας/ φόρτισης τους • (m/z) ratio. • 1. Τοποθετείται το μόριο στη συσκευή μέτρησης • 2. Το μόριο φορτίζεται • 3. Καταγράφεται η επιτάχυνση του σε ένα μαγνητικό πεδίο • 4. Υπολογίζεται το πηλίκο, m/z ratio, και αναγνωρίζεται το μόριο
Μass Spectrometry • Καταμετρούνται οι μάζες των μορίων ενός δείγματος • Οι πιο διαδεδομένες διαδικασίες είναι: • Peptide mass fingerprinting (PMF) • Fragment ion Searching • DE novo sequencing of peptide ladders
Peptide mass fingerprinting • Επιτυχημένη διαδικασία σε δείγματα με πρωτεΐνες που έχουν περίπου την ίδια περιεκτικότητα • Ανάλυση ατομικών spots από την διαδικασία 2D-gel • Το δείγμα πρωτεΐνης πρώτα συνδυάζεται με το ένζυμο trypsin δημιουργώντας trypsicpeptides • Τα νέα πεπτίδια αναλύονται και οι μάζες του κάθε πεπτιδίου δίνεται με ακρίβεια • Τα αποτελέσματα χρησιμοποιούνται σαν query σε πρωτεϊνικές βάσεις δεδομένων όπως SWISSPROT • Αν μια πρωτεΐνη ανήκει στη βάση δεδομένων γίνεται η αναγνώριση της βάσει του συνδυασμού των πρωτεϊνών με την trypsin
Κύρια σημεία για τη μέθοδο • Παίρνει γνωστές πρωτεΐνες, τις διασπά και τοποθετεί κομμάτια που παρατηρούνται συχνά στις βάσεις δεδομένων ώστε να μπορούν να αναγνωριστούν με αναζητήσεις στο μέλλον • Φτιάχνει τις άγνωστες πρωτεΐνες ως εξής: • Τις κόβει με ένζυμα (trypsin) και συγκρίνει τα κομμάτια με βάση δεδομένων • Υπολογίζει στην συνέχεια από τη βάση δεδομένων την ακολουθία που θα μπορούσε να δημιουργήσει εκείνα τα κομμάτια που παρατηρήθηκαν
Εφαρμογές πληροφορικής • Διαχείριση των δεδομένων των πειραμάτων • Δημιουργία databases για ανακάλυψη κομματιών (fragmentidentification - databaselookup) • Δημιουργία αλγορίθμων για την επαναδημιουργία της ακολουθίας βάσει των κομματιών που υπάρχουν • Assemblyofproteinsbasedonpeptidefragments) • • Συγχώνευση με άλλες πηγές δεδομένων
Προβλήματα μεθόδου • Δεν μπορούν να αναγνωριστούν όλες οι πρωτεΐνες γιατί η μέθοδος βασίζεται στην διαθεσιμότητα ολόκληρης της ακολουθίας της πρωτεΐνης σε βάσεις δεδομένων • Η μέθοδος είναι επιτυχημένη για γονιδιώματα που ολόκληρη η ακολουθία είναι γνωστή και υπάρχουν περιορισμένα posttranslationalmodification • Στο ανθρώπινο γονιδίωμα έχουμε πάρα πολλές αλλαγές στις πρωτεΐνες μετά την μετάφραση • Δυσκολεύει τη διαδικασία
Προβλήματα μεθόδου • SNPs • Στο ανθρώπινο γονιδίωμα 1 SNP κάθε kilobase • Θα υπάρχουν 3,000,000 διαφορές σε βάσεις ανάμεσα σε δύο ανθρώπους • Τα SNPs βρίσκονται πιο πολύ σε noncodingregions, αλλά υπάρχουν και σε codingregions • Αν και πολλά που βρίσκονται σε codingregions δίνουν synonymouschanges • υπάρχουν 50000 πολυμορφισμοί αμινοξέων σε ένα ανθρώπινο γονιδίωμα • Οι ακολουθίες που διαφέρουν σε SNP θα διαφέρουν και σε μάζα • Δεν θα τις βρίσκουμε στη βάση δεδομένων
Protein chips • Μικροσκοπικές συσκευές στις οποίες τοποθετούνται πρωτεΐνες ή άλλες ουσίες που δεσμεύουν πρωτεΐνες • Χρησιμοποιούνται για να διαχωρίσουν πρωτείνες • και για να τις χαρακτηρίσουν • Για ανακάλυψη νέων πρωτεϊνών-denovoproteinannotation- η τεχνολογία αυτή συνδυάζεται με τη μέθοδο massspectrometry
Πλεονεκτήματα protein chips • Μικρό μέγεθος • Ευκολία δημιουργία πειράματος • Με ένα πείραμα υπάρχουν πολλά δεδομένα όπως και με DNA arrays που έχουμε δει • Παρόμοια με DNA arrays χρειάζονται μέθοδοι για • ανάλυση εικόνας • μέτρησηsignal και normalization • σύγκριση διαφόρων θέσεων spots • κατηγοριοποίηση - clustering
Είδη protein chips • Antibodychips • Αντισώματα τοποθετούνται πάνω στο γυαλί και χρησιμοποιούνται για να ανιχνευθούν και να μετρηθούν συγκεκριμένες πρωτεΐνες σε ένα μείγμα • Antigenchips • Το αντίστροφο των chips με αντισώματα. Πρωτεΐνες βρίσκονται πάνω στο γυαλί και χρησιμοποιούνται για την ανίχνευση και μέτρηση αντισωμάτων μέσα σε ένα δείγμα
Είδη protein chips • Universal protein arrays • Συσκευές που περιέχουν οποιαδήποτε πρωτείνη στο γυαλί και χρησιμεύουν στην ανίχνευση άλλων ή στην εύρεση διάδρασης πρωτεϊνών μεταξύ τους. Η ανίχνευση γίνεται με labeling των πρωτεϊνών ή με ανίχνευση αλλαγών στην επιφάνεια του γυαλιού • Proteincapturechips • Δεν περιέχουν πρωτεΐνες αλλά μόρια που αλληλεπιδρούν με πρωτεΐνες με στόχο την απλοποίηση των πρωτεϊνικών μειγμάτων
Εφαρμογές expression proteomics • Διάγνωση καρκίνου από expression των πρωτεϊνών • Αναγνώριση περιοχών ασθένειας με χρήση MS δεδομένων από ασθενή και υγιή δείγματα • Φαρμακευτική βιομηχανία • Μέτρηση τοξικότητας φαρμάκων • Ποιες είναι οι παρενέργειες ενός φαρμάκου σε κυτταρικό επίπεδο
Εφαρμογές cell map proteomics • Για την αλληλεπίδραση των πρωτεϊνών θεωρείται δεδομένο ότι οι πρωτεΐνες σπάνια δουλεύουν μόνες αλλά είναι μέρη μιας μεγαλύτερης ομάδας • Οι ομάδες μπορεί να αποτελούνται από πολλές πρωτεΐνες ή από πρωτεΐνες και άλλες ουσίες • Μας ενδιαφέρει η εύρεση του τρόπου σύνδεσης και αλληλεπίδρασης των πρωτεϊνών στο κύτταρο
Μεθόδοι protein interaction • Η ανακάλυψη πρωτεϊνών που αλληλεπιδρούν γίνεται με: • γενετικές μεθόδους (supressormutations) • βιοχημικές μεθόδους (cross-linkingmethods) • κύτταρο βιολογικές μεθόδους (fluorescenceresonanceenergytransfer) • ατομικές μεθόδους (X-ray crystallography, NuclearMagneticResonance)
Μεθόδοι protein interaction • Με συνδυασμό MS δεδομένων ανακαλύφθηκαν διάφορα proteincomplexes • Από αυτά, βρέθηκαν κάποιες ομάδες πρωτεϊνών που εμφανίζονται συχνά μαζί • Αυτές συνδέονται μεταξύ τους • Μας δίνονται στοιχεία για το δίκτυο στο κύτταρο • Υπάρχουν και ορθόλογαcomplexes ανάμεσα σε δυο οργανισμούς, έχουν την ίδια λειτουργία
Γράφοι • Πληροφορίες για τον τρόπο που συνδέονται οι πρωτεΐνες απεικονίζονται συνήθως με γράφους • Οι ακμές είναι οι φυσικές συνδέσεις μεταξύ τους • Χρειάζονται μέθοδοι πληροφορικής για να παρουσιαστεί η πολυπλοκότητα των γράφων αυτών • Ενσωμάτωση των πληροφοριών αυτών στις βάσεις δεδομένων