1 / 82

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ. Υπολογιστική Βιολογία ΕΠΛ 450. Ομάδα μαθήματος. Δημήτρης Βογιατζής, dimitrv@cs.ucy.ac.cy Διαλέξεις, εργαστήριο Άθως Αντωνιάδης, athos@athosonline.com Εργαστήριο Παύλος Αντωνίου, pavlosantoniou@cytanet.com.cy Σημειώσεις Δικτυακός τόπος μαθήματος

zagiri
Download Presentation

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Υπολογιστική Βιολογία ΕΠΛ 450

  2. Ομάδα μαθήματος • Δημήτρης Βογιατζής, dimitrv@cs.ucy.ac.cy • Διαλέξεις, εργαστήριο • Άθως Αντωνιάδης, athos@athosonline.com • Εργαστήριο • Παύλος Αντωνίου, pavlosantoniou@cytanet.com.cy • Σημειώσεις • Δικτυακός τόπος μαθήματος • http://www.cs.ucy.ac.cy/courses/EPL450/

  3. Τι είναι η Βιοπληροφορική; • Συγχώνευση Βιολογίας και Πληροφορικής • Πρώτη αναφορά στον όρο το 1991 • Η σχεδίαση και η εφαρμογή μεθόδων για συλλογή, οργάνωση, κατηγοριοποίηση, αποθήκευση και ανάλυση βιολογικών ακολουθιών(DNA,RNA, πρωτεϊνικών)

  4. Χαρακτηριστικά τα μεγέθη... • PDB: πληροφορίες για 23,997 τριδιάστατες δομές πρωτεϊνών (20-Ιαν-2004). • PubMed περιλαμβάνει πάνω από 14M περιλήψεις βιοιατρικών άρθρων (από το 1950). • GenBank • 28 GBps (δισεκατομμύρια ζεύγη βάσεων) • Trembl • 1 M καταχωρήσεις (16-Ιαν-2004) • Οι καταχωρήσεις αυξάνονται με εκθετικό βαθμό. • Ανάγκη εργαλείων ανάλυσης δεδομένων.

  5. Στόχοι μαθήματος Βιοπληροφορικής α’ • Κατανόηση των πληροφοριακών συστημάτων διαχείρισης βιολογικών πληροφοριών • Γνωριμία με εργαλεία ανάλυσης των δεδομένων • Ανάπτυξη και εφαρμογή αλγορίθμων στα προβλήματα γενετικής

  6. Στόχοι μαθήματος Βιοπληροφορικής β’ • Εφαρμοσμένη βιοπληροφορική • επαφή και γνωριμία με Εργαλεία και βάσεις. • Αλγοριθμική βιοπληροφορική • Ανάλυση, μελέτη και σχεδίαση αλγορίθμων • Η προσέγγιση μας, συνδυασμός δύο μεθόδων.

  7. Στόχοι μαθήματος Βιοπληροφορικής γ’ Εργαστήρια • 9 εργαστήρια, λύση ασκήσεων με χαρτί και μολύβι, προγραμματισμός • 7 ασκήσεις, που θα αξιολογηθούν (βασικά θέματα από τη θεωρία) • 1 εργασία (ομαδική) Φροντιστήρια • Ανάλογα με τις ανάγκες Αξιολόγηση • Εργαστηριακές ασκήσεις/Εργασία 40% • Εξέταση ημιεξαμήνου 20% (18/3) • Τελική εξέταση 40%

  8. Θέματα • Εισαγωγή στη βιοπληροφορική • Συλλογή και αποθήκευση ακολουθιών • Alignment ζεύγους ακολουθιών • Multiple Sequence Alignment • Πρόβλεψη δευτερεύουσας δομής πρωτεϊνών • Εισαγωγή στην ανάλυση δεδομένων από microarrays • Φυλογενετική πρόβλεψη • Έλεγχος βάσεων για όμοιες ακολουθίες

  9. Προτεινόμενες πηγές • Bioinformatics: Sequence and Genome Analysis, David Mount, Cold Spring Harbor Laboratory Press, 2001, www.bioinformaticsonline.org • Introduction to Bioinformatics, Arthur M. Lesk, Oxford, 2002, http://www.oup.co.uk/best.textbooks/biochemistry/bioinf/ (μπορείτε να κατεβάσετε το κεφ. 1) • Δοκιμάστε στο • Η ιστοσελίδα του μαθήματος, σύντομα κοντά σας...

  10. Εργαλεία/Αλγόριθμοι • Δυναμικός προγραμματισμός (για sequence alignment). • Τεχνητά Νευρωνικά Δίκτυα (για κατασκευή μοντέλων πρόβλεψης τριδιάστατης δομής) • Τεχνικές clustering για ομαδοποίηση gene expression data • Τεχνικές text data mining για εξαγωγή πληροφορίας από συλλογές κειμένων. • Matlab • Perl/C

  11. Στοιχειώδη Μοριακής βιολογίας

  12. Στοιχειώδεις γνώσεις Μοριακής Βιολογίας • Για την κατανόηση των πληροφοριακών συστημάτων διαχείρισης βιολογικών πληροφοριών που γίνεται με την Βιοπληροφορικής πρέπει πρωταρχικά να γίνουν κατανοητές βασικές έννοιες της Μοριακής Βιολογίας. • Ακολουθεί μια ανασκόπηση-υπενθύμιση βασικών εννοιών της μοριακής βιολογίας

  13. Μοριακή βιολογία • Δομικό στοιχείο κάθε οργανισμού είναι το κύτταρο. • Το κύτταρο πραγματοποιεί τις λειτουργίες του σύμφωνα με μια σειρά πληροφοριών που έχει κληρονομήσει από τους προγόνους του. • Οι πληροφορίες αυτές είναι καταγραμμένες στο DNA που βρίσκεται στον πυρήνα του κυττάρου και είναι το γενετικό υλικό.

  14. Το ζωικό κύτταρο

  15. Μοριακή βιολογία • Το συνολικό DNA σε κάθε διπλοειδές κύτταρο του ανθρώπου έχει μήκος περίπου 2 μέτρα και συσπειρώνεται σε τέτοιο βαθμό ώστε να χωράει στον πυρήνα του κυττάρου που έχει διάμετρο δέκα εκατομμυριοστά του μέτρου

  16. Ποίες οι λειτουργίες του DNA; • Το DNA παράγει αντίγραφα του έτσι η πληροφορία μεταβιβάζεται αναλλοίωτη από κύτταρο σε κύτταρο και από γενιά σε γενιά. • Το DNA προσδιορίζει την παραγωγή των διαφόρων ειδών RNA και μέσω αυτών των πρωτεϊνών. • Οι πρωτεΐνες είναι υπεύθυνες για τα βασικά δομικά και λειτουργικά χαρακτηριστικά των κυττάρων.

  17. Το DNA είναι το Δεοξυριβονουκλεϊνικό οξύ. Deoxyribonucleic Acid Είναι δυο πολυνουκλεϊνικές αλυσίδες που σχηματίζουν στο χώρο μια δεξιόστροφη διπλή έλικα. Η ανακάλυψη της διπλής έλικας του DNA έγινε μόλις το 1953 από τους Watson και Crick γεγονός για το οποίο τους απονεμήθηκε βραβείο Νόμπελ. Watson και Crick Τι ακριβώς είναι το DNA;

  18. Τι ακριβώς είναι το DNA; • Αποτελείται από νουκλεοτίδια. • Τα νουκλεοτίδια αποτελούνται από μια πεντόζη,τη δεοξυριβόζη η οποία είναι ενωμένη με μία φωσφορική ομάδα και μία αζωτούχο βάση. • Το μόνο που διαφέρει το ένα νουκλεοτίδιο με το άλλο είναι η αζωτούχα βάση με την οποία είναι συνδεδεμένο.

  19. Στα νουκλεοτίδια του DNA η αζωτούχος βάση μπορεί να είναι: Α - Αδενίνη (Adenine) G - Γουανίνη (Guanine) T - Θυμίνη (Thymine) C - Κυτοσίνη (Cytosine) Τι ακριβώς είναι το DNA;

  20. Νουκλεοτίδιο του DNA

  21. Τι ακριβώς είναι το DNA; • Τα νουκλεοτίδια αυτά συνδέονται μεταξύ τους σχηματίζοντας μια πολυνουκλεοτιδική αλυσίδα. • Το DNA αποτελείται από δύο τέτοιες αλυσίδες συνδεδεμένες μεταξύ τους σχηματίζοντας έλικα. • Οι αζωτούχες βάσεις της μίας αλυσίδας συνδέονται με τις βάσεις της άλλης σύμφωνα με τον κανόνα της συμπληρωματικότητας.

  22. Τι ακριβώς είναι το DNA; • Η Αδενίνη συνδέεται μόνο με τη Θυμίνη και αντίστροφα(Α-Τ, Τ-Α) ενώ η κυτοσίνη συνδέεται μόνο με τη Γουανίνη και αντίστροφα (G-C, C-G) • Οι δυο αλυσίδες είναι συμπληρωματικές και αντιπαράλληλες. • Η συμπληρωματικότητα έχει μεγάλη σημασία στον αυτοδιπλασιασμό του DNA.

  23. Λειτουργίες DNA • Το DNA έχει τη δυνατότητα να αυτοδιπλασιάζεται, να αντιγράφεται καθώς και να μεταγράφεται. • H αντιγραφή γίνεται με ξετύλιγμα του DNA και απέναντι από τις βάσεις των μητρικών αλυσίδων προσθέτονται νέες συμπληρωματικές τους και έτσι δημιουργούνται δύο θυγατρικές αλυσίδες DNA.

  24. Αντιγραφή DNA

  25. Κεντρικό δόγμα της μοριακής βιολογίας • O F.Crick διατύπωσε το 1958 το κεντρικό δόγμα της μοριακής βιολογίας το οποίο αφορά τη ροή της γενετικής πληροφορίας • Το DNA με τη διαδικασία της μεταγραφής μεταφέρει την πληροφορία του στο RNA. • To RNA μεταφέρει τη πληροφορία με τη διαδικασία της μετάφρασης στις πρωτεΐνες . • DNA RNA πρωτεΐνες

  26. Τι είναι το RNA; • Το RNA είναι το ριβονουκλεϊνικό οξύ (Ribonucleic acid) το οποίο αποτελείται κι αυτό από νουκλεϊνικά οξέα με τη διαφορά ότι οι αζωτούχες βάσεις του περιέχουν την Ουρακίλη U (Uracil) αντί της θυμίνης Τ. • Υπάρχει αντιστοιχία ανάμεσα στις βάσεις του DNA και του RNA : A-U,G-C,C-G,T-A • To RNA δημιουργείται από τα μόρια DNA κατά τη διαδικασία της μεταγραφής.

  27. Ροή γενετικής πληροφορίας • Η γενετική πληροφορία είναι η καθορισμένη σειρά βάσεων του DNA η οποία σειρά είναι αυτό που διαφοροποιεί τη μια αλυσίδα DNA από την άλλη. Βρίσκεται στα γονίδια. • Το κάθε ανθρώπινο κύτταρο περιέχει γύρω στα 40000 γονίδια. • Τα γονίδια δια μέσου της μεταγραφής και της μετάφρασης καθορίζουν τη σειρά των αμινοξέων που θα δημιουργήσουν την πρωτεΐνη.

  28. Μετατροπή πληροφορίας DNA σε πρωτεΐνες • Γίνεται με τις διαδικασίες Μεταγραφής και Μετάφρασης • Κατά τη μεταγραφή παράγονται τρία είδη RNA: • 1. m RNA • 2. t RNA • 3. snRNA

  29. Μετατροπή πληροφορίας DNA σε πρωτεΐνες • To m RNA (messenger RNA) περιέχει την πληροφορία του DNA που την αποκτά με την συμπληρωματική αντιστοιχία των βάσεων του DNA με τις δικές του ξετυλίγοντας τη διπλή έλικα του DNA. • Αφού πάρει την πληροφορία την μεταφέρει στο ριβόσωμα όπου θα γίνει η πρωτεϊνοσύνθεση.

  30. Μεταγραφή DNA

  31. Μετατροπή πληροφορίας DNA σε πρωτεΐνες • Έτσι με το τέλος της μεταγραφής η αλληλουχία (σειρά) των βάσεων του m RNA είναι ακριβώς η ίδια με την αλληλουχία των βάσεων του DNA με τη μόνη διαφορά ότι στη θέση της Τ (Θυμίνης) υπάρχει η U (Ουρακίλη).

  32. Πρωτεϊνοσύνθεση • Η αντιστοίχιση των νουκλεοτιδίων του m RNA με τα αμινοξέα των πρωτεϊνών γίνεται μέσω του γενετικού κώδικα. Η αλληλουχία των βάσεων του m RNA καθορίζει την αλληλουχία των αμινοξέων στις πρωτεΐνες. Κάθε 3 βάσεις του m RNA κωδικοποιούν ένα αμινοξύ. Για αυτό το λόγο ο γενετικός κώδικας ονομάζεται και κώδικας τριπλέτας. • Έχει τρία στάδια. Έναρξη, επιμήκυνση και λήξη.

  33. Πρωτεϊνοσύνθεση

  34. Πρωτεϊνοσύνθεση • Έναρξη: Σύνδεση m RNA με ριβόσωμα.Το t RNA μεταφέρει το πρώτο αμινοξύ στην τριπλέτα (κωδικόνιο) έναρξης. • Επιμήκυνση: Τα t RNA μεταφέρουν τα αμινοξέα που αντιστοιχούν στα κωδικόνια τα οποία συνδέονται μεταξύ τους. • Λήξη: Στο κωδικόνιο λήξης σταματά η Πρωτεϊνοσύνθεση και ελευθερώνεται η πολυπεπτιδική αλυσίδα.

  35. Γενετικός κώδικας

  36. Καρυότυπος ανθρώπου • Ανθρώπινο γονιδίωμα σε ένα γαμέτη αποτελείται από 3x10^8 ζεύγη βάσεων DNA που είναι οργανωμένα σε 23 χρωματοσώματα. • Τα χρωματοσώματα ταξινομούνται σε ζεύγη κατά ελαττούμενο μέγεθος.22 μορφολογικά και το 23ο φυλετικό. ΧΥ στον άντρα και ΧΧ στη γυναίκα.

  37. Τέλος ανασκόπησης τηςμοριακήςβιολογίας

  38. Περιήγηση στα θέματα

  39. 1: Portals

  40. 2: Πρωτεϊνες • Αν δοθεί η ακολουθία των αμινοξέων, μπορούμε να προβλέψουμε την τριδιάστατη δομή της πρωτεϊνης? • Δηλαδή αν δοθεί το 1 mmkmegialk krlswisvcl lvlvsaagml fstaaktets shkahteaqv intfdgvady 61 lqtyhklpdn yitkseaqal gwvaskgnla dvapgksigg difsnregkl pgksgrtwre 121 adinytsgfr nsdrilyssd wliykttdhy qtftkir • Μπορούμε να πάρουμε με υπολογιστικές μεθόδους τη δομή που φαίνεται στην επόμενη διαφάνεια;

  41. Βασικές δομές πρωτεϊνών sheets helices

  42. Γιατίθέλουμε πρόβλεψη δομής πρωτεϊνης; • Διότι υπάρχουν πληροφορίες για 143418 πρωτεϊνες,πειραματικά καθορισμένες (Release 42.8 of 15-Jan-2004 of Swiss-Prot)και για 1M (Trembl) • Ενώ υπάρχουν πληροφορίες για 23997 δομές πρωτεϊνών, πειραματικά καθορισμένες (Last Update: 20-Jan-2004 PDB Statistics). • Δηλαδή υπάρχει πληροφορία για το 16.7% (2.4%) των πρωτεϊνών. Ο προσδιορισμός δομής είναι ακριβή μέθοδος (κρυσταλλογραφία). • Πολύ σημαντική η τριδιάστατη δομή διότι προσδιορίζει λειτουργία και συνεπώς είναι σημαντικότατη για σχεδιασμό φαρμάκων.

  43. Υπολογιστικές μέθοδοι πρόβλεψης τριδιάστατης δομής • Νευρωνικά δίκτυα

  44. 3: Alignment ακολουθιών • Ευθυγράμμιση δυο ακολουθιών είναι η διαδικασία σύγκρισης δυο ακολουθιών για εύρεση ατομικών χαρακτήρων ή προτύπων χαρακτήρων με την ίδια σειρά στις δύο ακολουθίες. • Οι ακολουθίες μπορούν να αφορούν DNA ή πρωτεϊνες. • Πχ. gctgaacg και ctataatc • Find maximum degree of likeness • Find minimum evolutionary distance

  45. Alignment ακολουθιών • Πχ. Έστω δύο πρωτεΐνες οι: gctgaacgκαιctataatc. Πόσο όμοιες είναι; Ευθυγράμμιση με κενά 1: g c t g a - a - - c g - - c t - a t a a t c Ευθυγράμμιση χωρίς κενά: g c t g a a c g c t a t a a t c Ευθυγράμμιση με κενά 2: g c t g - a a - c g - c t a t a a t c -

  46. Alignment ακολουθιών • Μέτρα ομοιότητας (Hamming, Levenshein) • Αλγόριθμοι: Dot Plots, Δυναμικός προγραμματισμός • Αποτίμηση της ευθυγράμμισης

  47. Φυλογενετική • Περιγραφή βιολογικών σχέσεων υπό μορφή δένδρου. • Πηγή ομοιότητας είναι ο κοινός πρόγονος (αλλά όχι πάντα). • Για την κατασκευή του χρησιμοποιούμε alignments. • Οι αριθμοί δηλώνουν την απόσταση (similarity)

  48. 4. Φυλογενετική πρόβλεψη • Δηλαδή δοσμένης κάποιας DNA ή πρωτεϊνικής αλληλουχίας πως μπορούμε να εξαγάγουμε τις σχέσεις τις σχέσεις τους; • Πχ. ΑΤCC, ATGC, TTCG, TCGG προκύπτει το 1.5 1.5 0.5 0.5 1 1 ATCC ATGC TTCG TCGG

More Related