1 / 42

Bioinformatyczne bazy danych

Bioinformatyczne bazy danych. Genomowe Proteomowe Publikacje. pierwotne wtórne. Jako merytoryczna weryfikacja danych. Biologiczne bazy danych przeszukuje się głównie w celu znalezienia: sekwencji nukleotydowych sekwencji białkowych struktur białkowych

Download Presentation

Bioinformatyczne bazy danych

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bioinformatyczne bazy danych • Genomowe • Proteomowe • Publikacje pierwotne wtórne Jako merytoryczna weryfikacja danych • Biologiczne bazy danych przeszukuje się głównie • w celu znalezienia: • sekwencji nukleotydowych • sekwencji białkowych • struktur białkowych • informacji merytorycznych i publikacji Biotechnologia UWM

  2. Wyszukiwarki popularnych serwisów Biotechnologia UWM

  3. Przeszukiwanie za pomocą słów kluczowych • Słowem kluczowym (keyword) może być dowolna fraza (np. hemoglobin) lub numer ID danego rekordu z bazy • Fraza, czyli zapytanie do wyszukiwania może mieć złożoną formę w celu precyzyjnego określenia celu poszukiwania w wyszukiwaniu zaawansowanym:(hemoglobin) AND ((human) OR (bovine)) NOT (alpha) • Do przeszukiwania konkretnej bazy w NCBI przydatnym narzędziem jest „historia wyszukiwania” Biotechnologia UWM

  4. Historia wyszukiwania w NCBI Biotechnologia UWM

  5. Przeszukiwanie za pomocą odnośników Biotechnologia UWM

  6. Przeszukiwanie na podstawie wprowadzonej sekwencji • http://www.ncbi.nlm.nih.gov/blast/producttable.shtml • http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml Biotechnologia UWM

  7. BLAST Biotechnologia UWM

  8. Etapy dopasowywania sekwencji Biotechnologia UWM

  9. Kryteria szacowania podobieństwa sekwencji Biotechnologia UWM

  10. Kryteria szacowania podobieństwa sekwencji • Procent identyczności (względny udział odpowiadających sobie pozycji obsadzonych tymi samymi resztami) • Długość porównywanych sekwencji (liczba porównywanych pozycji) • Rozmieszczenie identycznych pozycji wzdłuż porównywanych sekwencji • Typ reszt okupujących pozycje konserwatywne (sekwencje białkowe) • Relacje genetyczne/strukturalne między resztami znajdującymi się w odpowiadających sobie nieidentycznych pozycjach (sekwencje białkowe) Biotechnologia UWM

  11. Procedura oszacowania stopnia podobieństwa porównywanych sekwencji Bardzo często oszacowanie stopnia podobieństwa porównywanych sekwencji sprowadzane jest jedynie do określenia względnego udziału pozycji identycznych. Pozostałe kryteria analizy zazwyczaj nie są w ogóle brane pod uwagę (np. bezwzględna długość sekwencji, dystrybucja identycznych pozycji wzdłuż łańcucha). Podejście takie jest niekompletne i stwarza ryzyko błędnej interpretacji otrzymanych wyników. Przedstawiona niżej metoda oparta jest na prawdopodobieństwie przypadkowego pojawienia sie zadeklarowanego stopnia identyczności. Uwzględnia ona podstawowe parametry mające znaczenie dla opisu faktycznego związku między porównywanymi sekwencjami. Liczbę wszystkich możliwych stopni identyczności dla danych dwóch sekwencji opisuje poniższe równanie: Gdzie: x – ilość rodzajów jednostek występujących w sekwencjach (20 dla białek; 4 dla kwasów nukleinowych) n – długość sekwencji (liczba porównywanych par pozycji) a – ilość pozycji identycznych Biotechnologia UWM

  12. Dopasowywanie dwóch sekwencji • Alignment, multiple alignment = dopasowanie (wielu) sekwencji • Dopasowywanie globalnedopasowanie, którego mechanizm zakłada porównanie całych sekwencji ze sobą • Dopasowywanie lokalnedopasowywanie na podstawie podobieństwa oddzielnych rejonów porównywanych sekwencji – ta metoda zakłada modularną strukturę białek i dopuszcza istnienie domen Biotechnologia UWM

  13. Programowanie dynamiczne opiera się na podziale rozwiązywanego problemu na podproblemy względem kilku parametrów. Biotechnologia UWM

  14. Dopasowanie globalne (1970) The Needleman and Wunsch Algorithm Mi,j = Mij + max(Mk,j+1 , Mi+1,I) Biotechnologia UWM

  15. Powstawanie dot-matrix Biotechnologia UWM

  16. Dot-matrix ścieżka i alignment Biotechnologia UWM

  17. FASTA Biotechnologia UWM

  18. Dot-matrix Biotechnologia UWM

  19. Dlaczego FAST? Biotechnologia UWM

  20. Podobieństwa biochemiczne i biofizyczne aminokwasów Diagram Venn-a Biotechnologia UWM

  21. Macierze substytucji (podstawień) • Jak za pomocą liczby określić podobieństwa biochemiczne i biofizyczne poszczególnych aminokwasów tak, aby liczba ta wyrażała jednocześnie realny wpływ na całe białko podstawienia danego aminokwasu innym w łańcuchu polipeptydowym? !!! MACIERZE SUBSTYTUCJI !!! Biotechnologia UWM

  22. PAM i BLOSUM Biotechnologia UWM

  23. PAM Biotechnologia UWM

  24. BLOSUM (62) Biotechnologia UWM

  25. Kara za przerwy (gap costs, gappenalty) Kara za otwarcie przerwy – G Kara za przedłużenie przerwy – L Kara = G + Ln gdzie: n – długość przerwy Standardowo: G = 10 - 15 L = 1 - 2 Biotechnologia UWM

  26. Programowanie dynamiczne – local alignment Biotechnologia UWM

  27. Algorytmy i narzędzia dopasowań lokalnych • FASTA (FAST Alignment): • Pierwszy program do przeszukiwania baz w celu znalezienia podobnej sekwencji • Używa szablonów słów (wielkość słowa) • Łączenie słów i prosta algorytmiczna optymalizacja • BLAST (Basic Local Alignment Search Tool ) • Idea sąsiadujących słów (podobne, nie identyczne słowa) – pozwala stosować słowa o dużych rozmiarach • Kilka wersji BLAST-a • ClustalW – multiple alignment Biotechnologia UWM

  28. Jak używać BLAST do wyszukiwania sekwencji? Biotechnologia UWM

  29. Jakiego BLAST-a wybrać? Biotechnologia UWM

  30. Formatka BLAST w NCBI Biotechnologia UWM

  31. BLAST – ustawienia zaawansowane Biotechnologia UWM

  32. Jak używać BLAST do wyszukiwania sekwencji? Biotechnologia UWM

  33. Jak analizować wyniki z BLAST w NCBI Graficzny przegląd wyników Biotechnologia UWM

  34. Jak analizować wyniki z BLAST w NCBI Szczegóły znalezionych dopasowań Biotechnologia UWM

  35. Jak analizować wyniki z BLAST w NCBI Alignmenty czyli zestawienia sekwencji Biotechnologia UWM

  36. BLAST w EBI Biotechnologia UWM

  37. ClustalW w EBI Biotechnologia UWM

  38. Analiza wyników ClustalW Biotechnologia UWM

  39. Podstawy genetyczne algorytmów do zestawień aminokwasów? ? Biotechnologia UWM

  40. Algorytm semihomologiczny Diagram of amino acid genetic relationships Diagram of codon genetic relationships Biotechnologia UWM

  41. Dot matrix pairwise alignment Internal homology (gene multiplication) SEMIHOM BLAST 2 SEQUENCES Chicken ovoinhibitor precursor (7 domains) Chicken ovomucoid precursor (3 domains) Biotechnologia UWM

  42. Fin Biotechnologia UWM

More Related