1 / 140

Bioinformatica Allineamento di sequenze e ricerca di similarità

Bioinformatica Allineamento di sequenze e ricerca di similarità. Dr. Giuseppe Pigola – pigola@dmi.unict.it. Allineamento di Sequenze. L’allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione;

ronna
Download Presentation

Bioinformatica Allineamento di sequenze e ricerca di similarità

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. BioinformaticaAllineamento di sequenze e ricerca di similarità Dr. Giuseppe Pigola – pigola@dmi.unict.it

  2. Allineamento di Sequenze • L’allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; • La similarità tra due o più sequenza può essere definita in base a una funzione distanza: Tanto più simili sono le sequenze, tanto meno distanti sono; • Esistono diversi algoritmi di allineamento ciascuno dei quali definisce una funzione distanza; • Dato un allineamento possiamo assegnare uno Score che indica il grado di similarità delle due sequenze. Bioinformatica

  3. Allineamento di Sequenze • GLOBALE: Si cerca la corrispondenza ottimale tra tutti gli amminoacidi (nucleotidi) di entrambe le sequenze. • LOCALE: Si cerca di individuare regioni locali di similarità. Globale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHK ||.  | |  |  .|     .|  ||  || | ||   TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Locale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHK   ||||||||.||||     TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Bioinformatica

  4. Allineamento Pairwise – Matrici Dot Plot • Si crea una matrice in cui vengono confrontati tutti i possibili appaiamenti di ogni carattere delle due sequenze da allineare. • Si riempie la matrice, annerendo le caselle che hanno nella corrispondente riga e colonna la stessa lettera. • Il programma DOTLET (http://myhits.isb-sib.ch/cgi-bin/dotlet) , date due sequenze in input permette di disegnare facilmente la relativa matrice Dot Plot. Bioinformatica

  5. m a r g a r e t q a k l e r d a y h q f f * m * * * * a * * r * g * * * * a Duplicazione * * r * * e * * t * Inversione d * * * a * y * h * q * f * Similarità f Allineamento Pairwise – Matrici Dot Plot Bioinformatica

  6. Allineamento Pairwise – Matrici Dot Plot FILTRAGGIO –Window Size • E’ chiaro che il numero di punti della matrice è influenzato dalla natura della sequenza; • Se confrontiamo due sequenze di nucleotidi (o proteine) costituite da 100 residui, assumendo che ciascun nucleotide (o aminoacido) occorra con la stessa probabilità, il numero totale di punti della matrice sarà mediamente pari a 2500 (500 nel caso di aminoacidi) su 10000 celle totali; • Quando confrontiamo sequenze nucleotidiche il rumore di fondo sara più elevato; • Possiamo confrontare finestre costituite da w residui contigui; • In tal caso metteremo un “dot” nella cella (i,j) solo nel caso in cui le stringhe risultino identiche per s residui su w. Bioinformatica

  7. DotLet - http://myhits.isb-sib.ch/cgi-bin/dotlet • Preleviamo la sequenza proteica della calmodulina umana con accession Number CAA36839; • Confrontate la sequenza con se stessa per mezzo di DotLet; • Lasciare come parametri iniziali la matrice Blosum62 ed una finestra di 15 residui per il confronto Bioinformatica

  8. DotLet - http://myhits.isb-sib.ch/cgi-bin/dotlet • Il grafico riporta la distribuzione degli score ottenuti da tutte le coppie di finestre di sequenza confrontate (usando le matrici di score). • Si noti che la maggior parte dei punteggi ricade nella distribuzione a sinistra a basso punteggio, mentre una piccola popolazione a punteggio elevato si trova a destra. • Spostando i cursori si variano i punteggi limite al di sotto dei quali la cella assume il colore nero e al di sopra il colore bianco. Tra i due limiti le celle assumono un tono di grigio proporzionale al punteggio che contengono. Num di score con quel punteggio Punteggio ottenuto Bioinformatica

  9. DotLet - http://myhits.isb-sib.ch/cgi-bin/dotlet • Cliccando sulla matrice si attiva un reticolo che può essere spostato sulla superficie della matrice stessa con il puntatore del mouse; • In basso viene riportato l’allineamento tra i due segmenti della proteina corrispondenti alla posizione del centro del reticolo sulla matrice; Bioinformatica

  10. DotLet - http://myhits.isb-sib.ch/cgi-bin/dotlet • Spostando i cursori in modo da posizionarci sulla piccola distribuzione a destra a punteggio elevato verranno visualizzati solo i punteggi elevati che ovviamente corrispondono alla diagonale principale; Bioinformatica

  11. DotLet -http://myhits.isb-sib.ch/cgi-bin/dotlet Esempio: Domini Ripetuti. • Matrice Dot Plot calcolata sulla stessa sequenza di Drosophila Melanogaster (proteina SLIT). • Parametri: Blosum 62, Zoom 1:5, grayscale: 53%,30% SLIT_DROME (P24014):MAAPSRTTLMPPPFRLQLRLLILPILLLLRHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSCT GLNVDCSHRGLTSVPRKISADVERLELQGNNLTVIYETDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVI TTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNNNNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSW LSRFLRSATRLAPYTRCQSPSQLKGQNVADLHDQEFKCSGLTEHAPMECGAENSCPHPCRCADGIVDCREKSLTSVPVTL PDDTTDVRLEQNFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNKIKDLPSGVFKGLGSLRLLL LNANEISCIRKDAFRDLHSLSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHKNPIETSGARCE SPKRMHRRRIESLREEKFKCSWGELRMKLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNELGR ISSDGLFGRLPHLVKLELKRNQLTGIEPNAFEGASHIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFE HLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAPSKVRDVQIKDLPHSEFKCSSENSEGCLGDGYCPPSCT CTGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRLDLSNNQITILSNYTFANLTKLSTLIISYN KLQCLQRHALSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWFSDWIKLDYVEPGIARCAEPEQ MKDKLILSTPSSSFVCRGRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMIDACYGNPCRNNAT CTVLEEGRFSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPCANGAK CMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMCQNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHEC KHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNSFVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAV ELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVDRGLARSIINEGSNDYLKLTTPMFLGGLPVDP AQQAYKNWQIRNLTSFKGCMKEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEEDDEQDFMDETPHIKEEPVDPCLEN KCRRGSRCVPNSNARDGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRSRQPLKYAKCVGGCGN QCCAAKIVRRRKVRMVCSNNRKYIKNLDIVRKCGCTKKCY Bioinformatica

  12. DotLet -http://myhits.isb-sib.ch/cgi-bin/dotlet ESERCIZIO Recuperare le sequenze proteiche in formato FASTA di: • subunità alfa 2 di Rattus norvegicus del recettore neuronale dell’acetilcolina (Neuronal acetylcholine receptor protein, alpha-2 chain precursor P12389); • subunità alfa 4 di chicken del recettore neuronale dell’acetilcolina (Neuronal acetylcholine receptor protein, alpha-4 chain precursor P09482); • Confrontare le due sequenze con DotLet per verificare la presenza di zone di somiglianza ed eventuali dissimilarità nella diagonale principale(Far variare i parametri di input); Bioinformatica

  13. Allineamento Pairwise Siano S e T due sequenze. • Un allineamento A associa ad S e T le sequenze S’ e T’, che possono contenere simboli di spazio “-”, in modo che • |S’|=|T’| • Rimuovendo gli spazi da S’ e T’ otteniamo S e T. Se l = |S’|=|T’|, lo score di un allineamento pairwise è definito da: L’allineamento ottimale sarà quello che massimizza la similarità (lo score); Bioinformatica

  14. Allineamento Pairwise • ESEMPIO: NEEDLEMAN-WUNSCH Lo score ottimale V(i,j) di due sequenze S1….i T1…j ha le seguenti proprietà: Algoritmo di programmazione dinamica per calcolare l’allineamento match/mismatch deletion insertion Bioinformatica

  15. Allineamento Pairwise • ESEMPIO: NEEDLEMAN-WUNSCH j - 1 2 3 4 5 i C A D B D S2 - 0 -1 -2 -3 -4 -5 1 A -1 -1 1 0 -1 -2 S1 = ACBCDB S2 = CADBD 2 C -2 1 0 0 -1 -2 3 B -3 0 0 -1 2 1 4 C -4 -1 -1 -1 1 1 5 D -5 -2 -2 1 0 3 Otteniamo tre allineamenti ottimali: ACBCDB- ACBCDB- -ACBCDB | || | || | | | -C-ADBD -CA-DBD CADB-D- 6 B -6 -3 -3 0 3 2 S1 Allineamento ottimale V(6,5) = 2 Bioinformatica

  16. Allineamento Pairwise – Matrici di Score • Un modo per definire la funzione σ è ad esempio quello di assegnare 1 in caso di caratteri uguali e 0 altrimenti. • Nel caso di Nucleotidi questa definizione può andare bene; • Nel caso di aminoacidi non è del tutto corretto assegnare ai mismatch lo stesso peso; • Per questo motivo si introducono le matrici di score che assegnano ad ogni coppia di amino acidi un punteggio: • Matrici PAM (Percent Accepted Mutations): si basano su calcoli statistici; • Matrici BLOSUM: sono invece basate su una banca dati (BLOCKS) di allineamenti multipli di segmenti proteici; Bioinformatica

  17. Score allineamento: 15 Seq1 V D S - C Y Seq2 V E S L C Y Score 4 2 4 -11 9 7 Allineamento Pairwise – Matrici di Score Penalità del gap. blosum62 Bioinformatica

  18. Allineamento Pairwise - EMBOSShttp://www.ebi.ac.uk/Tools/emboss/align/ Bioinformatica

  19. Allineamento Pairwise - EMBOSShttp://www.ebi.ac.uk/Tools/emboss/align/ • Utilizziamo EMBOSS per allineare due sequenze con gli algoritmi di • Needleman-Wunsch (globale); • Smith-Waterman (locale); Bioinformatica

  20. Allineamento Pairwise - EMBOSS http://www.ebi.ac.uk/Tools/emboss/align/ • Selezioniamo il tipo di sequenza: • Protein; • DNA; Bioinformatica

  21. Allineamento Pairwise - EMBOSS http://www.ebi.ac.uk/Tools/emboss/align/ • Scelta della scoringmatrix: • Protein: • Blosum62; • Blosum50; • Blosum40; • DNA: • DNAFull: (Assegna score diversi nel caso di mismatch di caratteri IUB-IUPAC); • DNAMat: (usata da BLAST assegna uno score al match e un altro al mismatch); Bioinformatica

  22. Allineamento Pairwise - EMBOSS http://www.ebi.ac.uk/Tools/emboss/align/ • GOP e GEP; Bioinformatica

  23. Allineamento Pairwise - EMBOSS http://www.ebi.ac.uk/Tools/emboss/align/ Inserimento delle due sequenza anche da file; Bioinformatica

  24. Allineamento Pairwise - EMBOSS http://www.ebi.ac.uk/Tools/emboss/align/ Identity: percentuale di match identici; Similarity: percentuale di match per cui la matrice di scoring ha un valore >= 0 (si tratta di aminoacidi diversi che hanno caratteristiche chimico-fisiche simili); Bioinformatica

  25. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST BLAST Basic Local Alignment Search Tool Bioinformatica

  26. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST BLAST (BasicLocalAlignmentSearchTool) Permette di ricercare regioni di similarità locale tra una sequenza data e una collezione di sequenze in banca dati. Bioinformatica

  27. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST L’idea di base dell’algoritmo consiste nel procedere ad allineare passo dopo passo piccole sequenze (WORD e KTUPLE) e tentando di estendere poi l’allineamento. Bioinformatica

  28. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST BLAST NUCLEOTIDICO MEGABLAST E’ utilizzato per trovare efficientemente lunghi allineamenti tra sequenze molto simili tra loro o per identificare una sequenza di input sconosciuta. Discontiguous MEGABLAST E’ utilizzato per trovare efficientemente lunghi allineamenti tra sequenze che hanno alcune differenze tra loro. BLASTN Utilizzato in tutti gli altri casi. Bioinformatica

  29. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST BLAST PROTEICO BLASTP E’ utilizzato per identificare una sequenza proteica di input nel DB o per ricercare sequenze proteiche simili; PSI-BLAST Position-Specific Iterata BLAST è il programma BLAST più sensibile, il che lo rende molto utile per trovare proteine poco correlate (molto distanti). PHI-BLAST Pattern-Hit Initiated BLAST è progettato per la ricerca di proteine che contengono un pattern specificato dall'utente e sono simili alla sequenza query in prossimità del pattern. Bioinformatica

  30. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST ALTRI TOOL BLASTX (Translatedquery vs protein database) E’ utilizzato per trovare proteine simili a quelle codificate da una query di nucleotidi; TBLASTN (Proteinquery vs translated database) E’ utilizzato per trovare proteine omologhe a quella data in input. Le sequenzenucleotidiche del DB vengonotradotte in sequenzeaminoacidicheutilizzandotutti e seii frame di lettura e poi contfrontatecon la query. TBLASTX (Translated query vs translated database) Prende in input una sequenza nucleotidica, la traduce in tutti e sei i frame di lettura e confronta queste sequenze tradotte con il DB di nucleotidi a sua volta tradotto in Aminoacidi. Utile per trovare nuovi geni. BLAST2SEQ Utilizza BLAST per allineare due o più sequenze. Bioinformatica

  31. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Scelta dei vari BLAST Inserire la sequenza in formato FASTA (anche da file) oppure specificare l’AccessionNumber o il Gene ID. Specificare eventualmente l’intervallo di interesse. Bioinformatica

  32. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Scegliere un nome descrittivo per la ricerca che apparirà nei risultati. Selezionare se si vuole utilizzare BLAST per allineare due o più sequenze. Campo di ricerca: DB, Organismo. E’ possibile usare la sintassi di entrez per filtrare i DB selezionati. Bioinformatica

  33. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST • Ottimizza la ricerca per: • Similarità; • Dissimilarità; • Ricerca generica; Bioinformatica

  34. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST E’ possibile cambiare la soglia di significatività statistica. Ogni match trovato ha un valore di significatività statistica, che indica quanto è statisticamente probabile che quel match sia casuale. Minore è il numero, maggiore sarà il tempo di esecuzione.L’accuratezza però cresce. Filtrare regioni il cui match avrebbe scarso significato biologico. Bioinformatica

  35. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Dimensione delle Word: Maggiore è il numero, minore sarà il numero di word generate per cui minore sarà il tempo di esecuzione. L’accuratezza però decresce. Bioinformatica

  36. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Esempio ricerchiamo il gene DIABLO in Drosophila Melanogaster La prima voce che troviamo è il gene cercato. Selezioniamo la sequenza corrispondente di mRNA in formato FASTA e diamola in pasto a BLAST scegliendo come DB nt e tool Megablast. Bioinformatica

  37. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Dati generali Taxonomy Report ci da informazioni sulle specie coinvolte nei risultati; Può essere utile per verificare la presenza di sequenze ortologhi in altre specie; Bioinformatica

  38. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Dati generali Allineamento grafico: I colori indicano la qualità dell’allineamento. Le prime due sequenze sono identiche. Bioinformatica

  39. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Le prime due sequenze sono identiche alla query (per questo motivo BLAST può essere usato per ricercare sequenze sconosciute). Le altre sono sequenze parziali. Bioinformatica

  40. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Scorrendo i risultati troviamo altre sequenze (anche parziali) in altri tipi di Drosophile. Bioinformatica

  41. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Infine troviamo i dettagli dei vari allineamenti. I trattini indicano un match, la loro assenza indica un mismatch. Bioinformatica

  42. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST MAX SCORE Punteggio dell’allineamento locale più significativo. (punteggio alto → elevata similarità); TOTAL SCORE La somma dei punteggi di tutti gli allineamenti locali trovati tra la sequenza query e le sequenze del database. QUERY COVERAGE Percentuale della sequenza allineata E-VALUE Esprime la probabilità che l’allineamento trovato sia casuale. Più basso è, maggiore è la probabilità che NON sia casuale. (dipende, oltre che dalla similarità, anche dalla numerosità delle sequenze in database e dalla lunghezza delle sequenze). MAX INDENT Percentuale di identità dell’allineamento locale più significativo. Bioinformatica

  43. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST VALIDAZIONE STATISTICA e BIT SCORE La probabilità di trovare un allineamento con score maggiore o uguale di S segue la distribuzione di Poisson M,N: lunghezze delle due sequenze; λ,K: parametri che dipendono tra le altre cose dalla banca dati, dalla sua dimensione etc. Il numero atteso di sequenze che hanno per caso lo score S è Il bit-score non è altro che lo score normalizzato in modo da poter confrontare bit-score di banche dati diverse Bioinformatica

  44. Allineamento Pairwise – BLAST2SEQhttp://www.ncbi.nlm.nih.gov/BLAST E’ possibile usare BLAST per fare un allineamento di due sequenze. In questo caso verranno evidenziate le similarità locali. Si sceglie il programma adatto, si inseriscono le sequenze e si ottiene il risultato. I parametri dell’interfaccia cambiano leggermente quanto si sceglie di allineare proteine piuttosto che nucleotidi (ad esempio le matrici di score). Bioinformatica

  45. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Ritorniamo alla pagina principale di BLAST C’è una sezione dedicata ai genomi completi (o in fase di completamento); In questo modo è possibile fare un BLAST su sequenze di una data specie; Bioinformatica

  46. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST Ritorniamo alla pagina principale di BLAST C’è una sezione dedicata ai genomi completi (o in fase di completamento); In questo modo è possibile fare un BLAST su sequenze di una data specie; Bioinformatica

  47. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST ESERCIZIO Data la seguente sequenza sconosciuta. Determinare l’identità più probabile. >SCONOSCIUTA ATCACTGTAGTAGTAGCTGGAAAGAGAAATCTGTGACTCCAATTAGCCAGTTCCTGCAGACCTTGTGAGGACTAGAGGAAGAATGCTCCTGGCTGTTTTGTACTGCCTGCTGTGGAGTTTCCAGACCTCCGCTGGCCATTTCCCTAGAGCCTGTGTCTCCTCTAAGAACCTGATGGAGAAGGAATGCTGTCCACCGTGGAGCGGGGACAGGAGTCCCTGTGGCCAGCTTTCAGGCAGAGGTTCCTGTCAGAATATCCTTCTGTCCAATGCACCACTTGGGCCTCAATTTCCCTTCACAGGGGTGGATGACCGGGAGTCGTGGCCTTCCGTCTTTTATAATAGGACCTGCCAGTGCTCTGGCAACTTCATGGGATTCAACTGTGGAAACTGCAAGTTTGGCTTTTGGGGACCAAACTGCACAGAGAGACGACTCTTGGTGAGAAGAAACATCTTCGATTTGAGTGCCCCAGAGAAGGACAAATTTTTTGCCTACCTCACTTTAGCAAAGCATACCATCAGCTCAGACTATGTCATCCCCATAGGGACCATTGGCCAAATGAAAAATGGATCAACACCCATGTTTAACGACATCAATATTTATGACCTCTTTGTCTGGATGCATTATTATGTGTCAATGGATGCACTGCTTGGGGGATCTGAAATCTGGAGAGACATTGATTTTGCCCATGAAGCACCAGCTTTTCTGCCTTGGCATAGACTCTTCTTGTTGCGGTGGGAACAAGAAATCCAGAAGCTGACAGGAGATGAAAACTTCACTATTCCATATTGGGACTGGCGGGATGCAGAAAAGTGTGACATTTGCACAGATGAGTA Bioinformatica

  48. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST ESERCIZIO I Ricercare le sequenze proteiche simili alla subunità IV della citocromo c ossidasi umana (AccessionNumber: P13073). Ci sono sequenze predette? Ci sono sequenze appartenenti a organismi non facenti parte dei mammiferi? Bioinformatica

  49. Similarità nei DB - BLAST http://www.ncbi.nlm.nih.gov/BLAST ESERCIZIO II Considerare la seguente sequenza proteica del lievito: >gi|2498220|sp|Q06703.1|CDA2_YEAST Chitin deacetylase 2 precursor MRIQLNTIDLQCIIALSCLGQFVHAEANREDLKQIDFQFPVLERAATKTPFPDW LSAFTGLKEWPGLDPP YIPLDFIDFSQIPDYKEYDQNHCDSVPRDSCSFDCHH CTEHDDVYTCSKLSQTFDDGPSASTTKLLDRLK HNSTFFNLGVNIVQHPDIYQ RMQKEGHLIGSHTWSHVYLPNVSNEKIIAQIEWSIWAMNATGNHTPKWFRPPY GGIDNRVRAITRQFGLQAVLWDHDTFDWSLLLNDSVITEQEILQNVINWNKSGT GLILEHDSTEKTV DLAIKINKLIGDDQSTVSHCVGGIDYIKEFLS Fare una ricerca di omologia nei soli funghi. Riportare accessionnumber e E-value della proteina più simile di Neuorspora Crassa. Riportare accessionnumber e E-valueddella proteina più simile di AspergillusNidulans. Bioinformatica

  50. Similarità nei DB - FASTA http://www.ebi.ac.uk/Tools/sss/fasta/ FASTA Sequence Similarity Search using the FASTA Bioinformatica

More Related