150 likes | 311 Views
Introduction of RefSeq and LocusLink: resources at the NCBI. Magno Inácio dos Santos. Artigos. Introducing refSeq and LocusLink: curated human genome resources at the NCBI RefSeq and LocusLink: NCBI gene-centered resources. Trends in Genetics,2000, Vol.16, No.1, pg.44-47
E N D
Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos
Artigos • Introducing refSeq and LocusLink: curated human genome resources at the NCBI • RefSeq and LocusLink: NCBI gene-centered resources • Trends in Genetics,2000, Vol.16, No.1, pg.44-47 • Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140 PARA MAIS INFORMAÇÕES...
Equipe/recursos • Os idealizadores destes projetos foram os pesquizadores; Kim D. Pruitt, Donna R. Maglott, Kenneth S. Katz e Hugues Sicote com recursos para construção e manutenção dos seguintes grupos: • Human Gene Nomenclature Committee • Online Mendelian Inheritance in Man • National Center for Biotechnology Information • contribuições individuais e institucionais
Objetivos • Encontrar a sequência de um gene; • determinar o que se sabe sobre um gene ou proteína; • estabelecer uma forma comum de referência para comparação de várias sequências e polimorfismos; • selecionar um número representativo de sequências para estudos de expressão em larga escala.
Uso das ferramentas • LocusLink organiza informações sobre genes gerando um banco de dados para serem acessadas informações de genes específicos; • Refseq proporciona referências de modelos sequenciais de genomas, transcrições e proteínas; • RefSeq e LocusLink proporcionam uma via direta para auxiliar a pesquisa em genes e linhagens de genes, variação, expressão gênica e apontamento genomico.
Análise do LocusLink • O LocusLink mantém informações descritivas sobre um“loci” incluindo nomenclatura, identificador de bancos de dados (locus ID), doenças associadas, posições no mapa e acréscimo de sequências; • O LocusLink mantém ligações diretas para facilitar pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene e dbSNP . • A pesquisa no LocusLink pode ser feita através de termos (como uma proteína ou nome de doença), símbolos de genes, sequências de acesso, e ID’s de bancos de dados. Http://www.ncbi.nlm.nih.gov/LocusLink.html Como acessar...
Análise do Refseq • O RefSeq transcreve registros de proteínas. • Diferente dos registros do Genbank, o RefSeq pode ser modificado depois de revisado por um Biólogo. • Uma sequência provisória é computada de um registro nucleotídico que tem uma região de codificação completa (CDS). O registro RefSeq de uma proteína é a tradução de um apontamento de CDS. Http://www.ncbi.nlm.nih.gov/LocusLink/refseq.html Como acessar...
RefSeq • Banco de sequências de referência • redundância do GenBank retirada • Inclui nº acesso • mRNAs (Nucleotide) NM • proteínas (Protein) NP • cromossomos inteiros (Genome) NC • Três níveis de curadoria para sequências NM: • predita, provisória e revisada • Além de entradas originadas de anotação do genoma
Três classes de NM • Predita: automática • cDNA com ORF sem função descrita • Provisória: manual • proteína com função conhecida ou inferida • o melhor representante do GenBank, mais anotado • Revisada: manual • compilação sobre o gene e seus transcritos • sequência, propriedades, nomenclatura, referências, retirada de vetor, adição de UTRs, domínios conservados, descrição da função do gene, links
Escolha das NM provisórias • Preferência para entrada GenBank com mais UTR; • Diferença com GenBank: • Inicialmente nenhuma • Anotação da entrada RefSeq vai ficando mais detalhada • Acrescenta dados de vários laboratórios e entradas • Seleção de um único representante; • redundância = somente isoformas de processamento • Pseudogenes não geram RefSeq; • Aparecem no GenBank
Anotação do genoma • Software indica presença de gene e proteína; • Sem comprovação de expressão: • Acesso • NT contigs genômicos construídos, • XM mRNA modelado (sem evidência EST), • XP proteína modelada
Download de sequências • Somente a entrada única do gene: Nome [Gene name] e srcd RefSeq [prop]; • Isoformas de processamento: Nome [Gene Name] e srcd RefSeq [properties]; • Todas as provisórias (combinar com organismo): Srcd RefSeq [prop] e provisional [all]; • Todas as revisadas (combinar com organismo): : Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional [all].
Aumento e manutenção • As informações levantadas no LocusLink e RefSeq estão sendo continuamente revisadas e aumentadas. O número de registros RefSeq triplicou, e o LocusLink expandiu cerca de cinco vezes num período de um ano.
Status atual • Registros RefSeq novos e atualizados são avaliados continuamente pelo público. • O site do LocusLink é atualizado semanalmente.