840 likes | 1.14k Views
生物信息学实验. 实习 1 : 常用生物信息中心浏览及查询 一、 实习目标: 1 、了解 NCBI 、 DDBJ 、 EMBL 上网的方法自学各网站相关介绍。 2 、了解北大生物信息学中心等几大中文生物信息学网站。 3 、利用 NCBI 的 Entrenz 查询系统和 EBI 的 SRS 检索文献和核酸或蛋白质 序列。 1 、生物信息学网站浏览. NCBI 输入网址 (http://www.ncbi.nlm.nih.gov/). http://www.ncbi.nlm.nih.gov/.
E N D
实习1:常用生物信息中心浏览及查询 一、 实习目标: 1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。 2、了解北大生物信息学中心等几大中文生物信息学网站。 3、利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。 1、生物信息学网站浏览
NCBI 输入网址(http://www.ncbi.nlm.nih.gov/) http://www.ncbi.nlm.nih.gov/
2)European Molecular Biology Laboratory输入网址:http://www.ebi.ac.uk/embl/
3) DDBJ (DNA Data Bank of Japan )输入网址:http://www.ddbj.nig.ac.jp/
2、查询 1)Entrez (http://www.ncbi.nlm.nih.gov/Entrez/)查询 (1)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列 选择gene 输入arabidopsis phyE
arabidopsis phyE(光敏色素E)基因位于的染色体 由网页可知该基因位于拟南芥: Arabidopsis thaliana chromosome 4
(2)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列(2)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列 选中: nucleotide 输入: arabidopsis phyE
由搜索结果知: 序列编号: ACCESSION : NM_117923 碱基 : 3648 bp
点击FASTA, huo
编码拟南芥(arabidopsis)phyE(光敏色素E)基因mRNA的Fasta格式序列编码拟南芥(arabidopsis)phyE(光敏色素E)基因mRNA的Fasta格式序列
点击该处显示蛋白质的编码信息 点击该网页中的 NP-193547.4 获得其蛋白质的序列
获得蛋白质:LOCUS NP_193547 1112 aa linear PLN 28-MAY-2011可知氨基酸数目:1112aa
由记录查找过程知: 该基因位于拟南芥的第四条染色体上 由3648碱基构成;编码1112个氨基酸。 accession号是多少? arabidopsis phyEmRNA的accession号:NM_117923
(2)查询ID号为AAH05255的蛋白质序列并最终获得它的Fasta格式序列(2)查询ID号为AAH05255的蛋白质序列并最终获得它的Fasta格式序列
AAH05255的蛋白质 它来源于什么物种? Homo sapiens (human) 包含有多少个氨基酸? 110aa 是什么蛋白? Protein 1..110 /product=“insulin” (胰岛素)
3)查询一篇关于phyA的查考文献 选中: Pubmed 输入: Arabidopsis phyA
文献名称:Arabidopsis phytochrome a is modularly structured to integrate the multiple features that are required for a highly sensitized phytochrome. 作者名字:Oka Y, Ono Y, Toledo-Ortiz G, Kokaji K, Matsui M, Mochizuki N, Nagatani A 杂志名称: Plant Cell. 出版日期:2012 Jul;24(7):2949-62. Epub 2012 Jul 27.
实习二 BLAST和Fasta的使用 一、实习目标 1.掌握BLAST的基本功能并可熟练使用 2.了解FastA的基本功能及使用方法 1.BLAST 用NCBI中的BLAST在线工具搜索与其相匹配的序列。
由网页结构显示:accession NP_000530.1的序列相识度最高为100%
搜索的序列来自于Homo sapiens的rhodopsin(视紫红质)相似度到达100%
实习三 基因预测—Genscan 和ORF Finder 一 实习目标: 1、掌握ORF Finder对原核生物基因组进行基因预测。 2、能够利用genscan进行基因预测。 3、能够对预测的结果进行分析。 1. Genscan的使用 1.1、从NCBI下载基因序列核酸序列,保存其fasta格式到记事本(H.sapiens ENO3)
2.使用genscan进行基因预测:输入网址:http://genes.mit.edu/GENSCAN.html2.使用genscan进行基因预测:输入网址:http://genes.mit.edu/GENSCAN.html Organism选中: Vertebrate Print option选中: Predicted CDS and peptide 将搜索到的H.sapiens ENO3基因序列核酸序列输入到方框内
Predict genes/exons结果输出 起始位置、终止位置 该基因起始外显子从1624碱基处开始,到1708碱基处结束;接着有7个中间外显子;终止外显子在6837碱基处结束,其后还有polyA信号 起始外显子 中间外显子 终止外显子
2. ORF Finder 的使用 1.到ORF Finder进行基因预测 要求:通过简单的文字描述和图片记录预测过程;分析预测结果:预测出Rickettsia conorii 包含多少个长度大于300bp 的基因?列举几个它们在基因组中的起始终止位置?是正链还是负链?长度是多少?它们分别编码多少个氨基酸?有无重叠基因?(提示:列表说明)
输入网址:http://www.ncbi.nlm.nih.gov/gorf/gorf.html进入以下界面:输入网址:http://www.ncbi.nlm.nih.gov/gorf/gorf.html进入以下界面:
点击(例子1) 无重叠序列
点击(例子2) 有重叠序列
点击(例子3) 有重叠序列