520 likes | 796 Views
生物信息学. 第九章 核酸序列的其他分析方法. 1. 确定 DNA 序列的分子量和碱基组成. 分子量( molecular weight ). 单链 DNA ( single strand DNA , ssDNA ) 双链 DNA ( double strand DNA , dsDNA ). 碱基组成( composition ). 各种碱基数量 各种碱基比例. 分析举例. 下载 BioEdit 分析工具 http://www.mbio.ncsu.edu/BioEdit/bioedit.html. 在本地计算机上利用 BioEdit 工具进行分析.
E N D
生物信息学 第九章 核酸序列的其他分析方法
1. 确定DNA序列的分子量和碱基组成 • 分子量(molecular weight) • 单链DNA(single strand DNA,ssDNA) • 双链DNA(double strand DNA,dsDNA) • 碱基组成(composition) • 各种碱基数量 • 各种碱基比例
分析举例 下载BioEdit分析工具http://www.mbio.ncsu.edu/BioEdit/bioedit.html 在本地计算机上利用BioEdit工具进行分析 拷贝fasta格式的序列,在BioEdit分析工具的“File”栏目选择“New from Clipboard”输入序列 选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic Acid→Nucleotide Composition” 文字分析结果和图形结果
2. 序列变换 • DNA-DNA序列之间变换 • DNA-RNA序列之间变换 AAAAATGGCCATGGGTCCACACGCAGTGAGATGAATGCTAGATCTCAC 原始DNA序列 互补序列 (complement) TTTTTACCGGTACCCAGGTGTGCGTCACTCTACTTACGATCTAGAGTG 反向序列 (reverse) CACTCTAGATCGTAAGTAGAGTGACGCACACCTGGGTACCGGTAAAAA 反向互补序列 (reverse complement) GTGAGATCTAGCATTCATCTCACTGCGTGTGGACCCATGGCCATTTTT RNA序列 AAAAAUGGCCAUGGGUCCACACGCAGUGAGAUGAAUGCUAGAUCUCAC
分析举例 在本地计算机上利用BioEdit工具进行分析 拷贝fasta格式的序列,在BioEdit分析工具的“File”栏目选择“New from Clipboard”输入序列 选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic Acid→Complement”获得互补序列、“Nucleic Acid→Reverse Complement”获得反向互补序列、“Nucleic Acid→DNA-RNA”获得RNA序列 在“Edit”栏目选择“Copy Sequence to clipboard (Fasta Format)”将获得的序列粘贴到另一个文件
DNA-蛋白质序列之间变换 AAAAATGGCCATGGGTCCACACGCAGTGAGATGAATGCTAGATCTCACGAG K N G H G S T R S E M N A R S H E 阅读框 1 阅读框 2 K M A M G P H A V R * M L D L T R 阅读框 3 K W P W V H T Q * D E C * I S R
确定开放读码框(ORF) ORF finder http://www.ncbi.nlm.nih.gov/projects/gorf/ 输入序列或注册号,选择密码表 显示结果,进行选择 翻译为蛋白质 序列比对、更改显示格式
分析方法-翻译全长DNA序列(举例1) 在本地计算机上利用BioEdit工具进行分析 拷贝fasta格式的序列,在BioEdit分析工具的“File”栏目选择“New from Clipboard”输入序列 选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic Acid→Translate →Frame 1”获得氨基酸序列 分析结果
分析方法-翻译选择的DNA序列区段(举例2) 在SRS检索主页(http://srs.ebi.ac.uk)点击“Tools” 在Tools网页选择“Nucleic Tools→Nucleic Translation →ShowseqN”,点击“Launch” 在ShowseqN网页粘贴序列,选择阅读框和密码表类型,确定翻译区域 分析结果
3. 分析限制性内切酶切割位点 • 展示DNA序列的酶切位点图 • 分离克隆基因或特定的DNA片段 • 分子标记,如CAPS(cleaved amplified polymorphism sequence)标记 • 可选择限制性内切酶 Restriction Map and MCS of pEGFP-N1 Vector
分析方法1(举例) 在本地计算机上利用BioEdit工具进行分析 拷贝fasta格式的序列,在BioEdit分析工具的“File”栏目选择“New from Clipboard”输入序列 选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic Acid→Restriction Map” 在“Create Restriction Map”页面中选择限制性内切酶种类、选择阅读框等后点击“Generate Map” 分析结果
分析方法2(举例) 利用在线分析工具NEBcutter进行分析 输入序列或注册号,或调取载体序列,选择酶和显示方式 显示结果 具体描述
其它分析限制性内切酶切割位点软件 • EnzymeX http://www.mekentosj.com/science/enzymex • RestrictionMapper http://www.restrictionmapper.org/ • DNAMAN http://www.lynnon.com/pc/pcmain_new.html
设计PCR引物 Forward primer Reverse primer • 确定PCR产物片段大小 • 确定引物所在区段 • 确定引物序列的长度范围 • 确定引物Tm(melting temperature)值范围
分析方法(举例) 采用Primer3(http://frodo.wi.mit.edu/primer3)或校内Primer3服务器 (http://redb.ncpgr.cn/modules/redbtools/primer3.php)进行分析 在Primer3的网页粘贴序列,修改参数 分析结果 Primer3与BLAST结合——Primer-BLAST
分析方法(举例) 采用Primer Premier进行分析 在Primer Premier的软件,File--New--DNA Sequence 粘贴序列 点击Primer,出来引物结果 点击Search,修改参数
DNA序列格式修饰 • 根据需要展示DNA序列 • 10个碱基一列,每行n列,方便阅读和使用 • 用数字刻度显示每个碱基位置 • 用颜色显示不同碱基 • 在序列左侧标注序列名称 在BioEdit中选择序列,在“File”栏目点击“Graphic View” 在菜单工具中选择各种修饰类型
在染色体上定位DNA序列 • 涉及 GenBank 的dbSTS 二级数据库和NCBI 的UniSTS 数据库 • 已知序列在染色体上的位置 • 有PCR引物序列的信息 • 采用electronic PCR(e-PCR)功能定位DNA序列(http://www.ncbi.nlm.nih.gov/projects/e-pcr/) Genome Res. 1997, 7: 541-550 • Forward e-PCR:用待分析序列检索dbSTS数据库或UniSTS数据库 • Reverse e-PCR:用STS序列检索核苷酸数据库
Forward e-PCR分析方法(举例) 在e-PCR网页点击“Forward e-PCR” 在Forward e-PCR网页粘贴序列或输入序列注册号 分析结果(检测到3个定位的marker),点击“Marker”栏目中的marker名称,查看在染色体上的具体位置 选择的marker在染色体上的物理或遗传位置
Reverse e-PCR分析方法(举例) 在e-PCR网页点击“Reverse e-PCR” 在Reverse e-PCR网页选择数据库(Dataset)、点击“UniSTS input”、输入序列注册号 分析结果
如: 如: EST annotation 批量自动分析 EST 1.在本地计算机进行 CAP3... sequence assembly BLASTX 2.在线进行 gene annotation InterProScan... 更多工具 Gene Ontology classification
生物信息学 第九章 核酸序列的其他分析方法 (上机操作)
大麦Mlo基因(Z83834)编码区的GC含量是多少? • 如何获得Z83834的反向互补序列? • 推测Z83834的ORF和翻译产物。 • BamHI可将Mlo基因的编码区切割开吗?
5. 请查询序列NM_018845的相关信息回答下列问题:这条核苷酸序列的编码区由多少个碱基组成?它编码蛋白质可能的功能是什么?若用限制性内切酶BamHI消化这条序列,可以得到几个片段?