400 likes | 926 Views
生物信息学. 第七章 蛋白质性质和结构分析 (I). Molecular weight: 109801.8 Theoretical pI: 6.12. Membrane protein.
E N D
生物信息学 第七章 蛋白质性质和结构分析 (I)
Molecular weight: 109801.8 Theoretical pI: 6.12 Membrane protein MAGIFYFILFSFLFGICDAVTGSRVYPANEVTLLDSRSVQGELGWIASPLEGGWEEVSIMDEKNTPIRTYQVCNVMEASQNNWLRTDWITREGAQRVYIEIKFTLRDCNSLPGVMGTCKETFNLYYYESDNDKERFIRESQFGKTDTIAADESFTQVDIGDRIMKLNTEIRDVGPLSKKGFYLAFQDVGACIALVSVRVFYKKCPLTVRNLAQFPDTITGADTSSLVEVRGSCVNNSEEKDVPKMYCGADGEWLVPIGNCLCNAGHEEQNGECQACKIGYYKALSTDASCAKCPPHSYSVWEGATSCTCDRGFFRADNDAASMPCTRPPSAPLNLISNVNETSVNLEWSSPQNTGGRQDISYNVVCKKCGAGDPSKCRPCGSGVHYTPQQNGLKTTRVSITDLLAHTNYTFEIWAVNGVSKYNPSPDQSVSVTVTTNQAAPSSIALVQAKEVTRYSVALAWLEPDRPNGVILEYEVKYYEKDQNERSYRIVRTAARNTDIKGLNPLTSYVFHVRARTAAGYGDFSEPLEVTTNTVPSRIIGDGANSTVLLVSVSGSVVLVVILIAAFVISRRRSKYSKAKQEADEEKHLNQGVRTYVDPFTYEDPNQAVREFAKEIDASCIKIEKVIGVGEFGEVCSGRLKVPGKREICVAIKTLKAGYTDKQRRDFLSEASIMGQFDHPNIIHLEGVVTKCKPVMIITEYMENGSLDAFLRKNDGRFTVIQLVGMLRGIGSGMKYLSDMSYVHRDLAARNILVNSNLVCKVSDFGMSRVLEDDPEAAYTTRGGKIPIRWTAPEAIAYRKFTSASDVWSYGIVMWEVMSYGERPYWDMSNQDVIKAIEEGYRLPPPMDCPIALHQLMLDCWQKERSDRPKFGQIVNMLDKLIRNPNSLKRTGSESSRPNTALLDPSSPEFSAVVSVGDWLQAIKMDRYKDNFTAAGYTTLEAVVHMSQDDLARIGITAITHQNKILSSVQAMRTQMQQMHGRMVPV
蛋白质性质和结构分析 • 序列相似的蛋白质具有相似的三维结构 • 不同蛋白质中相同的结构域(domain)具有相似的功能 • 分析蛋白质的功能 • 一级结构:氨基酸的排列顺序 • 二级结构:主要由氢键维系的结果(α-helix、β-sheet) • 三级结构:二级结构进一步折叠形成的结构域 • 许多生物信息学网站具有分析蛋白质性质和结构的软件
Swiss Institute of Bioinformatics (SIB) 的分析工具 • 蛋白质序列分析 • 蛋白质性质分析 • 蛋白质结构分析 • 2-D PAGE 分析 蛋白质性质和结构分析 ExPASy (Expert Protein Analysis System) http://www.expasy.org Nucleic Acids Research 2003, 31:3784-8
Technical University of Denmark (1993) • Protein sorting • Post-translational modifications of proteins • Immunological features • Protein function and structure CBS (Center for Biological Sequence Analysis) http://www.cbs.dtu.dk/services/
蛋白质性质和结构分析软件 ANTHEPROT http://antheprot-pbil.ibcp.fr/ DNAMAN http://www.lynnon.com/
(一) 分析蛋白质的一级结构 • 一级结构:蛋白质的氨基酸序列 • 分析内容 • 蛋白质的氨基酸组成 • 等电点(pI) • 分子量(molecular weight, Mw) • 疏水性(hydrophobicity) • 其它
1. 分析蛋白质的pI、Mw、氨基酸组成 打开ExPASy 主页,单击 “Resources A..Z” 选择“ProtParam”分析软件 在ProtParam主页粘贴序列进行分析 蛋白质的 pI、Mw、氨基酸组成等
2. 分析蛋白质的疏水性 打开ExPASy 主页,单击 “Resources A..Z” 选择“ProtScale”分析软件 在ProtScale主页粘贴序列、选择分析方法 蛋白质的亲水和疏水性分析结果,有文字和图形两种显示方式
-螺旋(-helix) • -折叠(-sheet) • 转角(turn) 环(loop) (二) 分析蛋白质的二级结构 • 二级结构:主要是氢键维持的结构 • 无规则卷(random coil)
预测蛋白质的-螺旋、-折叠及其它二级结构预测蛋白质的-螺旋、-折叠及其它二级结构 在“ANTHEPROT”栏目选择“SOPMA”分析软件 http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html 在SOPMA主页粘贴序列(FASTA格式) 螺旋、折叠、转角、无规则卷和其它二级结构
(三) 分析蛋白质的三级结构 1. 根据已知蛋白质结构推测未知蛋白质结构 在蛋白质结构数据库(PDB)中检索同源蛋白质的结构 BLAST 检索 2. 通过分子建模(molecular modeling)分析蛋白质结构 • 分析复杂 • 适用于专业人员
(四) 分析膜蛋白质 • 膜蛋白种类 • 整合蛋白(跨膜)integral (transmembrane) • 锚定蛋白 membrane-anchored • 外周蛋白 peripheral ①、②膜整合蛋白;③、④膜锚定蛋白;⑤、⑥外周蛋白
膜蛋白质结构特征 • 膜整合蛋白的跨膜区一般形成-螺旋 • 膜锚定蛋白的形成 • 直接与脂双分子层连接 • 通过糖分子间接与脂结合 如:糖基化磷脂酰肌醇(GPI)
1. 预测膜整合蛋白的跨膜区 在SOSUI主页选择分析“SOSUI” (http://bp.nuap.nagoya-u.ac.jp/sosui/) 在SOSUI:Submit a protein sequence网页粘贴序列 分析结果(1)、(2)
其它分析软件 • DAS:分析原核生物蛋白质的跨膜结构 (http://www.sbc.su.se/~miklos/DAS/maindas.html) • TMpred:分析蛋白质的跨膜结构和在膜上的方向(http://www.ch.embnet.org/software/TMPRED_form.html) • HMMTOP: 分析蛋白质跨膜结构和方向 (http://www.enzim.hu/hmmtop/html/submit.html) • TopPred: 分析细胞膜蛋白拓扑结构 (http://mobyle.pasteur.fr/cgi-bin/portal.py?#forms::toppred) • TMHMM: 分析蛋白质跨膜结构 (http://www.cbs.dtu.dk/services/TMHMM/)
2. 分析膜锚定蛋白的GPI位点 在“GPI Lipid Anchor Project”栏目选择“big-PI Predictor ”分析软件 在big-PI predictor主页递交序列 分析结果 • For Plant Proteins http://mendel.imp.ac.at/gpi/plant_server.html • For Fungal Proteins http://mendel.imp.ac.at/gpi/fungi_server.html
生物信息学 第七章 蛋白质性质和结构分析 (II)
(五)分析蛋白质的翻译后修饰 • 信号肽序列的特征 • 20-35 个氨基酸 • 富含疏水氨基酸的片段 • 至少有一个带正电荷的氨基酸
1. 分析信号肽及其剪切位点 在“CBS Prediction Servers”主页“Protein sorting”栏目选择“SignalP”分析软件 (http://www.cbs.dtu.dk/services/SignalP/) 在SignalP网页选择物种参照和分析方法,粘贴序列 分析结果 分析革兰氏阴性菌脂蛋白信号肽LipoP http://www.cbs.dtu.dk/services/LipoP/ 分析植物叶绿体信号肽ChloroP http://www.cbs.dtu.dk/services/ChloroP/
2. 分析糖链连接点 • 糖链连接方式 • O-连接:丝氨酸、苏氨酸、羟赖氨酸的羟基 • N-连接:天门冬酰氨的酰氨基
分析方法(1):分析O-连接糖蛋白 在“CBS Prediction Servers”主页“Post-translational modifications of proteins”栏目选择“NetOGlyc” 软件分析O-连接糖链的连接位点 在NetOGlyc网页粘贴序列 分析结果
分析方法(2):分析N-连接糖蛋白 在“CBS Prediction Servers”主页“Post-translational modifications of proteins”栏目选择“NetNGlyc” 软件分析N-连接糖链的连接位点 在NetNGlyc网页粘贴序列 分析结果
(六)分析蛋白质的亚细胞定位 有助于了解: • 蛋白质功能 • 蛋白质互作 Gene Ontology
线粒体蛋白质 • 内质网蛋白质 • 高尔基复合体蛋白质 • 过氧化物酶体蛋白质 • 溶酶体蛋白质 • 细胞核蛋白质 • 叶绿体蛋白质
分析蛋白质的亚细胞定位 打开PSORT 主页(http://psort.hgc.jp/) 根据待分析蛋白质来源物种差异选择不同软件 如选择WoLF PSORT 选择物种,粘贴序列 分析结果
(七)分析化学因子作用蛋白质的位点 打开ExPASy 主页 “Resources A..Z” 选择“PeptideCutter”分析软件 在PeptideCutter网页选择化学因子、粘贴序列 分析结果
生物信息学 第七章 蛋白质性质和结构分析 (上机操作)
从数据库中任选一蛋白质的序列作分析对象,熟悉分析蛋白质的一级和二级结构的方法。从数据库中任选一蛋白质的序列作分析对象,熟悉分析蛋白质的一级和二级结构的方法。 大麦Mlo基因(Z83834)编码的蛋白质是否是跨膜蛋白? 预测人Nanog基因(AY230262)编码产物的亚细胞定位。 人Nanog基因产物是否是糖蛋白?什么类型的糖蛋白? 分析人Nanog基因产物的亲水性和疏水性。
6. 分析一个甲虫基因(AF422804)编码的蛋白质的化学性 质和结构特点(请注明分析方法名称): 等电点是多少?分子量是多少? 是否膜蛋白质?如果是膜蛋白质,请注明跨膜结构位点。 是否具有GPI固定(anchor)的蛋白质? 7. 你从实验中获得一条由250个氨基酸组成的蛋白质的序列。你想了解该蛋白质的三维结构是否已知。根据你从“生物信息学”课中学到的知识,该如何寻找答案?