330 likes | 800 Views
学术报告之二 分子动力学方法应用. 学生:付健健 时间: 2012/12/10. 4. 5. 主要内容. 分子动力学模拟概论. 1. Amber 10.0 软件介绍. 2. 3. 分子动力学应用实例 -- 研究案例. 总结及展望. 4. 参考文献. 4. 1.1 分子动力学模拟概论. 经验力场模型 — 分子力学. 1 ) ab initio 方法 — 精确计算分子的电子性质,计算量大, 对大分子无法计算;
E N D
学术报告之二分子动力学方法应用 学生:付健健 时间:2012/12/10
4 5 主要内容 分子动力学模拟概论 1 Amber 10.0软件介绍 2 3 分子动力学应用实例--研究案例 总结及展望 4 参考文献 4
1.1 分子动力学模拟概论 经验力场模型—分子力学 1) ab initio方法—精确计算分子的电子性质,计算量大, 对大分子无法计算; 2)半经验方法—通过近似,可以用于较大的有机分子,但 对更大的如生物分子来说还是不适用; 3) 分子力学—用来研究大分子体系的性质
分子力学模型Molecular Mechanics(MM) 分子由原子组成,因此孤立分子或相互作用 体系的势能是原子坐标的函数,采用Newton方程 表示( 解析式) ,不使用波函数或电子密度。因此 分子力学可获得分子的平衡结构、振动光谱、热 力学性质等,但不能求得体系与电子结构有关的性 质。经验力场计算的结果有时与最高级别量子力 学计算的结果同样精确,而所耗计算机的时间很 少,因此广泛用于分子动力学等模拟方法。
经验力场的优缺点 • 优点:使用经验力场解决生物分子中各个原子之间的相互作用,可以节约大量计算时间 • 缺点:准确性较低,使用经验力场有一定的限制性。经验力场最明显也最重要的一个限制性就是模拟的生物分子不能发生重大构象变化,如化学键的断裂和重建。为了突破这样的限制性
经典力学 • 分子动力学模拟方法是建立在牛顿第二定律之上的,即牛顿运动方程: • F=ma
经典力学 • 牛顿运动方程: • 其中,Fi表示作用在质点i上的力,mi表示质点i的质量,而ai表示质点i的加速度。作用 • 力可以表达成势能的梯度函数,即 • 将上面两个式子进行整合,可得 • 其中V表示系统的势能。牛顿运动方程即表达成系统势能与随时间变化的质子位置之间的表达式。 • --------------------------------牛顿第二定律的一个简单应用: • 如果加速度恒定 • 有: • 因为速度是位移随时间的变化 • 有: • 将上列式子进行整个,可以得到某一时刻t与位置x的关系: • 其中x0和v0分别表示初始位置和初始速度。加速度可以表示为势能对位置的导数: • 所以,为了求取一个运动轨迹,必须知道系统中粒子的初始位置,初始速度分布和加速度,这些都可以从势能导数方程推导得到。比如,开始时间的粒子的位置和时间可以准确得到某一时刻t的位置和速度。初始位置可以系统实验结构数据得到,如X光衍射或者NMR实验。系统初始速度分布主要来自计算机随机分布,同时根据系统温度进行修正以确保系统的整体动量为零: • 其中,速度vi是根据温度在一个波尔兹曼分布或者高斯分布中随机抽取,所以原子i可以得到在温度T在x方向上的速度vx。 • 反过来,系统温度可以从速度求得: • 其中N表示系统中粒子数。
算法 由于系统地势能是系统内所有原子的位置的函数,方程十分复杂而没有解析解,只能用数值方法求解。几种常用的数值算法有: • 1、Verlet算法2、Leap-frog算法3、Velocity Verlet算法4、Beeman's算法 • 在选择不用算法是,要注意算法是否能保持系统内部动量的恒定,并可以高效地解决问题,同时允许进行比较长的步长模拟。 • 所有以上的算法都假定系统中原子的位置、速度和加速度可以利用泰勒张开近似求得: 其中,r表示位置,v表示速度(随时间变化的第一个因变量),a为加速度(随时间变化的第二个因变量)。
统计力学理论 • 分子动力学模拟可以得到原子显微水平的信息,包括原子位置和运 • 动速度。要将这些微观信息转化为宏观水平信息,如压强、能量、热容量等 • 等,需要用到统计力学理论。统计力学是分子动力学模拟生物系统研究的基 • 本理论 • 1、统计力学概论 • 在分子动力学模拟计算中,通常希望如计算一个分子系统的待定药物小分子 • 的结合自由能或者构象转化的能量变化等得到这个分子系统的宏观性质。这种微观模 • 拟以得到宏观性质的方法是以统计力学为基础的,因为统计力学用严格的数学方式表 • 达了这种宏观状态与系统内部原子和分子运动之间的关系;分子动力学模拟方法就是 • 根据这些严格的数学公式描述粒子的运动并求取这些数学公式的结果。利用分子动力 • 学模拟,可以研究系统的热力学性质以及时间依赖性的动力学现象。
系综 • 系综:一系列具有不同微观状态却表现出相同宏观热力学状态的系统的集合 。 • 微正则系综(NVE),该系综的系统的热力学状态表现为 • 内部粒子数N恒定不变,体积不变,同时系统能量也不变。 • 该系综主要见于孤立系统。 • 正则系综(NVT),这类系统内部热力学状态表现为粒子数N恒定, • 同时系统的体积和温度都保持不变。 • 等压等温系综(NPT),这类系统粒子数恒定,同时压强和温度保持不变。 • 巨正则系综(&mu VT),这一类系统的化学势&mu保持不变,同时体积和温度保持不变。
分子动力学模拟计算平均量 • 化学实验对象通常是一个可以观察其宏观状态的包含成千上万个原子或者分子的样品。在统计力学研究中,实验对象作表现的状态和现象对应于系综的平均值,这已经被实验所证明。一个系综的平均值是同时对系综所有系统同时取样得到。 在统计力学中,平均值定义为系综的平均值。系综平均值由得到。
势函数形式 • 分子力学中势能面是用解析经验势函数来描述的,体系的势函数可以分解成多种势函数的共同作用。通常分为键伸缩能Es 、键弯曲能Eb 、二面角扭曲能Etor、范德华作用能Evdw 和静电作用能Eelec
简单力场的函数形式 第一项表示成键原子间的相互作用,第二项表示分子 第一项表 示成键原子间的相互作用,第二项表示分子 中所有键角的贡献,用的均为谐振子模型,第三项为扭曲 势,表示键旋转时的能量变化,第四项是非键项,将计算所 有处于不同分子的以及同一分子中相距至少三个键的原子之 间的相互作用,在简单力场中,用库仑势描述静电相互作 用,Lennard -Jones势描述van der Waals作用。
力场 • 力场= 解析式+参数 • 力场具有可移植性。 • 力场可以较准确地预测其用来进行参数化的性 • 质,其它性质的预测可能不准确。 • 力场是经验性的—精度和速度的折中
原子类型(Atom Type) • 分子力学计算必须定义: • 原子的坐标和原子类型—决定参数的选取 • 分子中的C原子并不相同: • • 杂化形式 • • 原子上的电荷 • • 键连的原子
参数化 • 一般参数可从通用的力场参数文件中获得 • 如果缺乏某项参数,可采用相近原子类型的 • 参数,也可以通过计算从其它力场移植。 • 确定参数的工作十分复杂,一般从实验数据 • 或ab initio计算的结果进行拟合。 • 一般性计算对参数的要求并非要达到尽善尽 • 美,只要能够满足本体系的计算要求即可。 • 由于参数的问题,体系中不同类型的分子在 • 计算中可能产生系统误差。
常见力场 • AMBER —Assisted model building with energy refinement • 力场与程序同名,为蛋白质和核酸参数化,使用 力场与程序同名,为蛋白质和核酸参数化,使用 • 5 个键和非键项以及一个复杂的静电项,没有交 • 叉项,对蛋白质和核酸计算的结果非常好,对其 叉项,对蛋白质和核酸计算的结果非常好,对其 • 它体系则不定。 • • CHARMM—Chemistry at Harvard macromolecular mechanics • 力场与程序同名,初始为蛋白质和核酸设计,现 • 在可广泛用于生物分子、MD、溶剂化、晶体堆 • 积、振动分析以及QM/MM研究。使用5 个价键 • 项,其中1 个是静电项。 • GROMOS—Gronigen molecular simulation • 与程序同名,常用于预测分子和大量液体的动 • 力学运动,也用于模拟生物分子,有5 个价项, • 其中1 个静电项
常用软件中的力场 • Gaussian 98 • AMBER,DREIDING和UFF • Hyperchem • MM+, AMBER, BIO+(CHARMM),OPLS • CS Chem3D • MM2 • Tinker • AMBER, CHARMM, MM2, MM3, OPLS- UA, • OPLS- AA 和AMOEBA
分子力学的应用 • 对给定构型和力场的分子,分子力学程序可 • 以计算出能量。这个能量严格来讲应称之为 • 空间能(steric Energy) ,其能量零点为一个假 • 想分子的能量,该分子中,键长、键角、二 • 面角和非键作用均为strainless 值。 • 构型优化 • 构象搜索 • 分子动力学模拟 • Monte Carlo模拟
Amber 10.0软件介绍 • Amber是著名的分子动力学软件,用于蛋白质、核酸、糖等生物大分子的计算模拟。Amber也指一种经验力场(empirical force fields)。 力场和代码是分开的, 一些软件中包含amber力场, 而其他的力场也包含在此amber的软件中。 • 开发这个软件的是Kollman课题组 • AMBER提供两部分内容:用于模拟生物分子的一组分子力学力场(无版权限制,也用于其它一些模拟程序中);分子模拟程序软件包,包含源代码和演示(有版权限制,需要购买)。
AMBER主要程序 • AMBER主要程序 • Leap:用于准备分子系统坐标和参数文件,有两个程序: • xleap:X-windows版本的leap,带GUI图形界面 • tleap:文本界面的Leap • Antechamber:用于生成少见小分子力学参数文件的。有的时候一些小分子Leap程序不认识,需要加载其力学参数,这些力学参数文件就要antechamber生成 • Sander:MD数据产生程序,即MD模拟程序,被称做AMBER的大脑程序。 • Ptraj:MD模拟轨迹分析程序。相关结构的均方根偏差,氢键分析,时间相关函数,扩散行为等等。
研究案例——一种稳定蛋白质的全部原子结构预测和折叠模拟研究案例——一种稳定蛋白质的全部原子结构预测和折叠模拟 • Simmerling, C., Strockbine, B., Roitberg, A.E., J. Am. Chem. Soc., 2002, 124, 11258-11259 (http://dx.doi.org/10.1021/ja0273851) • 这篇论文应用AMBER FF99力场和经典的全原子动力学对一个肽的 • 折叠过程进行了模拟。模拟的对象“trpcage”是一个由20个氨基酸构成 • 的小肽,华盛顿大学的 Andersen已经对这个蛋白做过了结构优化, • 它是现在已知最小的能够显示两种不同折叠状态的蛋白,而且这个蛋 • 白在室温下可以稳定存在。该蛋白的小身量使得它成为模拟蛋白质折 • 叠的绝嘉对象。当最早的关于这个蛋白的折叠的计算结果出炉时,对 • 这个蛋白结构的实验测定还没有完成,所以整个模拟过程是在没有实 • 验数据作为指导的情况下完成的。当蛋白的结构经由实验手段测定之 • 后,人们惊喜地发现,计算机模拟的结果与实验测定的数值之间的 • RMSD值仅为1.4A。考虑到整个模拟过程是从蛋白的一级结构开始并 • 且完全没有同源蛋白作为参考,这样的一个计算结果是非常精确的。
第一步:构建起始结构 在以往的教程中,我们要么有一个可用的晶体结构,要么可以通过程序生成一个已经初步优化的结构。而在这个教程中我们要用的结构太复杂,没法通过手画的办法完成,同时我们也没有一个可用的PDB结构,因此我们就需要构建一个线形的肽链,非常幸运的是,在LEAP中有一个命令可以完成这个工作,就是sequence。 下面启动xleap并调用ff99力场: $AMBERHOME/exe/xleap -s -f $AMBERHOME/dat/leap/cmd/leaprc.ff99
第二步:创建prmtop和inpcrd文件 • 我们已经有了起始结构,下一步的工作是创建prmtop以及inpcrd文件 如果现在你已经关闭了xLEaP,可以重新打开并调入蛋白质结构: $AMBERHOME/exe/xleap -s -f $AMBERHOME/dat/leap/cmd/leaprc.ff99 >loadoff TC5b_linear.lib 然后调入修正的二面角参数: >loadamberparams frcmod.mod_phipsi.1 下面就可以存储我们的 prmtop和 inpcrd文件: >saveamberparm TC5b TC5b.prmtop TC5b.inpcrd 下面是生成的输入文件 TC5b.prmtop, TC5b.inpcrd
第三步:预优化蛋白质 • 在运行分子动力学模拟之前我们必须对起始结构进行短时间的优化,这样的话我们的体系就不会因为局部能量的聚集而在动力学过程中出现问题。结构优化的过程会整理整个分子结构,重新修整氢的位置,这样的过程之后我们的动力学模拟会比较稳定 。 • 下面是结构优化的输入文件:
第四步:体系加热. • 接下来我们要在这个体系中正式开始分子动力学模拟,首先我们要分7步花费50ps时间对体系进行升温模拟。将升温过程分为7步完成可以在每一步升温之后维持一段时间,以免一次升温造成体系能量聚集最终跑飞,另外一种可行的方法是对升温过程加一个权重限制。您可以参阅AMBER用户手册以获取更多信息。一般而言我们升温的最终目标是室温即300K但是为了重复文献的运算我们选择325K
第五步:生产相动力学模拟 • 本教程分子模拟部分的最后一步是在325K条件下进行一个时间非常长的动力学模拟。在文献中他们做了50ns的动力学模拟,但是实际上我们看到的结果在模拟进行了20ns之后就已经呈现在人们面前了,之后继续进行的30ns模拟的意义仅仅在于说明之前的计算获得的就是一个稳定的结果。 尽管文献的作者发现在模拟的最初5~20ns中蛋白就已经充分折叠,我们在本教程中仍然进行50ns的动力学计算,以重复文献的报道。
第六步:分析模拟结果 • 下面我们要开始分析模拟的结果,我们要绘制模拟过程的温度、总能量、动能、势能变化曲线,这些信息可以从输出文件中获取,检查这些数据也可以让我们知道在动力学模拟过程中有没有发生什么异常状况。我们可以看到,温度的曲线非常平滑,并且维持在325K。动能和势能的曲线也一样,会在平衡位置比较平滑。这些曲线任何的突刺都暗示了我们的模拟过程发生了一些意外,我们就需要看看是不是用了不好的起始结构、太长的动力学步长或者不合适的参数等等。
总结及展望 • 计算机模拟技术已经成为理论分析和实验观察之外的第三种科学研究手段,相信随着新的方法和理论的充实和巩固,分子动力学仿真技术将会为力学原理在更深层次上得到发展起到关键作用。从原子尺度方面出发来研究材料的力学行为。特别是研究蛋白酶和酶抑制剂以及它们的交互作用不仅可行.而且更为根本…
参考文献 • [1] A. D. MacKerell Jr., J. Wiórkiewicz-Kuczera, and M. Karplus (1995). An All-Atom Empirical Energy Function for the Simulation of Nucleic Acids, J. Am. Chem. Soc. 117, 11946-11975. • [2] S.N. Ha, A. Giammona, M. Field, J.W. Brady, A revised potential-energy surface for molecular mechanics studies of carbohydrates, Carbohydr. Res. (1988), 180(2), 207-221. • [3] D. McQuarrie, Statistical Mechanics (Harper & Row, New York, 1976) • D. Chandler, Introduction to Modern Statistical Mechanics (Oxford University Press, New York, 1987) • [4] M. Schlenkrich, J. C. Smith, R. Stote, J. Straub, M. Watanabe, J. Wiórkiewicz-Kuczera, D. Yin, M. Karplus (1998). All-atom Empirical Potential for Molecular Modeling and Dynamics Studies of Proteins. J. Phys. Chem. 102, 3586-3616. • [4] S.N. Ha, A. Giammona, M. Field, J.W. Brady, A revised potential-energy surface for molecular mechanics studies of carbohydrates, Carbohydr. Res. (1988), 180(2), 207-221. • [5] R. E. Wilde and S. Singh, Statistical Mechanics, Fundamentals and Modern Applications (John Wiley & Sons, Inc, New York, 1998)
AMBER主要程序 mm_pbsa:脚本,对MD轨迹自动后期处理,用连续溶剂方法进行热力学分析。它能够把能量归属到不同的氨基酸残基片断中去,并估算不同构像之间的自由能量差。 pmemd:这是一个在sander基础上进行重大修改的程序(最初由Bob Duke发起),用于优化周期性、PME模拟以及GB模拟过程。新版本Pmemd的计算速度要比Sander快,而且更适用于并行。此外,11版新增NVIDIA GPU加速,因此,它通常是一可选程序,除非你需要的选项它不支持。在新版模型中,我们可以理解为:
参考文献 • [19] Jean-Michel Pawlotsky.Therapeutic implications of hepatitis C virus resistance • to antiviral drugs. Therapeutic Advances in Gastroenterology. (2009) 2(4) 205–219. • [20] Melissa Palmer, M.D., Series Editor.The Future of Hepatitis C Beyond Protease Inhibitors–Will Hepatitis C be a Disease of the Past? INFLAMMATORY BOWEL DISEASE: A PRACTICAL . 2012,19(12):13-22. • [21] Robert A. Love et al.The Crystal Structure of Hepatitis C Virus NS3 Proteinase Reveals a Trypsin-like Fold and a Structural Zinc Binding Site. Cell,1996, 87,:331–342. • [22] Wu, X.; Rönn, R.; Gossas, T.; Larhed, M. Easy-to-Execute Car-bonylations: Microwave Synthesis of Acyl Sulfonamides Using Mo(CO)6 as a Solid Car Monoxide Source. J. Org. Chem.2005, 70, 3094–3098. • [23] 段桂运.丙型肝炎病毒NS3/4A蛋白酶抑制剂的设计与合成.化学试剂,2006,V28(2),124一125.