Computer-aided biotechnology: from immuno-informatics to reverse vaccinology

Computer-aided biotechnology:from immuno-informatics to reverse vaccinology 计算机辅助的生物工艺学：从免疫信息学到反向疫苗学

Abstract 包括人类在内的许多生物体基因测序已经完成，并且，高通量分析正广泛的用于分析庞大的生物组学数据。生物信息学对这些数据的处理及分析是至关重要的，而且，生物信息学也不断的促进了大规模的功能分析及特异对象的功能分析。精确的运算法则，使得生物科技人员可根据具有高置信度预测的计算机辅助策略开展实验。为了解决一些复杂的问题。在免疫信息学及反向疫苗学中，目前主要致力于改进,调整试验流程以及简便，自动化的生物信息学。对计算机辅助的生物工艺学发展趋势：预测性的研究将逐步的取代那些耗时，昂贵的试验流程。

Introduction 一、从功能性的生物信息学到计算机辅助的生物工艺学：早期的in silico分析的开发，缩短了实验时间并形成了随后的“湿实验”的研究趋势，每个分类学中家系的新的基因组序列及功能注解数据，使得研究者能够根据大量的数据集得到研究对象之间的相互关系，并能够研发出更加可靠的分析及预测工具。多同源序列的比对鉴定结构、功能信号信号的综合数据集扫描工具的综合数据集蛋白结构域轮廓催化部位的蛋白基序形成“从序列到功能”试验流程配体结合部位蛋白分选信号等扫描工具可根据已知序列的信号，推断目的序列可能的功能及调节机制生物信息学革命预示着计算机辅助的生物工艺学的诞生

二、计算机辅助的生物工艺学举例：免疫信息学二、计算机辅助的生物工艺学举例：免疫信息学生物信息学方法表明功能信息已经对分子免疫学产生了巨大的影响，并使得这一领域的研究者在考虑生物学及生物工艺学问题时，倾向于综合性的考虑：in silico及实验证据两者综合性的考虑来研究问题。为了处理实验证据的差异性，免疫信息学综合了生物信息学的各种领域：数据库的创建，管理；结构和功能信号的精确度及利用，预测工具的发展及利用。此外，各种运算规则已被用于预测工具的发展。 in silico方法中的这些功能潜力，已被用于反向疫苗学(RV)。RV代表着免疫学的革命，以及生物工艺学的里程碑；它也阐明了怎样通过鉴别，研究，in silico中在一定合理度上综合考虑一些问题，来解决一个复杂的生物学问题，譬如：疫苗的设计。

数据库及预测工具 一、免疫反应的分子基础---免疫原性区分体液免疫和细胞免疫有助于免疫原性的分类：体液免疫：抗体介导细胞免疫：主要组织相容性复合体MHCs和T细胞受体TCRs间的相互作用中，蛋白聚合的复杂系统(Figure 1). TCRs表现出较大范围的选择性和亲和力病菌抗原 TCRs结合其他细胞表面的MHCs。吞噬细胞处理，抗原形成肽段肽段呈递到细胞表面，与MHCs结合 MHCs，肽段，TCRs三元复合体(细胞免疫应答的关键 ) 抗原的识别：可通过抗体识别整个分子可通过T细胞识别一个或多个肽段。

Figure 1. Molecular and cellular players in antigen presentation and recognition. Cellular immunity is mediated by T-cells, which constantly patrol the body, seeking out foreign proteins originating from pathogens. The uptake of an antigen is followed by intracellular processing, which results in the production of small peptide epitopes that are presented at the cell surface and are bound to major histocompatibility complex (MHC) molecules (blue). The T-cell receptor (TCR, red) exhibits a wide range of selectivities and affinities; TCRs bind to MHCs, which are presented on the surfaces by other cells. It is recognition of such ternary MHC–peptide–TCR complexes (i.e. antigen recognition, yellow background box) that lies at the heart of both the adaptive, and memory, cellular immune response.

二、免疫反应相关的抗原鉴定 蛋白质 1.获得有效疫苗的起始步骤就是辨别最佳的保护性抗原多聚糖胶囊多聚糖胶囊：病原菌的培养及分子变异的出现，很难有效的维持疫苗的药效因此，主要的研究集中在：鉴别，测试蛋白抗原 2.蛋白抗原： ①.传统的研究是筛选病人的抗体 ②.病原菌完整基因组序列的获得，以及大量的新的生物信息学工具开启了抗原鉴定的新途径----基本原理主要是鉴定病原菌表面的各种蛋白----？在发病机理及毒力方面，病原菌表面暴露的蛋白或分泌蛋白与宿主细胞之间的相互作用，是一个关键步骤。在病原菌内，一些关键物都是蛋白，包括附着，入侵，分泌，信号传输，终止宿主反应，毒性，运动性，脂蛋白。 3.目前已经开始致力于阐明表面分子的结构以用于了解相互作用中的分子机制 Figure 2表示：Protein Data Bank(PDB)中一些已被证实的结构。

抗原鉴定方法---确定in silico标准，预测的合理基础 in silico标准：正则表达式（序列模式），特异的表面蛋白矩阵模式图等举例：革兰氏阴性菌：根据三聚的自运输体（外膜分泌蛋白）的特性，通过序列谱，可更易于对它们的鉴定；革兰氏阳性菌：包含LPXTG基序在内的序列谱用于鉴定细胞壁锚定结构域发现了特异针对抗原亚基的信号，如：2个保守基序--针对锚定于细胞壁的粘附素的配体结合区域。计算机方法来预测蛋白的亚细胞定位；从功能上鉴定抗原；

三、为什么要预测抗原决定簇？数据汇集的重要性三、为什么要预测抗原决定簇？数据汇集的重要性预测抗原决定簇的原因： 1.免疫量子，是免疫系统中最小的识别分子单位； 2.非肽类抗原决定簇， B细胞、T细胞肽类抗原决定簇； 3. MHC分子的肽段结合域具有非常多的结构形态--广泛的结合特异性； 4. T细胞，B细胞，可溶抗体的抗原决定簇的识别作用，是整个免疫应答的关键，这种认别激活了细胞免疫及体液免疫，并最终有效的摧毁了病原菌；因此，抗原决定簇作为疫苗的主要成分，精确的预测T细胞，B细胞的抗原决定簇是免疫信息学的关键环节。数据汇集的重要性：根据抗原的氨基酸序列预测出从抗原到抗原决定簇呈递的整个途径大量的精确模式数据精确性建模并整合为预测工具数据库

四.抗原决定簇鉴定的方法及流程 X射线晶体学分析MHC-肽复合物-----分析MHC肽结合域的构造实现的基础：基序，数量矩阵，机器学习技术，abinitio(从头计算) 1.依据基序的试验流程： ①检测含有一个特异等位基因编码的MHC结合肽； ②确定是否有在“特异锚着位”上具有“特异锚着氨基酸残基”的基序； ③对这些抗原基序序列进行扫描，检测出MHC结合域；局限性：在一些MHC结合域没有基序的结合以及在一些非保守位点可能存在二级锚着氨基酸残基结构，这两者都限制了这种方法的有效性。 2.依据数量矩阵的试验流程：优点:考虑到了每个位点上的每个氨基酸残基的贡献率，而不是依据基序的试验流程中只考虑到锚着位上的锚着氨基酸残基；局限性：不能处理非线性数据。QMs线性方法只能假定每个位点及每个氨基酸残基对于亲和力都具有各自独立的贡献率，但是，真实的数据是非线性,因为，亲和力并不是结合域中每个氨基酸残基贡献率的简单加和。

3.依据机器学习技术的试验流程： 优点：它能处理非线性数据，因此，能够高度精确的预测MHC结合域；局限性：需要大量准确的MHC结合域模式数据； 4.依据abinitio的试验流程：根据MHC分子与肽段结合部位的结构进行预测；高计算成本及MHC-肽复合物的三维构象限制了这一预测方法。 DiscoTope是一种利用蛋白三维构象数据预测非连续表位(抗原决定簇) 的新方法： DiscoTope的分析基础：通过抗体-抗原复合物的X射线晶体分析，确定非连续表位中的氨基酸数据，空间信息，表面可接触性。

五.根据抗原及抗原决定簇的鉴定设计疫苗 ㈠基于抗原决定簇设计疫苗一般有效的合成疫苗都含有一个或多个T细胞，B细胞抗原决定簇，以及非蛋白危险信号。疫苗的设计首要的就是研究抗原决定簇 1.MHC结合域的预测----疫苗亚基的设计在MHC结合域的预测的基础上，进行全面性研究(抗原处理在内的一些因素：对分裂位点的预测及TAP结合域的预测 ) 2.基于生物化学性质----预测连续性表位或线性表位和构象表位。 BEPITOPE：预测B细胞连续性表位的分布及在蛋白中的图谱。 CEP(构象表位预测)服务器：预测构象表位及预测抗原决定簇及序列表位 3.以T细胞表位为基础的疫苗设计： MHCsim数据库--特异MHC-肽复合物结构：根据数据库中储存资料()模拟分子模型，该数据库能够自动化的依据MHC-肽结构资料和数据库中的储存资料，实现分子动力学模拟。

㈡基于抗原的疫苗设计 设计抗微生物感染的疫苗中，粘附素是一个关键分子一、粘附素和粘附素样蛋白的鉴定：实验水平上非常的费时费力；生物信息学成为鉴定粘附素和粘附素样蛋白的理想策略；二、粘附素和粘附素样蛋白鉴定方法： 1.序列同源性为基础的实验方法功能非常的强大，能迅速的鉴定同源序列；但是，序列之间差异较大时，该方法就无法鉴定； 2.机器学习技术及分子组成特征被用于研发一些预测软件 ---基于序列性质的非同源性方法，克服上述的局限性；应用：SPAAN --一种利用神经网络方法对粘附素和粘附素样蛋白进行预测的软件程序：一个假定蛋白是粘附素的最终概率是五个网络数据库得出的个别概率的加权平均值； 3.通过抗原的基因组序列来寻找并识别假定的亚单位疫苗。该方法不是集中于预测抗原域，而是在识别细菌、病毒、肿瘤抗原数据库的阴性和阳性数据集的基础上，利用统计学模式，预测整个蛋白的抗原性。

反向疫苗学 RV是一个计算机辅助的生物工艺学的成功例子： 1.病菌基因组及序列分析工具使得在in silico中，基因组水平上实现寻找疫苗候选分子成为可能------RV 2.传统方法：培养病菌并鉴定保护性抗原 RV：利用的是潜在抗原的完整型谱 ----允许研究者得到更多的疫苗候选分子在体外不能表达或少量表达的抗原或不能培养的病菌的抗原 3.应用： RV研发了 ,传统疫苗不能有效针对脑膜炎奈瑟球菌B血清群(MenB)的疫苗： ①传统疫苗失败的原因：这种病菌亚群表面暴露多糖，并且与人类靶向高度相似，因此，可能导致弱免疫性或自身免疫性，从而阻碍了B群脑膜炎球菌疫苗的开发。 ②RV流程：MenB基因组测序及序列对比，基序扫描，SCL预测分析，确定了570个假定的表面暴露蛋白。将这些蛋白基因克隆，表达，350个成功表达，220个未表达，最终的血清分析表明有5个高效的疫苗候选分子。

结论 1.改进的计算法及组合的整合策略，为研究者分析复杂的生物学特性提供了高置信度的预测。 2.研究工作趋向于计算机辅助的生物工艺学：功能生物信息学日益取代了耗时，昂贵的大规模实验预测方法。 3.反向疫苗学证明了免疫信息学是如何支持生物工艺学研究。

Computer-aided biotechnology: from immuno-informatics to reverse vaccinology