E N D
1、糖组学(glycomics) 的背景及研究意义 • 20 世纪末,继基因组学、蛋白质组学之后,糖组学也日益受到人们关注。顾名思义,糖组学是对糖链组成及其功能研究的一门新学科,是基因组学的后续和延伸,具体内容包括研究糖与糖之间、糖与蛋白质之间、糖与核酸之间的联系和相互作用,其主要研究对象为聚糖。丰富多样的聚糖覆盖了生物有机体的所有细胞,不仅体现细胞的类型和状态,也参与了许多生物学行为,如细胞发育、分化、肿瘤转移、微生物感染、免疫反应等;聚糖还体现生物和分子的进化作用,如糖酵解、生物合成的保守性以及核糖的起源等。
示例: 糖链的生物学功能 (1)糖链在糖蛋白新生肽链折叠和缔合中的作用 研究表明:糖蛋白N-糖链在参与新生肽的折叠,维持蛋白质正确构象时起重要作用。 红细胞血凝素,如N-糖链 缺乏,则不能折叠呈三聚体
(2)糖链影响糖蛋白的分泌和稳定性 免疫球蛋白如缺乏N-糖链则不 能分泌到胞外而留在内质网中
(3)糖链参与分子识别和细胞识别 ●与血浆中老蛋白的清除有关 血清中很多蛋白质式含有以唾液酸残基为末端的N-糖链糖蛋白,称唾液酸糖蛋白,如免疫球蛋白、蛋白质激素,载体蛋白等。 如被唾液 酸酶降解 与肝细胞膜上的去唾液酸糖蛋白受体结合 胞吞作用并降解
●与精卵识别有关 受精是精子与卵子的融合。哺乳动物的卵子外面有一层透明的糖蛋白外衣,称透明带(zone pelluci da,ZP)。透明带由ZP-1、ZP-2和ZP-3三种糖蛋白组成,受精中起主要作用的是ZP-3,连接在ZP-3上的O -GalNAc糖链能被精子表面上的凝集素受体识别(有物种特异性)。O -GalNAc糖链的非还原端是一个α一连接的半乳糖残基,它可能在精卵识别中起关键作用。
●与细胞粘着有关 细胞粘着(cell adhesion)是进化中随着多细胞生物出现的必然现象。多细胞生物中细胞有相互识别而聚集成细胞群的能力——细胞粘着。细胞群或组织(tissue)中细胞与细胞之间充满着由糖蛋白(胶原蛋白、纤连蛋白、层粘蛋白)、蛋白聚糖、透明质酸等组成的胞外基质(extracellular matrix,ECM)。在整个生物体中,ECM形成一个连续的主体网络结构,所有的细胞都交织或浸泡在这一网状基质中,网络中细胞一细胞粘着,细胞一ECM粘着都是通过有关的膜内在蛋白质(integral membrane protein)完成的。这些膜蛋白称细胞粘着分子(cell adhesion molecule, CAM)或粘着蛋白,包括整联蛋白(integrin),钙粘着蛋白(cadher --in)免疫球蛋白超家族(Ig superfamily),血管地址素(vescular addressin) 选择蛋白(selectin)等。CAM 绝大多数都是含N一糖链的糖蛋白.例如整联蛋白是由α一和β一亚基组成的异二聚体,两个亚基上有多个N一糖基化位点。去糖链的整联蛋白完全失去与纤连蛋白的粘着能力。
(4)糖链影响糖蛋白的生物学活性 ●糖链与酶活性 糖链在酶的新生肽链折叠、转运和保护等方面普遍起作用。但糖链与成熟酶活性的关系因酶而异。有些酶除去糖链活性不受影响,如UDP-葡糖醛酸酶、酵母羧肽酶等。有些酶的活力依赖其糖链的存在, 如溶酶体β一葡糖苷酶除去糖链后只有免疫活性而而完全没有酶活力。
●糖链与激素活性 糖蛋白激素主要有腺垂体促激素类包括FSH(促卵泡激素),LH(促黄体生成激素)和TSH(促甲状腺 激素)以及胎盘绒毛膜促性腺激素和肾脏红细胞生成素(erytlmpoietin,EPO)等。 FSH、LH和TSH均由α亚基和β亚基组成,两个亚基都有N一糖链。糖链呈高度不均一性,例如LH和TSH中精链的外链末端有些为SO4--4GalNAc β 1,有些为Sia α2 → 3Gal β 1→,而FSH中的糖链都是以 Sia α2 → 3Gal β 1→为末端的。已经证明,带有SO4--4GalNAc β 1→末端结构的激素对受体的亲和力比带有Sia α2 → 3Gal β 1→末端的激素高,但在体内的半寿期前者比后者短,因为在肝脏网状细胞表面有特异结合SO4--4GalNAc β 1→为末端的糖链的受体,而Sia为末端的糖链则必须经唾液酸酶水解除去Sia从而暴露Gal后才能被半乳糖结合受体识别并清除。
●糖链与IgG 活性 每分子IgG 均含糖链约三条,几乎全部N一糖链都是复杂型,非还原末端残基为Sia或Gal(去Sia),少数为GlcNAc(去Sia-Gal), IgG的N-糖链多达30余种,呈高度不均一性。如IgG的N一糖链缺失外链Gal (这种糖链称G0 糖链)后,可成为一种自身抗原,被免疫系统识别而产生自身抗体。后者能与带有Go糖链的Ig G生成免疫复合体,沉积于关节腔内,引起炎症。这种免疫复合体是由带Go糖链的IgGFc段(作为抗原)和带末端Sia的IgG(作为抗体)Fab段结合而成,实际上是IgG的自身聚合物。类风湿性关节炎、红斑狼疮等都是一种与IgG的糖链结构改变有关的自身免疫病(autoimmune disease)。
总 之 • 毫无疑问,如果试图深入了解生命的复杂规律,就必须有“基因组-蛋白质组-糖组”的整体观念,这样才有可能揭示自身全部基因功能,从而进一步深入研究疾病的发病机制,有效控制疾病的发生、发展及预后,以及筛选疾病、预测诊断标记物和开发新的药物靶标。
2、糖组学的研究策略 • 糖组学的研究远较基因组学、蛋白质组学复杂。 • 目前糖组学关注的焦点是糖蛋白,为了更好地与蛋白质组学相关联,将研究对象锁定为糖肽。研究核心策略为: • (1) 分析单物种生物所产生的所有聚糖; • (2) 以糖肽为研究对象确认编码糖蛋白的基因; • (3) 结合有效的理化和生化性质,研究糖蛋白糖链的性质。 • 研究的重点在于: • (1) 编码糖蛋白的基因; • (2) 实际糖基化的位点; • (3) 聚糖结构; • (4) 糖基化的作用。 • 主要分为三大部分: 结构糖组学、功能糖组学以及生物信息学;其中结构糖组学主要包括“糖捕获”技术、前沿亲和层析技术等,功能糖组学主要包括微阵列技术等。
3、糖组学研究技术进展 1)结构糖组学 • 根据与糖链连接方式不同,蛋白质主要有N-连接和O-连接两种糖基化形式: 前者是糖链与蛋白Asn-XXX-Ser/Thr序列子(XXX 为除脯氨酸以外的氨基酸) 中Asn 残基上的 —NH2 相连;后者则是糖链与蛋白Ser/Thr 残基上的—OH相连。N-连接和O-连接糖蛋白主要定位于细胞膜表面,也可以分泌型蛋白的形式存在。此外,糖蛋白还有GPI锚定蛋白和近年来在细胞核和细胞质发现的O-GlcNAc(N-乙酰氨基葡萄糖 )修饰蛋白两种存在形式。
A、 N-糖链 ●N-糖链的共同结构花式:核心五糖 Glc-葡萄糖;Gal-半乳糖;Man-甘露糖 ;Fru-果糖 Rib-核糖;Fuc-岩藻糖;Sia-唾液酸;GlcA-葡糖酸 GlcUA-糖醛酸;GlcNAc — N-乙酰葡萄糖胺; GalNAc — N-乙酰半乳糖胺;NeuNAc —N-乙酰神经氨酸
B、 O-糖链 特点:与N-糖链相比结构简单,但连接形式多。 几种糖蛋白的寡糖链
小 结 • 糖链结构信息包括糖链的单糖组成、异头碳构型、糖苷键的连接位置和糖残基的序列分析等内容。糖蛋白糖链的结构分析包括糖蛋白的提取分离、糖链释放和糖链结构鉴定等多个步骤。
(1)糖蛋白的提取和分离纯化 • 糖蛋白多定位于细胞表面,属于膜蛋白,水溶性不好,其有效提取是糖组学糖链结构研究的瓶颈之一。目前常采用先制备质膜,然后用CHAPS 等去污剂释放或Triton X-114 相分离、有机溶剂萃取等方法提取糖蛋白。获得的糖蛋白主要采用透析、超滤、电泳和层析等方法来分离纯化,其中由几种不同类型凝集素亲合柱组成的序列凝集素亲合层析(serial lectin affinity chromatography, SLAC)法是较好的方法。
●SLAC • 研究发现,植物凝集素是一类能选择性地结合糖链的糖结合蛋白。利用这种特性可以特异性地富集某种糖蛋白/糖链。用于纯化糖蛋白/糖链的植物凝集素主要有刀豆凝集素(concanavalin A, Con A)、麦胚凝集素(wheat germ agglutinin, WGA)、豌豆外源凝集素(pea lectin)、植物血凝素(phytohaemagglutinin-E4 ,E4-PHA) 和网孢盘菌凝集素(Aleuria aurantia lectin,AAL)等。单一一种凝集素并不能够富集细胞中所有的糖蛋白/糖链,因此科学家们在上世纪80年代发明了一种被称作连续凝集素亲和色谱(serial lectin affinitychromatography, SLAC)的方法来分离同一细胞中的各种糖蛋白/糖链。这种方法是将不同的凝集素亲和柱串联排列,样品混合物依次经过这些亲和柱,这样就可将不同的糖蛋白/糖链富集在不同的柱中,提高了糖蛋白/糖链的回收效率和混合糖蛋白/糖链的分离效果。
The lectins tested recognize the following residues: • β-D-galactosyl [Ricinus communis agglutinin 120, (RCA-1) and peanut agglutinin, (PNA)]; • α-D-galactosyl [Griffonia simplicifolia agglutinin (GSA)]; • α-D-mannosyl>α-D- glucosyl [concanavalin A (ConA) and Lens culinaris agglutinin (LcH)]; • N-acetyl- and N-glycolylneuraminic acid[Limax flavus agglutinin (LFA) andLimulus polyphemus agglutinin (LPA)]; • N-acetyl-glucosaminyl and sialyl [wheat germ agglutinin (WGA)]; • N-acetyl-D-galactosaminyl [Helix pomatia agglutinin (HPA) and Dolichos biflorus agglutinin (DBA)] andα -L-fucosyl [Ulex europeus agglutinin (UEA-1)].
(2)糖链的释放 • 纯化后的糖蛋白样品即可进行糖链释放。糖链释放一般有化学释放和酶释放两种方法。 • 化学法主要有肼解法和β-消除法,前者可释放糖蛋白的N-糖链和O-糖链,目前已实现仪器自动化。但因该法反应条件剧烈,肼解后需对糖链进行乙酰化复原处理,而且蛋白部分已经破坏,无法进行有关糖基化位点的研究。 • 酶法释放糖蛋白糖链因方法简单,条件温和,能够提供有关糖链残基组成、排列顺序和糖苷键的α或β构型等信息,目前应用较广。较常用的释放N-糖链的特异蛋白酶有N-糖肽酶F(PNGase F) 和N-糖肽酶A(PNGase A) ,二者具有很好的互补性,常联合使用。而PNGase F 因广谱性好,也常单独使用。对于特异释放糖蛋白O-糖链的酶,目前发现的较少,且广谱性不强。
(3)糖链的分离纯化 A、层析法 • 柱层析是分离纯化糖蛋白糖链的常规方法,由分离机制不同可以有离子交换、分子筛、正相和反相等不同形式。一般常压和低中压柱层析所需样品量较大,而高效液相层析(HPLC) 因上样量少、灵 敏度高、重现性好、更加快速和自动化,是目前微量糖链分析的首选。不同结构的糖链在不同HPLC上的层析行为是不同的。 • 为了更充分、更准确地分离分析糖链混合物,可将几种不同类型的HPLC 组合成多维HPLC (MD-HPLC) ,如离子交换HPLC、正相HPLC、反相HPLC 组合就构成了3D-HPLC。为达到最大分离效率,各维之间的分离模式应是各自独立的,而且高维的分离速度应快于低维的分离速度,以避免已分开组分的重新混合。
前沿亲合层析(FAC)是近年来新兴的利用亲合层析技术定量分析两生物分子间结合程度的研究工具,具有简单、经济、准确和可操作性强等优点。在糖蛋白糖链结构研究中,FAC 常应用凝集素微柱来分离纯化和富集浓缩特定糖蛋白,而多元凝集素微柱的组合可以实现糖链的结构解析。 • Hirabayashi 等将13 种半乳凝素制成 FAC 微柱,观察了它们与41 种2-AP 标记糖链间的特异结合情况。结果表明半乳凝素可结合N-乙酰乳糖胺的3 个羟基,而不结合糖脂糖链和复杂型N-糖链等结构。FAC 微柱与电喷雾质谱联用( FAC-MS) 可对糖链混合物进行有效的分离分析, 功能强大。
B、电泳法 • 硫酸化、唾液酸化的糖链可用电泳法分离纯化。中性糖链通过与硼酸作用形成带电的复合物,也可用电泳分离。电泳技术不仅可以对糖蛋白糖链进行一定的分离纯化,还可以给出其相关的结构信息。荧光辅助糖电泳(FACE) 、毛细管电泳(CE) 等是糖链分离纯化、结构解析的常用工具。
(4)糖链结构的解析 • 分析糖复合物中的糖链结构是糖组学研究的核心内容之一,如何能快速准确测定糖链的结构成为糖生物学家最为关心的问题。 • 目前主要有3种方法: • 基于DNA测序仪的荧光糖电泳 • 用于糖链结构解析的质谱分析法 • 核磁共振技术
A、基于DNA测序仪的荧光糖电泳 • 荧光分子标记的单糖或多糖分子可以在20%-40% 聚丙烯酰胺凝胶中得到分离,同时检测荧光并与标准品进行比较即可得到相应的糖分子信息。但是由于普通的电泳胶的大小限制,无法得到彻底的分析结果。 • 基于以上的优缺点,Callewaert 等开发了一种基于DNA测序仪的荧光糖电泳(DNA sequencer-assisted,fluorophore-assistedcarbohydrateelectrophoresis, DSAFACE)用于测定N- 糖链的结构。 • 基本程序是,先用酶切割糖链,然后用荧光物标记糖链,再用高分辨率的ABI-377A 型DNA 测序仪进行电泳,最后用Genescan 软件对结果进行分析。 • 实验结果表明,用内切酶消化后再进行电泳,可检测到质谱无法达到的飞摩尔水平的聚糖或皮摩尔水平的糖蛋白上的糖链,其中飞摩尔水平的壳四糖检测信号的信噪比超过4 。而且在结构分析方面得到的信息与用基质辅助激光解析离子化飞行质谱所得到的结构信息完全一致
B、用于糖链结构解析的质谱分析法 • 到目前为止,质谱仍是糖生物学家应用最为广泛的测定糖链结构的工具。快原子轰击质谱(fast atom bombardment mass spectrometry, FAB-MS)、电喷雾质谱(electrospray mass spectrometry, ES-MS)、基质辅助激光解析离子化飞行质谱(matrix-assisted laser desorptionionization time-of-flight mass spectrometry,MALDI-TOF-MS)是目前在糖链结构测定方面应用广泛的3 种质谱,它们可以直接对样品进行离子化和解析作用以获得信息,而且可以对完整的糖复合物或者是片段化的样品进行分析。 • 质谱法测定糖链的另一个优点是可以与蛋白质分离设备,如H P L C 、C E 等进行联用,在H P L C和CE上分离的糖蛋白或寡糖可以直接进入质谱进行结构分析,这样就避免了在样品进行转运过程中的污染和损失,提高了分析效率和准确度
C、核磁共振技术(NMR) • 目前,NMR 技术已成为糖链立体化学结构分析最重要的方法之一,可确定糖链的构型、连接位置、分支和微观多样性。 • Shaw 等利用二维1H NMR技术对维持花生过氧化物酶稳定的3 个糖链进行了结构分析。 • Kogelberg 等利用ESI-MS 和1H NMR技术发现了人乳中新的糖链结构。 • 但NMR 测定糖的讯号峰重叠严重,解析较难,灵敏度不高,而且多维NMR 需要毫克级样品,这对多数糖复合物中的微量糖链是很难达到的。
2)功能糖组学研究技术 • 随着糖组学研究的深入,基于芯片的原理人们发明了用于糖组研究的各类糖芯片。自Wang 等首次报道用糖芯片进行研究以来,这种方法得到了广泛的应用。由于其具有信息量大、可进行自动化操作等特点,就如基因芯片对于基因研究和蛋白质芯片对于蛋白质组研究一样,糖芯片在糖组学的研究中同样也将扮演重要的角色。
(1)研究凝集素-糖相互作用的芯片 • 根据凝集素和寡糖之间的特异性相互作用,将寡糖或糖基复合物固定于芯片上,再用荧光素标记的凝集素进行杂交,检测阳性信号分析与已知凝集素相互作用的寡糖结构。这种方法的最大优点是可以同时检测多个样本,具有批量化、标准化和自动化的特点。 • Nimrichter等采用含有200个点的糖芯片研究鸡肝细胞对糖的吸附情况。研究表明表面含有C 型凝集素的鸡肝细胞可以特异结合到以各种链接方式固定的N- 乙酰葡萄糖胺残基的非还原性末端,而不能与半乳糖或N- 乙酰半乳糖胺的非还原性末端结合。
(2)杂交糖类/糖蛋白芯片 • Ratner等开发出一种杂交糖类/糖蛋白芯片,可以快速测定在结合过程中,蛋白质- 蛋白质相互作用和糖类- 蛋白质相互作用的主反应一方。通过将糖蛋白和它表面的寡糖都点到点阵上,就可以迅速证实结合的决定簇。 • 将GAPS II 型玻片用两种化学物质进行表面修饰,在一侧用马来酰亚胺修饰,另一侧用N-羟基丁二酰亚胺(N-hydroxysuccinimide,NHS)活化的酯进行修饰。然后分别将糖和糖蛋白点在同一张芯片的马来酰亚胺侧和N H S 活化的酯一侧,用一种糖结合蛋白杂交来确定蛋白肽是否是结合时所必需的成分。 • Adams 等应用这种技术证实了在HIV表面的糖蛋白gp120与人类蛋白相互作用过程中,gp120 的糖链起到了至关重要的作用。
(3)用于研究蛋白质-糖相互作用的表面质子共振技术(3)用于研究蛋白质-糖相互作用的表面质子共振技术 • 为了监测凝集素和固定化糖在玻片表面的相互作用,糖生物学家于上世纪90年代将表面质子共振(surface plasmon resonance, SPR)光谱应用于分析。 • 该技术是利用了物理光学的原理,在研究两分子相互作用时,将一种分子固定在传感片表面,而含有另一种分子的溶液流过其表面,两种分子的结合会使传感片表面的折射率改变,因此检测两分子间的相互作用。这种技术不仅可以时时监测两种分子的结合情况,还可以测量结合亲和力的强弱。 • Smith等将SPR 技术用于分析刀豆凝集素Con A 与甘露糖和木菠萝凝集素jacalin与半乳糖的相互作用。 • SPR 在糖芯片中的应用为糖组学研究提供了一种有力的研究工具。人们可以用它快速测定糖与凝集素或蛋白质之间的特异性作用,还可以对它们之间相互作用的增强剂或抑制剂进行高通量筛选分析。
3)生物信息学 • 糖蛋白糖链研究的信息处理、归纳分析以及糖链结构检索都要借助生物信息学来进行。目前这方面的数据库和网络信息很多,其中CFG、KEGG和CCSD 等就是糖蛋白糖链结构研究的很好资源。 • 比如利用CFG可以查找糖链亚结构、分子量和组成等许多参数;而CCSD 收集的众多糖链结构数据为糖谱的构建和糖链结构查新提供了很好的保障。 • 目前,借助生物信息学构建的标准糖谱已成为样品糖链结构鉴定的主要工具,但其强大功能的发挥还有赖于相关应用软件、数据库资源和计算机网络的发展和完善。 • 可以说,生物信息学是糖组学糖蛋白糖链结构分析技术平台不可缺少的一项,是国际合作和资源共享的结果,为糖链结构的测定和新糖链结构的发现提供了强大的技术支持。
4、糖组学的应用——在肿瘤研究中的应用 • 糖基化改变普遍存在于肿瘤的发生、发展过程中,分析糖基化修饰对于深入研究肿瘤的机制及诊断治疗至关重要,通过糖组学的方法分析肿瘤细胞与正常细胞之间所表现出来的糖蛋白的差异,作为诊断和控制疾病的工作焦点。 • 糖组学并不是以单个糖蛋白作为靶点,而是在任何可以改变生物体系的所有可能网络路径中发掘其影响,所以糖组学要求对多种种属群体成员进行筛选,以揭示那些发生在蛋白表达中与个体水平相类似的群体水平上的变化。
目前,双相凝胶电泳已经成功地用于鉴定糖蛋白差异,已报道众多的血清糖蛋白作为肾细胞癌的标记物; HPA 相关糖蛋白作为乳腺癌、结直肠癌的标记物等。 • 其次,糖基化的差异也被用于构建多糖类癌症疫苗,以特殊的多糖与合成多肽结合, 用于免疫治疗的不同策略已在临床试用。 • Meichenin 等发现一种新型肠肿瘤相关抗原———多聚凝集素抗原,抗体的特异性取决于糖链的结构,针对多聚凝集素抗原可以进行免疫治疗。 • 此外,糖组学还可以应用于估计肿瘤的预后。对于肿瘤发生、发展转移的基础研究,糖组学也起着重要作用。 • Ihara 等利用糖组学方法揭示了N-乙酰氨基葡萄糖基转移酶能够将蛋白裂解酶N 端糖基化,这是N-乙酰氨基葡萄糖基转移酶与肿瘤转移密切相关的重要原因。
5、展望 • 与基因组和蛋白质组学研究相比,糖组学的研究还处于起步阶段。阻碍糖组学迅速发展的主要是研究技术的限制和糖链本身结构的复杂性,目前尚没有一种技术可以快速、大量的测定细胞所有的糖链结构。 • 在期望能有更便捷的测定糖链结构的技术的同时,如何利用现有技术开展糖组学研究则更应是糖生物学家需要考虑的问题。在糖链富集方面,虽然凝集素对聚糖有特异性的结合作用,但是并不是所有的聚糖都有与之相特异结合的凝集素。在结构测定方面质谱仪是最主要的结构测定工具,但是昂贵的价格限制了其更为广泛的应用。DAS-FACE技术的出现开辟了一条测定N- 糖链结构的道路,但测定的结果还需要与质谱的结果进行比较确认。对于O- 糖链和GPI 糖基磷脂酰肌醇锚结构的测定目前仍是糖生物学家所面临的难题。 • 糖芯片技术的出现和SPR 技术的应用对于研究聚糖的结构和功能起到了相当大的推动作用,必将在糖组学研究中得到更为广泛的应用。
虽然目前还存在诸多的问题,但是糖组学研究这一崭新时代的到来是不可避免的,而且越来越多的科学家正投身到这一领域中。相信随着研究的深入,人们对生命本质的理解将会随之而达到新的高度。虽然目前还存在诸多的问题,但是糖组学研究这一崭新时代的到来是不可避免的,而且越来越多的科学家正投身到这一领域中。相信随着研究的深入,人们对生命本质的理解将会随之而达到新的高度。