460 likes | 696 Views
系统生物学 Toward System-level Understanding of Biological Systems. Tiantian Li 2003-10-29. What is Systems Biology?. 系统生物学是研究一个生物系统中所有组成成分( gene 、 mRNA 、 protein 等)的构成,以及在特定条件下这些组分间的相互关系的学科。系统生物学不同于以往的实验生物学 —— 仅关心个别的 gene 和 protein ,它要研究所有的 gene 、所有的 protein 、组分间的所有相互关系。 系统生物学是以整体性研究为特征的一种大科学 。
E N D
系统生物学Toward System-level Understanding of Biological Systems Tiantian Li 2003-10-29
What is Systems Biology? • 系统生物学是研究一个生物系统中所有组成成分(gene、mRNA、protein等)的构成,以及在特定条件下这些组分间的相互关系的学科。系统生物学不同于以往的实验生物学——仅关心个别的gene和protein,它要研究所有的gene、所有的protein、组分间的所有相互关系。系统生物学是以整体性研究为特征的一种大科学。 • 创始人:美国科学家 Leroy Hood • 1999年:The Institute for Systems Biology
Dr. Leroy Hood Hiroaki Kitano(北野宏明)
研究内容 • (1) the structure of the systems, such as genes, metabolism, and signal transduction networks and physical structures, • (2) the dynamics of such systems, • (3) methods to control systems, and • (4) methods to design and modify systems for desired properties.
产生背景 • DNA结构与功能 • 基因、基因组学与HGP • RNA结构与功能 • 蛋白质、蛋白质组学 • 分子生物学及相关技术 • 细胞生物学及相关技术 • 遗传、发育、疾病与进化相关知识的积累 • 新技术的突破 • ……
系统生物学的灵魂——整合 • 系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于:它是一种整合型大科学。 • 需要一套原理和方法将系统内部各个组分的行为(behaviors)与系统的特性及功能连接起来。 • 还原论整体论 • 避免机械唯物主义,1+1=3(系统科学的核心思想是:“整体大于部分之和”)
Studying the behaviors of all the elements in a biological system Healthcare System Biological System DNA Patients RNA Nurses Doctors Biomodules Government Hospitals Cells Networks Insurance Companies Proteins
首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等)整合在一起进行研究。首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等)整合在一起进行研究。 • 系统生物学研究所第一篇论文:整合酵母的基因组分析和蛋白质组分析,研究酵母的代谢网络(Ideker T, et al. Science, 2002, 292:929 )。 • 不同生物分子的研究难度不一样,技术发展程度不一样,它们的研究水平有较大的差距:基因组和基因表达方面的研究比较完善,蛋白质研究较为困难,生物小分子的代谢组分的研究更不成熟。 • 真正实现这种整合还有很长的路要走。
Integration of gene expression response with the network of known physical interactions
对于多细胞生物,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的整合。对于多细胞生物,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的整合。 • 系统科学的核心思想:“整体大于部分之和”;系统整体特性是不同组成部分、不同层次间相互作用而“涌现”的新性质。 • 对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个根本性的挑战。
系统生物学整合性的第三层含义:研究思路和方法的整合。系统生物学整合性的第三层含义:研究思路和方法的整合。 • 经典的分子生物学研究——垂直型的研究。(即采用多种手段研究个别的基因和蛋白质。首先在DNA水平上寻找特定的基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。) • 基因组学、蛋白质组学和其他各种“组学”——水平型研究。(即以单一的手段同时研究成千上万个基因或蛋白质。) • 系统生物学的特点——把水平型研究和垂直型研究整合起来,成为一种“三维”的研究。 • 此外,系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、计算机科学等各种学科的共同参与。
先人眼中的系统生物学 • 中医——天人合一的黑箱 • 1933 Cannon 稳态学说 • 1948 Wiener 生物控制论 • 1968 Ludwig von Bertalanffy 总体系统论 • 建立于生理学水平的对生物系统的认识 • 分子生物学的发展是系统生物学发展的催化剂。
系统生物学的基础——信息 • 生物学是一门信息科学: • 生物学研究的核心——基因组是数字化的; • 生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因,第二类信息是指控制基因行为的调控网络; • 生物信息是有等级次序的,而且沿着不同的层次流动。
根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。 • 生命是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量,以抵消其熵增过程。 • 因此,生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。
系统生物学研究范围 • (1) genomics and other molecular biology research, • (2)computational studies, such as simulation, bioinformatics, and software tools, • (3) analysis of dynamics of the system, • (4) technologies for high precision, comprehensive measurements.
对系统生物学的理解 • System Structure Identification ---Regulatory relationships of genes and interactions of proteins, cell-cell communication • System Behavior Analysis ---How to against external perturbations • System Control ---How to control the biological system • System Design ---personalized medicine, drug use, organ transplantation…
1. MEASUREMENT TECHNOLOGIES AND EXPERIMENTAL METHODS • 2. SYSTEM STRUCTURE IDENTIFICATION • 3. SYSTEM BEHAVIOR ANALYSIS • 4. ROBUSTNESS OF BIOLOGICAL SYSTEMS • 5. THE SYSTEOME PROJECT • 6. IMPACTS OF SYSTEMS BIOLOGY
1. MEASUREMENT TECHNOLOGIES AND EXPERIMENTAL METHODS • Systems biology is the quantitative study of biological processes as whole systems, instead of isolate parts.---2001年第二届国际系统生物学会 • It requires a comprehensive body of data and control of the quality of data produced so that it can be used as a reference point of simulation, modeling, and system identification. • For the computational and systems approach to be successful, measurement has to be (1) comprehensive, (2) quantitatively accurate, and (3) systematic.
关于comprehensive • Factor comprehensiveness ---被测物,gene, protein…cover的问题 • Time-series comprehensiveness ---反映系统动态连续变化的时间段 • Item comprehensiveness ---转录水平,蛋白互作,磷酸化,蛋白定位,其他特性等。
关于systematic • The ideal systematic measurement is simultaneous measurement of multiple features for a single sample. • 数据要多,从多个层面表现代表性;样品的实验条件须一致;microarray上关联的基因数据比分散的基因数据要更可信;数据的获取由in vitro转向in vivo;参数的设置要反映系统的动态变化;系统的不同组成部分,参数设置不同; • 还要考虑多细胞系统
Next-generation Experimental Systems • 实验过程自动化水平的提高和动态化处理; • 交叉技术的应用可以实现现在无法企及的功能; • 实验技术的微型化和精确定量化; • 高级图形处理算法与并行化超级计算机;
2. SYSTEM STRUCTURE IDENTIFICATION • How the structure of gene regulatory networks can be identified. • We must identify all components of the network, the function of each component, interactions, and all associated parameters. • True network out of multiple candidates should be identified.
Two major tasks of system structure identification • Network Structure Identification 1)BOTTOM-UP APPROACH 2)TOP-DOWN APPROACH • Parameter Identification
BOTTOM-UP APPROACH • 数据来源:独立生物学实验数据的积累 • 数据收集手段:特定研究范围的文字搜索 • 适合对象:大多数基因及其调控关系相对清楚,尤其适合大结局前的战场打扫。 • 优点:模拟精确 • 缺点:对于未知知识束手无策 • 应用:建立模型,通过改变参数设置,分析系统动态变化 • 举例:KEGG
TOP-DOWN APPROACH • 数据来源:芯片高通量数据 • 数据收集手段:聚类方法,但无法直接推导网络结构,Alternative methods尝试直接从表达谱数据中推导出网络结构 • 优点:大规模自动化系统化分析数据 • 缺点:二进制翻译过程中的信息损失(已有改进)模拟不精确 • 应用:未介绍
二者的结合 • It is unlikely that no knowledge is available before applying any inference methods • It can be assumed that various genes and their interactions are partially understood, and that it is necessary to identify the rest of the network. • By using knowledge that is sufficiently accurate, the possible space of network structures is significantly reduced.
Parameter Identification • 参数的设置要基于实验数据,模拟与实际相符; • 多参数设置产生的模拟结果与实际相符须注意; • 参数优化算法:找出最多的局部最小值,而非单一的全局最小值,结合实验,判断正确的参数设置。 • 参数优化设置方法:暴力穷举搜索,遗传算法,simulated annealing等。缺点是巨量运算。 • 个别例子说明参数的设置不十分重要。 • 参数的设置需要与理论分析结合,提高准确性。
3. SYSTEM BEHAVIOR ANALYSIS • 系统生物学的钥匙——干涉 • 系统生物学一方面要了解生物系统的结构组成,另一方面要揭示系统的行为方式。相比之下,后一个任务更为重要。 • 系统生物学研究的并非一种静态的结构,而是要在人为控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力学特征。
系统生物学中的干涉特点 • 首先,这些干涉应该是有系统性的,如酵母果糖代谢的9个基因逐一进行突变,研究在每一个基因突变下的系统变化。 • 其次,系统生物学需要高通量的干涉能力,如高通量的遗传变异。 • “发现的科学”(discovery science) • “假设驱动的科学”(hypothesis-driven science) • 系统生物学既需要“发现的科学”,也需要“假设驱动的科学”。先选择一种条件(干涉),然后利用“发现的科学”的方法,对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发现的科学”研究手段进行新研究。这两种不同研究策略和方法的互动和整合,是系统生物学成功的保证。
(1) the robustness and stability of the system, • (2) functionalities of the circuits. • Simulation • Analysis Methods
Simulation • 系统生物学的理想就是要得到一个尽可能接近真正生物系统的理论模型;建模过程贯穿在系统生物学研究的每一个阶段。离开了数学和计算机科学,就不会有系统生物学。 • 仿真仿什么?The behavior of gene and metabolism networks, high-level structures of chromosomes, P-P interaction…... • 为什么仿?Simulation is an essential tool not only for understanding the behavior, but also for the design process.
怎样仿?怎样分析? • The simulator needs to be coupled with parameter optimization tools, a hypothesis generator, and a group of analysis tools. • Algorithms behind these software systems need to be designed precisely for biological research. • 参数优化方法需要考虑全局/局部最小值,找到全局优化的设计。 • 基于现有算法的改进方法。
software systems • a database for storing experimental data, • a cell and tissue simulator, • parameter optimization software, • bifurcation and systems analysis software, • hypotheses generator and experiment planning advisor software • data visualization software.
Beside the software module itself, the exchange of data and the interface between software modules is a critical issue in data-driven research tools. • Systems Biology Mark-up Language (SBML) is a versatile and common open standard that enables the exchange of data and modeling information among a wide variety of software systems
Analysis Methods • bifurcation analysis, metabolic control analysis, and sensitivity analysis. • A group of analysis methods such as flux balance analysis (FBA) and metabolic control analysis (MCA) provides a useful method to understand system-level behaviors of metabolic circuits under various environments and internal disruptions. • 动态和非线性分析方法将会提供更强大的功能。
4. ROBUSTNESS OF BIOLOGICAL SYSTEMS • System Control • Redundancy • Modular Design • Structural Stability ---Engineering systems
System Control • 前馈:开放,简单 • 反馈:闭合,复杂
Redundancy Theoretical analysis combined with experimental data indicate that different pathways are used to attain essentially the same objective function.
Modular Design • Modular design ensures that damage in one part of the system does not spread to the entire system. • 举例:cellular structure • P53 mutation cell cycle check point, but not metabolic pathways, • In engineering wisdom, each low-level module should be sufficiently self-contained and encapsulated so that changes in higher-level structure do not affect internal dynamics of the lower-level module.
Structural Stability • Relative independence from specific parameters is an important feature of a robust system. • The structure of the circuit that is dominantly responsible for pattern formation rather than specific parameter values
5. THE SYSTEOME PROJECT6. IMPACTS OF SYSTEMS BIOLOGY7. CONCLUSION8.本文优缺点
Thank you!!! Suggestions, Please!