820 likes | 1.15k Views
BioUML - интегрированная платформа для построения моделей виртуальной клетки и физиологических функций человека.
E N D
BioUML - интегрированная платформа для построения моделей виртуальной клетки и физиологических функций человека Колпаков Ф.А.1,2, Толстых Н.И.1, ВалеевТ.Ф.1, Киселев И.Н. 1,2, Кутумова Е.О. 1,2, Евшин И.С.1,3, Семисалов Б.В. 1,2, Шарипов Р.Н.1,4,Кондрахин Ю.В.1,2, Кель А.Э.1,5 1ООО «Институт системной биологии», г. Новосибирск, 2КТИ ВТ СО РАН, г. Новосибирск, 3НГУ, г. Новосибирск 4ИЦиГ СО РАН, г. Новосибирск 5geneXplain GmbH, г. Вольфенбютель, Германия www.biouml.org
План доклада • Технология BioUML • Методология • разработка компьютерной техники: • визуальное моделирование ( графическая нотация) • модульный подход • определение интерфейсов • переключатели • разработка программного обеспечения • итерационный подход • функциональные тесты • социальные технологии • совместные исследования (collaborativeresearch) • crowdsourcing • Новые экспериментальные данные • Модель виртуальной клетки (концепция) • Текущие результаты • Virtualcell • GTRD – Gene Transcription Regulation Database модели регуляции генной экспрессии генов • Proteome – база данных о количестве белков в клетке • Apoptosis - модель апоптоза из 13 модулей. • Virtual Human – база данных моделей различных физиологических функций человека. Содержит более 40 модулей связанных с работой сердечнососудистой системы и почки.
BioUML platform • BioUML is an open source integrated platform for systems biology that spans the comprehensive range of capabilities including access to databases with experimental data, tools for formalized description, visual modeling and analyses of complex biological systems. • Due to scripts (R, JavaScript) and workflow support it provides powerful possibilities for analyses of high-throughput data. • Plug-in based architecture (Eclipse run time from IBM is used) allows to add new functionality using plug-ins. BioUML platform consists from 3 parts: • BioUML server – provides access to biological databases; • BioUML workbench – standalone application. • BioUML web edition – web interface based on AJAX technology;
Main features • supported standards: SBML, SBGN, BioPAX, SED-ML, SBO, MIRIAM, CellML • some examples, CellDesigner extension support • state concept • SED-ML as workflow • Modular modelling: composite models, agent based models • systems biology – reproducible highthroughput data analyses: • analyses: algorithms, scripts, workflows • integration with R/Bioconductor, Galaxy • data: microarrays, NGS, ChIP-SEQ • visualization: genome browser • BioUML – as platform for collaborative research • Amazon EC2 servers • data repository - groups, projects, import/export, FTP upload • chat, history
JavaScript host objects allows to merge R/Bioconductor and Java/BioUML worlds R world Java/BioUML world
Main platforms for bioinformatics and BioUML R/Bioconductor Taverna scripts, statistics, plots standalone application powerful workflows standalone applicationpowerful workflows scripts, statistics, plots BioUML platform Eclipse plug-in based architecture, chemoinformatics web interface, collaborative research genome browser Eclipse plug-in based architecture, chemoinformatics workflows, web interface, collaborative research, genome browser Galaxy BioClipse
Main platforms for bioinformatics and BioUML R/Bioconductor Taverna scripts, statistics, plots standalone application powerful workflows • + systems biology • visual modelling • simulation • parameters fitting • … • + chat for on-line consultations standalone applicationpowerful workflows scripts, statistics, plots BioUML platform Eclipse plug-in based architecture, chemoinformatics web interface, collaborative research genome browser Eclipse plug-in based architecture, chemoinformatics workflows, web interface, collaborative research, genome browser Galaxy BioClipse
Методология • разработка компьютерной техники: • визуальное моделирование (графическая нотация) • модульный подход • четкое определение интерфейсов • переключатели (состояние) • разработка программного обеспечения • итерационный подход • функциональные тесты • социальные технологии • совместные исследования (collaborativeresearch) • crowdsourcing
Yuri Lazebnik “Can a biologist fix a radio?—Or, what I learned while studying apoptosis“. Cancer Cell, 2002, 2(3): 179-182
Biologist view Engineer’sview 2002 However, I hope that it is only a question of time before a user-friendly and flexible formal language will be taught to biology students, as it is taught to engineers, as a basic requirement for their future studies. My advice to experimental biologists is to be prepared. Y. Lazebnik, 2002
2010 Standards in systems biology SBML – Systems Biology Markup Language SBGN – Systems Biology Graphics Notation TNF-α module (SBGN)
Biologist view Engineer’sview
Biologist view Engineer’sview Last centaury: 50-70-th
Modules: clear specification of interfaces input/output contacts
Global quantification of mammalian gene expression control. • Schwanhäusser B, Busse D, Li N, Dittmar G, Schuchhardt J, Wolf J, Chen W, Selbach M. • Nature. 2011 May 19;473(7347):337-342. • - фибробласты мыши • одновременное измерение транскриптома и протеома для 5000+ генов • измерено время полураспада для всех мРНК и соответствующих белков • построена полногеномная модель для предсказания скорости синтеза мРНК и белков • Deep proteome and transcriptome mapping of a human cancer cell line. • Nagaraj N, Wisniewski JR, Geiger T, Cox J, Kircher M, Kelso J, Pääbo S, Mann M. • Mol Syst Biol. 2011 Nov8;7:548. doi: 10.1038/msb.2011.81. • HeLa cells • число молекул для 10 255 белков и 9207 соответствующих РНК • проведенный анализ показывает, что покрыто большинство белков и РНК кодирующих генов • The quantitative proteome of a human cell line. • Beck M, Schmidt A, Malmstroem J, Claassen M, Ori A, Szymborska A, Herzog F, Rinner O, Ellenberg J, Aebersold R.Mol Syst Biol.2011 Nov 8;7:549. doi: 10.1038/msb.2011.82. • человек, остеосаркома – U20S клеточная линия • количество молекул для 10 000+ белков • диапазон измерений – 7 порядков, от десятков до 20 000 000 молекул белка на клетку.
Виртуальная клеткаконцепция модели
Базовая модель • на основе данных • Schwanhäusser et al, 2011 • транскриптом • протеом • параметры • для мРНК – ksynth-RNA, kdegr-RNA • для белков - ktransl-p, kdegr-p
Базовая модель • на основе данных • Schwanhäusser et al, 2011 • транскриптом • протеом • параметры • для мРНК – ksynth-RNA, kdegr-RNA • для белков - ktransl-P, kdegr-P воздействие транскриптом(виртуальный микрочиповый эксперимент) протеом предсказание сравнение микрочип NGS мас-спекрометрия эксперимент
Базовая модель • на основе данных • Schwanhäusser et al, 2011 • транскриптом • протеом • параметры • для мРНК – ksynth-RNA, kdegr-RNA • для белков - ktransl-P, kdegr-P воздействие • моделирование воздействия: • путь передачи сигнала • задействованные гены • модели регуляции транскрипции соответствующих генов • базовая модель • транскрипция мРНК • трансляция белок
геном • набор регуляторных сайтов, полученных • в результате мета-анализа данных: • ChIP-SEQ • предсказанных сайтов • эволюционно-консервативных районов • микрочиповых экспериментов GTRD математические модели на основе геномных и транскриптомных данных транскриптом GTRD • Экспериментальные данные: • Schwanhausseretal., 2011 • Becketal., 2011 • Nagaraj N., 2011 протеом Proteome • система АДУ + дискретные события • модификации белков • образование комплексов • функции F для регуляции: транскрипции, трансляции, распада белков (например, через убиквитинирование) регуляторные пути Apoptosis Ubiquitomix метаболом система ОДУ
GTRDGene Transcription Regulation Database • Целью которой является: • построение моделей регуляции генной экспрессии для всех генов человека, мыши и крысы • ежеквартальное обновление моделей на основе вновь появляющихся данных • в полуавтоматическом режиме на основе сценариев (workflow) • Модели строятся на 2 уровнях: 1) набор сайтов связывания транскрипционных факторов, полученных в ходе • мета-анализа на основе данных: • - ChIP-SEQ • - предсказанных сайтов • - эволюционно-консервативных районов • - микрочиповых экспериментов. • 2) математические модели регуляции отдельных генов, представленные в виде дифференциальных уравнений;
Фрагмент сценария для автоматической • обработкиChIP-Seqданных
Моделирование генной экспрессии Фиксируем ген-мишень G. - экспрессия гена-мишени в момент времени t. - гены прямо или косвенно влияющие на его экспрессию (регуляторы). - уровень экспрессии i-того гена-регулятора в момент времени t. Модель регуляции гена-мишени: • Задачи: • Составление списка генов-регуляторов – на основе GTRD. • Выбор регуляторной функции (т.е. выбор модели). Исходные данные:
Варианты моделей 1. Линейная модель со сдвигом: 2. Простая нелинейная модель: 3. Стохастическая нелинейная модель: где - сигма-функция.