1 / 36

Dimonta , Ltd and Research Computing Center of Lomonosov Moscow State University

Программа прямого обобщенного докинга FLM: валидация и исследование спектра энергетических минимумов комплексов белок- лиганд. И.В. Оферкин , Е.В. Каткова, А.В. Сулимов , В.Б . Сулимов. f. Dimonta , Ltd and Research Computing Center of Lomonosov Moscow State University. 2.

Download Presentation

Dimonta , Ltd and Research Computing Center of Lomonosov Moscow State University

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Программа прямого обобщенного докинга FLM: валидация и исследование спектра энергетических минимумов комплексов белок-лиганд И.В. Оферкин, Е.В. Каткова, А.В. Сулимов, В.Б. Сулимов f Dimonta, Ltd and Research Computing Center of Lomonosov Moscow State University

  2. 2 Действие лекарства Болезнь Белок Вируса Белок Человека Белок Активный Центр Белка Блокировка работы активного центра Органическая молекула -ингибитор В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ

  3. Работа фермента 3 (Белок Человека Белок Вируса) ES Enzyme Substrate Product скорость реакции концентрация субстрата константа Михаэлиса

  4. Работа фермента в присутствии ингибитора: competitive inhibition 4 Inhibitor [E] - концентрация свободного фермента [I] - концентрация свободного ингибитора [EI] - концентрация заингибированного фермента

  5. 5 Блокирование работы белка осуществляется молекулами – ингибиторами $500 M Основа нового лекарства – новые ингибиторы Для многих болезней известны белки-мишени, блокирование работы которых лечит болезнь Активный ЦентрБелка-Мишени 15 Лет! 50% времени затрачивается на разработку ингибиторов: экспериментально методом проб и ошибок Ингибитор Белок Суперкомпьютеры ускоряют разработку ингибиторов В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ

  6. 6 Стадии разработки нового лекарства Ключевой Самый дешевый этап Начальный этап Разработка базового соединения Lead compound Доклинические испытания базового соединения на животных Клинические испытания на людях 10-15 лет $ 500 000 000 В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ

  7. 7 Докинг, скоринг и скрининг – основа конструирования лекарств Молекулярное Моделирование Помогает быстрее и дешевле выполнять начальную стадию разработки • Докинг – позиционирование лиганда в активном центре белка • Скоринг – оценка энергии связывания лиганда с белком • Скрининг– перебор больших баз данных молекул с целью поиска кандидатов в ингибиторы – нужны суперкомпьютеры В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ

  8. Влияние ингибитора на скорость реакции 8

  9. Задача: найти ингибиторс низкой Ki 9 константа ингибирования свободная энергия связывания белка с ингибитором энтропия энтальпия газовая постоянная (8.31 Дж/К*моль) температура (310 К) ΔG = -10 ккал/моль лучше, чем ΔG = -5 ккал/моль

  10. 10 Движение лиганда в белке-мишени статистическая сумма (configuration integral)

  11. Вычисление ΔG[1] 11 • Белок состоит из 103-104атомов, лиганд из 101-102атомов • Точность вычисления ΔG должна быть лучше, чем 1 ккал/моль = 0.04 эВ • Она не достигнута в существующих программах докинга • Многие программы докинга используют подгоночные коэффициенты в функции скоринга • Хорошие результаты получаются только для определенных белков и лигандов, но не для произвольно взятого белка и лиганда • Правильное позиционирование лиганда еще не означает правильное вычисление ΔG

  12. Вычисление ΔG[2] 12 • Обычно используется силовое поле, которое плохо описывает межмолекулярные взаимодействия, в частности, водородные связи • Взаимодействие с растворителем не описывается или описывается весьма грубо, в то время как оно весьма существенно: ε=78.5 • Находится только одно положение связывания лиганда • Сложно учесть подвижность не только атомов лиганда, но и атомов белка, хотя бы водородов белка в активном центре • Должен производиться поиск минимума(ов) и комплекса лиганд-белок, и свободного белка, и свободного лиганда В программах докинга слишком много разных допущений и приближений, возможно, компенсирующих друг друга

  13. SOL: программа классического докинга 13 поиск потенциальной энергии глобального минимума расчет свободной энергии <-- торсионно подвижный лиганд силовое поле MMFF94 жесткий белок, представленный сеткой потенциалов

  14. Силовое поле MMFF94 14 E(r1, ..., rN) = [valence interactions] + [nonvalenceinteractions] EBij + EAijk + EBAijk + ETijkl + EOOPijkl EQij + EvdWij r1 r2 EBij = Aij*Δrij2 + Bij*Δrij3 + Cij*Δrij4 r3 Δrij EQij = Aqiqj/(Δrij+0.05) EAijk = Aijk*αijk2 + Bijk*αijk3 Δrij αijk

  15. 15 Ограничения SOL расчет потенциальной энергии вместо свободной использование сетки потенциалов очень упрощенная модель растворителя упрощенная MMFF-типизация учет энтропии через число торсионов, что неправильно[Chang, C.A.; Chen, W.; Gilson, M.K. Ligand configurational entropy and protein binding. PNAS, 2007, 104, 1534-1539]

  16. 16 CSAR benchmark 2012

  17. 17

  18. Аппроксимация U(x) независимыми гармоническими ямами 18 G = -kT*ln(Z) Z = Z1 + Z2

  19. 22 комплекса для тестирования FLM 19 - 4 complexes of CHK1 (4FT0, 4FT9, 4FSW, 4FTA); - 2 complexes of ERK2 (4FV5, 4FV6); - 3 complexes of PIN1 (3IKD, 3IKG, 3JYJ); - 3 complexes of RNase A (3D6O, 3D6P, 3D8Z); - 2 complexes of thrombin (1DWC, 1TOM); - 6 complexes of urokinase (1C5Y, 1F5L, 1O3P, 1SQO, 1VJ9, 1VJA); - 2 complexes of factor Xa (2P94, 3CEN). 1C5Y Q=+1 NA=20 NT=2 1SQO Q=+1 NA=34 NT=4 1VJA Q=+1 NA=61 NT=17

  20. 22 комплекса для тестирования FLM 20 экспериментально известно положение связывания лиганда (нативное положение лиганда) константа ингибирования Ki Корреляция теоретических энергий связывания с логарифмом констант ингибирования Геометрическая близость(RMSD) к нативному положению

  21. 21 Программа FLM [1] Выбор системы: комплекс, свободный белок или свободный лиганд Анализ торсионных и декартовых степеней свободы Задание случайных начальных конфигураций в торсионах (~108) c1 c2 c3 c4 c5 Локальная оптимизация LBFGSв декартовых (~106) m1 m2 m3 m4 Проверка на совпадение m1 m2 (всего ~103) Пересчет пот. энергии с растворителем, расчет частот, Gi, Hi, TSi

  22. 22 Программа FLM [2]

  23. 23 Программа FLM [3] • силовое поле MMFF94 • отсутствует учет растворителя • задание начального положения лиганда - в торсионных координатах • локальная оптимизация начального положения лиганда - в декартовых координатах - методом L-BFGS: квазиньютоновский градиентный метод, критерий остановки - неубывание энергии вдоль градиента на шаге > 10-5Å

  24. 24 Быстродействие FLM Докинг 1 комплекса 25 000 CPU*hours 3*106пробных оптимизаций 3*105пробных оптимизаций 1C5Y (NA = 20, NT = 2) 1VJ9 (NA = 74, NT = 19) 9*105пробных оптимизаций 3*105пробных оптимизаций Докинг 1 свободного лиганда 100 CPU*hours Всего затрачено на 22 комплекса ~500 000 CPU*hours Эффективность на 8192 ядрах ~90% Одна пробная оптимизация лигандав комплексе: 1-10 минут Сравнимо с single pointMOPAC-расчетомили mcbhSOLV-расчетом

  25. 25 Быстродействие MOPAC Быстродействие MOPAC in vacuo[PM7 MOZYME] 1C5Y 1VJ9 4 sec 2 min свободный лиганд оптимизация 14 min 12 min свободный белок single point комплекс оптимизация по лиганду 7 hours 8 hours

  26. 26 Пример нижних мод 1sqo в двух минимумах ω102 = 4.7*1012 Hz, ω102 = 3.3*1012 Hz

  27. 27 Пример результатов FLM для урокиназы1vja

  28. 22 комплекса - "8"хороших и "14" плохих 28

  29. Пример результатов FLM для урокиназы 1vja 29 ~4*105пробных оптимизаций, ~3*104 CPU-часов

  30. 30 Результаты FLM для урокиназыи фактора Xa (6+2) (сравнение с экспериментом) расчет эксперимент

  31. 31 MMFF94, PM7, PM7 COSMO сравнение с экспериментом

  32. 32 MMFF94, PM7, PM7 COSMO энергии минимумов 4FT0 MMFF94 PM7 PM7 COSMO

  33. 33 Выводы [1] • Получен валидационный набор минимумов • Нативноеположение может быть далеко от глобального минимума (как по RMSD, так и по энергии) • Парадигма докинганеточна: глобальный минимум энергии может лежать далеко от нативного положения • Основную роль играет потенциальная энергия глобального минимума

  34. 34 Выводы [2] • Теоретические энергии связывания на порядок превосходят экспериментальные • Диапазон изменений PM7 COSMO энергий связывания существенно меньше, чем у MMFF94 и PM7 энергий • PM7 COSMO чаще получает близкое к нативному положению в глобальном минимуме • Изменение способа расчета энергии существенно переупорядочивает минимумы

  35. 35 Перспективы развития • Уточнение расчета потенциальной энергии • Учет растворителя (PCM) • Ускорение PCM-расчетов (MCBHSOLV) • Более адекватное силовое поле • Квантово-химические расчеты межмолекулярного взаимодействия • Учет подвижности белка • Учет ангармонизма колебаний? • Ускорениевычислений (требуется по крайней мере в 1000 раз): • Более направленный, чем Монте-Карло, алгоритм поиска низкоэнергетичных минимумов (TTDOCK?) • Неполная оптимизация • Иерархический расчет энергий (MMFF94 -> PCM -> PM7)

  36. Спасибо за внимание

More Related