370 likes | 558 Views
Программа прямого обобщенного докинга FLM: валидация и исследование спектра энергетических минимумов комплексов белок- лиганд. И.В. Оферкин , Е.В. Каткова, А.В. Сулимов , В.Б . Сулимов. f. Dimonta , Ltd and Research Computing Center of Lomonosov Moscow State University. 2.
E N D
Программа прямого обобщенного докинга FLM: валидация и исследование спектра энергетических минимумов комплексов белок-лиганд И.В. Оферкин, Е.В. Каткова, А.В. Сулимов, В.Б. Сулимов f Dimonta, Ltd and Research Computing Center of Lomonosov Moscow State University
2 Действие лекарства Болезнь Белок Вируса Белок Человека Белок Активный Центр Белка Блокировка работы активного центра Органическая молекула -ингибитор В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ
Работа фермента 3 (Белок Человека Белок Вируса) ES Enzyme Substrate Product скорость реакции концентрация субстрата константа Михаэлиса
Работа фермента в присутствии ингибитора: competitive inhibition 4 Inhibitor [E] - концентрация свободного фермента [I] - концентрация свободного ингибитора [EI] - концентрация заингибированного фермента
5 Блокирование работы белка осуществляется молекулами – ингибиторами $500 M Основа нового лекарства – новые ингибиторы Для многих болезней известны белки-мишени, блокирование работы которых лечит болезнь Активный ЦентрБелка-Мишени 15 Лет! 50% времени затрачивается на разработку ингибиторов: экспериментально методом проб и ошибок Ингибитор Белок Суперкомпьютеры ускоряют разработку ингибиторов В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ
6 Стадии разработки нового лекарства Ключевой Самый дешевый этап Начальный этап Разработка базового соединения Lead compound Доклинические испытания базового соединения на животных Клинические испытания на людях 10-15 лет $ 500 000 000 В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ
7 Докинг, скоринг и скрининг – основа конструирования лекарств Молекулярное Моделирование Помогает быстрее и дешевле выполнять начальную стадию разработки • Докинг – позиционирование лиганда в активном центре белка • Скоринг – оценка энергии связывания лиганда с белком • Скрининг– перебор больших баз данных молекул с целью поиска кандидатов в ингибиторы – нужны суперкомпьютеры В.А.Садовничий, В.Б.Сулимов, НИВЦ МГУ
Влияние ингибитора на скорость реакции 8
Задача: найти ингибиторс низкой Ki 9 константа ингибирования свободная энергия связывания белка с ингибитором энтропия энтальпия газовая постоянная (8.31 Дж/К*моль) температура (310 К) ΔG = -10 ккал/моль лучше, чем ΔG = -5 ккал/моль
10 Движение лиганда в белке-мишени статистическая сумма (configuration integral)
Вычисление ΔG[1] 11 • Белок состоит из 103-104атомов, лиганд из 101-102атомов • Точность вычисления ΔG должна быть лучше, чем 1 ккал/моль = 0.04 эВ • Она не достигнута в существующих программах докинга • Многие программы докинга используют подгоночные коэффициенты в функции скоринга • Хорошие результаты получаются только для определенных белков и лигандов, но не для произвольно взятого белка и лиганда • Правильное позиционирование лиганда еще не означает правильное вычисление ΔG
Вычисление ΔG[2] 12 • Обычно используется силовое поле, которое плохо описывает межмолекулярные взаимодействия, в частности, водородные связи • Взаимодействие с растворителем не описывается или описывается весьма грубо, в то время как оно весьма существенно: ε=78.5 • Находится только одно положение связывания лиганда • Сложно учесть подвижность не только атомов лиганда, но и атомов белка, хотя бы водородов белка в активном центре • Должен производиться поиск минимума(ов) и комплекса лиганд-белок, и свободного белка, и свободного лиганда В программах докинга слишком много разных допущений и приближений, возможно, компенсирующих друг друга
SOL: программа классического докинга 13 поиск потенциальной энергии глобального минимума расчет свободной энергии <-- торсионно подвижный лиганд силовое поле MMFF94 жесткий белок, представленный сеткой потенциалов
Силовое поле MMFF94 14 E(r1, ..., rN) = [valence interactions] + [nonvalenceinteractions] EBij + EAijk + EBAijk + ETijkl + EOOPijkl EQij + EvdWij r1 r2 EBij = Aij*Δrij2 + Bij*Δrij3 + Cij*Δrij4 r3 Δrij EQij = Aqiqj/(Δrij+0.05) EAijk = Aijk*αijk2 + Bijk*αijk3 Δrij αijk
15 Ограничения SOL расчет потенциальной энергии вместо свободной использование сетки потенциалов очень упрощенная модель растворителя упрощенная MMFF-типизация учет энтропии через число торсионов, что неправильно[Chang, C.A.; Chen, W.; Gilson, M.K. Ligand configurational entropy and protein binding. PNAS, 2007, 104, 1534-1539]
16 CSAR benchmark 2012
Аппроксимация U(x) независимыми гармоническими ямами 18 G = -kT*ln(Z) Z = Z1 + Z2
22 комплекса для тестирования FLM 19 - 4 complexes of CHK1 (4FT0, 4FT9, 4FSW, 4FTA); - 2 complexes of ERK2 (4FV5, 4FV6); - 3 complexes of PIN1 (3IKD, 3IKG, 3JYJ); - 3 complexes of RNase A (3D6O, 3D6P, 3D8Z); - 2 complexes of thrombin (1DWC, 1TOM); - 6 complexes of urokinase (1C5Y, 1F5L, 1O3P, 1SQO, 1VJ9, 1VJA); - 2 complexes of factor Xa (2P94, 3CEN). 1C5Y Q=+1 NA=20 NT=2 1SQO Q=+1 NA=34 NT=4 1VJA Q=+1 NA=61 NT=17
22 комплекса для тестирования FLM 20 экспериментально известно положение связывания лиганда (нативное положение лиганда) константа ингибирования Ki Корреляция теоретических энергий связывания с логарифмом констант ингибирования Геометрическая близость(RMSD) к нативному положению
21 Программа FLM [1] Выбор системы: комплекс, свободный белок или свободный лиганд Анализ торсионных и декартовых степеней свободы Задание случайных начальных конфигураций в торсионах (~108) c1 c2 c3 c4 c5 Локальная оптимизация LBFGSв декартовых (~106) m1 m2 m3 m4 Проверка на совпадение m1 m2 (всего ~103) Пересчет пот. энергии с растворителем, расчет частот, Gi, Hi, TSi
22 Программа FLM [2]
23 Программа FLM [3] • силовое поле MMFF94 • отсутствует учет растворителя • задание начального положения лиганда - в торсионных координатах • локальная оптимизация начального положения лиганда - в декартовых координатах - методом L-BFGS: квазиньютоновский градиентный метод, критерий остановки - неубывание энергии вдоль градиента на шаге > 10-5Å
24 Быстродействие FLM Докинг 1 комплекса 25 000 CPU*hours 3*106пробных оптимизаций 3*105пробных оптимизаций 1C5Y (NA = 20, NT = 2) 1VJ9 (NA = 74, NT = 19) 9*105пробных оптимизаций 3*105пробных оптимизаций Докинг 1 свободного лиганда 100 CPU*hours Всего затрачено на 22 комплекса ~500 000 CPU*hours Эффективность на 8192 ядрах ~90% Одна пробная оптимизация лигандав комплексе: 1-10 минут Сравнимо с single pointMOPAC-расчетомили mcbhSOLV-расчетом
25 Быстродействие MOPAC Быстродействие MOPAC in vacuo[PM7 MOZYME] 1C5Y 1VJ9 4 sec 2 min свободный лиганд оптимизация 14 min 12 min свободный белок single point комплекс оптимизация по лиганду 7 hours 8 hours
26 Пример нижних мод 1sqo в двух минимумах ω102 = 4.7*1012 Hz, ω102 = 3.3*1012 Hz
27 Пример результатов FLM для урокиназы1vja
22 комплекса - "8"хороших и "14" плохих 28
Пример результатов FLM для урокиназы 1vja 29 ~4*105пробных оптимизаций, ~3*104 CPU-часов
30 Результаты FLM для урокиназыи фактора Xa (6+2) (сравнение с экспериментом) расчет эксперимент
31 MMFF94, PM7, PM7 COSMO сравнение с экспериментом
32 MMFF94, PM7, PM7 COSMO энергии минимумов 4FT0 MMFF94 PM7 PM7 COSMO
33 Выводы [1] • Получен валидационный набор минимумов • Нативноеположение может быть далеко от глобального минимума (как по RMSD, так и по энергии) • Парадигма докинганеточна: глобальный минимум энергии может лежать далеко от нативного положения • Основную роль играет потенциальная энергия глобального минимума
34 Выводы [2] • Теоретические энергии связывания на порядок превосходят экспериментальные • Диапазон изменений PM7 COSMO энергий связывания существенно меньше, чем у MMFF94 и PM7 энергий • PM7 COSMO чаще получает близкое к нативному положению в глобальном минимуме • Изменение способа расчета энергии существенно переупорядочивает минимумы
35 Перспективы развития • Уточнение расчета потенциальной энергии • Учет растворителя (PCM) • Ускорение PCM-расчетов (MCBHSOLV) • Более адекватное силовое поле • Квантово-химические расчеты межмолекулярного взаимодействия • Учет подвижности белка • Учет ангармонизма колебаний? • Ускорениевычислений (требуется по крайней мере в 1000 раз): • Более направленный, чем Монте-Карло, алгоритм поиска низкоэнергетичных минимумов (TTDOCK?) • Неполная оптимизация • Иерархический расчет энергий (MMFF94 -> PCM -> PM7)