640 likes | 991 Views
Структурное выравнивание. Структурное выравнивание - Структура vs Структура - Докинг Структурное моделирование ( Структура vs Структура ) - Homology modeling - Fold recognition/ Threading. Structural Alignment. Conserved 1º sequences похожие структуры
E N D
Структурное выравнивание • Структурное выравнивание - Структура vs Структура - Докинг • Структурное моделирование (Структура vs Структура) - Homology modeling - Fold recognition/ Threading
Structural Alignment • Conserved 1º sequencesпохожие структуры 2) Похожие структуры conserved 1º sequences ?
Почему структурное выравнивание? • Группировка/классификация белков по структурам (по схожести) • Определение вклада отдельных аминокислот в образование 3D структуры • Определение дистантных гомологов в белковых семействах • Предсказание функции белков с низким уровнем sequence similarity с другими белками • Исследования: • Структурно-функциональные отношения • Эволюция • Общие блоки\сайты связывания - мотивы
Distance Based Matrix A B • DDM’s • Самый простой метод сравнения структур • Не требует ни трансформаций, ни поворотов, ни совмещений • Очень эффективен для поиска движений в шарнирах или локальных отличий • • Интуитивно понятная мера похожести
Выравнивание структур белков • Уровни описания структуры: • Atom • Group • Fragment • Элементы вторичной структуры (SSE) • Описание структуры - особенности: • Геометрия/архитектура - координаты/относительные позиции • Топология - порядок аминокислот в белке, взаиморасположение мотивов • Свойства - физико-химические свойства аминокислот
Описание структур • Scoring Equivalences: • Coordinate based - defined using a transformation of one structure onto the other:root mean square deviation – RMSd • Similarity of properties between equivalenced elements - conserved/similar amino acid • Similarity of relations between pairs of equivalenced elements - similar distances, internal RMSd • Pitfalls of RMSD: • all atoms are treated equally (residues on the surface have a higher degree of freedom than those in the core) • best alignment does not always mean minimal RMSD • significance of RMSD is size dependent • Alternative RSMDs • aRMSD = best root-mean-square deviation calculated over all aligned alpha-carbon atoms • bRMSD = the RMSD over the highest scoring residue pairs • wRMSD = weighted RMSD • ( W. Taylor(1999), Protein Science, 8: 654-665. • http://www.prosci.uci.edu/Articles/Vol8/issue3/8272/8272.html#relat) Structure I Structure II Feature Extraction Structure Description II Structure Description I Comparison Algorithm Constrains Scoring Equivalence RMS Scoring Assessment Statistical Significant? Accurate?
B Поиск оптимального выравнивания • Поиск наибольшего количества атомов, выравненных с наименьшим RMSD (Root Mean Squared Deviation) • Поиск баланса между локальными областями с очень хорошим выравниванием и общим выравниванием
Требования для сравнения структур 1. Какой атом структуры A соответствует другому атому структуры B? Вариант ответа – в выравнивании последовательнсотей THESESENTENCESALIGN----NICLEY ||| ||| || || ||||| |||||| THE—SEQ--ENCE--ALIGNEDNICELY 2. Позиции\координаты атомов в структуре? Ответ: PDB-файлы (Dihedral angles, bond lengths …) How good is a particular choice of heuristic and what is the computational cost of the search?
Локальное выравнивание вторичных структур Поиск первичного выравнивания двух белков при помощи динамического программирования для векторов вторичной структуры A B
Сопоставление атомов • Применение жадных методов ближайшего соседа для минимизации RMSD между Cαатомами пробы и шаблона (i.e. поиск локальных минимумов в пространстве выравнивания)
Core Superposition Поиск лучшего выравнивания последовательно идущих Cα атомов и минимизация RMSD между ними
RMSD в множественном выравнивании структур A B
RMSD без выравнивания • 0.0-0.5 Å -> Essentially Identical • <1.5 Å -> Very good fit • < 5.0 Å -> Moderately good fit • 5.0-7.0 Å -> Dubious relationship • > 7.0 Å -> Structurally related • > 12.0 Å -> Completely unrelated
Пример: Zinc Fingers 3znf and 4znf 248 atoms RMS = 1.42Å 30 CA atoms RMS = 0.70Å
Сервера для выравнивания структур • LOCK - hierarchical protein structure Superposition • 3dSearch - fast secondary structure superposition • CE -Tools for 3-D Protein Structure Comparison and Alignment Using the Combinatorial Extension (CE) Method (no hetero atoms). • Дополнительная информация об алгоритмах • http://cmgm.stanford.edu/~brutlag/Papers/singh00.pdf
Алгоритмы структурного выравнивания Distance based methods: • DALI (Holm and Sander): Aligning scalar distance plots (similarity between the 2-D distance matrices) • STRUCTAL (Gerstein and Levitt): Dynamic programming using pair wise inter-molecular distances • SSAP (Orengo and Taylor): Dynamic programming using intra-molecular vector distances • MINAREA (Falicov and Cohen): Minimizing soap-bubble surface area Vector based methods: • VAST (Bryant): Graph theory based secondary structure alignment • 3dSearch (Singh and Brutlag): Fast secondary structure index lookup Both • LOCK (Singh and Brutlag): Hierarchically uses both secondary structure vectors and atomic distances
Ресурсы • Reviews in computational chemistry, vol. 17, 2001, 1-59 • http://www.zbi.uni-saarland.de/zbi/stud/lehrveranstaltungen/ws01/bioinformatikI/materialien/PL-Docking.pdf • Reviews in comp. chem., Vol 17. 2001. Ed. Kenny B. Lipkowitz, Donald B. Boyd
Молекулярное узнавание – центральный феномен в биологии • ФерментыСубстраты • РецепторыСигналы (лиганды) • Антитела Антигены • Классификация проблем докинга • Докинг белок-лиганд • Rigid-body докинг • Flexible докинг • Докинг белок-белок • Докинг белок-ДНК Почему докинг?
Дано: две молекулы в 3D с атомарным разрешением: • Связываются ли они друг с другом? Если да: • Как выглядит комплекс? • Насколько сильно связывание? • Структуры белок-лиганд • X-ray (PDB: 20946 entries from X-ray) • NMR • Важность 3D структур • Разрешение < 2.5Å • Проблема моделирования гомологов Проблема молекулярного докинга
Основные принципы • Связывание молекул основано на взаимодействии • H-связи, солевые мостики, гидрофобные контакты, эдектростатические взаимодействия • Очень сильное отталкивающее влияние VdW на коротких дистанциях. • Случайные взаимодействия – слабые и короткие. • Сильное связывание предполагает комплементарность поверхностей. • Большинство молекул гибкие.
Binding Affinity • Склонность к связыванию – энергетическая разность между связанным и свободным состояниями. • Среда (обычно вода) играет важную роль. • Энтропия вносит значимый вклад. • Binding affinity описывает комплекс, а не единичные структуры.
Applications • Оценка склонности к связыванию • Поиск ключевых структур для белка\ов (виртуальный скрининг). • Оценка влияния модификаций ключевых структур. • Дизайн лигандов De Novo. • Создание библиотек. • Предсказание молекулярных комплексов. • Распознавание вида связывания. • Оптимизация ключевых структур.
Docking иScoring • Идентификация верного связывания лиганда с активным сайтом • Пробы • Spatial DOF • Internal DOF • Идентификация верного связывания по наименьшей энергии • Функции скоринга - оценка • Требования • Характеристки
Требования и характеристики • Требования • Осуществить докинг и его оценку для базы структурно различных (гипотетически) соединений. • Идентифицировать weak binders среди non-binders. • Идентифицировать как минимум одно соединение с низкой IC50 mM активностью. • Оценить ~10000 лигандов в день на процессор. • RMS между экспериментом и моделью дока < 2Å - допустимо. • Характеристики • Высокий уровень false positives и false negatives. • Отсутствие универсальной функции оценки.
False Positive и False negative Допустим • База данных – 100000 соединений, среди которых 20 - хорошо связывающихся. • При 50% false negatives имеем 10 binders. • При 1% false positives имеем 1000 false positives. • Если мы можем лабораторными методами проверить 50 50 молекул (серьезный труд) из 1010 позитивных хитов, то 60% за то, что мы не получим ни одного верного соединения. • Для того, чтобы достичь 90% успеха в определении верного хита уровень false positives должен быть 0.2%
Что такое Docking? • Вычислительный подход к предсказанию взаимодействий между белками или между белками и другими молекулами (лигандами) • Предположение: компоненты, которые хорошо стыкуются, могут и связываться друг с другом. • Предсказание какие протеины могут взаимодействовать друг с другом • Предсказание сайтов для такого взаимодействия • Автоматизированное предсказание для белок–лекарственного взаимодействия • Улучшение и облегчение инженерии белков и разработки лекарств (drug design)
Docking – почему это важно? • Биомолекулярные взаимодействия – ядро всех регуляторных и метаболических процессов. • Роль компьютерного анализа возрастает, поскольку растут объёмы баз данных известных структур. • Увеличение вычислительных мощностей позволяет производить более детальный анализ и предсказание молекулярных взаимодействий. • Автоматизированное предсказание молекулярных взаимодействий – ключ к рациональной разработке новых лекарств.
Цели докинга • Для двух заданных биомолекул определить: • Могут ли они взаимодействовать согласно Gibbs free energy • Есть ли такая энергетически выгодная ориентация двух молекул, при которой одна может модифицировать функцию\свойства другой? • Могут ли две молекулы «соответствовать» друг другу в каком-либо энергетически выгодном состоянии? • Если могут, то какова их ориентация, которая сделает взаимодействие максимальным при минимизации общей «энергии»комплекса? • Цель: Найти такие молекулы в базах данных молекулярных структур.
Docking – Совмещение (Superposition) • Найти матрицу трансформации, которая наилучшим образом перекроет стол и стул. Иными словами найти такую матрицу трансформации, которая минимизирует RMS между соответствующими точками стола и стула. • Соответствия: • Верх стула – верх стола • Бок стула – бок стола и т.д.
Docking – Совмещение (Superposition) Алгоритм абсолютной ориентации Ключ – нахождение соответствующих точек между двумя структурами
Docking – почему это так непросто? • Обе молекулы гибкие и могут изменять друг друга во время взаимодействия: • Степени свободы • Допустимые конформации
Белок-белковое взаимодействие • Обе молекулы рассматриваются как rigidbodies (но можно и иначе!). • Огромная область для поиска (6 dof: 3 поворота, 3 перемещения) • Стерические/энергетические ограничения для уменьшения области поиска.
Полости, впадины и взаимодействие • CASTp • Идентификация и характеризация областей на поверхности (и внутренних, недоступных для взаимодействия) белков и иных молекул. • MolSurfer • Белок-белковые интерфейсы • PASSБыстрое определение и визуализация впадин для предсказания сайтов связывания • Surface RacerРасчет доступной дл явзаимодействия поверхности, её кривизны и впадин (включая внутренние). • SURFNETПоверхности и доступные области на молекулярных поверхностях • ASC • Набор скриптов для расчета поверхностей на базе PDB файла
CAPRI • CAPRI: Critical Assessment of PRediction of Interactions First community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group
Жесткий докинг • Допущения • Ригидный белок • Ригидный лиганд • Применения метода • Докинг малых или очень ригидных молекул. • Докинг фрагментов (гибкий докинг дизайн De Novo). • Докинг по базе мульти-конформеров.
A a D B b c C Ba Bb Bc Da Aa Db Ab Dc Ac Ca Cb Cc The Clique Method • Сопоставляем подходящие точки/характеристики двух молекул (рецептора и лиганда). рецептор лиганд Distance compatibility graph • Для N сайтов рецептора и n сайтов лиганда образуем N x n узлов. • Для каждой пары узлов определяем Δd = D receptorsites – D ligandsites. • ПриΔd < ε, соединяем узлы линиями. • A clique– подграф, в котором все узлы соединены между собой.
X-ray structure of HIV protease Connolly surface for active site The Dock Programhttp://www.cmpharm.ucsf.edu/kuntz/dock35/dock_demo.html Active site заполнен сферами. Их центры – потенциальные места для атомов лиганда.
Лиганд представляется как перекрывающиеся сферы (или как атомы) • Scoring • Shape scoring – используя аппроксимацию: Lennard-Jones potential. • Electrostatic scoring – ПО DELPHI , расчет электростатического потенциала. • Force-field scoring – потенциал AMBER. Модель с наивысшим score vs X-ray структура Центры сфер соответствуют атомам лиганда. Используя clique technique (до 4 точек на cliques), можно определить возможные ориентации лиганда. Обычно генерируется несколько десятков тысяч ориентаций для каждой молекулы. The Dock Program
Гибкий докинг: Допущения • Гибкость лиганда ограничена торзионными углами + кольцевыми структурами. • Конформационные ансамбли • Жесткий докинг пула конформаций для каждой молекулы (DOCK). • Фрагментация лиганда • Постепенно наращиваемые конструкции (FlexX) • «Вписываем-соединяем» • Явный конформационный поиск • Генетические алгоритмы (GOLD) • Monte Carlo (LigandFit) • Симуляции • Белок рассматривается как почти полностью жесткая молекула • Множественные модели белка (FlexE) • Симуляции
Гибкий докинг: Применения • Анализ комплексов, поиск возможных вариантов связывания. • Виртуальный скрининг по базам малых молекул.
Incremental Construction • Стратегия • Разбиение молекулы на фрагменты. • Вставка одного или нескольких фрагментов в активный сайт, игнорируя положение остальных. • Последовательное добавление остальных фрагментов. • Стратегия поиска • Жадный поиск:После добавления фрагмента – выбор конформацию с наивысшей оценкой. Остальные отбрасываем. • Линейный масштаб от количества фрагментов. • Без учета возможных взаимодействий между фрагментами.
Взаимодействия белок-лиганд описываются типами и геометрией. • Типы взаимодействия делятся на группы и «антигруппы». • Уровень взаимодействия - геометрия. • Чем выше уровень, тем более строгие требования к геометрии взаимодействия. The FlexX Programhttp://cartan.gmd.de/flexx/
Поверхность взаимодействия O N H O Центр взаимодействия H-bond donor H-bond acceptor Геометрия взаимодействия • Взаимодействие между группой A лиганда и группой B белка наблюдается, если: • Группа взаимодействия B находится в антигруппе A. • Центр взаимодействия A лежит примерно на поверхности взаимодействия B и наоборот.
Hydrogen bonds (3) Hydrophobic: Aromatic (2) Hydrophobic: Aliphatic (1) Геометрия взаимодействия
Гибкость белков • Protein flexibility and drug design: how to hit a moving target • Несмотря на миллионы лет эволюции, создававшей рецепторы, которые могут распознавать специфический лиганд мы все ещё можем идентифицировать молекулы, которые связываются с ним с большей афинностью • Сайт связывания может взаимодействовать с множеством молекул – существует возможность реорганизации сайта с относительно небольшим «штрафом» для соответствия малой молекуле. • Двойная природа сайта связывания– высокая стабильность и высокая гибкость (зачастую большая, чем у белка в целом). • Парадигма «Ключ-замок» устарела. Белок – совокупность предопределенных состояний. Carlson/ Curr. Op. Chem. Biol. 2002, 6: 447-452.
Решения • Использование единичной структуры белка в эксперименте докинга может пропустить возможное взаимодействие • Cross docking • Докинг всех лигандов на все имеющиеся структуры белка с дальнейшим объединением в ранжированный список. • Ограничено имеющимися конформациями белка. • Protein flexibility • FlexE • Включает все комбинации структур белка.