1 / 58

Структурное выравнивание

Структурное выравнивание. Структурное выравнивание - Структура vs Структура - Докинг Структурное моделирование ( Структура vs Структура ) - Homology modeling - Fold recognition/ Threading. Structural Alignment. Conserved 1º sequences похожие структуры

jaguar
Download Presentation

Структурное выравнивание

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Структурное выравнивание • Структурное выравнивание - Структура vs Структура - Докинг • Структурное моделирование (Структура vs Структура) - Homology modeling - Fold recognition/ Threading

  2. Structural Alignment • Conserved 1º sequencesпохожие структуры 2) Похожие структуры conserved 1º sequences ?

  3. Почему структурное выравнивание? • Группировка/классификация белков по структурам (по схожести) • Определение вклада отдельных аминокислот в образование 3D структуры • Определение дистантных гомологов в белковых семействах • Предсказание функции белков с низким уровнем sequence similarity с другими белками • Исследования: • Структурно-функциональные отношения • Эволюция • Общие блоки\сайты связывания - мотивы

  4. Distance Based Matrix A B • DDM’s • Самый простой метод сравнения структур • Не требует ни трансформаций, ни поворотов, ни совмещений • Очень эффективен для поиска движений в шарнирах или локальных отличий • • Интуитивно понятная мера похожести

  5. Совмещение структур A B

  6. Выравнивание структур белков • Уровни описания структуры: • Atom • Group • Fragment • Элементы вторичной структуры (SSE) • Описание структуры - особенности: • Геометрия/архитектура - координаты/относительные позиции • Топология - порядок аминокислот в белке, взаиморасположение мотивов • Свойства - физико-химические свойства аминокислот

  7. Описание структур • Scoring Equivalences: • Coordinate based - defined using a transformation of one structure onto the other:root mean square deviation – RMSd • Similarity of properties between equivalenced elements - conserved/similar amino acid • Similarity of relations between pairs of equivalenced elements - similar distances, internal RMSd • Pitfalls of RMSD: • all atoms are treated equally (residues on the surface have a higher degree of freedom than those in the core) • best alignment does not always mean minimal RMSD • significance of RMSD is size dependent • Alternative RSMDs • aRMSD = best root-mean-square deviation calculated over all aligned alpha-carbon atoms • bRMSD = the RMSD over the highest scoring residue pairs • wRMSD = weighted RMSD • ( W. Taylor(1999), Protein Science, 8: 654-665. • http://www.prosci.uci.edu/Articles/Vol8/issue3/8272/8272.html#relat) Structure I Structure II Feature Extraction Structure Description II Structure Description I Comparison Algorithm Constrains Scoring Equivalence RMS Scoring Assessment Statistical Significant? Accurate?

  8. B Поиск оптимального выравнивания • Поиск наибольшего количества атомов, выравненных с наименьшим RMSD (Root Mean Squared Deviation) • Поиск баланса между локальными областями с очень хорошим выравниванием и общим выравниванием

  9. Требования для сравнения структур 1. Какой атом структуры A соответствует другому атому структуры B? Вариант ответа – в выравнивании последовательнсотей THESESENTENCESALIGN----NICLEY ||| ||| || || ||||| |||||| THE—SEQ--ENCE--ALIGNEDNICELY 2. Позиции\координаты атомов в структуре? Ответ: PDB-файлы (Dihedral angles, bond lengths …) How good is a particular choice of heuristic and what is the computational cost of the search?

  10. Локальное выравнивание вторичных структур Поиск первичного выравнивания двух белков при помощи динамического программирования для векторов вторичной структуры A B

  11. Сопоставление атомов • Применение жадных методов ближайшего соседа для минимизации RMSD между Cαатомами пробы и шаблона (i.e. поиск локальных минимумов в пространстве выравнивания)

  12. Core Superposition Поиск лучшего выравнивания последовательно идущих Cα атомов и минимизация RMSD между ними

  13. RMSD в множественном выравнивании структур A B

  14. RMSD без выравнивания • 0.0-0.5 Å -> Essentially Identical • <1.5 Å -> Very good fit • < 5.0 Å -> Moderately good fit • 5.0-7.0 Å -> Dubious relationship • > 7.0 Å -> Structurally related • > 12.0 Å -> Completely unrelated

  15. Пример: Zinc Fingers 3znf and 4znf 248 atoms RMS = 1.42Å 30 CA atoms RMS = 0.70Å

  16. Сервера для выравнивания структур • LOCK - hierarchical protein structure Superposition • 3dSearch - fast secondary structure superposition • CE -Tools for 3-D Protein Structure Comparison and Alignment Using the Combinatorial Extension (CE) Method (no hetero atoms). • Дополнительная информация об алгоритмах • http://cmgm.stanford.edu/~brutlag/Papers/singh00.pdf

  17. Алгоритмы структурного выравнивания Distance based methods: • DALI (Holm and Sander): Aligning scalar distance plots (similarity between the 2-D distance matrices) • STRUCTAL (Gerstein and Levitt): Dynamic programming using pair wise inter-molecular distances • SSAP (Orengo and Taylor): Dynamic programming using intra-molecular vector distances • MINAREA (Falicov and Cohen): Minimizing soap-bubble surface area Vector based methods: • VAST (Bryant): Graph theory based secondary structure alignment • 3dSearch (Singh and Brutlag): Fast secondary structure index lookup Both • LOCK (Singh and Brutlag): Hierarchically uses both secondary structure vectors and atomic distances

  18. Docking и Scoring

  19. How Do You Du(o)ck?

  20. Ресурсы • Reviews in computational chemistry, vol. 17, 2001, 1-59 • http://www.zbi.uni-saarland.de/zbi/stud/lehrveranstaltungen/ws01/bioinformatikI/materialien/PL-Docking.pdf • Reviews in comp. chem., Vol 17. 2001. Ed. Kenny B. Lipkowitz, Donald B. Boyd

  21. Молекулярное узнавание – центральный феномен в биологии • ФерментыСубстраты • РецепторыСигналы (лиганды) • Антитела Антигены • Классификация проблем докинга • Докинг белок-лиганд • Rigid-body докинг • Flexible докинг • Докинг белок-белок • Докинг белок-ДНК Почему докинг?

  22. Дано: две молекулы в 3D с атомарным разрешением: • Связываются ли они друг с другом? Если да: • Как выглядит комплекс? • Насколько сильно связывание? • Структуры белок-лиганд • X-ray (PDB: 20946 entries from X-ray) • NMR • Важность 3D структур • Разрешение < 2.5Å • Проблема моделирования гомологов Проблема молекулярного докинга

  23. Основные принципы • Связывание молекул основано на взаимодействии • H-связи, солевые мостики, гидрофобные контакты, эдектростатические взаимодействия • Очень сильное отталкивающее влияние VdW на коротких дистанциях. • Случайные взаимодействия – слабые и короткие. • Сильное связывание предполагает комплементарность поверхностей. • Большинство молекул гибкие.

  24. Binding Affinity • Склонность к связыванию – энергетическая разность между связанным и свободным состояниями. • Среда (обычно вода) играет важную роль. • Энтропия вносит значимый вклад. • Binding affinity описывает комплекс, а не единичные структуры.

  25. Applications • Оценка склонности к связыванию • Поиск ключевых структур для белка\ов (виртуальный скрининг). • Оценка влияния модификаций ключевых структур. • Дизайн лигандов De Novo. • Создание библиотек. • Предсказание молекулярных комплексов. • Распознавание вида связывания. • Оптимизация ключевых структур.

  26. Docking иScoring • Идентификация верного связывания лиганда с активным сайтом • Пробы • Spatial DOF • Internal DOF • Идентификация верного связывания по наименьшей энергии • Функции скоринга - оценка • Требования • Характеристки

  27. Требования и характеристики • Требования • Осуществить докинг и его оценку для базы структурно различных (гипотетически) соединений. • Идентифицировать weak binders среди non-binders. • Идентифицировать как минимум одно соединение с низкой IC50 mM активностью. • Оценить ~10000 лигандов в день на процессор. • RMS между экспериментом и моделью дока < 2Å - допустимо. • Характеристики • Высокий уровень false positives и false negatives. • Отсутствие универсальной функции оценки.

  28. False Positive и False negative Допустим • База данных – 100000 соединений, среди которых 20 - хорошо связывающихся. • При 50% false negatives имеем 10 binders. • При 1% false positives имеем 1000 false positives. • Если мы можем лабораторными методами проверить 50 50 молекул (серьезный труд) из 1010 позитивных хитов, то 60% за то, что мы не получим ни одного верного соединения. • Для того, чтобы достичь 90% успеха в определении верного хита уровень false positives должен быть 0.2%

  29. Что такое Docking? • Вычислительный подход к предсказанию взаимодействий между белками или между белками и другими молекулами (лигандами) • Предположение: компоненты, которые хорошо стыкуются, могут и связываться друг с другом. • Предсказание какие протеины могут взаимодействовать друг с другом • Предсказание сайтов для такого взаимодействия • Автоматизированное предсказание для белок–лекарственного взаимодействия • Улучшение и облегчение инженерии белков и разработки лекарств (drug design)

  30. Docking – почему это важно? • Биомолекулярные взаимодействия – ядро всех регуляторных и метаболических процессов. • Роль компьютерного анализа возрастает, поскольку растут объёмы баз данных известных структур. • Увеличение вычислительных мощностей позволяет производить более детальный анализ и предсказание молекулярных взаимодействий. • Автоматизированное предсказание молекулярных взаимодействий – ключ к рациональной разработке новых лекарств.

  31. Цели докинга • Для двух заданных биомолекул определить: • Могут ли они взаимодействовать согласно Gibbs free energy • Есть ли такая энергетически выгодная ориентация двух молекул, при которой одна может модифицировать функцию\свойства другой? • Могут ли две молекулы «соответствовать» друг другу в каком-либо энергетически выгодном состоянии? • Если могут, то какова их ориентация, которая сделает взаимодействие максимальным при минимизации общей «энергии»комплекса? • Цель: Найти такие молекулы в базах данных молекулярных структур.

  32. Docking – Совмещение (Superposition) • Найти матрицу трансформации, которая наилучшим образом перекроет стол и стул. Иными словами найти такую матрицу трансформации, которая минимизирует RMS между соответствующими точками стола и стула. • Соответствия: • Верх стула – верх стола • Бок стула – бок стола и т.д.

  33. Docking – Совмещение (Superposition) Алгоритм абсолютной ориентации Ключ – нахождение соответствующих точек между двумя структурами

  34. Docking – почему это так непросто? • Обе молекулы гибкие и могут изменять друг друга во время взаимодействия: • Степени свободы • Допустимые конформации

  35. Белок-белковое взаимодействие • Обе молекулы рассматриваются как rigidbodies (но можно и иначе!). • Огромная область для поиска (6 dof: 3 поворота, 3 перемещения) • Стерические/энергетические ограничения для уменьшения области поиска.

  36. Полости, впадины и взаимодействие • CASTp • Идентификация и характеризация областей на поверхности (и внутренних, недоступных для взаимодействия) белков и иных молекул. • MolSurfer • Белок-белковые интерфейсы • PASSБыстрое определение и визуализация впадин для предсказания сайтов связывания • Surface RacerРасчет доступной дл явзаимодействия поверхности, её кривизны и впадин (включая внутренние). • SURFNETПоверхности и доступные области на молекулярных поверхностях • ASC • Набор скриптов для расчета поверхностей на базе PDB файла

  37. CAPRI • CAPRI: Critical Assessment of PRediction of Interactions First community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group

  38. Жесткий докинг • Допущения • Ригидный белок • Ригидный лиганд • Применения метода • Докинг малых или очень ригидных молекул. • Докинг фрагментов (гибкий докинг дизайн De Novo). • Докинг по базе мульти-конформеров.

  39. A a D B b c C Ba Bb Bc Da Aa Db Ab Dc Ac Ca Cb Cc The Clique Method • Сопоставляем подходящие точки/характеристики двух молекул (рецептора и лиганда). рецептор лиганд Distance compatibility graph • Для N сайтов рецептора и n сайтов лиганда образуем N x n узлов. • Для каждой пары узлов определяем Δd = D receptorsites – D ligandsites. • ПриΔd < ε, соединяем узлы линиями. • A clique– подграф, в котором все узлы соединены между собой.

  40. X-ray structure of HIV protease Connolly surface for active site The Dock Programhttp://www.cmpharm.ucsf.edu/kuntz/dock35/dock_demo.html Active site заполнен сферами. Их центры – потенциальные места для атомов лиганда.

  41. Лиганд представляется как перекрывающиеся сферы (или как атомы) • Scoring • Shape scoring – используя аппроксимацию: Lennard-Jones potential. • Electrostatic scoring – ПО DELPHI , расчет электростатического потенциала. • Force-field scoring – потенциал AMBER. Модель с наивысшим score vs X-ray структура Центры сфер соответствуют атомам лиганда. Используя clique technique (до 4 точек на cliques), можно определить возможные ориентации лиганда. Обычно генерируется несколько десятков тысяч ориентаций для каждой молекулы. The Dock Program

  42. Гибкий докинг: Допущения • Гибкость лиганда ограничена торзионными углами + кольцевыми структурами. • Конформационные ансамбли • Жесткий докинг пула конформаций для каждой молекулы (DOCK). • Фрагментация лиганда • Постепенно наращиваемые конструкции (FlexX) • «Вписываем-соединяем» • Явный конформационный поиск • Генетические алгоритмы (GOLD) • Monte Carlo (LigandFit) • Симуляции • Белок рассматривается как почти полностью жесткая молекула • Множественные модели белка (FlexE) • Симуляции

  43. Гибкий докинг: Применения • Анализ комплексов, поиск возможных вариантов связывания. • Виртуальный скрининг по базам малых молекул.

  44. Incremental Construction • Стратегия • Разбиение молекулы на фрагменты. • Вставка одного или нескольких фрагментов в активный сайт, игнорируя положение остальных. • Последовательное добавление остальных фрагментов. • Стратегия поиска • Жадный поиск:После добавления фрагмента – выбор конформацию с наивысшей оценкой. Остальные отбрасываем. • Линейный масштаб от количества фрагментов. • Без учета возможных взаимодействий между фрагментами.

  45. Взаимодействия белок-лиганд описываются типами и геометрией. • Типы взаимодействия делятся на группы и «антигруппы». • Уровень взаимодействия - геометрия. • Чем выше уровень, тем более строгие требования к геометрии взаимодействия. The FlexX Programhttp://cartan.gmd.de/flexx/

  46. Поверхность взаимодействия O N H O Центр взаимодействия H-bond donor H-bond acceptor Геометрия взаимодействия • Взаимодействие между группой A лиганда и группой B белка наблюдается, если: • Группа взаимодействия B находится в антигруппе A. • Центр взаимодействия A лежит примерно на поверхности взаимодействия B и наоборот.

  47. Hydrogen bonds (3) Hydrophobic: Aromatic (2) Hydrophobic: Aliphatic (1) Геометрия взаимодействия

  48. Гибкость белков • Protein flexibility and drug design: how to hit a moving target • Несмотря на миллионы лет эволюции, создававшей рецепторы, которые могут распознавать специфический лиганд мы все ещё можем идентифицировать молекулы, которые связываются с ним с большей афинностью • Сайт связывания может взаимодействовать с множеством молекул – существует возможность реорганизации сайта с относительно небольшим «штрафом» для соответствия малой молекуле. • Двойная природа сайта связывания– высокая стабильность и высокая гибкость (зачастую большая, чем у белка в целом). • Парадигма «Ключ-замок» устарела. Белок – совокупность предопределенных состояний. Carlson/ Curr. Op. Chem. Biol. 2002, 6: 447-452.

  49. Решения • Использование единичной структуры белка в эксперименте докинга может пропустить возможное взаимодействие • Cross docking • Докинг всех лигандов на все имеющиеся структуры белка с дальнейшим объединением в ранжированный список. • Ограничено имеющимися конформациями белка. • Protein flexibility • FlexE • Включает все комбинации структур белка.

  50. Гибкость белков

More Related