1 / 93

О цен ка качеств а модели пространственной структуры

О цен ка качеств а модели пространственной структуры. Тернистый путь создания модели. Ян Вермеер Дельфтский Аллегория живописи 1666. Структура белка - это созданная человеком на основании экспериментальных данных модель.

Download Presentation

О цен ка качеств а модели пространственной структуры

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Оценка качествамодели пространственной структуры

  2. Тернистый путь создания модели Ян Вермеер Дельфтский Аллегория живописи 1666

  3. Структура белка - это созданная человеком на основании экспериментальных данных модель The structures in the PDB are based on a subjective interpretation of experimental data, which may itself be of variablequality, a process that can lead to errors with varying degreesof impact (Bra¨nde´n & Jones, 1990; Morris et al., 1992; Kleywegt & Jones, 1995, 1996, 1997, 2002; Hooft et al., 1996;Kleywegt, 2000, 2007, 2009; Chen et al., 2010). For this reason,it is crucial to assess the quality and reliability of the resultingmodels, a process known as validation (Kleywegt, 2000, 2009). Gore, Velankar and Kleywegt, Implementing an X-ray validation pipeline for the Protein Data Bank, 2012

  4. 1. Примеры ошибок

  5. 1PHY, 2.4 ÅMcRee et al. 1989 2PHY, 1.4 Å Borgstahl et al. 1995 Полностьюошибочнаямодель, 1989 Две структуры одного и того же белка радикально отличаются. В PDB 1PHY заменена на 2PHY

  6. Полностьюошибочнаямодель, 2006 SCIENCE VOL 314 22 DECEMBER 2006

  7. Experimental Data for Structure Papers We are writing to address the retraction of five papers on structural studies of ATP-binding cassette (ABC) transporters—three in Science (G. Chang et al., “Retraction,” Letters, 22 Dec. 2006, p. 1875), one in the Proceedings of the National Academy of Sciences (1), and one in the Journal of Molecular Biology (2). We have much sympathy for your readers but very little for the magazine. This is not the first time incorrect structures have been published in Science (3), and it will not be the last time. We and all of your readers make mistakes; crystallography is fortunate that by careful treatment of the experimental and derived data, most serious mistakes are caught and corrected before publication. The necessary tools and techniques are well described [for example, (4), and references therein] and widely used by our community. Inherent in structural analysis is a degree of subjectivity (3), which is particularly relevant in low-resolution studies such as those made by Chang and co-workers. Essentially correct structures have been built at 4.5 Å resolution, but it is not surprising that some of them turn out to be wrong upon further scrutiny. 13 JULY 2007 VOL 317 SCIENCE We are writing to address the retraction of five papers on structural studies of ATP-binding cassette (ABC) transporters—three in Science (G. Chang et al., “Retraction,” Letters, 22 Dec. 2006, p. 1875), one in the Proceedings of the National Academy of Sciences (1), and one in the Journal of Molecular Biology (2). We have much sympathy for your readers but very little for the magazine. This is not the first time incorrect structures have been published in Science (3), and it will not be the last time. ROBBIE P. JOOSTEN AND GERT VRIEND

  8. Университет Алабамы обращается к руководителям PDB c запросом на удаление следующих структур, депонированных сотрудниками университета. Также просит журналы отозвать 9 соответствующих публикаций 2009 год… 1BEF, 1CMW, 1DF9 2QID, 1G40, 1G44, 1L6L, 2OU1, 1RID, 1Y8E, 2A01, 2HR0

  9. Gln20 Ala5 Ala5 Ser22 Lys16 Lys16 Gly40 Gly40 2CHR: Kleywegt et al., 1996 Разрешение 3.00 Å Пример “сдвига рамки” при расшифровке: две модели, построенные по тем же экспериментальным данным 1CHR: Hoier et al., 1993 Разрешение 3.00 Å

  10. Выравнивание последовательностей 1CHR и 2CHR по близости C_alpha атомов при наложении структур

  11. “Мелкие” ошибки. Противоречие физике и химии 1DLP 167-169:C, Разрешение 3.3 ангстрема (2000г) 2013. Структура, по-прежнему, лежит в PDB

  12. Примеры плохого соответствия модели “экспериментальной” ЭП Из протокола Алисы Гараевой Из протокола Льва Шагама, 2006 Уровень подрезки 2.5 sigma Это явная неточность расшифровки. … сталкиваемся с полным произволом авторов структуры. То есть если на уровне подрезки 1 на месте бокового радикала этого остатка ещё есть какая-то электронная плотность, то на этом уровне от неё не остаётся и следа. Наибольшая электронная плотность (3 sigma) наблюдается вокруг Сα-атома, наименьшая (около 0.1 sigma!) – у Сδ – атома.

  13. 2. Источники ошибок

  14. Этапы РСА Этап Результат Кристалл Структурные факторы= амплитуды гармоник Фурье, кристаллографическая ячейка, группа симметрий, разрешение Фазы гармоник Фурье, функция ЭП Модель (“черновой”pdbфайл) Модель для PDB • Кристаллизация • Рентгеновский эксперимент • Решение фазовой проблемы • Построение черновой модели • Оптимизация модели • Проверка качества

  15. Ошибки, влияющие на качество модели • Ошибки измерения структурных факторов • Ошибки в размерах и симметриях кристаллографической ячейки • Плохие фазы • Ошибки вписывания атомов в черновую ЭП • Неудачная оптимизация модели

  16. 3. Разрешение

  17. “Одномерный кристалл” 1) В ячейка 30 ангстрем 3 тяжелых атома и водород. Их положение известно. 4) Разрешение гармоники = расстояние между максимумами. Например, разрешение 3й гармоники равно 30 Å/3 = 10 Å 2) График функции ЭП 4) Разрешение в зависимости отнабора измеренных гармоник 3)Ряд Фурье функции ЭП ρ(x)=F0 + +F1cos( 1* 2π/30*x + φ1) + +F2cos(2*2π/30*x + φ2) + +F3cos(3*2π/30*x + φ3) + + …

  18. Разрешение структуры • Проведен РСА эксперимент: найдены параметры кристаллической ячейки и получен файл структурных факторов : CRYST1 77.553 192.966 93.740 90.00 90.00 90.00 0 0 4 211.0 0 0 6 1642.7 ………………. 1 1 3 160.9 • Для каждой гармоники (h, k, l) рассчитываем разрешение dhkl(параметры кристаллической решетки известны!) • Имеем множество измеренных рефлексов (h, k, l) (см. рис) • Если измерены все рефлексы с разрешением dи больше, и d – минимальное с таким свойством, то говорят, что разрешение структуры d (ангстрем) • Слово “все”следует заменить на слова “почти все”(добавив, для честности, параметр “полнота данных”) потому, что это эксперимент, а не теория. • Так, например, рефлексы, отвечающие самым маленьким тройкам чисел (h,k,l):(0,0,0), (1,0,0) …. не могут быть измерены [почему?] • Кроме того, некоторые измеренные амплитуды не используют из-за их плохого качества

  19. Разрешение как показатель качества модели структуры • Характеризует экспериментальные данные, а не модель! • Остается небольшая доля субъективности в определении разрешения структуры • По данным РСА с плохим разрешением можно построить хорошую модель; при хорошем разрешении в модели могут быть ошибки

  20. Условные градации разрешения • Высокое разрешение: <1.5 Å • Хорошее разрешение: 1.5 – 2.5 Å(в моделях с разрешением < 2.5 Å обычно моделируют и молекулы воды) • Удовлетворительное: 2.5 – 3.5 Å • Низкое: > 3.5 ÅНо и модели с разрешением 5 Å и более могут быть очень важными!Например, первые расшифровки рибосомы

  21. Менее 10% структур, полученных с помощью рентгеноструктурного анализа, имеют разрешение менее, чем 1,5 ангстрем

  22. 4. R-фактори R-free

  23. Вписывание полипептидной цепи: черновая модель пространственной структуры неточна! • неточность структурных факторов и фаз • произвол при вписывании – тем больший, чем хуже ЭП 2.5 Å, MIR

  24. В.Ю.Лунин, лекция 3 Оптимизация координат атомов • Что оптимизируется: • Соответствиерефлексов: • Fhkl(calc) - рассчитанных по координатам атомов в модели, и • Fhkl(obs) – полученных в эксперименте • Длины валентных связей • Валентные углы • Какая величина оптимизируется:Составной R-фактор (измеряется в % или долях единицы): RX-ray = = + + R w R w R w R - - X ray X ray dist dist angle angle

  25. В.Ю.Лунин, лекция 3 Оптимизация координат атомов • Как оптимизируется • Немножко меняются координаты всех атомовв текущей n-й модели , получаем новую, (n+1)-ю модель • Рассчитывается Rn+1для новой модели • Если Rn >Rn+1 , то берем (n+1)-ю модель • Поступаем так до тех пор, пока R-фактор не перестанет уменьшаться • Существуют алгоритмы как выбирать смещения атомов для очередной модели

  26. R-фактор отражает соответствие модели и эксперимента: чем меньше R-фактор, тем модель лучше! Хорошие значения: R<25% Но…

  27. Подгонка под ответ! Борис Кустодиев Сапожник 1924

  28. Пример “успешной” подгонки (свобода, право) (вольности) Структура CRABP, вписанная в обратном порядке и оптимизированная Структура белка CRABP

  29. ЧТО ПОЛУЧАЕТСЯ: • R-фактор является тем параметром, который минимизируется в процессе уточнения модели • При минимизации уточняются координаты всех атомов =>“подкручиваются много тысяч ручек” (параметров) • С помощью тысяч “ручек” один параметр можно минимизировать почти до нуля по случайным причинам!

  30. R-free

  31. В.Ю.Лунин, лекция 3 В любом эксперименте необходим контроль! Служат для оптимизации модели рабочие все рефлексы Используются после получения окончательной модели для контроля. контрольные R-free вычисляется по той же формуле, что и R_x-ray, но только по контрольным рефлексам и только по окончательной модели!

  32. Если модель правильная, то R-free окажется примерно равным R-X-ray или немногим больше! • Может ли быть так, что R-free< R? • Если модель подогнана под рабочие рефлексы – “переоптимизирована”, - то R_free окажется большим!

  33. Интерпретация R_free • Хорошие значения: R_free<20% • Плохие значения:R_free>40% • Значения(R_free – R)>10%настораживают в отношении переоптимизации (ovefitting)

  34. REMARK 3 REMARK 3 FIT TO DATA USED IN REFINEMENT. REMARK 3 CROSS-VALIDATION METHOD : THROUGHOUT REMARK 3 FREE R VALUE TEST SET SELECTION : RANDOM REMARK 3 R VALUE (WORKING + TEST SET) : 0.15621 REMARK 3 R VALUE (WORKING SET) : 0.15185 REMARK 3 FREE R VALUE : 0.19471 REMARK 3 FREE R VALUE TEST SET SIZE (%) : 10.1 REMARK 3 FREE R VALUE TEST SET COUNT : 5989 REMARK 3 • Авторы получили в эксперименте 59 297 рефлексов • Они утверждают, что 5 989 (10%) рефлексов спрятали в сейф, опечатали и никому не показывали  • По оставшимся 53 308 рефлексам оптимизировали модель и получили R=15% • После этого достали тайные рефлексы из сейфа и рассчитали R-фактор по ним. Этои есть Rfree . Авторы получили Rfree = 19%. • Все общественно признанные критерии удовлетворены: • Rfree <20% - приемлемое значение для хорошей модели • Rfree- R <10% - нет доводов в пользу переоптимизации • Значит, можно отправлять в PDB и публиковать статью!

  35. Польза R_free демонстрируется в работе Структура CRABP, вписанная в обратном порядке и оптимизированная Структура белка CRABP

  36. 5.Карта РамачандранаСтепени свободы полипептидной цепи

  37. Длины валентных связей и валентные углы имеют известные значения. Отклонения от этих значений энергетически невыгодны. Поэтому в модели соблюдаются табличные значения этих параметров с хорошей точностью. См. соответствующие слагаемые в R-факторе.

  38. Укладка полипептидной цепи определяется тремя торсионными углами,,

  39. Торсионный угол 1 3 4 • Определяется для упорядоченной четверки атомов: 1-2-3-4 • Если расположить атомы над плоскостью проекции так, чтобы 3-й и 2-й проектировались в одну точку, 3й – выше 2-го, то торсионный угол равен углу между проекциями ребер 1-2 и 2-3 • торсионный угол отсчитывается от проекции ребра 1-2 против часовой стрелки • торсионный угол измеряется в пределах от -180º до -+180º градусов 2 Рис.1. Упорядоченная четверка атомов в пространстве 1 2 3 4 Рис.2. Проекция четверки на плоскость. Торсионный угол – примерно +160º

  40. Угол  принимает определенные значения:180° почти всегда (trans- конформация)0° крайне редко (cis- конформация), бывает, в основном, у пролина N Cα(i) Cα(i+1) Рис.2 Trans конформация: “кочерга” Cα(i+1) C N Cα(i) Рис.1 Cis и trans конформации полипептидной цепи C Рис.3Cis конформация: “чашка”

  41. Существенно разные (но не любые) значения могут принимать углы , .Пара чисел от -180° до +180 ° соответствует точке в квадрате на координатной плоскости Квадрат -180° до +180 °, предназначенный для отображения торсионных углов (φ,ψ)называется картой Рамачандрана

  42. Карта Рамачандрана(по Рамачандрану)Каждой точке на карте можно приписать энергию такой конформации полипептидной цепи остатка. ψ +180° 0° -180° Крестиками отмечены пары(φ,ψ) для остатков одной структуры Области низкой энергии, т.е. предпочитаемых значений (φ,ψ), обведены контурами -180° 0° +180° φ

  43. Области на карте Рамачандрана 1CNR, разрешение 1.05 ангстрем Классификация областей(PROCHECK): - предпочитаемая (A,B,L) - разрешенная (a,b,l,p) - допустимая (~a,~b,~l,~p) -запрещенная

  44. Карта Рамачандрана по последним данным(Lovell et al., 2003; Davis et al., 2004) Внутренний контур окружает 98% остатков Внешний - 99.95 % остатков (!)

  45. Области на карте Рамачандрана, используемые в программах, определены на основании статистики по PDB Рекомендуемая VTF программа - MolProbity

  46. Выводы • ВСЕ остатки, не попадающие в обведенные области на карте Рамачандрана, следует считать маргинальными: • либо координаты остовных атомов существенно неточны • либо это крайне редкие особенности (встречаются реже 1 на 2000 случаев), требующие объяснения

  47. Карта Рамачандрана модели белка как индикатор её качества • Этот индикатор хорош потому, что независим от процедуры оптимизации модели (как правило) • В хорошей модели >90% остатков, не считая Gly, Pro, находятсяв предпочитаемой области • Этот критерий нынче известен всем, поэтому авторы стараются подогнать модель!

  48. Сравните две карты Рамачандрана

  49. Инверсия пептидной цепи(pep-flip) Индикатором возможности инверсии служат два идущих подряд остатка на карте Рамачандрана попавшие в неблагоприятные области

  50. 6. Торсионные углы боковых цепей. Ротамеры

More Related