Interested Article - Макромолекулярный докинг
- 2020-06-15
- 2
Макромолекулярный докинг — это метод молекулярного моделирования четвертичной структуры комплексов, образованных двумя или более взаимодействующими биологическими макромолекулами . Чаще всего исследуются белок -белковые комплексы, реже — белок- нуклеиновые .
Конечной целью докинга является предсказание трёхмерной структуры изучаемого макромолекулярного комплекса в естественной среде. Результатом докинга является набор моделей комплекса (структур). Они могут быть ранжированы различными методами, такими как для отбора наиболее правдоподобных (с большей долей вероятности встречающихся в организме).
Термин «докинг» или «стыковка» появился в конце 1970-х в значении моделирования стыковки двух молекул, при котором ориентация последних не менялась (менялось только положение). С увеличением компьютерных мощностей стало возможно разрешить изменение ориентации партнёров, такой вариант докинга называется «rigid docking» или докинг жёстких тел («rigid body»). Следующим шагом стал переход к «гибкому докингу» («flexible docking»), при котором изменяется внутренняя геометрия (конформация) партнёров.
Введение
Биологические роли большинства белков, описываемые тем, с какими молекулами они могут взаимодействовать известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных биологических процессах (напр. ЦТК ) могут иметь неожиданных интерактантов или новые биологические функции.
В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что генетические заболевания (напр. муковисцидоз ) вызываются неправильно свернутыми ( мутированными ) белками и возникает желание понять какие аномальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.
Для некоторого набора белков может решаться следующий спектр задач:
- Связываются ли белки in vivo ?
Если связываются,
- Какую конформацию имеет белок в связанном состоянии?
- Насколько сильным можно считать их взаимодействие?
Если не связываются,
- Можно ли получить связывание путём внедрение мутаций в белки?
Для решения этих проблем может применяться белок-белковый докинг.
Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, её можно моделировать (см. предсказание структуры белка ).
Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. Транскрипционные факторы регулируют экспрессию генов , а полимеразы , которые осуществляют репликацию суть белковые комплексы , а генетический материал, с которым они связываются состоят из нуклеиновых кислот . Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.
История
В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнёров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах. Затем в 1978 году появилась работа с комплексом трипсин - Апротинин . Компьютеры использовались для отличия «плохих» и «хороших» моделей, посредством оценочной функции. «Вознаграждалась» большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощённое представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. Электростатические взаимодействия, такие как водородные связи , анализировались вручную.
К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением биоинформатики основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.
В 1992 году был опубликован метод , в котором использовалось быстрое преобразование Фурье. В этом методе имело место «грубое» представление партнёров докинга: в виде трёхмерных матриц, числа в которых соответствовали положениям атомов. Быстрое преобразование Фурье помогало находить расположение этих матриц, соответствующее контакту партнёров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.
В 1996 году были опубликованы результаты первого исследования , в котором шесть исследовательских групп пытались предсказать структуру комплекса бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учёта конформационных изменений и трудности различения конформеров.
Методы
Основной механизм докинга схож с молекулярным докингом . Также применяются методы типа Монте-Карло , в которых в ходе итеративных изменений набора параметров уточняется исходная конфигурация. На каждом шаге конфигурация принимается или отвергается, исходя из значения оценочной функции.
Переход в обратное пространство
Каждый из белков может быть представлен в виде простой кубической решётки. Для моделей комплекса, переводимых друг в друга путём изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением . Можно построить осмысленные, хотя и приблизительные, «сверточные» скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.
Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надёжного выявления структуры лучшего комплекса.
Оценочные функции (скоринг-функции)
Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести «экспериментально» лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата). Скоры разделяют на несколько категорий, включающих:
- Эвристические скор-функции, основанные на экспериментальных данных о контактах аминокислотных остатков .
- Комплиментарность формы взаимодействующих партнёров.
- Свободные энергии, оцененные с использованием параметров из , таких как или .
- Филогенетические подтверждение взаимодействующих областей.
- Коэффициенты кластеризации.
Обычно гибридные оценки (собственно скор-функции) создаются путём объединения одной или нескольких вышеупомянутых категорий (далее «термы» скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т. н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.
В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico белковой инженерии , разработку лекарств а также высокопроизводительную аннотацию интерактома (то есть какие белки связываются, а какие нет). Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций. Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций оказалась почти ортогональной (R 2 ~ 0). Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти и улучшить скор-функцию, пересмотрев веса её компонентов (термов). Среди экспериментальных методов определения аффинности связывания выделяют поверхностный плазмонный резонанс (SPR), , методы с применением радиолигандов, (ITC), (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга.
Тестовые выборки (Бенчмарки)
Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов. Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнёров в базе данных ). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.
Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов, а для ДНК-белкового — из 47. Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов. Существуют объединенные тестовые выборки, насчитывающие 209 комплексов.
Тестовая выборка для оценки аффинности была основана на тестовой выбоке для белок-белкового докинга. В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.
Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена. Новая тестовая выборка включает белки с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнёров друг к другу, с K d в диапазоне от 10 −5 до 10 −14 M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнёров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выбока может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе).
CAPRI
CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий) — это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок-белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является двойным слепым методом , так как участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.
В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Несмотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка CASP является аналогичным упражнением в области предсказания структуры белка.
См. также
- Молекулярный докинг — докинг небольших молекул
Примечания
- C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. (англ.) // Proceedings of the National Academy of Sciences . — National Academy of Sciences , 1975-04-01. — Vol. 72 , iss. 4 . — P. 1330—1334 . — ISSN . — doi : .
- Shoshana J. Wodak, Joël Janin. // Journal of Molecular Biology. — 1978-09. — Т. 124 , вып. 2 . — С. 323—342 . — ISSN . — doi : .
- E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo. (англ.) // Proceedings of the National Academy of Sciences . — National Academy of Sciences , 1992-03-15. — Vol. 89 , iss. 6 . — P. 2195—2199 . — ISSN . — doi : .
- N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz. // Nature Structural Biology. — 1996-03. — Т. 3 , вып. 3 . — С. 233—239 . — ISSN . — doi : .
- Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations". J. Mol. Biol . 331 (1): 281—299. doi : . PMID .
- Camacho C. J., Vajda S. Protein docking along smooth association pathways (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2008. — Vol. 98 , no. 19 . — P. 10636—10641 . — doi : . — . — PMC .
- Camacho C. J., Vajda S. In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach (англ.) // Vol. 7 . — P. 37 . — doi : . — . — PMC . : journal. — 2007. —
- Zhang C., Liu S., Zhu Q., Zhou Y. A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes (англ.) // Vol. 48 , no. 7 . — P. 2325—2335 . — doi : . — . : journal. — 2005. —
- Esmaielbeiki R., Nebel J. C. Scoring docking conformations using predicted protein interfaces (англ.) // Vol. 15 . — P. 171 . — doi : . — . — PMC . : journal. — 2014. —
- ↑ Kastritis P. L., Bonvin A. M. Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark (англ.) // vol. 9 , no. 5 ). — P. 2216—2225 . — doi : . — . : journal. — 2010. — May (
- Rosato A., Fuentes G., Verma C. (англ.) // Faculty of 1000 Biology : journal. — 2010. — Vol. 9 , no. 5 . — P. 2216—2225 . — doi : . — .
- Badal, V. D., Kundrotas, P. J., Vakser, I. A. Natural language processing in text mining for structural modeling of protein complexes (англ.) // Vol. 19 , no. 1 . — P. 84 . — doi : . — . — PMC . : journal. — 2018. —
- Mintseris J., Wiehe K., Pierce B., Anderson R., Chen R., Janin J., Weng Z. Protein-Protein Docking Benchmark 2.0: an update (неопр.) // Proteins. — 2005. — Т. 60 , № 2 . — С. 214—216 . — doi : . — .
- Vreven T., Moal I. H., Vangone A., Pierce B. G., Kastritis P. L., Torchala M., Chaleil R., Jiménez-García B., Bates P. A., Fernandez-Recio J., Bonvin A. M., Weng Z. Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2 (англ.) // vol. 427 , no. 19 ). — P. 3031—3041 . — doi : . — . — PMC . : journal. — 2015. — September (
- van Dijk M., Bonvin A. M. A protein-DNA docking benchmark (англ.) // vol. 36 , no. 14 ). — P. e88 . — doi : . — . — PMC . : journal. — 2008. — August (
- Nithin C., Mukherjee S., Bahadur R. P. A non-redundant protein-RNA docking benchmark version 2.0 (англ.) // Proteins : journal. — 2016. — November ( vol. 85 , no. 2 ). — P. 256—267 . — doi : . — .
- Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes (англ.) // Genes : journal. — 2018. — 25 August ( vol. 9 , no. 9 ). — P. 432 . — doi : . — . — PMC .
- ↑ Kastritis P. L., Moal I. H., Hwang H., Weng Z., Bates P. A., Bonvin A. M., Janin J. A structure-based benchmark for protein-protein binding affinity (англ.) // vol. 20 , no. 3 ). — P. 482—491 . — doi : . — . — PMC . : journal. — 2011. — March (
- Janin J., Henrick K., Moult J., Eyck L. T., Sternberg M. J., Vajda S., Vakser I., Wodak S. J. CAPRI: a Critical Assessment of PRedicted Interactions (англ.) // Proteins : journal. — 2003. — Vol. 52 , no. 1 . — P. 2—9 . — doi : . — .
- 2020-06-15
- 2