Interested Article - Кэп-анализ экспрессии генов

Кэп-ана́лиз экспре́ссии ге́нов ( англ. cap analysis gene expression, CAGE ) — технология, используемая в молекулярной биологии , в результате которой получают профили экспрессии генов эукариот с одновременным определением специфических для клетки / ткани условий транскрипционных стартовых сайтов (TSS), включая данные о задействованных промоторах . Метод заключается в получении и прочтении коротких (обычно длиной 27 нуклеотидов ) участков последовательности 5'-конца кэпированных РНК эукариот. Далее проводится картирование секвенированных последовательностей на готовый геном , что позволяет уточнить 5'-границы транскрибируемых областей, а также провести количественный анализ экспрессии. Методика была разработана и опубликована в 2003 году, после чего активно совершенствовалась . Метод активно используется в исследовательском проекте по функциональной аннотации геномов млекопитающих ( англ. FANTOM — Functional Annotation of the Mammalian Genome) .

С помощью данного метода было показано существование альтернативно регулируемых сайтов начала транскрипции и были открыты новые регуляторные элементы . Также он позволил предсказывать сайты связывания факторов транскрипции и других мотивов , связанных с транскрипцией . Анализ 5'-концов данным методом особенно хорош для исследования регуляторных взаимосвязей генов; с его помощью выявили ключевые транскрипционные факторы, ответственные за дифференцировку монобластов в моноциты . Поскольку данный метод не предполагает никакую известную модель гена, он показал, что ретротранспозоны экспрессируются специфично и регулируют мРНК и другие некодирующие РНК .

Актуальность метода

Биологический аспект

Для транскрипции необходимо, чтобы РНК-полимераза связалась с промоторной последовательностью ДНК . У бактерий за этот процесс отвечает сигма-фактор , и, как правило, инициация происходит на −10 и −35 нуклеотидов до точки начала транскрипции (σ 70 узнает консенсусные последовательности в этой области) . У архей и эукариот происходит преинициация с участием транскрипционных факторов. В зависимости от типа транскрипционного фактора инициация у эукариот может происходить в разных сайтах промоторной области до точки начала транскрипции. Кроме того, существует множество механизмов регуляции этого процесса. Например, некоторые транскрипционные факторы способны связываться со специальными регуляторными последовательностями, что приводит к активации или подавлению транскрипции целевого гена. Сложность системы инициации транскрипции затрудняет точное предсказание сайта начала транскрипции по последовательности ДНК .

Секвенирование последовательностей мРНК позволяет решить эту проблему, однако используемый для поиска транскрибируемых участков RNA-seq , основанный на современных методах секвенирования с последующим картированием ридов на геном, обычно не позволяет определить четкие границы (с точностью до одного нуклеотида) концов РНК. С одной стороны, чем более протяженный участок мы можем отсеквенировать, тем проще будет собирать риды. С другой стороны, чем длиннее риды, тем меньше вероятность каждого из них попасть на край транскрипта. В результате при любой технологии секвенирования обычно возникают отклонения в количестве ридов на концах транскрибируемой области (см. рис. 1) .

Для решения проблемы определения точки начала транскрипции у бактерий существуют различные методы, основанные на избирательном присоединении различных тэгов к 5'-концу мРНК с трифосфатом на конце .

Для решения проблемы определения точки начала транскрипции у эукариот был создан метод CAGE и последующие его модификации. Он сосредоточен на секвенировании 5’-концов РНК, которые кэпированы у эукариот. У прокариот на 5'-конце вместо кэпа находится трифосфат, поэтому метод CAGE к ним применить невозможно. Однако применяется альтернативный метод: РНК обрабатывают эндонуклеазами , после чего подвергают обработке 5'- экзонуклеазами . При этом остаются только защищенные трифосфатом 5’-концевые фрагменты .

Технологические особенности

Сравнение методов RNA-seq и CAGE показывает, что оба метода дают почти одинаковые количественные оценки экспрессии генов . Это подтверждает высокую эффективность метода CAGE ещё и для количественного анализа экспрессии. Основное преимущество CAGE — возможность секвенирования последовательностей старта транскрипции. Данная методика неоднократно совершенствовалась и были достигнуты следующие технологические показатели :

  • Малое время эксперимента (около 62 ч)
  • Низкое начальное количество РНК (1 — 5 мкг)
  • Возможность упрощения протоколов (можно сократить некоторые стадии эксперимента, например амплификацию с помощью ПЦР )
  • Относительно небольшая стоимость (81$ за библиотеку )

Ограничения

Так как метод был изначально создан для анализа 5'-концевых участков РНК, претерпевших процесс кэпирования, с помощью него невозможно анализировать некэпированные РНК. В связи с этим метод не применим к прокариотам, а также к РНК, транскрибированных РНК-полимеразами I и III . Кроме того большинство разработанных протоколов не работают с РНК короче ~100 нуклеотидов, так как они вымываются в ходе очистки .

Базовая схема эксперимента

Внешние изображения
Схема базового эксперимента

Ниже приводится схема базового эксперимента CAGE .

  1. Синтез полной кДНК обратной транскриптазой с олиго(dТ) праймером , комплементарным полиаденилированному 3’-концу мРНК. Получение полных мРНК-кДНК гибридов.
  2. 5'-конца мРНК с помощью обработки реагентом «CAP Trapper» , специфично взаимодействующим с двумя соседними гидроксильными группами кэпа.
  3. Очистка кэп-содержащих дуплексов с использованием стрептавидиновых носителей.
  4. Гидролиз мРНК, получение одноцепочечной полной кДНК.
  5. Прикрепление к 5'-концу 1-го биотинилированного линкера с сайтами узнавания эндонуклеаз рестрикции XmaJI и MmeI.
  6. Синтез второй цепи кДНК (до сайта полиаденилирования).
  7. Обработка дцДНК эндонулеазой рестрикции MmeI. Рестриктаза MmeI способна делать разрез двухцепочечной нуклеиновой кислоты, отступив 20/18 нуклеотидов. Эта её особенность используется, чтобы избавиться от большей части кДНК, сохранив примерно 20 нуклеотидов, соответствующих 5'-концу мРНК.
  8. Лигирование с противоположной стороны 2-го линкера, содержащего сайт узнавания XbaI .
  9. ПЦР (увеличение числа копий).
  10. Обработка рестриктазами XmaJI и XbaI (получение фрагментов по 32 нуклеотида, из которых 20 — последовательность с 5'-конца мРНК).
  11. Очистка стрептавидином (избавляемся от фрагментов линкеров).
  12. Получение лигированием липких GATC концов, возникших после обработки рестриктазами.
  13. Создание библиотеки клонов и секвенирование по Сэнгеру.
  14. Картирование фрагментов на собранный геном.

Развитие технологии

Внешние изображения
Схема обновленного эксперимента

В 2011 году, в связи с задействованием технологии в ENCODE , был переосмыслен протокол CAGE для секвенирования платформами нового поколения . Так, теперь :

  • В реакции обратной транскрипции используется фермент, не имеющий рибонуклеазной активности. Обратная транскриптаза SuperScript II ( РНКаза Н активность практически уничтожена мутагенезом ) заменена на PrimeScript (полностью отсутствует активность РНКаза Н, кроме того хорошо работает с GC-богатой РНК и РНК с богатой вторичной структурой , обладает более высокой точностью) . В результате происходит более качественный синтез первой цепи кДНК.
  • Вместо олиго(dТ) праймеров используются праймеры, содержащие случайную последовательность длиной 15 нт. Случайные праймеры были впервые предложены в 2006 году и позволяют работать с слабополиаденилированной и неполиаденилированной РНК. Также при использовании случайных праймеров эффективность транскрипции 5'-концов не зависит от длины мРНК.
  • Вместо эндонуклеазы рестрикции MmeI используется EcoP15I. Эндонуклеаза EcoP15I разрезает ДНК с отступом в 27 нт от сайта узнавания, что позволяет увеличить читаемое число нуклеотидов с 20 до 27, увеличив таким образом однозначность картирования последовательностей на геном.
  • Перед биотинилированием смесь обрабатывается РНКазами. Это приводит к увеличению качества очистки целевой РНК, так как экстрагируются только полные с 5'-конца РНК
  • Биотинилируются как кэп, так и 3'-конец РНК.
  • Одноцепочечные кДНК лигируют со специально подготовленными димерами маркированных линкеров, неспособными соединяться друг с другом.
  • После лигирования кДНК с димерами линкеров смесь обрабатывают специальной фосфатазой , работающей при низких температурах Данная процедура увеличивает точность метода.
  • Синтез второй цепи кДНК происходит при участии биотинилированных праймеров.
  • Производится лигирование со 2-м линкером, комплеметарным 3'-концевым праймерам секвенирования.
  • ПЦР (необходимый этап при создании библиотеки клонов и дальнейшего секвенирования) содержит 5'- и 3'-концевые последовательности праймеров секвенирования.

Методы, основанные на CAGE

DeepCAGE

Данный метод был разработан для нахождения малоактивных промоторов. Метод устарел по сравнению с более поздними протоколами. Для прочтения конкатемеров применяются методы 454-секвенирования «нового поколения» .

nanoCAGE

Данный метод был разработан для работы с очень малыми количествами РНК (до 10 нг тотальной РНК) :

  • Вместо использования реагента «CAP Trapper» применяется подход со сменой матрицы.
  • Используется эндонуклеаза EcoP15I, что позволяет увеличить длины последовательностей до 27 нуклеотидов.
  • Последовательности читаются напрямую на NGS-платформе Solexa (сейчас часть Illumina ), что позволяет отказаться от получения конкатемеров.

CAGEscan

Данный метод является адаптацией nanoCAGE (от тех же авторов) для секвенирования спаренных концов :

  • Не используется стадия ферментативного отрезания 5'-тегов.
  • 5'-концы кДНК секвенируются в обе стороны, чтобы соединить данные о новых промоторах со старыми аннотациями.

HeliScopeCAGE

Данный метод был разработан для уменьшения предвзятости и предполагает использование одномолекулярного секвенирования . Протокол автоматизирован Itoh et al. в 2012 году .

  • Отсутствуют стадии достраивания второй цепи, лигирования и отрезания 5'-концевых участков.
  • 5'-кэпированные РНК секвенируются без ПЦР с использованием платформы HeliScope (секвенирует индивидуальные молекулы).

RAMPAGE

Данный метод был разработан для профилирования активности промоторов .

  • Использование исходного реагента «CAP Тrapper», смена матрицы (nanoCAGE) и обработка 5′-фосфат-зависимыми экзонуклеазами совмещены для максимизации специфичности промотора.

nAnTi-CAGE

Данный метод был разработан для уменьшения предвзятости и предполагает использование Illumina .

  • Отсутствует стадия отрезания 5'-концевых участков последовательностей.
  • 5'-кэпированные РНК секвенируются без ПЦР.

Анализ

Результатом кэп-анализа экспрессии генов является набор последовательностей секвенированных областей, следующих за сайтами старта транскрипции, и их уровень экспрессии. Граница начала транскрипции определяется с точностью до одного нуклеотида. Окружение сайта начала транскрипции обычно включают в себя регуляторные элементы, контролирующие экспрессию генов. Таким образом, становится возможным сопоставление уровня экспрессии с различных точек инициации транскрипции, выявление и анализ мотивов в прилегающих к ним областях для поиска и качественного описания энхансеров и репрессоров .

Благодаря CAGE стало возможным картировать сайты стартов транскрипции и промоторы для мРНК с низким уровнем экспрессии . Также удалось доказать, что транскрипция часто начинается не строго с определённой позиции, а существует распределение: острое (где предпочтителен один старт и вариации незначительны) или широкое (когда явного пика не существует, и транскрипция может начинаться на участке в десятки и даже сотни нуклеотидов). В результате разное начало инициации транскрипции может влиять на функцию РНК/ белка и открывает возможность для дополнительной регуляции .

При анализе результатов CAGE надо учитывать отклонение в получаемых библиотеках в сторону добавления лишних гуанозинов на 5'-конец . Это происходит из-за проскальзывания обратной транскриптазы и даже используется в ряде протоколов, использующих «смену матрицы» .

Примечания

  1. Маргасюк Сергей Дмитриевич. . Конференция Ломоносов 2017 (2017). Дата обращения: 30 апреля 2019. 30 апреля 2019 года.
  2. Shiraki T. , Kondo S. , Katayama S. , Waki K. , Kasukawa T. , Kawaji H. , Kodzius R. , Watahiki A. , Nakamura M. , Arakawa T. , Fukuda S. , Sasaki D. , Podhajska A. , Harbers M. , Kawai J. , Carninci P. , Hayashizaki Y. (англ.) // Proceedings of the National Academy of Sciences. — 2003. — 8 December ( vol. 100 , no. 26 ). — P. 15776—15781 . — ISSN . — doi : . [ ]
  3. . fantom.gsc.riken.jp. Дата обращения: 1 мая 2019. Архивировано из 2 ноября 2018 года.
  4. Carninci Piero , Sandelin Albin , Lenhard Boris , Katayama Shintaro , Shimokawa Kazuro , Ponjavic Jasmina , Semple Colin A M , Taylor Martin S , Engström Pär G , Frith Martin C , Forrest Alistair R R , Alkema Wynand B , Tan Sin Lam , Plessy Charles , Kodzius Rimantas , Ravasi Timothy , Kasukawa Takeya , Fukuda Shiro , Kanamori-Katayama Mutsumi , Kitazume Yayoi , Kawaji Hideya , Kai Chikatoshi , Nakamura Mari , Konno Hideaki , Nakano Kenji , Mottagui-Tabar Salim , Arner Peter , Chesi Alessandra , Gustincich Stefano , Persichetti Francesca , Suzuki Harukazu , Grimmond Sean M , Wells Christine A , Orlando Valerio , Wahlestedt Claes , Liu Edison T , Harbers Matthias , Kawai Jun , Bajic Vladimir B , Hume David A , Hayashizaki Yoshihide. (англ.) // Nature Genetics. — 2006. — 28 April ( vol. 38 , no. 6 ). — P. 626—635 . — ISSN . — doi : . [ ]
  5. Gustincich Stefano , Sandelin Albin , Plessy Charles , Katayama Shintaro , Simone Roberto , Lazarevic Dejan , Hayashizaki Yoshihide , Carninci Piero. (англ.) // The Journal of Physiology. — 2006. — 24 August ( vol. 575 , no. 2 ). — P. 321—332 . — ISSN . — doi : . [ ]
  6. Kanamori-Katayama M. , Itoh M. , Kawaji H. , Lassmann T. , Katayama S. , Kojima M. , Bertin N. , Kaiho A. , Ninomiya N. , Daub C. O. , Carninci P. , Forrest A. R. R. , Hayashizaki Y. (англ.) // Genome Research. — 2011. — 19 May ( vol. 21 , no. 7 ). — P. 1150—1159 . — ISSN . — doi : . [ ]
  7. Vitezic Morana , Lassmann Timo , Forrest Alistair R. R. , Suzuki Masanori , Tomaru Yasuhiro , Kawai Jun , Carninci Piero , Suzuki Harukazu , Hayashizaki Yoshihide , Daub Carsten O. (англ.) // Nucleic Acids Research. — 2010. — 19 August ( vol. 38 , no. 22 ). — P. 8141—8148 . — ISSN . — doi : . [ ]
  8. Frith M. C. , Valen E. , Krogh A. , Hayashizaki Y. , Carninci P. , Sandelin A. (англ.) // Genome Research. — 2007. — 21 November ( vol. 18 , no. 1 ). — P. 1—12 . — ISSN . — doi : . [ ]
  9. The FANTOM Consortium , Riken Omics Science Center. (англ.) // Nature Genetics. — 2009. — 19 April ( vol. 41 , no. 5 ). — P. 553—562 . — ISSN . — doi : . [ ]
  10. Faulkner Geoffrey J , Kimura Yasumasa , Daub Carsten O , Wani Shivangi , Plessy Charles , Irvine Katharine M , Schroder Kate , Cloonan Nicole , Steptoe Anita L , Lassmann Timo , Waki Kazunori , Hornig Nadine , Arakawa Takahiro , Takahashi Hazuki , Kawai Jun , Forrest Alistair R R , Suzuki Harukazu , Hayashizaki Yoshihide , Hume David A , Orlando Valerio , Grimmond Sean M , Carninci Piero. (англ.) // Nature Genetics. — 2009. — 19 April ( vol. 41 , no. 5 ). — P. 563—571 . — ISSN . — doi : . [ ]
  11. . — 9th ed. — Dubuque, IA: McGraw-Hill, 2011. — С. 278—301. — xxvi, 1279, [97] pages с. — ISBN 9780073532226 , 9780077350024, 0077350022, 0073532223, 9780071222068, 0071222065, 9780071327640, 0071327649.
  12. Lieberman, Michael, 1950-. Chapter 14 // . — Fourth edition. — Philadelphia: Wolters Kluwer Health/Lippincott Williams & Wilkins, [2013]. — ix, 1014 pages с. — ISBN 9781608315727 , 160831572X, 9781451100037, 1451100035.
  13. Head Steven R. , Komori H. Kiyomi , LaMere Sarah A. , Whisenant Thomas , Van Nieuwerburgh Filip , Salomon Daniel R. , Ordoukhanian Phillip. (англ.) // BioTechniques. — 2014. — 1 February ( vol. 56 , no. 2 ). — ISSN . — doi : . [ ]
  14. Innocenti Nicolas , Golumbeanu Monica , Fouquier d'Hérouël Aymeric , Lacoux Caroline , Bonnin Rémy A. , Kennedy Sean P. , Wessner Françoise , Serror Pascale , Bouloc Philippe , Repoila Francis , Aurell Erik. (англ.) // RNA. — 2015. — 3 March ( vol. 21 , no. 5 ). — P. 1018—1030 . — ISSN . — doi : . [ ]
  15. Ettwiller Laurence , Buswell John , Yigit Erbay , Schildkraut Ira. (англ.) // BMC Genomics. — 2016. — 8 March ( vol. 17 , no. 1 ). — ISSN . — doi : . [ ]
  16. Mazin Pavel V. , Fisunov Gleb Y. , Gorbachev Alexey Y. , Kapitskaya Kristina Y. , Altukhov Ilya A. , Semashko Tatiana A. , Alexeev Dmitry G. , Govorun Vadim M. (англ.) // Nucleic Acids Research. — 2014. — 31 October ( vol. 42 , no. 21 ). — P. 13254—13268 . — ISSN . — doi : . [ ]
  17. Kawaji H. , Lizio M. , Itoh M. , Kanamori-Katayama M. , Kaiho A. , Nishiyori-Sueki H. , Shin J. W. , Kojima-Ishiyama M. , Kawano M. , Murata M. , Ninomiya-Fukuda N. , Ishikawa-Kato S. , Nagao-Sato S. , Noma S. , Hayashizaki Y. , Forrest A. R. R. , Carninci P. , The FANTOM Consortium. (англ.) // Genome Research. — 2014. — 27 March ( vol. 24 , no. 4 ). — P. 708—717 . — ISSN . — doi : . [ ]
  18. Adiconis Xian , Haber Adam L. , Simmons Sean K. , Levy Moonshine Ami , Ji Zhe , Busby Michele A. , Shi Xi , Jacques Justin , Lancaster Madeline A. , Pan Jen Q. , Regev Aviv , Levin Joshua Z. (англ.) // Nature Methods. — 2018. — 4 June ( vol. 15 , no. 7 ). — P. 505—511 . — ISSN . — doi : . [ ]
  19. Kodzius Rimantas , Kojima Miki , Nishiyori Hiromi , Nakamura Mari , Fukuda Shiro , Tagami Michihira , Sasaki Daisuke , Imamura Kengo , Kai Chikatoshi , Harbers Matthias , Hayashizaki Yoshihide , Carninci Piero. (англ.) // Nature Methods. — 2006. — March ( vol. 3 , no. 3 ). — P. 211—222 . — ISSN . — doi : . [ ]
  20. Carninci Piero , Kvam Catrine , Kitamura Akiko , Ohsumi Tomoya , Okazaki Yasushi , Itoh Mitsuteru , Kamiya Mamoru , Shibata Kazuhiro , Sasaki Nobuya , Izawa Masaki , Muramatsu Masami , Hayashizaki Yoshihide , Schneider Claudio. (англ.) // Genomics. — 1996. — November ( vol. 37 , no. 3 ). — P. 327—336 . — ISSN . — doi : . [ ]
  21. Takahashi Hazuki , Lassmann Timo , Murata Mitsuyoshi , Carninci Piero. (англ.) // Nature Protocols. — 2012. — 23 February ( vol. 7 , no. 3 ). — P. 542—561 . — ISSN . — doi : . [ ]
  22. . www.thermofisher.com. Дата обращения: 1 мая 2019. 1 мая 2019 года.
  23. . www.takarabio.com. Дата обращения: 1 мая 2019. 1 мая 2019 года.
  24. Valen E. , Pascarella G. , Chalk A. , Maeda N. , Kojima M. , Kawazu C. , Murata M. , Nishiyori H. , Lazarevic D. , Motti D. , Marstrand T. T. , Tang M.-H. E. , Zhao X. , Krogh A. , Winther O. , Arakawa T. , Kawai J. , Wells C. , Daub C. , Harbers M. , Hayashizaki Y. , Gustincich S. , Sandelin A. , Carninci P. (англ.) // Genome Research. — 2008. — 3 December ( vol. 19 , no. 2 ). — P. 255—265 . — ISSN . — doi : . [ ]
  25. Plessy Charles , Bertin Nicolas , Takahashi Hazuki , Simone Roberto , Salimullah Md , Lassmann Timo , Vitezic Morana , Severin Jessica , Olivarius Signe , Lazarevic Dejan , Hornig Nadine , Orlando Valerio , Bell Ian , Gao Hui , Dumais Jacqueline , Kapranov Philipp , Wang Huaien , Davis Carrie A , Gingeras Thomas R , Kawai Jun , Daub Carsten O , Hayashizaki Yoshihide , Gustincich Stefano , Carninci Piero. (англ.) // Nature Methods. — 2010. — 13 June ( vol. 7 , no. 7 ). — P. 528—534 . — ISSN . — doi : . [ ]
  26. Itoh Masayoshi , Kojima Miki , Nagao-Sato Sayaka , Saijo Eri , Lassmann Timo , Kanamori-Katayama Mutsumi , Kaiho Ai , Lizio Marina , Kawaji Hideya , Carninci Piero , Forrest Alistair R. R. , Hayashizaki Yoshihide. (англ.) // PLoS ONE. — 2012. — 30 January ( vol. 7 , no. 1 ). — P. e30809 . — ISSN . — doi : . [ ]
  27. Batut P. , Dobin A. , Plessy C. , Carninci P. , Gingeras T. R. (англ.) // Genome Research. — 2012. — 30 August ( vol. 23 , no. 1 ). — P. 169—180 . — ISSN . — doi : . [ ]
  28. Murata Mitsuyoshi , Nishiyori-Sueki Hiromi , Kojima-Ishiyama Miki , Carninci Piero , Hayashizaki Yoshihide , Itoh Masayoshi. (англ.) // Transcription Factor Regulatory Networks. — 2014. — P. 67—85 . — ISBN 9781493908042 . — ISSN . — doi : . [ ]
  29. de Hoon Michiel , Hayashizaki Yoshihide. (англ.) // BioTechniques. — 2008. — April ( vol. 44 , no. 5 ). — P. 627—632 . — ISSN . — doi : . [ ]
  30. Zhao Xiaobei , Valen Eivind , Parker Brian J. , Sandelin Albin. (англ.) // PLoS ONE. — 2011. — 24 August ( vol. 6 , no. 8 ). — P. e23409 . — ISSN . — doi : . [ ]
  31. Islam S. , Kjallquist U. , Moliner A. , Zajac P. , Fan J.-B. , Lonnerberg P. , Linnarsson S. (англ.) // Genome Research. — 2011. — 4 May ( vol. 21 , no. 7 ). — P. 1160—1167 . — ISSN . — doi : . [ ]

Ссылки

  • .
Источник —

Same as Кэп-анализ экспрессии генов