Interested Article - Кэп-анализ экспрессии генов
- 2020-06-14
- 1
Кэп-ана́лиз экспре́ссии ге́нов ( англ. cap analysis gene expression, CAGE ) — технология, используемая в молекулярной биологии , в результате которой получают профили экспрессии генов эукариот с одновременным определением специфических для клетки / ткани условий транскрипционных стартовых сайтов (TSS), включая данные о задействованных промоторах . Метод заключается в получении и прочтении коротких (обычно длиной 27 нуклеотидов ) участков последовательности 5'-конца кэпированных РНК эукариот. Далее проводится картирование секвенированных последовательностей на готовый геном , что позволяет уточнить 5'-границы транскрибируемых областей, а также провести количественный анализ экспрессии. Методика была разработана и опубликована в 2003 году, после чего активно совершенствовалась . Метод активно используется в исследовательском проекте по функциональной аннотации геномов млекопитающих ( англ. FANTOM — Functional Annotation of the Mammalian Genome) .
С помощью данного метода было показано существование альтернативно регулируемых сайтов начала транскрипции и были открыты новые регуляторные элементы . Также он позволил предсказывать сайты связывания факторов транскрипции и других мотивов , связанных с транскрипцией . Анализ 5'-концов данным методом особенно хорош для исследования регуляторных взаимосвязей генов; с его помощью выявили ключевые транскрипционные факторы, ответственные за дифференцировку монобластов в моноциты . Поскольку данный метод не предполагает никакую известную модель гена, он показал, что ретротранспозоны экспрессируются специфично и регулируют мРНК и другие некодирующие РНК .
Актуальность метода
Биологический аспект
Для транскрипции необходимо, чтобы РНК-полимераза связалась с промоторной последовательностью ДНК . У бактерий за этот процесс отвечает сигма-фактор , и, как правило, инициация происходит на −10 и −35 нуклеотидов до точки начала транскрипции (σ 70 узнает консенсусные последовательности в этой области) . У архей и эукариот происходит преинициация с участием транскрипционных факторов. В зависимости от типа транскрипционного фактора инициация у эукариот может происходить в разных сайтах промоторной области до точки начала транскрипции. Кроме того, существует множество механизмов регуляции этого процесса. Например, некоторые транскрипционные факторы способны связываться со специальными регуляторными последовательностями, что приводит к активации или подавлению транскрипции целевого гена. Сложность системы инициации транскрипции затрудняет точное предсказание сайта начала транскрипции по последовательности ДНК .
Секвенирование последовательностей мРНК позволяет решить эту проблему, однако используемый для поиска транскрибируемых участков RNA-seq , основанный на современных методах секвенирования с последующим картированием ридов на геном, обычно не позволяет определить четкие границы (с точностью до одного нуклеотида) концов РНК. С одной стороны, чем более протяженный участок мы можем отсеквенировать, тем проще будет собирать риды. С другой стороны, чем длиннее риды, тем меньше вероятность каждого из них попасть на край транскрипта. В результате при любой технологии секвенирования обычно возникают отклонения в количестве ридов на концах транскрибируемой области (см. рис. 1) .
Для решения проблемы определения точки начала транскрипции у бактерий существуют различные методы, основанные на избирательном присоединении различных тэгов к 5'-концу мРНК с трифосфатом на конце .
Для решения проблемы определения точки начала транскрипции у эукариот был создан метод CAGE и последующие его модификации. Он сосредоточен на секвенировании 5’-концов РНК, которые кэпированы у эукариот. У прокариот на 5'-конце вместо кэпа находится трифосфат, поэтому метод CAGE к ним применить невозможно. Однако применяется альтернативный метод: РНК обрабатывают эндонуклеазами , после чего подвергают обработке 5'- экзонуклеазами . При этом остаются только защищенные трифосфатом 5’-концевые фрагменты .
Технологические особенности
Сравнение методов RNA-seq и CAGE показывает, что оба метода дают почти одинаковые количественные оценки экспрессии генов . Это подтверждает высокую эффективность метода CAGE ещё и для количественного анализа экспрессии. Основное преимущество CAGE — возможность секвенирования последовательностей старта транскрипции. Данная методика неоднократно совершенствовалась и были достигнуты следующие технологические показатели :
- Малое время эксперимента (около 62 ч)
- Низкое начальное количество РНК (1 — 5 мкг)
- Возможность упрощения протоколов (можно сократить некоторые стадии эксперимента, например амплификацию с помощью ПЦР )
- Относительно небольшая стоимость (81$ за библиотеку )
Ограничения
Так как метод был изначально создан для анализа 5'-концевых участков РНК, претерпевших процесс кэпирования, с помощью него невозможно анализировать некэпированные РНК. В связи с этим метод не применим к прокариотам, а также к РНК, транскрибированных РНК-полимеразами I и III . Кроме того большинство разработанных протоколов не работают с РНК короче ~100 нуклеотидов, так как они вымываются в ходе очистки .
Базовая схема эксперимента
Ниже приводится схема базового эксперимента CAGE .
- Синтез полной кДНК обратной транскриптазой с олиго(dТ) праймером , комплементарным полиаденилированному 3’-концу мРНК. Получение полных мРНК-кДНК гибридов.
- 5'-конца мРНК с помощью обработки реагентом «CAP Trapper» , специфично взаимодействующим с двумя соседними гидроксильными группами кэпа.
- Очистка кэп-содержащих дуплексов с использованием стрептавидиновых носителей.
- Гидролиз мРНК, получение одноцепочечной полной кДНК.
- Прикрепление к 5'-концу 1-го биотинилированного линкера с сайтами узнавания эндонуклеаз рестрикции XmaJI и MmeI.
- Синтез второй цепи кДНК (до сайта полиаденилирования).
- Обработка дцДНК эндонулеазой рестрикции MmeI. Рестриктаза MmeI способна делать разрез двухцепочечной нуклеиновой кислоты, отступив 20/18 нуклеотидов. Эта её особенность используется, чтобы избавиться от большей части кДНК, сохранив примерно 20 нуклеотидов, соответствующих 5'-концу мРНК.
- Лигирование с противоположной стороны 2-го линкера, содержащего сайт узнавания XbaI .
- ПЦР (увеличение числа копий).
- Обработка рестриктазами XmaJI и XbaI (получение фрагментов по 32 нуклеотида, из которых 20 — последовательность с 5'-конца мРНК).
- Очистка стрептавидином (избавляемся от фрагментов линкеров).
- Получение лигированием липких GATC концов, возникших после обработки рестриктазами.
- Создание библиотеки клонов и секвенирование по Сэнгеру.
- Картирование фрагментов на собранный геном.
Развитие технологии
В 2011 году, в связи с задействованием технологии в ENCODE , был переосмыслен протокол CAGE для секвенирования платформами нового поколения . Так, теперь :
- В реакции обратной транскрипции используется фермент, не имеющий рибонуклеазной активности. Обратная транскриптаза SuperScript II ( РНКаза Н активность практически уничтожена мутагенезом ) заменена на PrimeScript (полностью отсутствует активность РНКаза Н, кроме того хорошо работает с GC-богатой РНК и РНК с богатой вторичной структурой , обладает более высокой точностью) . В результате происходит более качественный синтез первой цепи кДНК.
- Вместо олиго(dТ) праймеров используются праймеры, содержащие случайную последовательность длиной 15 нт. Случайные праймеры были впервые предложены в 2006 году и позволяют работать с слабополиаденилированной и неполиаденилированной РНК. Также при использовании случайных праймеров эффективность транскрипции 5'-концов не зависит от длины мРНК.
- Вместо эндонуклеазы рестрикции MmeI используется EcoP15I. Эндонуклеаза EcoP15I разрезает ДНК с отступом в 27 нт от сайта узнавания, что позволяет увеличить читаемое число нуклеотидов с 20 до 27, увеличив таким образом однозначность картирования последовательностей на геном.
- Перед биотинилированием смесь обрабатывается РНКазами. Это приводит к увеличению качества очистки целевой РНК, так как экстрагируются только полные с 5'-конца РНК
- Биотинилируются как кэп, так и 3'-конец РНК.
- Одноцепочечные кДНК лигируют со специально подготовленными димерами маркированных линкеров, неспособными соединяться друг с другом.
- После лигирования кДНК с димерами линкеров смесь обрабатывают специальной фосфатазой , работающей при низких температурах Данная процедура увеличивает точность метода.
- Синтез второй цепи кДНК происходит при участии биотинилированных праймеров.
- Производится лигирование со 2-м линкером, комплеметарным 3'-концевым праймерам секвенирования.
- ПЦР (необходимый этап при создании библиотеки клонов и дальнейшего секвенирования) содержит 5'- и 3'-концевые последовательности праймеров секвенирования.
Методы, основанные на CAGE
DeepCAGE
Данный метод был разработан для нахождения малоактивных промоторов. Метод устарел по сравнению с более поздними протоколами. Для прочтения конкатемеров применяются методы 454-секвенирования «нового поколения» .
nanoCAGE
Данный метод был разработан для работы с очень малыми количествами РНК (до 10 нг тотальной РНК) :
- Вместо использования реагента «CAP Trapper» применяется подход со сменой матрицы.
- Используется эндонуклеаза EcoP15I, что позволяет увеличить длины последовательностей до 27 нуклеотидов.
- Последовательности читаются напрямую на NGS-платформе Solexa (сейчас часть Illumina ), что позволяет отказаться от получения конкатемеров.
CAGEscan
Данный метод является адаптацией nanoCAGE (от тех же авторов) для секвенирования спаренных концов :
- Не используется стадия ферментативного отрезания 5'-тегов.
- 5'-концы кДНК секвенируются в обе стороны, чтобы соединить данные о новых промоторах со старыми аннотациями.
HeliScopeCAGE
Данный метод был разработан для уменьшения предвзятости и предполагает использование одномолекулярного секвенирования . Протокол автоматизирован Itoh et al. в 2012 году .
- Отсутствуют стадии достраивания второй цепи, лигирования и отрезания 5'-концевых участков.
- 5'-кэпированные РНК секвенируются без ПЦР с использованием платформы HeliScope (секвенирует индивидуальные молекулы).
RAMPAGE
Данный метод был разработан для профилирования активности промоторов .
- Использование исходного реагента «CAP Тrapper», смена матрицы (nanoCAGE) и обработка 5′-фосфат-зависимыми экзонуклеазами совмещены для максимизации специфичности промотора.
nAnTi-CAGE
Данный метод был разработан для уменьшения предвзятости и предполагает использование Illumina .
- Отсутствует стадия отрезания 5'-концевых участков последовательностей.
- 5'-кэпированные РНК секвенируются без ПЦР.
Анализ
Результатом кэп-анализа экспрессии генов является набор последовательностей секвенированных областей, следующих за сайтами старта транскрипции, и их уровень экспрессии. Граница начала транскрипции определяется с точностью до одного нуклеотида. Окружение сайта начала транскрипции обычно включают в себя регуляторные элементы, контролирующие экспрессию генов. Таким образом, становится возможным сопоставление уровня экспрессии с различных точек инициации транскрипции, выявление и анализ мотивов в прилегающих к ним областях для поиска и качественного описания энхансеров и репрессоров .
Благодаря CAGE стало возможным картировать сайты стартов транскрипции и промоторы для мРНК с низким уровнем экспрессии . Также удалось доказать, что транскрипция часто начинается не строго с определённой позиции, а существует распределение: острое (где предпочтителен один старт и вариации незначительны) или широкое (когда явного пика не существует, и транскрипция может начинаться на участке в десятки и даже сотни нуклеотидов). В результате разное начало инициации транскрипции может влиять на функцию РНК/ белка и открывает возможность для дополнительной регуляции .
При анализе результатов CAGE надо учитывать отклонение в получаемых библиотеках в сторону добавления лишних гуанозинов на 5'-конец . Это происходит из-за проскальзывания обратной транскриптазы и даже используется в ряде протоколов, использующих «смену матрицы» .
Примечания
- Маргасюк Сергей Дмитриевич. . Конференция Ломоносов 2017 (2017). Дата обращения: 30 апреля 2019. 30 апреля 2019 года.
- ↑ Shiraki T. , Kondo S. , Katayama S. , Waki K. , Kasukawa T. , Kawaji H. , Kodzius R. , Watahiki A. , Nakamura M. , Arakawa T. , Fukuda S. , Sasaki D. , Podhajska A. , Harbers M. , Kawai J. , Carninci P. , Hayashizaki Y. (англ.) // Proceedings of the National Academy of Sciences. — 2003. — 8 December ( vol. 100 , no. 26 ). — P. 15776—15781 . — ISSN . — doi : .
- . fantom.gsc.riken.jp. Дата обращения: 1 мая 2019. Архивировано из 2 ноября 2018 года.
- Carninci Piero , Sandelin Albin , Lenhard Boris , Katayama Shintaro , Shimokawa Kazuro , Ponjavic Jasmina , Semple Colin A M , Taylor Martin S , Engström Pär G , Frith Martin C , Forrest Alistair R R , Alkema Wynand B , Tan Sin Lam , Plessy Charles , Kodzius Rimantas , Ravasi Timothy , Kasukawa Takeya , Fukuda Shiro , Kanamori-Katayama Mutsumi , Kitazume Yayoi , Kawaji Hideya , Kai Chikatoshi , Nakamura Mari , Konno Hideaki , Nakano Kenji , Mottagui-Tabar Salim , Arner Peter , Chesi Alessandra , Gustincich Stefano , Persichetti Francesca , Suzuki Harukazu , Grimmond Sean M , Wells Christine A , Orlando Valerio , Wahlestedt Claes , Liu Edison T , Harbers Matthias , Kawai Jun , Bajic Vladimir B , Hume David A , Hayashizaki Yoshihide. (англ.) // Nature Genetics. — 2006. — 28 April ( vol. 38 , no. 6 ). — P. 626—635 . — ISSN . — doi : .
- Gustincich Stefano , Sandelin Albin , Plessy Charles , Katayama Shintaro , Simone Roberto , Lazarevic Dejan , Hayashizaki Yoshihide , Carninci Piero. (англ.) // The Journal of Physiology. — 2006. — 24 August ( vol. 575 , no. 2 ). — P. 321—332 . — ISSN . — doi : .
- ↑ Kanamori-Katayama M. , Itoh M. , Kawaji H. , Lassmann T. , Katayama S. , Kojima M. , Bertin N. , Kaiho A. , Ninomiya N. , Daub C. O. , Carninci P. , Forrest A. R. R. , Hayashizaki Y. (англ.) // Genome Research. — 2011. — 19 May ( vol. 21 , no. 7 ). — P. 1150—1159 . — ISSN . — doi : .
- Vitezic Morana , Lassmann Timo , Forrest Alistair R. R. , Suzuki Masanori , Tomaru Yasuhiro , Kawai Jun , Carninci Piero , Suzuki Harukazu , Hayashizaki Yoshihide , Daub Carsten O. (англ.) // Nucleic Acids Research. — 2010. — 19 August ( vol. 38 , no. 22 ). — P. 8141—8148 . — ISSN . — doi : .
- Frith M. C. , Valen E. , Krogh A. , Hayashizaki Y. , Carninci P. , Sandelin A. (англ.) // Genome Research. — 2007. — 21 November ( vol. 18 , no. 1 ). — P. 1—12 . — ISSN . — doi : .
- The FANTOM Consortium , Riken Omics Science Center. (англ.) // Nature Genetics. — 2009. — 19 April ( vol. 41 , no. 5 ). — P. 553—562 . — ISSN . — doi : .
- Faulkner Geoffrey J , Kimura Yasumasa , Daub Carsten O , Wani Shivangi , Plessy Charles , Irvine Katharine M , Schroder Kate , Cloonan Nicole , Steptoe Anita L , Lassmann Timo , Waki Kazunori , Hornig Nadine , Arakawa Takahiro , Takahashi Hazuki , Kawai Jun , Forrest Alistair R R , Suzuki Harukazu , Hayashizaki Yoshihide , Hume David A , Orlando Valerio , Grimmond Sean M , Carninci Piero. (англ.) // Nature Genetics. — 2009. — 19 April ( vol. 41 , no. 5 ). — P. 563—571 . — ISSN . — doi : .
- . — 9th ed. — Dubuque, IA: McGraw-Hill, 2011. — С. 278—301. — xxvi, 1279, [97] pages с. — ISBN 9780073532226 , 9780077350024, 0077350022, 0073532223, 9780071222068, 0071222065, 9780071327640, 0071327649.
- Lieberman, Michael, 1950-. Chapter 14 // . — Fourth edition. — Philadelphia: Wolters Kluwer Health/Lippincott Williams & Wilkins, [2013]. — ix, 1014 pages с. — ISBN 9781608315727 , 160831572X, 9781451100037, 1451100035.
- Head Steven R. , Komori H. Kiyomi , LaMere Sarah A. , Whisenant Thomas , Van Nieuwerburgh Filip , Salomon Daniel R. , Ordoukhanian Phillip. (англ.) // BioTechniques. — 2014. — 1 February ( vol. 56 , no. 2 ). — ISSN . — doi : .
- Innocenti Nicolas , Golumbeanu Monica , Fouquier d'Hérouël Aymeric , Lacoux Caroline , Bonnin Rémy A. , Kennedy Sean P. , Wessner Françoise , Serror Pascale , Bouloc Philippe , Repoila Francis , Aurell Erik. (англ.) // RNA. — 2015. — 3 March ( vol. 21 , no. 5 ). — P. 1018—1030 . — ISSN . — doi : .
- Ettwiller Laurence , Buswell John , Yigit Erbay , Schildkraut Ira. (англ.) // BMC Genomics. — 2016. — 8 March ( vol. 17 , no. 1 ). — ISSN . — doi : .
- Mazin Pavel V. , Fisunov Gleb Y. , Gorbachev Alexey Y. , Kapitskaya Kristina Y. , Altukhov Ilya A. , Semashko Tatiana A. , Alexeev Dmitry G. , Govorun Vadim M. (англ.) // Nucleic Acids Research. — 2014. — 31 October ( vol. 42 , no. 21 ). — P. 13254—13268 . — ISSN . — doi : .
- Kawaji H. , Lizio M. , Itoh M. , Kanamori-Katayama M. , Kaiho A. , Nishiyori-Sueki H. , Shin J. W. , Kojima-Ishiyama M. , Kawano M. , Murata M. , Ninomiya-Fukuda N. , Ishikawa-Kato S. , Nagao-Sato S. , Noma S. , Hayashizaki Y. , Forrest A. R. R. , Carninci P. , The FANTOM Consortium. (англ.) // Genome Research. — 2014. — 27 March ( vol. 24 , no. 4 ). — P. 708—717 . — ISSN . — doi : .
- Adiconis Xian , Haber Adam L. , Simmons Sean K. , Levy Moonshine Ami , Ji Zhe , Busby Michele A. , Shi Xi , Jacques Justin , Lancaster Madeline A. , Pan Jen Q. , Regev Aviv , Levin Joshua Z. (англ.) // Nature Methods. — 2018. — 4 June ( vol. 15 , no. 7 ). — P. 505—511 . — ISSN . — doi : .
- ↑ Kodzius Rimantas , Kojima Miki , Nishiyori Hiromi , Nakamura Mari , Fukuda Shiro , Tagami Michihira , Sasaki Daisuke , Imamura Kengo , Kai Chikatoshi , Harbers Matthias , Hayashizaki Yoshihide , Carninci Piero. (англ.) // Nature Methods. — 2006. — March ( vol. 3 , no. 3 ). — P. 211—222 . — ISSN . — doi : .
- Carninci Piero , Kvam Catrine , Kitamura Akiko , Ohsumi Tomoya , Okazaki Yasushi , Itoh Mitsuteru , Kamiya Mamoru , Shibata Kazuhiro , Sasaki Nobuya , Izawa Masaki , Muramatsu Masami , Hayashizaki Yoshihide , Schneider Claudio. (англ.) // Genomics. — 1996. — November ( vol. 37 , no. 3 ). — P. 327—336 . — ISSN . — doi : .
- Takahashi Hazuki , Lassmann Timo , Murata Mitsuyoshi , Carninci Piero. (англ.) // Nature Protocols. — 2012. — 23 February ( vol. 7 , no. 3 ). — P. 542—561 . — ISSN . — doi : .
- . www.thermofisher.com. Дата обращения: 1 мая 2019. 1 мая 2019 года.
- . www.takarabio.com. Дата обращения: 1 мая 2019. 1 мая 2019 года.
- Valen E. , Pascarella G. , Chalk A. , Maeda N. , Kojima M. , Kawazu C. , Murata M. , Nishiyori H. , Lazarevic D. , Motti D. , Marstrand T. T. , Tang M.-H. E. , Zhao X. , Krogh A. , Winther O. , Arakawa T. , Kawai J. , Wells C. , Daub C. , Harbers M. , Hayashizaki Y. , Gustincich S. , Sandelin A. , Carninci P. (англ.) // Genome Research. — 2008. — 3 December ( vol. 19 , no. 2 ). — P. 255—265 . — ISSN . — doi : .
- ↑ Plessy Charles , Bertin Nicolas , Takahashi Hazuki , Simone Roberto , Salimullah Md , Lassmann Timo , Vitezic Morana , Severin Jessica , Olivarius Signe , Lazarevic Dejan , Hornig Nadine , Orlando Valerio , Bell Ian , Gao Hui , Dumais Jacqueline , Kapranov Philipp , Wang Huaien , Davis Carrie A , Gingeras Thomas R , Kawai Jun , Daub Carsten O , Hayashizaki Yoshihide , Gustincich Stefano , Carninci Piero. (англ.) // Nature Methods. — 2010. — 13 June ( vol. 7 , no. 7 ). — P. 528—534 . — ISSN . — doi : .
- Itoh Masayoshi , Kojima Miki , Nagao-Sato Sayaka , Saijo Eri , Lassmann Timo , Kanamori-Katayama Mutsumi , Kaiho Ai , Lizio Marina , Kawaji Hideya , Carninci Piero , Forrest Alistair R. R. , Hayashizaki Yoshihide. (англ.) // PLoS ONE. — 2012. — 30 January ( vol. 7 , no. 1 ). — P. e30809 . — ISSN . — doi : .
- Batut P. , Dobin A. , Plessy C. , Carninci P. , Gingeras T. R. (англ.) // Genome Research. — 2012. — 30 August ( vol. 23 , no. 1 ). — P. 169—180 . — ISSN . — doi : .
- Murata Mitsuyoshi , Nishiyori-Sueki Hiromi , Kojima-Ishiyama Miki , Carninci Piero , Hayashizaki Yoshihide , Itoh Masayoshi. (англ.) // Transcription Factor Regulatory Networks. — 2014. — P. 67—85 . — ISBN 9781493908042 . — ISSN . — doi : .
- ↑ de Hoon Michiel , Hayashizaki Yoshihide. (англ.) // BioTechniques. — 2008. — April ( vol. 44 , no. 5 ). — P. 627—632 . — ISSN . — doi : .
- ↑ Zhao Xiaobei , Valen Eivind , Parker Brian J. , Sandelin Albin. (англ.) // PLoS ONE. — 2011. — 24 August ( vol. 6 , no. 8 ). — P. e23409 . — ISSN . — doi : .
- Islam S. , Kjallquist U. , Moliner A. , Zajac P. , Fan J.-B. , Lonnerberg P. , Linnarsson S. (англ.) // Genome Research. — 2011. — 4 May ( vol. 21 , no. 7 ). — P. 1160—1167 . — ISSN . — doi : .
Ссылки
- .
- 2020-06-14
- 1