Interested Article - Транскриптомные технологии

Транскрипто́мные техноло́гии ( англ. transcriptomics technologies ) — методы, разработанные для изучения транскриптома (то есть совокупности всех РНК - транскриптов ) организма. В состав транскриптома входят все транскрипты, которые присутствовали в клетке на момент . Исследуя транскриптом, можно установить, какие клеточные процессы были активны в тот или иной момент времени.

Первые попытки изучения транскриптома были предприняты в начале 1990-х годов. Благодаря развитию новых технологий в конце 1990-х транскриптомика стала важной биологической наукой. В настоящий момент в транскриптомике есть два основополагающих метода: микрочипы , позволяющие выявить наличие и количество определённых транскриптов, и секвенирование РНК (РНК-Seq), в котором используются методы секвенирования нового поколения для получения последовательностей всех транскриптов. С улучшением методик количество данных, получаемых в ходе одного транскриптомного эксперимента, увеличивалось. В связи с этим методы анализа данных также совершенствовались, чтобы обеспечить точный и эффективный анализ возрастающего объёма данных. Транскриптомные базы данных постоянно растут и становятся всё более полезными для исследователей. Это связано с тем, что правильная интерпретация данных, полученных в ходе транскриптомного эксперимента, практически невозможна без опоры на предшествующие исследования.

Измерение уровня экспрессии определённых генов в клетках разных тканей и при разных условиях или же в разные моменты времени даёт информацию о регуляторных механизмах, связанных с экспрессией генов. С помощью этих данных могут быть определены функции ранее генов. Анализ транскриптомов позволяет выявить различия в экспрессии определённых генов у разных организмов, что может быть особенно полезно для понимания молекулярных основ заболеваний человека .

История

Количество публикаций, касающихся РНК-Seq (чёрный), микрочипов (красный), экспрессируемых меток последовательностей (синий) и сериального/кэпового анализа экспрессии генов (жёлтый) с 1990 года по 2016 год

Первая попытка получения части человеческого транскриптома была предпринята в 1991 году; в ходе этого исследования были получены последовательности 609 мРНК из мозга человека . В 2008 году были опубликованы два человеческих транскриптома, состоящие из миллионов последовательностей, происходящих от транскриптов 16 тысяч генов . К 2015 году были опубликованы транскриптомы сотен людей . Получение транскриптомов индивидуумов с тем или иным заболеванием, разных тканей и даже одиночных клеток в настоящее время является рутинной процедурой . Бурное развитие транскриптомики было возможно благодаря быстрому развитию новых экономичных технологий с повышенной чувствительностью .

До транскриптомики

Исследования отдельных транскриптов проводились ещё за несколько десятилетий до того, как методы транскриптомики стали общедоступны. В конце 1970-х были получены , которые были конвертированы в комплементарную ДНК ( кДНК ) с помощью обратной транскриптазы для бабочки . В 1980-х с помощью низкопроизводительного секвенирования по Сэнгеру были получены последовательности случайных транскриптов; так появились так называемые ( англ. expressed sequence tags, EST ) . Метод секвенирования по Сэнгеру доминировал до появления технологий высокопроизводительного секвенирования, например, секвенирования синтезом ( Solexa/Illumina ). EST стали активно использоваться в 1990-х как эффективный метод определения генного состава организма без . Количество отдельных транскриптов оценивалось с помощью нозерн-блотов , и количественной ПЦР с обратной транскрипцией (RT-qPCR) . Однако эти методы очень трудоёмки и охватывают лишь крошечную долю целого транскриптома .

Первые попытки

Слово «транскриптом» ( англ. transcriptome ) было введено в употребление в 1990-х годах . В 1995 году появился первый транскриптомный метод, основанный на секвенировании, — ( англ. serial analysis of gene expression (SAGE) ), который заключался в секвенировании по Сэнгеру соединённых фрагментов случайных транскриптов. Количество транскриптов оценивалось по числу совпадений с фрагментами известных генов . Вскоре появился вариант SAGE, использующий вместо секвенирования по Сэнгеру технологии секвенирования нового поколения — цифровой анализ экспрессии генов ( англ. digital gene expression analysis ) . Однако эти методы практически полностью были вытеснены методами высокопроизводительного секвенирования целых транскриптов, которые давали дополнительную информацию о транскрипте, например, сведения о сплайсинговых вариантах .

Развитие современных методов

Сравнение современных методов
РНК-Seq Микрочипы
От 1 дня до 1 недели на эксперимент 1—2 дня на эксперимент
Необходимое количество РНК Низкое ~ 1 нг тотальной РНК Высокое ~ 1 мкг РНК
Трудоёмкость Высокая ( пробоподготовка и анализ данных) Низкая
Предшествующая информация Не требуется, хотя наличие /транскриптома упрощает работу Для создания необходим референсный геном/транскриптом
Точность * ~ 90 % (ограничена последовательностей) > 90 % (ограничена точностью детекции флуоресценции )
Разрешение последовательностей Может детектировать однонуклеотидные полиморфизмы и сплайсинговые варианты (ограничение — точность секвенирования (~ 99 %)) Специализированные микрочипы могут детектировать сплайсинговые варианты (ограничения — создание проб и кросс-гибридизация)
Чувствительность 1 транскрипт на миллион (приблизительно, ограничение — покрытие последовательности) 1 транскрипт на тысячу (приблизительно, ограничено детекцией флуоресценции)
Динамический диапазон 100000 : 1 (ограничен покрытием последовательности) 1000 : 1 (ограничен насыщением флуоресценции)
Техническая воспроизводимость > 99 % > 99 %

Превалирующие современные методы — микрочипы и РНК-Seq — появились в середине 1990-х и 2000-х соответственно . Публикации по микрочипам, которые измеряли относительное содержание определённых транскриптов за счёт их гибридизации с комплементарными пробами, нанесёнными на микрочип, появились в 1995 году . Метод микрочипов позволял одновременно исследовать тысячи транскриптов, и за счёт этого позволял снизить стоимость исследования транскриптома в расчёте на ген и сэкономить усилия . До конца 2000-х лучшими методами транскрипционного профилинга были пятновые олигонуклеотидные чипы ( англ. spotted oligonucleotide arrays ) и микрочипы с высокой плотностью . В течение этого периода было создано множество чипов, покрывающих известные гены модельных и экономически важных организмов. Улучшения технологий создания микрочипов привели к увеличению специфичности проб и количества генов, которые можно проанализировать с помощью одного чипа. Благодаря новым методам детекции флуоресценции стало возможным точно определять наличие и количество даже транскриптов, синтезируемых на низком уровне .

РНК-Seq подразумевает секвенирование кДНК, соответствующей транскриптам, причём численность отдельных фрагментов кДНК определяется численностью соответствующих транскриптов. Огромное влияние на РНК-Seq оказало развитие методов секвенирования нового поколения . Первым транскриптомным методом стало ( англ. Massively parallel signature sequencing (MPSS) ), в основе которого лежало образование коротких последовательностей длиной от 16 до 20 пар оснований (п. о.) в ходе сложной последовательности гибридизаций . В 2004 году с помощью этого метода была оценена экспрессия 10 тысяч генов растения Arabidopsis thaliana . Первая работа, посвящённая РНК-Seq, была опубликована в 2006 году. В ходе этого исследования с помощью технологии была определена последовательность ста тысяч транскриптов . Полученного покрытия было достаточно для оценки относительного количества отдельных транскриптов. Популярность РНК-Seq значительно повысилась после 2008 года, когда технологии Illumina/Solexa позволили секвенировать один миллиард транскриптов . Благодаря этим данным сейчас возможно количественно оценивать и сравнивать транскриптомы разных людей .

Получение данных

Получение данных о транскриптах возможно двумя принципиально различающимися путями: секвенированием отдельных транскриптов (EST или РНК-Seq) или гибридизацией транскриптов на упорядоченный чип нуклеотидных последовательностей (микрочип) .

Выделение РНК

Для всех транскриптомных методов необходимо выделить РНК из исследуемого организма. Несмотря на огромное разнообразие биологических систем, методика выделения РНК во всех случаях примерно одна и та же. Она включает разрушение клеток и тканей, разрушение РНКаз при помощи солей , разрушение макромолекул и комплексов, содержащих нуклеотиды , отделение РНК от ненужных биомолекул , включая ДНК, концентрирование РНК при помощи из раствора и очищение с помощью специальных . Выделенную РНК также можно дополнительно обработать ДНКазой , чтобы разрушить остатки ДНК . Обычно необходимо концентрирование мРНК, поскольку 98 % выделенной РНК приходится на рРНК . Концентрирование можно произвести с помощью методов, использующих наличие у мРНК поли(А)-хвоста , или путём удаления рРНК с помощью специфических проб . На результаты эксперимента может повлиять разрушенная РНК. Например, если отбирать мРНК из повреждённых РНК, то отобранные молекулы могут быть лишены 5'-концов и привести к искажению данных. Чтобы избежать разрушения РНК, перед её выделением образец обычно подвергают .

Экспрессируемые метки последовательностей

Экспрессируемые метки последовательностей (EST) — это короткие нуклеотидные последовательности, полученные из целого транскрипта. Поскольку EST можно получить без какой-либо специфики относительно организма, из которого выделена РНК, их можно получить из смеси организмов или образцов, взятых из окружающей среды . Хотя в настоящее время чаще всего используется высокопроизводительное секвенирование, EST активно использовали при разработке первых микрочипов. Например, микрочип ячменя был получен из 350 тысяч предварительно секвенированных EST .

Сериальный и кэповый анализ экспрессии генов (SAGE/CAGE)

Схема SAGE. Из организма выделяется мРНК, переводится в двуцепочечную ДНК (синий) посредством обратной транскрипции. Далее ДНК расщепляется рестриктазами (в точках ‘X’ и ‘X’+11) с образованием 11-нуклеотидных меток. Далее они конкатенируются и секвенируются с помощью метода Сэнгера с длинными прочтениями (метки разных оттенков синего соответствуют разным генам). Далее последовательности подвергают деконволюции и определяют частоту встречаемости каждой метки. Частота метки свидетельствует об интенсивности экспрессии соответствующего гена

Сериальный анализ экспрессии генов является дальнейшим развитием технологии EST с большей выработкой меток. Он также позволяет провести некоторый количественный анализ численности транскриптов. РНК сначала переводится в кДНК, затем она разрезается на метки длиной 11 нуклеотидов с помощью рестриктаз, которые вносят разрывы в определённые последовательности ДНК. Полученные метки сшивают по типу «голова к хвосту» в длинные фрагменты длиной более 500 нуклеотидов, которые секвенируют с помощью низкопроизводительных, но дающих длинные методов, таких как секвенирование по Сэнгеру. Далее последовательности снова делят на 11-нуклеотидные кусочки с помощью специальных компьютерных программ (деконволюция) . Если референсный геном недоступен, то полученные метки можно непосредственно использовать в качестве диагностических маркеров, которые в случае болезни экспрессируются иначе, чем в здоровом организме .

Кэповый анализ экспрессии генов ( англ. cap analysis gene expression, CAGE ) представляет собой вариант SAGE, при котором в качестве меток берутся только 5'-концевые последовательности мРНК. Поэтому, когда метки выравниваются на референсный геном, можно идентифицировать точки начала транскрипции генов. Этот метод активно используется для анализа промоторов и для клонирования полноразмерных кДНК .

SAGE и CAGE дают информацию о большем количестве генов, чем секвенирование отдельных EST, однако пробоподготовка и анализ данных в этих методах существенно сложнее .

Микрочипы

Схема работы микрочипов. Из организма выделяется зрелая мРНК (красный) и путём обратной транскрипции переводится в двуцепочечную ДНК (синий). Далее ДНК фрагментируется и флуоресцентно метится (оранжевый). Меченые фрагменты связываются с комплементарными олигонуклеотидными пробами на микрочипе, и интенсивность флуоресценции в каждой ячейке свидетельствует о численности соответствующего гена

Принципы и преимущества

Микрочип состоит из коротких олигонуклеотидов (проб), которые прикреплены в ячейках сетки на стеклянной подложке . Многочисленность транскриптов определяется на основании гибридизации транскриптов с этими пробами . в каждой ячейке свидетельствует о численности транскрипта, гибридизующегося с данной пробой .

Для создания микрочипа необходимо знать, хотя бы частично, геном исследуемого организма, например, в виде аннотированной последовательности или библиотеки EST; это необходимо для создания проб .

Методы

Микрочипы, использующиеся в транскриптомике, можно подразделить на два типа: пятновые чипы с низкой плотностью и чипы высокой плотности с короткими пробами . Пятновые чипы низкой плотности обычно представляют собой стеклянную основу, на которую нанесены пико литровые капли, содержащие разные фрагменты очищенной кДНК . Эти пробы длиннее, чем в чипах с короткими пробами, и с их помощью нельзя выявить события альтернативного сплайсинга . В пятновых чипах используются два типа флуорофоров , которыми метят экспериментальные и контрольные образцы, а относительная многочисленность высчитывается из интенсивности флуоресценции . Чипы высокой плотности используют только одну флуоресцентную метку, и каждый образец гибридизуется и детектируется отдельно . Чипы высокой плотности распространялись компанией Affymetrix GeneChip. В этих чипах каждому транскрипту соответствует несколько 25-нуклеотидных проб . Компания NimbleGen производит чипы высокой плотности при помощи , которая позволяла получать чипы разного строения. Один чип содержит сотни тысяч проб длиной от 45 до 85 нуклеотидов, которые гибридизуются с образцом, меченным флуоресцентной меткой одного вида .

РНК-Seq

Схема РНК-Seq. Из организма выделяется зрелая мРНК (красный) и путём обратной транскрипции переводится в двуцепочечную ДНК (синий). ДНК секвенируется при помощи высокопроизводительных методов с короткими прочтениями. Далее прочтения выравниваются на референсный геном, благодаря чему выявляются транскрибирующиеся участки генома. С помощью полученных данных можно установить, какие гены экспрессируются, какова интенсивность их экспрессии, а также наличие альтернативного сплайсинга

Принципы и преимущества

РНК-Seq представляет собой сочетание высокопроизводительного секвенирования с вычислительными методами оценки численности отдельных транскриптов в экстракте РНК . Обычно получаются последовательности длиной около 100 пар оснований (п. о.), однако в зависимости от метода секвенирования их длина может составлять от 30 п. о. до 10 тысяч п. о. РНК-Seq обеспечивает глубокое покрытие транскриптома множеством коротких фрагментов, благодаря которому возможно при помощи вычислительных методов реконструировать исходные транскрипты, выравнивая прочтения на референсный геном или друг на друга ( сборка de novo ) . С помощью РНК-Seq можно рассчитать количество как многочисленных, так и малочисленных РНК, так как динамический диапазон метода составляет 5 порядков. В этом заключается главное преимущество РНК-Seq перед микрочипами. Кроме того, для РНК-Seq требуется очень мало исследуемой РНК по сравнению с микрочипами — нанограммы против микрограммов. Благодаря этому РНК-Seq в сочетании с линейной амплификацией кДНК позволяет исследовать очень небольшие клеточные структуры вплоть до отдельных клеток . Теоретически верхнего предела количественной оценки в РНК-Seq не существует, и для прочтений длиной 100 п. о. фоновый шум в неповторяющихся участках очень низок .

С помощью РНК-Seq можно идентифицировать гены в геноме или установить, какие гены активны в данный момент времени. На основании количества прочтений можно точно установить относительный уровень экспрессии генов. Методология РНК-Seq постоянно совершенствуется, преимущественно за счёт улучшения технологий секвенирования, которые повышают производительность и точность метода, а также выдают прочтения всё большей длины . Со времени первых публикаций в 2006 и 2008 годах РНК-Seq интенсивно внедрялся в исследования и к 2015 году догнал микрочипы, став вторым доминирующим транскриптомным методом .

Попытки получения транскриптомных данных для отдельных клеток стимулировали совершенствование методов приготовления библиотек для РНК-Seq, что значительно увеличило чувствительность технологии. На данный момент получен ряд транскриптомов единичных клеток и даже появились методы РНК-Seq in situ , в которых транскриптомы отдельных клеток были получены непосредственно в фиксированных тканях .

Методы

РНК-Seq появился вместе с бурным развитием нескольких методов высокопроизводительного секвенирования . Однако стадии секвенирования выделенных РНК предшествуют несколько этапов пробоподготовки, которые различаются в разных методах. Методы различаются способами концентрирования транскриптов, фрагментации, амплификации, способом секвенирования (одноконцевое или парноконцевое), а также тем, сохраняется ли информация об исходной цепи .

Чувствительность РНК-Seq в конкретном эксперименте можно повысить за счёт концентрирования интересующих классов РНК и удаления остальных. мРНК можно отделить с помощью олигонуклеотидных проб, которые связываются с их поли(А)-хвостами. Удалить неинформативные и чрезвычайно многочисленные рРНК можно с помощью гибридизующихся проб, созданных специально для рРНК данного таксона (например, млекопитающих или растений). Однако вместе с рРНК с помощью такого подхода можно удалить и другие РНК, что может исказить картину эксперимента. Малые РНК , например, микроРНК , можно выделить на основании их размера из агарозного геля после .

Поскольку мРНК, как правило, длиннее, чем единичные прочтения в большинстве методов высокопроизводительного секвенирования, обычно перед секвенированием транскрипты . Метод фрагментации лежит в основе создания библиотеки для секвенирования. Фрагментацию можно проводить путём химического гидролиза , распыления, обработки ультразвуком ( ) или обратной транскрипции с использованием терминирующих нуклеотидов . Кроме того, фрагментацию и добавление меток к кДНК можно осуществить одновременно при помощи транспозаз .

В ходе пробоподготовки для секвенирования фрагменты кДНК, соответствующие транскриптам, можно размножить с помощью ПЦР так, чтобы повысить численность молекул, содержащих необходимые 3'- и 5'-концевые . Стадия амплификации также необходима перед секвенированием образцов с очень низким содержанием РНК. Нижним пределом количества РНК, которое пригодно для секвенирования, является 50 пикограмм . Чтобы оценить качество библиотеки и секвенирования ( GC-состав , длина фрагментов, предпочтение фрагментов с определённым положением в транскрипте), можно использовать контрольные . ( англ. unique molecular identifiers, UMI ) — это короткие случайные последовательности, которые используются для индивидуального мечения фрагментов при приготовлении библиотеки таким образом, чтобы после добавления идентификатора каждый фрагмент был уникален . С помощью UMI можно измерить численность транскриптов в абсолютной шкале, чтобы скорректировать отклонения, возникшие при создании библиотеки, перед амплификацией, а также чтобы точно оценить количество ДНК в исходном образце. UMI особенно удобны для РНК-Seq одиночных клеток, в которых исходное количество РНК очень мало и требует неспецифичной амплификации .

После пробоподготовки молекулы транскриптов (точнее, соответствующих им кДНК) можно секвенировать в одном направлении (одноконцевое прочтение) или в обоих (парноконцевое прочтение). Одноконцевое секвенирование, как правило, быстрее и дешевле, и в большинстве случаев его достаточно для количественной оценки уровней экспрессии генов. Парноконцевое секвенирование позволяет получить более точные выравнивания и сборки , что очень важно для аннотации генов и описания изоформ транскриптов . Методы РНК-Seq, специфичные по отношению к цепи, сохраняют сведения о цепи ДНК, с которой был транскрибирован каждый транскрипт. Без этой информации прочтения можно выровнять на локус , однако будет неясно, в каком направлении происходит транскрипция гена. Одноцепочечный РНК-Seq удобен для определения направления транскрипции , расположенных на разных цепях, что позволяет сделать предсказание генов у немодельных организмов более точным .

Технологии секвенирования, используемые в РНК-Seq
Платформа Коммерческий релиз Типичная длина прочтения Максимальная производительность одного запуска Точность единичного прочтения Запуски РНК-Seq, размещённые в базе NCBI SRA по состоянию на октябрь 2016 года. RNA-Seq runs deposited in the NCBI SRA (Oct 2016)
454 Life Sciences 2005 700 п. о. 0,7 миллиарда п. о. 99,9 % 3548
Illumina 2006 50-300 п. о. 900 миллиардов п. о. 99,9 % 362903
SOLiD 2008 50 п. о. 320 миллиардов п. о. 99,9 % 7032
Ion Torrent 2010 400 п. о. 30 миллиардов п. о. 98 % 1953
2011 10000 п. о. 2 миллиарда п. о. 87 % 160

NCBI SRA — Национального центра биотехнологической информации ( США )

Поскольку в настоящий момент РНК-Seq включает перевод РНК в кДНК в ходе обратной транскрипции, платформы для последующего секвенирования одинаковы и для транскриптомных, и для геномных данных. По этой причине развитие РНК-Seq в значительной мере определяется усовершенствованием методов секвенирования ДНК . Однако всё большее распространение получает непосредственное секвенирование РНК при помощи нанопор . С помощью нанопорового секвенирования в РНК можно обнаружить модифицированные основания , которые нельзя было выявить при секвенировании кДНК, кроме того, для этого метода не нужна амплификация, которая вносит дополнительные искажения .

Чувствительность и точность РНК-Seq определяются числом прочтений, полученных с каждого образца . Для достаточного покрытия транскриптома необходимо очень много прочтений, что позволяет обнаружить даже малочисленные транскрипты. Дополнительные сложности создаёт этап секвенирования, дающего прочтения ограниченной длины, различной точности и качества. Более того, организмы каждого вида имеют разное количество генов, поэтому для эффективной сборки транскриптома для каждого вида необходимо разное число прочтений. На ранних этапах это количество определялось эмпирически, однако с развитием технологий необходимое покрытие стало возможным предсказывать вычислительными методами. Наиболее эффективным способом улучшения точности выявления дифференциальной экспрессии низкоэкспрессируемых генов является не увеличение числа прочтений, а увеличение . В настоящий момент Энциклопедия элементов ДНК рекомендует 70-кратное покрытие экзома для обычного РНК-Seq и до 500-кратного покрытия для обнаружения редких транскриптов и изоформ .

Анализ данных

Методы транскриптомики позволяют проводить параллельные эксперименты со множеством образцов, поэтому для получения результатов как с помощью РНК-Seq, так и с помощью микрочипов необходима серьёзная вычислительными методами . Данные с микрочипов представляют собой изображения с высоким разрешением , поэтому обработка данных включает ( англ. feature detection ) и спектральный анализ . Изображения, полученные с микрочипов, достигают размера 750 Мб , в то время как обработанные данные занимают 60 Мб. Множество коротких проб, соответствующих одному и тому же транскрипту, могут позволить определить экзон - интронную структуру гена, поэтому для определения достоверности финального сигнала необходимы статистические модели . В ходе экспериментов РНК-Seq получаются миллиарды коротких последовательностей ДНК, которые необходимо выровнять на референсный геном , включающий миллионы или миллиарды п. о. Сборка транскриптома de novo требует построения весьма сложных . Операции обработки данных РНК-Seq требуют многократного повторения, поэтому для них могут удобны параллелизованные вычисления , однако с использованием современных алгоритмов обработку данных простых транскриптомных экспериментов, не требующих сборки de novo , можно осуществить даже на обычном персональном компьютере . Человеческий транскриптом можно достаточно точно собрать из 300 миллионов 100-нуклеотидных прочтений, полученных с помощью РНК-Seq . Для хранения такого объёма данных в сжатом требуется 1,8 Гб дискового пространства на образец. Обработанные численные значения для каждого гена занимают ещё меньше памяти, сопоставимо с обработанными данными с микрочипов. Данные о последовательностях можно хранить в публичных данных, таких как SRA (от англ. sequence read archive — архив прочтений последовательностей) . Набор данных РНК-Seq можно загрузить в базу данных Gene Expression Omnibus .

Обработка изображений

Микрочип и проточная ячейка для секвенирования (РНК-Seq). Обработка изображений при использовании микрочипов и РНК-Seq различается. В микрочипе каждое пятно соответствует определённой олигонуклеотидной пробе, и интенсивность флуоресценции соответствует численности определённого транскрипта (Affymetrix). В ячейке для высокопроизводительного секвенирования пятно соответствует одному нуклеотиду, секвенированному в данный момент времени, и цвет флуоресценции соответствует виду нуклеотида (Illumina Hiseq). В различных видах этих методов может быть использовано большее или меньшее количество цветов

Обработка изображений , полученных с микрочипов, должна сохранять ячеек изображения и независимо количественно оценивать интенсивность флуоресценции в каждой ячейке. Необходимо также выявлять и исключать их из финального анализа. Интенсивность флуоресценции свидетельствует о представленности каждой последовательности, поскольку последовательность пробы в каждой ячейке известна .

Первые этапы РНК-Seq также включают схожую обработку изображений, однако перевод изображений в данные о последовательностях производится автоматически специальными программами. Результатом секвенирования синтезом по технологии Illumina является совокупность кластеров, расположенных на поверхности проточной ячейки . В ходе каждого цикла секвенирования изображение каждой проточной ячейки снимается до четырёх раз, причём один запуск включает десятки или сотни циклов. Кластеры проточных ячеек аналогичны пятнам в микрочипах и на ранних этапах секвенирования должны быть правильно определены. При пиросеквенировании (компания ) интенсивность испускаемого света соответствует количеству одинаковых нуклеотидов в гомо полимерном участке. Существует множество вариаций перечисленных методов, и каждая предполагает использование разных профилей ошибок для получающихся данных .

Анализ данных РНК-Seq

В ходе экспериментов РНК-Seq получается огромный объём прочтений, которые необходимо обработать для получения полезной информации. Анализ данных, как правило, включает использование комбинаций различных биоинформатических программ, которые необходимо подбирать сообразно эксперименту и целям. Процесс обработки данных можно разбить на четыре этапа: контроль качества, выравнивание, количественный анализ и дифференциальная экспрессия . Наиболее популярные программы для обработки данных РНК-Seq запускаются из командной строки в среде Unix или R / Bioconductor .

Контроль качества

Прочтения небезупречны, поэтому необходимо определить точность прочтения каждого основания в последовательности. Прочтения, прошедшие контроль качества, гарантированно имеют высокую точность определения каждого основания, их GC-состав соответствует ожидаемому распределению, в них нет перепредставленности коротких мотивов и редки дупликации . Существует несколько программ для анализа качества, например, FastQC и FaQCs. Низкокачественные прочтения или удаляются, или специальным образом помечаются, что учитывается при дальнейшем анализе .

Выравнивание

Чтобы связать численность прочтений с определённым геном, прочтения необходимо выровнять на референсный геном или друг на друга, если референсный геном неизвестен (сборка транскриптома de novo ) . Основными требованиями, которым должны удовлетворять программы для выравнивания, являются скорость, позволяющая за приемлемое время выровнять миллиарды коротких прочтений, определённая гибкость, чтобы выявлять случаи сплайсинга эукариотических мРНК, а также правильно выбирать расположение прочтений, соответствующих нескольким местам в геноме. Программы постоянно совершенствуются в соответствии с перечисленными требованиями, а увеличение длины прочтений снижает вероятность неоднозначного выравнивания. (EBI) поддерживает список доступных в данный момент инструментов для выравнивания прочтений, полученных при высокопроизводительном секвенировании .

Выравнивание первичных эукариотических транскриптов на референсный геном требует особое обращение с интронами, которых нет в зрелых мРНК . Программы для выравнивания коротких прочтений могут создавать особые выравнивания, предназначенные специально для идентификации сайтов сплайсинга на основе канонических последовательностей сайтов сплайсинга. Идентификация сайтов сплайсинга предотвращает их ошибочное выравнивание или отбраковывание, позволяя выровнять на референсный геном большее количество прочтений и увеличивая качество количественных оценок экспрессии генов. Поскольку * может осуществляться на уровне изоформ мРНК, выравнивания, учитывающие сплайсинг, позволяют обнаружить изменения в численности тех или иных изоформ, что было бы невозможно с помощью обычного анализа .

Для сборки транскриптома de novo производится выравнивание прочтений друг на друга, что позволяет реконструировать полноразмерные транскрипты без использования референсного генома . Сложностями сборки de novo являются необходимость больших вычислительных мощностей, чем для сборки на основе референсного генома, дополнительной проверки вариантов и фрагментов генов и дополнительной аннотации собранных транскриптов. Первые метрики, предназначенные для оценки качества сборки транскриптома, такие как N50 , были признаны ошибочными , и в данный момент доступны усовершенствованные методы оценки. Метрики, основанные на аннотации, хорошо подходят для оценки степени сборки генома. Транскриптом, собранный de novo , может быть использован в качестве референсного при выравнивании последовательностей и количественном анализе экспрессии генов .

Программы для сборки транскриптома de novo
Программа Дата релиза Дата последнего обновления Вычислительная эффективность Сильные и слабые стороны
Velvet-Oases 2008 2011 Низкая, один поток выполнения , необходимо много памяти с произвольным доступом Первый сборщик коротких прочтений. В настоящее время почти не используется.
SOAPdenovo-trans 2011 2014 Средняя, несколько потоков выполнения, умеренная необходимость в памяти с произвольным доступом Один из первых сборщиков коротких прочтений. Адаптирован для сборки транскриптомов.
Trans-ABySS 2010 2016 Средняя, несколько потоков выполнения, умеренная необходимость в памяти с произвольным доступом Предназначена для коротких прочтений, но может быть использована и для сложных транскриптомов. Доступна MPI -параллельная версия для вычислительных кластеров.
Trinity 2011 2017 Средняя, несколько потоков выполнения, умеренная необходимость в памяти с произвольным доступом Предназначена для коротких прочтений. Можно использовать для сложных транскриптомов, но требуется много памяти.
miraEST 1999 2016 Средняя, несколько потоков выполнения, умеренная необходимость в памяти с произвольным доступом Может обрабатывать повторяющиеся последовательности, комбинирует несколько форматов данных секвенирования, совместима с большим числом платформ секвенирования.
Newbler 2004 2012 Низкая, один поток выполнения, необходимо много памяти с произвольным доступом Специализирована на устранении ошибок секвенаторов 454 Roche, связанных с гомополимерными последовательностями.
CLC genomics workbench 2008 2014 Высокая, несколько потоков выполнения, низкая необходимость памяти с произвольным доступом Имеет графический интерфейс , может комбинировать различные технологии секвенирования. Не специализирована для транскриптомов, перед использованием необходимо приобрести лицензию.
SPAdes 2012 2017 Высокая, несколько потоков выполнения, низкая необходимость памяти с произвольным доступом Предназначена для транскриптомных экспериментов с единичными клетками.
RSEM 2011 2017 Высокая, несколько потоков выполнения, низкая необходимость памяти с произвольным доступом Может оценивать частоту альтернативно сплайсированных транскриптов. Удобна в использовании.
StringTie 2015 2018 Высокая, несколько потоков выполнения, низкая необходимость памяти с произвольным доступом Может использовать комбинацию методов сборки на основе референсного генома и de novo для идентификации транскриптов.

Количественный анализ

Тепловая карта, отображающая наличие одинаковых паттернов экспрессии в различных образцах. Каждая колонка отображает данные измерений изменений экспрессии генов в единичном образце. Относительная экспрессия генов показана цветом: высокая (красный), средняя (белый) и низкая (синий). Гены и образцы с одинаковой экспрессией можно автоматически сгруппировать (левое и верхнее деревья). Образцы могут соответствовать разным индивидуумам, тканям, условиям среды и состоянию здоровья. В данном примере в образцах 1, 2 и 3 экспрессия набора генов 1 высокая, а набора 2 — низкая

Количественный анализ выравниваний прочтений может быть произведён на уровне гена, экзона и транскрипта. Типичным результатом анализа является количество прочтений для каждого элемента анализа (гена, экзона или транскрипта). Например, для генов она выдаётся в формате general feature format (GFF) . Количество прочтений для генов и экзонов можно определить при помощи разных программ, например, HTSeq . Анализ на уровне транскрипта более сложен и требует привлечения вероятностных методов для оценки численности транскрипта на основании коротких прочтений; например, это может выполнить программа cufflinks . Прочтения, одинаково хорошо ложащиеся на разные места в геноме, должны быть идентифицированы и удалены либо выровнены на одно из возможных мест либо на наиболее вероятное из них. Некоторые методы оценки вовсе не предполагают выравнивания прочтения на референсный геном. Например, метод, используемый в программе kallisto, объединяет псевдовыравнивание и количественный анализ в один шаг, который идёт на два порядка быстрее, чем методы программ tophat и cufflinks, и требует меньших вычислительных затрат .

Дифференциальная экспрессия

Когда для каждого транскрипта получены количественные данные, с помощью их статистического анализа , моделирования и нормализации анализируется дифференциальная экспрессия генов . Большинство программ, которые её анализируют, берут на вход таблицу из названий генов и числа транскриптов для каждого из них, но некоторые программы, например, cuffdiff, в качестве входных данных получают выравнивание прочтений в (от англ. Binary Alignment Map — карта попарных выравниваний). На выходе программы выдают список генов с результатами попарных статистических тестов , проверяющих значимость различий в экспрессии между экспериментальными и контрольными данными .

Программы для анализа дифференциальной экспрессии генов в экспериментах РНК-Seq
Программа Среда Специализация
Cuffdiff2 Основанные на Unix Анализ транскриптов, направленный на обнаружение событий альтернативного сплайсинга мРНК
EdgeR R/Bioconductor Любые количественные геномные данные
DEseq2 R/Bioconductor Разные типы данных
Limma/Voom R/Bioconductor Microarray or RNA-Seq data, flexible experiment design
Ballgown R/Bioconductor Эффективное и чувствительное отыскание транскриптов

Подтверждение

Результаты транскриптомного анализа можно подтвердить с помощью других методов, например, количественной ПЦР (qPCR) . Экспрессия генов измеряется относительно стандартной экспрессии изучаемого гена и контрольных генов. Принцип измерения в qPCR такой же, что и в РНК-Seq, а именно, значение для данного гена рассчитывается на основе концентрации участка-мишени в исследуемом образце. Однако qPCR подходит только для , имеющих менее 300 п. о. и расположенных вблизи 3'-конца кодирующей области . Если необходимо проверить данные по изоформам транскрипта, с помощью тщательного анализа выравниваний прочтений РНК-Seq можно определить, каким участкам должны соответствовать праймеры для qPCR, чтобы сделать различия наиболее явными . Измерение экспрессии контрольных генов наряду с исследуемыми даёт стабильные референсные данные. Проверка данных РНК-Seq с помощью контрольной ПЦР показала, что разные варианты РНК-Seq в целом дают схожие данные .

Для анализа транскриптомных данных очень важна информация о функциях изучаемых генов. Наблюдаемые паттерны экспрессии генов можно связать с определённым фенотипом при помощи экспериментов по нокдауну изучаемых генов и .

Применение

Диагностика и профилирование заболеваний

Транскриптомные технологии нашли применение в различных областях биомедицины , в частности, в диагностике и профилировании заболеваний . С помощью РНК-Seq стало возможным обнаружение сайтов начала транскрипции, использования альтернативных промоторов и новых вариантов альтернативного сплайсинга. Поскольку геномные играют важную роль в патогенезе многих заболеваний, определение их вариантов чрезвычайно важно для интерпретации данных полногеномного поиска ассоциаций . С помощью РНК-Seq можно обнаруживать однонуклеотидные полиморфизмы, связанные с болезнями, случаи аллелеспецифичной экспрессии, , которые позволяют пролить свет на генетические основы развития заболеваний .

С помощью РНК-Seq можно получить информацию о транскрипции эндогенных ретротранспозонов , которые могут влиять на транскрипцию соседних генов посредством разнообразных эпигенетических механизмов, что может привести к развитию болезней . Важной потенциальной сферой применения РНК-Seq является исследование молекулярных основ нарушений иммунной системы , потому что этот метод позволяет разделить популяции иммунных клеток разных типов и секвенировать репертуары T- и B-клеточных рецепторов пациентов .

Транскриптомы человека и его патогенов

С помощью РНК-Seq можно находить изменения в экспрессии генов у человеческих патогенов , что может помочь идентифицировать новые , предсказывать устойчивость к антибиотикам , а также понять детали . С помощью РНК-Seq можно разработать оптимизированные меры , а также направленные индивидуальные стратегии лечения .

Транскриптомный анализ можно проводить и для хозяина, и для патогена. С помощью двойного РНК-Seq можно одновременно построить профили экспрессии генов и хозяина, и патогена в ходе всего инфекционного процесса . Такой подход позволяет изучать динамический иммунный ответ и межвидовые для обоих взаимодействующих организмов с момента начального контакта до инвазии и финальной персистенции патогена или его разрушения иммунной системой хозяина .

Ответы на условия окружающей среды

Транскриптомика позволяет идентифицировать гены и метаболические пути , ответственные за ответ и противодействие стрессам, связанным с биотическими и абиотическими факторами внешней среды . Благодаря неспецифичным методам транскриптомики с её помощью можно находить новые генные сети даже в сложных системах. Например, сравнительный анализ нескольких линий нута на различных стадиях развития позволил идентифицировать транскрипционные профили, связанные со стрессами, вызванными засухой и повышенной солёностью; в частности, была показана роль изоформ транскриптов - . Изучение экспрессии генов при формировании биоплёнок патогенными дрожжами Candida albicans позволило выявить набор совместно регулируемых генов, критически важных для образования и поддержания биоплёнки .

Транскриптомное профилирование даёт ценнейшую информацию о механизмах лекарственной устойчивости . Анализ более тысячи малярийного плазмодия Plasmodium falciparum показал, что устойчивость к артемизинину изолятов из Юго-Восточной Азии связана с повышенной активностью и с более медленным прохождением внутри эритроцитарной стадии жизненного цикла .

Аннотация функций генов

Одно из применений транскриптомных технологий заключается в определении функций генов, а также аллелей, ответственных за конкретный фенотип. Транскриптомика экотипов растения Arabidopsis , которые металлы , показала связь с этим фенотипом генов, отвечающих за проникновение металлов в организм, толерантность и гомеостаз . Объединение данных РНК-Seq, полученных для разных тканей, позволило усовершенствовать аннотацию функций генов у коммерчески важных организмов, например, огурца , или видов, находящихся под угрозой исчезновения, таких как коала .

Сборка прочтений РНК-Seq не зависит от референсного генома , поэтому этот метод идеально подходит для изучения экспрессии генов у немодельных организмов, для которых ещё нет готовых геномных данных. Например, база данных однонуклеотидных полиморфизмов, которая использовалась в программах по размножению псевдотсуги Мензиса , была создана при транскриптомном анализе de novo при отсутствии секвенированного генома . Схожим образом гены, участвующие в развитии сердечной , мышечной и нервной тканей у омара , были идентифицированы путём сравнения транскриптомов разных тканей без использования последовательности генома. РНК-Seq также можно использовать для обнаружения ранее неизвестных белоккодирующих областей в уже секвенированных геномах .

Некодирующие РНК

Обычно транскриптомика рассматривает только мРНК клетки. Однако те же методы можно применить и к некодирующим РНК , которые участвуют в трансляции , репликации геномной ДНК , сплайсинге и регуляции транскрипции . Многие из этих некодирующих тРНК связаны с развитием болезней, в том числе рака , сердечно-сосудистых заболеваний и .

Базы данных транскриптомов

При изучении транскриптомов создаются огромные объёмы данных, которые потенциально могут быть использованы и в других проектах. Поэтому сырые или обработанные данные размещают в публичных базах данных, чтобы сделать их доступными для всего научного сообщества. Например, по состоянию на 2018 год, база данных Gene Expression Omnibus содержит данные миллионов экспериментов .

Базы данных транскриптомов
Название Владелец Данные Описание
Gene Expression Omnibus NCBI Микрочипы, РНК-Seq Первая база данных транскриптомов, полученных из разных источников. Первая ввела стандарты и MINSEQE, которые регламентируют необходимые метаданные для эксперимента, чтобы он был хорошо интерпретируем и воспроизводим .
ArrayExpress Микрочипы Импортирует наборы данных из Gene Expression Omnibus и подчиняется ей. Обработанные данные и метаданные экспериментов хранятся в ArrayExpress, а сырые прочтения — в ENA. Соответствует стандартам MIAME и MINSEQE .
EBI Микрочипы, РНК-Seq Содержит данные о тканеспецифичной экспрессии генов у животных и растений. Содержит данные вторичных анализов и их визуализацию, использует термины Gene Ontology , домены и метаболические пути. Содержит ссылки на данные по многочисленности белков, если они имеются.
Частное курирование Микрочипы, РНК-Seq Содержит справочные пояснения к публично доступным транскриптомным данным, в основном касающиеся медицины и биологии растений. Данные отдельных экспериментов нормализованы, что позволяет сравнивать экспрессию генов в различных экспериментах. Для полного доступа необходимо приобрести лицензию, бесплатно доступна лишь часть базы.
RefEx DDBJ Все Транскриптомы, полученные из 40 различных органов человека, мыши и крысы . Данные по экспрессии генов визуализированы в виде тепловой карты , наложенной на трёхмерную модель анатомической структуры.
NONCODE noncode.org РНК-Seq Некодирующие РНК (кроме тРНК и рРНК)

Примечания

  1. . dan.corlan.net . Дата обращения: 5 октября 2016. 12 августа 2020 года.
  2. Sutcliffe J. G. , Milner R. J. , Bloom F. E. , Lerner R. A. (англ.) // Proceedings Of The National Academy Of Sciences Of The United States Of America. — 1982. — August ( vol. 79 , no. 16 ). — P. 4942—4946 . — . [ ]
  3. Pan Qun, Shai O., Lee L. J., Frey B. J., Blencowe B. J. // Nature Genetics. — 2008. — Vol. 40, no. 12. — P. 1413—1415. — doi : . — . [ ]
  4. Sultan M. , Schulz M. H. , Richard H. , Magen A. , Klingenhoff A. , Scherf M. , Seifert M. , Borodina T. , Soldatov A. , Parkhomchuk D. , Schmidt D. , O'Keeffe S. , Haas S. , Vingron M. , Lehrach H. , Yaspo M. L. (англ.) // Science (New York, N.Y.). — 2008. — 15 August ( vol. 321 , no. 5891 ). — P. 956—960 . — doi : . — . [ ]
  5. Lappalainen T. , Sammeth M. , Friedländer M. R. , 't Hoen P. A. , Monlong J. , Rivas M. A. , Gonzàlez-Porta M. , Kurbatova N. , Griebel T. , Ferreira P. G. , Barann M. , Wieland T. , Greger L. , van Iterson M. , Almlöf J. , Ribeca P. , Pulyakhina I. , Esser D. , Giger T. , Tikhonov A. , Sultan M. , Bertier G. , MacArthur D. G. , Lek M. , Lizano E. , Buermans H. P. , Padioleau I. , Schwarzmayr T. , Karlberg O. , Ongen H. , Kilpinen H. , Beltran S. , Gut M. , Kahlem K. , Amstislavskiy V. , Stegle O. , Pirinen M. , Montgomery S. B. , Donnelly P. , McCarthy M. I. , Flicek P. , Strom T. M. , Lehrach H. , Schreiber S. , Sudbrak R. , Carracedo A. , Antonarakis S. E. , Häsler R. , Syvänen A. C. , van Ommen G. J. , Brazma A. , Meitinger T. , Rosenstiel P. , Guigó R. , Gut I. G. , Estivill X. , Dermitzakis E. T. (англ.) // Nature. — 2013. — 26 September ( vol. 501 , no. 7468 ). — P. 506—511 . — doi : . — . [ ]
  6. Melé M. , Ferreira P. G. , Reverter F. , DeLuca D. S. , Monlong J. , Sammeth M. , Young T. R. , Goldmann J. M. , Pervouchine D. D. , Sullivan T. J. , Johnson R. , Segrè A. V. , Djebali S. , Niarchou A. , GTEx Consortium. , Wright F. A. , Lappalainen T. , Calvo M. , Getz G. , Dermitzakis E. T. , Ardlie K. G. , Guigó R. (англ.) // Science (New York, N.Y.). — 2015. — 8 May ( vol. 348 , no. 6235 ). — P. 660—665 . — doi : . — . [ ]
  7. Kolodziejczyk A. A. , Kim J. K. , Svensson V. , Marioni J. C. , Teichmann S. A. (англ.) // Molecular Cell. — 2015. — 21 May ( vol. 58 , no. 4 ). — P. 610—620 . — doi : . — . [ ]
  8. McGettigan P. A. (англ.) // Current Opinion In Chemical Biology. — 2013. — February ( vol. 17 , no. 1 ). — P. 4—11 . — doi : . — . [ ]
  9. Wang Z. , Gerstein M. , Snyder M. (англ.) // Nature Reviews. Genetics. — 2009. — January ( vol. 10 , no. 1 ). — P. 57—63 . — doi : . — . [ ]
  10. Ozsolak F. , Milos P. M. (англ.) // Nature Reviews. Genetics. — 2011. — February ( vol. 12 , no. 2 ). — P. 87—98 . — doi : . — . [ ]
  11. Morozova O. , Hirst M. , Marra M. A. (англ.) // Annual Review Of Genomics And Human Genetics. — 2009. — Vol. 10 . — P. 135—151 . — doi : . — . [ ]
  12. Sim G. K. , Kafatos F. C. , Jones C. W. , Koehler M. D. , Efstratiadis A. , Maniatis T. (англ.) // Cell. — 1979. — December ( vol. 18 , no. 4 ). — P. 1303—1316 . — . [ ]
  13. Putney S. D. , Herlihy W. C. , Schimmel P. (англ.) // Nature. — 1983. — 21 April ( vol. 302 , no. 5910 ). — P. 718—721 . — . [ ]
  14. Marra M. A. , Hillier L. , Waterston R. H. (англ.) // Trends In Genetics : TIG. — 1998. — January ( vol. 14 , no. 1 ). — P. 4—7 . — doi : . — . [ ]
  15. Alwine J. C. , Kemp D. J. , Stark G. R. (англ.) // Proceedings Of The National Academy Of Sciences Of The United States Of America. — 1977. — December ( vol. 74 , no. 12 ). — P. 5350—5354 . — . [ ]
  16. Becker-André M. , Hahlbrock K. (англ.) // Nucleic Acids Research. — 1989. — 25 November ( vol. 17 , no. 22 ). — P. 9437—9446 . — . [ ]
  17. Piétu G. , Mariage-Samson R. , Fayein N. A. , Matingou C. , Eveno E. , Houlgatte R. , Decraene C. , Vandenbrouck Y. , Tahi F. , Devignes M. D. , Wirkner U. , Ansorge W. , Cox D. , Nagase T. , Nomura N. , Auffray C. (англ.) // Genome Research. — 1999. — February ( vol. 9 , no. 2 ). — P. 195—209 . — . [ ]
  18. Velculescu V. E. , Zhang L. , Zhou W. , Vogelstein J. , Basrai M. A. , Bassett Jr. D. E. , Hieter P. , Vogelstein B. , Kinzler K. W. (англ.) // Cell. — 1997. — 24 January ( vol. 88 , no. 2 ). — P. 243—251 . — . [ ]
  19. Velculescu V. E. , Zhang L. , Vogelstein B. , Kinzler K. W. (англ.) // Science (New York, N.Y.). — 1995. — 20 October ( vol. 270 , no. 5235 ). — P. 484—487 . — . [ ]
  20. Audic S. , Claverie J. M. (англ.) // Genome Research. — 1997. — October ( vol. 7 , no. 10 ). — P. 986—995 . — . [ ]
  21. Mantione K. J. , Kream R. M. , Kuzelova H. , Ptacek R. , Raboch J. , Samuel J. M. , Stefano G. B. (англ.) // Medical Science Monitor Basic Research. — 2014. — 23 August ( vol. 20 ). — P. 138—142 . — . [ ]
  22. Zhao S. , Fung-Leung W. P. , Bittner A. , Ngo K. , Liu X. (англ.) // PloS One. — 2014. — Vol. 9 , no. 1 . — P. e78644—78644 . — doi : . — . [ ]
  23. Hashimshony T. , Wagner F. , Sher N. , Yanai I. (англ.) // Cell Reports. — 2012. — 27 September ( vol. 2 , no. 3 ). — P. 666—673 . — doi : . — . [ ]
  24. Stears R. L. , Getts R. C. , Gullans S. R. (англ.) // Physiological Genomics. — 2000. — 9 August ( vol. 3 , no. 2 ). — P. 93—99 . — doi : . — . [ ]
  25. Illumina . European Pharmaceutical Review. Дата обращения: 19 августа 2018. 28 сентября 2020 года.
  26. Black M. B. , Parks B. B. , Pluta L. , Chu T. M. , Allen B. C. , Wolfinger R. D. , Thomas R. S. (англ.) // Toxicological Sciences : An Official Journal Of The Society Of Toxicology. — 2014. — February ( vol. 137 , no. 2 ). — P. 385—403 . — doi : . — . [ ]
  27. Marioni J. C. , Mason C. E. , Mane S. M. , Stephens M. , Gilad Y. (англ.) // Genome Research. — 2008. — September ( vol. 18 , no. 9 ). — P. 1509—1517 . — doi : . — . [ ]
  28. SEQC/MAQC-III Consortium. (англ.) // Nature Biotechnology. — 2014. — September ( vol. 32 , no. 9 ). — P. 903—914 . — doi : . — . [ ]
  29. Chen J. J. , Hsueh H. M. , Delongchamp R. R. , Lin C. J. , Tsai C. A. (англ.) // BMC Bioinformatics. — 2007. — 25 October ( vol. 8 ). — P. 412—412 . — doi : . — . [ ]
  30. Larkin J. E. , Frank B. C. , Gavras H. , Sultana R. , Quackenbush J. (англ.) // Nature Methods. — 2005. — May ( vol. 2 , no. 5 ). — P. 337—344 . — doi : . — . [ ]
  31. Nelson N. J. (англ.) // Journal Of The National Cancer Institute. — 2001. — 4 April ( vol. 93 , no. 7 ). — P. 492—494 . — . [ ]
  32. Schena M. , Shalon D. , Davis R. W. , Brown P. O. (англ.) // Science (New York, N.Y.). — 1995. — Vol. 270, no. 5235 . — P. 467—470. — . [ ]
  33. Pozhitkov A. E. , Tautz D. , Noble P. A. (англ.) // Briefings In Functional Genomics & Proteomics. — 2007. — June ( vol. 6 , no. 2 ). — P. 141—148 . — doi : . — . [ ]
  34. Heller M. J. (англ.) // Annual Review Of Biomedical Engineering. — 2002. — Vol. 4 . — P. 129—153 . — doi : . — . [ ]
  35. McLachlan, Geoffrey J.; (англ.) ; Ambroise, Christopher. Analyzing Microarray Gene Expression Data (англ.) . — Hoboken: John Wiley & Sons , 2005. — ISBN 978-0-471-72612-8 .
  36. Brenner S. , Johnson M. , Bridgham J. , Golda G. , Lloyd D. H. , Johnson D. , Luo S. , McCurdy S. , Foy M. , Ewan M. , Roth R. , George D. , Eletr S. , Albrecht G. , Vermaas E. , Williams S. R. , Moon K. , Burcham T. , Pallas M. , DuBridge R. B. , Kirchner J. , Fearon K. , Mao J. , Corcoran K. (англ.) // Nature Biotechnology. — 2000. — June ( vol. 18 , no. 6 ). — P. 630—634 . — doi : . — . [ ]
  37. Meyers B. C. , Vu T. H. , Tej S. S. , Ghazal H. , Matvienko M. , Agrawal V. , Ning J. , Haudenschild C. D. (англ.) // Nature Biotechnology. — 2004. — August ( vol. 22 , no. 8 ). — P. 1006—1011 . — doi : . — . [ ]
  38. Bainbridge M. N. , Warren R. L. , Hirst M. , Romanuik T. , Zeng T. , Go A. , Delaney A. , Griffith M. , Hickenbotham M. , Magrini V. , Mardis E. R. , Sadar M. D. , Siddiqui A. S. , Marra M. A. , Jones S. J. (англ.) // BMC Genomics. — 2006. — 29 September ( vol. 7 ). — P. 246—246 . — doi : . — . [ ]
  39. Mortazavi A. , Williams B. A. , McCue K. , Schaeffer L. , Wold B. (англ.) // Nature Methods. — 2008. — July ( vol. 5 , no. 7 ). — P. 621—628 . — doi : . — . [ ]
  40. Wilhelm B. T. , Marguerat S. , Watt S. , Schubert F. , Wood V. , Goodhead I. , Penkett C. J. , Rogers J. , Bähler J. (англ.) // Nature. — 2008. — 26 June ( vol. 453 , no. 7199 ). — P. 1239—1243 . — doi : . — . [ ]
  41. Chomczynski P. , Sacchi N. (англ.) // Analytical Biochemistry. — 1987. — April ( vol. 162 , no. 1 ). — P. 156—159 . — doi : . — . [ ]
  42. Chomczynski P. , Sacchi N. (англ.) // Nature Protocols. — 2006. — Vol. 1 , no. 2 . — P. 581—585 . — doi : . — . [ ]
  43. Grillo M. , Margolis F. L. (англ.) // BioTechniques. — 1990. — September ( vol. 9 , no. 3 ). — P. 262—264 . — . [ ]
  44. Bryant S. , Manning D. L. (англ.) // Methods In Molecular Biology (Clifton, N.J.). — 1998. — Vol. 86 . — P. 61—64 . — doi : . — . [ ]
  45. Zhao W. , He X. , Hoadley K. A. , Parker J. S. , Hayes D. N. , Perou C. M. (англ.) // BMC Genomics. — 2014. — 2 June ( vol. 15 ). — P. 419—419 . — doi : . — . [ ]
  46. Close T. J. , Wanamaker S. I. , Caldo R. A. , Turner S. M. , Ashlock D. A. , Dickerson J. A. , Wing R. A. , Muehlbauer G. J. , Kleinhofs A. , Wise R. P. (англ.) // Plant Physiology. — 2004. — March ( vol. 134 , no. 3 ). — P. 960—968 . — doi : . — . [ ]
  47. Lowe R. , Shirley N. , Bleackley M. , Dolan S. , Shafee T. (англ.) // PLoS Computational Biology. — 2017. — May ( vol. 13 , no. 5 ). — P. e1005457—1005457 . — doi : . — . [ ]
  48. Shiraki T. , Kondo S. , Katayama S. , Waki K. , Kasukawa T. , Kawaji H. , Kodzius R. , Watahiki A. , Nakamura M. , Arakawa T. , Fukuda S. , Sasaki D. , Podhajska A. , Harbers M. , Kawai J. , Carninci P. , Hayashizaki Y. (англ.) // Proceedings Of The National Academy Of Sciences Of The United States Of America. — 2003. — 23 December ( vol. 100 , no. 26 ). — P. 15776—15781 . — doi : . — . [ ]
  49. Romanov V. , Davidoff S. N. , Miles A. R. , Grainger D. W. , Gale B. K. , Brooks B. D. (англ.) // The Analyst. — 2014. — 21 March ( vol. 139 , no. 6 ). — P. 1303—1326 . — doi : . — . [ ]
  50. Barbulovic-Nad I. , Lucente M. , Sun Y. , Zhang M. , Wheeler A. R. , Bussmann M. (англ.) // Critical Reviews In Biotechnology. — 2006. — October ( vol. 26 , no. 4 ). — P. 237—259 . — doi : . — . [ ]
  51. Auburn R. P. , Kreil D. P. , Meadows L. A. , Fischer B. , Matilla S. S. , Russell S. (англ.) // Trends In Biotechnology. — 2005. — July ( vol. 23 , no. 7 ). — P. 374—379 . — doi : . — . [ ]
  52. Shalon D. , Smith S. J. , Brown P. O. (англ.) // Genome Research. — 1996. — July ( vol. 6 , no. 7 ). — P. 639—645 . — . [ ]
  53. Lockhart D. J. , Dong H. , Byrne M. C. , Follettie M. T. , Gallo M. V. , Chee M. S. , Mittmann M. , Wang C. , Kobayashi M. , Horton H. , Brown E. L. (англ.) // Nature Biotechnology. — 1996. — December ( vol. 14 , no. 13 ). — P. 1675—1680 . — doi : . — . [ ]
  54. Irizarry R. A. , Bolstad B. M. , Collin F. , Cope L. M. , Hobbs B. , Speed T. P. (англ.) // Nucleic Acids Research. — 2003. — 15 February ( vol. 31 , no. 4 ). — P. e15—15 . — . [ ]
  55. Selzer R. R. , Richmond T. A. , Pofahl N. J. , Green R. D. , Eis P. S. , Nair P. , Brothman A. R. , Stallings R. L. (англ.) // Genes, Chromosomes & Cancer. — 2005. — November ( vol. 44 , no. 3 ). — P. 305—319 . — doi : . — . [ ]
  56. Svensson V. , Vento-Tormo R. , Teichmann S. A. (англ.) // Nature Protocols. — 2018. — April ( vol. 13 , no. 4 ). — P. 599—604 . — doi : . — . [ ]
  57. Tachibana Chris. (англ.) // Science. — 2015. — 31 July. — ISSN . — doi : . [ ]
  58. Nagalakshmi U. , Wang Z. , Waern K. , Shou C. , Raha D. , Gerstein M. , Snyder M. (англ.) // Science (New York, N.Y.). — 2008. — 6 June ( vol. 320 , no. 5881 ). — P. 1344—1349 . — doi : . — . [ ]
  59. Su Z. , Fang H. , Hong H. , Shi L. , Zhang W. , Zhang W. , Zhang Y. , Dong Z. , Lancashire L. J. , Bessarabova M. , Yang X. , Ning B. , Gong B. , Meehan J. , Xu J. , Ge W. , Perkins R. , Fischer M. , Tong W. (англ.) // Genome Biology. — 2014. — 3 December ( vol. 15 , no. 12 ). — P. 523—523 . — doi : . — . [ ]
  60. Lee J. H. , Daugharthy E. R. , Scheiman J. , Kalhor R. , Yang J. L. , Ferrante T. C. , Terry R. , Jeanty S. S. , Li C. , Amamoto R. , Peters D. T. , Turczyk B. M. , Marblestone A. H. , Inverso S. A. , Bernard A. , Mali P. , Rios X. , Aach J. , Church G. M. (англ.) // Science (New York, N.Y.). — 2014. — 21 March ( vol. 343 , no. 6177 ). — P. 1360—1363 . — doi : . — . [ ]
  61. Shendure J. , Ji H. (англ.) // Nature Biotechnology. — 2008. — October ( vol. 26 , no. 10 ). — P. 1135—1145 . — doi : . — . [ ]
  62. Lahens N. F. , Kavakli I. H. , Zhang R. , Hayer K. , Black M. B. , Dueck H. , Pizarro A. , Kim J. , Irizarry R. , Thomas R. S. , Grant G. R. , Hogenesch J. B. (англ.) // Genome Biology. — 2014. — 30 June ( vol. 15 , no. 6 ). — P. 86—86 . — doi : . — . [ ]
  63. Knierim E. , Lucke B. , Schwarz J. M. , Schuelke M. , Seelow D. (англ.) // PloS One. — 2011. — Vol. 6 , no. 11 . — P. e28240—28240 . — doi : . — . [ ]
  64. Routh A. , Head S. R. , Ordoukhanian P. , Johnson J. E. (англ.) // Journal Of Molecular Biology. — 2015. — 14 August ( vol. 427 , no. 16 ). — P. 2610—2616 . — doi : . — . [ ]
  65. Parekh S. , Ziegenhain C. , Vieth B. , Enard W. , Hellmann I. (англ.) // Scientific Reports. — 2016. — 9 May ( vol. 6 ). — P. 25533—25533 . — doi : . — . [ ]
  66. Shanker S. , Paulson A. , Edenberg H. J. , Peak A. , Perera A. , Alekseyev Y. O. , Beckloff N. , Bivens N. J. , Donnelly R. , Gillaspy A. F. , Grove D. , Gu W. , Jafari N. , Kerley-Hamilton J. S. , Lyons R. H. , Tepper C. , Nicolet C. M. (англ.) // Journal Of Biomolecular Techniques : JBT. — 2015. — April ( vol. 26 , no. 1 ). — P. 4—18 . — doi : . — . [ ]
  67. Jiang L. , Schlesinger F. , Davis C. A. , Zhang Y. , Li R. , Salit M. , Gingeras T. R. , Oliver B. (англ.) // Genome Research. — 2011. — September ( vol. 21 , no. 9 ). — P. 1543—1551 . — doi : . — . [ ]
  68. Kivioja T. , Vähärautio A. , Karlsson K. , Bonke M. , Enge M. , Linnarsson S. , Taipale J. (англ.) // Nature Methods. — 2011. — 20 November ( vol. 9 , no. 1 ). — P. 72—74 . — doi : . — . [ ]
  69. Tang F. , Barbacioru C. , Wang Y. , Nordman E. , Lee C. , Xu N. , Wang X. , Bodeau J. , Tuch B. B. , Siddiqui A. , Lao K. , Surani M. A. (англ.) // Nature Methods. — 2009. — May ( vol. 6 , no. 5 ). — P. 377—382 . — doi : . — . [ ]
  70. Islam S. , Zeisel A. , Joost S. , La Manno G. , Zajac P. , Kasper M. , Lönnerberg P. , Linnarsson S. (англ.) // Nature Methods. — 2014. — February ( vol. 11 , no. 2 ). — P. 163—166 . — doi : . — . [ ]
  71. Jaitin D. A. , Kenigsberg E. , Keren-Shaul H. , Elefant N. , Paul F. , Zaretsky I. , Mildner A. , Cohen N. , Jung S. , Tanay A. , Amit I. (англ.) // Science (New York, N.Y.). — 2014. — 14 February ( vol. 343 , no. 6172 ). — P. 776—779 . — doi : . — . [ ]
  72. Levin J. Z. , Yassour M. , Adiconis X. , Nusbaum C. , Thompson D. A. , Friedman N. , Gnirke A. , Regev A. (англ.) // Nature Methods. — 2010. — September ( vol. 7 , no. 9 ). — P. 709—715 . — doi : . — . [ ]
  73. Quail M. A. , Smith M. , Coupland P. , Otto T. D. , Harris S. R. , Connor T. R. , Bertoni A. , Swerdlow H. P. , Gu Y. (англ.) // BMC genomics. — 2012. — Vol. 13. — P. 341. — doi : . — . [ ]
  74. Liu L. , Li Y. , Li S. , Hu N. , He Y. , Pong R. , Lin D. , Lu L. , Law M. (англ.) // Journal Of Biomedicine & Biotechnology. — 2012. — Vol. 2012 . — P. 251364—251364 . — doi : . — . [ ]
  75. . Дата обращения: 6 октября 2016. 14 декабря 2020 года.
  76. Loman N. J. , Misra R. V. , Dallman T. J. , Constantinidou C. , Gharbia S. E. , Wain J. , Pallen M. J. (англ.) // Nature Biotechnology. — 2012. — May ( vol. 30 , no. 5 ). — P. 434—439 . — doi : . — . [ ]
  77. Goodwin S. , McPherson J. D. , McCombie W. R. (англ.) // Nature Reviews. Genetics. — 2016. — 17 May ( vol. 17 , no. 6 ). — P. 333—351 . — doi : . — . [ ]
  78. Garalde D. R. , Snell E. A. , Jachimowicz D. , Sipos B. , Lloyd J. H. , Bruce M. , Pantic N. , Admassu T. , James P. , Warland A. , Jordan M. , Ciccone J. , Serra S. , Keenan J. , Martin S. , McNeill L. , Wallace E. J. , Jayasinghe L. , Wright C. , Blasco J. , Young S. , Brocklebank D. , Juul S. , Clarke J. , Heron A. J. , Turner D. J. (англ.) // Nature Methods. — 2018. — March ( vol. 15 , no. 3 ). — P. 201—206 . — doi : . — . [ ]
  79. Loman N. J. , Quick J. , Simpson J. T. (англ.) // Nature Methods. — 2015. — August ( vol. 12 , no. 8 ). — P. 733—735 . — doi : . — . [ ]
  80. Ozsolak F. , Platt A. R. , Jones D. R. , Reifenberger J. G. , Sass L. E. , McInerney P. , Thompson J. F. , Bowers J. , Jarosz M. , Milos P. M. (англ.) // Nature. — 2009. — 8 October ( vol. 461 , no. 7265 ). — P. 814—818 . — doi : . — . [ ]
  81. Hart S. N. , Therneau T. M. , Zhang Y. , Poland G. A. , Kocher J. P. (англ.) // Journal Of Computational Biology : A Journal Of Computational Molecular Cell Biology. — 2013. — December ( vol. 20 , no. 12 ). — P. 970—978 . — doi : . — . [ ]
  82. Conesa A. , Madrigal P. , Tarazona S. , Gomez-Cabrero D. , Cervera A. , McPherson A. , Szcześniak M. W. , Gaffney D. J. , Elo L. L. , Zhang X. , Mortazavi A. (англ.) // Genome Biology. — 2016. — 26 January ( vol. 17 ). — P. 13—13 . — doi : . — . [ ]
  83. Rapaport F. , Khanin R. , Liang Y. , Pirun M. , Krek A. , Zumbo P. , Mason C. E. , Socci N. D. , Betel D. (англ.) // Genome Biology. — 2013. — Vol. 14 , no. 9 . — P. 95—95 . — doi : . — . [ ]
  84. (англ.) // Nature. — 2012. — Vol. 489, no. 7414 . — P. 57—74. — doi : . — . [ ]
  85. Sloan C. A. , Chan E. T. , Davidson J. M. , Malladi V. S. , Strattan J. S. , Hitz B. C. , Gabdank I. , Narayanan A. K. , Ho M. , Lee B. T. , Rowe L. D. , Dreszer T. R. , Roe G. , Podduturi N. R. , Tanaka F. , Hong E. L. , Cherry J. M. (англ.) // Nucleic Acids Research. — 2016. — 4 January ( vol. 44 , no. D1 ). — P. D726—732 . — doi : . — . [ ]
  86. . encodeproject.org . Дата обращения: 21 августа 2018. 20 ноября 2020 года.
  87. Ritchie M. E. , Phipson B. , Wu D. , Hu Y. , Law C. W. , Shi W. , Smyth G. K. (англ.) // Nucleic Acids Research. — 2015. — 20 April ( vol. 43 , no. 7 ). — P. e47—47 . — doi : . — . [ ]
  88. Robinson M. D. , McCarthy D. J. , Smyth G. K. (англ.) // Bioinformatics. — 2010. — 1 January ( vol. 26 , no. 1 ). — P. 139—140 . — doi : . — . [ ]
  89. Huber W. , Carey V. J. , Gentleman R. , Anders S. , Carlson M. , Carvalho B. S. , Bravo H. C. , Davis S. , Gatto L. , Girke T. , Gottardo R. , Hahne F. , Hansen K. D. , Irizarry R. A. , Lawrence M. , Love M. I. , MacDonald J. , Obenchain V. , Oleś A. K. , Pagès H. , Reyes A. , Shannon P. , Smyth G. K. , Tenenbaum D. , Waldron L. , Morgan M. (англ.) // Nature Methods. — 2015. — February ( vol. 12 , no. 2 ). — P. 115—121 . — doi : . — . [ ]
  90. Smyth, G. K. (англ.) . — Springer, New York, NY, 2005. — P. 397—420. — (Statistics for Biology and Health). — ISBN 9780387251462 . — doi : . 22 августа 2018 года.
  91. Steve., Russell. (неопр.) . — Burlington: Elsevier , 2008. — ISBN 9780080919768 .
  92. Haas B. J. , Papanicolaou A. , Yassour M. , Grabherr M. , Blood P. D. , Bowden J. , Couger M. B. , Eccles D. , Li B. , Lieber M. , MacManes M. D. , Ott M. , Orvis J. , Pochet N. , Strozzi F. , Weeks N. , Westerman R. , William T. , Dewey C. N. , Henschel R. , LeDuc R. D. , Friedman N. , Regev A. (англ.) // Nature Protocols. — 2013. — August ( vol. 8 , no. 8 ). — P. 1494—1512 . — doi : . — . [ ]
  93. Pertea M. , Pertea G. M. , Antonescu C. M. , Chang T. C. , Mendell J. T. , Salzberg S. L. (англ.) // Nature Biotechnology. — 2015. — March ( vol. 33 , no. 3 ). — P. 290—295 . — doi : . — . [ ]
  94. Kodama Y. , Shumway M. , Leinonen R. , International Nucleotide Sequence Database Collaboration. (англ.) // Nucleic Acids Research. — 2012. — January ( vol. 40 ). — P. D54—56 . — doi : . — . [ ]
  95. Edgar R. , Domrachev M. , Lash A. E. (англ.) // Nucleic Acids Research. — 2002. — 1 January ( vol. 30 , no. 1 ). — P. 207—210 . — . [ ]
  96. Petrov Anton , Shams Soheil. (англ.) // The Journal of VLSI Signal Processing-Systems for Signal, Image, and Video Technology. — 2004. — November ( vol. 38 , no. 3 ). — P. 211—226 . — ISSN . — doi : . [ ]
  97. Kwon, Young Min; Ricke, Steven. High-Throughput Next Generation Sequencing (англ.) . — SpringerLink . — doi : .
  98. Nakamura K. , Oshima T. , Morimoto T. , Ikeda S. , Yoshikawa H. , Shiwa Y. , Ishikawa S. , Linak M. C. , Hirai A. , Takahashi H. , Altaf-Ul-Amin M. , Ogasawara N. , Kanaya S. (англ.) // Nucleic Acids Research. — 2011. — July ( vol. 39 , no. 13 ). — P. e90—90 . — doi : . — . [ ]
  99. Van Verk M. C. , Hickman R. , Pieterse C. M. , Van Wees S. C. (англ.) // Trends In Plant Science. — 2013. — April ( vol. 18 , no. 4 ). — P. 175—179 . — doi : . — . [ ]
  100. . Babraham Bioinformatics. Дата обращения: 23 мая 2017. 24 ноября 2020 года.
  101. Lo C. C. , Chain P. S. (англ.) // BMC Bioinformatics. — 2014. — 19 November ( vol. 15 ). — P. 366—366 . — doi : . — . [ ]
  102. Trapnell C. , Hendrickson D. G. , Sauvageau M. , Goff L. , Rinn J. L. , Pachter L. (англ.) // Nature Biotechnology. — 2013. — January ( vol. 31 , no. 1 ). — P. 46—53 . — doi : . — . [ ]
  103. Xie Y. , Wu G. , Tang J. , Luo R. , Patterson J. , Liu S. , Huang W. , He G. , Gu S. , Li S. , Zhou X. , Lam T. W. , Li Y. , Xu X. , Wong G. K. , Wang J. (англ.) // Bioinformatics. — 2014. — 15 June ( vol. 30 , no. 12 ). — P. 1660—1666 . — doi : . — . [ ]
  104. Fonseca N. A. , Rung J. , Brazma A. , Marioni J. C. (англ.) // Bioinformatics. — 2012. — 15 December ( vol. 28 , no. 24 ). — P. 3169—3177 . — doi : . — . [ ]
  105. Trapnell C. , Pachter L. , Salzberg S. L. (англ.) // Bioinformatics. — 2009. — Vol. 25, no. 9 . — P. 1105—1111. — doi : . — . [ ]
  106. Trapnell C. , Williams B. A. , Pertea G. , Mortazavi A. , Kwan G. , van Baren M. J. , Salzberg S. L. , Wold B. J. , Pachter L. (англ.) // Nature Biotechnology. — 2010. — May ( vol. 28 , no. 5 ). — P. 511—515 . — doi : . — . [ ]
  107. Miller J. R. , Koren S. , Sutton G. (англ.) // Genomics. — 2010. — June ( vol. 95 , no. 6 ). — P. 315—327 . — doi : . — . [ ]
  108. O'Neil S. T. , Emrich S. J. (англ.) // BMC Genomics. — 2013. — 9 July ( vol. 14 ). — P. 465—465 . — doi : . — . [ ]
  109. Smith-Unna R. , Boursnell C. , Patro R. , Hibberd J. M. , Kelly S. (англ.) // Genome Research. — 2016. — August ( vol. 26 , no. 8 ). — P. 1134—1144 . — doi : . — . [ ]
  110. Li B. , Fillmore N. , Bai Y. , Collins M. , Thomson J. A. , Stewart R. , Dewey C. N. (англ.) // Genome Biology. — 2014. — 21 December ( vol. 15 , no. 12 ). — P. 553—553 . — doi : . — . [ ]
  111. Zerbino D. R. , Birney E. (англ.) // Genome Research. — 2008. — May ( vol. 18 , no. 5 ). — P. 821—829 . — doi : . — . [ ]
  112. Schulz M. H. , Zerbino D. R. , Vingron M. , Birney E. (англ.) // Bioinformatics. — 2012. — 15 April ( vol. 28 , no. 8 ). — P. 1086—1092 . — doi : . — . [ ]
  113. Robertson G. , Schein J. , Chiu R. , Corbett R. , Field M. , Jackman S. D. , Mungall K. , Lee S. , Okada H. M. , Qian J. Q. , Griffith M. , Raymond A. , Thiessen N. , Cezard T. , Butterfield Y. S. , Newsome R. , Chan S. K. , She R. , Varhol R. , Kamoh B. , Prabhu A. L. , Tam A. , Zhao Y. , Moore R. A. , Hirst M. , Marra M. A. , Jones S. J. , Hoodless P. A. , Birol I. (англ.) // Nature Methods. — 2010. — November ( vol. 7 , no. 11 ). — P. 909—912 . — doi : . — . [ ]
  114. Grabherr M. G. , Haas B. J. , Yassour M. , Levin J. Z. , Thompson D. A. , Amit I. , Adiconis X. , Fan L. , Raychowdhury R. , Zeng Q. , Chen Z. , Mauceli E. , Hacohen N. , Gnirke A. , Rhind N. , di Palma F. , Birren B. W. , Nusbaum C. , Lindblad-Toh K. , Friedman N. , Regev A. (англ.) // Nature Biotechnology. — 2011. — 15 May ( vol. 29 , no. 7 ). — P. 644—652 . — doi : . — . [ ]
  115. Chevreux B. , Pfisterer T. , Drescher B. , Driesel A. J. , Müller W. E. , Wetter T. , Suhai S. (англ.) // Genome Research. — 2004. — June ( vol. 14 , no. 6 ). — P. 1147—1159 . — doi : . — . [ ]
  116. Margulies M. , Egholm M. , Altman W. E. , Attiya S. , Bader J. S. , Bemben L. A. , Berka J. , Braverman M. S. , Chen Y. J. , Chen Z. , Dewell S. B. , Du L. , Fierro J. M. , Gomes X. V. , Godwin B. C. , He W. , Helgesen S. , Ho C. H. , Irzyk G. P. , Jando S. C. , Alenquer M. L. , Jarvie T. P. , Jirage K. B. , Kim J. B. , Knight J. R. , Lanza J. R. , Leamon J. H. , Lefkowitz S. M. , Lei M. , Li J. , Lohman K. L. , Lu H. , Makhijani V. B. , McDade K. E. , McKenna M. P. , Myers E. W. , Nickerson E. , Nobile J. R. , Plant R. , Puc B. P. , Ronan M. T. , Roth G. T. , Sarkis G. J. , Simons J. F. , Simpson J. W. , Srinivasan M. , Tartaro K. R. , Tomasz A. , Vogt K. A. , Volkmer G. A. , Wang S. H. , Wang Y. , Weiner M. P. , Yu P. , Begley R. F. , Rothberg J. M. (англ.) // Nature. — 2005. — 15 September ( vol. 437 , no. 7057 ). — P. 376—380 . — doi : . — . [ ]
  117. Kumar S. , Blaxter M. L. (англ.) // BMC Genomics. — 2010. — 16 October ( vol. 11 ). — P. 571—571 . — doi : . — . [ ]
  118. Bankevich A. , Nurk S. , Antipov D. , Gurevich A. A. , Dvorkin M. , Kulikov A. S. , Lesin V. M. , Nikolenko S. I. , Pham S. , Prjibelski A. D. , Pyshkin A. V. , Sirotkin A. V. , Vyahhi N. , Tesler G. , Alekseyev M. A. , Pevzner P. A. (англ.) // Journal Of Computational Biology : A Journal Of Computational Molecular Cell Biology. — 2012. — May ( vol. 19 , no. 5 ). — P. 455—477 . — doi : . — . [ ]
  119. Li B. , Dewey C. N. (англ.) // BMC Bioinformatics. — 2011. — 4 August ( vol. 12 ). — P. 323—323 . — doi : . — . [ ]
  120. Gehlenborg N. , O'Donoghue S. I. , Baliga N. S. , Goesmann A. , Hibbs M. A. , Kitano H. , Kohlbacher O. , Neuweger H. , Schneider R. , Tenenbaum D. , Gavin A. C. (англ.) // Nature Methods. — 2010. — March ( vol. 7 , no. 3 Suppl ). — P. 56—68 . — doi : . — . [ ]
  121. Anders S. , Pyl P. T. , Huber W. (англ.) // Bioinformatics. — 2015. — 15 January ( vol. 31 , no. 2 ). — P. 166—169 . — doi : . — . [ ]
  122. Bray N. L. , Pimentel H. , Melsted P. , Pachter L. (англ.) // Nature Biotechnology. — 2016. — May ( vol. 34 , no. 5 ). — P. 525—527 . — doi : . — . [ ]
  123. Li H. , Handsaker B. , Wysoker A. , Fennell T. , Ruan J. , Homer N. , Marth G. , Abecasis G. , Durbin R. , 1000 Genome Project Data Processing Subgroup. (англ.) // Bioinformatics. — 2009. — 15 August ( vol. 25 , no. 16 ). — P. 2078—2079 . — doi : . — . [ ]
  124. Love M. I. , Huber W. , Anders S. (англ.) // Genome Biology. — 2014. — Vol. 15 , no. 12 . — P. 550—550 . — doi : . — . [ ]
  125. Frazee A. C. , Pertea G. , Jaffe A. E. , Langmead B. , Salzberg S. L. , Leek J. T. (англ.) // Nature Biotechnology. — 2015. — March ( vol. 33 , no. 3 ). — P. 243—246 . — doi : . — . [ ]
  126. Fang Z. , Cui X. (англ.) // Briefings In Bioinformatics. — 2011. — May ( vol. 12 , no. 3 ). — P. 280—287 . — doi : . — . [ ]
  127. Ramsköld D. , Wang E. T. , Burge C. B. , Sandberg R. (англ.) // PLoS Computational Biology. — 2009. — December ( vol. 5 , no. 12 ). — P. e1000598—1000598 . — doi : . — . [ ]
  128. Vandesompele J. , De Preter K. , Pattyn F. , Poppe B. , Van Roy N. , De Paepe A. , Speleman F. (англ.) // Genome Biology. — 2002. — 18 June ( vol. 3 , no. 7 ). — P. 0034—0034 . — . [ ]
  129. Core L. J. , Waterfall J. J. , Lis J. T. (англ.) // Science (New York, N.Y.). — 2008. — 19 December ( vol. 322 , no. 5909 ). — P. 1845—1848 . — doi : . — . [ ]
  130. Camarena L. , Bruno V. , Euskirchen G. , Poggio S. , Snyder M. (англ.) // PLoS Pathogens. — 2010. — 1 April ( vol. 6 , no. 4 ). — P. e1000834—1000834 . — doi : . — . [ ]
  131. Govind G. , Harshavardhan V. T. , Patricia J. K. , Dhanalakshmi R. , Senthil Kumar M. , Sreenivasulu N. , Udayakumar M. (англ.) // Molecular Genetics And Genomics : MGG. — 2009. — June ( vol. 281 , no. 6 ). — P. 591—605 . — doi : . — . [ ]
  132. Costa V. , Aprile M. , Esposito R. , Ciccodicola A. (англ.) // European Journal Of Human Genetics : EJHG. — 2013. — February ( vol. 21 , no. 2 ). — P. 134—142 . — doi : . — . [ ]
  133. Khurana E. , Fu Y. , Chakravarty D. , Demichelis F. , Rubin M. A. , Gerstein M. (англ.) // Nature Reviews. Genetics. — 2016. — February ( vol. 17 , no. 2 ). — P. 93—108 . — doi : . — . [ ]
  134. Slotkin R. K. , Martienssen R. (англ.) // Nature Reviews. Genetics. — 2007. — April ( vol. 8 , no. 4 ). — P. 272—285 . — doi : . — . [ ]
  135. Proserpio V. , Mahata B. (англ.) // Immunology. — 2016. — February ( vol. 147 , no. 2 ). — P. 133—140 . — doi : . — . [ ]
  136. Byron S. A. , Van Keuren-Jensen K. R. , Engelthaler D. M. , Carpten J. D. , Craig D. W. (англ.) // Nature Reviews. Genetics. — 2016. — May ( vol. 17 , no. 5 ). — P. 257—271 . — doi : . — . [ ]
  137. Wu H. J. , Wang A. H. , Jennings M. P. (англ.) // Current Opinion In Chemical Biology. — 2008. — February ( vol. 12 , no. 1 ). — P. 93—101 . — doi : . — . [ ]
  138. Suzuki S. , Horinouchi T. , Furusawa C. (англ.) // Nature Communications. — 2014. — 17 December ( vol. 5 ). — P. 5792—5792 . — doi : . — . [ ]
  139. Westermann A. J. , Gorski S. A. , Vogel J. (англ.) // Nature Reviews. Microbiology. — 2012. — September ( vol. 10 , no. 9 ). — P. 618—630 . — doi : . — . [ ]
  140. Durmuş S. , Çakır T. , Özgür A. , Guthke R. (англ.) // Frontiers In Microbiology. — 2015. — Vol. 6 . — P. 235—235 . — doi : . — . [ ]
  141. Garg R. , Shankar R. , Thakkar B. , Kudapa H. , Krishnamurthy L. , Mantri N. , Varshney R. K. , Bhatia S. , Jain M. (англ.) // Scientific Reports. — 2016. — 13 January ( vol. 6 ). — P. 19228—19228 . — doi : . — . [ ]
  142. García-Sánchez S. , Aubert S. , Iraqui I. , Janbon G. , Ghigo J. M. , d'Enfert C. (англ.) // Eukaryotic Cell. — 2004. — April ( vol. 3 , no. 2 ). — P. 536—545 . — . [ ]
  143. Rich S. M. , Leendertz F. H. , Xu G. , LeBreton M. , Djoko C. F. , Aminake M. N. , Takang E. E. , Diffo J. L. , Pike B. L. , Rosenthal B. M. , Formenty P. , Boesch C. , Ayala F. J. , Wolfe N. D. (англ.) // Proceedings Of The National Academy Of Sciences Of The United States Of America. — 2009. — 1 September ( vol. 106 , no. 35 ). — P. 14902—14907 . — doi : . — . [ ]
  144. Mok S. , Ashley E. A. , Ferreira P. E. , Zhu L. , Lin Z. , Yeo T. , Chotivanich K. , Imwong M. , Pukrittayakamee S. , Dhorda M. , Nguon C. , Lim P. , Amaratunga C. , Suon S. , Hien T. T. , Htut Y. , Faiz M. A. , Onyamboko M. A. , Mayxay M. , Newton P. N. , Tripura R. , Woodrow C. J. , Miotto O. , Kwiatkowski D. P. , Nosten F. , Day N. P. , Preiser P. R. , White N. J. , Dondorp A. M. , Fairhurst R. M. , Bozdech Z. (англ.) // Science (New York, N.Y.). — 2015. — 23 January ( vol. 347 , no. 6220 ). — P. 431—435 . — doi : . — . [ ]
  145. Verbruggen N. , Hermans C. , Schat H. (англ.) // The New Phytologist. — 2009. — March ( vol. 181 , no. 4 ). — P. 759—776 . — doi : . — . [ ]
  146. Li Z. , Zhang Z. , Yan P. , Huang S. , Fei Z. , Lin K. (англ.) // BMC Genomics. — 2011. — 2 November ( vol. 12 ). — P. 540—540 . — doi : . — . [ ]
  147. Hobbs M. , Pavasovic A. , King A. G. , Prentis P. J. , Eldridge M. D. , Chen Z. , Colgan D. J. , Polkinghorne A. , Wilkins M. R. , Flanagan C. , Gillett A. , Hanger J. , Johnson R. N. , Timms P. (англ.) // BMC Genomics. — 2014. — 11 September ( vol. 15 ). — P. 786—786 . — doi : . — . [ ]
  148. Howe G. T. , Yu J. , Knaus B. , Cronn R. , Kolpak S. , Dolan P. , Lorenz W. W. , Dean J. F. (англ.) // BMC Genomics. — 2013. — 28 February ( vol. 14 ). — P. 137—137 . — doi : . — . [ ]
  149. McGrath L. L. , Vollmer S. V. , Kaluziak S. T. , Ayers J. (англ.) // BMC Genomics. — 2016. — 16 January ( vol. 17 ). — P. 63—63 . — doi : . — . [ ]
  150. Noller H. F. (англ.) // Annual Review Of Biochemistry. — 1991. — Vol. 60 . — P. 191—227 . — doi : . — . [ ]
  151. Christov C. P. , Gardiner T. J. , Szüts D. , Krude T. (англ.) // Molecular and cellular biology. — 2006. — Vol. 26, no. 18 . — P. 6993—7004. — doi : . — . [ ]
  152. Kishore S. , Stamm S. (англ.) // Science (New York, N.Y.). — 2006. — 13 January ( vol. 311 , no. 5758 ). — P. 230—232 . — doi : . — . [ ]
  153. Hüttenhofer A. , Schattner P. , Polacek N. (англ.) // Trends In Genetics : TIG. — 2005. — May ( vol. 21 , no. 5 ). — P. 289—297 . — doi : . — . [ ]
  154. Esteller M. (англ.) // Nature Reviews. Genetics. — 2011. — 18 November ( vol. 12 , no. 12 ). — P. 861—874 . — doi : . — . [ ]
  155. . www.ncbi.nlm.nih.gov . Дата обращения: 26 марта 2018. 29 ноября 2020 года.
  156. Brazma A. , Hingamp P. , Quackenbush J. , Sherlock G. , Spellman P. , Stoeckert C. , Aach J. , Ansorge W. , Ball C. A. , Causton H. C. , Gaasterland T. , Glenisson P. , Holstege F. C. , Kim I. F. , Markowitz V. , Matese J. C. , Parkinson H. , Robinson A. , Sarkans U. , Schulze-Kremer S. , Stewart J. , Taylor R. , Vilo J. , Vingron M. (англ.) // Nature Genetics. — 2001. — December ( vol. 29 , no. 4 ). — P. 365—371 . — doi : . — . [ ]
  157. Brazma A. (англ.) // TheScientificWorldJournal. — 2009. — 29 May ( vol. 9 ). — P. 420—423 . — doi : . — . [ ]
  158. Kolesnikov N. , Hastings E. , Keays M. , Melnichuk O. , Tang Y. A. , Williams E. , Dylag M. , Kurbatova N. , Brandizi M. , Burdett T. , Megy K. , Pilicheva E. , Rustici G. , Tikhonov A. , Parkinson H. , Petryszak R. , Sarkans U. , Brazma A. (англ.) // Nucleic Acids Research. — 2015. — January ( vol. 43 ). — P. D1113—1116 . — doi : . — . [ ]
  159. Petryszak R. , Keays M. , Tang Y. A. , Fonseca N. A. , Barrera E. , Burdett T. , Füllgrabe A. , Fuentes A. M. , Jupp S. , Koskinen S. , Mannion O. , Huerta L. , Megy K. , Snow C. , Williams E. , Barzine M. , Hastings E. , Weisser H. , Wright J. , Jaiswal P. , Huber W. , Choudhary J. , Parkinson H. E. , Brazma A. (англ.) // Nucleic Acids Research. — 2016. — 4 January ( vol. 44 , no. D1 ). — P. D746—752 . — doi : . — . [ ]
  160. Hruz T. , Laule O. , Szabo G. , Wessendorp F. , Bleuler S. , Oertle L. , Widmayer P. , Gruissem W. , Zimmermann P. (англ.) // Advances In Bioinformatics. — 2008. — Vol. 2008 . — P. 420747—420747 . — doi : . — . [ ]
  161. Mitsuhashi N. , Fujieda K. , Tamura T. , Kawamoto S. , Takagi T. , Okubo K. (англ.) // Nucleic Acids Research. — 2009. — January ( vol. 37 ). — P. D782—785 . — doi : . — . [ ]
  162. Zhao Y. , Li H. , Fang S. , Kang Y. , Wu W. , Hao Y. , Li Z. , Bu D. , Sun N. , Zhang M. Q. , Chen R. (англ.) // Nucleic Acids Research. — 2016. — 4 January ( vol. 44 , no. D1 ). — P. D203—208 . — doi : . — . [ ]
Источник —

Same as Транскриптомные технологии