Искусственный геном
- 1 year ago
- 0
- 0
Геном человека — совокупность наследственного материала, заключённого в клетке человека . Согласно этому определению человеческий геном состоит из 23 пар хромосом , находящихся в ядре , а также множества копий митохондриальной ДНК . Существует и другое определение генома, в котором под геномом подразумевают совокупность генетического материала гаплоидного набора хромосом . Когда говорят о размере генома человека, то имеют в виду данный вариант определения генома. Так, двадцать две аутосомы , две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе 3 099 734 149 пар оснований .
В ходе выполнения проекта « Геном человека » была определена последовательность ДНК всех хромосом и митохондриальной ДНК (к 2003 году было секвенировано 85 % генома человека. Полное секвенирование генома человека, не учитывая некоторые фрагменты Y-хромосомы , было завершено лишь в 2022 году, исследование выявило, что человеческий геном содержит 19 969 активных генов , это составляет лишь очень небольшую часть генома, только 1,5 % всего генетического материала кодирует белки или функциональные РНК . Всего же насчитывается 63 494 генов, большинство из которых являются генами некодирующей РНК, которую часто называют мусорной ДНК , но которая, как оказалось, играет важную роль в регуляции активности генов . В настоящее время эти данные активно используются по всему миру в биомедицинских исследованиях. В 2023 году была полностью секвенирована Y-хромосома , последняя хромосома, расшифровка структуры которой вызывало наибольшие сложности, в ходе исследования был обнаружен 41 ранее неизвестный ген .
В геноме присутствует 23 пары хромосом : 22 пары аутосомных хромосом, а также пара половых хромосом X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y-хромосомы . Нормальные диплоидные соматические клетки имеют 46 хромосом .
Предварительные оценки предполагали наличие в геноме человека более 100 тысяч генов. По результатам проекта « Геном человека » количество генов, а точнее открытых рамок считывания , составило около 23 000 генов. В связи с усовершенствованием методов поиска (предсказания) генов предполагается дальнейшее уменьшение числа генов.
Число генов у человека лишь ненамного больше, чем у более простых организмов , например, круглого червя Caenorhabditis elegans или мухи Drosophila melanogaster . Так происходит из-за того, что в человеческом геноме широко представлен альтернативный сплайсинг . Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны , и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.
Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бендами (полосы поперёк хромосомы, которые видно в микроскоп) и с . В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.
Кроме генов, кодирующих белки, человеческий геном содержит тысячи РНК-генов , кодирующих транспортные РНК (tRNA), рибосомные РНК , микроРНК и прочие РНК, не кодирующие белок.
В человеческом геноме найдено множество различных последовательностей, отвечающих за . Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена ( энхансеры ). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью . Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики , высокопроизводительных вычислений и молекулярной биологии . Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.
Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно данным молекулярных часов , эволюционные линии человека и мыши разделились около 100 миллионов лет назад . Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности, идентичные или очень слабо отличающиеся в сравниваемых геномах) в некодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов у обоих организмов .
Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу . Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8 раз меньший объём « мусорной ДНК ». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов .
Кодирующие белок последовательности (множество последовательностей составляющих экзоны ) составляют менее чем 1,5 % генома . Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, пока не выяснена. Эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:
Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и эти участки генома многие называют мусорной ДНК. Однако есть масса свидетельств в пользу того, что эти объекты обладают некоторой функцией, которая пока неясна.
Эксперименты с ДНК-микрочипами показали, что много участков генома, не являющихся генами, вовлечены в процесс транскрипции .
Около 1 % в геноме человека занимают встроенные гены ретровирусов ( эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты . Большинство ретровирусов встроились в геном предков человека свыше 25 млн лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено .
Азотистые основания в ДНК ( аденин , тимин , гуанин , цитозин ) соответствуют 4 различным логическим состояниям, что эквивалентно 2 битам информации . Таким образом, геном человека содержит более 6 гигабит информации в каждой цепи, что эквивалентно 800 мегабайтам и сопоставимо с количеством информации на компакт-диске . Логика хранения данных в парных основаниях аналогична системе репликации (дублирования) данных RAID 1 .