Эволюционная дистанция
— величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена
.
Содержание
Методы определения
Попарная дистанция
Простейшей величиной, характеризующей эволюционную дистанцию является доля несовпадающих нуклеотидов при попарном сравнении соответствующих позиций в гене. Эта величина называется «попарной дистанцией» (обычно обозначается символом
p
).
Например, при сравнении следующих двух участков гена
CAGACAGTCA
CACACTGCCA
на 10 нуклеотидов приходится три несовпадающих,
p
= 0,3.
Попарная дистанция недостаточно адекватно описывает эволюционные различия между организмами:
Так как для двух абсолютно произвольных последовательностей нуклеотидов вероятность их случайного совпадения в соответствующих позициях равна 25 %, то попарное расстояние между двумя совершенно чужеродными участками ДНК в среднем равно
p
= 0,75, тогда как по смыслу должно быть
p
= 1.
Попарное расстояние не учитывает разную вероятность различных замен нуклеотидов.
Попарное расстояние не учитывает возможность многократных мутаций в одной позиции.
Недостатки попарной дистанции устраняются использованием более сложных формул определения дистанции:
Метод Джукса-Кантора
Метод Тадзимы-Неи
Метод Кимуры
Метод Тамуры
Метод Тамуры-Неи
и другие методы.
Метод Джукса-Кантора
Метод Джукса-Кантора
(
англ.
Jukes-Cantor Method
) представляет собой простейшую попытку исключить из рассмотрения случайные совпадения нуклеотидов, вероятность которых составляет 25 %. Это однопараметрический метод, который в качестве параметра использует долю несовпадающих нуклеотидов (то есть попарную дистанцию
p
). Дистанция рассчитывается по следующей формуле
Метод предполагает, что все четыре нуклеотида (А, Ц, Т, Г) присутствуют в ДНК в одинаковых пропорциях, а вероятность замены одного нуклеотида на другой одинакова для любой пары нуклеотидов.
Как видно из формулы при
p
> 0,75 выражение не имеет смысла (отрицательное выражение под знаком логарифма). Это является недостатком метода, так как ситуации с
p
> 0,75 (более 75 % различающихся нуклеотидов) принципиально не исключены.
Формула была предложена в 1965 году, на заре исследований в области молекулярной биологии преподавателем химического факультета Калифорнийского университета
(англ.)
(
и студентом того же факультета
(англ.)
(
. В середине 1960-х годов биохимические технологии достигли того уровня, когда стала возможной расшифровка отдельных фрагментов ДНК и аминокислотных последовательностей белков. Это позволило путём сравнения нуклеотидных последовательностей проследить эволюционную близость различных организмов и пути эволюции отдельных видов. Джукс и Кантор входили в число пионеров в деле формализации этого метода, а Кантор стал автором одной из первых компьютерных программ для анализа нуклеотидных последовательностей
.
В качестве примера применения формулы можно привести фрагменты генов, кодирующих α- и β-гемоглобин человека. Считается, что около 400 млн лет назад оба гена произошли от одного предкового гена
.
Сравнение фрагмента обнаруживает 12 различий на 30 нуклеотидов (
p
= 0,4). Однако простой подсчёт расхождений не учитывает вероятность того, что в некоторых позициях произошли многократные мутации, в том числе приведшие к восстановлению исходного нуклеотида. Формула Джукса-Кантора даёт дистанцию
Таким образом, из формулы следует, что с учётом кратных замен в рассматриваемом фрагменте ДНК произошло 0,572·30=17 мутаций.
Метод Кимуры
Мотоо Кимура
предложил метод вычисления дистанции, который получил название «двухпараметрическая дистанция Кимуры» (
англ.
Kimura 2-parameter distance, K2P
). Модель Кимуры предполагает, что различные варианты замены нуклеотидов неравновероятны и рассматривает два типа замен:
Транзиция
— замена нуклеотида без смены его типа, например, замена пуринового основания на пуриновое (А ↔ Г) или пиримидинового на пиримидиновое (Ц ↔ Т).
Трансверсия
— смена типа основания с пуринового на пиримидиновый или наоборот (А или Г ↔ Ц или Т).
Дистанция в модели Кимуры определяется по формуле
где
P
— доля транзиций,
Q
— доля трансверсий.
Рассматривая в качестве примера эволюционную дистанцию между фрагментами генов α- и β-гемоглобина, получим:
В некоторых источниках дистанцией Тадзимы-Нея называется расчёт по более простой формуле
где
Для случая, когда все нуклеотиды встречаются с одинаковой частотой (
g
i
= 0,25), эта формула совпадает с формулой Джукса-Кантора (
b
= 0,75).
Расчёты по этим формулам дают для того же примера
Примечания
от 28 января 2007 на
Wayback Machine
. На сайте СНК кафедры общей химии БГМУ.
T. H. Jukes
,
C. R. Cantor
(1969) Evolution of protein molecules. In H. N. Munro, ed., Mammalian Protein Metabolism, pp. 21-132, Academic Press, New York.
↑
Thomas H. Jukes
(April 30, 1990)
от 21 октября 2012 на
Wayback Machine
Current Contests:
33
(18), p. 21.
Sudhir Kumar, Koichiro Tamura, and
Masatoshi Nei
.
(англ.)
.
MEGA: Molecular Evolutionary Genetics Analysis. Version 1.01
.
(1993). Дата обращения: 18 февраля 2015.
6 февраля 2015 года.
Provine W.B. Rise of the null selection hypothesis. In Cain A.J. and Provine W.B. 1991. Genes and ecology in history. In Berry R.J. et al. (eds)
Genes in ecology: the 33rd Symposium of the British Ecological Society
. Blackwell, Oxford, p15-23.