Кооперативная теория игр
- 1 year ago
- 0
- 0
Некооперативная игра — термин теории игр . Некооперативной игрой называется математическая модель взаимодействия нескольких сторон (игроков) , в процессе которого они не могут формировать коалиции и координировать свои действия.
Некооперативной игрой в нормальной форме называется тройка , где — множество участников игры (сторон, игроков); — множество стратегий участника ; — функция выигрыша участника , определенная на множестве ситуаций и отображающая его во множество действительных чисел .
Некооперативная игра в нормальной форме предполагает следующий порядок разыгрывания.
1. Игроки одновременно и независимо друг от друга выбирают из множеств свои стратегии. Вектор стратегий всех игроков представляет собой ситуацию в игре.
2. Каждый игрок получает выигрыш, определяемый значением функции , на этом взаимодействие между ними прекращается.
Нормальная форма игры описывает статическое взаимодействие игроков, не предусматривая возможности последовательных ходов, накопления информации о действиях соперника и повторяющегося взаимодействия. Для моделирования этих аспектов используется развернутая форма игры.
Некооперативная игра в развернутой форме с множеством игроков представляется с использованием ориентированного дерева (дерева игры) следующим образом.
Вершины дерева представляют собой состояния ( позиции ), в которых может оказываться игра, ребра — ходы , которые могут использовать игроки. Предполагается, что в каждой позиции может совершать ход не более одного игрока. Выделяется три вида позиций в игре:
Начальная и промежуточные позиции образуют множество нетерминальных позиций.
Для каждой вершины дерева , соответствующей нетерминальной позиции, определен игрок , совершающий в ней ход и множество ходов этого игрока . Каждому ходу соответствует ребро, выходящее из вершины .
Для учёта несовершенства информации, имеющейся у игроков, нетерминальные вершины могут объединяться в информационные множества .
Для каждой вершины , соответствующей терминальной позиции, определены функции выигрыша всех игроков .
Игра предполагает следующий порядок разыгрывания:
1. Игра начинается из начальной позиции.
2. В любой нетерминальной позиции игрок, имеющий в ней право хода, выбирает ход , в результате чего игра попадает в следующую позицию, в которую входит ребро, соответствующее ходу . Если эта позиция является нетерминальной, то повторяется п. 2.
3. Если игра попадает в терминальную позицию , то все игроки получают выигрыши , и игра завершается.
Основным принципом оптимальности стратегий для некооперативных игр в нормальной форме является равновесие Нэша , основанное на невозможности отклонений участников от выбранных стратегий. К настоящему времени разработано семейство принципов, основанных на равновесии Нэша, и называемых очищениями равновесия Нэша (Nash equilibrium refinements), наиболее часто используемыми среди которых являются:
Менее универсальными, используемыми в отдельных классах некооперативных игр, являются следующие принципы:
Для некооперативных игр в развернутой форме также используются принципы оптимальности, основанные на равновесии Нэша, но учитывающие специфику динамического взаимодействия игроков. К основным из них относятся: