Некооперативная теория игр
- 1 year ago
- 0
- 0
Домини́рование в теории игр — ситуация, при которой одна из стратегий некоторого игрока дает больший выигрыш, нежели другая, при любых действиях его оппонентов. Обратное понятие, нетранзитивность , возникает, если некоторая стратегия может давать меньшие выигрыши, чем другая, в зависимости от поведения остальных участников.
Понятие доминирования используется при решении или упрощении некоторых типов некооперативных игр .
При выборе своей стратегии из множества допустимых игрок сравнивает по предпочтительности исходы от их применения. Может возникать три типа результатов:
Это понятие обобщается на сравнение более чем двух стратегий:
Говорят, что стратегия игрока слабо доминирует стратегию , если
Здесь представляет собой прямое произведение стратегических множеств всех игроков, кроме -го.
Стратегия строго доминирует , если
C | D | |
C | 1, 1 | 0, 0 |
D | 0, 0 | 0, 0 |
Слабое доминирование |
Если для одного из игроков существует строго доминирующая стратегия, он будет её использовать в любом из равновесий Нэша в игре. Если все игроки имеют строго доминирующие стратегии, игра имеет единственное равновесие Нэша. Однако, это равновесие не обязательно будет эффективным по Парето , т.е. неравновесные исходы могут обеспечить всем игрокам больший выигрыш. Классическим примером этой ситуации является игра « Дилемма заключенного ».
Использование строго доминируемых стратегий ни при каких условиях не является рациональным для игроков, в связи с чем они не будут входить в равновесия Нэша. В то же время, слабо доминируемые стратегии могут входить в равновесия. Пример такой игры приведен справа.
Здесь стратегии D обоих игроков слабо доминируются их стратегиями C . Однако, ситуации ( D , D ) является равновесием Нэша в этой игре. Действительно, ни один из игроков, отклоняясь от использования D , не сможет получить большего выигрыша, если другой игрок придерживается D .
Последовательное исключение доминируемых стратегий — часто используемая технология решения или упрощения некооперативных игр. Она основана на предположении о том, что в процессе игры стороны не будут использовать доминируемые стратегии, в связи с чем их можно не рассматривать при дальнейшем решении. Однако, исключение этих стратегий из рассмотрения приводит к сужению множества возможных ситуаций, в результате чего могут возникнуть новые доминируемые стратегии, которые в исходной игре не доминировались. Последовательное исключение доминируемых стратегий заключается в их отыскании и удалении в последовательности редуцированных игр с сужающимися множествами игровых ситуаций.
Этот процесс может останавливаться, приводя к редуцированной игре, в которой все стратегии игроков являются нетранзитивными либо к единственной ситуации. Если при этом удалялись строго доминируемые стратегии, такая ситуация является единственным равновесием Нэша в игре. Удаление слабо доминируемых стратегий также приводит к равновесию Нэша, однако это равновесие может быть не единственным. В некоторых играх, в зависимости от последовательности удаления слабо доминируемых стратегий, процесс итеративного исключения может сходиться к различным равновесиям Нэша.
Пример решения игры методом последовательного исключения строго доминируемых стратегий.
Пусть в игре участвуют игроки A и B. Для игрока A доступны стратегии a 1 и a 2 , для игрока B — стратегии b 1 , b 2 , b 3 . Игроки выбирают стратегии одновременно и независимо друг от друга. В таблице приведены платежи, которые получают игроки, сыграв свою стратегию, в зависимости от выбранной стратегии другого игрока. Первая цифра в ячейке — платёж первого игрока, цифра после точки с запятой — платёж, получаемый вторым игроком.
Исходная таблица. Например, из таблицы видно, что если игрок A сыграет стратегию a 2 , а игрок B сыграет стратегию b 3 , то игрок A получит 4 очка, а игрок B — 1 очко.
b 1 | b 2 | b 3 | |
---|---|---|---|
a 1 | 6 ; 5 | 3 ; 6 | 3 ; 9 |
a 2 | 7 ; 7 | 3 ; 0 | 4 ; 1 |
Можно заметить, что вне зависимости от выбора игрока A, для второго игрока стратегия b 2 уступает по своим характеристикам стратегии b 3 (6 < 9 и 0 < 1).
b 1 | b 2 | b 3 | |
---|---|---|---|
a 1 | 6 ; 5 | 3 ; 6 | 3 ; 9 |
a 2 | 7 ; 7 | 3 ; 0 | 4 ; 1 |
Поэтому столбец со стратегией b 2 можно не учитывать в дальнейшем рассмотрении, вычёркиваем его. С точки зрения игрока A, среди оставшихся стратегий, a 1 явно уступает a 2 (6 < 7 и 3 < 4)
b 1 | b 3 | |
---|---|---|
a 1 | 6 ; 5 | 3 ; 9 |
a 2 | 7 ; 7 | 4 ; 1 |
Вычёркиваем строку со стратегией a 1 . В таблице платежей остаётся всего две ячейки, и для второго игрока стратегия b 1 явно предпочтительнее стратегии b 3 (1 < 7).
b 1 | b 3 | |
---|---|---|
a 2 | 7 ; 7 | 4 ; 1 |
Таким образом, исключением строго доминируемых стратегий мы решили игру: рациональные игроки сыграют стратегии b 1 и a 2 , каждый игрок получит платёж равный 7.