<<
>>

16.4 Динамические игры с несовершенной информацией

Особенность рассматриваемых в предыдущем разделе игр - каждый игрок, перед тем, как сделать ход, полностью знает предысторию игры - выборы, сделанные ранее им и другими игроками.

Другими словами игрок знает, в какой вершине дерева он оказался. В этом разделе мы рассмотрим класс игр, называемых играми с несовершенной информацией , в которых игроки могут не знать полностью предысторию игры. Т. е., осуществляя очередной ход, они знают, что находятся в одной из вершин некоторого подмножества множества всех вершин дерева игры (так называемого информационного множества).

Примером игры с несовершенной информацией служит любая статическая игра. Ее можно искусственно "динамизировать", задав произвольным образом порядок ходов и определив подходящим образом информационные множества, как это сделано ниже для Игры 16.2.1 (с. 624) "Выбор компьютера" (см. Рис. 16.14).

Предположим, что первый игрок ходит первым, второй - вторым. Есть две вершины, в которых ход принадлежит 2-му игроку, однако сам он не может различить, выбирая свои действия, в какой вершине он находится; другими словами, эти две вершины находятся в одном и том же информационном множестве.

Рис. 16.14. Представление статической игры "Выбор компьютера" в виде дерева

a+c

Как видим, развернутая форма игр с несовершенной информацией несколько более сложна, чем развернутая форма игр с совершенной информацией. Дополнительно к тем составляющим, которые были указаны в прежнем определении, требуется также перечислить информационные множества, которые задают разбиение множества вершин (кроме конечных). Информационные множества должны быть заданы так, чтобы каждая вершина, кроме конечных, принадлежала одному и только одному из них. Кроме того, по смыслу определения информационного множества, во всех его вершинах ход должен принадлежать одному и тому же игроку.

Дополнительно следует потребовать, чтобы множество возможных действий во всех вершинах одного и того же информационного множества были одинаковыми.

В противном случае игрок мог бы по тому, какие альтернативы ему доступны, определить, в какой именно вершине он находится. Дерево игры, представленное на Рис. 16.14 удовлетворяет этому требованию - ив вершине ©, и в вершине © 2-й игрок выбирает между IBM и Mac.

Используя понятие информационного множества, мы можем дать формальное определение игр с совершенной информацией: в играх с совершенной информацией в каждом информационном множе-

29

стве находится только одна вершина .

В приложениях теории игр чаще всего рассматривают так называемые игры с идеальной памятью, то есть такие игры, в которых игроки не забывают ту информацию, которой они обладали на предыдущих ходах. Мы не будем давать формального определения таких игр. Приведем только примеры игр, в которых предположение об идеальной памяти не выполняется (см. Рис. 16.15). Игрок 2

Игр

Рис. 16.15. Примеры игр, не являющихся играми с идеальной памятью

Таким образом, существуют два представления любой игры - представление в нормальной и развернутой форме. Выше мы показали, как динамическую игру с совершенной информацией представить в нормальной форме, а статическую игру - в развернутой форме. Таким образом, любую динамическую игру с совершенной информацией можно представить в нормальной форме, а затем, - на основе этой нормальной формы - построить развернутую форму соответствующей игры. Приведем пример такого построения.

Если мы представим игру на Рис. 16.16 в нормальной форме, то получим Таблицу 16.14 (для упрощения выигрыши не указаны).

Рис. 16.16.

Таблица 16.14.

Игрок 2 L2

R2 Li Ri

Игрок 1 Этой нормальной форме соответствует дерево игры, представленное на Рис. 16.17. Как видим, при таком "двойном переводе" частично потеряна информация о структуре игры и мы получили другую игру в развернутой форме. Очевидно, что принципиально разным играм может соответствовать одна и та же нормальная форма. L

Рис. 16.17.

Таким образом, нормальная форма игры не является в общем случае адекватной для описания динамических игр.

С помощью нее можно представлять корректно только статические игры. Если операцию "двойного перевода" из развернутой формы в нормальную и обратно осуществить со статической игрой, представленной на Рис. 16.14, то дерево игры не поменяется (с точностью до выбора порядка ходов, что в данном случае несущественно).

Использование нормальной формы для представления статических игр вполне допустимо и даже предпочтительно, так как она более компактна.

Уточним понятие стратегии для рассматриваемого класса игр.

Стратегия игрока в играх с несовершенной информацией должна, указывать, какие этот игрок выберет действия, если окажется в данном информационном множестве. Поскольку в играх с совершенной информацией в каждом из информационных множеств находится только одна вершина, то такая модификация определения стратегии полностью согласуется с данным ранее определением. Пользуясь понятием стратегии, мы можем распространить концепцию равновесия Нэша на динамические игры с несовершенной информацией. Определение ничем не будет отличаться от ранее данного.

Определение совершенного в подыграх равновесия в играх с несовершенной информацией совпадает с данным выше определением для игр с совершенной информацией. Однако, в играх с несовершенной информацией следует дать несколько другое определение подыгры. Отличие состоит в том, что подыгра может начинаться не из любой вершины. Следует потребовать, чтобы если некоторая вершина содержалась в подыгре, то в этой же подыгре содержалось и все информационное множество, содержащее данную вершину. Например в игре, дерево которой показано на Рис. 16.18, в вершины ©, © и О не являются начальными вершинами подыгр. Таким образом, в этой игре нет собственных подыгр.

Игрок 1

Рис. 16.18.

2 1 i© Игрок 3

\V /1

Заметим, что не к любой игре с несовершенной информацией можно применить алгоритм обратной индукции. Игра на Рис. 16.18 представляет собой как раз такую игру, в которой невозможно найти решение с помощью обратной индукции. Игрок 3 в этой игре не знает, в какой именно из двух вершин информационного множества он находится, поэтому он не может без каких-либо дополнительных предположений выбрать между двумя имеющимися альтернативами. Мы рассмотрим концепцию решения подобных игр позже, в параграфе, посвященном совершенному байесовскому равновесию.

Здесь мы рассмотрим лишь класс игр, для анализа которых можно использовать (при естественной его модификации) алгоритм обратной индукции. Эти игры можно назвать играми с почти совершенной информацией. Другое название - многоэтапные игры с наблюдаемыми действиями. Такие игры можно разбить на несколько этапов: t = 1,..., T, каждый из которых представляет собой одну или несколько статических игр. В рамках t-го этапа игроки одновременно выбирают действия, причем каждый игрок знает всю предысторию, т. е. какие действия выбрали другие игроки на предыдущих этапах (1,..., t - 1); более того, предыстория игры является общеизвестной. Пример такой игры - повторяющаяся конечное число раз статическая игра. Заметим, что множества стратегий некоторых игроков в этих статических играх могут быть пустыми (как, например, на первом этапе игры, представленной на Рис. 16.20).

Сначала при использовании обратной индукции последнем, T-м, этапе находятся равновесия по Нэшу всех игр этого этапа. Затем, каждая их этих игр заменяется конечной вершиной. Ей сопоставляются выигрыши, соответствующие равновесию по Нэшу (одному из равновесий, если их несколько). Тем самым мы получаем игру с T - 1 этапом, и т. д.

Игры с почти полной информацией удобны для анализа, поскольку каждая статическая игра (соответствующего этапа) начинает одну из подыгр. Этапы можно рассматривать последовательно, а это фактически и означает, что в них не возникает трудностей с использованием обратной индукции.

Рассмотрим пример игры с почти полной информацией и использования обратной индукции для поиска решения в таких играх.

Игра 9. "Набеги на банки"

Два инвестора вложили в банк одинаковые денежные суммы (например, по 2 рубля). Банк обещает им вернуть через 3 месяца по 3 рубля. Они могут взять деньги из банка через 1, 2 или 3 месяца, однако банк сможет вернуть только половину общей суммы сделанных инвестиций, если вкладчики потребуют деньги раньше срока (через 1 или 2 месяца). При этом если оба потребуют деньги, то получат по 1 рублю, а если деньги потребует только один, то он получит 2 рубля, а другой вкладчик не сможет

получить ничего. <

Дерево игры показано на Рис. 16.19. R обозначает "забрать деньги", L - "не забирать". Игра происходит в два этапа, на каждом из которых вкладчики одновременно решают, забирать ли деньги. Первый этап происходит по прошествии одного месяца после вложения денег, второй - по прошествии двух месяцев.

В Таблице 16.15 изображена статическая игра, соответствующая второму этапу. В игре имеется два равновесия по Нэшу. Применяя обратную индукцию, мы используем выигрыши, соответствующие этим равновесиям, чтобы сформулировать статическую игру, соответствующую первому этапу.

Получающаяся редуцированная игра представлена в Таблице 16.16. В ней выигрыши второго этапа обозначены через vi и v2 соответственно.

II этап

1 2 0 !

Рис. 16.19. Дерево игры "Набеги на банки"

Таблица 16.15. Игра "Набеги на банки" на втором этапе R3

Игрок 1

Игрок 2 L4 R4

L

3 3

3 2

0 0

2 1

1 Таблица 16.16. Редуцированная игра "Набеги на банки" на первом этапе Ri

Игрок 1

Игрок 2 L2 R2

L

i V2

V1 2

0 0

2 1

1 Множество равновесий Нэша в редуцированной игре первого этапа зависит от того, какое из двух равновесий может реализоваться на втором этапе. Если игроки считают, что на втором этапе они оба заберут деньги, то им выгоднее забрать деньги на первом этапе, поскольку vi,v2 = 1 < 2. Если же игроки считают, что на втором этапе они оба оставят деньги в банке, то на первом этапе может реализоваться одно из двух равновесий Нэша, поскольку vi,v2 = 3 > 2: либо оба игрока забирают деньги, либо оба оставляют. Таким образом, обратная индукция дает три решения. В двух из этих решений происходит "набег на банк" на первом и втором этапе соответственно. Третье решение соответствует случаю, когда оба вкладчика дожидаются получения максимального выигрыша (3, 3).

Использование обратной индукции в играх с почти совершенной информацией можно дополнительно обосновать тем, что для них выполнен вариант Теоремы 158. Теорема 159:

В игре с почти совершенной информацией (и конечным числом ходов) множество решений, получаемых обратной индукцией, совпадает с множеством совершенных в подыграх равновесий. J

В отличие от игр с совершенной информацией, в играх с почти совершенной информацией решения в чистых стратегиях может не существовать (как, например в игре на Рис. 16.20). Выход из положения состоит в том, чтобы ввести в поведение игроков элемент рандомизации, по аналогии со смешанными стратегиями, которые мы рассмотрели в случае статических игр.

Рис. 16.20. Игра, в которой нет равновесия в чистых стратегиях

Конечно, мы можем прямо перенести понятие смешанной стратегии на динамические игры, воспользовавшись представлением этих игр в нормальной форме. Согласно такой интерпретации, смешанная стратегия игрока - это вероятности, с которыми игрок выбирает свои чистые стратегии. В этом случае игроки рандомизируют стратегии. Однако более предпочтительной кажется другая концепция: игроки рандомизируют действия. Эта концепция лучше соответствует идеологии динамических игр.

Стратегию с рандомизацией действий принято называть поведенческой стратегией. Поведенческая стратегия должна указывать для каждого информационного множества, в котором ход принадлежит игроку, некоторое распределение вероятностей на множестве действий, из которых он выбирает в данном информационном множестве. При этом предполагается, что распределения вероятностей в разных информационных множествах статистически независимы.

Фундаментальный результат, принадлежащий Куну, состоит в том, что в играх с идеальной памятью использование поведенческих стратегий эквивалентно использованию смешанных стратегий (со случайным выбором чистых стратегий). Мы понимаем под эквивалентностью двух наборов стратегий то, что они порождают одно и то же распределение вероятностей на множестве конечных вершин (или, что то же самое, на множестве всех траекторий игры, начинающихся в начальной вершине). Несложно понять, что каждый набор смешанных стратегий однозначно порождает набор поведенческих стратегий, при этом оба они порождают одно и то же распределение на множестве конечных вершин. Обратное утверждение состоит в том, что для любого набора поведенческих стратегий найдется хотя бы один набор смешанных стратегий, который его порождает. В дальнейшем мы везде будем говорить о смешанных стратегиях, имея в виду поведенческие стратегии.

Алгоритм обратной индукции можно естественным образом распространить на случай случайного выбора игроками своих действий. Заметим, что в играх с совершенной информацией с различными выигрышами такая обратная индукция даст то же самое единственное решение, что и обычная обратная индукция. Смешанные стратегии в этом решении будут вырожденными: каждый игрок будет выбирать одно из действий с единичной вероятностью. По-видимому, смешанные стратегии имеет смысл рассматривать только в играх с несовершенной информацией.

Рассмотрим в качестве примера Игру 16.4 "Набеги на банки" (с. 659). Как мы уже видели, в этой игре существует три равновесия в чистых стратегиях. Мы сейчас увидим, что в игре, кроме того, существуют равновесия в смешанных стратегиях.

Обозначим через вероятность того, что первый вкладчик не забирает деньги на первом этапе (вероятность выбора Li), а через vi - вероятность того, что второй вкладчик не забирает деньги на первом этапе (вероятность выбора L2). Соответствующие вероятности на втором этапе обозначим ^2 и V2 (вероятности выбора L3 и L4 соответственно).

В игре второго этапа существуют три равновесия Нэша в смешанных стратегиях (см. Рис. 16.21). Два из этих равновесий - равновесия в вырожденных смешанных стратегиях. Есть также равновесие в невырожденных смешанных стратегиях: ^2 = 1/2 и V2 = 1/2. Ожидаемые выигрыши вкладчиков составят при этом по 3/2. Структура равновесий в редуцированной игре 1-го этапа зависит от того, какое из трех возможных равновесий второго этапа ожидают игроки. Равновесия в вырожденных смешанных стратегиях аналогичны рассмотренным выше равновесиям в игре с чистыми стратегиями. Кроме того, в редуцированной игре при vi,v2 = 3 (когда на втором этапе оба оставляют деньги в банке) существует равновесие в невырожденных смешанных стратегиях: = 1/2 и vi = 1/2. V2 (^2 )

Л V2 1 M2(V2)

М2 -i"-

1

Рис. 16.21. Равновесия в смешанных стратегиях второго этапа игры "Набеги на банки"

Задачи

^ 701. "Раз-два-три" Каждый из двух игроков одновременно называет одно из трех чисел: 1, 2 или 3. При совпадении второй игрок дает первому названное и совпавшее число (при несовпадении никто не платит). Дополнительно игроки получают удовольствие от участия в игре, которые они оценивают в 1/2. Какую сумму z первый игрок должен заплатить второму до начала игры, чтобы тот согласился играть? Нарисуйте дерево, описывающее данную ситуацию.

^ 702. В игре участвуют 2 игрока. Игра состоит из двух этапов. На первом этапе игроки одновременно решают, хотят ли они участвовать во втором этапе. Если игрок говорит, что хочет участвовать во втором этапе то он платит $1. Второй этап начинается, только если оба решают участвовать во втором этапе, в противном случае игра заканчивается, и деньги забирает организатор игры. В игре второго этапа игроки одновременно заявляют, хотят ли они забрать имеющиеся $2. В случае их отказа, деньги достаются организатору этой игры. Если же на эти деньги претендуют оба, то между ними происходит ссора, потери от которой обо игрока оценивают выше, чем достающаяся им доля, так что выигрыш обоих - отрицательный. Полностью эта игра с указанием всех выигрышей изображена на Рис. 16.22. На первом этапе L обозначает "дать доллар", R - "не давать доллар". На втором этапе L обозначает "попытаться забрать доллары", R - "отказаться от долларов".

Проанализируйте эту игру и найдите в ней все совершенные в подыграх равновесия как в чистых, так и в смешанных стратегиях.

^ 703. Найдите равновесие в смешанных стратегиях для игры, изображенной на Рис. 16.20 (с. 661). ^ 704. 50 пиратов делят добычу в 100 дукатов. Правило дележа следующее. В порядке старшинства каждый пират предлагает свою схему дележа. Если большинство пиратов (не менее половины, включая пирата, который предлагает дележ) принимает предложение, то оно выполняется и процедура дележа заканчивается. Если предложение отвергается, то пират, который его сделал, исключается из числа

участвующих в дележе, и тогда настает очередь следующего по старшинству пирата предложить схему дележа между оставшимися пиратами.

Объясните, почему описанная игра является игрой с почти совершенной информацией.

Как будет поделена добыча? (Предложите решение игры.)

Будет ли равновесие единственным?

<< | >>
Источник: Бусыгин, Желободько, Цыплаков. Микроэкономика - Третий уровень 2005 702 с.. 2005

Еще по теме 16.4 Динамические игры с несовершенной информацией:

  1. Оглавление
  2. 16.2 Статические игры с полной информацией
  3. Под статической игрой понимают такую игру, в которой все ее участники принимают решения не зная, какие именно решения принимают другие. Обычно в этом случае говорят, что участники принимают решения одновременно, хотя сама по себе одновременность принятия решений в данном случае не важна. Под играми с полной информацией понимаются такие игры, в которых каждый из игроков точно знает характеристики других игроков .
  4. 16.3 Динамические игры с совершенной информацией
  5. 16.4 Динамические игры с несовершенной информацией
  6. 16.5 Статические игры с неполной информацией
  7. 1. Статические игры с полной информацией
  8. 2. Динамические игры с совершенной информацией
  9. 3. Динамические игры с несовершенной информацией
  10. 4. Статические игры с неполной информацией
  11. Глава 1. Статические игры с полной информацией
  12. Глава 2. Динамические игры с полной информацией
  13. 2.2. Обратная индукция и конечные игры с совершенной информацией
  14. Глава 3. Статические игры с неполной информацией
  15. Глава 4. Динамические игры с неполной информацией
  16. КОНЕЧНО ПОВТОРЯЕМЫЕ ИГРЫ ПРИ ПОЛНОЙ ИНФОРМАЦИИ С МНОЖЕСТВОМ РАВНОВЕСИЙ В СОСТАВНОЙ ИГРЕ
  17. ИГРЫ С СОВЕРШЕННОЙ ИНФОРМАЦИЕЙ
  18. СТАТИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ
  19. Риск, несовершенная информация и несовершенные рынки капиталов