<<
>>

16.5 Статические игры с неполной информацией

Рассматривая статические игры, мы предполагали, что игроки в равной степени информированы о структуре игры, так что каждый из игроков знает множества возможных действий и целевые функции других игроков (более того, мы предполагали, что все это общеизвестно).

На самом деле экономические субъекты всегда бывают в разной степени информированы или, другими словами, асимметрично информированы, поэтому многие экономические явления невозможно адекватно описать, не отказавшись от этого упрощающего предположения.

Мы рассмотрим здесь разновидность игр, в которых игроки могут не знать точно предпочтения других игроков. Предпочтения игроков в этих играх зависят от случайных событий, при этом игроки в разной степени владеют информацией о том, какое именно событие произошло. Формально это учитывается с помощью введения понятия типа игрока: каждый из игроков может быть нескольких типов. При этом считается, что каждый из игроков знает только свой собственный тип. Можно считать, что первый ход делает природа, выбирая типы всех игроков. Такого рода игры называют играми с неполной информацией или байесовскими играми.

Концепция игр с неполной информацией оказывается очень плодотворной, и позволяет моделировать различные ситуации, содержащие элемент случайности, которые невозможно смоделировать в рамках игр с полной информацией, которые были рассмотрены нами выше. Например, характеристики игрока могут зависеть от некоторых случайных параметров. Стратегия игрока при этом должна описывать, какие действия он выберет при каждом возможном значении параметра.

В этом параграфе мы разберем статические игры с неполной информацией. Динамическим играм с неполной информацией посвящен следующий параграф.

Опишем структуру статической игры с неполной информацией (статической байесовской игры).

Как и раньше, I = {1,..., m} - множество игроков. В байесовских играх каждый игрок имеет несколько типов, G ©j, где ©j - множество типов i-го игрока (не обязательно конечное или счетное).

Предполагается, что появление того или иного типа - случайное событие. Таким образом, в описании байесовской игры должно быть задано распределение вероятностей на множестве

© = ©1 х o o o х ©,

Если множества типов ©j конечны, то достаточно задать вероятности появления сочетаний типов (01, ..., 0m) € ©, т. е. функцию

п(-) : © ^ R+,

для которой выполнены стандартные предположения о том, что вероятности должны быть неотрицательны и их сумма должна равняться единице.

В дальнейшем мы, как правило, будем предполагать, что имеет место независимость появления типов у разных игроков (для краткости будем называть это независимостью типов). В таком случае достаточно задать вероятности появления каждого из типов для каждого игрока, то есть m функций

n"i(-) : ©j ^ R+, i = 1,..., m,

таких что п (0) - вероятность появления типа 0 € ©j игрока i. Это случай, когда знание своего типа не дает игроку дополнительной информации о типах других игроков.

Если типы - это действительные числа, то можно считать, что дана функция распределения типов, F(01,..., 0m). Независимость типов в данном контексте означает, что функцию распределения можно представить как произведение функций распределения типов отдельных игроков

F (01,..., 0m) = П Fi(0i).

j=i

Предполагается, что все типы одного и того же игрока имеют одинаковые множества действий Xj . Выигрыш в статических байесовских играх зависит не только от выбранных игроками действий, (x1,..., xm) € X, но и от того, какие именно типы, (01,..., 0m) € ©, участвуют в игре. Предпочтения игроков заданы функциями выигрышей:

uj : X х © ^ R,

где X = X1 х o o o х Xm.

Таким образом, описание статической байесовской игры должно включать в себя следующие составляющие:

?Ф множество игроков;

?Ф для каждого игрока - множество типов; Ф распределение вероятностей на множествах типов; Ф для каждого игрока - множество возможных действий; Ф для каждого игрока - функции выигрышей.

В частном случае, когда множества типов конечны, статическая байесовская игра есть набор

(I, {©j}/,п, {Xj}/, {uj}/>.

Стратегии в статических байесовских играх не совпадают с действиями.

В соответствии со сложившейся терминологией, стратегия игрока описывает действия каждого из типов этого игрока. Можно представить стратегию как функцию sj(-), которая ставит в соответствие каждому типу 0 € ©j некоторые действия sj(0) € Xj.

Естественное обобщение понятия рациональности в данном случае состоит в том, что каждый тип каждого игрока максимизирует ожидаемый выигрыш при некоторых ожиданиях относительно стратегий других игроков . Поскольку игрок знает свой тип, то математическое ожидание должно быть условным по этому типу. (Условные вероятности в общем случае рассчитываются по формуле Байеса - отсюда и термины "байесовские игры", "байесовское равновесие".) Ожидаемый выигрыш игрока i, имеющего тип 0 и выбравшего действия xj, в предположении, что остальные игроки выбрали стратегии

s-j(-) = (S1(-), . . . , Sj- 1 ('), Sj+1 (o) , . . . , Sm (o)),

равен

Uj(0,Xj,s_i(-)) = E[uj(xj,s-j(0_j),0,0_j) | 0j = 0],

где 6-j = (0i,..., 0j_i, 0j+i,..., 0m) - типы остальных игроков.

Если имеет место независимость типов, то условное по типу мат. ожидание совпадает с безусловным, т. е.

Uj(0,xj, s_j(-)) = E(uj(xj, s_j(0_j),0,0_j)).

Если множества типов конечны и типы независимы, то ожидаемый выигрыш рассчитывается по формуле

Uj(0, Xj, s_ j(^)) = ^ П_ j (0_ j )uj (Xj, s_j (0_j),0, 0_j),

где мы обозначили

©_j = (©i,..., ©j_i, ©j+i,..., ©m)

и

n_j(0_j) = Ц nj (0j)

j=j

(вероятность того, что типы остальных игроков окажутся равными 0_j = (0i,..., 0j_i, 0j+i,..., 0m)).

Для байесовских игр предложена концепция равновесия , аналогичная равновесию Нэша в играх с полной информацией.

Определение 95:

Набор стратегий (si(-),..., sm(-)) является равновесием Нэша- Байеса (байесовским равновесием) в игре с неполной информацией, если для каждого типа 0 G ©j каждого игрока i действия s(0) максимизируют его ожидаемую полезность в предположении, что все другие игроки выбрали равновесные стратегии:

Uj(0, s(0), s_j(^)) = max Uj(0, Xj, s_j(-)).

xiGXi

Для того, чтобы введенные определения стали более понятными, проиллюстрируем их на условном примере.

Игра 10. "Выбор компьютера"

В игре участвуют два игрока, использующие в работе компьютеры. Каждый игрок может быть двух типов - предпочитает работать либо на IBM PC, либо на Макинтоше, причем любители IBM PC попадаются с вероятностью п (для обоих игроков). Каждый из игроков выбирает либо IBM PC, либо Макинтош. Лишь после того, как игрок выбрал тип компьютера, он узнает, с партнером какого типа ему предстоит работать, и какой тот выбрал себе компьютер. Каждый из типов каждого из игроков оценивает пользование компьютером любимой разновидности в 1 у. е., а пользование другим компьютером в 0 у. е. Игроки получают дополнительный выигрыш в 2 у. е., если выберут компьютеры одной

и той же разновидности. <

Игра представлена в Таблице 16.17.

Мы не будем полностью решать эту игру. Найдем только условия для параметра п, при которых набор стратегий "если игрок любит IBM, то оно выбирает IBM; если игрок любит Mac, то он выбирает Mac", т. е. ((IBM, Mac), (IBM, Mac)), будет равновесием Нэша- Байеса.

Рассмотрим выбор 1-го игрока, если он предпочитает IBM PC. Если он ожидает, что стратегией 2-го игрока является (IBM, Mac), то его ожидаемая полезность от выбора компьютеров IBM PC и Макинтош равна соответственно

IBM: п o 3+(1 - п) o 1, Mac: п o 0+(l - п) o 2. Таблица 16.17. Любит Mac

[1 - п]

Любит IBM

[п]

IBM Mac IBM Mac

Игрок 1

Игрок 2 Любит IBM Любит Mac IBM Mac IBM Mac 3

3 0

1 3

2 1

1 1

0 2

2 0

0 3

2 2

3 0

0 2

2 1

0 1

1 3

2 0

1 3

3 [п]

[1 - п] Первый игрок такого типа выберет IBM PC, если выполнено условие

или

п o 3 + (1 - п) o 1 > п o 0 + (1 - п) o 2

п > 1/4. Рассмотрим теперь выбор 1-го игрока, если он предпочитает Макинтош. Поскольку в равновесии он ожидает, что стратегией 2-го игрока является (IBM, Mac), то его ожидаемая полезность от выбора компьютеров IBM PC и Макинтош равна соответственно

IBM: п o 2 + (1 - п) o 0, Mac: п o 1 + (1 - п) o 3.

Первый игрок такого типа выберет Макинтош, если выполнено условие

п o 2 + (1 - п) o 0 < п o 1 + (1 - п) o 3

п < 3/4.

Для второго игрока рассуждения аналогичные и приводят к тем же условиям, поскольку игроки одинаковы. Таким образом, условие

1/4 < п < 3/4

гарантирует, что набор стратегий ((IBM, Mac), (IBM, Mac)) будет байесовским равновесием.

Следующий пример не является полноценной игрой, поскольку выбор в нем делает только один игрок, однако он включает все те компоненты байесовской игры, о которых здесь говорилось. Этот пример показывает, как можно моделировать то, что один и тот же игрок может в зависимости от некоторых случайных обстоятельств обладать разным объемом информации. Размышления над примером позволяет "сломать" некоторые стереотипы, которые могут сложиться на основе формального определения байесовской игры.

Игра 11. "Вахтер"

На входе в некоторое учреждение стоит вахтер. В учреждение могут войти посетители двух типов: "свои" и "чужие" (будем их для краткости обозначать A и B). Некоторые посетители кажутся вахтеру своими, а некоторые - чужими. Таким образом, в данной игре есть 2 типа вахтера (обозначим их соответственно a и b). Вахтер может проверить у посетителя наличие пропуска. При этом, если посетитель окажется своим, то выигрыш вахтера составит -1 , а если чужим, то 1 .

Матрица игры приведена в Таблице 16.18. Вероятность того, что свой посетитель кажется вахтеру своим обозначена п^а и т. д. Заметим, что по смыслу игры, если вахтер достаточно опытен, то вероятности появления типов не должны быть независимыми. Таблица 16.18. b

Вахтер

a

проверять не проверять проверять не проверять

Посетитель A B - [ПА"]

0 - [пва] 0 [ПАЬ] -1- [пвь] Условная вероятность того, что посетитель свой, если он кажется своим, равна пла/(пла + пва), а условная вероятность того, что посетитель чужой, если он кажется своим, равна пва/(пла + пва). Таким образом, ожидаемый выигрыш вахтера типа а, если он проверяет документы, равен

ПЛа (_!) + пВа ^

ПЛа + П Ва ПЛа + ПВа

а если не проверяет, то 0. Аналогично, ожидаемый выигрыш вахтера типа b, если он проверяет документы, равен

ПЛЬ ? (_1)+ ПВЬ ? 1, пль + пвь ПЛЬ + ПВЬ

а если не проверяет, то 0.

Если вахтер опытен, то вероятность пла велика по сравнению с вероятностью пва, а вероятность пЛЬ велика по сравнению с вероятностью пвь , и естественно ожидать, что вахтер будет проверять документы у тех, кто ему кажется чужими и не будет проверять документы у тех, кто ему кажется своими.

Разберем также пример, в котором множества типов являются континуумами.

Игра 12. "Аукцион с заявками в запечатанных конвертах" Некий предмет продается с аукциона. Участники аукциона (i = 1,... ,n), подают свои заявки, pi ^ 0, в запечатанных конвертах. Побеждает тот, кто предложит самую высокую цену. (Если самую высокую цену предложат сразу несколько участников, то победитель определяется жребием.) Победивший участник платит заявленную цену и получает предмет. Если i -й участник окажется победителем, то его выигрыш составит vi _pi, где vi - ценность для него данного предмета; выигрыш всех остальных участников будет равен нулю. Известно, что оценки vi распределены равномерно на отрезке [0,1] и

независимы. <

В данном случае можно считать, что множество типов каждого игрока совпадает с отрезком [0,1]. Удобно рассматривать стратегию i-го игрока как функцию, ставящую в соответствие типу v цену, которую он предложит, pi(v) :

Pi(-) : [0,1] ^ R+.

Решить эту задачу непосредственно затруднительно. Можно предложить следующий путь решения: предположить, что равновесные стратегии обладают некоторыми естественными свойствами, затем вычислить, исходя из этого, равновесные стратегии и показать, что на самом деле найдено равновесие.

По смыслу задачи естественно искать симметричное равновесие, то есть такое равновесие, в котором игроки выбирают одинаковые стратегии:

Pi(v) = po(v) Vi,

Кроме того, предположим, что одинаковая для всех стратегия po(-) является возрастающей дифференцируемой функцией. Найдем, исходя из этих предположений, оптимальный отклик i -го игрока. Если этот игрок выберет цену p, то вероятность того, что другой игрок, j, предложил более низкую цену равна

Pr(po(vj) (p),

где мы воспользовались тем, что оценка vj равномерно распределена на [0,1], и обозначили через ^>(p) функцию, обратную к po(-). Поскольку по предположению vj распределены независимо, то события

Po(vj) < p независимы, и вероятность того, что i-й игрок выиграет аукцион, заявив цену p, равна ^(p)"-1. (Здесь мы пользуемся тем, что, поскольку po(-) - возрастающая функция, то вероятность события po(vj) = p равна нулю.) Таким образом, ожидаемый выигрыш i-го игрока с оценкой v, предложившего цену p, в предположении, что все остальные игроки выбрали стратегии po(-), равен

^(p)"-1 o (v - p) + (1 - ^(p)"-1) o 0 = (v - p)^(p)"-1.

Условия первого порядка для задачи максимизации ожидаемого выигрыша имеют вид

(n - 1)(v - p)^(p)"-2^'(p) - ^(p)"-1 = 0

или

(n - 1)(v - p)^/(p) - ^(p) =

В равновесии игрок, имеющий оценку v, должен предлагать цену p = po(v). Подставив это в условия первого порядка, получаем:

(n - 1)(v -po(v))^/(po(v)) - y(po(v)) = 0.

Поскольку (o) - функция, обратная к po(^), то

^(po(v)) = v и ^/(po(v)) = "Т^т.

po(v)

Получим дифференциальное уравнение

(n - 1)[v -po(v)] -po(v)v = 0. Решением этого уравнения, как несложно проверить, является

. . n - 1 C

po(v) = v + ,

n v" 1

где C - константа интегрирования. Найдем эту константу. По смыслу игры po(v) не должна превышать v. С другой стороны, по условию заявленная цена не может быть отрицательной. Поэтому должно выполняться граничное условие po(0) = 0, откуда C = 0. Таким образом, наши рассуждения приводят к стратегиям вида

n- 1

po(v) = v.

n

В самом деле, при таких стратегиях других игроков ожидаемый выигрыш игрока с оценкой v ,

(n-1)

"1

( v - p ) p "

n1

достигает глобального максимума на R+ при p = ? v, то есть условия первого порядка дали нам правильное решение. Заметим, что хотя мы нашли равновесие, но не можем быть уверены, что полученное нами решение единственно.

Если в аукционе участвуют 2 игрока, то в равновесии каждый предложит цену на уровне половины своей оценки. С ростом количества участников равновесные стратегии все больше приближаются к "правдивым" стратегиям pj(v) = v.

Выше уже упоминалось, что равновесие в смешанных стратегиях в играх с полной информацией можно представить как байесовское равновесие (в чистых стратегиях) в играх с неполной информацией. Рассмотрим в качестве примера Игру 16.2.5 "Инспекция".

С помощью байесовского равновесия можно имитировать эффект смешанных стратегий при использовании только чистых стратегий. Рассмотрим, как это можно сделать на примере Игры 16.2.5 "Инспекция" (с. 636). Предположим, что оба игрока могут быть разных типов. Для упрощения предположим, что множество типов у каждого из игроков - отрезок [0,1]. При этом предполагаем, что разные типы одного и того же игрока имеют одинаковые предпочтения (те, что заданны Таблицей 16.9). Несложно проверить, что следующий набор стратегий является байесовским равновесием расширенной игры: налогоплательщик платит налог, если его тип удовлетворяет условию $1 ^ 1/2, в противном

случае он налог не платит; аналогично налоговый инспектор проверяет, если его тип удовлетворяет условию $2 ^ 1/2. Это байесовское равновесие полностью воспроизводит равновесие в смешанных стратегиях исходной игры: в половине случаев налогоплательщик платит налог, и в половине случаев налоговый инспектор проверяет налогоплательщика. Рандомизирует при этом не игрок, а природа, когда выбирает тот или иной тип игрока.

Конечно, в расширенной игре существует не одно, а бесконечно много байесовских равновесий. Для получения другого байесовского равновесия требуется только произвольным образом разбить множество типов каждого игрока на две части, вероятности попадания в которые равны вероятностям использования чистых стратегий в исходном равновесии в смешанных стратегиях.

Можно также имитировать равновесие в смешанных стратегиях с помощью слегка измененной игры, в которой к выигрышам добавляются малые случайные возмущения, зависящие от типов игроков. Такой подход позволяет избавится от множественности байесовских равновесий, о котором только что говорилось. При этом равновесие в смешанных стратегиях будет пределом байесовских равновесий в "возмущенных" играх. (См. задачу 707.)

Задачи

^ 705. Как представить Игру 16.2.1 (с. 625) в виде байесовской игры?

^ 706. Богатство отца составляет $3 с вероятностью 1/5, $6 с вероятностью 1/5 ? 4/5, $12 с вероятностью 1/5 ? (4/5)2, и т. д. (то есть, $3 х 2k с вероятностью 1/5 ? (4/5)k для каждого k ^ 0). В один конверт он кладет две трети своего богатства, в другой - одну треть. Он дает по конверту каждому из двух сыновей (каждый из сыновей с одинаковой вероятностью получит любой конверт). Каждый из сыновей видит, сколько денег в его собственном конверте, но не знает, сколько денег в конверте брата. Каждый из сыновей имеет функцию полезности от богатства ln(w). [Подсказка: 39 > 214 ].

Рассмотрим следующую игру. Каждый из братьев решает, разделить ли деньги, находящиеся в конвертах. Таким образом каждый из братьев говорит "Да" или "Нет" (одновременно). Если оба говорят "Да", они делят деньги поровну. Если хотя бы один из братьев говорит "Нет", то они остаются с деньгами, находящимися в их собственных конвертах.

Каждый брат знает только количество денег в его собственном конверте. Таким образом тип каждого брата - это элемент множества {1, 2,4, 8,...}. Каково распределение вероятностей по типам?

Опишите эту ситуацию формально как игру с неполной информацией.

Опишите равновесие (Нэша- Байеса) в чистых стратегиях, в котором братья делят деньги. Проверьте, что это действительно равновесие. Существует ли в этой игре другое равновесие?

Предположите теперь, что отец объявил, что ни в одном из конвертов не может находиться больше чем $3 х 2K (для некоторого K ^ 1). Охарактеризуйте равновесия Нэша- Байеса в чистых стратегиях получившейся в результате игры.

^ 707. В Таблице 16.19 показана "возмущенная" игра "Инспекция" (см. Игру 16.2.5). В ней ?i и ?2 - случайные возмущения, соответствующие типу 1-го и 2-го игрока соответственно, причем ?i и ?2 равномерно распределены на отрезке [0, 6] (6 > 0) и независимы между собой . Найдите байесовское равновесие (в чистых стратегиях) в этой игре. Докажите, что при 6 ^ 0 найденное байесовское равновесие стремится к равновесию в смешанных стратегиях исходной игры (Игра 16.2.5 на с. 636).

[Указание: Подскажем, равновесие какого вида здесь искать. Каждый игрок выбирает некоторый пороговый уровень, ? i . Равновесные стратегии выглядят следующим образом: если ?1 < ? 1 , то первый игрок выбирает стратегию "нарушать", а если ?1 > ? 1 - то стратегию "не нарушать" (вероятность того, что ?1 = ? 1 равна нулю, поэтому этот случай можно не рассматривать); аналогичным образом второй игрок выбирает стратегию "проверять", если ?2 < ?2 и стратегию "не проверять", если ?2 > ?2 .]

<< | >>
Источник: Бусыгин, Желободько, Цыплаков. Микроэкономика - Третий уровень 2005 702 с.. 2005

Еще по теме 16.5 Статические игры с неполной информацией:

  1. Оглавление
  2. 16.2 Статические игры с полной информацией
  3. Под статической игрой понимают такую игру, в которой все ее участники принимают решения не зная, какие именно решения принимают другие. Обычно в этом случае говорят, что участники принимают решения одновременно, хотя сама по себе одновременность принятия решений в данном случае не важна. Под играми с полной информацией понимаются такие игры, в которых каждый из игроков точно знает характеристики других игроков .
  4. 16.3 Динамические игры с совершенной информацией
  5. 16.4 Динамические игры с несовершенной информацией
  6. 16.5 Статические игры с неполной информацией
  7. СОДЕРЖАНИЕ
  8. 1. Статические игры с полной информацией
  9. 2. Динамические игры с совершенной информацией
  10. 3. Динамические игры с несовершенной информацией