Экономика » Анализ » Модели ограниченной рациональности vs. оптимизационные модели стратегического мышления и обучения в играх

Модели ограниченной рациональности vs. оптимизационные модели стратегического мышления и обучения в играх

Статьи - Анализ
Винсент Кроуфорд
профессор экономики
Оксфордский университет и Университет Калифорнии в Сан-Диего

Неоклассическая микроэкономика стала одним из наиболее успешных направлений в социальных науках. Однако во многих экспериментальных и эмпирических исследованиях проявляются существенные отклонения от ее ключевых поведенческих предпосылок и прогнозов (Selten, 1990; 1998; Thaler, 1992; Rabin, 1998; Frederick et al., 2002; Camerer, 2003; Sobel, 2005; DellaVigna, 2009; Armstrong, Huck, 2010; Crawford et al., 2013)1.

Поскольку эти отклонения имеют вполне очевидные систематические последствия, то, моделируя их и интегрируя эти результаты в микроэкономическую теорию, можно улучшить модели индивидуального принятия решений и стратегического поведения, а также экономический анализ, который на них основан.

Попытки моделировать отклонения от рациональности можно, следуя Харстаду и З^льтену, разделить на две категории. Большую часть моделей в обеих категориях дополняют, допуская существование ошибок в принятии решений, что обычно значимо в эмпирических приложениях. Однако я сосредоточусь на детерминированных структурах моделей, говоря об ошибках в принятии решений лишь в том случае, когда они имеют значение.

К первой категории относятся модели ограниченной рациональности, в которых предпринимается попытка усовершенствовать неоклассический анализ, ослабляя ключевую предпосылку о том, что агенты оптимизируют, в пользу разнообразных осмысленных, прямых характеристик индивидуального принятия решений. Хотя в таких моделях ослабляется предпосылка об оптимизации, во многих из них сохраняются (пусть порой и неявно) обычные неоклассические предпосылки по поводу области определения индивидуальных предпочтений, непротиворечивости целей агентов, адекватности их моделей и выводов, которые агенты делают на их основании2.

Харстад и Зельтен также относят теорию «обучения ориентировке по направлению» (learning direction theory, далее — ТООН) и равновесие в модели импульсного баланса (РИБ) к ограниченно рациональным моделям, и в некотором важном смысле это верно (Selten, Stoecker, 1986; Selten, Buchta, 1999; Selten et al., 2005; Ockenfels, Selten, 2005; Selten, Chmura, 2008; Brunner et al., 2011; Selten et al., 2011). Однако я покажу, что в другом смысле указанные концепции подпадают под вторую категорию моделей, их я буду называть оптимизационными.

Оптимизационные модели сохраняют обычную неоклассическую предпосылку о том, что индивиды действуют так, как будто они что-то оптимизируют. В этих моделях предпринимается попытка улучшить неоклассический анализ, ослабляя или заменяя одну или несколько обычных неоклассических предпосылок. Как отмечают Харстад и Зельтен, оптимизационные модели (в широком смысле), с давних пор играя доминирующую роль в неоклассической микроэкономике, стали преобладать и в современной поведенческой экономике.

В одной области поведенческой теории принятия решений ослабляются обычные неоклассические предпосылки по поводу области определения индивидуальных предпочтений и допускаются предпочтения, зависящие от точки отсчета и реагирующие на изменения в потреблении по отношению к точке отсчета, а также к уровням потребления (Kahneman, Tversky, 1979; Tversky, Kahneman, 1991; Köszegi, Rabin, 2006). В рамках другого направления ослабляются традиционные ограничения на область определения предпочтений и допускаются общественно ориентированные предпочтения и реципрокность, а индивиды реагируют на результаты и/или решения как других агентов, так и собственные (Rabin, 1993; Fehr, Schmidt, 1999; Bolton, Ockenfels, 2000; Andreoni, Miller, 2002; Charness, Rabin, 2002; Sobel, 2005).

В третьей области поведенческой теории принятия решений в оптимизационных моделях ослабляются обычные предпосылки о непротиворечивости индивидуальных целей и допускаются предпочтения, искаженные в отношении настоящего момента, с временной непоследовательностью и конфликтом между немедленным и будущим вознаграждением (Laibson, 1997; O'Donoghue, Rabin, 1999; Frederick et al., 2002). Наконец, еще в одной области ослабляются предпосылки о корректности моделей, используемых агентами, и выводов из них и допускаются различные эвристики и искажения (Tversky, Kahneman, 1974; Rabin, 2002).

В поведенческой теории игр в оптимизационных моделях обучения ослабляется привычная неоклассическая предпосылка о том, что игроки с самого начала игры разыгрывают равновесие по Нэшу, но предполагается, что они следуют простым адаптивным правилам, которые если и могут сойтись к равновесным решениям, то только в пределе. В моделях адаптивного обучения, основанных на представлениях (beliefs) агентов — в отличие от моделей «подкрепляющего» обучения, которые были отнесены к ограниченно рациональным, — подстройка стратегий игроков непосредственно мотивирована оптимизацией, хотя их представления основаны на чрезмерно упрощенных моделях принятия решения другими агентами (Woodford, 1990; Milgrom, Roberts, 1990; 1991; Selten, 1991; Crawford, 1995; Fudenberg, Levine, 1998; Camerer, Ho, 1999; Camerer et al., 2002)3.

В TOOH и РИБ постулируется, что игроки подстраиваются к текущей ситуации, исходя из оптимизационных соображений, хотя в этих моделях нет явного анализа представлений игроков. В этом смысле такие модели ближе к традиционным моделям обучения, основанным на представлениях, чем к большинству моделей ограниченной рациональности (Ockenfels, Selten, 2005).

В приложениях, где из-за отсутствия явных прецедентов простые модели обучения малоубедительны, модели стратегического мышления и первоначальных реакций на игры предполагают ослабление концепции равновесия по Нэшу в пользу моделей k-уровней (Crawford et al., 2013) или когнитивной иерархии (Camerer et al., 2004). В них решения игроков оптимальны при данных представлениях, которые получаются из простой модели инстинктивных реакций других участников на игру и затем подстраиваются путем небольшого числа (k) итераций — наилучших ответов. В других моделях стратегического мышления равновесие по Нэшу ослабляется в пользу равновесия дискретной реакции (РД/) (McKelvey, Palfrey, 1995), в котором решения отдельных игроков характеризуются как «шум» с некоторым заданным распределением, и решение каждого игрока — это наилучший «шумовой» ответ на распределения решений других игроков.

Статья Харстада и Зельтена (Harstad, Selten, 2013)4 полезна тем, что в ней подчеркивается доминирование оптимизационных моделей в современной микроэкономике по сравнению с моделями ограниченной рациональности и ставится под сомнение утверждение, что первые представляют собой более удачный путь развития, чем вторые. По их словам, оптимизационный подход «уже нельзя больше твердо отстаивать как подходящее первое приближение к реальности. Накапливаются все более и более убедительные свидетельства в пользу того, что поведенческие предпосылки, положенные в основу традиционного оптимизационного подхода, неверны и могут серьезно дезориентировать исследователя, направив его по ложному пути. После более подробной разработки неоклассической теории ее серьезные недостатки стали очевидны». Они поясняют, что под «неоклассическими» понимают «поведенческие» оптимизационные модели.

Хотя Харстад и Зельтен весьма скромно преподносят свои предложения по переориентации микроэкономики, считая статью скорее приглашением к действию, нежели критическим комментарием по поводу текущего положения вещей, их вопросы становятся вызовом для оптимизационного подхода. Этот вызов имеет решающее значение для будущего микроэкономики.

Статья Рабина (Rabin, 2013)5 написана в ответ на статью Харстада и Зельтена, и в ней основное внимание уделено вопросам моделирования индивидуальных решений. Рабин утверждает, что хотя микроэкономику иногда можно улучшить, отказываясь от оптимизационных моделей, но сохранять оптимизацию, при этом ослабляя обычные неоклассические предпосылки о предпочтениях или суждениях специфическими, основанными на данных способами (это подход большей части современной поведенческой экономики), может быть продуктивнее во многих приложениях, чем ратовать за всеобщий переход к моделям ограниченной рациональности, связь которых с реальными данными менее очевидна.

В этой статье дан комментарий к работе Харстада и Зельтена и основное внимание уделено моделированию стратегического поведения. Подобно Харстаду, Зельтену и большинству тех, кто применяет теорию игр в микроэкономике, я принимаю за точку отсчета некооперативную теорию игр, в которой начинают с исчерпывающей модели стратегической ситуации и пытаются описать, как игроки реагируют на нее6. Поскольку некооперативные игры — это просто взаимозависимые задачи индивидуального принятия решений, идеи Харстада, Зельтена и Рабина по поводу моделирования индивидуальных решений применимы и к играм. Я буду следовать обычному разделению микроэкономики (на поведенческую и неоклассическую), сосредоточившись на вопросах, затронутых Харстадом и Зельтеном, которые специфичны именно для игр.

Каноническая неоклассическая описательная модель стратегического поведения — равновесие по Нэшу — определяется как комбинация стратегий, по одной для каждого игрока, такая, что стратегия любого игрока максимизирует его ожидаемую полезность, или «платеж» при данных стратегиях других игроков (Myerson, 1999). Предпосылку о том, что игроки будут следовать своим равновесным по Нэшу (далее, если из контекста это ясно, они будут именоваться просто «равновесными») стратегиям, можно обосновать двумя способами (Crawford et al., 2013).

Если у игроков достаточно опыта взаимодействия в близких по структуре играх — теория и экспериментальные результаты свидетельствуют о том, что агенты обычно обучаются предсказывать стратегический выбор тех, с кем они взаимодействуют, причем достаточно хорошо, — то их представления о стратегическом выборе контрагентов сходятся в данной игре к некоторому равновесию по Нэшу7. С учетом такого опыта равновесие можно рассматривать как модель поведения игроков в стационарном состоянии. Однако если у игры не было подходящих прецедентов в прошлом (или вообще не было никаких прецедентов), то при условии, что предпосылка о равновесии обоснованна, она должна получить развитие в модели стратегического мышления для первоначальных реакций игроков на игру. Такая логика может привести игроков к равновесию по Нэшу, если они рациональны в том — относящемся к теории принятия решений — смысле, что оптимизируют ожидаемые полезности, и если у них одинаковые, «рациональные» (подтверждающие сами себя) ожидания или представления о том, как будут играть другие участники (Brandenburger, 1992)8.

Некоторые из обсуждаемых Харстадом, Зельтеном и мною понятий относятся к поведению в стационарном состоянии, при котором обучение возможно, а некоторые — к стратегическому мышлению при первоначальных реакциях. Харстад и Зельтен иллюстрируют необходимость моделей ограниченно рационального стратегического поведения и их потенциальные преимущества, приводя несколько примеров наблюдаемых явлений, которые противоречат объяснениям на основании равновесия по Нэшу. В качестве возможных частичных способов преодоления этих недостатков оптимизационного подхода они предлагают несколько иллюстративных моделей стратегического поведения.

Вероятно, важнейший пример из приведенных Харстадом и Зельтеном — это возникновение пузырей и кризисы на финансовых рынках. Эти явления не могут произойти в общепринятом равновесии рациональных ожиданий (Milgrom, Stokey, 1982; Tirole, 1982). Но они наблюдаются в экспериментальных исследованиях финансового рынка, даже если агенты полностью информированы и, следовательно, информационные выводы на основании решений других игроков не имеют значения (omith et al., 1988; Lei et al., 2001). Исходя из этого, Харстад и Зельтен утверждают, что пузыри и кризисы нельзя объяснить с помощью модели, полностью основанной на оптимизации.

Другой пример — «проклятие победителя», при котором участники аукционов с общей ценностью не могут модифицировать свои оценки при учете информации, которая была бы раскрыта — в логике равновесия по Нэшу, — если бы они выиграли9. В случае выигрыша собственная оценка агента была выше, чем оценки остальных участников, и, следовательно, скорее всего общая ценность объекта была преувеличена. Участники, не способные сделать такие выводы на основании информации, делают ставки выше равновесных, часто теряя деньги, если выигрывают (Сареп et al., 1971; Milgrom, Weber, 1982; Samuelson, Bazerman, 1985; Seltenetal., 2005). Как отмечают Харстад и Зельтен, «проклятие победителя» связано с феноменом — его называют «проклятое равновесие» (Eyster, Rabin, 2005) или «информационная наивность» (Crawford et al., 2013),— при котором агентам не удается сделать правильные выводы из данных о связи между частной информацией и решениями других агентов. Обусловливая стадное поведение, информационная наивность может также усугублять пузыри и кризисы на финансовых рынках (Eyster, Rabin, 2010).

Последний из приводимых Харстадом и Зельтеном примеров касается игр, в которых пространства стратегий настолько велики или сложны, что модель, непосредственно основанная на оптимизации, оказывается малопригодной.

Случай аукционов с независимыми частными оценками и простых матричных игр

Рассмотрим предложенную Зельтеном теорию обучения ориентировке по направлению (Selten, Stoecker, 1986; Selten, Buchta, 1999; Selten et al., 2005) и ее версию для стационарных состояний — равновесие в модели импульсного баланса (Selten et al., 2005; Ockenfels, Selten, 2005; Selten, Chmura 2008; Brunner et al., 2011; Selten et al., 2011) на материале аукционов и матричных игр. ТООН — это простая модель обучения в контекстах, которые позволяют агентам непосредственно учиться на собственном опыте. Предполагается, что игрок не только наблюдает свое решение и полученный в результате выигрыш, но и обладает информацией об игре, достаточной для оценки выигрышей, возможных в результате альтернативных решений. Предполагается, что допустимые решения упорядочены в одном измерении и направления вполне определены. Предполагается далее, что если решение, более «высокое» (и соответственно «низкое»), чем реально избранное, дает более высокий выигрыш, то игрок модифицирует свое решение, двигаясь вверх (вниз).

Информационные требования в ТООН очень близки к возникающим в рассуждениях типа «а что если?», на которых основано обучение, исходящее из представлений агентов, и далеки от требований «подкрепляющего» обучения, когда игроки просто реагируют на реализованные выигрыши от избранных ими действий, не прибегая к контрфактическому рассуждению (Selten et al., 2005). ТООН можно рассматривать как разновидность обучения, исходящего из представлений агентов, в котором игроки оценивают свои оптимальные решения непараметрически (Ockenfels, Selten, 2005)10.

ТООН качественна в том смысле, что в ней заданы границы подстройки, осуществляемой игроками, но не определена величина этой подстройки. Напротив, равновесие в модели импульсного баланса (РИБ) дает количественную характеристику точек покоя в стационарном состоянии, полученных из ТООН. РИБ возникает, когда избранное решение (стохастически) балансирует три импульса: во-первых, если повышение могло бы привести к большему платежу, то возникает импульс скорректировать выбранное действие в сторону повышения; во-вторых, если понижение могло бы привести к большему платежу, то возникает импульс скорректировать выбранное действие в соответствующем направлении; в-третьих, если некое действие привело к отрицательному выигрышу, которого можно было бы избежать снижением, то возникает импульс к соответствующей корректировке действий. Кроме того, если эти три импульса a priori одинаково сильны, то равновесие в модели импульсного баланса можно рассматривать как модель без параметров. Однако веса импульсов играют такую же роль, как неприятие потерь, и иногда оцениваются (Ockenfels, Selten, 2005). В такой интерпретации РИБ эквивалентно равновесию по Нэшу в игре, где платежи переформатированы так, чтобы отражать неприятие потерь. Поэтому а priori нет оснований считать эти веса равными, хотя равные веса соответствуют значению коэффициента неприятия потерь (2), которое близко к оценкам, полученным в других условиях (Brunner et al., 2011).

Информационные требования в РИБ близки к соответствующим требованиям для равновесия по Нэшу, РДР и правилам k-уровней. И хотя Харстад и Зельтен считают ТООН и РИБ теориями ограниченной рациональности, они также основаны на оптимизации — в том же смысле, как и другие модели обучения, исходящие из представлений агентов.

Основной эмпирический вопрос, который призваны решить модели стационарного поведения в играх, вызван тем фактом, что распределения решений агентов обычно чувствительны к внеравновесным платежам (out-of-equilibrium payoffs). Эта чувствительность чаще всего проявляется в аспектах, понятных с точки зрения теории принятия решений: увеличение одного или нескольких внеравновесных платежей, связанных с тем или иным решением, увеличивает вероятность выбора именно этого решения.

В равновесии по Нэшу такая чувствительность отвергается a priori, поскольку внеравновесные платежи не влияют на ожидаемые платежи игрока, который рассчитывает, что другие игроки будут следовать своим равновесным по Нэшу стратегиям. В РДР такая чувствительность отражена в силу предпосылки о том, что решение игрока есть реакция на распределение «шумовых» решений других игроков. Модели ^-уровней и когнитивной иерархии отражают эту чувствительность структурно, смешивая игроков, наилучшим образом реагирующих на различные неравновесные решения (Crawford et al., 2013).

Возникает вопрос: какие из этих концепций стационарных состояний (и других, менее значимых в нашем контексте) лучше всего описывают поведение агентов в разнообразных экспериментальных условиях? В частности, речь идет о закрытых аукционах первой или второй цены с независимыми частными оценками, когда выводы, основанные на информации о решениях других агентов, не имеют значения, а также о простых асимметричных играх/орлянке.

В аукционах первой и второй цены с независимыми частными оценками агенты в экспериментах демонстрируют сильную и устойчивую склонность к завышению ставок по отношению к стандарту риск-нейтрального равновесия по Байесу—Нэшу (Kagel, Levin, 1993; Ockenfels, Selten 2005). Эта склонность сохраняется, даже если имеются широкие возможности для обучения. Напротив, на английских аукционах — прогрессивных аналогах закрытых аукционов второй цены — такой склонности к завышению ставок не наблюдается11.

Если РИБ основано на оптимизации, то как с помощью этой концепции можно объяснить завышение ставок на аукционах второй цены с независимыми частными оценками, где делать ставку в соответствии со своей истинной оценкой — слабо доминирующая стратегия? Ответить на этот вопрос для аукционов как первой, так и второй цены можно, используя асимметрию сигналов обратной связи, которые в виде внеравновесных платежей получают игроки, если их ставки выше или ниже равновесных. На аукционах второй цены, «когда агент теряет деньги, поскольку и его ставка, и вторая по величине ставка превышает его оценку лота, это негативная обратная связь, из которой можно заключить, что агент играет слишком агрессивно. Однако на аукционе второй цены агент может завысить ставку, выиграть и все равно заработать: может так случиться, что ни один из его конкурентов не предложит ставку, находящуюся между завышенной ставкой агента и его собственной оценкой лота. Это может (ошибочно) восприниматься как положительная обратная связь, уравновешивающая негативные эффекты, если ставки не слишком завышены. Подобные явления не возможны на английском аукционе, поскольку там вопрос о завышении ставок не возникает до тех пор, пока цена не достигнет уровня собственной оценки агента, и у него остаются конкуренты» (Harstad, 2000. Р. 262). На аукционах первой цены асимметрия обратной связи иная, но можно показать, что РИБ объясняет склонность завышать оценки и на таких аукционах.

РИБ дает простое объяснение систематических устойчивых форм отклонения от равновесия по Байесу—Нэшу для закрытых аукционов с независимыми частными оценками, и ключевой объясняющий механизм — асимметричные эффекты внеравновесных платежей. Для аукционов второй цены такие эффекты могут объяснить систематические отклонения от доминирующей стратегии.

Если обратиться к асимметричным матричным играм, то сравнительная статика для единственных равновесных по Нэшу значений вероятностей при изменении платежей у игроков разных типов (и тем самым при сохранении игры с нулевой суммой) оказывается интуитивно ожидаемой (с точки зрения теории принятия решений) лишь для игроков одного типа — вероятность выбора «улучшенной» чистой стратегии выше. Однако для игроков другого типа такой очевидности в сравнительной статике нет (Crawford, Smallwood, 1984; Crawford et al., 2013).

В экспериментах агрегированные реакции агентов на такие изменения платежей обычно оказываются интуитивно ожидаемыми (по крайней мере, в слабой форме) для игроков обоих типов, поэтому равновесие по Нэшу обладает плохой прогнозной силой. В РДР, РИБ и моделях k-уровней или когнитивной иерархии удается избежать контринтуитивных выводов12. Учитывая, что равновесие по Нэшу не чувствительно к внеравновесным платежам, кажется удивительным, что с помощью такой концепции стационарного состояния, как РИБ, можно избежать контринтуитивных выводов равновесия по Нэшу и отслеживать наблюдаемую чувствительность агентов к внеравновесным платежам, не предполагая напрямую, что ответы агентов на «шумовые» решения будут наилучшими.

Однако необходимы дальнейшие исследования, чтобы выяснить, отражают точные прогнозы по модели РИБ адекватное описание структуры реакций агентов на сигналы обратной связи или они просто связаны с тем, что в этих играх РИБ имитирует эффекты неприятия потерь. В последнем случае неприятие потерь можно легко встроить в модель равновесия по Нэшу, которая в таком контексте может почти так же точно описывать наблюдаемое поведение, как и РИБ (Brunner, Camerer, Goeree, 2011). Кроме того, необходимо понять, действительно ли феномен завышенных ставок на аукционах второй цены поддается столь механистичному объяснению, как в РИБ, или завышение ставок связано с более глубокими когнитивными ограничениями (неспособностью или нежеланием строить рассуждения с учетом будущих событий).

Нужно найти определения понятия РИБ для игр, в которых допустимые решения не упорядочены в каком-то одном измерении, чтобы комбинацию в замках РИБ идей из оптимизационных моделей и моделей ограниченной рациональности можно было распространить на класс игр, почти столь же общий, как и тот, для которого применяется равновесие по Нэшу. Если окажется, что у этой задачи есть решение, то я предполагаю, что его найдут, анализируя, как игроки в таких играх могут непараметрически оценивать свои оптимальные решения — адаптивно или в стационарном состоянии.

Пузыри и кризисы на финансовых рынках

Пузыри и кризисы не могут наблюдаться в общепринятых моделях равновесия с рациональными ожиданиями (Milgrom, Stokey, 1982; Tirole, 1982). Однако в экспериментах с полностью информированными участниками они все же возникают (Smith et al., 1988; Lei et al., 2001). Исходя из этого, Харстад и Зельтен утверждают, что пузыри и кризисы нельзя объяснить с помощью модели, целиком основанной на оптимизации. По их словам, пузыри и кризисы на таких рынках трудно согласовать как с моделями поведенческой экономики и моделями k-уровня, так и с неоклассическими моделями мейнстрима.

Однако результаты, исключающие появление пузырей и кризисов, возможны при крайне жестких предпосылках о всеобщем знании (на которых основано равновесие рациональных ожиданий) в сочетании с предпосылкой об оптимизации. Существуют модели, способные объяснять пузыри и кризисы. Часть этих моделей оптимизационные, но допускают наличие гетерогенных представлений у агентов (Barberis, Thaler, 2003; Brunnermeier, Oehmke, 2013; Xiong, 2013).

Сложно найти модель (оптимизационную или какую-то еще), в которой поведенческие предпосылки хорошо обоснованы реальными данными и которая не просто согласуется с наличием пузырей и кризисов, но и дает конкретные прогнозы, позволяющие объяснять наблюдаемые эмпирические закономерности. Для объяснения эмпирических закономерностей — пузырей и кризисов — можно использовать оптимизационную модель, ослабляя предпосылки о всеобщем знании в пользу структурной модели с агентами, имеющими различные представления. Это, по-видимому, соответствует эмпирическим данным13.

Существуют значительные эмпирические свидетельства, восходящие к экспериментальным исследованиям повторяющейся конечное число раз «дилеммы заключенного» (Selten, Stoecker, 1986), что лишь незначительная доля агентов рассматривает будущие последствия своих текущих решений на горизонте, достаточно длительном для того, чтобы подтвердилось эпистемическое обоснование отсутствия пузырей. Игра «дилемма заключенного», проигрываемая конечное число раз, имеет единственное равновесие по Нэшу (совершенное в подыграх или нет), в котором игроки отклоняются от кооперативного решения в каждом периоде, не обращая внимания на историю игры. Однако эксперименты показали, что большинство выбирает кооперативную стратегию вплоть до последних периодов десятипериодной игры; точный момент отклонения от кооперативной стратегии различается для разных игроков. Отклонившись один раз, они скорее всего не вернутся к кооперации, и к концу игры отклоняется все большее число агентов (Selten, Stoecker, 1986). Эти закономерности позволяют построить модель, в которой агенты рассматривают будущие последствия своих текущих решений, но лишь на несколько ходов вперед, на ближнем горизонте (он различный для разных агентов) — возможно, в силу когнитивных ограничений или предполагая наличие таких ограничений у других агентов и т. д. Выяснилось, что, если десятипериодная игра целиком повторяется, то агенты раньше начинают отклоняться от кооперативной стратегии (Selten, Stoecker, 1986). Именно это наблюдение легло в основу ТООН.

Похожие закономерности — различия в том, в какой степени агенты рассматривают будущие последствия своих текущих действий — наблюдались и в экспериментах, организованных с целью спровоцировать первоначальные реакции агентов в трехпериодных играх торга с изменяющимися условиями сделки (Johnson et al., 2002). Такие результаты объясняются в рамках структурной модели, в которой агенты просчитывают на небольшое (и разное) число ходов вперед, следуя оптимизационным правилам, которые зависят от горизонта планирования того или иного игрока.

Подобная оптимизационная модель финансовых рынков имела бы более прочные поведенческие основания и могла бы помочь объяснить наличие пузырей и кризисов. Хотя объяснения с позиций ограниченной рациональности возможны, но мне неизвестны данные, которые могли бы обосновать выбор в пользу одной из многих возможных моделей такого рода.

«Проклятие победителя» и информационная наивность

На аукционах с общей ценностью выводы, основанные на информации о решениях других игроков, играют ключевую роль в назначении оптимальных ставок — равновесных или каких-то других (Capen et al., 1971; Milgrom, Weber, 1982; Samuelson, Bazerman, 1985; Selten et al., 2005). Существует объяснение «проклятия победителя» в терминах ТООН и РИБ (Selten et al., 2005). Однако пока неясно, действительно этот феномен есть механическое следствие импульсного баланса или он обусловлен свойствами человеческого познания (неспособностью или нежеланием строить рассуждения с учетом будущих событий).

Харстад и Зельтен признают, что существует правдоподобный оптимизационный анализ «проклятия победителя» в модели «проклятого равновесия» (Eyster. Rabin, 2005), в которой агенты не полагаются целиком на возможные корреляции между решениями и частной информацией других игроков, но в остальном следуют логике равновесия по Байесу—Нэшу. «Проклятое равновесие» — хороший вариант модели стационарных состояний, если агенты действительно не учитывают взаимосвязь между решениями других игроков и их — этих игроков — частной информацией.

Представляется, что в большинстве случаев «проклятие победителя» и информационную наивность можно успешно описать при помощи оптимизационных моделей. При этом для определенных классов игр модели «проклятого равновесия» и k-уровней плохо согласуются с экспериментальными данными (Charness, Levin, 2009). Это означает, что необходимо больше внимания уделять когнитивным ограничениям. Ни оптимизационные модели, ни модели ограниченной рациональности в настоящее время не дают удовлетворительного анализа таких ограничений в подобных контекстах — для обоих подходов это и вызов, и новые возможности.

Игры с большими и сложными пространствами стратегий

Харстад и Зельтен обсуждают также проблематику игр, в которых пространства стратегий слишком велики и сложны, чтобы оптимизационные модели работали в них. Они сосредоточиваются на экспериментальном и теоретическом анализе игр типа «полковник Блотто» (Arad, Rubinstein, 2012). Еще более характерная иллюстрация — шахматы (Ewerhart, 2000), в которых равновесие находится при условии, что слабо доминируемые стратегии последовательно устраняются за два раунда. Таким образом, если руководствоваться обычными критериями, то игра в шахматы имеет чрезвычайно простую стратегическую структуру. Отсюда становится ясно, что основная трудность этой игры состоит в колоссальном объеме и сложности пространств стратегий.

Харстад и Зельтен предлагают поведенческую модель стратегического мышления (развивая идеи, предложенные в: Selten et al., 2012; Arad, Rubinstein, 2012). В ней игроки сначала разбивают свои пространства стратегий на несколько обозримых измерений, абстрагируясь от других аспектов своих стратегий. Затем они применяют некий формат рассуждения, например модель k-yровней (Crawford et al., 2013) или когнитивной иерархии (Camerer et al., 2004), но переходя от измерения к измерению в упрощенной игре. Таким образом, эта модель представляет собой гибрид из ограниченно рационального и оптимизационного подходов.

Предлагаемый Харстадом и Зельтеном подход может стать многообещающей попыткой решить трудную задачу моделирования стратегического мышления в реалистичных и сложных ситуациях. Но, как известно, необходимо еще приложить много усилий для того, чтобы этот подход можно было использовать и чтобы он сравнялся по точности, общности и применимости в различных играх с моделями равновесия по Нэшу. Главное препятствие для этого связано с принципами, на которых основано осуществляемое игроками упрощение. Помочь преодолеть эту трудность могли бы теория аналогий (см: Mullainathan, 2000; Gabaix, 2011; Samuelson, 2001) и интеграция модели аналогий в общую модель стратегического поведения (Jehiel, 2005). Мне кажется не случайным, что во всех этих моделях небольшие «порции» ограниченной рациональности смешаны с крупными «дозами» оптимизации.

 


 

Заслуга Харстада и Зельтена состоит в том, что они обозначили преобладание в современной микроэкономике оптимизационных моделей, а не моделей ограниченной рациональности, и усомнились в том, что первые представляют собой более удачный путь, чем вторые. Я попытался поместить предлагаемые ими примеры в более широкий контекст, указать на (преимущественно оптимизационные) модели, предложенные для решения поставленных задач, и выявить возможные проблемы и пути развития теории.

Концепция равновесия по Нэшу доминирует в анализе стратегического поведения в социальных науках, поскольку она имеет важные преимущества — простота, точность в формулировке прогнозов, возможности обобщения и применимости в различных играх (Myerson, 1999). Тот, кто хочет добиться успеха в конкуренции с этой концепцией, должен предложить более точный анализ стратегического поведения, явным или неявным образом обнаруживая и моделируя систематические отклонения от равновесия по Нэшу, но при этом сохранив большую часть его преимуществ.

Среди конкурентов равновесия по Нэшу, обсуждаемых мною и Харстадом и Зельтеном, — моделей k-уровней и когнитивной иерархии, кратко описанной выше модели ограниченного предвидения на финансовых рынках, модели стратегического мышления в играх с большими или сложными пространствами стратегий, — все имеют предпосылку о том, что игроки оптимизируют. ТООН и РИБ являются оптимизационными концепциями в более широком смысле: в них оптимизация используется как обоснование модификации и подстройки агентами своих стратегий, но не в качестве непосредственного основания их стратегического выбора. РДР и концепция «проклятого равновесия» основаны на оптимизации и сохраняют (в разном смысле) идею рациональных ожиданий.

Хотя Харстад и Зельтен могут считать преобладание оптимизационных моделей — даже в этой дискуссии об ограниченной рациональности — просто аргументом в пользу их позиции, я считаю, что такое положение вещей вытекает из всего, что мы пытаемся сделать, поэтому едва ли его стоит оценивать негативно. В большинстве ситуаций возникает огромное количество логически возможных моделей — оптимизации или ограниченной рациональности, которые отличаются от неоклассических. Пытаясь усовершенствовать инструментарий, мы должны выработать некий принципиальный метод выбора между разными вариантами. Современная поведенческая экономика и поведенческая теория игр позволяют отбирать модели, строго соотнося их предпосылки с экспериментальными и эмпирическими данными о предпочтениях, оценках, обучении, стратегическом мышлении и — в более общем плане — о познании.

Конечно, непосредственные характеристики индивидуального поведения, на которых построены модели ограниченной рациональности, также основаны на реальных данных о когнитивных процессах и поведении. Но чтобы двигаться вперед, сторонники моделирования ограниченной рациональности должны отыскать относительно более убедительные, эмпирически обоснованные способы выбора между возможными моделями неоптимизирующего поведения. Я думаю, что это будет более сложной задачей, чем поиск эмпирических подтверждений оптимизационных отклонений от неоклассических моделей, поскольку стандарт, задаваемый парадигмой оптимизации, помогает собирать реальные данные.

Чтобы улучшить неоклассические модели, нужно выявить систематические отклонения от них, иначе лучше оставить все как есть и пользоваться более «шумной» неоклассической версией. Поведенческая теория принятия решений построена на таких систематических отклонениях. Эмпирическая закономерность: поведение подавляющего большинства людей либо искажено «неоклассически», либо смещено в пользу настоящего, но очень редко — в пользу будущего. Другая закономерность: подавляющее большинство агентов характеризуется либо неоклассическими предпосылками, либо неприятием убытков, но очень редко — неприятием выгод и т. д. Эти поведенческие искажения и смещения были бы незаметны для исследователей в отсутствие неоклассического, оптимизационного стандарта, относительно которого их можно было бы измерить.

Поведенческая теория игр также основана на систематических отклонениях. В частности, модели k-уровней и когнитивной иерархии в стратегическом мышлении основаны на эмпирической закономерности, согласно которой люди не способны или не желают прибегать к рассуждениям, связанным с поиском неподвижных точек или с неопределенным числом итераций (такие рассуждения часто требуются для осмысленного обоснования равновесий по Нэшу или Байесу). Экспериментальные (и некоторые полевые) данные свидетельствуют о том, что именно поэтому люди часто прибегают к использованию правил k-yровня, соотносящих их представления с простой моделью первоначальных реакций других игроков на игровую ситуацию, а затем модифицируют свои представления, используя небольшое число (k) итеративных наилучших ответов (Costa-Gomes, Crawford, 2006; Crawford et al., 2013). Но вряд ли исследователи искали бы данные о способности или желании индивидов прибегать к рассуждениям, связанным с поиском неподвижных точек или с неопределенным числом итераций, если бы такие рассуждения не фигурировали в теории равновесия по Нэшу. Однако уклонение от таких рассуждений чревато важными последствиями для стратегического поведения, и использование особой поведенческой модели позволяет лучше понять ситуации, в которых равновесие по Нэшу не описывает наблюдаемые феномены (Crawford et al., 2013).

По всем этим причинам мне кажется, что ключевая задача — изучать, как наилучшим образом специфицировать оптимизационные модели и как использовать их в приложениях. При этом Харстад и Зельтен правы в том, что недостатки оптимизационных моделей делают их уязвимыми по сравнению с моделями ограниченной рациональности. Но есть и другая задача — найти эмпирически обоснованные модели ограниченной рациональности, для которых характерны точность, легкость обобщения и применимость в различных контекстах. Если эта задача будет решена, то такие модели станут достойным конкурентом равновесия по Нэшу.

Перевод с английского И. Болдырева


1 Здесь и далее я не претендую на то, чтобы дать исчерпывающие ссылки, и предпочитаю цитировать сравнительно свежие обзоры, если таковые имеются. Моя цель - дать читателям начальные сведения об огромном массиве соответствующей литературы.

2 Примеры моделей ограниченной рациональности см. в: Simon, 1955; Cyert, March, 1963; Newell, Simon, 1972; Nelson, Winter, 1982; Rubinstein, 1998. Содержательные обсуждения см. в: Hogarth, Recler, 1986; Selten, 1990; 1998; Conlisk, 1996; Munier et al., 1999; Spießler, 2011a; 2011b. Примеры ограниченно рациональных моделей стратегического поведения см. в: Rosenthal, 1989; Rubinstein, 1998; Young, 2004; в контексте «подкрепляющего» обучения см. в: Roth, Erev, 1995; Erev, Roth, 1998.

3 Я не обсуждаю здесь модели «рационального обучения», в которых предполагается равновесие в игре, описывающее процесс обучения целиком, поскольку модели адаптивного обучения эмпирически гораздо более полезны.

4 Рус. пер. см. в этом номере журнала. С. 5 26. Примеч. ред.

5 Рус. пер. см. в этом номере журнала. С. 45 — 65. — Примеч. ред.

6 Альтернативой была бы кооперативная теория игр, в которой нет необходимости уточнять детали стратегической ситуации, поскольку предполагается, что в любом случае игроки достигнут Парето-эффективного соглашения. В условиях преобладания в микроэкономике некооперативной теории игр важное исключение составляет (в основном) кооперативная теория рынков поиска и подбора, но аспекты моделирования поиска и подбора в данной дискуссии непосредственно не обсуждаются.

7 В этом утверждении опущены некоторые подробности, значимые только для игр в развернутой форме.

8 Модель равновесия дает гораздо более точные прогнозы, чем только предпосылка, что агенты оптимизируют, имея некие заданные представления. Если не требовать, чтобы представления подтверждали сами себя, то даже из общего знания о том, что игроки оптимизируют, следует лишь рационализируемость их стратегий (Bernheim, 1984; Реагсе, 1984), а поведение часто остается совершенно неопределенным.

9 В аукционах с независимыми частными оценками такие выводы на основании информации не имеют значения.

10 Аналогичный подход к моделированию обучения в координационных играх (заимствованный из литературы по инженерному адаптивному управлению благодаря работе: Woodford, 1990) см. в: Crawford, 1995.

11 Объяснение феномена завышения ставок в аукционах второй цены с независимыми частными оценками в духе ТООН и РИБ, основанное на работе (Kagel et al., 1987), см. в: Harstad, 2000. Похожее объяснение завышенных ставок для аукционов первой цены, основанное на РИБ, см. в: Ockenfels, Selten, 2005.

12 В результате РДР и РИБ примерно одинаково точны, и обе концепции существенно лучше равновесия по Нэшу (Brunner et al., 2011).

13 Модель, которая имеется в виду, примерно похожа на представленную в: Morris et al., 1995, но я предлагаю заменить их эпистемические рассуждения более простой моделью поведения, которая, как мне кажется, имеет более прочные поведенческие основания. См. также: Abreu, Brunnermeier, 2003. Харстад и Зельтен не предлагают никакой специальной модели пузырей и кризисов.


Список литературы

Abreu D., Brunnermeier М. К. (2003). Bubbles and Crashes // Econometrica. Vol. 71, No 1. P. 173-204.

Andreoni J., Miller J. (2002). Giving According to GARP: An Experimental Test of the Consistency of Preferences for Altruism // Econometrica. Vol. 70, No 2. P. 737-753.

Arad A., Rubinstein А. (2012). Multi-dimensional Iterative Reasoning in Action: The Case of the Colonel Blotto Game // Journal of Economic Behavior and Organization. Vol. 84, No 2. P. 571-585.

Armstrong M., Huck S. (2010). Behavioral Economics as Applied to Firms: A Primer // Competition Policy International. Vol. 6, No 1. P. 3 — 45.

Barberis N., Thaler R. (2003). A Survey of Behavioral Finance // Handbook of the Economics of Finance. Vol. IB. Financial Markets and Asset Pricing / G. M. Constan-tinides, M. Harris, R. Stulz (eds.). Amsterdam; L.; N. Y.: Elsevier, North Holland.

Bernheim В. D. (1984). Rationalizable Strategic Behavior // Econometrica. Vol. 52, No 4. P. 1007-1028.

Bolton G. E., Ockenfels A. (2000). ERC: A Theory of Equity, Reciprocity, and Competition // American Economic Review. Vol. 90, No 1. P. 166 — 193.

Brandenburger A. (1992). Knowledge and Equilibrium in Games // Journal of Economic Perspectives. Vol. 6, No 4. P. 83-101.

Brunner Ch., Camerer C. F., Goeree J. K. (2011). Stationary Concepts for Experimental 2x2 Games: Comment // American Economic Review. Vol. 101, No 2. P. 1029-1040.

Brunnermeier M. K., Oehmke M. (2013). Bubbles, Financial Crises, and Systemic Risk // Handbook of the Economics of Finance. Vol. 2, Part В / G. M. Constan-tinides, M. Harris, R. Stulz (eds.). Amsterdam; L.; N. Y.: Elsevier, North Holland.

Camerer C. F. (2003). Behavioral Game Theory: Experiments in Strategic Interaction. Princeton: Princeton University Press; N. Y.: Sage.

Camerer C. F., Ho T.-H. (1999). Experience-Weighted Attraction Learning in Normal Form Games // Econometrica. Vol. 67, No 4. P. 827-874.

Camerer C. F., Ho T.-H., Chong J.-K. (2002). Sophisticated Experience-Weighted Attraction Learning and Strategic Teaching in Repeated Games // Journal of Economic Theory. Vol. 104, No 1. P. 137-188.

Camerer C. F., Ho Т. Н., Chong J.-K. (2004). A Cognitive Hierarchy Model of Games // Quarterly Journal of Economics. Vol. 119, No 3. P. 861-898.

Capen E. СClapp R. V., Campbell W. M. (1971). Competitive Bidding in High-Risk Situations // Journal of Petroleum Technology. Vol. 23, No 6. P. 641 — 653.

Charness G., Levin D. (2009). The Origin of the Winner's Curse: A Laboratory Study // American Economic Journal: Microeconomics. Vol. 1, No 1. P. 207—236.

Charness G. Rabin M. (2002). Understanding Social Preferences with Simple Tests // Quarterly Journal of Economics. Vol. 117, No 3. P. 817—869.

Conlisk J. (1996). Why Bounded Rationality? // Journal of Economic Literature. Vol. 34, No 2. P. 669-700.

Costa-Gomes M. A., Crawford V. P. (2006). Cognition and Behavior in Two-Person Guessing Games: An Experimental Study // American Economic Review. Vol. 96, No 5. P. 1737-1768.

Crawford V. P. (1995). Adaptive Dynamics in Coordination Games // Econometrica. Vol. 63, No 1. P. 103-143.

Crawford V. P., Costa-Gomes M. A., Iriberri N. (2013). Structural Models of Non-equilibrium Strategic Thinking: Theory, Evidence, and Applications // Journal of Economic Literature. Vol. 51, No 1. P. 5 — 62.

Crawford V. P., Smallwood D. (1984). Comparative Statics of Mixed-Strategy Equilibria in Noncooperative Two-Person Games // Theory and Decision. Vol. 16, No 3. P. 225-232.

Cyert R. M., March J. G. (1963). A Behavioral Theory of the Firm. N. Y.: Prentice Hall.

DellaVigna S. (2009). Psychology and Economics: Evidence from the Field // Journal of Economic Literature. Vol. 47, No 2. P. 315-372. [рус. пер.: Делавинья С. (2011). Психология и экономика: результаты эмпирических исследований // Вопросы экономики. № 4. С. 47-77; № 5. С. 56-74; № 6. С. 82-106.]

Erev /., Roth А. Е. (1998). Predicting How People Play Games: Reinforcement Learning in Experimental Games with Unique, Mixed Strategy Equilibria //' American Economic Review. Vol. 88, No 4. P. 848-881.

Ewerhart Ch. (2000). Chess-like Games Are Dominance Solvable in at Most Two Steps // Games and Economic Behavior. Vol. 33, No 1. P. 41—47.

Eyster E. Rabin M. (2005). Cursed Equilibrium // Econometrica. Vol. 73, No 5. P. 1623-1672.

Eyster E., Rabin M. (2010). Naive Herding in Rich-Information Settings // American Economic Journal: Microeconomics. Vol. 2, No 4. P. 221—243.

Fehr E.y Schmidt К. M. (1999). A Theory of Fairness, Competition, and Cooperation // Quarterly Journal of Economics. Vol. 114, No 3. P. 817 — 868.

Frederick S., Loewenstein G. O'Donoghue T. (2002). Time Discounting and Time Prefe-rence: A Critical Review // Journal of Economic Literature. Vol. 40, No 2. P. 351-401.

Fudenberg D., Levine D. K. (1998). The Theory of Learning in Games. Cambridge, MA; L.: MIT Press.

Gabaix X. (2011). A Sparsity-Based Model of Bounded Rationality // National Bureau of Economic Research Working Paper. No 16911.

Harstad R. M. (2000). Dominant Strategy Adoption and Bidders' Experience with Pricing Rules // Experimental Economics. Vol. 3, No P. 261—280.

Harstad R. M., Selten R. (2013). Bounded-Rationality Models: Tasks to Become Intellectually Competitive // Journal of Economic Literature. Vol. 51, No 2. P. 496—511. [Рус. пер.: Харстад P. M., Зельтен P. (2014). Модели ограниченной рациональности: пути достижения интеллектуальной конкурентоспособности // Вопросы экономики. № 5. С. 5—26.]

Hogarth R. М. Reder М. W. (eds.) (1986). Rational Choice: The Contrast between Economics and Psychology. Chicago; L.: University of Chicago Press.

Jehiel Ph. (2005). Analogy-Based Expectation Equilibrium // Journal of Economic Theory. Vol. 123, No 2. P. 81-104.

Johnson E. J., Camerer C. F., Sen S., Rymon T. (2002). Detecting Failures of Backward Induction: Monitoring Information Search in Sequential Bargaining // Journal of Economic Theory. Vol. 104, No 1. P. 16-47.

Kagel J. H., Harstad R. M., Levin D. (1987). Information Impact and Allocation Rules in Auctions with Affiliated Private Values: A Laboratory Study // Econometrica. Vol. 55, No 6. P. 1275-1304.

Kagel J. H.y Levin D. (1993). Independent Private Value Auctions: Bidder Behaviour in First-, Second- and Third-Price Auctions with Varying Numbers of Bidders // Economic Journal. Vol. 103, No 419. P. 868-879.

Kahneman D., Tversky A. (1979). Prospect Theory: An Analysis of Decision under Risk // Econometrica. Vol. 47, No 2. P. 263-292.

Köszegi В., Rabin M. (2006). A Model of Reference-Dependent Preferences // Quarterly Journal of Economics. Vol. 121, No 4. P. 1133-1165.

Laibson D. (1997). Golden Eggs and Hyperbolic Discounting // Quarterly Journal of Economics. Vol. 112, No 2. P. 443-477.

Lei V., Noussair Ch. N. Plott Ch. R. (2001). Nonspeculative Bubbles in Experimental Asset Markets: Lack of Common Knowledge of Rationality vs. Actual Irrationality // Econometrica. Vol. 69, No 4. P. 831 — 859.

McKelvey R. D., Palfrey T. R. (1995). Quantal Response Equilibria for Normal Form Games // Games and Economic Behavior. Vol. 10, No 1. P. 6 — 38.

Milgrom P. R. Roberts J. (1990). Rationalizability, Learning, and Equilibrium in Games with Strategic Complementarities // Econometrica. Vol. 58, No 6. P. 1255 — 1277.

Milgrom P. R. Roberts J. (1991). Adaptive and Sophisticated Learning in Normal Form Games // Games and Economic Behavior. Vol. 3, No 1. P. 82 — 100.

Milgrom P. R., Stokey N. (1982). Information, Trade and Common Knowledge // Journal of Economic Theory. Vol. 26, No 1. P. 17-27.

Milgrom P. R., Weber R. J. (1982). A Theory of Auctions and Competitive Bidding // Econometrica. Vol. 50, No 5. P. 1089-1122.

Morris S., Postlewaite A. Shin H. S. (1995). Depth of Knowledge and the Effect of Higher Order Uncertainty // Economic Theory. Vol. 6, No 3. P. 453-467.

Mullainathan S. (2000). Thinking through Categories. Mimeo.

Munier В. et al. (1999). Bounded Rationality Modeling // Marketing Letters. Vol. 10, No 3. P. 233-248.

Myerson R. B. (1999). Nash Equilibrium and the History of Economic Theory // Journal of Economic Literature. Vol. 37, No 3. P. 1067 — 1082. [рус. пер.: Майерсон P. (2010). Равновесие по Нэшу и история экономической науки // Вопросы экономики. № 6. С. 26—42.]

Nelson R. R., Winter S. G. (1982). An Evolutionary Theory of Economic Change. Cambridge, MA; London: Harvard University Press, [рус. пер.: Нельсон P., Уинтер С. (2002). Эволюционная теория экономических изменений. М.: Дело.]

Newell А., Simon Н. А. (1972). Human Problem Solving. N.Y.: Prentice Hall.

Ockenfels A., Selten R. (2005). Impulse Balance Equilibrium and Feedback in First Price Auctions // Games and Economic Behavior. Vol. 51, No 1. P. 155 — 170.

O'Donoghue Т., Rabin M. (1999). Doing It Now or Later // American Economic Review. Vol. 89, No 1. P. 103-124.

Pearce D. G. (1984). Rationalizable Strategic Behavior and the Problem of Perfection // Econometrica. Vol. 52, No 4. P. 1029-1050.

Rabin M. (1993). Incorporating Fairness into Game Theory and Economics // American Economic Review. Vol. 83, No 5. P. 1281-1302.

Rabin M. (1998). Psychology and Economics // Journal of Economic Literature. Vol. 36, No 1. P. 11-46.

Rabin M. (2002). Inference by Believers in the Law of Small Numbers // Quarterly Journal of Economics. Vol. 117, No 3. P. 775 — 816.

Rabin M. (2013). Incorporating Limited Rationality into Economics // Journal of Economic Literature. Vol. 51, No 2. P. 528-543. [Рус. пер.: Рабин M. (2014). Интеграция ограниченной рациональности в экономическую науку // Вопросы экономики. № 5. С. 45 — 65.]

Rosenthal R. W. (1989). A Bounded-Rationality Approach to the Study of Non-cooperative Games // International Journal of Game Theory. Vol. 18, No 3. P. 273-291.

Roth A. E., Erev I. (1995). Learning in Extensive-Form Games: Experimental Data and Simple Dynamic Models in the Intermediate Term // Games and Economic Behavior. Vol. 8, No 1. P. 164-212.

Rubinstein A. (1998). Modeling Bounded Rationality. Cambridge, MA; L.: MIT Press.

Samuelson L. (2001). Analogies, Adaptation, and Anomalies // Journal of Economic Theory. Vol. 97, No 2. P. 320-366.

Samuelson W. F., Bazerman M. H. (1985). The Winner's Curse in Bilateral Negotiations // Research in Experimc Чаї Economics. Vol. З / V. Smith (ed.). Greenwich, Conn.: J AI Press.

Selten R. (1990). Bounded Rationality // Journal of Institutional and Theoretical Economics. Vol. 146, No 4. P. 649-658.

Selten R. (1991). Anticipatory Learning in Two-Person Games // Game Equilibrium Models I: Evolution and Game Dynamics / R. Selten (ed.). N. Y.; Berlin; L.; Tokyo: Springer.

Selten R. (1998). Features of Experimentally Observed Bounded Rationality // European Economic Review. Vol. 42, No 3 — 5. P. 413 — 436.

Selten R. Abbink КCox R. (2005). Learning Direction Theory and the Winner's Curse // Experimental Economics. Vol. 8, No 1. P. 5—20.

Selten R., Buchta J. (1999). Experimental Sealed Bid First Price Auctions with Directly Observed Bid Functions // Games and Human Behavior: Essays in Honor of A. Rapoport / D. V. Budescu et al. (eds.). Mahwah, NJ: Lawrence Erlbaum Associates.

Selten R.y Chmura Th. (2008). Stationary Concepts for Experimental 2x2 Games // American Economic Review. Vol. 98, No 3. P. 938 — 966.

Selten R. Chmura Th., Goerg S. J. (2011). Stationary Concepts for Experimental 2x2 Games: Reply // American Economic Review. Vol. 101, No 2. P. 1041 — 1044.

Selten RPitt пешек S. Höhnisch M. (2012). Dealing with Dynamic Decision Problems when Knowledge of the Environment Is Limited: An Approach Based on Goal Systems // Journal of Behavioral Decision Making. Vol. 25, No 5. P. 443-457.

Selten R. Stoecker R. (1986). End Behavior in Sequences of Finite Prisoner's Dilemma Supergames: A Learning Theory Approach // Journal of Economic Behavior and Organization. Vol. 7, No 1. P. 47-70.

Simon H. A. (1955). A Behavioral Model of Rational Choice // Quarterly Journal of Economics. Vol. 69, No 1. P. 99-118.

Smith V. L. Suchanek G. L., Williams A. W. (1988). Bubbles, Crashes, and Endogenous Expectations in Experimental Spot Asset Markets // Econometrica. Vol. 56, No 5. P. 1119-1151.

Sobel J. (2005). Interdependent Preferences and Reciprocity // Journal of Economic Literature. Vol. 43, No 2. P. 392-436.

SpiegleK R. (2011a). Bounded Rationality and Industrial Organization. Oxford; N.Y.: Oxford University Press.

SpiegleK R. (2011b). 'But Can't We Get the Same Thing with a Standard Model?' Rationalizing Bounded-Rationality Models // Economic and Philosophy. Vol. 27, No 1. P. 23-43.

ThaleK R. H. (1992). The Winner's Curse: Paradoxes and Anomalies of Economic Life. Princeton; Chichester, U.K.: Princeton University Press.

Тікоіе J. (1982). On the Possibility of Speculation under Rational Expectations // Econometrica. Vol. 50, No 5. P. 1163-1181.

TveKsky A., Kahneman D. (1974). Judgment under Uncertainty: Heuristics and Biases // Science. Vol. 185, No 4157. P. 1124-1131.

TveKsky A., Kahneman D. (1991). Loss Aversion in Riskless Choice: A Reference-Dependent Model // Quarterly Journal of Economics. Vol. 106, No 4. P. 1039-1061.

WoodfoKd M. (1990). Learning to Believe in Sunspots // Econometrica. Vol. 58, No 2. P. 277-307.

Xiong W. (2013). Bubbles, Crises, and Heterogeneous Beliefs // Handbook on Systemic Risk / J.-P. Fouque, J. A. Langsam (eds.). Cambridge: Cambridge University Press.

Young H. P. 2004. Strategic Learning and Its Limits. Oxford: Oxford University Press.