Спецпроекты
Создана математическая модель нерационального поведения игроков в «Дилемме Заключённого»
Создана математическая модель нерационального поведения игроков в «Дилемме Заключённого»
Новости
отправить
Задать вопрос
по материалу
 

Вместе веселее

Создана математическая модель нерационального поведения игроков в «Дилемме Заключённого»

В Лаборатории экспериментальной экономики Московского физтеха построили теоретическую модель, описывающую преобладание выбора кооперативных стратегий в игре, изначально предполагающей выгоду индивидуального поведения.

Сильные отклонения участников от рационального поведения были замечены в «Дилемме Заключённого» — известной стратегической игре из теории игр. После знакомства и недолгого общения участников эксперимента уровень их кооперации значительно повысился.

Название «Дилемма Заключённого» дал канадский математик Альберт Такер по классическому примеру из уголовной практики. Вот, скажем, поймали двух сообщников преступления: что им выгоднее, выдать товарища или молчать? Допрашвают их отдельно друг от друга. Разумеется, следователь обещает каждому свободу, если он наговорит на напарника. Но кто из них знает, что делает другой? Если же они вдвоём наговорят друг на друга, то обоим впаяют по максимуму: за сообщничество полагается наказывать намного строже, чем за преступные действия в одиночку. Чтобы получить поменьше, им обоим лучше продолжить сообщничать и молчать. Но если каждый заботится в первую очередь о себе, то рациональнее предать — можно случайно выйти на свободу. Но если не повезёт, закончиться для них двоих это может самым худшим образом. В этом и заключается дилемма.

Теория игр — наука о принятии решений, математический метод изучения оптимальных стратегий в играх, где игроки обладают разными интересами и могут действовать нерационально. Её методики активно используются в экономике, политологии, психологии и многих других социальных сферах жизни.

В каждом из восьми экспериментов приняло участие по 12 игроков – студентов МФТИ. Всего было задействовано 96 человек: 59 юношей и 37 девушек. В исследовании применялись методы экспериментальной экономики. Она позволяет выявлять модели поведения людей в определенных социально-экономических ситуациях, понимать влияние одних событий и факторов на другие, прослеживать логику принятия решения в разных экономических областях.

Все студенты МФТИ были незнакомы, и сначала действовали по стандартной схеме выбора стратегий в игре «Дилемма Заключённого». Участникам предлагалось анонимно взаимодействовать друг с другом посредством двух действий: кооперировать (К) или предавать (П). По правилам игры, если один игрок выбирает «К», а другой «П», предатель получает 10 очков, а кооператор - 0. Если оба игрока выбирают «К», каждому достаётся по 5 очков, а если оба «П» - каждый получает всего по 1 очку. Зная правила, можно понять, что кооперироваться выгодно, хотя с точки зрения математики рациональнее выбрать предательство. Именно такая ситуация является в данной игре равновесием по Нэшу, то есть математически верной стратегией, названной именем автора — нобелевского лауреата Джона Форбса Нэша.

Отклонение от равновесия Нэша не приводит к увеличению выигрыша, если другие участники игры не меняют своих стратегий. В начале игры уровень кооперации в группах составил в среднем 21%, то есть участники скорее выбирали рациональную стратегию предательства. Но после знакомства и «социализации» средний уровень кооперации у них увеличился до 53% и выше, то есть участники сильно отклонялись от равновесия Нэша.

Расчёты учёных показали, что поведение участников до социализации может быть описано с помощью модели Quantal Response Equilibrium (QRE). Концепция QRE возникла на стыке теории игр и экспериментальной экономики для объяснения поведения испытуемых, когда оно отличается от равновесия Нэша. Эта модель хорошо соответствовала практике для 20% процентов отклонений.

Но оказалось, что стандартный подход QRE не может применяться для описания поведения участников после социализации, потому что отклонений от равновесия Нэша в этом случае становится слишком много, и их уже нельзя считать случайными ошибками, как это делается в традиционной модели.

Для теоретического обоснования полученных в ходе эксперимента данных математики применили марковские стратегии. Учёные построили и проанализировали модель повторяющейся игры «Дилеммы Заключённого». Каждый участник мог реагировать только на то, какую стратегию (кооперировать или предавать) реализовал его случайный анонимный партнёр ход назад. Анализируя эту информацию, он делал выбор стратегии на текущем ходе. Такой подход, названный в честь автора, русского математика Андрея Маркова, в итоге позволил получить игру в нормальной форме: то есть состоящей из множества игроков, множества чистых стратегий и множества действий каждого игрока. Также удалось показать, что выигрыши нелинейно зависят от вероятностей поведения игроков. Учёные нашли в явном виде семейство внутренних симметричных равновесий Нэша: набор оптимальных стратегий, одинаковый для обоих партнёров и зависящий только от вероятностей поведения игроков.

Таким образом, учёным удалось построить теоретическую модель, позволяющую описывать преобладание выбора кооперативных стратегий в повторяющейся игре «Дилемма Заключённого» и соответствующую экспериментальным данным.

«Парадокс индивидуальной рациональности разбирается на примере «Дилеммы Заключённого» уже на первой лекции практически любого курса по теории игр, – рассказал доцент кафедры Анализа систем и решений МФТИ Иван Меньшиков. – Тем не менее, эта игра в чём-то сложнее шахмат: применение каждым участником наилучшей для себя стратегии приводит к плохому исходу для всех. Нам удалось полностью исследовать повторяющуюся «Дилемму Заключённого» в марковских стратегиях. Более того, нам повезло ещё раз. Оказалась, поведение участников экспериментов приближается к теоретическим равновесным положениям, найденных нами, причём при разных уровнях социализации. Ещё один удивительный пример, как математическая модель рождается из анализа поведения людей».

Однако, по словам учёных, до сих пор теоретически не обоснованы результаты «Игры на доверие» и «Игры-Ультиматум», экспериментальные данные которых не соответствуют известным теоретическим игровым моделям.

В исследовании принимали участие Сколтех, ТГУ и Орегонский университет. Работа опубликована в журнале PLOS ONE.


Подпишитесь на рассылку «Умной Страны»
Подписаться