Теория игр: Игры с природой

image

Затянувшееся продолжение цикла статей о теории игр.




Ближе к практике


В прошлой статье о теории игр были рассмотрены ситуации, в которых предполагалась логичность дествий двух игроков, каждый из которых хочет получить для себя максимум выгоды. Следующим этапом являются так называемые игры с природой. Формально изучение игр с природой, так же, как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.

Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком один. Игроку два (природа) не важен результат, либо он не способен к осмысленным решениям. Или, возможно, условия не зависят от действий игрока, а определяются внешними факторами: реакция рынка, который не будет вредить одному конкретному игроку, государственная политика, реальная природа.


Виды задач и критерии выбора


Различают два вида задач в играх с природой:

  • Задача о принятии решений в условиях риска, когда известны вероятности, с которыми природа принимает каждое из возможных состояний;
  • Задачи о принятии решений в условиях неопределенности, когда нет возможности получить информацию о вероятностях появления состояний природы;



Чтобы быть ближе к реальным ситуациям, для примера возьмем относительно реальную ситуацию. Первого игрока, за которого мы будем принимать решения, будет представлять Samsung со своим Galaxy S5. Вторым игроком, играющим «природу», будет компания Apple, и его iPhone 6.

Подходит время выпуска нового смартфона, прошла презентация, эксперты высказали свое мнение, и игрок один должен принять важное решение, когда выпустить продукт? Упростив ситуацию, у нас останется три варианта: до конкурента (А1), вместе с ним (А2) или после (А3). Естественно, пока не выйдет новый iPhone мы не узнаем, будет он намного лучше нашего (В1), таким же (В3) или сильно уступающим в качестве (В3). Посчитав прибыль во всех случаях, в итоге получим матрицу:


В1 В2 В3
А1 5 5 7
А2 3 4 6
А3 2 4 8



Теперь же, для принятия решения, у нас есть несколько критериев.

1. Критерий Вальда (максиминный). Игрок рассчитывает, что природа пойдет по наихудшему для него пути, и следует выбрать вариант с максимальной прибылью при самом плохом исходе, поэтому данный критерий считается пессимистическим. Представить его можно в виде max (min i)

При данном критерии:

для А1 минимальной прибылью (5) выльются действия природы В1 и В2
для А2 минимальная прибыль 3 после действия В1
для А3 минимальная прибыль 2 после действия В1

Таким образом из 5, 3 и 2 максимум прибыли (5) нам даст вариант А1

2. Критерий максимума (максимаксный) является оптимистическим, т.е. мы надеемся на самый благоприятный для нас исход.представляется как max (max i).

для А1 максимальная прибыль 7
для А2 максимальная прибыль 6
для А3 максимальная прибыль 8

Из 7, 6 и 8 максимальную прибыль принесет вариант А3

3. Критерий Гурвица рекомендует стратегию, определяемую по формуле max (A*max i + (1-A)*min i), где А — степень оптимизма и изменяется в пределах от 0 до 1. Критерий выдает результат, учитывающий возможность как наихудшего, так и наилучшего поведения природы. При А=0 данный критерий можно заменить критерием максимума, а при А=1 — критерием Вальда. Величина А зависит от степени ответственности игрока один: чем она выше, тем ближе А к единице. Для данного примера примем А=0,4.

для А1 прибыль равна 0,4*7 + 0,6*5 = 5,8
для А2 прибыль равна 0,4*6 + 0,6*3 = 4,2
для А3 прибыль равна 0,4*8 + 0,6*2 = 4,4

Из полученных ответов максимыльную прибль приносит действие А1

4. Критерий Сэвиджа (минимаксный). Суть его заключается в выборе стратегии, не допускающей слишком высоких потерь. Для этого используется матрица рисков, в которой вычисляется максимальная прибыль при каждом варианте действия игрока, и среди результатов выбирается наименьший. Его формула выглядит как min (max i)

При данном критерии:

для А1 максимальной прибылью (7) выльется действие природы В3
для А2 максимальная прибыль 6 после действия В3
для А3 максимальная прибыль 8 после действия В3

Таким образом из 7, 6 и 8 минимум прибыли (6) нам даст вариант А2

5. По критерию Байеса предлагается придать равные вероятности всем рассматриваемым стратегиям, после чего принять ту из них, при которой ожидаемый выигрыш окажется наибольшим. Критерий имеет один недостаток: не всегда можно точно определить вероятность того или иного события со стороны природы. Формулой для него является max (Σ q*i).

Сначала мы положили вероятность наступления каждого из собитий природы равной 0,33, и получили

для А1 5*0,33 + 5*0,33 + 7*0,33 = 5,61
для А2 3*0,33 + 4*0,33 + 6*0,33 = 4,29
для А3 2*0,33 + 4*0,33 + 8*0,33 = 7,63

Очевидно что максимальную прибыль мы получим от варианта А3. Однако, обратившись к экспертам, мы получили вероятности событий для природы 0,5; 0,4; 0,1; соответственно. Таким образом

для А1 5*0,5 + 5*0,4 + 7*0,1 = 5,2
для А2 3*0,5 + 4*0,4 + 6*0,1 = 3,7
для А3 2*0,5 + 4*0,4 + 8*0,1 = 3,4

Думаю результат комментировать бессмысленно.

Основная задача состоит в том, чтобы найти оптимальные (или хотя бы рациональные) стратегии, наилучшим образом приводящие систему к цели при заданных внешних условиях. Для выбора стратегий в условиях неопределенности можно применять любые критерии, в условиях риска действеннее критерий Байеса. Однако выбор между самими критериями основывается обычно на интуиции, зависит от характера принимающего решение (в частности, его склонности к риску).

Если решение принимается в условиях неопределенности, то лучше использовать несколько критериев. В том случае, если рекомендации совпадают, можно с уверенностью выбирать наилучшее решение. Если рекомендации противоречивы, решение надо принимать более взвешенно, с учетом сильных и слабых сторон.

ссылка на оригинал статьи http://habrahabr.ru/post/179811/

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>