Моделирование
в условиях противодействия, игровые моделиСтраница 3
Таблица 3.7
Повторим метод рассуждений, использованный для предыдущего примера.
· Мы никогда не выберем стратегию S1
, поскольку она при любом ответе конкурента принесет нам значительные убытки.
· Из двух оставшихся разумнее выбрать S3
, так как при любом ответе конкурента мы получим прибыль.
· Выбираем в качестве оптимальной стратегии S3
.
Рассуждения нашего конкурента окажутся примерно такими же по смыслу. Понимая, что мы никогда не примем S1
и выберем, в конце концов, S3
, он примет решение считать оптимальной для себя стратегию C1
— в этом случае он будет иметь наименьшие убытки.
Можно применить и иной метод рассуждений, дающий, в конце концов, тот же результат. При выборе наилучшего плана игры для нас можно рассуждать так:
· при стратегии S1минимальный (min
) "выигрыш" составит - 4000
гривен;
· при стратегии S2минимальный (min
) "выигрыш" составит - 1000
гривен;
· при стратегии S3минимальный (min
) выигрыш составит + 1000
гривен.
Выходит, что наибольший (max
) из наименьших (min)
выигрышей — это 1000 гривен и сам бог велел полагать стратегию S3
оптимальной, с надеждой на ответный ход конкурента его стратегией C1
. Такую стратегию и называют стратегией MaxiMin.
Если теперь попробовать смоделировать поведение конкурента, то для него:
· при стратегии C1максимальный (max)
проигрыш составит 1000
гривен;
· при стратегии C2максимальный (max)
проигрыш составит 2000
гривен.
Значит, наш конкурент, если он будет рассуждать здраво, выберет стратегию C1
, поскольку именно она обеспечивает наименьший (min)
из наибольших (max)
проигрышей. Такую стратегию и называют стратегией MiniMax.
Легко заметить, что это одно и то же — вы делаете ход S3
в расчете на ответ C1
, а ваш конкурент — ход C1
в расчете на S3
.
Поэтому такие стратегии называют минимаксными— мы надеемся на минимум максимальных убытков или, что одно и то же, на максимум минимальной прибыли.
В двух рассмотренных примерах оптимальные стратегии "противников" совпадали, принято говорить — они соответствовали седловой точке
матрицы игры.
Метод минимакса отличается от стандартного пути логических рассуждений таким важным показателем как алгоритмичность.В самом деле, можно доказать, что если седловая точка существует, то она находится на пересечении некоторой строки S
и некоторого столбца C
. Если число в этой точке самое большое для данной строки
и, одновременно, самое малое в данном столбце
, то это и есть седловая точка.
Конечно, далеко не все игры обладают седловой точкой, но если она есть, то поиск ее при числе строк и столбцов в несколько десятков (а то и сотен) по стандартному логическому плану — дело практически безнадежное без использования компьютерных технологий.
Но, даже при использовании компьютера, писать программу для реализации всех возможных If . Then
Другое по теме
Нейронные сети ассоциативной памяти,
функционирующие в дискретном времени
Нейронные сети ассоциативной памяти — сети
восстанавливающие по искаженному и/или зашумленному образу ближайший к нему
эталонный. Исследована информационная емкость сетей и предложено несколько
путей ее повышения, в том числе — ...