Антагонистическая игра это. Нижняя чистая цена игры, заданной. Которая может быть. АНТАГОНИСТИЧЕСКИЕ ИГРЫ. Выстрел может быть у каждого только. Задана вещественная.

Матричные игры Антагонистические игры Теория игр — это в условиях конфликта или неопределенности. Предполагается, что действия сторон в игре характеризуются — наборами правил действий.

Не Может Быть Онлайн

Если выигрыш одной стороны неизбежно проводит к проигрышу другой стороны, то говорят. Если набор стратегий ограничен, то игра называется матричной и решение можно получить очень просто. Решения, получаемые с помощью теории игр, полезны при в условиях возможного противодействия конкурентов или неопределенности во внешней среде. Если является антагонистической, то игрока 2 полностью определяется игрока 1 (соответствующие элементы этих двух матриц отличаются только знаками). Поэтому биматричная полностью описывается единственной матрицей ( игрока 1) и в соответствии с этим называется матричной.

Эта игра — антагонистическая. В ней j = х2 - О, Р, а Я (О, О = Н(Р, Р) = —I и Я (О, Р) = Я (Р, О) = 1, или в матричной форме о р Определение., в которых каждый игрок имеет стратегий, называются матричными играми. Пусть некоторый класс игр Ж является 'зеркально-замкнутым', т.е. Вместе с каждой своей игрой содержит зеркально изоморфную ей (так как все игры, зеркально изоморфные данной, изоморфны, мы, в соответствии с только что сказанным, можем говорить об одной зеркально изоморфной игре). Таким классом является, например, класс всех антагонистических игр или класс всех матричных игр. Вспоминая определение приемлемых ситуаций в, получаем, что ситуация (X, Y ) в является приемлемой для игрока 1 тогда и только тогда когда при любом х G х выполняется неравенство Процесс переработки игр в симметричные им называется симметризацией.

Мы опишем здесь один прием симметризации. Другой, принципиально иной вариант симметризации будет приведен в п.

Оба эти варианта симметризации в действительности применимы к произвольным, но будут сформулированы и доказаны только для матричных игр. Таким образом, исходные термины и обозначения антагонистических игр совпадают с соответствующими терминами и обозначениями теории матричных игр.

Для конечных антагонистических (матричных) игр существование этих экстремумов было нами доказано в 10 гл. 1, и все дело заключалось в установлении их равенства или хотя бы в нахождении путей преодоления их неравенства. Связь е- общих антагонистических игр с минимакса-ми есть обобщение описанной в п. 1 связи с ними матричных игр. Уже рассмотрение матричных игр показывает, что существуют без ситуаций равновесия (и даже без ситуаций е-равно-весия при достаточно малых е 0) в первоначально заданных стратегиях игроков.

Но каждую конечную (матричную) игру можно дополнить до, например, путем предоставления в распоряжение каждого игрока любого числа доминируемых стратегий (см. Очевидно, такое расширение множества в действительности не будет означать расширения его возможностей, и фактическое его поведение в расширенной игре не должно будет отличаться от его поведения в первоначальной игре.

Тем самым мы получили сразу достаточное количество примеров бесконечных антагонистических игр, не имеющих. Имеются и примеров такого рода.

Не может быть актеры

Таким образом, для реализации в бесконечной принципа максимина необходимо, как и в случае конечной (матричной) игры, некоторое расширение стратегических возможностей игроков. Для 96 В связи со в бесконечных можно сформулировать и доказать утверждения, аналогичные тем, которые в связи со в были приведены в 9 гл. Аналогом леммы п. 1 является следующая лемма. Как и в случае матричных игр (см. 1), для общих антагонистических игр важную роль играет понятие спектра, которому здесь, однако, приходится дать более общее определение. Заметим, наконец, что множество всех 1 в произвольной является, как и в матричной Уже рассмотрение антагонистических игр показывает, что большое число таких игр, и в том числе конечных, матричных игр имеет ситуации равновесия не в исходных, а лишь в обобщенных,.

Антагонистическая игра может быть задана

Поэтому и для общих, неантагонистических бескоалиционных игр естественно искать ситуации равновесия именно в смешанных стратегиях. В превращается всякая, если в ней начать оценивать выигрыш игроков по различным (но монотонным ) шкалам полезности. В положении игрока 1 в оказывается, например, сторона, стремящаяся нанести ущерб противнику и правильно сравнивающая его ущерб в различных ситуациях, но дающая размеру этого ущерба, вообще говоря, неверную количественную оценку. Так, например (см. 3.1), мы уже отмечали, что 'Исполнителю' почти не приходится сталкиваться с поведенческой неопределенностью. А вот если взять типа 'Администратор', то здесь все как раз наоборот.

Как правило, главный тип неопределенности, с которым приходится сталкиваться такому 'нашему ЛПР' — это 'Конфликт'. Теперь можем уточнить, что обычно это нестрогое соперничество. Несколько реже 'Администратор' в условиях 'природной неопределенности', и еще реже он сталкивается со строгим, антагонистическим конфликтом.

Кроме того, столкновение интересов при 'Администратором' происходит, так сказать, 'однократно', т. В нашей классификации он чаще разыгрывает только одну (иногда весьма небольшое количество) партий игры. Шкалы для оценки последствий чаще качественные, чем количественные. Стратегическая самостоятельность у 'Администратора' довольно ограничена. Принимая во внимание сказанное, можно утверждать, что подобного масштаба чаще всего приходится анализировать с помощью бескоалиционных неантагонистических би-матричных игр, причем, в чистых стратегиях 39.

Принципы решения матричных антагонистических игр В итоге будет разумно ожидать, что в описанной выше игре противники будут придерживаться избранных стратегий. Матричная, для которой max min fiv = min max Aiy Однако далеко не все матричные являются вполне определенными, и в общем случае Таким образом, в общем случае для решения матричной размерностью /ихл необходимо решить пару, в результате чего находится набор, / и цена игры v. Как определяется матричная двух лиц Как находится верхняя и для вполне определенной матричной двух лиц Какие есть методы упрощения и решения матричных антагонистических игр В случае игры двух лиц естественно считать их интересы прямо противоположными —. Таким образом, выигрыш одного игрока равен проигрышу другого (сумма выигрышей обоих игроков равна нулю, отсюда и название — игра с нулевой суммой). Будем рассматривать игры, в которых у каждого игрока имеется конечное число альтернатив.

Для такой игры двух лиц с нулевой суммой может быть задана в (в виде платежной матрицы). Игра 'Монетки' и NEm. Способ решения и геометрия игры функции или отображения отклика. О существовании (доказательство) и следствие существование NEm. Теорема Брауна-Джексон о сходимости NEt к NEm, как способ вычисления NEm.

Седло (Sad) как пересечение NE и ММ, его существование в антагонистической матричной игре. Как уже отмечалось, конечная называется матричной. Также, Биматричиая игра, Дифференциаль-ные игры, Игра с 'природой ', Игры с непротивоположными интересами, Игры с ненулевой суммой, Игры с нулевой суммой, Конечные и, Прямоугольные игры. Рассмотрим более подробно и их.

Удобным способом задания игры двух участников с нулевой суммой является. Отсюда, кстати, происходит еще одно их название —. Каждый элемент ац содержит числовое значение выигрыша игрока I (проигрыша игрока II), если первый применяет стратегию /, а второй — стратегию /. Термины выигрыш и проигрыш следует понимать в широком смысле, т. Они могут принимать отрицательные значения и с житейской означать противоположное.

Нетривиальность задачи прежде всего заключается в том, что каждый из игроков делает свой выбор, не зная о выборе другого, что существенно осложняет процесс оптимизации выбираемой стратегии. matrix games — класс антагонистических игр, в которых участвуют два игрока, причем каждый игрок располагает конечным числом стратегий. Если один игрок имеет т стратегий, а второй — п, то можно построить размерностью тхп. Могут иметь, но могут и не иметь ее. В последнем случае в невозможно и игроков отыскиваются среди их. Для нахождения удобно преобразовывать в задачи линейного программирования. Начиная с этого места мы будем рассматривать только конечные, т.е.

Игры, в которых каждый игрок имеет стратегий. Переход от теории конечных бескоалиционных игр к теории бесконечных бескоалиционных игр напоминает переход от теории матричных игр (гл. 1) к теории бесконечных антагонистических игр (гл. 2), но является более громоздким. На этом пути довольно естест.

Венно получаются доказательства теорем существования ситуаций равновесия для бесконечных бескоалиционных игр, но нахождение ситуаций равновесия в таких играх удается ввиду технических трудностей лишь в отдельных, узких и пока еще немного численных случаях. Д., или Букварь по игр, пер. С англ., М., 1960 Вентцель Е. С., игр, 2 изд., М., 1961 Воробьев Н. Н., игр, Л., 1963 Ль юс Р. ИРайфа X., Игры и решения, пер. С англ., М., 1961 Мак-Кинси Д ж., Введение в теорию игр, пер.

С англ., М., I960. Сборник переводов. Воробьева, М., 1961 Бесконечные. Сборник переводов.

Воробьева, М., 1963. Связь матричных игр с и нахождение NEm. Доказательство Сл. 1.1 для антагонистических (матричных) игр двух лиц можно проводить и независимо от, через, что дает также способ поиска NEm для этих игр. Для этого задачу 1-го игрока записывают в форме максимизации (неизвестной ему заранее) //0 по переменным //о,/А при ограничениях цО, Sf li/ = lr fJ-ak ц0 (k = 1.,п2), где ak e Rni — столбцы матрицы платежей (а ) = (MI(X,X )). Здесь ограничения типа выражают гипотезу 1-го о неблагоприятном поведении противника (максимин). Легко проверить, что задача противника есть двойственная к описанной задаче.

Таким образом можно найти седловую пару в игре Gm, она является и Нэшевской парой. Для случая 2x2 также легко найти NEm графически, строя функции (или отображения) NRi(x i) отклика игроков на действия партнеров. Ui(si,s2) = — w2(si,s2) для всех Si G Si, г = 1,2, справедливо равенство amf = — 6mf для всех га и А, а поэтому такая игра может быть задна только одной матрицей (amf )m=i.,M, и поэтому конечные называются матричными (см. Подробнее Дополнение (Раздел 1.13)).

Смотреть страницы где упоминается термин Матричные игры Антагонистические игры: Смотреть главы.

Определение бесконечной антагонистической игры Естественным обобщением матричных игр являются бесконечные антагонистические игры (БАИ), в которых хотя бы один из игроков имеет бесконечное количество возможных стратегий. Мы будем рассматривать игры двух игроков, делающих по одному ходу, и после этого происходит распределение выигрышей.

При формализации реальной ситуации с бесконечным числом выборов можно каждую стратегию сопоставить определённому числу из единичного интервала, т.к. Всегда можно простым преобразованием любой интервал перевести в единичный и наоборот. Пусть Е – некоторое множество вещественных чисел. Если существует число y, такое, что x £ y при всех хÎЕ (при этом y не обязательно принадлежит Е), то множество Е называется ограниченным сверху, а число y называется верхней границей множества Е.

Не может быть актеры

Аналогично определяется ограниченность снизу и нижняя граница множества Е. Обозначаются верхняя и нижняя границы соответственно через sup Е и inf Е соответственно. Пусть множество Е состоит из всех чисел вида, n = 1,2. Тогда множество Е ограничено, его верхняя грань равна 1, а нижняя 0, причём 0ÏЕ, а 1ÎЕ. Для дальнейшего изложения теории игр этого класса введём определения и обозначения: 0; 1 – единичный промежуток, из которого игрок может сделать выбор; х – число (стратегия), выбираемое игроком 1; y – число (стратегия), выбираемое игроком 2; Мi(x,y) – выигрыш i-го игрока; G (X,Y,M1,M2) – игра двух игроков, с ненулевой суммой, в которой игрок 1 выбирает число х из множества Х, игрок 2 выбирает число y из множества Y, и после этого игроки 1 и 2 получают соответственно выигрыши M1(x, y) и M2(x, y). Пусть, далее, G (X,Y,M) – игра двух игроков с нулевой суммой, в которой игрок 1 выбирает число х, игрок 2 – число y, после чего игрок 1 получает выигрыш М(x, y) за счёт второго игрока. Большое значение в теории БАИ имеет вид функции выигрышей M(x, y).

Так, в отличии от матричных игр, не для всякой функции M(x, y) существует решение. Будем считать, что выбор определённого числа игроком означает применение его чистой стратегии, соответствующей этому числу. По аналогии с матричными играми назовём чистой нижней ценой игры величину V1 = M(x, y) или V1 = M(x, y), а чистой верхней ценой игры величину V2 = M(x, y) или V2 = M(x, y), Для матричных игр величины V1 и V2 всегда существуют, а в бесконечных играх они могут не существовать.

Естественно считать, что, если для какой-либо бесконечной игры величины V1 и V2 существуют и равны между собой (V1 = V2 = V), то такая игра имеет решение в чистых стратегиях, т.е. Оптимальной стратегией игрока 1 есть выбор числа xoÎX и игрока 2 – числа yoÎY, при которых M(xo, yo) = V, в этом случае V называется ценой игры, а (xo, yo) – седловой точкой в чистых стратегиях. Игрок 1 выбирает число х из множества Х = 0; 1, игрок 2 выбирает число y из множества Y = 0; 1. После этого игрок 2 платит игроку 1 сумму M(x, y) = 2х2 - y2. Поскольку игрок 2 хочет минимизировать выигрыш игрока 1, то он определяет (2x2 - y2) = 2х2 - 1, т.е. При этом y = 1. Игрок 1 желает максимизировать свой выигрыш, и поэтому определяет ( M(x, y)) = (2х2 - 1) = 2-1 = 1, который достигается при х = 1.

Итак, нижняя цена игры равна V1 = 1. Верхняя цена игры V2 = ( (2х2 - y2)) = (2 - y2) = 2-1 = 1, т.е. В этой игре V1 = V2 = 1. Поэтому цена игры V = 1, а седловая точка (1;1). Игрок 1 выбирает хÎX = (0; 1), игрок 2 выбирает yÎY = (0; 1).

Не Может Быть Фильм

После этого игрок 1 получает сумму M(x, y) = x + y за счёт игрока 2. Поскольку Х и Y - открытые интервалы, то на них V1 и V2 не существуют.

Если бы Х и Y были замкнутые интервалы, то, очевидно, было бы следующее: V1 = V2 = 1 при xo = 1, yo = 0. С другой стороны, ясно, что, выбирая х достаточно близкое к 1, игрок 1 будет уверен, что он получит выигрыш не меньше, чем число, близкое к цене игры V = 1; выбирая y близкое к нулю, игрок 2 не допустит, чтобы выигрыш игрока 1 значительно отличался от цены игры V = 1. Степень близости к цене игры может характеризоваться числом e 0. Поэтому в описываемой игре можно говорить об оптимальности чистых стратегий хo = 1, yo = 0 соответственно игроков 1 и 2 с точностью до произвольного числа e 0.

В связи с этим введём следующие определения. Точка (, ), где ÎX, ÎY, в антагонистической непрерывной игре G называется точкой e-равновесия, если для любых стратегий xÎX игрока 1, yÎY игрока 2 имеет место неравенство М(х, ) - e £ M(, ) £ М(, y) + e. Точка e-равновесия (, ) называется также e-седловой точкой функции М(x, y), а стратегии и называются e-оптимальными стратегиями. Эти стратегии являются оптимальными с точностью до e в том смысле, что, если отклонение от оптимальной стратегии никакой пользы игроку принести не может, то его отклонение от e-оптимальной стратегии может увеличить его выигрыш не более, чем на e.

Можно доказать, что для того, чтобы функция М имела e-седловые точки для любого e0 необходимо и достаточно чтобы M(x, y) = M(x, y). Если игра G не имеет седловой точки (e-седловой точки) в чистых стратегиях, то оптимальные стратегии можно искать среди смешанных стратегий. Однако, в качестве вероятностной меры здесь вводятся функции распределения вероятностей применения игроками чистых стратегий.

Пусть F(х) – функция распределения вероятностей применения чистых стратегий игроком 1. Если число x - чистая стратегия игрока 1, то F(х) = P(x £ х), где P(x £ х) означает вероятность того, что случайно выбранная чистая стратегия x не будет превосходить числа х. Аналогично рассматривается функция распределения вероятностей применения чистых стратегий h игроком 2 Q(y) = P(h £ y). Функции F(х) и Q(y) называются смешанными стратегиями соответственно игроков 1 и 2. Если F(х) и Q(y) дифференцируемы, то существуют их производные, обозначаемые соответственно через f(x) и q(y) (функции плотности распределения). В общем случае дифференциал функции распределения dF(х) выражает вероятность того, что стратегия x находится в промежутке х £ x £ х + dх.

Аналогично для игрока 2: dQ(y) означает вероятность того, что его стратегия h находится в интервале y £ h £ y + dy. Тогда выигрыш игрока 1 составит М(х, y) dF(х), а выигрыш игрока 2 равен М(х, y) dQ(y). Средний выигрыш игрока 1 при условии, что игрок 2 применяет свою чистую стратегию y, получим, если проинтегрируем выигрыш по всем возможным значениям х, т.е. E(F, y) = Напомним, что множество Y для y является замкнутым промежутком 0; 1. Если игрок 1 применяет свою чистую стратегию х, а игрок 2 - y, то выигрыш игрока 1 составит М(х, y) dP(х) dQ(y). Средний выигрыш игрока 1 при условии, что оба игрока применяют свои смешанные стратегии F(х) и Q(y), будет равен E(F,Q) =. По аналогии с матричными играми определяются оптимальные смешанные стратегии игроков и цена игры: в антагонистической непрерывной игре G(Х,Y,М) пара смешанных стратегий F.(х) и Q.(y) соответственно для игроков 1 и 2 образует седловую точку в смешанных стратегиях, если для любых смешанных стратегий F(х) и Q(y) справедливы соотношения Е(F,Q.) £ Е(F.,Q.) £ Е (F.,Q).

Из левой части последнего неравенства следует, что если игрок 1 отступает от своей стратегии F.(х), то его средний выигрыш не может увеличиться, но может уменьшиться за счёт лучших действий игрока 2, поэтому F.(х) называется оптимальной смешанной стратегией игрока 1. Из правой части последнего неравенства следует, что если игрок 2 отступит от своей смешанной стратегии Q.(y), то средний выигрыш игрока 1 может увеличиться, а не уменьшиться, за счёт более разумных действий игрока 1, поэтому Q.(y) называется оптимальной смешанной стратегией игрока 2. Средний выигрыш Е(F.,Q.), получаемый игроком 1 при применении игроками оптимальных смешанных стратегий, называется ценой игры. По аналогии с матричными играми рассматривается нижняя цена непрерывной игры в смешанных стратегиях V1 = E(F,Q) и верхняя цена игры V2 = E(F,Q). Если существуют такие смешанные стратегии F.(х) и Q.(y) соответственно для игроков 1 и 2, при которых нижняя и верхняя цены непрерывной игры совпадают, то F.(х) и Q.(y) естественно назвать оптимальными смешанными стратегиями соответствующих игроков, а V1 = V2 = V – ценой игры. Можно доказать, что существование седловой точки в смешанных стратегиях игры G(Х,Y,М) равносильно существованию верхней V2 и нижней V1 цен игры в смешанных стратегиях и их равенству V1 = V2 = V. Таким образом, решить игру G(Х,Y,М) – означает найти седловую точку или такие смешанные стратегии, при которых нижняя и верхняя цены игры совпадают.

Антагонистическая Игра Может Быть Задана

Теорема 1 (существования). Всякая антагонистическая бесконечная игра двух игроков G с непрерывной функцией выигрышей М(х,y) на единичном квадрате имеет решение (игроки имеют оптимальные смешанные стратегии). Пусть – бесконечная антагонистическая игра с непрерывной функцией выигрышей М(х, y) на единичном квадрате и ценой игры V. Тогда, если Q(y) – оптимальная стратегия игрока 2 и для некоторого xo, то xo не может входить в точки спектра оптимальной стратегии игрока 1; если F(х) – оптимальная стратегия игрока 1и для некоторого yo, то yo не может быть точкой спектра оптимальной стратегии игрока 2. Из теоремы 2 следует, что если один из игроков применяет оптимальную стратегию, а другой – чистую, притом что средний выигрыш игрока 1 отличается от цены игры, то эта чистая стратегия не может войти в его оптимальную стратегию (или она входит в неё с вероятностью нуль). Пусть в бесконечной антагонистической игре функция выигрышей М(х,y) непрерывная для хÎ0; 1, yÎ0; 1 и М(х, y) = -М(y, х), тогда цена игры равна нулю и любая оптимальная стратегия одного игрока будет также оптимальной стратегией другого игрока.

Сформулированные свойства оптимальных смешанных стратегий и цены игры помогают находить или проверять решения, но они ещё не дают в общем виде приемлемых методов решения игры. Более того, не существует общих методов для точного нахождения решения БАИ, и в том числе непрерывных игр на единичном квадрате. Поэтому рассматриваются частные виды антагонистических бесконечных игр. Игры с выпуклыми функциями выигрышей. Игры с выпуклыми непрерывными функциями выигрышей, называемые часто ядром, называются выпуклыми. Напомним, что выпуклой функцией f действительной переменной х на интервале (а,b) называется такая функция, для которой выполняется неравенство f(a1 х1 + a2 х2) £ a1 f(х1) + a2 f(х2), где х1 и х2 – любые две точки из интервала (а,b); a1, a2 ³ 0, причём a1 + a2 = 1. Если для a1 ¹ 0, a2 ¹ 0 всегда имеет место строгое неравенство f(a1 х1 + a2 х2) то функция f называется строго выпуклой на (а;b).

Геометрически выпуклая функция изображает дугу, график которой расположен ниже стягивающей её хорды (см. Рис.) Напомним, также, что непрерывная и строго выпуклая функция f на замкнутом интервале принимает минимальное значение только в одной точке интервала. Для нахождения решения выпуклой игры можно воспользоваться следующей теоремой. Пусть М(х, y) – непрерывная функция выигрышей игрока 1, на единичном квадрате и строго выпуклая по y для любого х. Тогда имеется единственная оптимальная чистая стратегия y = yo Î0;1 для игрока 2, цена игры определяется по формуле V = M(x, y), значение yo определяется как решение следующего уравнения M(x, yo) = V. Если в теореме 4 не предполагать строгую выпуклость функции М(х, y) по y, а просто выпуклость, то теорема остаётся в силе с тем отличием, что у игрока 2 оптимальная чистая стратегия не будет единственной.

Выпуклые игры называют часто выпукло-вогнутыми, т.к. Игра в них имеет седлообразное ядро, а так как ядро седлообразное, то игра имеет седловую точку в чистых стратегиях.

Не Может Быть Актеры

Таким образом, если М(х, y) непрерывна и выпукла по y, то цена игры определяется по формуле (1), и игрок 2 имеет оптимальную чистую стратегию, определяемую из уравнения (2). Аналогично и для игрока 1: если функция выигрышей М(х, y) непрерывна по обоим аргументам.

goodrurussian – 2019