Главная страница
Навигация по странице:

  • СТРАТЕГИЧЕСКАЯ РЕФЛЕКСИЯ В БИМАТРИЧНЫХ ИГРАХ Новиков Д.А.

  • Заключение

  • Стратегическая рефлексия в биматричных играх - Новиков Д.А.. Стратегическая


    Скачать 156.93 Kb.
    НазваниеСтратегическая
    АнкорСтратегическая рефлексия в биматричных играх - Новиков Д.А..pdf
    Дата09.08.2018
    Размер156.93 Kb.
    Формат файлаpdf
    Имя файлаСтратегическая рефлексия в биматричных играх - Новиков Д.А..pdf
    ТипДокументы
    #21320
    КатегорияЭкономика. Финансы

    1
    Региональная экономика в информационном измерении:
    модели, оценки, прогнозы /
    Сборник научных трудов под ред. Е.Ю. Иванова,
    Р.М. Нижегородцева.
    М.:Бизнес-Юнитек, 2003. С.296 – 307.
    СТРАТЕГИЧЕСКАЯ
    РЕФЛЕКСИЯ
    В
    БИМАТРИЧНЫХ
    ИГРАХ
    Новиков Д.А.
    (Институт проблем управления РАН, Москва)
    nov@ipu.rssi.ru
    Введение
    Традиционно при рассмотрении статических некооперативных тео- ретико-игровых моделей вводятся два предположения: во-первых, счита- ется, что все агенты (игроки) выбирают свои стратегии однократно, одно- временно и независимо; во-вторых, что информация о целевых функциях и допустимых множествах является общим знанием (common knowledge)
    [11]. Последнее предположение, которое мы обозначим CK, означает, что каждый из агентов знает целевые функции и допустимые множества всех агентов. Кроме того, он знает, что другие агенты знают это, а также то,
    что они знают, что он это знает и т.д. до бесконечности.
    Предположение CK является "предельным", то есть требующим от агентов бесконечной глубины рефлексии [4], и ему в соответствие может быть поставлено классическое равновесие Нэша. Однако информирован- ность агентов может отличаться от вводимой в CK, поэтому игры, в которых информированность о состоянии природы не удовлетворяет CK,
    назовем рефлексивными играми (см. также [6]).
    В рамках теоретико-игровых моделей целесообразно различать два типа рефлексии: информационную рефлексию и стратегическую рефлек- сию. Информационная рефлексия – процесс и результат размышлений игрока о том каковы значения неопределенных параметров, что об этих значениях знают и думают его оппоненты (другие игроки). При этом собственно «игровая» компонента отсутствует, так как никаких решений игрок не принимает. Информационная рефлексия относительно подробно рассмотрена в работе [5]. Стратегическая рефлексия – процесс и резуль-

    2
    тат размышлений игрока о том, какие принципы принятия решений ис- пользуют его оппоненты в рамках той информированности, которую он им приписывает в результате информационной рефлексии.
    Таким образом, информационная рефлексия имеет место только в ус- ловиях неполной информированности, и ее результат используется при принятии решений (в том числе – при стратегической рефлексии). Страте- гическая рефлексия имеет место даже в случае полной информированно- сти (за исключением ситуации, в которой принципы принятия решений всеми игроками являются общим знанием – представить себе такое на практике затруднительно), предваряя принятие игроком решения о вы- бранном действии.
    В настоящей работе рассматривается стратегическая рефлексия в би- матричных играх (статических конечных играх двух лиц [2]). Основная идея заключается в том, что в биматричных играх, в которых не сущест- вует равновесия Нэша, или в которых при существующем равновесии
    Нэша агенты выбирают субъективные гарантирующие стратегии (то есть стратегии, максимизирующие гарантированный при имеющейся инфор- мированности выигрыш), выигрыш каждого из агентов определяется типом разыгрываемой рефлексивной игры, то есть существенным образом зависит как от его ранга рефлексии, так и от ранга рефлексии оппонента.
    Кроме того, показывается, что неограниченное увеличение ранга страте- гической рефлексии не приводит к увеличению выигрыша. Перейдем к формальному описанию.
    1.
    Описание
    модели
    Рассмотрим биматричную игру
    1
    , в которой выигрыши первого и вто- рого игроков (агентов) задаются матрицами A = ||a
    ij
    || и B = ||b
    ij
    || размер- ности n
    ×
    m соответственно. Обозначим I = {1, 2, …, n} – множество стратегий
    (действий) первого игрока
    (выбирающего строку),
    J = {1, 2, …, m} – множество стратегий (действий) второго игрока (выби- рающего столбец). В рассматриваемой игре гарантирующие стратегии игроков имеют вид: i
    0

    Arg
    I
    i

    max
    J
    j

    min
    a
    ij
    , j
    0

    Arg
    J
    j

    max
    I
    i

    min
    b
    ij
    . Вве- дем следующие предположения.
    1
    Так как матричные игры (антагонистические конечные игры) являются
    частным случаем биматричных игр, то все приведенные в настоящей
    работе результаты справедливы и для рефлексивных матричных игр.

    3
    А.1. Матрицы выигрышей не содержат доминируемых стратегий
    2
    А.2. Для каждого игрока существует однозначное отображение, ста- вящее в соответствие любой стратегии оппонента единственный наилуч- ший ответ данного игрока.
    Определим рефлексивную биматричную игру MG
    kl
    (matrix game) как биматричную игру с матрицами A и B, в которой первый и второй игроки имеют ранги рефлексии, равные k и l соответственно, k, l


    , где


    множество натуральных чисел.
    Поясним, что будет пониматься под рангом рефлексии (точнее – под рангом стратегической рефлексии). В рефлексивных биматричных (и не только биматричных – см. [1]) играх выбор стратегий агентами осуществ- ляется на основании знания рангов рефлексии оппонента
    3
    . Ранги рефлек- сии определяются следующим образом. «Игрок имеет нулевой ранг реф- лексии, если он знает только матрицу платежей. Игрок обладает первым рангом рефлексии, если он считает, что его противники имеют нулевой ранг рефлексии, то есть, знают только матрицу платежей. Вообще, игрок с
    k-ым рангом рефлексии предполагает, что его противники имеют k–1-й ранг рефлексии. Он проводит за них необходимые рассуждения по выбору стратегии и выбирает свою стратегию на основе знания матрицы платежей и экстраполяции действий своих противников» [8].
    То есть, в рефлексивных биматричных играх предполагается, что ка- ждый агент знает ранг рефлексии оппонента [8, 9], что позволяет ввести понятие субъективной гарантирующей стратегии в рефлексивной би- матричной игре MG
    kl
    :
    (1) i
    k
    = arg
    I
    i

    max
    1

    k
    ij
    a
    , j
    l
    = arg
    J
    j

    max
    j
    i
    l
    b
    1

    , k, l


    .
    Отметим, что предположение А.2. означает, что у игрока, обладаю- щего заданным рангом рефлексии, существует единственная «оптималь- ная» стратегия. Следовательно, при определении наилучших ответов
    [2, 11] вместо выражений «i


    Arg
    I
    i

    max
    » и «j


    Arg
    J
    j

    max
    …» можно использовать, соответственно, выражения
    «i

    = arg
    I
    i

    max
    » и
    «j

    = arg
    J
    j

    max
    …». Несколько забегая вперед, подчеркнем, что при отказе
    2
    Если отказаться от этого предположения, то все приведенные в на-
    стоящей работе результаты останутся в силе, если под n и m понимать
    число соответствующих недоминируемых стратегий.
    3
    Отметим, что этим предположением исключается из рассмотрения
    информационная рефлексия.

    4
    от данного предположения гарантированные оценки максимального целесообразного ранга рефлексии, приводимые ниже, могут лишь умень- шится.
    Таким образом, игра MG
    00
    совпадает с исходной игрой, а субъектив- ным равновесием в игре MG
    kl
    является (
    l
    k
    j
    i
    a
    ;
    l
    k
    j
    i
    b
    ), k, l


    . Отметим два любопытных факта. Во-первых, выигрыш любого агента в игре MG
    kl
    при
    k

    1, l

    1 может оказаться меньше максимального гарантированного (см.
    примеры в [1, 7, 9]). Во-вторых, приписывание каждым агентом оппонен- ту ранга рефлексии на единицу меньше его собственного противоречиво,
    так как в игре MG
    kl
    при k

    1, l

    1 это означает, что должно одновременно выполняться l = k – 1 и k = l – 1, что, очевидно, невозможно. Следователь- но, равновесие в рефлексивной игре является существенно субъективным и априори агенты не знают в какую игру они играют (ранги рефлексии обоих агентов не могут быть общим знанием, так как это противоречило бы самому определению ранга рефлексии). Поэтому перспективным направлением будущих исследований представляется изучение информа- ционной рефлексии относительно рангов стратегической рефлексии агентов в биматричных играх.
    Внутренняя противоречивость рефлексивных биматричных игр мо- жет быть проиллюстрирована следующей схемой – на рисунке 1а) приве- дено субъективное описание игры MG
    kl
    в терминах графа информацион- ного равновесия [10] с точки зрения первого игрока, на рисунке 1б) –
    субъективное описание той же игры с точки зрения второго игрока.
    i
    0
    j
    0
    j
    1
    i
    1

    i
    k-1
    j
    k-1
    i
    k
    i
    k-2
    j
    k-2
    ?
    Рис. 1а). Субъективное описание
    игры MG
    kl
    с точки зрения
    первого агента
    i
    0
    j
    0
    j
    1
    i
    1

    i
    l-1
    j
    l-1
    i
    l
    i
    l-2
    j
    l-2
    ?
    Рис. 1б). Субъективное описание
    игры MG
    kl
    с точки зрения
    второго агента

    5
    Напомним (см. [10]), что граф информационного равновесия облада- ет тем свойством, что число дуг, входящих в каждую его вершину, должно быть на единицу меньше, чем число игроков (то есть, в биматричных играх равняться единице). Субъективные равновесные стратегии, выде- ленные на рисунке 1 жирными линиями, приводят к «равновесию» (i
    k
    , j
    l
    ).
    Стратегии i
    k-1
    для первого игрока и j
    l-1
    для второго не используются в соответствующих их субъективных описаниях игры (см. знаки вопроса на рисунке 1), то есть каждое из них оказывается внутренне незамкнутым.
    Завершив краткое обсуждение внутренней противоречивости реф- лексивных игр, вернемся к исследованию зависимости субъективного равновесия и выигрышей игроков от рангов их рефлексии.
    2.
    Стратегическая
    рефлексия
    Обозначим I
    K
    =
    U
    K
    k
    k
    i
    ,...,
    1
    ,
    0
    =
    , J
    L
    =
    U
    L
    l
    l
    j
    ,...,
    1
    ,
    0
    =
    , K = 0, 1, 2, …, L = 0, 1, 2, … .
    Под I

    и J

    будем понимать соответствующие объединения по всем ран- гам рефлексии от нуля до бесконечности.
    Если одному игроку (или обоим игрокам) неизвестен ранг рефлексии оппонента, то целесообразно рассмотрение игры MG
    ∞∞
    , в которой каждый игрок вычисляет гарантированный результат по рангу рефлексии оппо- нента. Введем гарантирующие стратегии, соответствующие полной неоп- ределенности относительно ранга рефлексии оппонента:
    (2) i

    = arg
    I
    i

    max


    J
    j
    min
    a
    ij
    , j

    = arg
    J
    j

    max


    I
    i
    min
    b
    ij
    .
    Аналогично можно определить гарантирующие стратегии в рамках информации о том, что ранг рефлексии оппонента не превышает извест- ной величины (то есть, первый игрок считает, что ранг рефлексии второго не выше L, а второй – что ранг рефлексии первого не выше K):
    (3) i
    L
    = arg
    I
    i

    max
    L
    J
    l

    min
    l
    ij
    a
    , j
    K
    = arg
    J
    j

    max
    K
    I
    k

    min
    j
    i
    k
    b
    Отметим, что в (3), в отличие от (1), стратегия каждого из игроков не зависит от его собственного ранга рефлексии, а определяется информаци- ей о ранге рефлексии оппонента.
    Выражения (1)-(3) не исчерпывают всего многообразия возможных ситуаций, так как, например, первый игрок может предположить, что второй выберет j

    , и тогда его наилучшим ответом будет arg
    I
    i

    max

    ij
    a
    , и т.д. Кроме того, хотя к увеличению ранга рефлексии способны лишь сильные игроки, интуитивно понятно, что при росте этого ранга, то есть

    6
    при удлинении цепочки рассуждений «я думаю, что он думает, что я думаю...» есть опасность «перемудрить». Сильный игрок с высоким рангом рефлексии переоценивает противника, предполагая, что у него ранг рефлексии тоже высокий. Но если ранг соперника на самом деле низкий, это приводит к проигрышу данному более слабому противнику
    [1, 7, 9]. Следовательно, необходимо систематическое исследование соотношения выигрышей агентов в зависимости от типа разыгрываемой рефлексивной игры. Приведем результаты этого исследования.
    Существенным для нашего рассмотрения является наличие или от- сутствие равновесия Нэша, а также выбор агентами (и использование при построении субъективных равновесий) гарантирующих стратегий или стратегий, равновесных по Нэшу. Таким образом, возможны следующие четыре ситуации.
    Вариант 1 (равновесие Нэша в чистых стратегиях существует, и аген- ты ориентируются на равновесные по Нэшу стратегии).
    Обозначим (i
    *
    ; j
    *
    ) – номера равновесных по Нэшу чистых стратегий.
    Тогда, если по аналогии с (1) считать, что в рефлексивной игре каждый агент выбирает свой наилучший ответ на выбор оппонентом соответст- вующей компоненты равновесия, то получим, что
    (4) i
    k
    = arg
    I
    i

    max
    *
    ij
    a
    , j
    l
    = arg
    J
    j

    max
    j
    i
    b
    *
    , k, l


    .
    Из (4) в силу определения равновесия Нэша [3, 11] следует, что
    i
    k
    = i
    *
    , j
    l
    = j
    *
    , k, l


    , то есть в рамках варианта 1 стратегическая рефлек- сия бессмысленна
    4
    (за исключением, быть может, случая, когда наилуч- шие ответы определяются таким образом, что агенты выбирают компо- ненты различных равновесий Нэша в случае, когда последних несколько).
    Вариант 2 (равновесие Нэша в чистых стратегиях существует, но агенты выбирают гарантирующие стратегии (1)).
    Если гарантирующие стратегии образуют равновесие Нэша (как это имеет место в антагонистических играх с седловой точкой), то попадаем в условия варианта 1. Следовательно, стратегическая рефлексия имеет смысл, только если в рамках варианта 2 равновесие Нэша не совпадает с равновесием в гарантирующих стратегиях (i
    0
    , j
    0
    ).
    4
    Под бессмысленностью стратегической рефлексии в матричных играх
    будем понимать случай, когда равновесие в рефлексивной игре с любой
    комбинацией ненулевых рангов рефлексии агентов совпадает с равновеси-
    ем в исходной игре.

    7
    Вариант 3 (равновесия Нэша в чистых стратегиях не существует, и агенты ориентируются на равновесные по Нэшу смешанные стратегии
    5
    ).
    Если агенты при определении своих наилучших ответов в рефлек- сивной игре по аналогии с (4) рассчитывают на то, что оппонент выберет равновесные по Нэшу смешанные стратегии, то легко показать, что мак- симум ожидаемого выигрыша каждого агента будет достигаться при выборе им также соответствующей равновесной по Нэшу смешанной стратегии. Следовательно, в рамках варианта 3 любое рефлексивное равновесие совпадает с равновесием Нэша в смешанных стратегиях, то есть стратегическая рефлексия в этом случае бессмысленна.
    Вариант 4 (равновесия Нэша в чистых стратегиях не существует, и агенты ориентируются на гарантирующие стратегии (1)).
    В четвертом варианте анализ рефлексии, очевидно, имеет смысл.
    Таким образом, рассмотрев все четыре возможных варианта поведе- ния игроков, получаем, что мы обосновали справедливость следующего утверждения.
    Утверждение 1. Стратегическая рефлексия в биматричных играх имеет смысл, если агенты используют субъективные гарантирующие стратегии (1), которые не являются равновесными по Нэшу.
    Обозначим
    (5) K
    min
    = min{K


    | I
    K
    = I

    },
    (6) L
    min
    = min{L


    | J
    L
    = J

    }.
    Содержательно, K
    min
    и L
    min
    – минимальные ранги рефлексии первого и второго агентов, при которых их множества субъективных равновесных стратегий совпадают с максимально возможными в рассматриваемой игре множествами субъективных гарантирующих стратегий.
    В силу определения

    K, L


    I
    K

    I
    K+1
    , J
    L

    J
    L+1
    . Значит

    K

    K
    min
    I
    K
    = I

    ,

    L

    L
    min
    J
    L
    = J

    В рефлексивных играх, в которых ранг рефлексии первого и второго агентов не превышает K и L соответственно, множества субъективных гарантирующих стратегий первого и второго агентов с точки зрения оппонента равны I
    L-1
    и J
    K-1
    соответственно. Значит, увеличение рангов рефлексии может приводить к расширению множества субъективных гарантирующих стратегий, если
    (7) L – 1 < K
    min
    ,
    (8) K – 1 < L
    min
    5
    Напомним, что в матричных играх равновесие Нэша в смешанных
    стратегиях всегда существует.

    8
    Отметим, что с рассматриваемой точки зрения максимальный целесооб-
    разный ранг рефлексии
    6
    первого игрока зависит от свойств субъективных гарантирующих стратегий второго игрока (см.(8)), и наоборот.
    С другой стороны, агенту не имеет смысл увеличивать ранг своей рефлексии, если он уже «исчерпал» собственное множество возможных субъективных равновесных стратегий. С этой точки зрения увеличение рангов рефлексии может приводить к расширению множества субъектив- ных гарантирующих стратегий, если
    (9) K < K
    min
    ,
    (10) L < L
    min
    Объединяя (8) и (9), а также (7) и (10), получаем, что первому агенту не имеет смысла увеличивать свой ранг рефлексии выше
    (11) K
    max
    = min{K
    min
    , L
    min
    + 1},
    а второму агенту не имеет смысла увеличивать свой ранг рефлексии выше
    (12) L
    max
    = min{L
    min
    , K
    min
    + 1}.
    Обозначим
    (13) R
    max
    = max{K
    max
    , L
    max
    }.
    Таким образом, мы доказали справедливость следующего утвержде- ния.
    Утверждение 2. Использование агентами в биматричной игре рангов стратегической рефлексии выше, чем (11) и (12), не имеет смысла
    7
    Утверждение 2 дает возможность в каждом конкретном случае (для конкретной разыгрываемой игры) каждому игроку (и исследователю операций) вычислить максимальные целесообразные ранги стратегиче- ской рефлексии обоих игроков.
    3.
    Основные
    результаты
    Так как величины (11)-(13) зависят от игры (матриц выигрышей), то получим оценки зависимости этих величин от размерности матриц выиг- рышей (очевидно, что |I

    |

    |I| = n, |J

    |

    |J| = m, а для игр размерности два справедлива более точная оценка – см. утверждение 3). Для этого введем в рассмотрение граф наилучших ответов.
    6
    Под максимальным целесообразным рангом рефлексии игрока будем
    понимать такое значение ранга его стратегической рефлексии, что
    увеличение ранга рефлексии выше данного не приводит к появлению новых
    субъективных (с точки зрения данного игрока) равновесий.
    7
    То есть, для любого ранга рефлексии, превышающего указанные оценки,
    найдется ранг рефлексии, удовлетворяющий указанным оценкам и приво-
    дящий к тому же субъективному равновесию.

    9
    Графом наилучших ответов G = (V, E) назовем конечный двудоль- ный ориентированный граф, в котором множество вершин V = I

    J, а дуги проведены от каждой вершины (соответствующей действию одного из игроков) к наилучшему на нее ответу оппонента. Опишем свойства введенного графа:
    1. Из каждой вершины множества I выходит дуга в вершину множе- ства J (у второго игрока есть наилучший ответ на любое действие первого игрока), из каждой вершины множества J выходит дуга в вершину множе- ства I (у первого игрока есть наилучший ответ на любое действие второго игрока).
    2. В каждую вершину множества V входит как минимум одна дуга
    (так как матрицы выигрышей не содержат доминируемых стратегий, то каждое действие является наилучшим ответом на какое-либо действие оппонента).
    3. Если любой путь дважды прошел через одну и ту же вершину, то по определению наилучших ответов его часть является контуром и в дальнейшем новых вершин в этом пути не появится.
    4. Максимальное число попарно различных стратегий первого агента,
    содержащихся в пути, начинающемся в вершине i
    0
    , равно min(n; m + 1).
    5. Максимальное число попарно различных стратегий второго агента,
    содержащихся в пути, начинающемся в вершине i
    0
    , равно min(n; m).
    6. Максимальное число попарно различных стратегий первого агента,
    содержащихся в пути, начинающемся в вершине j
    0
    , равно min(n; m).
    7. Максимальное число попарно различных стратегий второго агента,
    содержащихся в пути, начинающемся в вершине j
    0
    , равно min(n + 1; m).
    Выявленные свойства графа наилучших ответов позволяют получить оценки сверху целесообразных рангов стратегической рефлексии в бимат- ричных играх (см. утверждения 3 и 4).
    Утверждение 3. В биматричных играх 2
    ×
    2, в которых не существует равновесия Нэша, I

    = I, J

    = J.
    Доказательство. Рассмотрим произвольную биматричную игру 2
    ×
    2,
    в которой не существует равновесия Нэша. Пусть A
    1
    = {x
    1
    , x
    2
    },
    A
    2
    = {y
    1
    , y
    2
    }. Вычислим гарантирующие стратегии i
    0
    и j
    0
    . Положим для определенности x
    1
    = i
    0
    , y
    1
    = j
    0
    Возможны два взаимоисключающих варианта: j
    1
    = y
    1
    и j
    1
    = y
    2
    Если j
    1
    = y
    1
    , то i
    1
    = i
    2
    = x
    2
    (иначе (x
    1
    , y
    1
    ) – равновесие Нэша). Тогда
    j
    2
    = j
    3
    = y
    2
    (иначе (x
    2
    , y
    1
    ) – равновесие Нэша). Следовательно, i
    3
    = i
    4
    = x
    1
    (иначе (x
    2
    , y
    2
    ) – равновесие Нэша). То есть, в первом случае I

    = I, J

    = J.

    10
    Если j
    1
    = y
    2
    , то i
    2
    = x
    2
    (иначе (x
    1
    , y
    2
    ) – равновесие Нэша). Тогда j
    3
    = y
    1
    (иначе (x
    2
    , y
    2
    ) – равновесие Нэша). Следовательно, i
    4
    = x
    1
    (иначе (x
    2
    , y
    1
    ) –
    равновесие Нэша). То есть, во втором случае также I

    = I, J

    = J.

    Качественно, утверждение 3 означает, что в биматричной игре 2
    ×
    2,
    в которой не существует равновесия Нэша, любой исход может быть реализован как субъективное равновесие в некоторой рефлексивной игре.
    Перспективным направлением дальнейших прикладных исследова- ний можно считать анализ субъективных равновесий в базовых ординар- ных играх двух лиц 2
    ×
    2 (напомним, что существуют 78 структурно различных ординарных игр, то есть игр, в которых оба игрока, каждый из которых имеет две допустимых стратегии, может строго упорядочить собственные выигрыши от лучшего к худшему [12]).
    Утверждение 3 наводит на мысль, что, быть может, во всех бимат- ричных играх, в которых не существует равновесия Нэша, выполнено
    I

    = I, J

    = J. Контрпримером служит приведенный на рисунке 2 граф наилучших ответов в игре 4
    ×
    4, в котором вершины i
    0
    и j
    0
    затенены.
    I
    J
    I

    J

    Рис. 2. Пример графа наилучших ответов в игре 4
    ×
    4,
    в которой I


    I, J


    J
    Имея грубые оценки сверху (|I

    |

    n, |J

    |

    m) «размеров» множеств I

    и J

    , исследуем как быстро (при каких минимальных рангах стратегиче- ской рефлексии) эти множества «покрываются» соответствующими субъ- ективными равновесиями.
    Третье свойство графа наилучших ответов означает, что в биматрич- ной игре целесообразное увеличение ранга стратегической рефлексии,
    начиная со второго шага, обязательно изменяет множество стратегий,
    которые должны быть субъективными гарантирующими при рангах рефлексии меньших или равных данного.
    Так как в биматричных играх множества допустимых стратегий ко- нечны, то конечны множества I

    и J

    , следовательно, в силу свойств 4-7

    11
    графа наилучших ответов конечны и величины L
    min
    и K
    min
    , то есть в би-
    матричных играх неограниченное увеличение ранга рефлексии заве-
    домо нецелесообразно. Опять же в силу конечности допустимых мно- жеств, величины
    (11) и
    (12), определяющие максимальные целесообразные ранги рефлексии, могут быть легко рассчитаны для любой конкретной биматричной игры. Кроме того, свойства графа наи- лучших ответов позволяют получить оценки сверху максимальных целе- сообразных рангов рефлексии.
    В биматричной игре n
    ×
    m гарантированные оценки
    8
    величин (11)-
    (13), очевидно, будут зависеть от размерности матриц выигрышей, то есть
    K
    min
    = K
    min
    (n), L
    min
    = L
    min
    (m). Следовательно
    (14) K
    max
    (n, m) = min{K
    min
    (n), L
    min
    (m) + 1},
    (15) L
    max
    (n, m) = min{L
    min
    (m), K
    min
    (n) + 1}.
    Выражение (13) примет при этом вид:
    (16) R
    max
    (n, m) = max{K
    max
    (n, m), L
    max
    (n, m)}.
    Из свойств 4-7 графа наилучших ответов и выражений (14)-(16) сле- дует справедливость следующего утверждения.
    Утверждение 4. В биматричных играх n
    ×
    m максимальные целесооб- разные ранги стратегической рефлексии первого и второго игроков удов- летворяют следующим неравенствам
    (17) K
    max
    (n, m)

    min{n, m + 1},
    (18) L
    max
    (n, m)

    min{m, n + 1},
    (19) R
    max
    (n, m)

    max{min{n, m + 1}, min{m, n + 1}}.
    Следствие 1. В биматричной игре n
    ×
    n, n

    2, максимальный целесо- образный ранг стратегической рефлексии любого игрока
    9
    R
    max
    (n, n)

    n.
    Для случая двух стратегий (в силу его распространенности в при- кладных моделях) сформулируем отдельное следствие.
    Следствие 2. В биматричной игре 2
    ×
    2 максимальный целесообраз- ный ранг рефлексии не превосходит двух.
    Еще раз отметим, что оценки (19)-(21) являются оценками сверху –
    существование нескольких наилучших ответов на одну и ту же стратегию,
    наличие в исходной игре равновесия Нэша или доминируемых стратегий
    8
    Под гарантированной оценкой будем понимать оценку сверху, то есть
    максимально возможную для данного класса игр соответствующую
    величину.
    9
    Очевидно, что в игре, в которой один из агентов имеет единственную
    допустимую стратегию, рефлексия бессмысленна.

    12
    может привести только к тому, что максимальный целесообразный ранг рефлексии не увеличится.
    Заключение
    Рекламную версию утверждения 1 можно сформулировать следую- щим образом: в биматричной игре максимальный целесообразный
    ранг стратегической рефлексии превышает минимальное число
    недоминируемых стратегий не более чем на единицу.
    В заключение настоящего подраздела еще раз напомним, что в ре- альных рефлексивных играх двух лиц (в том числе – описываемых бимат- ричными играми) тип разыгрываемой игры (ранги рефлексии обоих оппонентов k и l) неизвестны достоверно ни одному из игроков. Поэтому процесс принятия ими решений стоит рассматривать, скорее, не как игру,
    а как рефлексивное принятие решений, которое состоит из двух этапов –
    принятие предположения о значении ранга рефлексии оппонента и выбор соответствующего этому рангу собственного наилучшего ответа. С этой точки зрения результаты, приведенные в настоящей работе, связывают мощности множеств недоминируемых стратегий игроков с максимальны- ми рангами рефлексии, которые имеет смысл рассматривать.
    Литература
    1.
    ВАРШАВСКИЙ В.И., ПОСПЕЛОВ Д.А. Оркестр играет без дириже-
    ра. М.: Наука, 1989. – 208 с.
    2.
    ГЕРМЕЙЕР Ю.Б. Игры с непротивоположными интересами. М.:
    Наука, 1976. – 327 с.
    3.
    ГУБКО М.В., НОВИКОВ Д.А. Теория игр в управлении организацион-
    ными системами. М.: Синтег, 2002. – 148 с.
    4.
    ЛЕФЕВР В.А. Конфликтующие структуры. М.: Советское радио, 1973.
    – 158 с.
    5.
    НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Активный прогноз. М.: ИПУ
    РАН, 2002. – 102 с.
    6.
    НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Рефлексия и ее математиче-
    ское моделирование. Настоящий сборник.
    7.
    ПОДДЪЯКОВ А.Н. Исследовательское поведение: стратегии позна-
    ния, помощь, противодействие, конфликт. Ф-т психологии МГУ
    им. М.В. Ломоносова, 2002. – 189 с.
    8.
    ПОСПЕЛОВ Д.А. Игры рефлексивные / Энциклопедия кибернетики. Т.
    1. Киев: Гл. редакция УСЭ, 1974. С. 343.

    13 9.
    ПОСПЕЛОВ Д.А. Моделирование рассуждений. Опыт анализа мысли-
    тельных актов. М.: Радио и связь, 1989.
    10.
    ЧХАРТИШВИЛИ А.Г. Информационное равновесие / Управление большими системами. Сборник трудов молодых ученых ИПУ РАН. Вы- пуск 3. М.: ИПУ РАН, 2003.
    11.
    MYERSON R.B. Game theory: analysis of conflict. London: Harvard Univ.
    Press, 1991. – 568 p.
    12.
    RAPOPORT A., GUYER M. A taxonomy of 2
    ×
    2 games / General Systems:
    Yearbook of the Society for General Systems Research. 1966. №11. P.203–214.
    написать администратору сайта