Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

WALD-SAVAGE SYNTHETIC CRITERION FOR PLAYING WITH NATURE AND ITS ECONOMIC APPLICATIONS

Gorskiy M.A. 1 Labsker L.G. 1
1 Plekhanov Russian University of Economics
In the game with nature, it`s proposed to use the Wald-Savage synthetic criterion as an optimality principle, which allows to evaluate the optimality of the strategy planned in the game from the synthetic (joint) point of view of wins and risks, which distinguishes it from Wald’s criterion, which allows to evaluate the strategies optimality from the wins position, abstracting from risks, and from the Savage criterion characterizing the optimality in terms of game risks, abstracting from wins. The authors give a definition of a synthesized strategy that is optimal according to the «joint» Wald-Savage criterion and is not optimal, either according to the Wald criterion or Savage criterion. The property of synthesizing the Wald-Savage criterion is considered, the absence of which means that the use of this criterion for the search for synthesized strategies does not make sense. However, usage of the Wald-Savage criterion in this case allows us to reveal the dependence of the Wald – Savage criteria on the determined win indicator. The problem of synthesizing is formulated in the work and its solution is given at the level of substantiating the necessary and sufficient conditions for the Wald-Savage criterion to have no synthesizing property.
game with nature
wald-savage synthetic criterion
synthesized strategy
win indicator
problem of synthesizing the wald-savage criterion
solution to the synthesis problem

Введение

Во многих задачах финансово-экономического содержания принятие решений зависит не только от субъекта, принимающего решение, но и от объективной действительности, о которой у субъекта, принимающего решение, в момент его принятия недостаточно информации. Часто подходящей математической моделью для анализа и решения таких задач служит «Игра с природой» (или в другой терминологии «Статистическая игра»), в которой участвуют два игрока: A – субъект, принимающий рациональные решения, П – природа, представляющая собой объективную действительность, окружающую данную задачу. Природа, не являющаяся ни противником, ни союзником игрока A, в любой момент принимает случайным образом то или иное состояние, не преследуя при этом конкретной цели и оставаясь абсолютно безразличной к результатам игры.

Для принятия решения, которое, как известно, является одной из главных составляющих любого управления, игрок A, будучи рациональным, стремится из возможных альтернативных стратегий выбрать стратегию, максимально отвечающую поставленным целям решения задачи. Для сравнения стратегий по их эффективности необходимо подобрать подходящий принцип оптимальности.

Проблема выбора принципа оптимальности стратегий в играх с природой – одна из центральных в теории принятия решений. Существуют разнообразные критерии оптимальности с различными свойствами. Некоторые из них, выигрыш-критерии, определяют оптимальность выбираемых стратегий с точки зрения выигрышей, абстрагируясь от рисков. Например, критерий Вальда [1; 2], максимаксный критерий [2] и др. Другие, риск-критерии, – наоборот, характеризуют оптимальность стратегий с позиций рисков, абстрагируясь от выигрышей. Например, критерий Сэвиджа [2, 3]; миниминный критерий [2] и др. Широко используются комбинированные критерии, составленные из двух выигрыш-критериев или двух риск-критериев. В каждой такой паре один из критериев является крайне пессимистическим, а другой – крайне оптимистическим. Например, классический выигрыш-критерий Гурвица [4, 5].

На наш взгляд заслуживает внимания также и подход выбора стратегии, оптимальной с синтетической (совместной) точки зрения выигрышей и игровых рисков. Такие критерии оптимальности будем называть синтетическими. В [2, 6, 7] предложен общий подход к конструированию синтетических критериев и приведены формулы показателей эффективности стратегий по различным синтетическим критериям. В работах [6, 8, 9] введен в рассмотрение синтетический критерий Вальда-Сэвиджа, проведен его детальный математический анализ и предложено приложение к решению задачи об установлении приоритетного порядка кредитования потенциальных корпоративных заемщиков банка.

Для описания критерия Вальда-Сэвиджа напомним кратко необходимые определения.

Критерий Вальда-Сэвиджа. Пусть в игре с природой игрок A обладает множеством gor01.wmf (В обозначении Sp буква "p" – первая буква английского pure – чистый. Она указывает на то, что рассматриваемые в данной статье стратегии А1, А2,…, Ат являются чистыми, а не смешанными, т.е. выбираются игроком A определенным образом без примесей случайности и неопределенности), m ≥ 2, альтернативных чистых стратегий, а П1, П2,…, Пn, n ≥ 2, – состояния природы П. Пусть действительные числа aij, gor03.wmf, gor04.wmf, – выигрыши игрока A в игровой ситуации (Ai, Пj), когда игрок A выбирает стратегию Ai, а природа находится в состоянии Пj. Величину gor05.wmf, gor06.wmf, назовем показателем благоприятности состояния Пj. Выбор игроком A стратегии Ai, когда природа находится в состоянии Пj, сопровождается риском gor07.wmf gor08.wmf, не получения игроком A наибольшего при состоянии природы Пj выигрыша βj [2]. Таким образом, риск rij количественно характеризует упущенную игроком A возможность (при выборе им стратегии Ai) получения максимального выигрыша βj при нахождении природы в состоянии Пj и может интерпретироваться как своеобразная плата за отсутствие у игрока A информации о состоянии природы при выборе им стратегии Ai.

Критерий Вальда (W-критерий) описывается составляющими: gor09.wmf – показатель эффективности (W-показатель) стратегии Ai, gor10.wmf; gor11.wmf-цена (W-цена) игры в чистых стратегиях; Ak-стратегия, оптимальная (W-оптимальная) во множестве Sp чистых стратегий, если gor12.wmf; gor13.wmf- множество стратегий, W-оптимальных во множестве Sp чистых стратегий.

Критерий Сэвиджа (Sav-критерий) описывается составляющими: gor14.wmf- показатель неэффективности (Sav-показатель) стратегии Ai, gor15.wmf; gor16.wmf – цена (Sav-цена) игры в чистых стратегиях; Ak-стратегия, оптимальная (Sav-оптимальная) во множестве Sp чистых стратегий, если gor19.wmf; gor20.wmf- множество стратегий, Sav-оптимальных во множестве Sp чистых стратегий.

Далее нам понадобится критерий (–Sav), противоположный критерию Сэвиджа, который определяется следующим образом: gor21.wmf – показатель эффективности ((–Sav)-показатель) стратегии Ai, gor22.wmf; gor23.wmf – цена ((–Sav)-цена) игры в чистых стратегиях; Ak-стратегия, оптимальная ((–Sav)-оптимальная) во множестве Sp чистых стратегий, если gor24.wmf; gor25.wmf – множество стратегий, (–Sav)-оптимальных во множестве Sp чистых стратегий.

Два критерия будем называть эквивалентными во множестве чистых стратегий, если множества оптимальных чистых стратегий по этим критериям совпадают.

Предложение 1. Критерий Сэвиджа и противоположный ему критерий эквивалентны.

Доказательство. Пусть стратегия gor26.wmf. Эта принадлежность по определению оптимальной стратегии эквивалентна равенству gor27.wmf. Отсюда, по определениям (–Sav)-показателя и (–Sav)-цены игры получаем равенство (–Sav)k = gor28.wmf, которое означает, что gor29.wmf. Таким образом, доказано включение

gor30.wmf. (1)

Докажем обратное включение. Пусть gor31.wmf. Тогда gor32.wmf. Отсюда gor33.wmf и, следовательно,gor34.wmf. Итак, доказано включение

gor35.wmf. (2)

Из (1) и (2) следует равенство gor36.wmf, означающее эквивалентность Sav-критерия и (–Sav)-критерия во множестве Sp.

В определении критерия Вальда-Сэвиджа важную роль играют выигрыш-показатель gor37.wmf и риск-показатель gor38.wmf степени предпочтения, отдаваемого игроком A соответственно выигрышам и рискам. Выбор игроком A значения выигрыш-показателя gor39.wmf является субъективным и связан с его психологическими особенностями, определяющими его отношение к выигрышам и рискам.

При α = 0 и, следовательно, 1 – α = 1, игрок A при выборе стратегии абстрагируется от выигрышей, сконцентрировав свое внимание только на рисках. И, наоборот, при α = 1 и, следовательно, 1 – α = 0, игрок A во главу угла ставит выигрыши, абстрагируясь от рисков.

Критерий Вальда-Сэвиджа с выигрыш-показателем gor40.wmf (gor41.wmfкритерий), определяется составляющими: gor42.wmf gor43.wmf- показатель (gor44.wmf-показатель) эффективности стратегии Ai, gor45.wmf; gor46.wmf gor47.wmf- цена (gor48.wmf-цена) игры в чистых стратегиях; стратегию Ak назовем оптимальной (gor49.wmf-оптимальной) во множестве Sp чистых стратегий, если gor50.wmf; gor51.wmf- множество стратегий, gor52.wmf-оптимальных во множестве Sp чистых стратегий.

Очевидно, что при α = 0 критерий Вальда-Сэвиджа превращается в критерий, противоположный критерию Сэвиджа, и, следовательно, по предложению 1, эквивалентен критерию Сэвиджа. При α = 1 критерий Вальда-Сэвиджа превращается в критерий Вальда.

Из определения показателя gor53.wmf эффективности стратегии Ai видно, что он является линейной функцией аргумента gor54.wmf с угловым коэффициентом gor55.wmf. Следовательно, графиком показателя gor56.wmf является отрезок gor57.wmf (обозначаемый двумя его концами) с левым концом gor58.wmf и правым концом gor59.wmf. Тогда графиком цены игры gor60.wmf является, как следует из ее определения, верхняя огибающая m отрезков gor61.wmf, gor62.wmf, и представляющая собой ломаную, состоящую из не более m звеньев, число которых обозначим через gor63.wmf. Очевидно, что gor64.wmf.

Проблема синтезирования оптимальных стратегий критерием Вальда-Сэвиджа

Определение 1. Стратегию, оптимальную по критерию Вальда-Сэвиджа при выигрыш-показателе gor65.wmf, будем называть синтезированной при данном выигрыш-показателе α, если она не является оптимальной ни по критерию Вальда, ни по критерию Сэвиджа,

Определение 2. Будем говорить, что в данной игре критерий Вальда-Сэвиджа при фиксированном значении выигрыш-показателя gor66.wmf обладает свойством синтезирования, если при данном выигрыш-показателе α существует синтезированная стратегия, т.е. gor67.wmf.

Определение 3. Если в данной игре ни при каком значении выигрыш-показателя gor68.wmf не существует синтезированной стратегии, т.е. при любом gor69.wmf каждая стратегия, оптимальная по критерию Вальда-Сэвиджа, оптимальна либо по критерию Вальда, либо (связка «или» используется здесь в неразделительном смысле) по критерию Сэвиджа:

gor70.wmf,

gor71.wmf, (3)

то будем говорить, что в этом случае критерий Вальда-Сэвиджа не обладает свойством синтезирования.

Понятно, что в общем случае не каждая стратегия, оптимальная или по критерию Вальда, или по критерию Сэвиджа, является оптимальной по критерию Вальда-Сэвиджа с некоторым выигрыш-показателем gor72.wmf.

Так как при α = 0 и α = 1 критерий Вальда-Сэвиджа соответственно эквивалентен критерию Сэвиджа и совпадает с критерием Вальда, то при этих значениях выигрыш-показателя критерий Вальда-Сэвиджа свойством синтезирования не обладает. Именно поэтому в определениях 1 и 2 указанные значения выигрыш-показателя исключены из рассмотрения.

В следующем предложении сформулировано еще одно простое условие отсутствия у критерия Вальда-Сэвиджа свойства синтезирования.

Предложение 2. В игре, в которой число m чистых стратегий игрока A равно 2, критерий Вальда-Сэвиджа свойством синтезирования не обладает.

Доказательство. Пусть A1 и A2 – чистые стратегии игрока A. Графики показателей эффективности gor73.wmf и gor74.wmf этих стратегий – отрезки gor75.wmf и gor76.wmf либо совпадают, либо не пересекаются, либо пересекаются.

В первых двух случаях графиком цены игры gor77.wmf является отрезок. Тогда по необходимой части теоремы 11 из [10] в игре существует стратегия, оптимальная и по критерию Вальда, и по критерию Сэвиджа, т.е. выполняется условие

gor78.wmfO. (4)

Из условия (4) по достаточной части теоремы 10 из [10] следует равенство gor79.wmfgor80.wmf, при gor81.wmf, из которого вытекает включение (3), означающее по определению 3, что gor82.wmf-критерий свойством синтезирования не обладает.

Если же отрезки gor83.wmf и gor84.wmf пересекаются, то очевидно, что выполняется включение (3), из которого по определению 3 также следует, что критерий Вальда-Сэвиджа свойством синтезирования не обладает.

Таким образом, при α = 0 или α = 1, или m = 2 никакого синтезирования быть не может. Значит, ожидать синтезированное решение в результате применения критерия Вальда-Сэвиджа можно только при выигрыш-показателях gor85.wmf и при числе чистых стратегий m ≥ 3, что мы и будем предполагать в дальнейшем.

Из определения критерия Вальда-Сэвиджа [11, 12] следует, что его предназначение состоит в синтезировании крайне высоких предпочтений, отдаваемых лицом, принимающим решение, выигрышам (α = 1 и в этом случае им используется критерий Вальда) и рискам (α = 0 и в этом случае используется критерий Сэвиджа). В связи с этим возникает вопрос. В любой ли игре (при условиях gor86.wmf и m ≥3) критерий Вальда-Сэвиджа обладает свойством синтезирования?

Таким образом, возникает проблема синтезирования критерием Вальда-Сэвиджа. В настоящей статье дано решение этой проблемы: найдены необходимые и достаточные условия игры с природой, для которой критерий Вальда-Сэвиджа свойством синтезирования не обладает, и, следовательно, применять его для отыскания синтезированных стратегий не имеет смысла [13, 14, 15]. Тем не менее, решение, полученное в результате применения критерия Вальда-Сэвиджа, выявляет зависимость стратегий, оптимальных или по критерию Вальда, или по критерию Сэвиджа от значений выигрыш-показателя gor87.wmf. Приложение полученных результатов иллюстрируется на примере задачи с экономическим содержанием.

Решение проблемы синтезирования критерием Вальда-Сэвиджа. В доказательстве предложения 2 было показано, что при условии (4), т.е. при условии существования стратегии, оптимальной и по критерию Вальда и по критерию Сэвиджа, критерий Вальда-Сэвиджа свойством синтезирования не обладает. Поэтому в дальнейшем будем предполагать, что такой стратегии не существует, т.е.

gor88.wmfO. (5)

Условие (5) эквивалентно невыполнению условия (4), которое эквивалентно равенству l = 1. Следовательно, условие (5) эквивалентно тому, что l ≠ 1 или, что то же l ≥ 2. Таким образом, отсутствие в игре стратегии, оптимальной и по критерию Вальда, и по критерию Сэвиджа, эквивалентно тому, что ломаная, представляющая график цены игры gor89.wmf, состоит из не менее двух звеньев: l ≥ 2.

Если каждая чистая стратегия оптимальна по критерию Вальда или по критерию Cэвиджа: gor90.wmf, то критерий Вальда-Сэвиджа не обладает свойством синтезирования. Поэтому далее будем считать, что существуют стратегии, не являющиеся оптимальными ни по критерию Вальда, ни по критерию Сэвиджа:

gor91.wmf. (6)

Пусть gor92.wmf – множество стратегий, оптимальных по критерию Сэвиджа во множестве gor93.wmf стратегий, оптимальных по критерию Вальда, и gor94.wmf – цена игры по критерию Сэвиджа в стратегиях множества gor95.wmf; gor96.wmf – множество стратегий, оптимальных по критерию Вальда во множестве gor97.wmf стратегий, оптимальных по критерию Сэвиджа, и gor98.wmf – цена игры по критерию Вальда в стратегиях множества gor99.wmf.

Нетрудно видеть, что множества gor100.wmf и gor101.wmf не пусты и справедливы включения gor102.wmf и gor103.wmf.

Графики показателей эффективности gor104.wmf всех стратегий gor105.wmf совпадают и представляют собой отрезок с левым концом gor106.wmf и правым концом gor107.wmf, т.е. отрезок gor108.wmf (см. рис. 1).

Аналогично, графики показателей эффективности gor109.wmf всех стратегий gor110.wmf совпадают и представляют собой отрезок с левым концом gor111.wmf и правым концом gor112.wmf, т.е. отрезок gor113.wmf (см. рис. 1).

Gors1.tif

Рис. 1. Графики показателей эффективности стратегий в случае, когда ломаная, представляющая график цены игры по критерию Вальда-Сэвиджа, состоит из трех звеньев (l = 3)

Определение 4. В предположении выполнения условия (6), будем говорить, что игра удовлетворяет условию gor114.wmf, если для каждой чистой стратегии Ak, не являющейся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа (существующей в силу условия (6)), т.е. для которой выполняется условие

gor115.wmf, (7)

справедливо неравенство

gor116.wmfgor117.wmf. (8)

Отметим, что для стратегии gor118.wmf неравенство (8) не выполняется, поскольку в этом случае gor119.wmf и gor120.wmf, и, следовательно, левая и правая части неравенства (8) превращаются в нули.

Далее нам понадобится следующее предложение, доказанное в [10, лемма 3].

Предложение 3. Пусть выполняется условие (5) и пусть gor121.wmf и gor122.wmf. Тогда отрезки gor123.wmf и gor124.wmf = gor125.wmf не совпадают и пересекаются в точке gor126.wmf с абсциссой

gor127.wmf, (9)

и ординатой

gor128.wmf (10)

(см. рис. 1).

Необходимые условия отсутствия у критерия Вальда-Сэвиджа свойства синтезирования даны в следующей теореме.

Теорема 1 (необходимые условия отсутствия синтезирования). Пусть в игре не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа, т.е. выполняется условие (5), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. выполняется условие (6).

Тогда если в данной игре критерий Вальда-Сэвиджа не обладает свойством синтезирования, то справедливы следующие утверждения:

а) число l звеньев ломаной, представляющей график цены игры по критерию Вальда-Сэвиджа gor129.wmf, равно 2;

b) игра удовлетворяет условию gor130.wmf;

c) множество gor131.wmf стратегий, оптимальных по критерию Вальда-Сэвиджа, имеет следующую структуру

gor132.wmf (11)

где gor133.wmf определяется формулой (9).

Доказательство. Докажем утверждение a). Как было показано выше, условие (5) эквивалентно тому, что l ≥ 2. Предположим противное утверждению a): l ≠ 2. Тогда l ≥ 3.

В этом случае найдется стратегия Ak, такая, что отрезок gor134.wmf, являющийся графиком показателя эффективности gor135.wmf, будет пересекать отрезок gor136.wmf во внутренней его точке N1, порождая звено N1N2 ломаной gor137.wmf (см. рис. 1). Отрезок gor138.wmf является первым (слева направо) звеном ломаной gor139.wmf. Точка N2 является концом второго звена и началом третьего звена (На рис. 1 приведен случай l = 3; ломаная gor140.wmf, выделенная жирной линией, состоит из трех звеньев gor141.wmf, gor142.wmf и gor143.wmf).

По определению Sav-цены игры, gor144.wmf. Но gor145.wmf, поскольку в противном случае было бы справедливо равенство gor146.wmf и тогда отрезок gor147.wmf не мог бы пересечь отрезок gor148.wmf во внутренней его точке N1. Таким образом, имеет место неравенство gor149.wmf, означающее, что стратегия Ak не является Sav-оптимальной:

gor150.wmf. (12)

Справедливо неравенство

gor151.wmf, (13)

поскольку в противном случае: gor152.wmf и тогда отрезок gor153.wmf не мог бы пересекать отрезок gor154.wmf во внутренней его точке N1 (см. рис. 1).

По определению W-цены игры gor156.wmf. Но gor157.wmf, поскольку в противном случае стратегия gor158.wmf и по определению цены игры в стратегиях множества gor159.wmf по критерию Сэвиджа gor160.wmf, откуда следует неравенство gor161.wmf, противоречащее неравенству (13). Таким образом, gor162.wmf и, следовательно, стратегия Ak не является W-оптимальной:

gor163.wmf. (14)

Пусть α1 и α2 – абсциссы соответственно левого и правого концов второго звена ломаной gor164.wmf (см. рис. 1). Тогда при каждом значении выигрыш-показателя gor165.wmf критерий Вальда-Сэвиджа будет обладать свойством синтезирования, так как при каждом gor166.wmf, будем иметь gor167.wmf, т.е. стратегия Ak является gor168.wmf-оптимальной, но не является оптимальной ни по критерию Вальда (см. (14)), ни по критерию Сэвиджа (см. (12)). Но это противоречит условию теоремы.

Полученное противоречие доказывает, что l = 2. Утверждение a) доказано.

Докажем утверждение b). По доказанному утверждению a) число звеньев ломаной gor169.wmf равно 2 (l = 2). Символический вид этой ломаной изображен на рис. 2 (выделена жирной линией).

Пусть Ak – произвольная чистая стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. удовлетворяющая условию (7) (существование таких стратегий обусловлено требованием (6)). Графиком показателя эффективности этой стратегии по критерию Вальда-Сэвиджа gor170.wmf является отрезок gor171.wmf (обозначаемый его концами).

Gors2.tif

Рис. 2. Графики показателей эффективности стратегий в случае, когда ломаная, представляющая график цены игры по критерию Вальда-Сэвиджа, состоит из двух звеньев (l = 2)

Докажем, что значение gor172.wmf показателя эффективности gor173.wmf стратегии Ak при выигрыш-показателе gor174.wmf меньше, чем ордината gor175.wmf точки N:

gor176.wmf (15)

(на рис. 2 gor177.wmf, где gor178.wmf – длина отрезка gor179.wmf).

Левый конец gor180.wmf этого отрезка не может равняться gor181.wmf:

gor182.wmf, (16)

поскольку в противном случае стратегия gor183.wmf, что противоречит условию (7). Аналогично, правый конец gor184.wmf отрезка gor185.wmf не может совпадать с gor186.wmf:

gor187.wmf. (17)

ибо в противном случае gor188.wmf, что также противоречит (7).

Левый конец gor189.wmf отрезка gor190.wmf, в силу определения gor191.wmf, не может быть больше gor192.wmf

gor193.wmf, (18)

а правый конец gor194.wmf этого отрезка, в силу определению gor195.wmf, не может быть больше gor196.wmf:

gor197.wmf. (19)

Из неравенств (16), (17), (18) и (19) следует, что отрезок gor198.wmf не может пересекать только один из отрезков gor199.wmf или gor200.wmf.

Отрезок gor201.wmf не может пересекать оба отрезка gor202.wmf и gor203.wmf, ибо в противном случае ломаная gor204.wmf имела бы 3 звена, что противоречит утверждению a).

Отрезок gor205.wmf не может иметь с отрезками gor206.wmf и gor207.wmf единственную общую точку N. В самом деле, если отрезок gor208.wmf проходит через точку N и не имеет других общих точек ни с отрезком gor209.wmf, ни с отрезком gor210.wmf, то gor211.wmf, т.е. gor212.wmf. Таким образом, стратегия Ak оптимальна во множестве чистых стратегий по критерию Вальда-Сэвиджа при выигрыш-показателе gor213.wmf и не оптимальна ни по критерию Вальда, ни по критерию Сэвиджа. А это означает, что критерий Вальда Сэвиджа при выигрыш-показателе gor214.wmf обладает свойством синтезирования, что противоречит условию теоремы.

Итак, мы показали, что отрезок gor215.wmf лежит ниже точки N. Этим доказано неравенство (15).

Левую часть неравенства (15) заменим по ее определению, а вместо выигрыш-показателя gor216.wmf и ординаты gor217.wmf подставим их значения соответственно по формулам (9) и (10); в результате получим:

gor218.wmf gor219.wmf

gor220.wmf. (20)

Из того, что gor221.wmf (см. (9)) и gor222.wmf следует, что gor223.wmf. Поэтому обе части неравенства (20) можем умножить на этот знаменатель, после чего элементарными преобразованиями получаем неравенство (8).

Таким образом, мы показали, что для любой стратегии, не являющейся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, справедливо неравенство (8), т.е. игра удовлетворяет условию gor224.wmf. Утверждение b) доказано.

Для доказательства утверждения c) отметим, что оно, как было доказано в [10], следует из утверждения b).

Таким образом, теорема доказана.

Теорема 2 (достаточные условия отсутствия синтезирования). Пусть в игре не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа, т.е. выполняется условие (6), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. выполняется условие (7). Тогда из каждого из следующих условий следует, что критерий Вальда-Сэвиджа не обладает свойством сглаживания:

a) игра удовлетворяет условию gor225.wmf;

b) множество gor226.wmf стратегий, оптимальных по критерию Вальда-Сэвиджа, имеет структуру (11).

Доказательство. Докажем, что из условия a) следует утверждение теоремы.

Допустим противное утверждению теоремы, т.е. допустим, что существуют значение выигрыш-показателя gor227.wmf и стратегия Ak, удовлетворяющая условию (7) (такие стратегии существуют в силу условия (6)), которая является gor228.wmf-оптимальной:

gor229.wmf. (21)

Из принадлежности (21), по определению оптимальности стратегии, следует равенство gor230.wmf, означающее, что при α = αk отрезок, представляющий график показателя эффективности gor231.wmf стратегии Ak, имеет общую точку с ломаной, представляющей график цены игры gor232.wmf по критерию Вальда-Сэвиджа.

В силу условия (5) количество звеньев ломаной gor233.wmf не меньше 2 (l ≥ 2) и, следовательно, отрезки gor234.wmf и gor235.wmf не совпадают и пересекаются в точке N (см. рис. 3, на котором число звеньев l = 4). В силу условия (7), отрезок gor236.wmf не может совпадать ни с одним из отрезков gor237.wmf и gor238.wmf и также не может пересекать только один из отрезков gor239.wmf или gor240.wmf, поскольку из (7) следует, что gor241.wmf и потому gor242.wmf, а также gor243.wmf (см. рис. 3).

Gors3.tif

Рис. 3. Графики показателей эффективности оптимальных стратегий по критерию Вальда-Сэвиджа в случае, когда ломаная, представляющая график цены игры, состоит из четырёх звеньев (l = 4)

Если отрезок gor244.wmf пересекает оба отрезка gor245.wmf и gor246.wmf и занимает, например, положение отрезка gor247.wmfgor248.wmf (см. рис. 3), то

gor249.wmf, (22)

где gor250.wmf – ордината точки N (на рис. 3, gor252.wmfgor253.wmf, где gor254.wmf- длина отрезка gor255.wmf.

Если отрезок gor256.wmf имеет с отрезками gor257.wmf и gor258.wmf единственную общую точку N и занимает, например, положение отрезка gor259.wmfgor260.wmf (см. рис. 3), то

gor261.wmf. (23)

Оба случая (22) и (23) можно объединить одним неравенством gor262a.wmf gor262aa.wmf. Подставляя в это неравенство выражения для gor263.wmf и gor264.wmf по формулам соответственно (9) и (10), получим

gor265.wmf

gor266.wmf. (24)

При доказательстве утверждения b) теоремы 1 была доказана положительность знаменателя в неравенстве (24). Умножая обе части этого неравенства на знаменатель и проведя элементарные преобразования, получим неравенство

gor267.wmfgor268.wmf,

которое противоречит неравенству (8). Следовательно, отрезок gor269.wmf не имеет общих точек с ломаной, являющейся графиком цены игры, и потому стратегия Ak не является оптимальной по критерию Вальда-Сэвиджа. Таким образом, критерий Вальда-Сэвиджа не обладает свойством синтезирования.

Итак, доказано, что из условия a) следует утверждение теоремы.

Теперь докажем, что утверждение теоремы следует также и из условия b). Пусть множество оптимальных стратегий по критерию Вальда-Сэвиджа имеет структуру (11) и пусть Ak – произвольная стратегия, оптимальная по критерию Вальда-Сэвиджа при некотором значении выигрыш-показателя gor270.wmf: gor271.wmf.

Из структуры (11) очевидным образом вытекают следующие утверждения: если gor272.wmf, то gor273.wmf; если gor274.wmf, то gor275.wmf; если gor276.wmf, то gor277.wmf. Таким образом, справедливо включение gor278.wmfgor279.wmf, означающее отсутствие у критерия Вальда-Сэвиджа свойства синтезирования. Теорема доказана.

Из теорем 1 и 2 следует, что каждое из утверждений a) и b) теоремы 2 является необходимым и достаточным условием того, что критерий Вальда-Сэвиджа не обладает свойством синтезирования.

Условие a) теоремы 1, являясь необходимым условием отсутствия у критерия Вальда-Сэвиджа свойства синтезирования, не является достаточным. Для доказательства этого приведем следующий пример.

Пример 1. Пусть игра с природой задается матрицей А размера 3×2, в последней добавленной строке которой проставлены показатели благоприятности состояний природы gor280.wmf, j = 1, 2, а в последнем добавленном столбце – W-показатели стратегий и W-цена игры. По матрице А высчитываем риски gor281.wmf i = 1, 2, 3; j = 1, 2, и формируем матрицу рисков R, в последнем добавленном столбце которой стоят Sav-показатели стратегий и Sav-цена игры.

 

А    =

               Пj

Ai

              П1

               П2

Wi

A1

  3   

4

3

A2

10

–1

–1

A3

4

1

1

 

βj

10

4

gor284.wmf

 

R =   

                             Пj

Ai

         П1

         П2

Savi

A1

7

0

7

A2

0

5

5

A3

6

3

6

 

 

gor285.wmf

 

На рис. 4 представлены отрезки gor286.wmf, i = 1, 2, 3, являющиеся графиками показателей эффективности gor287.wmf стратегий Ai. Отрезки gor288.wmf, i = 1, 2, пересекаются в точке gor289.wmf с абсциссой gor290.wmf и ординатой gor291.wmf, образуя ломаную gor292.wmf (выделенную на рис. 4 жирной линией), представляющую график цены игры gor293.wmf по критерию Вальда-Сэвиджа и состоящую из двух звеньев gor294.wmf и gor295.wmf (l = 2).

Абсцисса gor296.wmf и ордината gor297.wmf вычисляются соответственно по формулам (9) и (10).Очевидно, что gor298.wmf; gor299.wmf; gor300.wmf; gor301.wmf; gor302.wmf; gor303.wmf. Тогда по формулам (9) и (10) будем иметь: gor304.wmf, gor305.wmf.

Стратегия A3 не является оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. она удовлетворяет условию (10), поскольку (как явствует из последних дополнительных столбцов матриц A и R) gor306.wmf и gor307.wmf (на рис. 4 левый конец (gor308.wmf) отрезка gor309.wmf лежит ниже gor310.wmf, а правый конец W3 = 1 отрезка gor311.wmf – ниже gor312.wmf).

Gors4.tif

Рис. 4. Геометрическая интерпретация примера

Показатель эффективности стратегии A3 при выигрыш-показателе gor313.wmf равен gor314.wmf. В самом деле,

gor315.wmf.

Таким образом, стратегия A3, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, оптимальна по синтетическому критерию Вальда-Сэвиджа при выигрыш-показателе gor316.wmf и, следовательно, критерий Вальда-Сэвиджа в данной игре обладает свойством синтезирования

Итак, в данной игре ломаная, представляющая график цены игры, состоит из двух звеньев, но, тем не менее, критерий Вальда-Сэвиджа обладает свойством синтезирования.

Иллюстрация применения полученных результатов. Применение полученных результатов проиллюстрируем на решении следующей задачи оптимального планирования производства.

Постановка задачи. Для изготовления X единиц определенной продукции должен быть выбран один из четырех возможных технологических способов. Потребность в этой продукции носит случайный характер и, как показывает прошлый опыт, может принимать значения 25, 35, 45 или 50 единиц. Производственные затраты TCi на изготовление X единиц продукции i-м (i = 1, 2, 3, 4) технологическим способом включают постоянные затраты, соответственно: Q1 = 145, Q2 = 70, Q3 = 180, Q4 = 110 условных денежных единиц (у.д.е) и удельные переменные затраты, соответственно: c1 = 3, c2 = 5, c3 = 2, c4 = 4 условных денежных единиц (у.д.е). Общие затраты на производство продукции объемом Х по i-му технологическому способу выражаются формулой:

gor317.wmf, i = 1, 2, 3, 4. (25)

Ставится задача выбора одного из четырех технологических способов изготовления продукции с критерием на минимум производственных затрат.

Решение. Для анализа задачи адекватной является модель «Игры с природой», в которой рациональным игроком A выступает предприятие, а природой выступает потребность в изготавливаемой продукции. Игрок A располагает четырьмя чистыми стратегиями Ai, i = 1, 2, 3, 4 – выбрать для изготовления продукции i-й технологический способ, а «природа» может находится в одном из четырех состояниях: П1 = 25, П2 = 35, П3 = 45 и П5 = 50 единиц потребляемой продукции. В модели в качестве выигрышей aij (i, j = 1, 2, 3, 4) игрока A в игровой ситуации (Ai, Пj): игрок A выбирает стратегию Ai, а природа находится в состоянии Пj, будем рассматривать производственные затраты предприятия, вычисляемые по формуле (25). Таким образом, выигрыши aij (i, j = 1, 2, 3, 4), представляют собой отрицательные величины, которые в обозначениях модели рассчитываются по формуле: gor318.wmf (i, j = 1, 2, 3, 4). На основе рассчитанных выигрышей aij формируем платежную матрицу А. Рассчитываем показатели gor319.wmf (j = 1, 2, 3, 4) благоприятности состояний природы и проставляем их в последней дополнительной строке матрицы А. Подсчитываем риски gor320.wmf (i, j = 1, 2, 3, 4) и формируем матрицу рисков R.

А =      

             Пj

Ai

П1

П2

П3

П4

Wi

A1

-220

-250

-280

-295

-295

A2

-195

-245

-290

-320

-320

A3

-230

-250

-270

-280

-280

A4

-210

-250

-290

-310

-310

 

βj

-195

-245

-270

-280

 

 

 

R =          

                Пj

Ai

П1

П2

П3

П4

Savi 

A1

25

5

10

15

25

A2

0

0

20

40

40

A3

35

5

0

0

35

A4

15

5

20

30

30

 

В последних добавленных столбцах матриц А и R проставлены W- и Sav-показатели стратегий. Перед тем как приступить к процедуре нахождения синтезированных стратегий целесообразно выяснить их существование. Для этого используем условие gor321.wmf. Из показателей столбцов «Wi» и «Savi» матриц А и R следует, что

gor322.wmf, gor323.wmf, gor324.wmf,

gor325.wmf, gor326.wmf, gor327.wmf.

Тогда правая часть неравенства (8)

gor328.wmf. (26)

Так как стратегии A2 и A4 не принадлежат множеству gor329.wmf, то левую часть неравенства (8) надо подсчитать только для этих стратегий. Имеем:

gor330.wmf, (27)

gor331.wmf. (28)

Из неравенств (26), (27) и (28) заключаем, что для стратегий A2 и A4 справедливо неравенство (8), т.е. данная игра удовлетворяет условию gor332.wmf. Нетрудно видеть, что выполняются также условия (6) и (7). Таким образом, выполняются условия теоремы 2, в соответствии с которой критерий Вальда-Сэвиджа не обладает свойством синтезирования, т.е. применение критерия Вальда-Сэвиджа ни при каком значении выигрыш-показателя gor333.wmf не приводит к синтезированным решениям и каждая стратегия, оптимальная по критерию Вальда-Сэвиджа, оптимальна либо по критерию Вальда, либо по критерию Сэвиджа. По формуле (9) gor334.wmf. Используя формулу (11), получим следующую структуру множества оптимальных не синтезированных стратегий по критерию Вальда-Сэвиджа

gor335.wmf

Условно-геометрическая интерпретация данной задачи представлена на рис. 5.

Найденное решение экономически можно проинтерпретировать следующим образом.

Gors5.tif

Рис. 5. Геометрическое представление задачи

Если значение выигрыш-показателя α находится в пределах 0 ≤  α < 0,4, то критерий Вальда-Сэвиджа рекомендует для изготовления продукции в качестве оптимального выбрать 1-й технологический способ (стратегия A1 в матрице R, оптимальная по критерию Сэвиджа), при котором предприятие гарантирует себе наибольший риск недостижения наименьших затрат при каждой потребности производимой продукции, равный 25 у.д.е (первая строка матрицы R). То есть, при выборе 1-го технологического способа производства риск недостижения наименьших затрат не может быть больше 25 у.д.е. При выборе другого способа производства этот риск может оказаться больше 25 у.д.е. Действительно, например, при выборе 2-го, 3-го или 4-го способа производства и при потребности соответственно в 50, 25 и 50 единиц продукции риск будет равен соответственно 40, 35 и 30 у.д.е (см. игровые ситуации (A2, П4), (A3, П1), (A4, П4) в матрице рисков R). Принятое решение является крайне пессимистическим относительно рисков, поскольку выбору 1-го технологического способа производства сопутствует наибольший при этом способе риск в 25 у.д.е.

Если значение выигрыш-показателя α находится в пределах 0,4 < α ≤ 1, то оптимальным по критерию Вальда-Сэвиджа является решение изготавливать продукцию по 3-му технологическому способу (стратегия A3 в матрице А оптимальна по критерию Вальда). При этом затраты предприятия при любой потребности в продукции составят не более 280 у.д.е. Если предприятие отклонится от оптимального решения и выберет 1-й, 2-й или 4-й способ производства, то при потребности в продукции в 50 единиц затраты составят соответственно 295, 320 или 310 у.д.е (см. игровые ситуации (A1, П4), (A2, П4), (A4, П4) в платежной матрице А). Принятое решение крайне пессимистично относительно издержек, так как при 3-м способе производства издержки в 280 у.д.е являются максимальными при этом способе производства.

Если α = 0,4 то с точки зрения критерия Вальда-Сэвиджа равноценными являются 1-й или 3-й способы производства.

Заключение

В статье рассмотрена проблематика корректности использования в процедурах выбора управленческих решений в условиях неопределенности, моделируемых в терминах «игры с природой», синтетического критерия, обобщающего свойства критериев, характеризующих принимаемое решение и с позиции возможного выигрыша, и с позиции возможного риска. Актуальность использования синтетического критерия связывается с необходимостью оценок качества принимаемого решения в условиях высокой неопределенности как в отношении выигрышей, так и сопровождающих их рисков. Предложенная интерпретация свойства синтезирования обобщенного критерия Вальда-Сэвиджа и доказанные условия наличия качества синтезирования этих критериев позволяют лицу, принимающему решения, обоснованно применять или не применять его в оценках игровой ситуации и при выборе окончательного решения.