Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

СИНТЕТИЧЕСКИЙ КРИТЕРИЙ ВАЛЬДА-СЭВИДЖА ДЛЯ ИГРЫ С ПРИРОДОЙ И ЕГО ЭКОНОМИЧЕСКИЕ ПРИЛОЖЕНИЯ

Горский М.А. 1 Лабскер Л.Г. 1
1 Российский экономический университет им. Г.В. Плеханова
В игре с природой в качестве принципа оптимальности предлагается использовать синтетический критерий Вальда-Сэвиджа, позволяющий оценивать оптимальность планируемой в игре стратегии с синтетической (совместной) точки зрения выигрышей и рисков, что отличает его от критерия Вальда, позволяющего оценить оптимальность стратегий с позиции выигрышей, абстрагируясь от рисков, и от критерия Сэвиджа, характеризующего оптимальность с позиции игровых рисков, абстрагируясь от выигрышей. Авторы приводят определение синтезированной стратегии, являющейся оптимальной по «совместному» критерию Вальда-Сэвиджа и не являющейся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа. Рассматривается свойство синтезирования критерия Вальда-Сэвиджа, отсутствие которого означает, что применение этого критерия для поиска синтезированных стратегий не имеет смысла. Однако, использование критерия Вальда-Сэвиджа в этом случае позволяет выявить зависимость критериев Вальда и Сэвиджа от определяемого выигрыш-показателя. В работе формулируется проблема синтезирования и дается ее решение на уровне обоснования необходимых и достаточных условий отсутствия у критерия Вальда-Сэвиджа свойства синтезирования. Применение полученных результатов иллюстрируется на примере задачи с экономическим содержанием, связанной с выбором оптимального технологического способа производства продукции.
игра с природой
синтетический критерий вальда-сэвиджа
синтезированная стратегия
выигрыш-показатель
проблема синтезирования критерием вальда-сэвиджа
решение проблемы синтезирования
1. Wald A. Statistical decision functions. N.Y.: Wiley; L., Chapman & Hall, 1950.
2. Лабскер Л.Г. Теория критериев оптимальности и экономические решения. Монография. М.: КНОРУС, 2014.
3. Savage L.J. The theory of statistical decision // J. Amer. Statist. Assoc, 1951. Vol. 46. No. 1. Р. 55-67.
4. Hurwicz L. Optimality Criteria for Decision Making under Ignorance // Cowles commission papers, 1951. № 370.
5. Arrow K.J., Hurwicz L. An optimality criterion for decision making under ignorance // Uncertainty and expectations in economics. Oxford: Basil Blackwell and Mott, 1972.
6. Горский М.А. Модели и методы оптимального управления кредитным портфелем коммерческого банка с расширенным набором критериев. Монография // М.: ФГБОУ ВО «РЭУ им. Г.В. Плеханова», 2016. 188 с.
7. Косоруков О.А., Мищенко А.В. Исследование операций. М.: Экзамен, 2003. 448 с.
8. Лабскер Л.Г., Ященко Н.А., Амелина А.В. Очередность кредитования банком корпоративных заемщиков: формирование приоритетного порядка на основе синтетического критерия Вальда-Сэвиджа. Монография. Saarbrucken (Germany): LAP (LAMBERT Academic Publishing) GmbH & Co. KG, 2012.
9. Gorskiy M.A., Khalikov M.A., Kukharenko A.Yu. Selection of Priority Sequence of Investor’s Portfolio with the Use of the Supply Chain Management in the Criteria of “Against Nature” Game // International Journal of Supply Chain Management, 2019. Vol. 8. № 3.
10. Лабскер Л.Г., Ященко Н.А. К вопросу о доказательстве теоремы о структуре множества стратегий, оптимальных по критерию Вальда-Сэвиджа // Наука и Мир. Международный научный журнал. 2013. № 1 (1). С. 158-167.
11. Захаров А.В. Теория игр в общественных науках: учебник для вузов. М.: Изд. дом Высшей школы экономики, 2015. 304 с.
12. Вальд А. Статистические решающие функции // Сб. Позиционные игры. М., 1967, С. 300-522.
13. Кухаренко А.Ю., Халиков М.А. Выбор портфеля неинституционального инвестора с использованием критерия Вальда – Сэвиджа // Фундаментальные исследования. 2019. № 5. С. 62-68.
14. Буянов В.П., Кирсанов К.А., Михайлов Л.М. Рискология. Управление рисками. М.: Экзамен, 2003, 384 с.
15. Петросян Л.А., Зенкевич Н. А, Оптимальный поиск в условиях конфликта. Л.: ЛГУ, 1987. 75 с.

Введение

Во многих задачах финансово-экономического содержания принятие решений зависит не только от субъекта, принимающего решение, но и от объективной действительности, о которой у субъекта, принимающего решение, в момент его принятия недостаточно информации. Часто подходящей математической моделью для анализа и решения таких задач служит «Игра с природой» (или в другой терминологии «Статистическая игра»), в которой участвуют два игрока: A – субъект, принимающий рациональные решения, П – природа, представляющая собой объективную действительность, окружающую данную задачу. Природа, не являющаяся ни противником, ни союзником игрока A, в любой момент принимает случайным образом то или иное состояние, не преследуя при этом конкретной цели и оставаясь абсолютно безразличной к результатам игры.

Для принятия решения, которое, как известно, является одной из главных составляющих любого управления, игрок A, будучи рациональным, стремится из возможных альтернативных стратегий выбрать стратегию, максимально отвечающую поставленным целям решения задачи. Для сравнения стратегий по их эффективности необходимо подобрать подходящий принцип оптимальности.

Проблема выбора принципа оптимальности стратегий в играх с природой – одна из центральных в теории принятия решений. Существуют разнообразные критерии оптимальности с различными свойствами. Некоторые из них, выигрыш-критерии, определяют оптимальность выбираемых стратегий с точки зрения выигрышей, абстрагируясь от рисков. Например, критерий Вальда [1; 2], максимаксный критерий [2] и др. Другие, риск-критерии, – наоборот, характеризуют оптимальность стратегий с позиций рисков, абстрагируясь от выигрышей. Например, критерий Сэвиджа [2, 3]; миниминный критерий [2] и др. Широко используются комбинированные критерии, составленные из двух выигрыш-критериев или двух риск-критериев. В каждой такой паре один из критериев является крайне пессимистическим, а другой – крайне оптимистическим. Например, классический выигрыш-критерий Гурвица [4, 5].

На наш взгляд заслуживает внимания также и подход выбора стратегии, оптимальной с синтетической (совместной) точки зрения выигрышей и игровых рисков. Такие критерии оптимальности будем называть синтетическими. В [2, 6, 7] предложен общий подход к конструированию синтетических критериев и приведены формулы показателей эффективности стратегий по различным синтетическим критериям. В работах [6, 8, 9] введен в рассмотрение синтетический критерий Вальда-Сэвиджа, проведен его детальный математический анализ и предложено приложение к решению задачи об установлении приоритетного порядка кредитования потенциальных корпоративных заемщиков банка.

Для описания критерия Вальда-Сэвиджа напомним кратко необходимые определения.

Критерий Вальда-Сэвиджа. Пусть в игре с природой игрок A обладает множеством gor01.wmf (В обозначении Sp буква "p" – первая буква английского pure – чистый. Она указывает на то, что рассматриваемые в данной статье стратегии А1, А2,…, Ат являются чистыми, а не смешанными, т.е. выбираются игроком A определенным образом без примесей случайности и неопределенности), m ≥ 2, альтернативных чистых стратегий, а П1, П2,…, Пn, n ≥ 2, – состояния природы П. Пусть действительные числа aij, gor03.wmf, gor04.wmf, – выигрыши игрока A в игровой ситуации (Ai, Пj), когда игрок A выбирает стратегию Ai, а природа находится в состоянии Пj. Величину gor05.wmf, gor06.wmf, назовем показателем благоприятности состояния Пj. Выбор игроком A стратегии Ai, когда природа находится в состоянии Пj, сопровождается риском gor07.wmf gor08.wmf, не получения игроком A наибольшего при состоянии природы Пj выигрыша βj [2]. Таким образом, риск rij количественно характеризует упущенную игроком A возможность (при выборе им стратегии Ai) получения максимального выигрыша βj при нахождении природы в состоянии Пj и может интерпретироваться как своеобразная плата за отсутствие у игрока A информации о состоянии природы при выборе им стратегии Ai.

Критерий Вальда (W-критерий) описывается составляющими: gor09.wmf – показатель эффективности (W-показатель) стратегии Ai, gor10.wmf; gor11.wmf-цена (W-цена) игры в чистых стратегиях; Ak-стратегия, оптимальная (W-оптимальная) во множестве Sp чистых стратегий, если gor12.wmf; gor13.wmf- множество стратегий, W-оптимальных во множестве Sp чистых стратегий.

Критерий Сэвиджа (Sav-критерий) описывается составляющими: gor14.wmf- показатель неэффективности (Sav-показатель) стратегии Ai, gor15.wmf; gor16.wmf – цена (Sav-цена) игры в чистых стратегиях; Ak-стратегия, оптимальная (Sav-оптимальная) во множестве Sp чистых стратегий, если gor19.wmf; gor20.wmf- множество стратегий, Sav-оптимальных во множестве Sp чистых стратегий.

Далее нам понадобится критерий (–Sav), противоположный критерию Сэвиджа, который определяется следующим образом: gor21.wmf – показатель эффективности ((–Sav)-показатель) стратегии Ai, gor22.wmf; gor23.wmf – цена ((–Sav)-цена) игры в чистых стратегиях; Ak-стратегия, оптимальная ((–Sav)-оптимальная) во множестве Sp чистых стратегий, если gor24.wmf; gor25.wmf – множество стратегий, (–Sav)-оптимальных во множестве Sp чистых стратегий.

Два критерия будем называть эквивалентными во множестве чистых стратегий, если множества оптимальных чистых стратегий по этим критериям совпадают.

Предложение 1. Критерий Сэвиджа и противоположный ему критерий эквивалентны.

Доказательство. Пусть стратегия gor26.wmf. Эта принадлежность по определению оптимальной стратегии эквивалентна равенству gor27.wmf. Отсюда, по определениям (–Sav)-показателя и (–Sav)-цены игры получаем равенство (–Sav)k = gor28.wmf, которое означает, что gor29.wmf. Таким образом, доказано включение

gor30.wmf. (1)

Докажем обратное включение. Пусть gor31.wmf. Тогда gor32.wmf. Отсюда gor33.wmf и, следовательно,gor34.wmf. Итак, доказано включение

gor35.wmf. (2)

Из (1) и (2) следует равенство gor36.wmf, означающее эквивалентность Sav-критерия и (–Sav)-критерия во множестве Sp.

В определении критерия Вальда-Сэвиджа важную роль играют выигрыш-показатель gor37.wmf и риск-показатель gor38.wmf степени предпочтения, отдаваемого игроком A соответственно выигрышам и рискам. Выбор игроком A значения выигрыш-показателя gor39.wmf является субъективным и связан с его психологическими особенностями, определяющими его отношение к выигрышам и рискам.

При α = 0 и, следовательно, 1 – α = 1, игрок A при выборе стратегии абстрагируется от выигрышей, сконцентрировав свое внимание только на рисках. И, наоборот, при α = 1 и, следовательно, 1 – α = 0, игрок A во главу угла ставит выигрыши, абстрагируясь от рисков.

Критерий Вальда-Сэвиджа с выигрыш-показателем gor40.wmf (gor41.wmfкритерий), определяется составляющими: gor42.wmf gor43.wmf- показатель (gor44.wmf-показатель) эффективности стратегии Ai, gor45.wmf; gor46.wmf gor47.wmf- цена (gor48.wmf-цена) игры в чистых стратегиях; стратегию Ak назовем оптимальной (gor49.wmf-оптимальной) во множестве Sp чистых стратегий, если gor50.wmf; gor51.wmf- множество стратегий, gor52.wmf-оптимальных во множестве Sp чистых стратегий.

Очевидно, что при α = 0 критерий Вальда-Сэвиджа превращается в критерий, противоположный критерию Сэвиджа, и, следовательно, по предложению 1, эквивалентен критерию Сэвиджа. При α = 1 критерий Вальда-Сэвиджа превращается в критерий Вальда.

Из определения показателя gor53.wmf эффективности стратегии Ai видно, что он является линейной функцией аргумента gor54.wmf с угловым коэффициентом gor55.wmf. Следовательно, графиком показателя gor56.wmf является отрезок gor57.wmf (обозначаемый двумя его концами) с левым концом gor58.wmf и правым концом gor59.wmf. Тогда графиком цены игры gor60.wmf является, как следует из ее определения, верхняя огибающая m отрезков gor61.wmf, gor62.wmf, и представляющая собой ломаную, состоящую из не более m звеньев, число которых обозначим через gor63.wmf. Очевидно, что gor64.wmf.

Проблема синтезирования оптимальных стратегий критерием Вальда-Сэвиджа

Определение 1. Стратегию, оптимальную по критерию Вальда-Сэвиджа при выигрыш-показателе gor65.wmf, будем называть синтезированной при данном выигрыш-показателе α, если она не является оптимальной ни по критерию Вальда, ни по критерию Сэвиджа,

Определение 2. Будем говорить, что в данной игре критерий Вальда-Сэвиджа при фиксированном значении выигрыш-показателя gor66.wmf обладает свойством синтезирования, если при данном выигрыш-показателе α существует синтезированная стратегия, т.е. gor67.wmf.

Определение 3. Если в данной игре ни при каком значении выигрыш-показателя gor68.wmf не существует синтезированной стратегии, т.е. при любом gor69.wmf каждая стратегия, оптимальная по критерию Вальда-Сэвиджа, оптимальна либо по критерию Вальда, либо (связка «или» используется здесь в неразделительном смысле) по критерию Сэвиджа:

gor70.wmf,

gor71.wmf, (3)

то будем говорить, что в этом случае критерий Вальда-Сэвиджа не обладает свойством синтезирования.

Понятно, что в общем случае не каждая стратегия, оптимальная или по критерию Вальда, или по критерию Сэвиджа, является оптимальной по критерию Вальда-Сэвиджа с некоторым выигрыш-показателем gor72.wmf.

Так как при α = 0 и α = 1 критерий Вальда-Сэвиджа соответственно эквивалентен критерию Сэвиджа и совпадает с критерием Вальда, то при этих значениях выигрыш-показателя критерий Вальда-Сэвиджа свойством синтезирования не обладает. Именно поэтому в определениях 1 и 2 указанные значения выигрыш-показателя исключены из рассмотрения.

В следующем предложении сформулировано еще одно простое условие отсутствия у критерия Вальда-Сэвиджа свойства синтезирования.

Предложение 2. В игре, в которой число m чистых стратегий игрока A равно 2, критерий Вальда-Сэвиджа свойством синтезирования не обладает.

Доказательство. Пусть A1 и A2 – чистые стратегии игрока A. Графики показателей эффективности gor73.wmf и gor74.wmf этих стратегий – отрезки gor75.wmf и gor76.wmf либо совпадают, либо не пересекаются, либо пересекаются.

В первых двух случаях графиком цены игры gor77.wmf является отрезок. Тогда по необходимой части теоремы 11 из [10] в игре существует стратегия, оптимальная и по критерию Вальда, и по критерию Сэвиджа, т.е. выполняется условие

gor78.wmfO. (4)

Из условия (4) по достаточной части теоремы 10 из [10] следует равенство gor79.wmfgor80.wmf, при gor81.wmf, из которого вытекает включение (3), означающее по определению 3, что gor82.wmf-критерий свойством синтезирования не обладает.

Если же отрезки gor83.wmf и gor84.wmf пересекаются, то очевидно, что выполняется включение (3), из которого по определению 3 также следует, что критерий Вальда-Сэвиджа свойством синтезирования не обладает.

Таким образом, при α = 0 или α = 1, или m = 2 никакого синтезирования быть не может. Значит, ожидать синтезированное решение в результате применения критерия Вальда-Сэвиджа можно только при выигрыш-показателях gor85.wmf и при числе чистых стратегий m ≥ 3, что мы и будем предполагать в дальнейшем.

Из определения критерия Вальда-Сэвиджа [11, 12] следует, что его предназначение состоит в синтезировании крайне высоких предпочтений, отдаваемых лицом, принимающим решение, выигрышам (α = 1 и в этом случае им используется критерий Вальда) и рискам (α = 0 и в этом случае используется критерий Сэвиджа). В связи с этим возникает вопрос. В любой ли игре (при условиях gor86.wmf и m ≥3) критерий Вальда-Сэвиджа обладает свойством синтезирования?

Таким образом, возникает проблема синтезирования критерием Вальда-Сэвиджа. В настоящей статье дано решение этой проблемы: найдены необходимые и достаточные условия игры с природой, для которой критерий Вальда-Сэвиджа свойством синтезирования не обладает, и, следовательно, применять его для отыскания синтезированных стратегий не имеет смысла [13, 14, 15]. Тем не менее, решение, полученное в результате применения критерия Вальда-Сэвиджа, выявляет зависимость стратегий, оптимальных или по критерию Вальда, или по критерию Сэвиджа от значений выигрыш-показателя gor87.wmf. Приложение полученных результатов иллюстрируется на примере задачи с экономическим содержанием.

Решение проблемы синтезирования критерием Вальда-Сэвиджа. В доказательстве предложения 2 было показано, что при условии (4), т.е. при условии существования стратегии, оптимальной и по критерию Вальда и по критерию Сэвиджа, критерий Вальда-Сэвиджа свойством синтезирования не обладает. Поэтому в дальнейшем будем предполагать, что такой стратегии не существует, т.е.

gor88.wmfO. (5)

Условие (5) эквивалентно невыполнению условия (4), которое эквивалентно равенству l = 1. Следовательно, условие (5) эквивалентно тому, что l ≠ 1 или, что то же l ≥ 2. Таким образом, отсутствие в игре стратегии, оптимальной и по критерию Вальда, и по критерию Сэвиджа, эквивалентно тому, что ломаная, представляющая график цены игры gor89.wmf, состоит из не менее двух звеньев: l ≥ 2.

Если каждая чистая стратегия оптимальна по критерию Вальда или по критерию Cэвиджа: gor90.wmf, то критерий Вальда-Сэвиджа не обладает свойством синтезирования. Поэтому далее будем считать, что существуют стратегии, не являющиеся оптимальными ни по критерию Вальда, ни по критерию Сэвиджа:

gor91.wmf. (6)

Пусть gor92.wmf – множество стратегий, оптимальных по критерию Сэвиджа во множестве gor93.wmf стратегий, оптимальных по критерию Вальда, и gor94.wmf – цена игры по критерию Сэвиджа в стратегиях множества gor95.wmf; gor96.wmf – множество стратегий, оптимальных по критерию Вальда во множестве gor97.wmf стратегий, оптимальных по критерию Сэвиджа, и gor98.wmf – цена игры по критерию Вальда в стратегиях множества gor99.wmf.

Нетрудно видеть, что множества gor100.wmf и gor101.wmf не пусты и справедливы включения gor102.wmf и gor103.wmf.

Графики показателей эффективности gor104.wmf всех стратегий gor105.wmf совпадают и представляют собой отрезок с левым концом gor106.wmf и правым концом gor107.wmf, т.е. отрезок gor108.wmf (см. рис. 1).

Аналогично, графики показателей эффективности gor109.wmf всех стратегий gor110.wmf совпадают и представляют собой отрезок с левым концом gor111.wmf и правым концом gor112.wmf, т.е. отрезок gor113.wmf (см. рис. 1).

Gors1.tif

Рис. 1. Графики показателей эффективности стратегий в случае, когда ломаная, представляющая график цены игры по критерию Вальда-Сэвиджа, состоит из трех звеньев (l = 3)

Определение 4. В предположении выполнения условия (6), будем говорить, что игра удовлетворяет условию gor114.wmf, если для каждой чистой стратегии Ak, не являющейся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа (существующей в силу условия (6)), т.е. для которой выполняется условие

gor115.wmf, (7)

справедливо неравенство

gor116.wmfgor117.wmf. (8)

Отметим, что для стратегии gor118.wmf неравенство (8) не выполняется, поскольку в этом случае gor119.wmf и gor120.wmf, и, следовательно, левая и правая части неравенства (8) превращаются в нули.

Далее нам понадобится следующее предложение, доказанное в [10, лемма 3].

Предложение 3. Пусть выполняется условие (5) и пусть gor121.wmf и gor122.wmf. Тогда отрезки gor123.wmf и gor124.wmf = gor125.wmf не совпадают и пересекаются в точке gor126.wmf с абсциссой

gor127.wmf, (9)

и ординатой

gor128.wmf (10)

(см. рис. 1).

Необходимые условия отсутствия у критерия Вальда-Сэвиджа свойства синтезирования даны в следующей теореме.

Теорема 1 (необходимые условия отсутствия синтезирования). Пусть в игре не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа, т.е. выполняется условие (5), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. выполняется условие (6).

Тогда если в данной игре критерий Вальда-Сэвиджа не обладает свойством синтезирования, то справедливы следующие утверждения:

а) число l звеньев ломаной, представляющей график цены игры по критерию Вальда-Сэвиджа gor129.wmf, равно 2;

b) игра удовлетворяет условию gor130.wmf;

c) множество gor131.wmf стратегий, оптимальных по критерию Вальда-Сэвиджа, имеет следующую структуру

gor132.wmf (11)

где gor133.wmf определяется формулой (9).

Доказательство. Докажем утверждение a). Как было показано выше, условие (5) эквивалентно тому, что l ≥ 2. Предположим противное утверждению a): l ≠ 2. Тогда l ≥ 3.

В этом случае найдется стратегия Ak, такая, что отрезок gor134.wmf, являющийся графиком показателя эффективности gor135.wmf, будет пересекать отрезок gor136.wmf во внутренней его точке N1, порождая звено N1N2 ломаной gor137.wmf (см. рис. 1). Отрезок gor138.wmf является первым (слева направо) звеном ломаной gor139.wmf. Точка N2 является концом второго звена и началом третьего звена (На рис. 1 приведен случай l = 3; ломаная gor140.wmf, выделенная жирной линией, состоит из трех звеньев gor141.wmf, gor142.wmf и gor143.wmf).

По определению Sav-цены игры, gor144.wmf. Но gor145.wmf, поскольку в противном случае было бы справедливо равенство gor146.wmf и тогда отрезок gor147.wmf не мог бы пересечь отрезок gor148.wmf во внутренней его точке N1. Таким образом, имеет место неравенство gor149.wmf, означающее, что стратегия Ak не является Sav-оптимальной:

gor150.wmf. (12)

Справедливо неравенство

gor151.wmf, (13)

поскольку в противном случае: gor152.wmf и тогда отрезок gor153.wmf не мог бы пересекать отрезок gor154.wmf во внутренней его точке N1 (см. рис. 1).

По определению W-цены игры gor156.wmf. Но gor157.wmf, поскольку в противном случае стратегия gor158.wmf и по определению цены игры в стратегиях множества gor159.wmf по критерию Сэвиджа gor160.wmf, откуда следует неравенство gor161.wmf, противоречащее неравенству (13). Таким образом, gor162.wmf и, следовательно, стратегия Ak не является W-оптимальной:

gor163.wmf. (14)

Пусть α1 и α2 – абсциссы соответственно левого и правого концов второго звена ломаной gor164.wmf (см. рис. 1). Тогда при каждом значении выигрыш-показателя gor165.wmf критерий Вальда-Сэвиджа будет обладать свойством синтезирования, так как при каждом gor166.wmf, будем иметь gor167.wmf, т.е. стратегия Ak является gor168.wmf-оптимальной, но не является оптимальной ни по критерию Вальда (см. (14)), ни по критерию Сэвиджа (см. (12)). Но это противоречит условию теоремы.

Полученное противоречие доказывает, что l = 2. Утверждение a) доказано.

Докажем утверждение b). По доказанному утверждению a) число звеньев ломаной gor169.wmf равно 2 (l = 2). Символический вид этой ломаной изображен на рис. 2 (выделена жирной линией).

Пусть Ak – произвольная чистая стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. удовлетворяющая условию (7) (существование таких стратегий обусловлено требованием (6)). Графиком показателя эффективности этой стратегии по критерию Вальда-Сэвиджа gor170.wmf является отрезок gor171.wmf (обозначаемый его концами).

Gors2.tif

Рис. 2. Графики показателей эффективности стратегий в случае, когда ломаная, представляющая график цены игры по критерию Вальда-Сэвиджа, состоит из двух звеньев (l = 2)

Докажем, что значение gor172.wmf показателя эффективности gor173.wmf стратегии Ak при выигрыш-показателе gor174.wmf меньше, чем ордината gor175.wmf точки N:

gor176.wmf (15)

(на рис. 2 gor177.wmf, где gor178.wmf – длина отрезка gor179.wmf).

Левый конец gor180.wmf этого отрезка не может равняться gor181.wmf:

gor182.wmf, (16)

поскольку в противном случае стратегия gor183.wmf, что противоречит условию (7). Аналогично, правый конец gor184.wmf отрезка gor185.wmf не может совпадать с gor186.wmf:

gor187.wmf. (17)

ибо в противном случае gor188.wmf, что также противоречит (7).

Левый конец gor189.wmf отрезка gor190.wmf, в силу определения gor191.wmf, не может быть больше gor192.wmf

gor193.wmf, (18)

а правый конец gor194.wmf этого отрезка, в силу определению gor195.wmf, не может быть больше gor196.wmf:

gor197.wmf. (19)

Из неравенств (16), (17), (18) и (19) следует, что отрезок gor198.wmf не может пересекать только один из отрезков gor199.wmf или gor200.wmf.

Отрезок gor201.wmf не может пересекать оба отрезка gor202.wmf и gor203.wmf, ибо в противном случае ломаная gor204.wmf имела бы 3 звена, что противоречит утверждению a).

Отрезок gor205.wmf не может иметь с отрезками gor206.wmf и gor207.wmf единственную общую точку N. В самом деле, если отрезок gor208.wmf проходит через точку N и не имеет других общих точек ни с отрезком gor209.wmf, ни с отрезком gor210.wmf, то gor211.wmf, т.е. gor212.wmf. Таким образом, стратегия Ak оптимальна во множестве чистых стратегий по критерию Вальда-Сэвиджа при выигрыш-показателе gor213.wmf и не оптимальна ни по критерию Вальда, ни по критерию Сэвиджа. А это означает, что критерий Вальда Сэвиджа при выигрыш-показателе gor214.wmf обладает свойством синтезирования, что противоречит условию теоремы.

Итак, мы показали, что отрезок gor215.wmf лежит ниже точки N. Этим доказано неравенство (15).

Левую часть неравенства (15) заменим по ее определению, а вместо выигрыш-показателя gor216.wmf и ординаты gor217.wmf подставим их значения соответственно по формулам (9) и (10); в результате получим:

gor218.wmf gor219.wmf

gor220.wmf. (20)

Из того, что gor221.wmf (см. (9)) и gor222.wmf следует, что gor223.wmf. Поэтому обе части неравенства (20) можем умножить на этот знаменатель, после чего элементарными преобразованиями получаем неравенство (8).

Таким образом, мы показали, что для любой стратегии, не являющейся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, справедливо неравенство (8), т.е. игра удовлетворяет условию gor224.wmf. Утверждение b) доказано.

Для доказательства утверждения c) отметим, что оно, как было доказано в [10], следует из утверждения b).

Таким образом, теорема доказана.

Теорема 2 (достаточные условия отсутствия синтезирования). Пусть в игре не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа, т.е. выполняется условие (6), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. выполняется условие (7). Тогда из каждого из следующих условий следует, что критерий Вальда-Сэвиджа не обладает свойством сглаживания:

a) игра удовлетворяет условию gor225.wmf;

b) множество gor226.wmf стратегий, оптимальных по критерию Вальда-Сэвиджа, имеет структуру (11).

Доказательство. Докажем, что из условия a) следует утверждение теоремы.

Допустим противное утверждению теоремы, т.е. допустим, что существуют значение выигрыш-показателя gor227.wmf и стратегия Ak, удовлетворяющая условию (7) (такие стратегии существуют в силу условия (6)), которая является gor228.wmf-оптимальной:

gor229.wmf. (21)

Из принадлежности (21), по определению оптимальности стратегии, следует равенство gor230.wmf, означающее, что при α = αk отрезок, представляющий график показателя эффективности gor231.wmf стратегии Ak, имеет общую точку с ломаной, представляющей график цены игры gor232.wmf по критерию Вальда-Сэвиджа.

В силу условия (5) количество звеньев ломаной gor233.wmf не меньше 2 (l ≥ 2) и, следовательно, отрезки gor234.wmf и gor235.wmf не совпадают и пересекаются в точке N (см. рис. 3, на котором число звеньев l = 4). В силу условия (7), отрезок gor236.wmf не может совпадать ни с одним из отрезков gor237.wmf и gor238.wmf и также не может пересекать только один из отрезков gor239.wmf или gor240.wmf, поскольку из (7) следует, что gor241.wmf и потому gor242.wmf, а также gor243.wmf (см. рис. 3).

Gors3.tif

Рис. 3. Графики показателей эффективности оптимальных стратегий по критерию Вальда-Сэвиджа в случае, когда ломаная, представляющая график цены игры, состоит из четырёх звеньев (l = 4)

Если отрезок gor244.wmf пересекает оба отрезка gor245.wmf и gor246.wmf и занимает, например, положение отрезка gor247.wmfgor248.wmf (см. рис. 3), то

gor249.wmf, (22)

где gor250.wmf – ордината точки N (на рис. 3, gor252.wmfgor253.wmf, где gor254.wmf- длина отрезка gor255.wmf.

Если отрезок gor256.wmf имеет с отрезками gor257.wmf и gor258.wmf единственную общую точку N и занимает, например, положение отрезка gor259.wmfgor260.wmf (см. рис. 3), то

gor261.wmf. (23)

Оба случая (22) и (23) можно объединить одним неравенством gor262a.wmf gor262aa.wmf. Подставляя в это неравенство выражения для gor263.wmf и gor264.wmf по формулам соответственно (9) и (10), получим

gor265.wmf

gor266.wmf. (24)

При доказательстве утверждения b) теоремы 1 была доказана положительность знаменателя в неравенстве (24). Умножая обе части этого неравенства на знаменатель и проведя элементарные преобразования, получим неравенство

gor267.wmfgor268.wmf,

которое противоречит неравенству (8). Следовательно, отрезок gor269.wmf не имеет общих точек с ломаной, являющейся графиком цены игры, и потому стратегия Ak не является оптимальной по критерию Вальда-Сэвиджа. Таким образом, критерий Вальда-Сэвиджа не обладает свойством синтезирования.

Итак, доказано, что из условия a) следует утверждение теоремы.

Теперь докажем, что утверждение теоремы следует также и из условия b). Пусть множество оптимальных стратегий по критерию Вальда-Сэвиджа имеет структуру (11) и пусть Ak – произвольная стратегия, оптимальная по критерию Вальда-Сэвиджа при некотором значении выигрыш-показателя gor270.wmf: gor271.wmf.

Из структуры (11) очевидным образом вытекают следующие утверждения: если gor272.wmf, то gor273.wmf; если gor274.wmf, то gor275.wmf; если gor276.wmf, то gor277.wmf. Таким образом, справедливо включение gor278.wmfgor279.wmf, означающее отсутствие у критерия Вальда-Сэвиджа свойства синтезирования. Теорема доказана.

Из теорем 1 и 2 следует, что каждое из утверждений a) и b) теоремы 2 является необходимым и достаточным условием того, что критерий Вальда-Сэвиджа не обладает свойством синтезирования.

Условие a) теоремы 1, являясь необходимым условием отсутствия у критерия Вальда-Сэвиджа свойства синтезирования, не является достаточным. Для доказательства этого приведем следующий пример.

Пример 1. Пусть игра с природой задается матрицей А размера 3×2, в последней добавленной строке которой проставлены показатели благоприятности состояний природы gor280.wmf, j = 1, 2, а в последнем добавленном столбце – W-показатели стратегий и W-цена игры. По матрице А высчитываем риски gor281.wmf i = 1, 2, 3; j = 1, 2, и формируем матрицу рисков R, в последнем добавленном столбце которой стоят Sav-показатели стратегий и Sav-цена игры.

 

А    =

               Пj

Ai

              П1

               П2

Wi

A1

  3   

4

3

A2

10

–1

–1

A3

4

1

1

 

βj

10

4

gor284.wmf

 

R =   

                             Пj

Ai

         П1

         П2

Savi

A1

7

0

7

A2

0

5

5

A3

6

3

6

 

 

gor285.wmf

 

На рис. 4 представлены отрезки gor286.wmf, i = 1, 2, 3, являющиеся графиками показателей эффективности gor287.wmf стратегий Ai. Отрезки gor288.wmf, i = 1, 2, пересекаются в точке gor289.wmf с абсциссой gor290.wmf и ординатой gor291.wmf, образуя ломаную gor292.wmf (выделенную на рис. 4 жирной линией), представляющую график цены игры gor293.wmf по критерию Вальда-Сэвиджа и состоящую из двух звеньев gor294.wmf и gor295.wmf (l = 2).

Абсцисса gor296.wmf и ордината gor297.wmf вычисляются соответственно по формулам (9) и (10).Очевидно, что gor298.wmf; gor299.wmf; gor300.wmf; gor301.wmf; gor302.wmf; gor303.wmf. Тогда по формулам (9) и (10) будем иметь: gor304.wmf, gor305.wmf.

Стратегия A3 не является оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, т.е. она удовлетворяет условию (10), поскольку (как явствует из последних дополнительных столбцов матриц A и R) gor306.wmf и gor307.wmf (на рис. 4 левый конец (gor308.wmf) отрезка gor309.wmf лежит ниже gor310.wmf, а правый конец W3 = 1 отрезка gor311.wmf – ниже gor312.wmf).

Gors4.tif

Рис. 4. Геометрическая интерпретация примера

Показатель эффективности стратегии A3 при выигрыш-показателе gor313.wmf равен gor314.wmf. В самом деле,

gor315.wmf.

Таким образом, стратегия A3, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа, оптимальна по синтетическому критерию Вальда-Сэвиджа при выигрыш-показателе gor316.wmf и, следовательно, критерий Вальда-Сэвиджа в данной игре обладает свойством синтезирования

Итак, в данной игре ломаная, представляющая график цены игры, состоит из двух звеньев, но, тем не менее, критерий Вальда-Сэвиджа обладает свойством синтезирования.

Иллюстрация применения полученных результатов. Применение полученных результатов проиллюстрируем на решении следующей задачи оптимального планирования производства.

Постановка задачи. Для изготовления X единиц определенной продукции должен быть выбран один из четырех возможных технологических способов. Потребность в этой продукции носит случайный характер и, как показывает прошлый опыт, может принимать значения 25, 35, 45 или 50 единиц. Производственные затраты TCi на изготовление X единиц продукции i-м (i = 1, 2, 3, 4) технологическим способом включают постоянные затраты, соответственно: Q1 = 145, Q2 = 70, Q3 = 180, Q4 = 110 условных денежных единиц (у.д.е) и удельные переменные затраты, соответственно: c1 = 3, c2 = 5, c3 = 2, c4 = 4 условных денежных единиц (у.д.е). Общие затраты на производство продукции объемом Х по i-му технологическому способу выражаются формулой:

gor317.wmf, i = 1, 2, 3, 4. (25)

Ставится задача выбора одного из четырех технологических способов изготовления продукции с критерием на минимум производственных затрат.

Решение. Для анализа задачи адекватной является модель «Игры с природой», в которой рациональным игроком A выступает предприятие, а природой выступает потребность в изготавливаемой продукции. Игрок A располагает четырьмя чистыми стратегиями Ai, i = 1, 2, 3, 4 – выбрать для изготовления продукции i-й технологический способ, а «природа» может находится в одном из четырех состояниях: П1 = 25, П2 = 35, П3 = 45 и П5 = 50 единиц потребляемой продукции. В модели в качестве выигрышей aij (i, j = 1, 2, 3, 4) игрока A в игровой ситуации (Ai, Пj): игрок A выбирает стратегию Ai, а природа находится в состоянии Пj, будем рассматривать производственные затраты предприятия, вычисляемые по формуле (25). Таким образом, выигрыши aij (i, j = 1, 2, 3, 4), представляют собой отрицательные величины, которые в обозначениях модели рассчитываются по формуле: gor318.wmf (i, j = 1, 2, 3, 4). На основе рассчитанных выигрышей aij формируем платежную матрицу А. Рассчитываем показатели gor319.wmf (j = 1, 2, 3, 4) благоприятности состояний природы и проставляем их в последней дополнительной строке матрицы А. Подсчитываем риски gor320.wmf (i, j = 1, 2, 3, 4) и формируем матрицу рисков R.

А =      

             Пj

Ai

П1

П2

П3

П4

Wi

A1

-220

-250

-280

-295

-295

A2

-195

-245

-290

-320

-320

A3

-230

-250

-270

-280

-280

A4

-210

-250

-290

-310

-310

 

βj

-195

-245

-270

-280

 

 

 

R =          

                Пj

Ai

П1

П2

П3

П4

Savi 

A1

25

5

10

15

25

A2

0

0

20

40

40

A3

35

5

0

0

35

A4

15

5

20

30

30

 

В последних добавленных столбцах матриц А и R проставлены W- и Sav-показатели стратегий. Перед тем как приступить к процедуре нахождения синтезированных стратегий целесообразно выяснить их существование. Для этого используем условие gor321.wmf. Из показателей столбцов «Wi» и «Savi» матриц А и R следует, что

gor322.wmf, gor323.wmf, gor324.wmf,

gor325.wmf, gor326.wmf, gor327.wmf.

Тогда правая часть неравенства (8)

gor328.wmf. (26)

Так как стратегии A2 и A4 не принадлежат множеству gor329.wmf, то левую часть неравенства (8) надо подсчитать только для этих стратегий. Имеем:

gor330.wmf, (27)

gor331.wmf. (28)

Из неравенств (26), (27) и (28) заключаем, что для стратегий A2 и A4 справедливо неравенство (8), т.е. данная игра удовлетворяет условию gor332.wmf. Нетрудно видеть, что выполняются также условия (6) и (7). Таким образом, выполняются условия теоремы 2, в соответствии с которой критерий Вальда-Сэвиджа не обладает свойством синтезирования, т.е. применение критерия Вальда-Сэвиджа ни при каком значении выигрыш-показателя gor333.wmf не приводит к синтезированным решениям и каждая стратегия, оптимальная по критерию Вальда-Сэвиджа, оптимальна либо по критерию Вальда, либо по критерию Сэвиджа. По формуле (9) gor334.wmf. Используя формулу (11), получим следующую структуру множества оптимальных не синтезированных стратегий по критерию Вальда-Сэвиджа

gor335.wmf

Условно-геометрическая интерпретация данной задачи представлена на рис. 5.

Найденное решение экономически можно проинтерпретировать следующим образом.

Gors5.tif

Рис. 5. Геометрическое представление задачи

Если значение выигрыш-показателя α находится в пределах 0 ≤  α < 0,4, то критерий Вальда-Сэвиджа рекомендует для изготовления продукции в качестве оптимального выбрать 1-й технологический способ (стратегия A1 в матрице R, оптимальная по критерию Сэвиджа), при котором предприятие гарантирует себе наибольший риск недостижения наименьших затрат при каждой потребности производимой продукции, равный 25 у.д.е (первая строка матрицы R). То есть, при выборе 1-го технологического способа производства риск недостижения наименьших затрат не может быть больше 25 у.д.е. При выборе другого способа производства этот риск может оказаться больше 25 у.д.е. Действительно, например, при выборе 2-го, 3-го или 4-го способа производства и при потребности соответственно в 50, 25 и 50 единиц продукции риск будет равен соответственно 40, 35 и 30 у.д.е (см. игровые ситуации (A2, П4), (A3, П1), (A4, П4) в матрице рисков R). Принятое решение является крайне пессимистическим относительно рисков, поскольку выбору 1-го технологического способа производства сопутствует наибольший при этом способе риск в 25 у.д.е.

Если значение выигрыш-показателя α находится в пределах 0,4 < α ≤ 1, то оптимальным по критерию Вальда-Сэвиджа является решение изготавливать продукцию по 3-му технологическому способу (стратегия A3 в матрице А оптимальна по критерию Вальда). При этом затраты предприятия при любой потребности в продукции составят не более 280 у.д.е. Если предприятие отклонится от оптимального решения и выберет 1-й, 2-й или 4-й способ производства, то при потребности в продукции в 50 единиц затраты составят соответственно 295, 320 или 310 у.д.е (см. игровые ситуации (A1, П4), (A2, П4), (A4, П4) в платежной матрице А). Принятое решение крайне пессимистично относительно издержек, так как при 3-м способе производства издержки в 280 у.д.е являются максимальными при этом способе производства.

Если α = 0,4 то с точки зрения критерия Вальда-Сэвиджа равноценными являются 1-й или 3-й способы производства.

Заключение

В статье рассмотрена проблематика корректности использования в процедурах выбора управленческих решений в условиях неопределенности, моделируемых в терминах «игры с природой», синтетического критерия, обобщающего свойства критериев, характеризующих принимаемое решение и с позиции возможного выигрыша, и с позиции возможного риска. Актуальность использования синтетического критерия связывается с необходимостью оценок качества принимаемого решения в условиях высокой неопределенности как в отношении выигрышей, так и сопровождающих их рисков. Предложенная интерпретация свойства синтезирования обобщенного критерия Вальда-Сэвиджа и доказанные условия наличия качества синтезирования этих критериев позволяют лицу, принимающему решения, обоснованно применять или не применять его в оценках игровой ситуации и при выборе окончательного решения.


Библиографическая ссылка

Горский М.А., Лабскер Л.Г. СИНТЕТИЧЕСКИЙ КРИТЕРИЙ ВАЛЬДА-СЭВИДЖА ДЛЯ ИГРЫ С ПРИРОДОЙ И ЕГО ЭКОНОМИЧЕСКИЕ ПРИЛОЖЕНИЯ // Вестник Алтайской академии экономики и права. – 2020. – № 4-2. – С. 179-193;
URL: https://vaael.ru/ru/article/view?id=1071 (дата обращения: 03.12.2021).