Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

COMPARATIVE ANALYSIS OF ARMA AND ARIMA MODELS FOR DIFFERENT FORECASTING HORIZONS: CHOOSING THE OPTIMAL APPROACH

Gorelik A.Yu. 1 Koroleva E.V. 1
1 Peter the Great St.Petersburg Polytechnic University
1017 KB
The article examines the predictive power of historical data on stock quotes in the Russian stock market. The objective of the work is to evaluate the effectiveness of ARMA and ARIMA time series models for different stock quotes forecasting horizons. The study analyzed time series of closing quotes for Sberbank shares using various data sets and dividing the samples into testing and training. The results showed that in the current market conditions, historical quote values ​​do not have sufficient predictive value, which limits the relevance of technical analysis. The findings of the study can be useful for traders and analysts when choosing approaches to forecasting the volatility of stock quotes. Further research is recommended into the use of more sophisticated tools that consider the influence of external and internal factors, quantitative and qualitative information.
stock quotes
historical data
time series
short-term forecasting
long-term forecasting
modeling
arma
arima

Введение

В сфере моделирования котировок ценных бумаг на финансовых рынках традиционно проводится разграничение между краткосрочным и долгосрочным горизонтом прогнозирования. Подобное разделение [1] обусловлено рядом факторов. Во-первых, различаются цели участников рынка: трейдеры, ориентированные на спекулятивный доход, сосредотачиваются на краткосрочных прогнозах, тогда как инвесторы, стремящиеся к увеличению капитала в долгосрочной перспективе, ориентируются на длительные временные горизонты. Во-вторых, источники, вызывающие колебания котировок ценных бумаг, также различаются: краткосрочные изменения обусловлены активной торговлей, колебаниями спроса и предложения, а также внезапными новостями как позитивного, так и негативного характера, тогда как долгосрочная динамика формируется на основе многолетних финансовых и экономических результатов деятельности компаний.

Проблема выбора наиболее эффективного инструментария для прогнозирования котировок ценных бумаг на каждом из горизонтов остаётся актуальной, поскольку универсального решения не существует. Финансовые рынки различных стран и активы, обращающиеся на них, обладают уникальной экономической природой, обусловленной множеством факторов.

Анализ научной литературы по данной тематике показал отсутствие комплексных сравнительных исследований эффективности моделей ARMA и ARIMA в контексте краткосрочного и долгосрочного прогнозирования котировок ценных бумаг. Отдельные авторы исследовали применение этих моделей в узкоспециализированных исследованиях. Например, в работе Шемякиной М.А. и Клейменкина Д.В. [2] анализируется эффективность моделей ARMA-GARCH применительно к рядам доходности акций. Авторы приходят к выводу, что данные модели демонстрируют высокую эффективность при анализе доходности. В работе [3] исследуется применение моделей ARIMA для краткосрочного прогнозирования акций на ливанском рынке. Автор отмечает, что модели ARIMA демонстрируют удовлетворительную точность, однако их применение ограничено наличием пропусков в исходных данных, которые потребовали дополнительных методов обработки. В исследовании Архиповой А.А. [4] предпринята попытка прогнозирования котировок акций компании «Алроса» с использованием моделей ARIMA-GARCH. Автор приходит к выводу, что эти модели могут быть эффективны на краткосрочном горизонте при условии низкой волатильности цен, при этом подчёркивается важность учёта внешних факторов, особенно в условиях российской экономики, где рынок подвержен влиянию геополитических и макроэкономических факторов. Дальнейшее исследование возможности включения экзогенных переменных в модели прогнозирования (построение модели ARIMAX) может открыть дополнительные перспективы в области финансового анализа, но данный аспект выходит за рамки текущего исследования.

Таким образом, в рамках данного исследования была сформулирована следующая гипотеза: модели ARMA могут обеспечивать более высокую точность прогнозирования на краткосрочном горизонте (например, в пределах нескольких дней), в то время как модели ARIMA, учитывающие разности, оказываются более эффективными для более длительного горизонта прогнозирования (например, на несколько месяцев).

Гипотеза была сформулирована на основании следующих аргументов:

1. Краткосрочное прогнозирование и модель ARMA

Природа краткосрочных колебаний: Временные ряды котировкой ценных бумаг на коротких интервалах (1-7 дней) часто подвержены влиянию случайных факторов – рыночных новостей, изменений настроений участников рынка и технических колебаний. Эти колебания, как правило, не связаны с долгосрочными трендами.

Преимущество модели ARMA заключается в том, что она эффективно справляется с моделированием таких случайных колебаний за счёт учёта автокорреляции и зависимости между предыдущими значениями ряда и ошибками модели. При краткосрочном прогнозировании модель ARMA может эффективно учитывать эти случайные отклонения и колебания, так как тренды и сезонные эффекты имеют ограниченное влияние на такие короткие горизонты.

Пример. Когда рынок реагирует на новости или события, такие как изменения в экономической политике, котировки могут резко колебаться в течение нескольких дней; в этом случае ARMA будет хорошо работать, так как её фокус на «шуме» (случайных компонентах) позволяет более точно предсказать колебания в короткие сроки.

2. Долгосрочное прогнозирование и модель ARIMA

Долгосрочные тренды: На более протяжённом временном интервале (несколько месяцев и более) котировки ценных бумаг обычно демонстрируют выраженные тренды, обусловленные фундаментальными факторами (экономический рост или спад, изменения в политике, решения центральных банков, и т.д.).

Преимущество модели ARIMA заключается в том, что она включает разностные преобразования, позволяющие привести временной ряд к стационарному виду, устраняя долгосрочные тренды. Это способствует более точному моделированию будущей динамики актива с учётом выявленных трендовых составляющих.

Пример. Котировки акций крупных компаний, таких как ПАО «Сбербанк», могут демонстрировать долгосрочные тенденции, зависящие от экономического роста, изменений в отраслевой политике и макроэкономических решений. ARIMA, благодаря разностным преобразованиям, позволяет убрать эти тренды и повысить точность на более длительном горизонте планирования.

3. Различие в типах шума и трендов:

Шум и автокорреляция. На краткосрочных интервалах данные часто содержат «шум» (случайные колебания), который ARMA может эффективно моделировать, так как она учитывает автокорреляцию между значениями и ошибками. На более длительном горизонте планирования, когда данные имеют сильные тренды, шум становится менее важным, и более важным становится способность модели улавливать долгосрочные зависимости и тренды, что делают разностные преобразования ARIMA.

4. Пример с акциями на финансовых рынках:

На финансовых рынках, например, в акциях крупных банков или компаний, краткосрочные колебания могут быть вызваны быстрыми реакциями на новости или события, в то время как долгосрочные тренды обычно связаны с более стабильными факторами, такими как финансовые отчеты, экономические показатели и изменения в отраслевых трендах. Краткосрочное поведение акций часто более непредсказуемо, и ARMA может быть более точным инструментом для прогнозирования краткосрочных цен, в то время как ARIMA лучше подойдет для долгосрочных прогнозов, где тренды более выражены.

5. Теория прогнозирования временных рядов:

Стационарность. Модели ARMA предполагают, что данные являются стационарными, то есть их статистические характеристики (среднее, дисперсия, автокорреляция) не изменяются со временем. Для временных рядов, которые не являются стационарными, применяются разностные преобразования (модель ARIMA). Для долгосрочных прогнозов, когда тренды становятся важными, разностные преобразования помогут улучшить точность прогноза, устраняя трендовые компоненты и делая данные стационарными.

Пример. Для акций ПАО «Сбербанк» в долгосрочной перспективе можно ожидать определенные тренды, связанные с экономическими циклами. ARIMA помогает устранить тренды и сделать модель более точной, так как использует разности временного ряда.

6. Практическое применение

В финансовых рынках часто используется комбинированный подход, где на краткосрочные прогнозы применяются модели, фокусирующиеся на автокорреляции (ARMA), а на долгосрочные – модели, которые могут учитывать тренды и стационаризацию (ARIMA). Это подход подтверждается в ряде эмпирических исследований и практическом применении в области финансового прогнозирования [5-7].

Целью исследования является проведение сравнительного анализа качественных метрик моделей ARMA и ARIMA для различных горизонтов прогнозирования.

Материалы и методы исследования

Исследовался временной ряд с 01.01.2023 по 31.12.2024, значениями которого являлись котировки обыкновенных акций (цена закрытия) ПАО «Сбербанк». Такой выбор обусловлен совокупностью факторов, обеспечивающих как теоретическую, так и практическую значимость анализа. Во-первых, ПАО «Сбербанк» представляет собой одну из крупнейших и наиболее ликвидных публичных компаний на российском фондовом рынке. Высокая ликвидность акций способствует формированию устойчивых и непрерывных временных рядов, что является необходимым условием для корректного применения моделей авторегрессии ARMA и ARIMA. Во-вторых, Сбербанк занимает системообразующее положение в банковском секторе Российской Федерации, и его рыночная капитализация, а также ключевая роль в финансовой системе страны, обеспечивают высокую чувствительность котировок его акций к изменениям экономической конъюнктуры. Это создаёт дополнительный интерес к исследованию временных рядов его котировок с целью прогнозирования и анализа рисков. Кроме того, открытость финансовой отчётности банка, а также наличие широкого спектра статистических и эконометрических данных по его деятельности создают благоприятные условия для проведения эмпирического анализа и валидации полученных моделей. Таким образом, выбор акций ПАО «Сбербанк» в качестве объекта исследования позволяет получить репрезентативные результаты.

Следует отметить, что в силу 5-дневного режима работы Московской фондовой биржи, первоначальные данные имели пропуски. Было рассмотрено 3 подхода к замене пропусков:

- метод линейной интерполяции;

- метод временной интерполяции;

- метод forward fill.

В силу схожести результатов, которые давали все методы интерполяции, был выбран метол линейной интерполяции вследствие его универсальности.

Для проверки выдвинутой гипотезы были построены соответственно модели ARMA и ARIMA.

Модель ARMA (AutoRegressive Moving Average) – это авторегрессионная модель скользящего среднего. Данная модель имеет 2 компонента: AR и MA. Компонент AR основан на идее, что будущие значений временного ряда могут быть предсказаны на основе предыдущих значений. Порядок компонента AR обозначается как «p» и означает количество прошлых значений, которое используется для прогнозирования будущего значения. Компонент MA основан на идее, что будущие значения временного ряда могут быть предсказаны на основе ошибок прошлых прогнозов. Порядок компонента MA обозначается как «q» и означает количество ошибок прошлых прогнозов, которое используется для прогнозирования будущего значения.

Модель ARIMA (AutoRegressive Integrated Moving Average) – это расширение модели ARMA путём добавления компонента I. Порядок компонента I обозначается как «d» и означает количество прошлых временных точек, которые нужно вычесть из текущего значения, причём данное преобразование приводит ряд к стационарному виду.

Для тестирования гипотезы исследования также следует отметить, что исходный временной ряд был разделён на множество разных выборок (количество наблюдений – 720, 630, 540, 450, 360, 270, 180 и 90). В рамках исследования каждая выборка имела множество комбинаций разбиения на тестовую и обучающую части с целью комплексного понимания того, как влияют разные разбиения на качество прогнозирования.

Для оценки качества моделирования использовались метрики MAE, MSE, RMSE, R2, AIC, BIC и HQIC [8-9]. Дадим их краткую интерпретацию.

− MAE (Mean Absolute Error; Средняя абсолютная ошибка) является линейной оценкой ошибки модели, то есть все ошибки модели (разности между фактическими и прогнозируемыми значениями моделируемой величины) в среднем взвешены одинаково; рассчитывается как среднее абсолютных разностей (среднее модуля абсолютных разностей) между наблюдаемым и предсказанным значениями.

− MSE (Mean Squared Error; Среднеквадратичная ошибка). Если в MAE абсолютные разности считались под знаком модуля, чтобы они не вносили компенсирующего эффекта в друг друга, то в MSE рассчитываются квадраты разностей, что, позволяет акцентировать внимание на больших ошибках в модели.

− MedAE (Median Absolute Error; Медианная абсолютная ошибка). Данную метрику можно рассматривать как ещё одну разновидность MAE, но разница заключается не в том, как сделать различия между фактическими данными и прогнозами положительными, а в простом обобщении результатов с использованием медианы, а не средней арифметической.

− R2 (R-Squared; Коэффициент детерминации) показывает долю дисперсии зависимой переменной, объяснённой с помощью регрессионной модели.

− AIC (Akaike Information Criterion; Информационный критерий Акаике) оценивает соответствие модели обучающим данным и добавляет штраф за сложность модели;

− BIC (Bayesian Information Criterion; Информационный критерий Байеса) так же, как и AIC, оценивает соответствие модели обучающим данным и добавляет более жёсткий штраф за сложность модели;

− HQIC (Hannan–Quinn Information Criterion; Информационный Критерий Ханнана-Куинна) выявляет степень соответствия оцениваемого измеримого уравнения.

Результаты исследования и их обсуждение

В связи с объёмностью полученных данных моделирования, авторами было принято решение по каждой из анализируемых выборок представить наилучшие и наихудшие результаты. Результаты, полученные по модели ARMA, представлены в таблице 1.

Таблица 1

Сравнительный анализ результатов моделирования ARMA по разным выборкам

Выборка (количество наблюдений)

Разделение выборки:

Метрики качества

Информационные критерии

Обучающая (%)

Тестовая (%)

MAE

MSE

RMSE

MedAE

R2

AIC

BIC

HQIC

720

85

15

11

185

14

9

0,19

2854

2876

2862

720

89

11

13

249

16

14

-0,19

2984

3006

2992

630

82

18

11

197

14

10

0,11

2401

2422

2409

630

83

17

12

212

15

12

0,08

2433

2454

2441

540

80

20

12

204

14

11

0,11

2017

2038

2025

540

92

8

18

360

19

17

-0,20

2320

2341

2328

450

82

18

13

228

15

12

-0,09

1739

1770

1751

450

88

12

16

335

18

17

-0,24

1867

1899

1880

360

85

15

15

318

18

14

-0,17

1425

1436

1429

360

87

13

15

358

19

12

-0,25

1461

1476

1467

270

80

20

15

322

18

14

-0,19

1047

1057

1051

270

82

18

17

358

19

16

-0,28

1071

1098

1082

180

94

6

4

25

5

4

0,39

943

968

953

180

92

8

40

2005

45

44

-5,61

861

885

871

На основе приведенной таблицы можно сделать следующие выводы:

1. Зависимость качества модели от размера выборки.

С уменьшением размера выборки (от 720 до 180 наблюдений) наблюдается явное снижение качества модели, что подтверждается ростом значений метрик ошибок – MSE и RMSE. Это свидетельствует о том, что средняя ошибка модели увеличивается по мере сокращения объёма данных. Наиболее значительный скачок ухудшения качества зафиксирован при переходе от 270 к 180 наблюдениям. Примечательно, что положительное значение коэффициента детерминации R2, отражающее наличие описательной способности модели, наблюдалось только на выборках с 720, 630, 540 и 180 наблюдениями.

2. Влияние разбиения выборки на обучающую и тестовую.

Разбиения данных в соотношениях 80%/20% и 85%/15% продемонстрировали наибольшую стабильность моделей по значениям метрик ошибок. Отклонение от данных соотношений приводило к незначительному росту MSE и RMSE на всех выборках, за исключением самой маленькой выборки (180 наблюдений), где влияние разбиения оказалось более выраженным. Положительное значение коэффициента детерминации R2 также чаще встречалось при классическом разбиении (80%/20% и 85%/15%), что подтверждает его эффективность.

3. Сравнение по метрикам качества (MAE, MSE, RMSE, MedAE, R2).

Большие выборки и разбиения данных в соотношениях 80%/20%, 85%/15% способствовали повышению описательной способности модели (наличие положительного R2), при этом рост ошибок (MAE, MSE, RMSE, MedAE) происходил медленнее по сравнению с сокращением количества наблюдений. Интересно, что наивысшая описательная способность в размере 39% была зафиксирована у модели с выборкой из 180 наблюдений при разбиении 94%/6%. Однако данный случай можно рассматривать как исключение, поскольку остальные модели с маленькими выборками демонстрировали отрицательное значение R2. В целом модели, построенные на больших выборках, показали более стабильные и точные результаты.

4. Сравнение по информационным критериям (AIC, BIC, HQIC).

С увеличением размера выборки значения информационных критериев AIC, BIC и HQIC также возрастали. Отклонение от разбиения данных в соотношениях 80%/20%, 85%/15% приводило к росту этих показателей, что указывает на снижение эффективности модели с точки зрения использования исходных данных. Наиболее эффективными оказались модели, построенные на малых выборках при разбиении 80%/20%.

Таким образом, оптимальными являются модели, построенные на выборках объёмом от 540 до 720 наблюдений с разбиением данных в соотношении 80%/20%. Такие модели демонстрируют стабильные значения метрик ошибок и положительное значение коэффициента детерминации R2, что свидетельствует о наличии (пусть и умеренной) описательной способности. Модели, основанные на меньших выборках и нетипичных разбиениях, напротив, показывают высокую вариативность результатов и, чаще всего, лишены объяснительной способности.

Результаты, полученные по модели ARIMA, представлены в таблице 2.

На основе приведенной таблицы можно сделать следующие выводы:

1. Зависимость качества модели от размера выборки.

С уменьшением размера выборки (от 720 до 180 наблюдений) качество модели заметно снижается, судя по увеличению MSE и RMSE. Заметное увеличение значений метрик качества наблюдается при переходе от 540 к 450 наблюдениям, что означает, что модели, построенные на малых выборках, очень нестабильны и имеют большой разброс в предсказаниях. Также у моделей малых выборок R2 чаще был отрицательным, что говорит об отсутствии у них описательных способностей. У моделей, которые были построены на выборках от 720 до 540 намного чаще R2 был положительным, но очень близким к нулю – это говорит о наличии минимальных прогностических способностях таких моделей.

2. Влияние разбиения выборки на обучающую и тестовую.

Модели, в которых присутствовало классическое разбиение 80% на 20%, имели меньшие ошибки в прогнозах, судя по метрикам MSE и RMSE.

3. Сравнение по метрикам качества (MAE, MSE, RMSE, MedAE, R2).

В целом у моделей с уменьшением размера выборки метрики MSE и RMSE возрастали, что означает уменьшение их стабильности, то есть они предсказывают со слишком большим разбросом от истинных значений. R2 был положительным и близким к нулю у моделей, построенных на выборках от 720 до 540.

Таблица 2

Сравнительный анализ результатов моделирования ARIMA по разным выборкам

Выборка (количество наблюдений)

Разделение выборки:

Метрики качества

Информационные критерии

Обучающая (%)

Тестовая (%)

MAE

MSE

RMSE

MedAE

R2

AIC

BIC

HQIC

720

83

17

3

16

4

2

0,01

2770

2792

2778

720

84

16

3

16

4

2

0,00

2813

2835

2822

630

80

20

3

16

4

2

0,00

2330

2351

2338

630

84

16

3

18

4

1

0,00

2463

2484

2471

540

80

20

3

17

4

2

0,00

2016

2036

2024

540

90

10

3

28

5

2

0,00

2267

2288

2275

450

88

12

3

28

5

2

0,00

1866

1885

1873

450

81

19

3

20

4

2

-0,01

1716

1751

1730

360

85

15

3

28

5

3

0,00

1424

1453

1435

360

80

20

3

23

5

2

-0,01

1334

1363

1346

270

80

20

3

28

5

3

0,00

1045

1072

1056

270

80

20

3

29

5

3

-0,01

1054

1081

1065

180

82

18

4

40

6

2

-0,11

770

779

774

180

94

6

3

16

4

3

-1,35

953

975

962

4. Сравнение по информационным критериям (AIC, BIC, HQIC).

С увеличением размера выборки информационные критерии возрастают, отхождение от классического разбиения также приводит к увеличению рассматриваемых показателей, то есть самыми эффективными с точки зрения использования исходных данных являются модели, которые построены на малых выборках с классическим разбиением 80% на 20%.

Таким образом, оптимальными моделями являются те, которые построены на достаточно большом объёме наблюдений (от 540 до 720) и с соблюдением общепринятого разбиения 80% на 20%, так как их метрики ошибок не сильно отличаются друга от друга и у них имеются положительные R2, что говорит о присутствии у них минимальных описательных способностей. Модели, построенные на меньших выборках и с отличным от общепринятого разбиением, как правило, демонстрируют большой разброс в своих предсказаниях и не имеют описательной способности.

Следует отметить, что ARMA демонстрирует более высокие описательные способности за счет учета как авторегрессии, так и скользящего среднего в более гибкой форме. ARIMA, в свою очередь, лучше работает при наличии явно выраженного тренда за счет интеграционного компонента, но может уступать ARMA на стационарных рядах, особенно на длинных горизонтах прогнозирования. Поэтому выбор модели следует делать исходя из характера временного ряда и цели прогноза: ARMA будет предпочтительна для стабильных, стационарных данных, тогда как ARIMA больше подойдет для рядов с трендом и сезонными изменениями.

В итоге обе модели (ARMA и ARIMA) показывают лучшие результаты на более длинных горизонтах планирования. Более того описательные способности модели ARMA намного выше, чем у модели ARIMA. По результатам исследования выдвинутая гипотеза отвергается, так как модели ARMA и ARIMA показали свою эффективность на более длинных горизонтах планирования.

Заключение

В заключение следует отметить, что анализ показал высокую эффективность как модели ARMA, так и модели ARIMA при прогнозировании котировок акций ПАО «Сбербанк» на выборках большого объёма и на более длинных горизонтах прогнозирования. Однако различия в точности прогнозов на краткосрочном и долгосрочном горизонтах оказались менее выраженными, чем предполагалось изначально. Это свидетельствует о том, что выбор модели должен основываться не только на временном горизонте прогнозирования, но и на специфике самого временного ряда, включая его стационарность и наличие трендовых составляющих.

Кроме того, результаты исследования указывают на значительное влияние внешних факторов на динамику котировок акций ПАО «Сбербанк». В связи с этим целесообразно в дальнейшем рассмотреть возможность использования моделей ARIMAX, способных учитывать экзогенные переменные, что может повысить точность прогнозирования. Данный вывод особенно важен для трейдеров и аналитиков, ориентирующихся на более комплексные модели прогнозирования, выходящие за рамки традиционного технического анализа. Таким образом, дальнейшие исследования в данной области могут быть направлены на интеграцию внешних факторов и тестирование их влияния на прогнозные результаты.