Введение
В современном мире информационных технологий и искусственного интеллекта финансовый рынок стал одной из областей, на которую применение машинного обучения может оказать значительное влияние. Применение искусственного интеллекта и методов машинного обучения может принести значительные преимущества для участников финансового рынка, поскольку алгоритмы машинного обучения могут выявлять сложные закономерности, которые не всегда доступны для человека. Однако применение машинного обучения на финансовых рынках также сопряжено с определенными вызовами и рисками. Например, данные, используемые для обучения моделей машинного обучения в финансовом секторе, могут содержать конфиденциальную информацию о клиентах или финансовых операциях и подпадать под правовые ограничения в отношении их использования и защиты. В этом раскрывается специфика финансового рынка, требующая повышенной технической экспертизы в области алгоритмов и моделей машинного обучения.
Целью данной работы является исследование существующих моделей прогнозирования на базе искусственного интеллекта, а также специфики применения этих моделей в финансовом секторе.
Материалы и методы исследования
В качестве информационной базы в работе использовались актуальные современные публикации российских и зарубежных исследователей. В данной статье методами исследования выступают дедукция и индукция, сравнение данных, анализ информации, синтез теории.
Результаты исследования и их обсуждения
Итоговый результат машинного обучения заключается в прогнозе, важном составляющем искусственного интеллекта. Повышение точности прогнозов, позволяющее искусственному интеллекту успешно решать сложные задачи, достигается через процесс обучения. Этапы, предшествующие внедрению моделей машинного обучения, охватывают обработку данных, разработку моделей, их оценку и последующую оптимизацию. Рассмотрим основные области использования машинного обучения в финансовой индустрии.
1. Кредитный скоринг.
Экономист В.Э. Кроливецкая отмечает, что кредитный сектор, представляющий собой ключевую составляющую финансового рынка, характеризуется многообразием участнико и форм сделок, что позволяет говорить о нем как о сложном, неоднородном и многофункциональном сегменте финансового рынка» [1]. В настоящее время, особенно в странах с развивающимися экономиками, этот сегмент служит основополагающим элементом финансовой индустрии, активно способствуя экспансии и быстрому прогрессу рыночной системы. Одновременно, с учетом предпочтения банков к кредитованию как ведущему направлению для генерации дохода, уровень кредитного риска принимается за критический индикатор в поддержании их финансовой надежности и стабильности. В этой связи, банки включают различные финансовые и математические модели для адекватного мониторинга данного вида риска. К примеру, оценивание кредитоспособности заемщика и ожидаемости выплат по кредитам осуществляется посредством широко используемых скоринговых систем на основе искусственного интеллекта, которые обеспечивают автоматизированный аудит кредитных заявков и прогнозируют вероятности дефолта заемщиков.
На начальных этапах разработки, исходя из конкретного запроса, ставится задача, что является ключевым моментом. Это обусловлено тем, что каждая разрабатываемая модель должна соответствовать уникальным требованиям банка. Ее цели могут варьироваться от анализа кредитоспособности новых клиентов до оценки лояльности существующих, как физических, так и юридических лиц. Модели подстраиваются под разнообразные условия кредитования и целевые сегменты.
Для анализа и прогнозирования кредитоспособности клиентов современные кредитно-скоринговые системы используют обширные объемы данных, достигающие терабайт. Эти данные могут охватывать широкий спектр переменных: личная инфомрация заемщика, детали по запрашиваемому кредиту, историю выполненных платежей, осуществленные финансовые операции, уровень задолженности, продолжительность формирования кредитной истории, поданные заявления на получение новых кредитов, разнообразие кредитных продуктов и многое другое [2]. Период сбора этой информации может быть различным, однако он зачастую охватывает многолетний промежуток времени.
Финансовые организации склонны применять методы машинного обучения под названием «обучение с учителем» для разработки систем кредитного скоринга, что обусловлено их эффективностью в простой интеграции в банковские процессы и удобством в оценке их эффективности. Примером объясняющей переменной может быть статистика дефолтов по клиентам. При необходимости компенсировать недостаточный объем данных, банки используют внешние ресурсы, в том числе бюро кредитных историй, для уточнения и оптимизации своих скоринговых моделей.
Ученые, такие как Гринева Н.В., Михайлова С.С., Гришин А.А., Строев С.П., и их коллеги, занимались разработкой и анализом алгоритмов для оценки кредитоспособности. Примером классического поиска наиболее эффективной модели может быть работы Гришина А.А., Строева С.П. под названием «Инструментарий и особенности решения задачи классификации в системах кредитного скоринга», Татаринцева М.А. и соавторов – «Сравнительный анализ технологий машинного обучения для задач кредитного скоринга». Проводились исследования эффективности использования для этих целей моделей глубокого обучения, примером такой работы является публикация Бабаева Д.Л. и др. «E.T.-RNN: Applying Deep Learning to Credit Loan Applications». Авторы получили по разработке патент.
Изучив разнообразные данные, было определено, что к числу наиболее эффективных и популярных методов машинного обучения зарекомендованы алгоритмы случайный лес, градиентный бустинг и рекуррентные нейронные сети [3-5].
2. Противодействие мошенничеству.
В рамках превентивных мер против действий, нацеленных на незаконное получение финансовой выгоды, ключевая задача банков и других финансовых учреждений заключается в сокращении потенциальных потерь [6]. Широко используемое понятие «мошенничество» охватывает разнообразные противоправные действия, включая, среди прочего, фальсификацию данных по кредитным картам, манипуляции с финансовой отчетностью, схемы легализации капитала, полученного преступным путем, и обман при страховании.
Идентификация фродовых операций эффективно осуществляется через применение множества техник машинного обучения, нацеленных на обнаружение аномальных действий. Компетенция данных алгоритмов охватывает детальный анализ множества аспектов, связанных с проводимыми операциями, таких как история транзакций клиента, локация выполнения платежа, паттерны расходования средств и прочее, для своевременного выявления подозрительных событий. Многообразие мошеннических схем в финансовой сфере требует применения целого арсенала методов машинного обучения при разработке моделей, включая простейшие алгоритмы классификации, такие как логистическая регрессия, до более сложных, например, генеративно-состязательные сети.
В данном контексте, искусственные нейронные сети разрабатываются для анализа больших объемов данных, включая визуальные и аудиальные материалы, обеспечивая эффективную обработку неструктурированных данных с поддержкой алгоритмов машинного обучения, таких как автокодировщики. Эти методы применяются в различных областях, включая борьбу с мошенничеством в онлайн-системах, как показано в исследовании Ларионовой С.В., освещающем стратегии и технологии антифрод-систем [7]. Применение генеративно-соперничающих сетей (GAN) анализируется в исследовании Ларионовой С.В. «Усовершенствование алгоритмов антифрод-системы на основе использования методов Graph Representation Learning и сетей CycleGAN» [8].
3. Управление рисками.
Алгоритмы искусственного интеллекта в сфере риск-менеджмента позволяют банкам и финансовым учреждениям анализировать кредитный риск, операционные угрозы и финансовые риски, обеспечивая высокую точность оценок.
Операционный риск относится к вероятности возникновения убытков, вызванных человеческими ошибками, нарушениями в выполнении задач сотрудниками, неисправностями или неэффективностью внутренних процедур и систем, а также случаями форс-мажора, которые выходят за пределы контроля предприятия. В контексте снижения операционного риска, алгоритмы искусственного интеллекта применяются для аудита и снижению рисков, связанных с противодействием отмыванию денег (ПОД) и финансированием терроризма (ФТ), обеспечением кибербезопасности и защиты информационных систем. В частности, технологии машинного обучения могут использоваться для настройки и усиления систем безопасности компании, обеспечивая идентификацию необычных активностей или нарушений в работе внутренних систем и обнаружение вредоносных программ, что позволяет незамедлительно реагировать на потенциальные угрозы безопасности.
Финансовый риск означает угрозу потерь финансов и капитальных активов. Потеря клиентов сильно влияет на итоговый результат. Сохранение лояльности клиентов достигается через анализ больших объемов данных, что является эффективным инструментом управления рисками. Применяя аналитику данных, финансовые институты могут оперативно реализовывать стратегии для минимизации или исключения утечки клиентов [9].
Многие инвестиционные фонды и портфельные управляющие активно используют методы искусственного интеллекта и машинного обучения, направленные на оптимизацию риск-менеджмента и гарантирование соблюдения нормативных стандартов. В качестве примера можно привести оценку риска рыночной ликвидности или проверку отчетов о качестве сделок (EQR) на наличие ошибок [10].
4. Сервисы поддержки клиентов.
Современные финансовые учреждения оптимизируют свои ежедневные операции, интегрируя технологии виртуальной и дополненной реальности, и AI-технологии, такие как чат-боты и робо-консультанты. Чат-боты, используемые в системах поддержки клиентов банков, предлагают целый ряд преимуществ: круглосуточный доступ, немедленное получение ответов, уменьшение времени ожидания, разгрузку персонала и улучшение качества клиентского сервиса.
Обучение чат-ботов происходит за счет обработки естественного языка. Обработка естественного языка (NLP) – область исследований в искусственном интеллекте, занимающаяся взаимодействием между компьютерами и человеческим языком. Для анализа, понимания и создания текстов на языке людей часто применяются рекуррентные нейросети и трансформеры – модели, обучаемые на обширных текстовых массивах, что позволяет им формировать последовательные и содержательные ответы.
5. Консалтинг в сфере инвестирования.
Робоэдвайзеры, или алгоритмические торговые советники, являются программными агентами, предлагающими рекомендации по инвестициям. Они вместе с чат-ботами образуют инфраструктуру для консультаций инвесторов. В дополнение к анализу естественного языка, эти автоматизированные системы анализируют, прогнозируют и идентифицируют ключевые паттерны и динамику на рынке ценных бумаг.
Разработка торгового робота включает в себя четыре ключевых этапа:
1. Формулировка торговой стратегии, то есть определение ее направления, ожидаемой частоты сделок.
2. Тестирование стратегий на исторических данных, выполнение серии тестовых запусков, детальный анализ выходных данных, выявление недостатков и их последующее устранение для улучшения производительности.
3. Создание адаптивного торгового алгоритма, который может реагировать на колебания рыночной ситуации для минимизации издержек, и внедрение его в функционал торговых систем.
4. Разработка и внедрение комплексной системы управления рисками, эффективное управление капиталовложениями для проведения финансовых операций, и формирование стратегических алгоритмов поведения при возможных потерях или наступлении специфических условий.
В этой области ключевое значение приобретают алгоритмы обучения с подкреплением, а также сверточные, рекуррентные, генеративно-состязательные и многослойные полносвязные нейронные сети [11].
6. Операции на биржах ценных бумаг, автоматизированная торговля.
Фондовый рынок является сегментом финансового рынка, где происходит обмен ценными бумагами такими, как акции компаний, государственные и корпоративные облигации, а также различные производные финансовые инструменты (деривативы). Осуществление точных прогнозов относительно будущих стоимостей этих активов занимает ключевую роль в стратегическом планировании для множества организаций, ведь верные прогнозы способны значительно увеличить их капитал. Применение технологий машинного обучения для анализа рыночных тенденций, основываясь на большом массиве неструктурированных данных – от новостных статей до сообщений в социальных сетях и экспертных обзоров – открывает новые возможности. Применение алгоритмов обработки естественного языка (NLP) позволяет выявлять эмоциональную окраску текстов, что дает трейдерам и инвесторам возможность лучше понять маркетинговые настроения, сделав их выбор более осмысленным.
Машинное обучение является фундаментом для алгоритмических трейдинговых ботов, применяющих передовые математические модели для непрерывного анализа рыночных показателей и автоматизации выполнения
В контексте алгоритмической торговли, переменная, которую нужно предсказать – это обычно изменение стоимости финансового актива за заданный интервал времени. В качестве альтернативы можно использовать показатель волатильности как целевую переменную для прогнозирования. Эти алгоритмы интегрируют и анализируют широкий спектр данных – от цен и объемов сделок до экономических новостей и общего настроя в рынке, позволяя оперативно проводить операции купли или продажи финансовых инструментов.
В области глубокого обучения наиболее распространенной моделью для прогнозирования цен акций является LSTM (долгая краткосрочная память) – специфический вид рекуррентной нейронной сети, решающий проблему затухающих градиентов, которые могут возникать в обычных RNN. Этот прорывной метод быстро завоевал доверие в научном сообществе благодаря своей эффективности. Примером его применения является исследование, проведенное К. Крауссом и его соавторами, где LSTM, наряду с градиентным бустингом и алгоритмом случайного леса, использовалась для анализа поведения индекса S&P 500 [12].
7. Оптимизация портфеля.
Банки и инвестиционные фонды заинтересованы в разработке программного обеспечения, способного эффективно формировать портфели активов. Хотя традиционно используется модель Гарри Марковица, есть потребность в применении AI для усовершенствования финансовых технологий и инвестиционного консультирования. Применение методов машинного обучения позволяет разрабатывать решения для инвестиций, учитывая уникальные потребности, желания и риск-профиль каждого клиента. Эти технологии обучаются на исторических данных и поведенческих паттернах, чтобы выявлять наилучшие инвестиционные пути и поддерживать принятие обоснованных финансовых решений.
В рамках задачи проводились исследования с использованием сети Хопфилда (Hopfield Network), одного из видов рекуррентных нейронных сетей, предложенный американским физиком Джоном Хопфилдом. В исследовании, авторства С.А. Галкиной «Использование методов машинного обучения для построения оптимального портфеля ценных бумаг», осуществлялось сопоставление комплектаций активов, сгенерированных при помощи данной сети, с эталонным портфелем по методике Марковица. Сходство характеристик данных наборов активов оказалось значительным [13].
При ребалансировке инвестиционного портфеля, методики, включающие эволюционные алгоритмы, способны оптимизировать размещение активов, принимая во внимание динамичность модельного риска. Такой подход обеспечивает адаптацию к изменениям рыночной среды, корректируя волатильность каждого актива при наличии ошибок в исходной модели. Это существенно повышает точность предсказаний успеха инвестирования. В результате применения этой стратегии портфели демонстрируют улучшение коэффициента Шарпа на 10%, отражая лучшую рентабельность против риска по сравнению с портфелями, не адаптированными под модельные риски [14].
8. Клиентская сегментация и индивидуальный маркетинговый подход.
Высокая степень конкуренции в финансовой отрасли требует усовершенствование ключевых процессов в сфере финансов, в том числе в обработке данных и аналитике клиентов, способствует укреплению позиций финансовых институтов на рынке. В фундаменте взаимодействия с клиентами в банковских учреждениях лежит сбор обширной информации о них для последующей эффективной классификации. Такое деление клиентской базы на отдельные категории по принципу общих черт позволяет точнее адресовать финансовые услуги и предложения.
Сегментирование клиентской базы является одной из ключевых задач в области кластеризации данных, методологии, позволяющей объединять потребителей в отдельные группы с учетом их сходства по ряду параметров, включая возрастные категории, уровень дохода, поведенческие аспекты и другие характеристики.
На рынке существует множество алгоритмов кластеризации, предназначенных для эффективного разделения клиентов на сегменты. Наиболее известными из них являются метод k-средних, DBSCAN и иерархическая кластеризация. В основе последних лежат такие объединения нейронов, как двухмерные сети или «карты» Кохонена, опирающиеся на идентичности анализируемых свойств, которые они воспроизводят и реплицируют [15]. Применение данных подходов в создании ИИ-моделей способствует разработке индивидуализированных рекомендаций в сфере маркетинга, повышая их целевую эффективность.
9. Автоматизация бизнес-процессов.
Роботизированная процессная автоматизация (RPA) представляет собой передовую технологию, которая использует программных роботов для выполнения повторяющихся задач, которые ранее выполнялись людьми. Она включает применение методик искусственного интеллекта, в том числе обработку естественного языка, оптическое распознавание символов и методы компьютерного зрения, а также использование традиционных и продвинутых алгоритмов машинного обучения. RPA может быть задействована для выполнения ряда бизнес-функций, таких как анализ и обработка документации, интеграция данных между различными системами и автоматизация процессов выставления счетов.
Методы машинного обучения, применяемые в сфере роботизированной автоматизации бизнес-процессов обеспечивают возможность программным решениям образовываться и совершенствоваться посредством анализа данных, что приводит к повышению их эффективности на протяжении времени. Мировой рынок данной технологии демонстрирует активный рост. Аналитики предсказывают, что в ближайшем будущем годовой рост этого сегмента достигнет примерно 39,9% [16].
10. Управление доступом.
В современном мире банковская индустрия активно интегрирует биометрические технологии в процессы верификации личности клиентов в рамках программы «Знай своего клиента» (KYC). KYC обязывает банки собирать всестороннюю информацию о своих клиентах, включая данные о юридических лицах, специфике их бизнеса, а также проводимых ими финансовых транзакциях. Это предохраняет финансовую систему от рисков отмывания денег, финансирования террористической деятельности и уклонения от налогообложения. Банки все активнее используют биометрическую верификацию, включая отпечатки пальцев, распознавание лица или голоса для проведения банковских операций через мобильные приложения, обеспечения доступа к системам безопасности и банкоматам. Применение биометрии усиливает защищенность транзакций и одновременно повышает уровень комфорта для пользователей.
Определение подходящего алгоритма диктуется родом биометрических измерений, объемом данных, целью применения (подтверждение личности или выявление индивидуума), а также необходимыми уровнями эффективности и защищенности системы.
Заключение
Таким образом, машинное обучение – это область исследований, которая наделяет компьютеры способностью обучаться без явного программирования с помощью прошлых данных или примеров. Искусственный интеллект, представленный на мировом рынке, конструируется с помощью машинного обучения.
Среди преобладающих направлений применения машинного обучения в финансовом секторе выделяются выявление мошенничества, ускорение принятия решений о кредитовании, автоматизация бизнес-процессов и автоматизация торговли на фондовом и валютных рынках.
Финансовая отрасль находится в топе областей, подверженных преступности и операционному риску. Расследование подозрительных операций вручную занимает много времени и часто страдает от высокого процента ложных срабатываний. Современные модели машинного обучения способны улучшить качество выявления мошенничества до 95% и существенно сокращать потери.
Использование машинного обучения для задач кредитного скоринга является значительно расширило сферу одобрения кредитов, предполагаемое увеличение числа принятых кредитных заявок составляет 27%. Кредитные организации теперь также полагаются не только на официальные данные кредитных бюро, но и на цифровое присутствие соискателя, его транзакции и даже профили в социальных сетях.
Финансовые роботы могут обеспечивать высококачественное обслуживание клиентов намного быстрее и эффективнее человека. Доля финансового сектора на рынке чат-ботов уступает лишь ритейлу и электронной торговле.
Использование роботов в алгоритмической торговле способствует высвобождению ресурсов трейдеров для реализации более сложных стратегий, оптимизации стратегий управления рисками и минимизации потенциальных потерь.
Библиографическая ссылка
Горбачева Т.А. НАПРАВЛЕНИЯ ИСПОЛЬЗОВАНИЯ МАШИННОГО ОБУЧЕНИЯ В ФИНАНСОВОЙ ИНДУСТРИИ // Вестник Алтайской академии экономики и права. 2025. № 2-2. С. 157-163;URL: https://vaael.ru/ru/article/view?id=3997 (дата обращения: 03.04.2025).
DOI: https://doi.org/10.17513/vaael.3997