Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

АВТОМАТИЗАЦИЯ НЕПРОИЗВОДСТВЕННЫХ БИЗНЕСС-ПРОЦЕССОВ С ИСПОЛЬЗОВАНИЕМ ГОЛОСОВЫХ ЦИФРОВЫХ ТЕХНОЛОГИЙ

Злобина О.В. 1
1 Санкт-Петербургский университет аэрокосмического приборостроения
Цифровые технологии (ЦТ) с использованием искусственного интеллекта (ИИ) для обеспечения голосового взаимодействия с потребителем получают все большее распространение и все чаще используются организациями для обеспечения внешнего взаимодействия. Данные опросов и исследований свидетельствуют как о росте общей степени цифровизации общества, так и о готовности пользователей цифровых устройств изменять свои потребительские привычки и поведение и перейти к почти полному взаимодействию с системами ИИ, включая голосовых помощников, в процессе поиска, выбора и приобретения товаров и услуг. Увеличение числа программных решений, платформ и приложений для создания голосовых ботов приводит к увеличению числа организаций, использующих их в разнообразных бизнес-процессах. Общая тенденция к переходу на голосовой диалог между цифровым устройством (ЦУ) и пользователем обеспечивается развитием технологий многофункциональных голосовых помощников (Алиса от Яндекса, Салют от Сбербанка, Маруся от Вконтакте). Возможность виртуального взаимодействия становится не только средством для организации бизнес-процессов и развития коммерческих организаций, критерием для оценки организаций пользователями, но и естественным способом взаимодействия современного человека с окружающим миром.
цифровизация
внешнее взаимодействие
трансформация
голосовой бот
цифровой голосовой помощник
интерактивная система голосового взаимодействия
IPSOS Views: The Evolution of Shopper Behavior, 2020. [Электронный ресурс] URL: https://www.ipsos.com/sites/default/files/ct/publication/documents/2020-01/evolution-shopper-behaviour-january2020.pdf (датаобращения 01.10.2022).
Prepare for the voice revolution. 2018 [Электронный ресурс] URL: https://www.pwc.com/us/en/services/consulting/library/consumer-intelligence-series/voice-assistants.htm (дата обращения: 12.01.2022).
Silkin L. Future of voice assistants. Апрель 2021. [Электронный ресурс] URL: https://www.futureofworkhub.info/explainers/2021/4/19/future-of-voice-assistants-how-the-va-might-overtake-the-pa Lewis Silkin LLP (дата обращения: 12.01.2022).
Worldwide digital voice assistant in use // Statista. [Электронный ресурс] URL: https://www.statista.com/statistics/973815/worldwide-digital-voice-assistant-in-use (дата обращения: 12.01.2022).
ИИ Предприятие компании Nvidia. [Электронный ресурс] URL: https://www.nvidia.com/en-us/data-center/products/ai-enterprise/(дата обращения: 10.08.2022).
Zachariadis M., Ozcan P. The Economics and Strategy of Platforms: Competing in the Era of Open Banking./ The Book on Open Banking, Bud Financial Limited, 2018. [Электронный ресурс] URL: https://appgfintech.org.uk/reports/the-book-onopen-banking-a-series-of-essays/ (дата обращения: 10.08.2022).
Makarenko E. 9 Key Predictions for the Future Of Voice Assistants. 2022 [Электронный ресурс] URL: https://masterofcode.com/blog/9-key-predictions-for-the-future-of-voice-assistants (дата обращения: 12.10.2022).
Voice Assistants in 2022: Usage, growth, and future of the AI voice assistant market // Insider Intelligence. [Электронный ресурс] URL: https://www.insiderintelligence.com/insights/voice-assistants (дата обращения: 12.01.2022).
Стартап SaaS платформа «Даша» [Электронный ресурс] URL: https://dasha.ai/ru-ru/(дата обращения: 15.10.2022).
Гусев А.Н. Анализ голоса в обеспечении безопасности финансовых организаций: использование технологии LVA // Внутренний контроль в кредитной организации. 2019. Т. 41, № 1. С. 82–93.
80 Key Voice Search Statistics: 2021/2022 Market Share & Data Analysis // Finances Online [Электронный ресурс] URL: https://financesonline.com/voice-search-statistics (дата обращения: 12.01.2022).
ВЦИОМ: Цифровизация и искусственный интеллект [Электронный ресурс] URL: https://wciom.ru/fileadmin/file/nauka/podborka/wciom_sociodigger_102020.pdf?ysclid=lac4gnow2w51093926 (дата обращения: 12.01.2022).
Овечкина А.И., Петрова Н.П. К вопросу цифровой трансформации российской экономики / Государственное регулирование экономики. 2021. C. 57-62. URL: https://cyberleninka.ru/article/n/k-voprosu-o-tsifrovoy-transformatsii-rossiyskoy-ekonomiki?ysclid=lb7y015k8o11037323 (дата обращения: 12.09.2022).
Голосовые боты. [Электронный ресурс] URL: https://in-scale.ru/blog/golosovye-boty/?ysclid=lac4xpjx4m921684112 (дата обращения: 02.11.2022).
Голосовой бот: обзор лучший сервисов и чек-лист по составлению алгоритма // Генератор продаж. Октябрь 2021. [Электронный ресурс] URL: https://sales-generator.ru/blog/golosovoy-bot-obzor-luchshiy-servisov/?ysclid=lb7vit8s2l158207165 (дата обращения: 12.01.2022).

Введение

Цифровые технологии (ЦТ) играют все большую роль в современном обществе, в том числе в сфере взаимодействия коммерческих предприятий и потребителей их товаров и услуг. Данные исследований говорят о радикальном изменении процесса поиска, выбора и приобретения товара или услуги – на сегодняшний день большая часть такого вида действий у наиболее экономически активной части общества осуществляется с использованием цифровых устройств (ЦУ) и ЦТ [1].

Современный потребитель характеризуется высокой степенью осведомленности о возможностях ЦУ, а также программных продуктов и сред, создаваемых компаниями для обеспечения взаимодействия с потребителями товаров или услуг (функциональные интернет-сайты, приложения для смартфонов и т. п.) [2]. Также данные опросов говорят о наличии высокой степени готовности потребителей использовать такие технологии и продукты для взаимодействия с организациями-поставщиками интересующих их товаров и услуг. Возможность получить опыт цифрового взаимодействия все чаще выступает как один из существенных критериев оценки эффективности организации в осуществлении внешнего взаимодействия [1].

Одним из сравнительно недавно (по отношению к другим видам ЦТ) появившихся направлений развития ЦТ можно назвать технологии на основе искусственного интеллекта (ИИ) с использованием речевого (голосового) взаимодействия, так называемых голосовых ботов, помощников или ассистентов. Первый голосовой помощник Siri был приобретен компанией Apple в 2011 г., в 2014 г. компания Microsoft разработала помощника Alexa, в 2016 г. появился Google Assistant [3]. Простота и эффективность голосового взаимодействия привели к быстрому развитию таких продуктов и резкому росту числа голосовых ботов: по оценкам, в 2019 г. их число превысило 3 миллиарда, и, по существующим прогнозам, к 2023 г. достигнет 8 миллиардов ботов (рисунок).

Основной причиной быстрого развития технологии голосовых помощников является характер обеспечиваемого ими взаимодействия: устное общение является наиболее простым и естественным способом взаимодействия человека с внешним миром, по сравнению с физическими действиями (например, поход в отделение банка или магазин, работа с графическим интерфейсом) и письмом (набором текста). Существующий уровень развития речевых технологий позволяет добиться достаточно высокой эффективности как в распознавании устройствами голосового запроса пользователя, так и в формировании голосового ответа на запрос – сегодня взаимодействие с голосовыми помощниками выглядит как естественный и эффективный диалог [5]. Важным фактором, содействующим распространению технологии голосовых ассистентов, является появление новых устройств, обеспечивающих такую функцию – умных колонок, капсул и т. п. продуктов.

Цель исследования

В качестве основной цели исследования выступает анализ текущего этапа развития и функционирования технологий голосового взаимодействия и оценка перспектив их применения для обеспечения бизнес-процессов коммерческих организаций, прежде всего внешней и внутренней коммуникации, на основе прогнозируемых тенденций и показателей.

Материал и методы исследования

Исследование носит эмпирический характер, поскольку связано с областью использования ЦТ, появившейся сравнительно недавно и переживающей период быстрого роста и развития, чем объясняется крайне небольшое количество доступных для анализа материалов. При проведении анализа были использованы преимущественно статистические данные исследований и опросов, проведенные такими специализирующимися в сборе статистических данных организациями, как ВЦИОМ и Statista, консалтинговыми агентствами PriceWaterhouseCoopers, Boston Consulting Group и IPSOS, сайты российских и западных разработчиков решений на основе голосового взаимодействия. Все использованные в ходе исследования данные были опубликованы в открытых источниках.

pic_Zlobina_1.wmf

Число голосовых ботов в мире, в миллиардах единиц (составлено по [4])

Результаты исследования и их обсуждение

Развитие цифровых технологий, в особенности технологий на основе ИИ, привело к появлению новых решений для организации как производственных, так и непроизводственных бизнес-процессов. Существующие системы позволяют полностью автоматизировать процессы, связанные с внутренней и внешней коммуникацией, ведением отчетности, выставлением счетов и т. д. [5]. Так, многие платформенные решения, как и решения на основе более сложных программных цифровых продуктов, позволяют полностью автоматизировать процесс внешней коммуникации: почтовый бот ведет переписку, отвечая на вопросы клиентов, формирует заказы и автоматически выставляет счета, также отправляет напоминание о необходимости оплаты выставленных счетов и т. д. Крупные организации используют чат-боты для организации внутренней коммуникации – автоматической отправки сообщений и напоминаний о собраниях, совещаниях и запланированных встречах, отчетах, информирование о событиях и т. п. [6]. Очевидно, разработка и внедрение подобных решений являются обязательным условием для полного перехода к промышленному «Интернету вещей» и Промышленности 4.0.

Фактически, на сегодняшний день можно говорить о практически полной автоматизации любого вида коммуникации – как внутри организаций, так и взаимодействия с внешней средой. Такого рода решения могут разрабатываться индивидуально, с использованием сложных комплексных технологий, например, комплексные решения с использованием программных продуктов NVidia AI Entersprise, позволяющие полностью автоматизировать производственные процессы, а также непроизводственные бизнес процессы – ведение отчетности, коммуникацию, логистику и т. д. [5].

Многие существующие платформы для предприятий малого и среднего бизнеса предлагают аналогичные, но более простые решения для организации непроизводственных бизнес-процессов и все чаще используются компаниями в организации своей деятельности [6].

Все чаще предприятия в разных секторах экономики и разного размера применяют технологии на основе ИИ с использованием систем обработки и создания текстовых сообщений, а также более совершенные системы обработки и вывода с использованием голосовых технологий. Естественно, в первую очередь такие технологии применяются компаниями с большим объемом внешней коммуникации. Так, например, текстовые (и сейчас все больше) голосовые боты все более широко применяются для организации внешней коммуникации крупными розничными магазинами и сетями, в первую очередь онлайн-торговыми площадками и сайтами-аггрегаторами. Фактически, вся внешняя коммуникация в таких случаях осуществляется автоматически с использованием текстовых ботов [7].

Еще одним сектором, где также активно внедряются технологии автоматизации внешней коммуникации являются банки. В отдельных случаях крупные банки даже осуществляют крупные инвестиции в разработку собственного виртуального голосового ассистента, например, «Елена» в Сбербанке или «Олег» в Тинькофф банке.

Аналогичные системы активно используются компаниями, специализирующими в оказании медицинских услуг, а также в сфере страхования – у таких компаний внедрение систем с использованием текстовых или голосовых ботов позволяет полностью автоматизировать все процессы, связанные с взаимодействием с клиентами. В медицинских учреждениях внедряются системы, позволяющие передать им все виды функций, выполняемых регистратурой (запись, напоминание о записи, ведение графиков приема специалистов и т. п.). Также существуют системы на основе текстовых / голосовых ботов, позволяющих следить за состоянием пациентов, находящихся вне медицинского учреждения, напоминать о необходимости приема лекарств и т. д. [7]. Страховые компании полностью автоматизирую процесс отправки предложений и напоминаний клиентам, производят расчет страховой выплаты и взносов, связываются с перспективными клиентами и т. п.

В целом, можно говорить о том, что на сегодняшний день практически любая коммерческая организация, вне зависимости от рода деятельности и размера, может автоматизировать все или значительную часть непроизводственных бизнес-процессов с использованием технологий на основе ИИ, в том числе речевых и голосовых технологий.

На текущем этапе развития ЦТ, связанных с обеспечением голосового взаимодействия, можно выделить несколько основных разновидностей продуктов, предназначенных для обеспечения автоматизации определенных процессов:

1) Голосовые боты.

2) Интерактивные системы голосового взаимодействия.

3) Голосовые помощники.

Данное разделение носит несколько условный характер, поскольку принцип разработки вышеуказанных типов продуктов весьма схож, различие проявляется только в возможностях соответствующего продукта и сфере их применения.

Под голосовыми ботами понимаются решения, аналогичные по типу чат-ботам (общение при помощи обмена сообщениями в мессенджере или приложении), при этом обладающие функциями восприятии устных сообщений и предоставления ответа также в форме устного сообщения. Такого рода боты разрабатываются чаще всего крупными компаниями в качестве дополнительной функции к уже существующему приложению для смартфона и аналогичных устройств [7]. Спектр функций таких голосовых ботов достаточно широк. Лидерами в области разработки голосовых ботов являются крупнейшие мировые банки (Erica в Bank of America, Олег в Тинькофф банке и др.), а также крупные компании, такие как Amazon, Spotify, Starbucks и т. д.

Интерактивные системы голосового взаимодействия предназначены для организации телефонного взаимодействия с клиентами, по сути, такие системы представляют собой усовершенствованный вариант колл-центра. Такие системы способны работать непрерывно, одновременно принимать до нескольких тысяч телефонных звонков, производить запись разговора, отвечать на вопросы клиента, пользуясь данными из определенной базы данных, в случае необходимости переключать звонок на оператора, производить обзвон клиентов с предложением товара или напоминанием о записи на прием, автоматически заполнять необходимые документы или вносить в базу необходимые данные, анализировать данные, полученные в ходе работы системы по многим параметрам [8]. Такого рода системы широко используются организациями, в силу характера своей деятельности вынужденными контактировать с большим числом клиентов постоянно.

Голосовые помощники представляют, по сути, более сложные решения, фактически объединяющие функции голосовых ботов и интерактивных систем голосового взаимодействия, поскольку способны выполнять самые разнообразные функции, в том числе взаимодействовать с другими приложениями на устройстве или с другими устройствами. Прогнозируется, что голосовые помощники станут одной из отличительных черт развития повседневного цифрового взаимодействия людей в ближайшем будущем и естественным компонентом взаимодействия людей с окружающим миром [7]. Крайне перспективными, с точки зрения аналитиков, представляются разработки умных колонок и капсул, которые не только обеспечивают более высокое качество общения (так, по данным опроса, удовлетворенность качеством распознавания речи и эффективностью диалога намного выше среди владельцев умных колонок, чем у владельцев смартфонов) и обеспечивают более широкий спектр функций, в том числе взаимодействие с другими устройствами, что является основой для домашнего Интернета вещей [2]. Разработчиками голосовых помощников выступают крупнейшие компании, специализирующиеся в области передовых информационных и цифровых технологий, например, «Яндекс», «Сбербанк», «Вконтакте» и т. п.

Несмотря на отдельные данные о низкой эффективности использования голосовых ботов [9], в целом можно говорить об очевидных преимуществах автоматизации бизнес-процессов с использованием речевых и голосовых технологий: эта мера позволяет компаниям как снизить издержки на организацию процесса (сокращение числа сотрудников, связанных с определенным бизнес-процессом, обеспечение непрерывности процесса и т. д.), так и повысить его эффективность (отсутствие ошибок, бесперебойная работа, большое число одновременных контактов и т. д.). К тому же, к функциям голосового бота или интерфейса можно добавить функции оценки эмоционального состояния или степени правдивости, в которых также используются технологии обработки речи. Такие разработки на сегодняшний день предлагают многие компании-поставщики голосовых ботов например, технология «Castel Detect» и ПО QA5 в компании «North Star» для оценки эмоционального состояния или технологии с использованием ПО RA7 показали высокую эффективность как в повышении качества внешней коммуникации, так и снижении расходов и риска [10].

Данные опросов и исследований свидетельствуют, что популярность голосового взаимодействия с цифровыми устройствами пользователей постоянно растет, что не в последнюю очередь связано с переходом «цифрового поколения» в разряд активных потребителей, т. е. речь идет о людях, родившихся в начале 21 века, в жизни которых сложные цифровые устройства и технологии присутствовали с рождения. Цифровое взаимодействие и использование цифровых устройств является неотъемлемой частью жизни таких людей, большая часть экономического, прежде всего потребительского, взаимодействия также происходит на основе использования цифровых устройств и технологий [1]. Такие пользователи считают цифровое взаимодействие естественным способом поиска, выбора, приобретения товаров и услуг, часто коммерческие организации выбираются и оцениваются такими потребителями с точки зрения качества обеспечиваемого организацией цифрового взаимодействия.

Еще одной группой, активно содействующей распространению голосовых технологий и решений с их применением, являются люди среднего возраста (25–49 лет), и в особенности жители крупных городов, семьи с детьми и люди с высоким доходом [2]. Данные исследований говорят о том, что представители разных возрастных групп (в опросе участвовали пользователи сети Интернет от 18 до 64 лет) характеризуются высокой степенью осведомленности о возможностях голосовых технологий: опрос, проведенный в 2018 г. компанией PriceWaterhouseCooper показал, что только 10 % респондентов ответили отрицательно на вопрос о знакомстве с голосовыми технологиями и их возможностями; при этом 72 % из ответивших на вопрос положительно заявили, что пользуются голосовыми помощниками. В целом, представители средней возрастной группы пользуются голосовыми помощниками даже чаще, чем более молодые пользователи (табл. 1).

Таблица 1

Соотношение активных и пассивных пользователей голосовых помощников разных возрастных групп (составлено по [2])

Возрастная группа, лет

Оценили частоту использования голосового помощника* как (в %)

Высокую

Среднюю

Низкую

18–24

59 %

33 %

8 %

25–49

65 %

29 %

6 %

50 и более

57 %

40 %

3 %

Примечание. *учитывались ответы респондентов, положительно ответивших на вопрос о знакомстве с голосовыми помощниками

Среди потребителей, пользовавшихся голосовыми помощниками для заказа товаров, 80 % положительно оценили полученный опыт, при этом 39 % впоследствии поделились рассказом о положительном опыте использования помощника знакомым; 39 % повторно произвели приобретение товара у этой же организации; 24 % увеличили расходы на товары, приобретаемые у этой организации. При этом каждый 4-ый пользователь выразил неготовность производить приобретение и оплату товаров при помощи голосового бота, вызванную опасениями в корректности обработки помощником устного заказа и недоверием к денежным переводам, осуществленным с использованием голоса.

Среди участников опроса 50 % респондентов заявили, что уже совершали приобретение товара или услуги при помощи голосового бота (каждый десятый опрошенный заявил, что совершает приобретение товаров / услуг ежедневно); при этом из ответивших отрицательно 25 % проявили готовность рассмотреть возможность приобретения товара или услуги при помощи голосового бота в будущем. В отношении групп товаров, приобретаемых (а также рассматриваемых как возможные для приобретения в будущем) пользователями с использованием голосовых помощников, данные опроса также показали интересное распределение (табл. 2).

На сегодняшний день аналогичных опросов среди российских пользователей не проводилось, однако ряд данных опросов ВЦИОМ, связанные с исследуемой тематикой, также подтверждают вышеизложенные результаты.

По данным опроса, проведенного ВЦИОМ в 2020 г., 3 % респондентов назвали умную колонку (умные очки) одним из 5 главных удобств 21 века [12]. Данные опроса 2019 г. о том, насколько часто пользователи заказывают товары с доставкой на дом показали, что около 20 % жителей больших городов делают такие заказы не менее раза в месяц, 5 % – несколько раз в неделю и 1 % – приобретают товары ежедневно, причем наиболее высокое число пользователей, регулярно заказывающих товары с доставкой на дом оказалось среди возрастных групп 18–24 и 25–34 лет, в которых более 30 % и 25 % соответственно производят заказ с доставкой на дом не менее нескольких раз в месяц (5 % опрошенных первой группы заявили, что делают это ежедневно).

Таблица 2

Соотношение активных и пассивных пользователей голосовых помощников разных возрастных групп (составлено по [11])

Вид товара/услуги

Ранее приобретали, в %

Планируют приобретение, в %

Готовые блюда на вынос

34 %

35 %

Бакалейные товары

31 %

27 %

Книги

24 %

23 %

Электроника и бытовая техника

22 %

26 %

Заказ такси

21 %

29 %

Билеты на культурные, спортивные и т. п. мероприятия

16 %

32 %

Одежда и обувь

3 %

22 %

Туристические поездки

0 %

26 %

Предприниматели, участвовавшие в опросе ВЦИОМ 2019 г. (в поросе участвовало 800 представителей бизнеса), дали следующие ответы на вопрос про использование технологий ИИ в деятельности организации (табл. 3).

Таблица 3

Использование технологий ИИ в деятельности организации [12]

Использование ИИ в работе компании

В % от числа опрошенных

Да, используются

31 %

Нет, но планируется их использовать

23 %

Нет и не планируется их использовать

43 %

Затрудняюсь ответить

3 %

Оценивая эффективность использования технологий ИИ, более 30 % опрошенных заявили об их безусловной эффективности, 50 % оценили внедрение технологий ИИ как эффективное и только 10 % заявили о неэффективности использования технологий ИИ. Эффективность внедрения ЦТ также подтверждают данные консалтингового агентства Boston Consulting Group, согласно которым организации-лидеры по использованию ЦТ как минимум в 1,8 раза опережают компании с более низкой степенью цифровизации в отношении таких показателей, как рост прибыли и общей стоимости компании [13].

Выводы

Технологии с использованием голосового общения, являясь наиболее простым и естественным способом человеческого общения, несомненно, получат широкое распространение. Крайне важной кажется возможность использования голосовых интерфейсов для людей со слабым и полностью утраченным зрением. Для повышения эффективности работы устройств и решений с использованием голосового общения необходимо

● продолжать разрабатывать новые устройства (такие, как умная колонка), обеспечивающие новые функции и возможности, а также повышающие качество голосового взаимодействия;

● продолжать совершенствовать сами технологии распознавания речи: например, решать проблемы с распознаванием речи иностранцев, носителей диалектов, людей с дефектами речи и т. п.

Уже сегодня, по сравнению с более ранними периодами существования голосовых технологий, они не только достигли уровня, обеспечивающего естественный для пользователя диалог, но и начали применяться организациями самых разных видов, в том числе сравнительно небольшими компаниями. Естественно, что разработка более сложных и совершенных, обеспеченных специальными устройствами решений, таких, как Алиса, Маруся, Салют и т. п., является результатом многолетней работы высококвалифицированных групп специалистов. Однако их растущая популярность и снижение стоимости специализированных устройств могут привести к полной трансформации взаимодействия человека и компьютера.

Одновременно разрабатываются среды и платформы для создания более простых решений, могущих использоваться для разработки голосовых решений даже небольшими компаниями, например, приложения агрегаторов голосовых ботов, таких как UIS, MTT, Mango, Гравител и т. д. [14] Более комплексные готовые решения (платформы), такие как Робовойс, Инфобот, Аймилогик или Воксимплант Кит, разработанные с использованием решений Google, Яндекс, Тинькофф, АСМ позволяют создавать как достаточно простые, так и многофункциональные системы с функциями отправки электронных писем или всплывающих уведомлений, говорящие клонированным (воспроизводимым на основе имеющихся образцов) голосом профессионального актера для создания более естественного звучания и т. п. [15]. Такие решения для организаций, работающих ежедневно с большим числом клиентов, в ближайшее время станут естественными и очевидными, что приведет не только к изменению способов организации внешнего взаимодействия компаний, но и к исчезновению некоторых профессий и изменению рынка труда.


Библиографическая ссылка

Злобина О.В. АВТОМАТИЗАЦИЯ НЕПРОИЗВОДСТВЕННЫХ БИЗНЕСС-ПРОЦЕССОВ С ИСПОЛЬЗОВАНИЕМ ГОЛОСОВЫХ ЦИФРОВЫХ ТЕХНОЛОГИЙ // Вестник Алтайской академии экономики и права. – 2022. – № 12-1. – С. 78-84;
URL: https://vaael.ru/ru/article/view?id=2619 (дата обращения: 26.04.2024).