Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

AUTOMATION OF SUPPORTING BUSINESS PROCESSES WITH VOICE-BASED DIGITAL TECHNOLOGIES

Zlobina O.V. 1
1 Saint Petersburg State University of Aerospace Instrumentation
Digital technologies based on artificial intelligence (AI) application for speech recognition and conversational interaction with consumers are becoming more natural, more common and are used extensively by businesses and organizations in their continuous interaction with consumers and external environment. Survey data demonstrate both growing degree of overall digitization in almost every aspect of human activity, including economy, and readiness of the wider public to change their consumer habits and behavior and to totally switch to interaction with AI-based systems including conversational interfaces, voice bots and digital assistants. Increased numbers of solutions, i.e. platforms and specialized applications, offering construction of voice-bot with pre-set features and functions at affordable prices makes more and more companies, including small and medium size businesses, turn to speech-based solutions. The overall trend for conversational interaction with digital devices is supported by proliferation and growing popularity of multifunctional digital assistants (Alexa, Google Assistant, Siri etc.). Digital, and more specifically conversational, experience available for user becomes a criterion of company’s evaluation by consumers and thus appears crucial for sustained growth and development. Conversation is predicted to become a natural way of computer-human interaction in the nearest future.
digitization
external interaction
transformation
voice bot
digital voice assistant
interactive virtual response

Введение

Цифровые технологии (ЦТ) играют все большую роль в современном обществе, в том числе в сфере взаимодействия коммерческих предприятий и потребителей их товаров и услуг. Данные исследований говорят о радикальном изменении процесса поиска, выбора и приобретения товара или услуги – на сегодняшний день большая часть такого вида действий у наиболее экономически активной части общества осуществляется с использованием цифровых устройств (ЦУ) и ЦТ [1].

Современный потребитель характеризуется высокой степенью осведомленности о возможностях ЦУ, а также программных продуктов и сред, создаваемых компаниями для обеспечения взаимодействия с потребителями товаров или услуг (функциональные интернет-сайты, приложения для смартфонов и т. п.) [2]. Также данные опросов говорят о наличии высокой степени готовности потребителей использовать такие технологии и продукты для взаимодействия с организациями-поставщиками интересующих их товаров и услуг. Возможность получить опыт цифрового взаимодействия все чаще выступает как один из существенных критериев оценки эффективности организации в осуществлении внешнего взаимодействия [1].

Одним из сравнительно недавно (по отношению к другим видам ЦТ) появившихся направлений развития ЦТ можно назвать технологии на основе искусственного интеллекта (ИИ) с использованием речевого (голосового) взаимодействия, так называемых голосовых ботов, помощников или ассистентов. Первый голосовой помощник Siri был приобретен компанией Apple в 2011 г., в 2014 г. компания Microsoft разработала помощника Alexa, в 2016 г. появился Google Assistant [3]. Простота и эффективность голосового взаимодействия привели к быстрому развитию таких продуктов и резкому росту числа голосовых ботов: по оценкам, в 2019 г. их число превысило 3 миллиарда, и, по существующим прогнозам, к 2023 г. достигнет 8 миллиардов ботов (рисунок).

Основной причиной быстрого развития технологии голосовых помощников является характер обеспечиваемого ими взаимодействия: устное общение является наиболее простым и естественным способом взаимодействия человека с внешним миром, по сравнению с физическими действиями (например, поход в отделение банка или магазин, работа с графическим интерфейсом) и письмом (набором текста). Существующий уровень развития речевых технологий позволяет добиться достаточно высокой эффективности как в распознавании устройствами голосового запроса пользователя, так и в формировании голосового ответа на запрос – сегодня взаимодействие с голосовыми помощниками выглядит как естественный и эффективный диалог [5]. Важным фактором, содействующим распространению технологии голосовых ассистентов, является появление новых устройств, обеспечивающих такую функцию – умных колонок, капсул и т. п. продуктов.

Цель исследования

В качестве основной цели исследования выступает анализ текущего этапа развития и функционирования технологий голосового взаимодействия и оценка перспектив их применения для обеспечения бизнес-процессов коммерческих организаций, прежде всего внешней и внутренней коммуникации, на основе прогнозируемых тенденций и показателей.

Материал и методы исследования

Исследование носит эмпирический характер, поскольку связано с областью использования ЦТ, появившейся сравнительно недавно и переживающей период быстрого роста и развития, чем объясняется крайне небольшое количество доступных для анализа материалов. При проведении анализа были использованы преимущественно статистические данные исследований и опросов, проведенные такими специализирующимися в сборе статистических данных организациями, как ВЦИОМ и Statista, консалтинговыми агентствами PriceWaterhouseCoopers, Boston Consulting Group и IPSOS, сайты российских и западных разработчиков решений на основе голосового взаимодействия. Все использованные в ходе исследования данные были опубликованы в открытых источниках.

pic_Zlobina_1.wmf

Число голосовых ботов в мире, в миллиардах единиц (составлено по [4])

Результаты исследования и их обсуждение

Развитие цифровых технологий, в особенности технологий на основе ИИ, привело к появлению новых решений для организации как производственных, так и непроизводственных бизнес-процессов. Существующие системы позволяют полностью автоматизировать процессы, связанные с внутренней и внешней коммуникацией, ведением отчетности, выставлением счетов и т. д. [5]. Так, многие платформенные решения, как и решения на основе более сложных программных цифровых продуктов, позволяют полностью автоматизировать процесс внешней коммуникации: почтовый бот ведет переписку, отвечая на вопросы клиентов, формирует заказы и автоматически выставляет счета, также отправляет напоминание о необходимости оплаты выставленных счетов и т. д. Крупные организации используют чат-боты для организации внутренней коммуникации – автоматической отправки сообщений и напоминаний о собраниях, совещаниях и запланированных встречах, отчетах, информирование о событиях и т. п. [6]. Очевидно, разработка и внедрение подобных решений являются обязательным условием для полного перехода к промышленному «Интернету вещей» и Промышленности 4.0.

Фактически, на сегодняшний день можно говорить о практически полной автоматизации любого вида коммуникации – как внутри организаций, так и взаимодействия с внешней средой. Такого рода решения могут разрабатываться индивидуально, с использованием сложных комплексных технологий, например, комплексные решения с использованием программных продуктов NVidia AI Entersprise, позволяющие полностью автоматизировать производственные процессы, а также непроизводственные бизнес процессы – ведение отчетности, коммуникацию, логистику и т. д. [5].

Многие существующие платформы для предприятий малого и среднего бизнеса предлагают аналогичные, но более простые решения для организации непроизводственных бизнес-процессов и все чаще используются компаниями в организации своей деятельности [6].

Все чаще предприятия в разных секторах экономики и разного размера применяют технологии на основе ИИ с использованием систем обработки и создания текстовых сообщений, а также более совершенные системы обработки и вывода с использованием голосовых технологий. Естественно, в первую очередь такие технологии применяются компаниями с большим объемом внешней коммуникации. Так, например, текстовые (и сейчас все больше) голосовые боты все более широко применяются для организации внешней коммуникации крупными розничными магазинами и сетями, в первую очередь онлайн-торговыми площадками и сайтами-аггрегаторами. Фактически, вся внешняя коммуникация в таких случаях осуществляется автоматически с использованием текстовых ботов [7].

Еще одним сектором, где также активно внедряются технологии автоматизации внешней коммуникации являются банки. В отдельных случаях крупные банки даже осуществляют крупные инвестиции в разработку собственного виртуального голосового ассистента, например, «Елена» в Сбербанке или «Олег» в Тинькофф банке.

Аналогичные системы активно используются компаниями, специализирующими в оказании медицинских услуг, а также в сфере страхования – у таких компаний внедрение систем с использованием текстовых или голосовых ботов позволяет полностью автоматизировать все процессы, связанные с взаимодействием с клиентами. В медицинских учреждениях внедряются системы, позволяющие передать им все виды функций, выполняемых регистратурой (запись, напоминание о записи, ведение графиков приема специалистов и т. п.). Также существуют системы на основе текстовых / голосовых ботов, позволяющих следить за состоянием пациентов, находящихся вне медицинского учреждения, напоминать о необходимости приема лекарств и т. д. [7]. Страховые компании полностью автоматизирую процесс отправки предложений и напоминаний клиентам, производят расчет страховой выплаты и взносов, связываются с перспективными клиентами и т. п.

В целом, можно говорить о том, что на сегодняшний день практически любая коммерческая организация, вне зависимости от рода деятельности и размера, может автоматизировать все или значительную часть непроизводственных бизнес-процессов с использованием технологий на основе ИИ, в том числе речевых и голосовых технологий.

На текущем этапе развития ЦТ, связанных с обеспечением голосового взаимодействия, можно выделить несколько основных разновидностей продуктов, предназначенных для обеспечения автоматизации определенных процессов:

1) Голосовые боты.

2) Интерактивные системы голосового взаимодействия.

3) Голосовые помощники.

Данное разделение носит несколько условный характер, поскольку принцип разработки вышеуказанных типов продуктов весьма схож, различие проявляется только в возможностях соответствующего продукта и сфере их применения.

Под голосовыми ботами понимаются решения, аналогичные по типу чат-ботам (общение при помощи обмена сообщениями в мессенджере или приложении), при этом обладающие функциями восприятии устных сообщений и предоставления ответа также в форме устного сообщения. Такого рода боты разрабатываются чаще всего крупными компаниями в качестве дополнительной функции к уже существующему приложению для смартфона и аналогичных устройств [7]. Спектр функций таких голосовых ботов достаточно широк. Лидерами в области разработки голосовых ботов являются крупнейшие мировые банки (Erica в Bank of America, Олег в Тинькофф банке и др.), а также крупные компании, такие как Amazon, Spotify, Starbucks и т. д.

Интерактивные системы голосового взаимодействия предназначены для организации телефонного взаимодействия с клиентами, по сути, такие системы представляют собой усовершенствованный вариант колл-центра. Такие системы способны работать непрерывно, одновременно принимать до нескольких тысяч телефонных звонков, производить запись разговора, отвечать на вопросы клиента, пользуясь данными из определенной базы данных, в случае необходимости переключать звонок на оператора, производить обзвон клиентов с предложением товара или напоминанием о записи на прием, автоматически заполнять необходимые документы или вносить в базу необходимые данные, анализировать данные, полученные в ходе работы системы по многим параметрам [8]. Такого рода системы широко используются организациями, в силу характера своей деятельности вынужденными контактировать с большим числом клиентов постоянно.

Голосовые помощники представляют, по сути, более сложные решения, фактически объединяющие функции голосовых ботов и интерактивных систем голосового взаимодействия, поскольку способны выполнять самые разнообразные функции, в том числе взаимодействовать с другими приложениями на устройстве или с другими устройствами. Прогнозируется, что голосовые помощники станут одной из отличительных черт развития повседневного цифрового взаимодействия людей в ближайшем будущем и естественным компонентом взаимодействия людей с окружающим миром [7]. Крайне перспективными, с точки зрения аналитиков, представляются разработки умных колонок и капсул, которые не только обеспечивают более высокое качество общения (так, по данным опроса, удовлетворенность качеством распознавания речи и эффективностью диалога намного выше среди владельцев умных колонок, чем у владельцев смартфонов) и обеспечивают более широкий спектр функций, в том числе взаимодействие с другими устройствами, что является основой для домашнего Интернета вещей [2]. Разработчиками голосовых помощников выступают крупнейшие компании, специализирующиеся в области передовых информационных и цифровых технологий, например, «Яндекс», «Сбербанк», «Вконтакте» и т. п.

Несмотря на отдельные данные о низкой эффективности использования голосовых ботов [9], в целом можно говорить об очевидных преимуществах автоматизации бизнес-процессов с использованием речевых и голосовых технологий: эта мера позволяет компаниям как снизить издержки на организацию процесса (сокращение числа сотрудников, связанных с определенным бизнес-процессом, обеспечение непрерывности процесса и т. д.), так и повысить его эффективность (отсутствие ошибок, бесперебойная работа, большое число одновременных контактов и т. д.). К тому же, к функциям голосового бота или интерфейса можно добавить функции оценки эмоционального состояния или степени правдивости, в которых также используются технологии обработки речи. Такие разработки на сегодняшний день предлагают многие компании-поставщики голосовых ботов например, технология «Castel Detect» и ПО QA5 в компании «North Star» для оценки эмоционального состояния или технологии с использованием ПО RA7 показали высокую эффективность как в повышении качества внешней коммуникации, так и снижении расходов и риска [10].

Данные опросов и исследований свидетельствуют, что популярность голосового взаимодействия с цифровыми устройствами пользователей постоянно растет, что не в последнюю очередь связано с переходом «цифрового поколения» в разряд активных потребителей, т. е. речь идет о людях, родившихся в начале 21 века, в жизни которых сложные цифровые устройства и технологии присутствовали с рождения. Цифровое взаимодействие и использование цифровых устройств является неотъемлемой частью жизни таких людей, большая часть экономического, прежде всего потребительского, взаимодействия также происходит на основе использования цифровых устройств и технологий [1]. Такие пользователи считают цифровое взаимодействие естественным способом поиска, выбора, приобретения товаров и услуг, часто коммерческие организации выбираются и оцениваются такими потребителями с точки зрения качества обеспечиваемого организацией цифрового взаимодействия.

Еще одной группой, активно содействующей распространению голосовых технологий и решений с их применением, являются люди среднего возраста (25–49 лет), и в особенности жители крупных городов, семьи с детьми и люди с высоким доходом [2]. Данные исследований говорят о том, что представители разных возрастных групп (в опросе участвовали пользователи сети Интернет от 18 до 64 лет) характеризуются высокой степенью осведомленности о возможностях голосовых технологий: опрос, проведенный в 2018 г. компанией PriceWaterhouseCooper показал, что только 10 % респондентов ответили отрицательно на вопрос о знакомстве с голосовыми технологиями и их возможностями; при этом 72 % из ответивших на вопрос положительно заявили, что пользуются голосовыми помощниками. В целом, представители средней возрастной группы пользуются голосовыми помощниками даже чаще, чем более молодые пользователи (табл. 1).

Таблица 1

Соотношение активных и пассивных пользователей голосовых помощников разных возрастных групп (составлено по [2])

Возрастная группа, лет

Оценили частоту использования голосового помощника* как (в %)

Высокую

Среднюю

Низкую

18–24

59 %

33 %

8 %

25–49

65 %

29 %

6 %

50 и более

57 %

40 %

3 %

Примечание. *учитывались ответы респондентов, положительно ответивших на вопрос о знакомстве с голосовыми помощниками

Среди потребителей, пользовавшихся голосовыми помощниками для заказа товаров, 80 % положительно оценили полученный опыт, при этом 39 % впоследствии поделились рассказом о положительном опыте использования помощника знакомым; 39 % повторно произвели приобретение товара у этой же организации; 24 % увеличили расходы на товары, приобретаемые у этой организации. При этом каждый 4-ый пользователь выразил неготовность производить приобретение и оплату товаров при помощи голосового бота, вызванную опасениями в корректности обработки помощником устного заказа и недоверием к денежным переводам, осуществленным с использованием голоса.

Среди участников опроса 50 % респондентов заявили, что уже совершали приобретение товара или услуги при помощи голосового бота (каждый десятый опрошенный заявил, что совершает приобретение товаров / услуг ежедневно); при этом из ответивших отрицательно 25 % проявили готовность рассмотреть возможность приобретения товара или услуги при помощи голосового бота в будущем. В отношении групп товаров, приобретаемых (а также рассматриваемых как возможные для приобретения в будущем) пользователями с использованием голосовых помощников, данные опроса также показали интересное распределение (табл. 2).

На сегодняшний день аналогичных опросов среди российских пользователей не проводилось, однако ряд данных опросов ВЦИОМ, связанные с исследуемой тематикой, также подтверждают вышеизложенные результаты.

По данным опроса, проведенного ВЦИОМ в 2020 г., 3 % респондентов назвали умную колонку (умные очки) одним из 5 главных удобств 21 века [12]. Данные опроса 2019 г. о том, насколько часто пользователи заказывают товары с доставкой на дом показали, что около 20 % жителей больших городов делают такие заказы не менее раза в месяц, 5 % – несколько раз в неделю и 1 % – приобретают товары ежедневно, причем наиболее высокое число пользователей, регулярно заказывающих товары с доставкой на дом оказалось среди возрастных групп 18–24 и 25–34 лет, в которых более 30 % и 25 % соответственно производят заказ с доставкой на дом не менее нескольких раз в месяц (5 % опрошенных первой группы заявили, что делают это ежедневно).

Таблица 2

Соотношение активных и пассивных пользователей голосовых помощников разных возрастных групп (составлено по [11])

Вид товара/услуги

Ранее приобретали, в %

Планируют приобретение, в %

Готовые блюда на вынос

34 %

35 %

Бакалейные товары

31 %

27 %

Книги

24 %

23 %

Электроника и бытовая техника

22 %

26 %

Заказ такси

21 %

29 %

Билеты на культурные, спортивные и т. п. мероприятия

16 %

32 %

Одежда и обувь

3 %

22 %

Туристические поездки

0 %

26 %

Предприниматели, участвовавшие в опросе ВЦИОМ 2019 г. (в поросе участвовало 800 представителей бизнеса), дали следующие ответы на вопрос про использование технологий ИИ в деятельности организации (табл. 3).

Таблица 3

Использование технологий ИИ в деятельности организации [12]

Использование ИИ в работе компании

В % от числа опрошенных

Да, используются

31 %

Нет, но планируется их использовать

23 %

Нет и не планируется их использовать

43 %

Затрудняюсь ответить

3 %

Оценивая эффективность использования технологий ИИ, более 30 % опрошенных заявили об их безусловной эффективности, 50 % оценили внедрение технологий ИИ как эффективное и только 10 % заявили о неэффективности использования технологий ИИ. Эффективность внедрения ЦТ также подтверждают данные консалтингового агентства Boston Consulting Group, согласно которым организации-лидеры по использованию ЦТ как минимум в 1,8 раза опережают компании с более низкой степенью цифровизации в отношении таких показателей, как рост прибыли и общей стоимости компании [13].

Выводы

Технологии с использованием голосового общения, являясь наиболее простым и естественным способом человеческого общения, несомненно, получат широкое распространение. Крайне важной кажется возможность использования голосовых интерфейсов для людей со слабым и полностью утраченным зрением. Для повышения эффективности работы устройств и решений с использованием голосового общения необходимо

● продолжать разрабатывать новые устройства (такие, как умная колонка), обеспечивающие новые функции и возможности, а также повышающие качество голосового взаимодействия;

● продолжать совершенствовать сами технологии распознавания речи: например, решать проблемы с распознаванием речи иностранцев, носителей диалектов, людей с дефектами речи и т. п.

Уже сегодня, по сравнению с более ранними периодами существования голосовых технологий, они не только достигли уровня, обеспечивающего естественный для пользователя диалог, но и начали применяться организациями самых разных видов, в том числе сравнительно небольшими компаниями. Естественно, что разработка более сложных и совершенных, обеспеченных специальными устройствами решений, таких, как Алиса, Маруся, Салют и т. п., является результатом многолетней работы высококвалифицированных групп специалистов. Однако их растущая популярность и снижение стоимости специализированных устройств могут привести к полной трансформации взаимодействия человека и компьютера.

Одновременно разрабатываются среды и платформы для создания более простых решений, могущих использоваться для разработки голосовых решений даже небольшими компаниями, например, приложения агрегаторов голосовых ботов, таких как UIS, MTT, Mango, Гравител и т. д. [14] Более комплексные готовые решения (платформы), такие как Робовойс, Инфобот, Аймилогик или Воксимплант Кит, разработанные с использованием решений Google, Яндекс, Тинькофф, АСМ позволяют создавать как достаточно простые, так и многофункциональные системы с функциями отправки электронных писем или всплывающих уведомлений, говорящие клонированным (воспроизводимым на основе имеющихся образцов) голосом профессионального актера для создания более естественного звучания и т. п. [15]. Такие решения для организаций, работающих ежедневно с большим числом клиентов, в ближайшее время станут естественными и очевидными, что приведет не только к изменению способов организации внешнего взаимодействия компаний, но и к исчезновению некоторых профессий и изменению рынка труда.