Введение
Цифровые технологии (ЦТ) играют все большую роль в современном обществе, в том числе в сфере взаимодействия коммерческих предприятий и потребителей их товаров и услуг. Данные исследований говорят о радикальном изменении процесса поиска, выбора и приобретения товара или услуги – на сегодняшний день большая часть такого вида действий у наиболее экономически активной части общества осуществляется с использованием цифровых устройств (ЦУ) и ЦТ [1].
Современный потребитель характеризуется высокой степенью осведомленности о возможностях ЦУ, а также программных продуктов и сред, создаваемых компаниями для обеспечения взаимодействия с потребителями товаров или услуг (функциональные интернет-сайты, приложения для смартфонов и т. п.) [2]. Также данные опросов говорят о наличии высокой степени готовности потребителей использовать такие технологии и продукты для взаимодействия с организациями-поставщиками интересующих их товаров и услуг. Возможность получить опыт цифрового взаимодействия все чаще выступает как один из существенных критериев оценки эффективности организации в осуществлении внешнего взаимодействия [1].
Одним из сравнительно недавно (по отношению к другим видам ЦТ) появившихся направлений развития ЦТ можно назвать технологии на основе искусственного интеллекта (ИИ) с использованием речевого (голосового) взаимодействия, так называемых голосовых ботов, помощников или ассистентов. Первый голосовой помощник Siri был приобретен компанией Apple в 2011 г., в 2014 г. компания Microsoft разработала помощника Alexa, в 2016 г. появился Google Assistant [3]. Простота и эффективность голосового взаимодействия привели к быстрому развитию таких продуктов и резкому росту числа голосовых ботов: по оценкам, в 2019 г. их число превысило 3 миллиарда, и, по существующим прогнозам, к 2023 г. достигнет 8 миллиардов ботов (рисунок).
Основной причиной быстрого развития технологии голосовых помощников является характер обеспечиваемого ими взаимодействия: устное общение является наиболее простым и естественным способом взаимодействия человека с внешним миром, по сравнению с физическими действиями (например, поход в отделение банка или магазин, работа с графическим интерфейсом) и письмом (набором текста). Существующий уровень развития речевых технологий позволяет добиться достаточно высокой эффективности как в распознавании устройствами голосового запроса пользователя, так и в формировании голосового ответа на запрос – сегодня взаимодействие с голосовыми помощниками выглядит как естественный и эффективный диалог [5]. Важным фактором, содействующим распространению технологии голосовых ассистентов, является появление новых устройств, обеспечивающих такую функцию – умных колонок, капсул и т. п. продуктов.
Цель исследования
В качестве основной цели исследования выступает анализ текущего этапа развития и функционирования технологий голосового взаимодействия и оценка перспектив их применения для обеспечения бизнес-процессов коммерческих организаций, прежде всего внешней и внутренней коммуникации, на основе прогнозируемых тенденций и показателей.
Материал и методы исследования
Исследование носит эмпирический характер, поскольку связано с областью использования ЦТ, появившейся сравнительно недавно и переживающей период быстрого роста и развития, чем объясняется крайне небольшое количество доступных для анализа материалов. При проведении анализа были использованы преимущественно статистические данные исследований и опросов, проведенные такими специализирующимися в сборе статистических данных организациями, как ВЦИОМ и Statista, консалтинговыми агентствами PriceWaterhouseCoopers, Boston Consulting Group и IPSOS, сайты российских и западных разработчиков решений на основе голосового взаимодействия. Все использованные в ходе исследования данные были опубликованы в открытых источниках.
Число голосовых ботов в мире, в миллиардах единиц (составлено по [4])
Результаты исследования и их обсуждение
Развитие цифровых технологий, в особенности технологий на основе ИИ, привело к появлению новых решений для организации как производственных, так и непроизводственных бизнес-процессов. Существующие системы позволяют полностью автоматизировать процессы, связанные с внутренней и внешней коммуникацией, ведением отчетности, выставлением счетов и т. д. [5]. Так, многие платформенные решения, как и решения на основе более сложных программных цифровых продуктов, позволяют полностью автоматизировать процесс внешней коммуникации: почтовый бот ведет переписку, отвечая на вопросы клиентов, формирует заказы и автоматически выставляет счета, также отправляет напоминание о необходимости оплаты выставленных счетов и т. д. Крупные организации используют чат-боты для организации внутренней коммуникации – автоматической отправки сообщений и напоминаний о собраниях, совещаниях и запланированных встречах, отчетах, информирование о событиях и т. п. [6]. Очевидно, разработка и внедрение подобных решений являются обязательным условием для полного перехода к промышленному «Интернету вещей» и Промышленности 4.0.
Фактически, на сегодняшний день можно говорить о практически полной автоматизации любого вида коммуникации – как внутри организаций, так и взаимодействия с внешней средой. Такого рода решения могут разрабатываться индивидуально, с использованием сложных комплексных технологий, например, комплексные решения с использованием программных продуктов NVidia AI Entersprise, позволяющие полностью автоматизировать производственные процессы, а также непроизводственные бизнес процессы – ведение отчетности, коммуникацию, логистику и т. д. [5].
Многие существующие платформы для предприятий малого и среднего бизнеса предлагают аналогичные, но более простые решения для организации непроизводственных бизнес-процессов и все чаще используются компаниями в организации своей деятельности [6].
Все чаще предприятия в разных секторах экономики и разного размера применяют технологии на основе ИИ с использованием систем обработки и создания текстовых сообщений, а также более совершенные системы обработки и вывода с использованием голосовых технологий. Естественно, в первую очередь такие технологии применяются компаниями с большим объемом внешней коммуникации. Так, например, текстовые (и сейчас все больше) голосовые боты все более широко применяются для организации внешней коммуникации крупными розничными магазинами и сетями, в первую очередь онлайн-торговыми площадками и сайтами-аггрегаторами. Фактически, вся внешняя коммуникация в таких случаях осуществляется автоматически с использованием текстовых ботов [7].
Еще одним сектором, где также активно внедряются технологии автоматизации внешней коммуникации являются банки. В отдельных случаях крупные банки даже осуществляют крупные инвестиции в разработку собственного виртуального голосового ассистента, например, «Елена» в Сбербанке или «Олег» в Тинькофф банке.
Аналогичные системы активно используются компаниями, специализирующими в оказании медицинских услуг, а также в сфере страхования – у таких компаний внедрение систем с использованием текстовых или голосовых ботов позволяет полностью автоматизировать все процессы, связанные с взаимодействием с клиентами. В медицинских учреждениях внедряются системы, позволяющие передать им все виды функций, выполняемых регистратурой (запись, напоминание о записи, ведение графиков приема специалистов и т. п.). Также существуют системы на основе текстовых / голосовых ботов, позволяющих следить за состоянием пациентов, находящихся вне медицинского учреждения, напоминать о необходимости приема лекарств и т. д. [7]. Страховые компании полностью автоматизирую процесс отправки предложений и напоминаний клиентам, производят расчет страховой выплаты и взносов, связываются с перспективными клиентами и т. п.
В целом, можно говорить о том, что на сегодняшний день практически любая коммерческая организация, вне зависимости от рода деятельности и размера, может автоматизировать все или значительную часть непроизводственных бизнес-процессов с использованием технологий на основе ИИ, в том числе речевых и голосовых технологий.
На текущем этапе развития ЦТ, связанных с обеспечением голосового взаимодействия, можно выделить несколько основных разновидностей продуктов, предназначенных для обеспечения автоматизации определенных процессов:
1) Голосовые боты.
2) Интерактивные системы голосового взаимодействия.
3) Голосовые помощники.
Данное разделение носит несколько условный характер, поскольку принцип разработки вышеуказанных типов продуктов весьма схож, различие проявляется только в возможностях соответствующего продукта и сфере их применения.
Под голосовыми ботами понимаются решения, аналогичные по типу чат-ботам (общение при помощи обмена сообщениями в мессенджере или приложении), при этом обладающие функциями восприятии устных сообщений и предоставления ответа также в форме устного сообщения. Такого рода боты разрабатываются чаще всего крупными компаниями в качестве дополнительной функции к уже существующему приложению для смартфона и аналогичных устройств [7]. Спектр функций таких голосовых ботов достаточно широк. Лидерами в области разработки голосовых ботов являются крупнейшие мировые банки (Erica в Bank of America, Олег в Тинькофф банке и др.), а также крупные компании, такие как Amazon, Spotify, Starbucks и т. д.
Интерактивные системы голосового взаимодействия предназначены для организации телефонного взаимодействия с клиентами, по сути, такие системы представляют собой усовершенствованный вариант колл-центра. Такие системы способны работать непрерывно, одновременно принимать до нескольких тысяч телефонных звонков, производить запись разговора, отвечать на вопросы клиента, пользуясь данными из определенной базы данных, в случае необходимости переключать звонок на оператора, производить обзвон клиентов с предложением товара или напоминанием о записи на прием, автоматически заполнять необходимые документы или вносить в базу необходимые данные, анализировать данные, полученные в ходе работы системы по многим параметрам [8]. Такого рода системы широко используются организациями, в силу характера своей деятельности вынужденными контактировать с большим числом клиентов постоянно.
Голосовые помощники представляют, по сути, более сложные решения, фактически объединяющие функции голосовых ботов и интерактивных систем голосового взаимодействия, поскольку способны выполнять самые разнообразные функции, в том числе взаимодействовать с другими приложениями на устройстве или с другими устройствами. Прогнозируется, что голосовые помощники станут одной из отличительных черт развития повседневного цифрового взаимодействия людей в ближайшем будущем и естественным компонентом взаимодействия людей с окружающим миром [7]. Крайне перспективными, с точки зрения аналитиков, представляются разработки умных колонок и капсул, которые не только обеспечивают более высокое качество общения (так, по данным опроса, удовлетворенность качеством распознавания речи и эффективностью диалога намного выше среди владельцев умных колонок, чем у владельцев смартфонов) и обеспечивают более широкий спектр функций, в том числе взаимодействие с другими устройствами, что является основой для домашнего Интернета вещей [2]. Разработчиками голосовых помощников выступают крупнейшие компании, специализирующиеся в области передовых информационных и цифровых технологий, например, «Яндекс», «Сбербанк», «Вконтакте» и т. п.
Несмотря на отдельные данные о низкой эффективности использования голосовых ботов [9], в целом можно говорить об очевидных преимуществах автоматизации бизнес-процессов с использованием речевых и голосовых технологий: эта мера позволяет компаниям как снизить издержки на организацию процесса (сокращение числа сотрудников, связанных с определенным бизнес-процессом, обеспечение непрерывности процесса и т. д.), так и повысить его эффективность (отсутствие ошибок, бесперебойная работа, большое число одновременных контактов и т. д.). К тому же, к функциям голосового бота или интерфейса можно добавить функции оценки эмоционального состояния или степени правдивости, в которых также используются технологии обработки речи. Такие разработки на сегодняшний день предлагают многие компании-поставщики голосовых ботов например, технология «Castel Detect» и ПО QA5 в компании «North Star» для оценки эмоционального состояния или технологии с использованием ПО RA7 показали высокую эффективность как в повышении качества внешней коммуникации, так и снижении расходов и риска [10].
Данные опросов и исследований свидетельствуют, что популярность голосового взаимодействия с цифровыми устройствами пользователей постоянно растет, что не в последнюю очередь связано с переходом «цифрового поколения» в разряд активных потребителей, т. е. речь идет о людях, родившихся в начале 21 века, в жизни которых сложные цифровые устройства и технологии присутствовали с рождения. Цифровое взаимодействие и использование цифровых устройств является неотъемлемой частью жизни таких людей, большая часть экономического, прежде всего потребительского, взаимодействия также происходит на основе использования цифровых устройств и технологий [1]. Такие пользователи считают цифровое взаимодействие естественным способом поиска, выбора, приобретения товаров и услуг, часто коммерческие организации выбираются и оцениваются такими потребителями с точки зрения качества обеспечиваемого организацией цифрового взаимодействия.
Еще одной группой, активно содействующей распространению голосовых технологий и решений с их применением, являются люди среднего возраста (25–49 лет), и в особенности жители крупных городов, семьи с детьми и люди с высоким доходом [2]. Данные исследований говорят о том, что представители разных возрастных групп (в опросе участвовали пользователи сети Интернет от 18 до 64 лет) характеризуются высокой степенью осведомленности о возможностях голосовых технологий: опрос, проведенный в 2018 г. компанией PriceWaterhouseCooper показал, что только 10 % респондентов ответили отрицательно на вопрос о знакомстве с голосовыми технологиями и их возможностями; при этом 72 % из ответивших на вопрос положительно заявили, что пользуются голосовыми помощниками. В целом, представители средней возрастной группы пользуются голосовыми помощниками даже чаще, чем более молодые пользователи (табл. 1).
Таблица 1
Соотношение активных и пассивных пользователей голосовых помощников разных возрастных групп (составлено по [2])
Возрастная группа, лет |
Оценили частоту использования голосового помощника* как (в %) |
||
Высокую |
Среднюю |
Низкую |
|
18–24 |
59 % |
33 % |
8 % |
25–49 |
65 % |
29 % |
6 % |
50 и более |
57 % |
40 % |
3 % |
Примечание. *учитывались ответы респондентов, положительно ответивших на вопрос о знакомстве с голосовыми помощниками
Среди потребителей, пользовавшихся голосовыми помощниками для заказа товаров, 80 % положительно оценили полученный опыт, при этом 39 % впоследствии поделились рассказом о положительном опыте использования помощника знакомым; 39 % повторно произвели приобретение товара у этой же организации; 24 % увеличили расходы на товары, приобретаемые у этой организации. При этом каждый 4-ый пользователь выразил неготовность производить приобретение и оплату товаров при помощи голосового бота, вызванную опасениями в корректности обработки помощником устного заказа и недоверием к денежным переводам, осуществленным с использованием голоса.
Среди участников опроса 50 % респондентов заявили, что уже совершали приобретение товара или услуги при помощи голосового бота (каждый десятый опрошенный заявил, что совершает приобретение товаров / услуг ежедневно); при этом из ответивших отрицательно 25 % проявили готовность рассмотреть возможность приобретения товара или услуги при помощи голосового бота в будущем. В отношении групп товаров, приобретаемых (а также рассматриваемых как возможные для приобретения в будущем) пользователями с использованием голосовых помощников, данные опроса также показали интересное распределение (табл. 2).
На сегодняшний день аналогичных опросов среди российских пользователей не проводилось, однако ряд данных опросов ВЦИОМ, связанные с исследуемой тематикой, также подтверждают вышеизложенные результаты.
По данным опроса, проведенного ВЦИОМ в 2020 г., 3 % респондентов назвали умную колонку (умные очки) одним из 5 главных удобств 21 века [12]. Данные опроса 2019 г. о том, насколько часто пользователи заказывают товары с доставкой на дом показали, что около 20 % жителей больших городов делают такие заказы не менее раза в месяц, 5 % – несколько раз в неделю и 1 % – приобретают товары ежедневно, причем наиболее высокое число пользователей, регулярно заказывающих товары с доставкой на дом оказалось среди возрастных групп 18–24 и 25–34 лет, в которых более 30 % и 25 % соответственно производят заказ с доставкой на дом не менее нескольких раз в месяц (5 % опрошенных первой группы заявили, что делают это ежедневно).
Таблица 2
Соотношение активных и пассивных пользователей голосовых помощников разных возрастных групп (составлено по [11])
Вид товара/услуги |
Ранее приобретали, в % |
Планируют приобретение, в % |
Готовые блюда на вынос |
34 % |
35 % |
Бакалейные товары |
31 % |
27 % |
Книги |
24 % |
23 % |
Электроника и бытовая техника |
22 % |
26 % |
Заказ такси |
21 % |
29 % |
Билеты на культурные, спортивные и т. п. мероприятия |
16 % |
32 % |
Одежда и обувь |
3 % |
22 % |
Туристические поездки |
0 % |
26 % |
Предприниматели, участвовавшие в опросе ВЦИОМ 2019 г. (в поросе участвовало 800 представителей бизнеса), дали следующие ответы на вопрос про использование технологий ИИ в деятельности организации (табл. 3).
Таблица 3
Использование технологий ИИ в деятельности организации [12]
Использование ИИ в работе компании |
В % от числа опрошенных |
Да, используются |
31 % |
Нет, но планируется их использовать |
23 % |
Нет и не планируется их использовать |
43 % |
Затрудняюсь ответить |
3 % |
Оценивая эффективность использования технологий ИИ, более 30 % опрошенных заявили об их безусловной эффективности, 50 % оценили внедрение технологий ИИ как эффективное и только 10 % заявили о неэффективности использования технологий ИИ. Эффективность внедрения ЦТ также подтверждают данные консалтингового агентства Boston Consulting Group, согласно которым организации-лидеры по использованию ЦТ как минимум в 1,8 раза опережают компании с более низкой степенью цифровизации в отношении таких показателей, как рост прибыли и общей стоимости компании [13].
Выводы
Технологии с использованием голосового общения, являясь наиболее простым и естественным способом человеческого общения, несомненно, получат широкое распространение. Крайне важной кажется возможность использования голосовых интерфейсов для людей со слабым и полностью утраченным зрением. Для повышения эффективности работы устройств и решений с использованием голосового общения необходимо
● продолжать разрабатывать новые устройства (такие, как умная колонка), обеспечивающие новые функции и возможности, а также повышающие качество голосового взаимодействия;
● продолжать совершенствовать сами технологии распознавания речи: например, решать проблемы с распознаванием речи иностранцев, носителей диалектов, людей с дефектами речи и т. п.
Уже сегодня, по сравнению с более ранними периодами существования голосовых технологий, они не только достигли уровня, обеспечивающего естественный для пользователя диалог, но и начали применяться организациями самых разных видов, в том числе сравнительно небольшими компаниями. Естественно, что разработка более сложных и совершенных, обеспеченных специальными устройствами решений, таких, как Алиса, Маруся, Салют и т. п., является результатом многолетней работы высококвалифицированных групп специалистов. Однако их растущая популярность и снижение стоимости специализированных устройств могут привести к полной трансформации взаимодействия человека и компьютера.
Одновременно разрабатываются среды и платформы для создания более простых решений, могущих использоваться для разработки голосовых решений даже небольшими компаниями, например, приложения агрегаторов голосовых ботов, таких как UIS, MTT, Mango, Гравител и т. д. [14] Более комплексные готовые решения (платформы), такие как Робовойс, Инфобот, Аймилогик или Воксимплант Кит, разработанные с использованием решений Google, Яндекс, Тинькофф, АСМ позволяют создавать как достаточно простые, так и многофункциональные системы с функциями отправки электронных писем или всплывающих уведомлений, говорящие клонированным (воспроизводимым на основе имеющихся образцов) голосом профессионального актера для создания более естественного звучания и т. п. [15]. Такие решения для организаций, работающих ежедневно с большим числом клиентов, в ближайшее время станут естественными и очевидными, что приведет не только к изменению способов организации внешнего взаимодействия компаний, но и к исчезновению некоторых профессий и изменению рынка труда.