Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

FACTORS INFLUENCING COMPANIES’ IMPLEMENTATION OF BIG DATA ANALYTICS

Chizhov S.A. 1 Suyts V.P. 1
1 Lomonosov Moscow State University
Given the doubling of the total amount of data that occurs every two years, and also the low cost of processing and storing data, for companies becomes important to implement big data analytics as a tool that provides a competitive advantage. The question arises: why, given the availability of free software, some companies have not been able to implement these technologies? In order to answer this question, we expanded the unified theory of acceptance and use of technology, adapted to the conditions of big data analytics, by adding two variables to it: reluctance to use and calculated risk. Using the degree of implementation of these technologies, we divided the companies into those that use and those that do not use big data analytics (BDA). The structural models were evaluated using the partial least squares (PLS) method. The results show that the importance of a good infrastructure outweighs the difficulties that companies face in implementing it. And while companies that plan to use big data expect good results, current users rate their performance more frugal.
big data
intent behavior
unified theory of technology adoption and use
reluctance to use
calculated risk

Введение

В настоящее время наблюдается экспоненциальный рост данных о нашей деятельности, производимых обществом. Эти данные распространяются, например, на мобильные телефоны, на все транзакции, осуществляемые с помощью интернета, на интернет вещей, социальные сети, умную одежду и т.д. Фирмы, способные переводить эти данные о клиентах в информацию, поступающую в режиме реального времени, приобретают существенное конкурентное преимущество. Данные пользователей позволяют фирмам знать, когда именно клиенты пользуются их продукцией, а также лучшее время для проведения рекламных акций и то, как можно улучшить отношение к бренду. Фирмы, использующие аналитику больших данных (BDA) [20], смогут практически в режиме реального времени обрабатывать огромные массивы данных и стать лидерами рынка.

Процесс получения ценной информации в стремительно меняющейся среде данных был детально описан Agrawal, Bernstein, & Bertino [1]: применение компаниями BDA включает в себя два основных процесса: управление данными и аналитику данных. BDA – это процесс извлечения из данных ценности за счет нахождения скрытых закономерностей, способствующих принятию решений на основе данных.

BDA улучшает процесс принятия решений за счет применения методов и программного обеспечения, доступных бесплатно и обладающих открытым кодом. Из этого вытекает два вопроса. Первый: что влияет на их внедрение? Второй: почему во множестве компаний BDA до сих пор так и не применяется? Большая часть литературы по аналитики больших данных посвящена техническим аспектам, связанным с этой экосистемой: разработка прикладного программного обеспечения, интеллектуальный анализ данных, аналитическая обработка данных, прогнозирование, предписания, статистическое моделирование. Вопрос внедрения BDA внутри компаний исследован мало [7], [10], [16], [28].

В данном исследовании, основанном на модели единой теории принятия и использования технологии (UTAUT) [27], рассматривается воздействие, оказываемое двумя новыми переменными – нежеланием пользоваться и осознанным риском – на внедрение BDA. Во втором разделе статьи описаны теоретические основы предложенной модели. Третий раздел описывает использованную нами методологию. В четвертом разделе анализируются результаты, полученные в результате применения модели к выборке компаний. И наконец, мы делаем основные теоретические и практические выводы, а также указываем на недостатки нашего исследования.

Цель исследования – объяснить, каким образом компании внедряют и применяют эту новую технологию, и понять проблемы, возникающие при реализации для того, чтобы дать рекомендации практикующим специалистам. Вот почему мы проводим различие между компаниями, применяющими и не применяющими эту технологию, и ищем различные факторы, влияющие на ее принятие и применение.

Материал и методы исследования

В наш опрос, проведенный в период с сентября по октябрь 2017 г посредством электронной почты и телефона, вошли 199 ответов генеральных директоров и руководителей различных направлений, таких как отделов кадров, финансов, маркетинга, сбыта. Была выполнена предварительная проверка опроса с участием 5 руководителей, вызвавшихся на добровольной основе, и нескольких экспертных исследователей. Они заполнили анкету и оставили отзывы на вопросы. В таблице 1 мы приводим компании респондентов согласно их доходам и секторам.

Таблица 1

Компании из выборки согласно их доходам и сектору деятельности

 

< 2 млн ₽

2млн ₽ < Х Х < 10 млн ₽

10 млн ₽ < Х Х < 43 млн ₽

>43 млн ₽

Нет ответа

Всего

Сельское хозяйство

1

3

2

1

 

7

Торговля и дистрибуция

5

4

1

10

 

20

Телекоммуникация

6

2

4

14

1

27

Строительство

2

 

1

4

 

7

Образование

2

1

 

2

 

5

Энергетика

1

   

3

 

4

Финансы

1

 

2

8

 

11

Промышленность

5

3

2

6

 

16

Другое

10

10

6

13

2

41

Здравоохранение

3

   

2

 

5

Услуги

24

12

9

10

 

55

Нет ответа

       

1

1

Всего

60

35

27

73

4

199

Для концепций UTAUT мы адаптировали к BDA шкалы, взятые из работы [27]. Нежелание пользоваться измерялось с помощью шкалы, предложенной Bhattacherjee и Hikmet [12], а осознанный риск – с помощью шкалы, взятой у Featherman и Pavlou [12]. Во всех случаях использовались шкалы Лайкерта, состоящие из семи пунктов.

Для оценки структурной модели мы применяли метод частичных наименьших квадратов (PLS) [14], используя статистическую компьютерную программу Smart PLS 3.2.3 [25]. Чтобы избежать систематической погрешности измерения или систематической погрешности метода (CMB) в исследуемой выборке, мы следовали рекомендациям Буртон-Джоунс [8]. Также мы придерживались мнения Podsakoff, MacKenzie, Lee, & Podsakoff [23], MacKenzie, Podsakoff, & Podsakoff [21]; Podsakoff, MacKenzie, & Podsakoff [24] и Kock & Lynn [19]. Поскольку исследование сосредоточено на CMB и PLS для моделей структурных уравнений, мы придерживались Кока [18] и добавили не относящиеся к теме вопросы, чтобы создать новую скрытую переменную с этими индикаторами и другими переменными в качестве антецедентов. Эта переменная CMB выступает в качестве зависимой переменной для всех остальных в модели. Оцениваемые с помощью этого метода факторы, увеличивающие дисперсию, должны быть ниже 3.3 для подтверждения отсутствия CMB в выборке.

Результаты исследования и их обсуждение

Самой комплексной моделью принятия технологии является модель UTAUT [27]. Эта модель объединяет прошлые модели и теории для того, чтобы проанализировать внедрение и принятие технологии. Предложенная нами модель включает четыре независимых переменных, взятых из модели UTAUT: 1) ожидаемая эффективность, которая измеряет уровень ожидаемой пользы от применения компанией технологии; 2) ожидаемые трудозатраты, которые измеряют предполагаемую легкость применения технологии; 3) влияние общества, которое измеряет, как люди относятся к тому, что друзья и члены семьи считают, что им следует пользоваться технологией; 4) благоприятствующие условия – насколько, по мнению потребителей, будут доступны ресурсы и поддержка для формирования поведения. Модель позволяет включать различные переменные-модераторы, которые влияют на ключевые элементы модели.

К элементам модели UTAUT мы добавили нежелание пользоваться и осознанный риск. Нежелание пользоваться состоит в отрицательной реакции на изменение или внедрение новой системы [17]. Осознанный риск представляет собой потенциальные убытки в результате внедрения новой технологии или информационной системы [12].

Мы предлагаем несколько гипотез, основанных на расширенной модели UTAUT для принятия и использования аналитики больших данных в компаниях: 1) ожидаемая эффективность положительно влияет на поведенческое намерение использовать BDA; 2) ожидаемые трудозатраты, или легкость пользования, положительно влияют на поведенческое намерение использовать BDA; 3) влияние общества оказывает положительное влияние на поведенческое намерение использовать BDA; 4) нежелание пользоваться оказывает негативное влияние на поведенческое намерение использовать BDA; 5) предполагаемый риск оказывает негативное воздействие на поведенческое намерение использовать BDA; 6) благоприятствующие условия оказывают положительное влияние на поведенческое намерение использовать BDA; 7) благоприятствующие условия оказывают положительное влияние на применение BDA; 8) побуждение использовать BDA оказывает положительное влияние на ее применение.

Мы проанализировали надежность элементов с помощью составных показателей надежности и Альфы Кронбаха. Во всех случаях значения наших индикаторов превышали 0,7 – как и было предположено Nunnally (1978). Мы обеспечили конвергентную валидность, проанализировав среднюю извлеченную дисперсию. Все значения превышали пороговое 0.5, предложенное Straub, Detmar, Boudreau и Gefen [26]. Эти индикаторы, приведенные в таблице 2, соответствуют требованиям.

Затем мы оценили дискриминантную валидность модели измерения двумя способами. Сначала мы провели тест Форнелла–Ларкера [3]. Результаты приведены в таблице 3.

Значения R2 для концепций второго порядка (поведенческое намерение и пользовательское поведение) приведены в таблице 4

Таблица 2

Составная надежность и конвергентная валидность

 

Альфа Кронбаха

ро_A

Составная надежность

Средняя извлеченная переменная (AVE)

Поведенческое намерение

0,985

0,986

0,989

0,958

Ожидаемые трудозатраты

0,906

0,934

0,928

0,722

Благоприятствующие условия

0,841

0,843

0,904

0,759

Осознанный риск

0,896

0,909

0,935

0,828

Ожидаемая эффективность

0,940

0,947

0,951

0,736

Нежелание пользоваться

0,951

0,954

0,965

0,872

Влияние общества

0,851

0,874

0,893

0,627

Пользовательское поведение

1,000

1,000

1,000

1,000

Таблица 3

Дискриминантная валидность (тест Форнелла–Ларкера)

 

Поведенческое намерение

Ожидаемые трудозатраты

Благоприятствующие условия

Осознанный риск

Ожидаемая эффективность

Нежелание пользоваться

Влияние общества

Пользовательское поведение

Поведенческое

намерение

0,979

             

Ожидаемые

трудозатраты

0,384

0,850

           

Благоприятствующие условия

0,628

0,587

0,871

         

Осознанный риск

-0,331

-0,185

-0,283

0,910

       

Ожидаемая

эффективность

0,544

0,434

0,373

-0,195

0,858

     

Нежелание

пользоваться

-0,506

-0,258

-0,343

0,408

-0,566

0,934

   

Влияние общества

0,497

0,459

0,483

-0,246

0,479

-0,234

0,792

 

Пользовательское поведение

0,630

0,361

0,624

-0,276

0,402

-0,400

0,449

1,000

Таблица 4

R2 модели

 

R в квадрате

Скорректированное R в квадрате

Поведенческое намерение

0,560

0,546

Пользовательское поведение

0,483

0,478

Для оценки структурной модели мы проанализировали значения коэффициентов направлений и объяснили дисперсию эндогенных переменных (R2). Коэффициенты направлений показывают интенсивность отношений между независимыми и зависимыми переменными. Мы применили метод бутстреп с 5000 образцов, чтобы определить надежность коэффициентов направлений, как показано в таблице 5.

Таблица 5

Оценки структурной модели (коэффициенты направлений)

Вся выборка

Первоначальная выборка (П)

Значения P

Поведенческое намерение -> Пользовательское поведение

0.393 ***

0.000

Ожидаемая эффективность -> Поведенческое намерение

-0.114 *

0.032

Благоприятствующие условия -> Поведенческое намерение

0.449 ***

0.000

Благоприятствующие условия -> Пользовательское поведение

0.377 ***

0.000

Осознанный риск -> Поведенческое намерение

-0.063 (n .s.)

0.112

Ожидаемая эффективность -> Поведенческое намерение

0.230 ***

0.001

Нежелание пользоваться -> Поведенческое намерение

-0.187 **

0.006

Влияние общества -> Поведенческое намерение

0.163 **

0.003

***p<0.001; **p<0.01; *p<0.05. (выполнение бутстрепа с 5,000 подвыборок и односторонним тестом).

Значительная связь с коэффициентами направлений и значением p выделены полужирным шрифтом.

Мы рассчитали показатель SRMR (стандартизированный среднеквадратичный остаток) для того, чтобы оценить соответствие модели. Полученное значение – 0,065 – оказалось меньше порогового, предложенного Henseler и соавторами [15], что говорит о хорошем соответствии модели. Модель объясняет 47.85% дисперсии в использовании и 54.6% – в поведенческом намерении (см. таблицу 4); оба значения превышают минимальный уровень 10%, рекомендованный Falk и Miller [11].

Результаты подтверждают большинство гипотез, за исключением Г5 (осознанный риск) и Г2 (ожидаемые трудозатраты). Коэффициенты подтверждаемых гипотез являются статистически значимыми на уровне 1%. Хотя ожидаемая эффективность является статистически значимой на уровне 5%, мы обнаружили обратную зависимость, возникшую из-за подавляющего воздействия [11], вызванного новой зависимостью между благоприятствующими условиями и поведенческим намерением, вследствие чего Г2 может быть отвергнута. Что касается влияния, то мы убеждаемся, что благоприятствующие условия больше всего воздействуют на поведенческое намерение; второе место по влиянию, которое оказывают благоприятствующие условия, приходится на применение. Ожидаемая эффективность вносит второй по значимости вклад в поведенческое намерение, а на первом месте по влиянию на применение находится поведенческое намерение. Отметим также, что коэффициент влияния поведенческого намерения на применение является значимым на уровне 0,1%. Коэффициент воздействия нежелания пользоваться на поведенческое намерение является значимым и отрицательным.

Мы также рассчитали Q2 Stone-Geisser для оценки прогностического потенциала модели [13]. Результаты приведены в таблице 6.

Таблица 6

Прогнозирование скрытых переменных

 

RMSE

Q2

Поведенческое намерение

0,558

0,502

Пользовательское поведение

0,522

0,397

Мы пришли к выводу, что модель имеет прогностическую значимость, поскольку значения Q2 в таблице 9 больше нуля.

Мы рассмотрели возможность наличия неоднородности в выборке. Следуя Becker, Rai, Ringle и Völckner [4], мы провели сегментацию скрытых классов PLS-POS, а также сегментацию скрытых классов FIMIX. Мы не обнаружили никаких различий в группах с апостериорной сегментацией.

Затем мы опробовали несколько априорных сегментаций с другими критериями: например, размер компании, применение больших данных, сфера деятельности, – не обнаружив в результате никаких различий между этими подвыборками. Однако мы нашли разницу в поведении в компаниях, когда спросили об уровне зрелости в освоении BDA. Мы использовали широко применяющуюся шкалу, предложенную Paulk, Curtis, Chrissis и Weber [22], в которой имеется пять уровней: начальный, повторный, определяемый, управляемый и оптимизирующий. Мы отнесли компании, которые еще не освоили BDA или находятся на первых двух уровнях, к первому сегменту, а те, что находятся на трех последних уровнях, – ко второму сегменту. Как показано в таблице 7 для первого сегмента и в таблице 8 – для второго, между этими двумя сегментами и целой выборкой существуют значительные различия (см. табл. 5).

Таблица 7

Первый сегмент. Оценочные показатели структурных моделей (коэффициенты направлений)

Те, кто не пользуются, и новички

Первый сегмент. Размер: 152 компании

Первоначальная выборка (O)

Значения P

Поведенческое намерение -> Пользовательское поведение

0.387 ***

0.000

Ожидаемая эффективность -> Поведенческое намерение

-0.092 (n. s.)

0.094

Благоприятствующие условия -> Поведенческое намерение

0.344 ***

0.000

Благоприятствующие условия -> Пользовательское поведение

0.237 **

0.002

Осознанный риск -> Поведенческое намерение

-0.073 (n. s.)

0.106

Ожидаемая эффективность -> Поведенческое намерение

0.330 ***

0.000

Нежелание пользоваться -> Поведенческое намерение

-0.227 **

0.002

Влияние общества -> Поведенческое намерение

0.189 **

0.002

***p<0.001; **p<0.01; *p<0.05. (выполнение бутстрепа с 5,000 подвыборок и односторонним тестом).

Значительная связь с коэффициентами направлений и значением p выделены полужирным шрифтом.

Таблица 8

Второй сегмент. Оценочные показатели структурных моделей (коэффициенты направлений)

Пользователи и активные пользователи

Второй сегмент. Размер: 47 компаний

Первоначальная выборка (O)

Значения P

Поведенческое намерение -> Пользовательское поведение

0.561 ***

0.001

Ожидаемая эффективность -> Поведенческое намерение

-0.186 (n. s.)

0.084

Благоприятствующие условия -> Поведенческое намерение

0.648 ***

0.001

Благоприятствующие условия -> Пользовательское поведение

0.128 (n. s.) **

0.188

Осознанный риск -> Поведенческое намерение

-0.188 (n. s.)

0.106

Ожидаемая эффективность -> Поведенческое намерение

-0.214 (n. s.) ***

0.174

Нежелание пользоваться -> Поведенческое намерение

-0.207 (n. s.)

0.172

Влияние общества -> Поведенческое намерение

0.056 (n. s.)

0.354

***p<0.001; **p<0.01; *p<0.05. (выполнение бутстрэпа с 5,000 подвыборок и односторонним тестом).

Значительная связь с коэффициентами направлений и значением p выделены полужирным шрифтом.

Мы выполнили тест ANOVA и подтвердили наличие существенных различий между подвыборками. В компаниях, где не пользовались или только начинали пользоваться (первый сегмент), все отношения были значимыми, за исключением воздействия осознанного риска и прогнозируемых трудозатрат на поведенческое намерение. Благоприятствующие условия и ожидаемая эффективность оказывали самое сильное влияние на поведенческое намерение и обладали высокими уровнями значимости. Коэффициенты нежелания пользоваться и воздействия общества были также большими и значимыми. Среди пользователей и активных пользователей (второй сегмент) значимых отношений не наблюдалось, за исключением воздействия благоприятствующих условий на поведенческое намерение. Оно оказалось самым сильным воздействием среди всех отношений в данном исследовании. Любопытно, что ожидаемая эффективность оказалась не значимой.

Выводы

Наше исследование расширяет модель UTAUT для больших данных за счет введения новой переменной – нежелания пользоваться. Расширяя, мы способствуем обобщению модели и росту понимания того, каким образом происходит принятие технологий. Наша модель дополняет предыдущие исследования BDA за счет включения новой независимой переменной, нежелания пользоваться, в модель UTAUT и включения пользовательского поведения BDA в качестве результирующей переменной.

Наши результаты показывают, что поведенческое намерение использовать BDA в компаниях определяется четырьмя факторами. Первый, ожидаемая эффективность – осознание того, что овладение данной технологией поможет достичь хороших результатов, увеличивает внедрение. Второй, влияние общества, оказывает положительное воздействие на намерение использовать BDA, как было показано в предыдущих статьях [6]. Третий, благоприятствующие условия, предоставляемые компанией, поддержка и необходимые для пользования ресурсы, улучшают и поведенческое намерение, и использование [2]. И наконец, нежелание пользоваться снижает поведенческое намерение использовать BDA в компаниях, причем это воздействие сильнее, чем влияние общества.

Мы также обнаружили, что, хотя аналитика больших данных и кажется трудным для применения (ожидаемые трудозатраты), влияние, которое это впечатление оказывает на поведенческое намерение, незначительно и содержится в другом отношении: воздействие благоприятствующих условий на поведенческое намерение (упомянутый выше эффект подавления).

Таким образом, можно сказать, что полученные данные согласуются со всеми гипотезами модели UTAUT, за исключением 5 гипотезы (осознанный риск). Поскольку мы обнаружили, что она имеет значительное воздействие, мы предлагаем добавить к первоначальной модели нежелание пользоваться для лучшего объяснения принятия и использования BDA в компаниях.

Наконец, мы отмечаем различия в поведении между компаниями, которые не используют эти методы или только начинают использовать (первый сегмент), и компаниями, которые используют их уже в течение длительного времени (второй сегмент). В случае новичков или компаний, которые ими не пользуются, ожидаемая эффективность, влияние общества и благоприятствующие условия оказывают сильное положительное влияние на поведенческое намерение и пользовательское поведение; в то время как нежелание пользоваться имеет сильное отрицательное влияние на обе переменных. Среди пользователей и активных пользователей только благоприятствующие условия оказывают воздействие на поведенческое намерение, в то время как остальные отношения не являются значимыми. Это может указывать на то, что опытные пользователи знают, чего они могут достигнуть с помощью этих методов, поэтому единственное, что их заботит, – хорошие благоприятствующие условия; в то время как новичкам до сих пор не известны все возможности данной технологии, так что они принимают в расчет больше проблем.

Что касается профессиональных затруднений, то результаты показывают, что руководители полагают, что каждая технология имеет свою собственную кривую обучения и этот вопрос не влияет на ее внедрение, если ожидаются отличные результаты, как это обстоит в случае с большими данными [9]. Аналогично, если в компании есть необходимая инфраструктура, она ничего не теряет, испытывая технологию. В любом случае для того, чтобы нежелание пользоваться, все равно требуется четкая информация о ее преимуществах. Следовательно, мы рекомендуем руководителям сделать две вещи. Во-первых, им следует знать, что большая часть программного оборудования, связанного с этими технологиями, бесплатна и, если у них уже есть аппаратные средства, им надо протестировать ее. Во-вторых, до руководителей среднего звена должны быть доведены сведения о преимуществах использования больших данных, в том числе примеры компаний, которые их применяют в тех же сферах. Использование аналитики больших данных в компаниях может стать очень важным шагом вперед в управлении информацией для улучшения отношений с клиентами.

Модель UTAUT должна продолжать развиваться, чтобы лучше объяснять принятие новых технологий. Дальнейшее исследование больших данных должно стремиться определить эти переменные. Кроме того, представляется необходимым исследовать новые переменные-модераторы с целью анализа возможных воздействий, которые прежде не принимались в расчет.

Наконец, увеличение размера выборки позволит установить различия в поведении групп компаний, которые мы можем проанализировать с помощью метода апостериорно сегментации, такого как апостериорная сегментация – частичные наименьшие квадраты (POSPLS). Так что, если у нас будет бо́льшая выборка компаний, использующих (или намеревающихся использовать) большие данные, мы получим бо́льшую эффективность данной модели и более информативные результаты.