Введение
Сегодня швейные машинки получают все большее распространение в обществе. Многие хозяйки обзаводятся ими, но каждая преследует свои цели от пользования. В последнее время обретает популярность такой вид творчества, как «Хенд-мейд». Люди шьют одежду, игрушки, различные элементы декора и продают их через социальные сети, интернет-магазины, кто-то открывает небольшие магазины в торговых центрах. Данный вид деятельности для многих людей является сейчас не только простым хобби, но и хорошим способом неплохого заработка, а, особенно, для домохозяек, не имеющих основного места работа, или для тех, кто находится в отпуске по уходу за ребенком.
К покупке различных видов техники люди подходят очень вдумчиво, не является исключением и поход к покупке швейных машинок. Если раньше особого выбора данного вида техники не было, то сейчас мы так сказать не можем, так как на рынке представлен широкий модельный ряд машинок для разных видов деятельности, поэтому выбор становится сложнее. При приобретении не следует опираться только на известность бренда, нужно изучить рынок в общем, все характеристики и возможности, которые бы соответствовали вашим требованиям.
Цель исследования
Целью данной работы является построение модели формирования цены швейных машинок в зависимости от их параметров:
- Цена;
- Бренд;
- Рейтинг;
- Количество выполняемых операций;
- Мощность;
- Вес;
- Вид челночного устройства;
- Тип управления;
- Наличие вышивального блока;
- Профессиональность модели.
Материал и методы исследования
Всего была собрана информация о 270 швейных машинках с сайта «Яндекс Маркет» [1]. В выборке представлены характеристики швейных машинок, представленные в виде как количественных, так и качественных переменных. В качестве зависимой переменной выступает цена.
Количественные данные: цена швейной машинки, количество выполняемых операций, мощность и вес.
Качественные переменные: бренд, рейтинг, вид челночного устройства, тип управления, наличие вышивального блока и профессиональность модели.
В ходе выполнения работы были поставлены следующие задачи:
1. Определить степень влияния бренда;
2. Определить значимо влияющие на цену параметры.
Результаты исследования и их обсуждение
Сначала необходимо выявить взаимосвязь цены с количественными и качественными параметрами [2].
Посмотрим на присутствующие связи между количественными параметрами с помощью парной корреляции (табл. 1).
Анализ матрицы коэффициентов парной корреляции для количественных переменных показывает, что цена имеет очень тесную связь (линейную) с количеством операций , с весом .
Между признаками (регрессорами) высокой связи (выше 0,85) не наблюдается, то есть можно сделать вывод, что мультиколлинеарность отсутствует.
Далее посмотрим на наличие связей между зависимой переменной «Цена» и качественными параметрами. Построим матрицу корреляций и обратим внимание на коэффициенты Спирмена (табл. 2).
Анализ матрицы коэффициентов парной корреляции для качественных переменных показывает, что цена имеет очень высокую связь с типом управления , с уровнем профессиональности . В табл. 1 ячейки с данными значениями выделены желтым цветом.
Таблица 1
Цена |
Кол-во операций |
Мощность (Вт) |
Вес |
|
Цена |
1 |
|||
Кол-во операций |
0,85 |
1 |
||
Мощность (Вт) |
0,65 |
0,51 |
1 |
|
Вес |
0,81 |
0,69 |
0,62 |
1 |
Таблица 2
Корреляции |
|||||||||
Цена |
Тип_Марки |
Рейтинг |
Расположение_челнока |
Управление |
Вышивальный_блок |
Профессиональность |
|||
P0 Спирмена |
Цена |
Коэффициент корреляции |
1,000 |
,149* |
-,097 |
,311** |
,831** |
,556** |
,710** |
Знач. (двухсторонняя) |
. |
,014 |
,112 |
,000 |
,000 |
,000 |
,000 |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
Тип_Марки |
Коэффициент корреляции |
,149* |
1,000 |
-,014 |
,082 |
,104 |
,077 |
-,034 |
|
Знач. (двухсторонняя) |
,014 |
. |
,818 |
,179 |
,088 |
,209 |
,573 |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
Рейтинг |
Коэффициент корреляции |
-,097 |
-,014 |
1,000 |
-,070 |
-,147* |
-,163* |
-,099 |
|
Знач. (двухсторонняя) |
,112 |
,818 |
. |
,251 |
,016 |
,007 |
,105 |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
Расположение_челнока |
Коэффициент корреляции |
,311** |
,082 |
-,070 |
1,000 |
,464** |
,234** |
,125** |
|
Знач. (двухсторонняя) |
,000 |
,179 |
,251 |
. |
,000 |
,000 |
,040 |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
Управление |
Коэффициент корреляции |
,831** |
,104 |
-,147* |
,464** |
1,000 |
,462** |
,566** |
|
Знач. (двухсторонняя) |
,000 |
,088 |
,016 |
,000 |
. |
,000 |
,000 |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
Вышивальный_блок |
Коэффициент корреляции |
,556** |
,077 |
-,163* |
,234** |
,462** |
1,000 |
||
Знач. (двухсторонняя) |
,000 |
,209 |
,007 |
,000 |
,000 |
. |
,000 |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
Профессиональность |
Коэффициент корреляции |
,710** |
-,034 |
-,099 |
,125** |
,566** |
,411** |
1,000 |
|
Знач. (двухсторонняя) |
,000 |
,573 |
,105 |
,040 |
,000 |
,000 |
. |
||
N |
270 |
270 |
270 |
270 |
270 |
270 |
270 |
||
*. Корреляция значима на уровне 0,05 (двухсторонняя). **. Корреляция значима на уровне 0,01 (двухсторонняя). |
Между регрессорами тесной связи (выше 0,85) также не наблюдается, то есть мультиколлинеарность отсутствует.
Из собственного предположения о том, что есть сильная связь между наличием вышивального блока и профессиональности машинки, рассмотрим взаимосвязь этих факторов.
Построим таблицу 2*2, рассчитаем коэффициенты связи (табл. 3).
Связь двух показателей определена по критериям (табл. 4).
По представленной таблице с рассчитанными коэффициентами связи (Фи коэффициент, V коэффициент Крамера, коэффициент сопряженности) меньше 0,5, т.е. сильной связи не выявлено.
Далее проведем оценивание модели [3].
В качестве независимых факторов в модель будут включены следующие регрессоры:
1. Количественные:
- X1 – количество выполняемых операций;
- X2 – мощность;
- X3 – вес.
2. Бинарные (принимают значение 0 или 1):
- S1 – рейтинг;
- S2 – вид челночного устройства;
- S3 – тип управления;
- S4 – наличие вышивального блока;
- S5 – профессиональность модели.
3. Категориальная переменная – тип марки. Она состоит из четырех категорий, для включения в модель она будет разбита на четыре бинарные переменные:
- D1 – принимает значение 1, если марка «Janome», 0 в остальных случаях;
- D2 – принимает значение 1, если «Bernina» или «Husquarna», 0 в остальных случаях;
- D3 – принимает значение 1, если «Brother» или «Elna», 0 в остальных случаях;
- D4 – принимает значение 1, если «Другие» модели, 0 в остальных случаях.
Во избежание мультиколлинеарности переменную D4 не будем включать в модель.
Таким образом, будет оцениваться модель:
Оцененная модель линейной регрессии представлена ниже. Табл. «Коэффициенты» (табл. 5) содержит номер модели, используемые в модели независимые переменные, коэффициенты уравнения регрессии, стандартные ошибки коэффициентов уравнения регрессии, стандартизированные коэффициенты, t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Таблица 3
Комбинационная таблица Профессиональность*Вышивальный_блок |
||||
Количество |
Вышивальный_блок |
|||
нет |
есть |
Всего |
||
Професиональность |
бытовые |
181 |
17 |
198 |
профессиональные |
40 |
32 |
72 |
|
Всего |
221 |
49 |
270 |
Таблица 4
Значение |
Приблизительная значимость |
||
Номинал/номинал |
Фи |
,411 |
,000 |
V Крамера |
,411 |
,000 |
|
Коэффициент сопряженности |
,380 |
,000 |
|
Количество ддопустимых наблюдений |
270 |
Таблица 5
Коэффициенты а |
||||||
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
т |
Значимость |
||
В |
Стандартная ошибка |
Бета |
||||
1 |
(Константа) |
-46686,733 |
8639,987 |
-5,404 |
,000 |
|
Мощность |
276,302 |
118,993 |
,085 |
2,322 |
,021 |
|
Вес |
5623,916 |
1095,311 |
,227 |
5,135 |
,000 |
|
Количество_операций |
114,472 |
8,941 |
, 438 |
12,804 |
,000 |
|
Рейтинг |
8640,019 |
4677,207 |
,044 |
1,847 |
,066 |
|
Расположение_челнока |
-3063,490 |
5247,157 |
-,017 |
-,584 |
,560 |
|
Управление |
1067,731 |
6116,117 |
,006 |
,175 |
,862 |
|
Вышивальный_блок |
31943,596 |
6679,050 |
,141 |
4,783 |
,000 |
|
Проессиональность |
28381,740 |
7332,978 |
,144 |
3,870 |
,000 |
|
D1 |
-8576,874 |
5749,978 |
-,047 |
-1,492 |
,137 |
|
D2 |
20989,184 |
7847,170 |
,089 |
2,675 |
,008 |
|
D3 |
-14434,115 |
6452,025 |
-,071 |
-2,237 |
,026 |
|
а. Зависимая переменная: Цена |
Из таблицы выше видно о наличии незначимых переменных в модели. Оптимизируем модель, избавившись от незначимых переменных методом пошагового исключения, уберем из модели переменные «Вид челночного устройства» и «Тип управления» [4]. Категориальные переменные D1, D2 и D3 можно также убрать из модели, а объяснить это можно тем, что бренд не имеет особого влияния на модель. То есть люди при покупке швейных машинок опираются не на бренд, а на характеристики.
Распределение остатков представлено на рис. 1.
Рис. 1. Распределение остатков
Несмотря на то, что из модели были исключены 2 незначимые переменные, распределение имеет асимметрию вправо и влево, остатки не являются нормальными.
Коэффициенты модели можно проинтерпретировать следующим образом [5]:
Для количественных переменных:
- при увеличении мощности на 10 Вт цена увеличится на 2 965 рублей;
- при увеличении веса на 1 кг цена увеличится на 5 550 рублей;
- при увеличении количества операций на 10 штук цена увеличится на 1 143 рублей.
Для бинарных переменных:
- За высокий рейтинг при прочих равных условиях доплата составит 8 570 рублей;
- За наличие вышивального блока в конструкции швейной машинки при прочих равных условиях доплата составит 31 858 рублей;
- За профессиональную модель при прочих равных условиях доплата составит 28 165 рублей.
Для учета нелинейной зависимости от веса, и учета процентной зависимости цены от факторов перейдем к логарифмической модели зависимости LN(Y):
Помимо категориальных переменных D1, D2 и D3, методом пошагового отбора (была исключена категориальная переменная «Тип марки») была получена следующая модель.
Оцененная модель линейной регрессии представлена ниже. Табл. «Коэффициенты» (табл. 6) содержит номер модели, используемые в модели независимые переменные, коэффициенты уравнения регрессии, стандартные ошибки коэффициентов уравнения регрессии, стандартизированные коэффициенты, t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Из таблицы видно, что все параметры значимы.
Распределение остатков представлено на рис. 2.
Рис. 2. Распределение остатков модели LN(Y)
График распределения остатков подтверждает предположение об их нормальности.
Коэффициенты модели можно проинтерпретировать следующим образом:
Для количественных переменных:
- при увеличении мощности на 10 Вт цена увеличится на 1 %;
- при увеличении веса на 1 кг цена увеличится на 11 %;
Для бинарных переменных:
- За наличие вышивального блока в конструкции швейной машинки при прочих равных условиях цена увеличится на 25 %;
- За профессиональную модель при прочих равных условиях цена будет выше на 38,4 %;
- За модель, которая управляется компьютерным способом, при прочих равных условиях цена будет выше на 113 %.
Таблица 6
Коэффициенты а |
||||||
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
т |
Значимость |
||
В |
Стандартная ошибка |
Бета |
||||
1 |
(Константа) |
7,691 |
,098 |
78,261 |
,000 |
|
Мощность |
,009 |
,001 |
,171 |
6,264 |
,000 |
|
Вес |
,112 |
,013 |
,289 |
8,424 |
,000 |
|
Количество_операций |
,000 |
,000 |
,116 |
4,037 |
,000 |
|
Вышивальный_блок |
,249 |
,085 |
,071 |
2,922 |
,004 |
|
Проессиональность |
,384 |
,089 |
,125 |
4,304 |
,000 |
|
Управление |
1,136 |
,074 |
,418 |
15,372 |
,000 |
|
а. Зависимая переменная: Цена |
Выводы
Главным выводом проделанной работы является то, что для моделирования цены швейных машин лучше всего использовать модель с логарифмом зависимой переменной, ее высокое качество (высокий коэффициент детерминации) и адекватность модели подтверждают ее выбор [6].
Также по поставленным задачам были достигнуты следующие результаты:
1. Определена степень влияния бренда на ценообразование швейных машинок. Сделан вывод, что бренд не имеет большого влияния на ценообразование. Куда больше влияние на цену остальных параметров (характеристик).
2. Были определены значимо влияющие параметры на цену. Такими параметрами можно назвать:
- Количество выполняемых операций (чем больше операций, тем выше цена).
- Тип управления (машины с компьютерным управлением стоят намного дороже электромеханических). Можно сказать, что они более удобные для профессиональной сферы.
- Наличие вышивального блока (значительно увеличивается цена, при его наличии).
- Профессиональность модели (профессиональная модель будет стоить намного дороже бытовой, так как ее используют не только обычные домохозяйки, которым подойдет машинка с базовыми характеристиками).