Введение
Вопросы управления университетами, в том числе отдельными протекающими в них процессами, в последнее время приобретают все большую популярность. Связано это, прежде всего, с возрастающей конкуренцией между вузами, с желанием занимать верхние позиции в мировых рейтингах. Алгоритмы управления отдельными процессами в разных вузах в корне отличаются между собой.
Согласно А. Лукичеву, директору центра компетенций НТИ по нейротехнологиям, «вузам поставили задачу коммерциализировать их внутренние разработки, и они стали наполовину бизнес-структурами. Каждый вуз – это отдельная планета, и все работают по-разному: у кого-то отдельно свои лаборатории, у кого-то своя внутренняя цифровая система...» [6].
Руководство любой организации при принятии управленческих решений, как правило, опирается на достоверные и актуальные данные. Это касается и объектов образования. Поэтому разработка новых методов, моделей управления процессами в организациях высшего образования в настоящее время интересуются многие ученые. А сейчас, в условиях пандемии COVID-19 и межвузовской конкуренции проблема набора контингента и увеличения количества выпускников особенно остро встает перед руководством образовательных учреждений. Рынок труда непрерывно меняется, профессии, которые были востребованы в последние десятилетия, становятся ненужными, появляется потребность в специалистах новых направлений. В настоящее время многие университеты инвестируют в прогнозную аналитику, которая обеспечивается данными, генерируемыми учебной деятельностью в Интернете, а также опирается на доступ к внешним консультационным экспертам.
Получение высшего образования – один из важнейших факторов повышения качества человеческого капитала как для любого государства, так и для отдельно взятых регионов. Вопросы, связанные с набором контингента и выпуском бакалавров и специалистов, являются одними из самых важных как для вузов, так и для рынка труда рассматриваемого региона. Государство выделяемыми грантами старается отрегулировать «провалы» образовательного рынка. Растущая конкуренция на рынке образовательных услуг, отсутствие надежных прогнозов и не совершенность механизмов по определению данного показателя, делает исследования по данной тематике особенно актуальными.
Рассмотрев публикации по теме использования методов и приложений прогнозирования, становится ясно, что интерес к данной области возрос в 10 раз за последние 40 лет [9].
Цель исследования провести анализ факторов, влияющих на вероятность обучающего успешно окончить обучение в университете.
Материалы и методы исследования
В качестве рабочей гипотезы предполагалось существование зависимости между социально-экономическими показателями региона и успешным окончанием обучения по программам бакалавриата региональных вузов. Аналогичное исследование проведено В.Ф. Пугач, в результате которого было выявлено повышение устойчивости студенческого контингента с увеличением конкурса при поступлении в вуз [5]. В качестве инструмента исследования был использован коэффициент корреляции рангов Ч. Спирмена.
В работе [8] в результате исследования было установлено, что академическая успешность студентов взаимосвязана с добросовестностью и ответственностью. В работе [3] определены статистически значимые детерминанты успешной успеваемости студентов.
При проведении исследования в качестве исходных данных были использованы статистические данные по региональному вузу Республики Казахстан (НАО Северо-Казахстанский университет имени М. Козыбаева) и материалы Бюро национальной статистики Агентства по стратегическому планированию и реформам Республики Казахстан, опубликованные на его официальном сайте [2]. Это показатели, отражающие индивидуальные характеристики абитуриентов, индивидуальные характеристики студентов при обучении в вузе и характеристики уровня социально-экономического развития Северо-Казахстанской области, в которой расположен исследуемый университет.
Первая группа показателей включает средний балл аттестата и место постоянного жительства, которое представляет собой бинарную переменную, равную единице при проживании по месту нахождения учебного заведения, и ноль при проживании в другой местности.
Вторая группа – накопленный в процессе обучения рейтинг, который в Казахстане называется GPA (Grade Point Average) и характеристика формы обучения: с оплатой (коммерческая форма) или на бесплатной основе, которая в Казахстане определяется грантом, а в России является бюджетной формой обучения. Последний показатель является бинарной переменной, принимающей значение единица для бюджетной формы и ноль для коммерческой.
Третья группа показателей – среднедушевой номинальный денежный доход населения, доля населения, имеющего доходы ниже величины прожиточного минимума и уровень безработицы.
В качестве результирующей рассматривалась бинарная переменная, принимающая значение единица, если студент был отчислен до окончания обучения.
Данные представлены за период 2006–2017 гг., объем выборки составил 14877 студентов.
Характер данных предполагает использование в качестве инструмента анализа моделей бинарного выбора.
Так как данные содержат независимые выборки за 12 периодов времени, по каждому периоду были рассчитаны средние значения количественных показателей, а бинарные переменные преобразованы в количественные в виде относительных показателей доли. В частности, результирующая переменная приняла форму доли отчисленных до окончания обучения, объясняющие переменные «место постоянного жительства» – доли проживающих по месту нахождения учебного заведения, «характеристика формы обучения» – доли обучающихся на бюджете.
Проведенные преобразования данных позволили применить для анализа успешности обучения модель регрессии по временным рядам.
В качестве альтернативного метода анализа больших данных был использован метод Левенберга-Маркара для построения нейронной сети, согласно которому обучение происходит «по эпохам» [1]. Данный метод предполагает, что ошибка построенной сети определяется за всю эпоху обучения, а параметры модели будут изменяться, когда сеть пройдет все элементы обучающей части выборки [7]. С этой целью, имеющуюся выборку разделили на три части: обучающую, контрольную и тестовую. Для обучения, то есть построения самой модели, использовали 70% данных, для текущей оценки состояния обучения – 15% данных, оставшиеся 15% данных были использованы для процесса тестирования качества построенной модели.
В настоящее время нейронные сети используются для решения большого класса задач, в том числе прогнозирования. Обученная сеть способна обобщать информацию и давать хорошие результаты даже на данных, которые не использовались в процессе обучения [4].
Для обработки данных были использованы инструменты Ms Excel, Gretl, Matlab R2017b.
Результаты исследования и их обсуждение
Проведенный предварительный корреляционный анализ межфакторных связей показал наличие мультиколлинеарности, что привело к сокращению количества объясняющих переменных. В частности, индивидуальные характеристики абитуриента имеют статистически значимую связь с характеристиками обучающегося. Студенты бюджетной формы обучения имеют в среднем более высокие баллы GPA. Тесно связаны между собой показатели третьей группы, отражающие уровень социально-экономического развития региона.
При построении моделей бинарного выбора наилучшей оказалась логит-модель следующего вида:
где P(otch = 1) – вероятность быть отчисленным до окончания обучения, bedn – доля населения, имеющего доходы ниже величины прожиточного минимума, ε – случайный остаток модели.
Все параметры модели статистически значимы, уравнение значимо (критерий отношения правдоподобия: Хи-квадрат (2) = 4488,09 [0,0000]), индекс McFadden R2 равен 0,39, предсказательная сила модели составляет 92,8%.
Таким образом, с ростом доли бедных вероятность быть отчисленным уменьшается. Предельный эффект для среднего значения данного фактора составил (-0,003). То есть с изменением доли бедных на один процентный пункт от среднего значения вероятность отчисления студента до окончания обучения изменяется в противоположную сторону на 0,003 при неизменном среднем балле GPA.
Очевидным образом вероятность отчисления повышается при уменьшении баллов текущей аттестации. Предельный эффект равен (-0,144), что показывает величину роста вероятности быть отчисленным при снижении балла GPA на единицу от среднего при неизменном уровне бедности.
Модель с этими же объясняющими переменными, построенная по временным рядам, имеет следующий вид:
,
где dotch – доля студентов, отчисленных в учебном году, GPA – средний балл для по выборке студентов для рассматриваемого года.
В скобках указаны фактические значения критерия Стьюдента, критическое значение составило 2,3 на уровне значимости 0,05. Скорректированный коэффициент детерминации равен 0,80. Уравнение регрессии значимо (p – value = 2,7 ∙ 10–8). Анализ случайных остатков отсутствие автокорреляции (критерий Дарбина-Уотсона dw = 2,11 при критических значениях 0,81 и 1,58) и нормальность их распределения (p – value = 0,97).
Полученные коэффициенты практически полностью совпадают с предельными эффектами, рассчитанными по логит-модели, однако логит-модель имеет более высокую предсказательную силу.
Таким образом, обе модели показали, что основным фактором, который определяет вероятность не попасть в число отчисленных, является накопленный в процессе обучения рейтинг (GPA).
Следующим этапом исследования успешности обучения в университете было построение нейронной сети с использованием обучающей выборки по всем показателям трех описанных выше групп. Результаты обучения определялись среднеквадратической ошибкой (MSE) и значением коэффициента корреляции (R) между выходами сети и целевыми значениями (таблица).
Значения результатов обучения нейронной сети
Объем выборки |
Среднеквадратическая ошибка |
Коэффициент корреляции |
|
Обучающая выборка |
10413 |
0,061 |
0,692 |
Контрольная выборка |
2232 |
0,051 |
0,728 |
Тестовая выборка |
2232 |
0,065 |
0,638 |
График эффективности обучения
Сравнение трех построенных моделей показало, что несмотря на то, что в нейронной сети были использованы все предложенные в начале исследования показатели, результат, полученный с её использованием, оказался хуже, чем у моделей регрессии. Так, коэффициент детерминации на разных выборках составлял от 0,41 до 0,53. Предсказательная сила нейронной сети, согласно тестовой выборке, составила 90,0%, что несколько ниже, чем по модели дискретного выбора (92,8%).
В целом можно заметить уменьшение ошибки во время процесса обучения на каждой эпохе (рисунок). Обучение было остановлено, когда ошибка на проверочном множестве перестала уменьшаться.
Заключение
Анализ факторов, оказывающих влияние на успешное окончание обучения в университете, проведенный по данным регионального университета в Республике Казахстан, показал, что наиболее существенным можно назвать отношение студентов к обучению, их прилежание и, соответственно, полученные оценки по дисциплинам. Социально-экономические показатели, в том числе низкий уровень благосостояния населения, являются одним из стимулов, мотивирующих студентов к ответственному отношению к учебному процессу, что подтверждено результатами эконометрического моделирования. Молодые люди стремятся после окончания обучения перейти в более высокие, лучше материально обеспеченные страты общества. Таким образом, рабочая гипотеза была подтверждена результатами эконометрического моделирования, как и очевидный факт, что успешность окончания университета напрямую зависит от отношения студента к учебе.