Введение
Целью серии статей «Поисковая типология стран мира» является разработка версии разделения стран и территорий мира на группы для анализа их социально-экономического развития. Поисковая типология производится путем автоматического распознавания дифференциации объектов. В отечественной науке подобную методологию первой применила Т.И.Заславская для типологии регионов СССР [1].
В первой статье серии был предложен обзор типологий стран, разработанных ранее органами ООН и отечественными учеными. Было обосновано использование в типологическом страноведении международных баз данных и перечень экономических, демографических, социальных показателей, которые могут быть для этого использованы. Во второй статье были представлены расчеты коэффициентов корреляции и произведен их выборочный обзор. Целью данной работы является факторный анализ выбранных для исследования показателей и интерпретация результатов.
Материалы и методы исследования
В серии статей используются методы сравнительного, корреляционного, факторного, кластерного анализа, ориентированные на реализацию методологии типологической классификации. Статистические расчеты производятся в программах Excel, Stadia, и GRETL. Используются статистические данные ООН, МВФ и других международных организаций, перечень которых с подробными ссылками был представлен в первой статье.
Факторный анализ с оциально-экономических показателей
Под факторным анализом обычно подразумевается перечисление и описание причин, действующих сил и механизмов определенного процесса или явления. Вот как, например, С.В.Олимпиева представляла (со ссылкой на МВФ) факторы развития экономики России в 2021 г.: «В целом экономическая ситуация в России определяется тремя основными факторами. Первый фактор – сохранение прочной макроэкономической основы…Второй фактор – это структурные проблемы, ограничивающие рост…Третий фактор – международные санкции…» [1, с.188]. Аналогичным образом трактуется данное понятие в региональной политологии [2], экономической статистике [3] и экономико-математическом моделировании [4].
В данной статье используется другое понимание: «факторный анализ – это метод статистического анализа, который используется для изучения структуры многомерных данных. Его основная цель – выявить скрытые переменные (факторы), которые объясняют взаимосвязи между наблюдаемыми явлениями»1. При необходимости метод может использоваться для обобщения (генерализации) и сокращения числа переменных. Методология факторного анализа разрабатывается зарубежными [5,6] и российскими статистиками [7,8,9]. Этот метод используется для поиска скрытых (латентных) структур и закономерностей в психологии и социологии, как например у Е.Е.Фоминой [10], исследования распространения инноваций в мировой экономике и построения рейтингов [11] и решения аналогичных задач в различных науках, направлениях и проектах. Метод также используется в многофакторной классификации регионов России как промежуточная ступень между корреляционным анализом данных и кластерным анализом [12].
Факторный анализ в статистическом понимании не претендует на нахождение «причин» и «следствий», «механизмов» развития социально-экономических процессов, но позволяет найти латентные группировки статистических показателей. Можно сказать, что он классифицирует – но не объекты исследования (регионы или страны) – а ряды статистических данных. Факторы, выделенные в результате такого анализа, характеризуются близкими по форме и размерности к коэффициентам корреляции «факторными нагрузками», отражающими взаимосвязь каждого отдельного показателя с латентным фактором. Каждый фактор характеризуется своим вкладом в полную дисперсию всех показателей. После осуществления расчетов исследователь может предложить наименования полученным факторам и далее волен интерпретировать их как «причины» и «следствия», но сама математическая программа не указывает на то, что является причиной или механизмом, а что следствием.
В представленных в данной статье расчетах были использованы 60 показателей, описанных в нашей первой статье данной серии и подвергнутых корреляционному анализу во второй статье. В процессе подготовки данных к факторному анализу был произведен поиск «выбросов» и «пропусков» по всему массиву исходных данных. Было принято решение не считать «выбросами» преимущество крупных держав над малыми странами (США в экономике, Индии и Китая в демографии, России по площади и т.д.) и не удалять данные по этим странам.
Затем в GRETL был осуществлен поиск пропущенных значений: количество наблюдений (строк, то есть стран) с пропущенными значениями = 121 (60,80%), общее количество пропущенных значений 740 (6,20% всех данных). В статистических программах GRETL и STADIA при множественных сопоставлениях пропуски обрабатываются автоматически, однако их наличие может повлиять на точность классификаций, производимых факторным или кластерным анализом. В эконометрике действует общее правило о замене пропусков средними величинами, медианами, интерполяцией и т.д. В данной работе была произведена замена пропусков на медианы. После этого показатели Х1-Х60 были стандартизованы в GRETL делением на стандартное отклонение выборки.
Расчеты для данной статьи производились в программе Stadia посредством корреляции Пирсона c вращением варимакс и нормализацией Кайзера, их результаты представлены в таблице. Показатели Х1-Х60 приводятся в той последовательности, что в таблицах предыдущих статей, только немного сокращены их наименования. Полные ссылки на источники данных были опубликованы в первой статье.
В таблице представлены 10 факторов, которые суммарно объясняют 73,031% полной дисперсии 60 показателей.
Первый из выделенных программой Stadia факторов является самым значимым – на него приходится 27,62% полной дисперсии показателей. Он сильно положительно связан с основными показателями уровня экономического развития – подушевого номинального ВВП (Х5) и ВВП по паритету покупательной способности на душу населения (Х6). Высокую нагрузку по этому фактору также имеют ряды данных, которые эксперты рассматривают как косвенные показатели уровня развития – доля услуг в ВВП (Х18), уровень урбанизации (Х30), индекс человеческого развития (Х32), уровень автомобилизации (Х41), потребление энергии на душу населения (Х51). Другие ряды данных, имеющие положительную нагрузку по первому фактору, можно назвать индикаторами уровня социального и демографического развития. Как показывают результаты корреляционного анализа, опубликованные в предыдущей статье, они достаточно тесно связаны с показателями ВВП на душу населения.
К этой группе относятся средний возраст населения (Х22) и ожидаемая продолжительность предстоящей жизни (Х28). Данные показатели показывают уровень развития медицины и социальной поддержки населения, хотя увеличение доли пожилых возрастов оказывает негативное воздействие на экономику. К группе индикаторов уровня социального развития относятся также средняя заработная плата (Х38), обеспеченность населения врачами (Х43), обеспеченность интернетом (Х53), индекс политической стабильности и отсутствия терроризма (Х55), калорийность рациона питания (Х56), потребление мяса (Х57), и в заключение – индекс демократии (Х59) и индекс счастья (Х60). Как уже отмечалось в нашей предыдущей статье, парадоксальную близость к «позитивным» показателям социально-экономического развития демонстрирует «негативный» индикатор потребления алкоголя (Х45). Здесь он также имеет положительную нагрузку по первому фактору.
Высокие отрицательные нагрузки по первому фактору имеют доля сельского хозяйства в ВВП (Х16) и группа демографических характеристик, отражающих прирост населения (Х23-Х26). Как уже указывалось в предыдущих статьях, статистические векторы демографического и социально-экономического развития в мире имеют противоположную направленность, это проявилось и в факторном анализе. Уровень бедности (Х49) также оказался отрицательно связан с первым фактором. Исходя из этого, мы интерпретировали первый фактор, как уровень социально-экономического развития. «Узким местом» представленной здесь классификации показателей является то, что не удалось выделить «уровень демографического развития» в отдельный фактор, противоположно направленный по отношению к факторам социально-экономического развития.
Второй фактор объясняет 10,94% полной дисперсии 60 переменных. Он положительно связан с абсолютным размером номинального ВВП (Х1) и ВВП по паритету покупательной способности (Х4), ВВП ППС в процентах от мирового (Х9). Все эти показатели коллинеарны, тем не менее они адекватно отражают величину экономики страны. Также положительную нагрузку по данному фактору имеют численность населения (Х19) и коллинеарные с ней численность населения трудоспособного возраста (Х34) и численность занятого населения (Х35), а также площадь страны (Х39).
Результаты факторного анализа (факторные нагрузки) по показателям социально-экономического развития 197 стран мира в 2023 году
|
|
|
Уровень социально- экономического развития |
Размеры экономики, населения и территории |
Экономическая недостаточность государства |
Медицина и смертность населения |
Рост населения и особенности образа жизни |
Структура экономики и инвестиции |
Инфляция |
Экономический рост и плотность населения |
Милитаризация |
Безработица и социальное неравенство |
|
|
Фактор: |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
Процент полной дисперсии, приходящейся на данный фактор: |
27,62 |
10,94 |
6,911 |
5,437 |
4,522 |
4,27 |
3,644 |
3,467 |
3,285 |
2,935 |
|
Номинальный ВВП |
Х1 |
|
0,8697 |
|
|
|
|
|
|
|
|
|
Годовой прирост ВВП |
Х2 |
|
|
|
|
|
|
|
0,9338 |
|
|
|
Прирост ВВП за 5 лет |
Х3 |
|
|
|
|
|
|
|
0,5072 |
|
|
|
ВВП ППС |
Х4 |
|
0,9819 |
|
|
|
|
|
|
|
|
|
Номинальный ВВП на душу населения |
Х5 |
0,7288 |
|
|
|
|
|
|
|
|
|
|
ВВП ППС на душу населения |
Х6 |
0,8119 |
|
|
|
|
|
|
|
|
|
|
Дефлятор ВВП в % |
Х7 |
|
|
|
|
|
|
-0,9440 |
|
|
|
|
Инфляция в % к предыдущему году |
Х8 |
|
|
|
|
|
|
-0,9559 |
|
|
|
|
ВВП ППС страны в % от мирового |
Х9 |
|
0,9819 |
|
|
|
|
|
|
|
|
|
Общий объем инвестиций в % от ВВП |
Х10 |
|
|
|
|
|
-0,5206 |
|
|
|
|
|
Валовые национальные сбережения в % от ВВП |
Х11 |
|
|
|
|
|
-0,6697 |
|
|
|
|
|
Государственные доходы, в % от ВВП |
Х12 |
|
|
-0,8535 |
|
|
|
|
|
|
|
|
Государственные расходы, в % от ВВП |
Х13 |
|
|
-0,8383 |
|
|
|
|
|
|
|
|
Государственный долг в % от ВВП |
Х14 |
|
|
|
|
|
|
|
|
|
|
|
Относительная сила валюты |
Х15 |
|
|
-0,5738 |
|
|
|
|
|
|
|
|
Структура экономики: сельское хозяйство в % от ВВП |
Х16 |
-0,8325 |
|
|
|
|
|
|
|
|
|
|
Структура экономики: промышленность в % от ВВП |
Х17 |
|
|
|
|
|
-0,7800 |
|
|
|
|
|
Структура экономики: услуги в % от ВВП |
Х18 |
0,5979 |
|
|
|
|
0,5318 |
|
|
|
|
|
Численность населения |
Х19 |
|
0,8719 |
|
|
|
|
|
|
|
|
|
Прирост населения за 5 лет |
Х20 |
|
|
|
|
|
|
|
|
-0,5104 |
|
|
Плотность населения |
Х21 |
|
|
|
|
|
|
|
0,7851 |
|
|
|
Средний возраст населения (медиана) |
Х22 |
0,8843 |
|
|
|
|
|
|
|
|
|
|
Годовой прирост населения |
Х23 |
-0,5542 |
|
|
|
-0,6354 |
|
|
|
|
|
|
Естественный прирост |
Х24 |
-0,8595 |
|
|
|
|
|
|
|
|
|
|
Общий коэффициент рождаемости |
Х25 |
-0,9145 |
|
|
|
|
|
|
|
|
|
|
Суммарный коэффициент рождаемости |
Х26 |
-0,8861 |
|
|
|
|
|
|
|
|
|
|
Общий коэффициент смертности |
Х27 |
|
|
|
0,8019 |
|
|
|
|
|
|
|
Ожидаемая продолжительность предстоящей жизни |
Х28 |
0,9175 |
|
|
|
|
|
|
|
|
|
|
Коэффициент младенческой смертности |
Х29 |
-0,8701 |
|
|
|
|
|
|
|
|
|
|
Уровень урбанизации |
Х30 |
0,6967 |
|
|
|
|
|
|
|
|
|
|
Коэффициент миграционного прироста населения |
Х31 |
|
|
|
|
-0,6694 |
|
|
|
|
|
|
Индекс человеческого развития |
Х32 |
0,9078 |
|
|
|
|
|
|
|
|
|
|
Среднее время обучения (ИЧР) |
Х33 |
0,7911 |
|
|
|
|
|
|
|
|
|
|
Численность населения трудоспособного возраста (15+) |
Х34 |
|
0,9029 |
|
|
|
|
|
|
|
|
|
Численность занятого населения |
Х35 |
|
0,9150 |
|
|
|
|
|
|
|
|
|
Уровень занятости в промышленности |
Х36 |
|
|
|
|
|
|
|
|
|
|
|
Уровень безработицы |
Х37 |
|
|
|
|
|
|
|
|
|
0,7206 |
|
Средняя заработная плата в месяц в долларах ППС |
Х38 |
0,6692 |
|
|
|
|
|
|
|
|
|
|
Площадь стран |
Х39 |
|
0,6407 |
|
|
|
|
|
|
|
|
|
Среднегодовая температура по странам |
Х40 |
|
|
|
-0,6046 |
|
|
|
|
|
|
|
Уровень автомобилизации |
Х41 |
0,7608 |
|
|
|
|
|
|
|
|
|
|
Расходы на здравоохранение в % от ВВП |
Х42 |
|
|
-0,5780 |
|
|
|
|
|
|
|
|
Обеспеченность врачами на 1000 человек населения |
Х43 |
0,7590 |
|
|
|
|
|
|
|
|
|
|
Обеспеченность больничными койками на 1000 человек населения |
Х44 |
|
|
|
0,5819 |
|
|
|
|
|
|
|
Потребление алкоголя на душу населения в год |
Х45 |
0,5695 |
|
|
0,5397 |
|
|
|
|
|
|
|
Распространение ожирения среди взрослого населения |
Х46 |
|
|
-0,6961 |
|
0,5014 |
|
|
|
|
|
|
Употребление табака, в процентах к численности населения |
Х47 |
|
|
|
|
0,5006 |
|
|
|
|
|
|
Расходы на образование в % от ВВП |
Х48 |
|
|
-0,6368 |
|
0,6916 |
|
|
|
|
|
|
Население ниже уровня бедности, % |
Х49 |
-0,5787 |
|
|
|
|
|
|
|
|
|
|
Индекс Джини |
Х50 |
|
|
|
|
|
|
|
|
|
0,6396 |
|
Потребление энергии на душу населения в % к среднему мировому уровню |
Х51 |
0,5920 |
|
|
|
|
|
|
|
|
|
|
Мобильные телефоны на 100 чел населения |
Х52 |
|
|
|
|
|
|
|
|
|
|
|
Пользователи интернета на 100 чел населения |
Х53 |
0,8882 |
|
|
|
|
|
|
|
|
|
|
Военные расходы в % от ВВП |
Х54 |
|
|
|
|
|
|
|
|
0,7484 |
|
|
Индекс политической стабильности Всемирного банка |
Х55 |
0,6113 |
|
|
|
|
|
|
|
|
|
|
Энергетическая обеспеченность рациона (ккал/суточная норма) |
Х56 |
0,7190 |
|
|
|
|
|
|
|
|
|
|
Потребление мяса – кг/ чел/год |
Х57 |
0,7449 |
|
|
|
|
|
|
|
|
|
|
Индекс научного цитирования Nature |
Х58 |
|
0,8679 |
|
|
|
|
|
|
|
|
|
Индекс демократии The Economist |
Х59 |
0,5906 |
|
|
|
|
|
|
|
|
|
|
Индекс счастья Oxford – Gallup |
Х60 |
0,6328 |
|
|
|
|
|
|
|
|
|
Положительную нагрузку по второму фактору также имеет индекс научного цитирования Nature (Х58), который коррелирует с размером экономики стран и с численностью их населения: лидерами рейтинга Nature с большим отрывом от других стран являются Китай и США. Второй фактор можно интерпретировать как «размер страны». В таблице он назван размеры экономики, населения и территории.
Первые два фактора объясняют 38,56% суммарной дисперсии используемых в данном исследовании данных и проявляют статистическую связь с 34 из 60 показателей. Таким образом, можно предположить, что основу дифференцирующих страны признаков в будущей типологии составят уровни развития и размеры подлежащих классификации объектов.
Третий фактор объясняет 6,911% полной дисперсии. Все показатели, связанные с этим фактором, имеют по нему отрицательную нагрузку. Это государственные доходы (Х12) и расходы (Х13), относительная сила валюты (Х15). Как уже было сказано в первых двух статьях, сильная валюта обычно в экономически развитых государствах, которые эффективно участвуют в мировой торговле. В странах, чьи деньги не пользуются спросом на мировом валютном рынке, валюта слабее, в некоторых из них центральные банки специально ослабляют ее, чтобы стимулировать экспорт. Отрицательную нагрузку по третьему фактору имеют также расходы на здравоохранение (Х42) и образование (Х48), которые как правило, также ниже в менее развитых странах. Исключительное значение величины расходов на образование в развитии экономики отмечают М.Г.Колосницына [13], Е.Я.Арапова [14] и другие авторы. Так что недостаток расходов на образование в ряде стран является серьезной проблемой. В то же время в странах с пониженными государственными расходами, менее распространено ожирение населения – отмечается отрицательная нагрузка по показателю Х46. Исходя из того, что основу третьего фактора составляют недостаток государственных расходов и слабость валюты, в таблице этот фактор назван экономическая недостаточность государства.
Четвертый фактор объясняет 5,437% полной дисперсии. Положительную нагрузку по нему имеет общий коэффициент смертности (Х27), который связан как с недостаточностью развития медицины в слаборазвитых странах, так и со старением населения в развитых. Также положительная нагрузка здесь отмечается по обеспеченности больничными койками (Х44) и потреблением алкоголя (Х45). И то, и другое свойственно развитым странам. Отрицательная нагрузка наблюдается по показателю температуры по странам (Х40). Как уже было сказано в предыдущей статье, отрицательная корреляция географического идентификатора – средней температуры с показателями уровня ВВП на душу населения показывает, что страны, находящиеся дальше от экватора, как правило более экономически развиты. Таким образом, четвертый фактор может рассматриваться как дополнительный к первому в части характеристик уровня социально-экономического развития, развития медицины и демографии. В таблице он назван медицина и смертность.
На пятый фактор приходится 4,522% полной дисперсии исследуемых данных. Отрицательную нагрузку по нему имеют годовой прирост населения (Х23) и коэффициент миграционного прироста (Х31). Положительную нагрузку проявляют «вредные привычки» – распространение ожирения (Х46), употребление табака (Х47). Пятый фактор интерпретируется как прирост населения и особенности образа жизни.
Шестой фактор предопределяет 4,27% полной дисперсии данных. Он имеет положительную нагрузку по доле сферы услуг в ВВП (Х18), отрицательную нагрузку по общему объему инвестиции (Х10), по валовым национальным сбережениям (Х11), доле промышленности в ВВП (Х17). Отметим, что государственные инвестиции имеют значение для обеспечения устойчивого развития [15]. Исходя из перечисленных факторных нагрузок данный фактор назван структура экономики и инвестиции.
На седьмой фактор приходится 3,644% полной дисперсии. Высокую отрицательную нагрузку по этому фактору демонстрируют дефлятор ВВП (Х7) и годовая инфляции (Х8). В таблице он назван инфляция.
Восьмой фактор предопределяет 3,467% полной дисперсии всех показателей. Положительную нагрузку по этому фактору имеют годовой прирост ВВП (Х2), прирост ВВП за 5 лет (Х3) и плотность населения (Х21), поэтому в таблице он обозначен, как экономический рост и плотность населения.
Девятый фактор предопределяет 3,285% полной дисперсии и положительную нагрузку по нему имеет показатель доли военных расходов в ВВП (Х54). Как было сказано в предыдущей статье, корреляционный анализ показывает, что уровень военных расходов не связан с экономическими, демографическими и социальными показателями, а также с уровнем демократии, а диктуется в основном геополитическими обстоятельствами. Данный фактор в таблице назван милитаризация.
Процент полной дисперсии, определяемой десятым фактором, составляет 2,935%. Положительную нагрузку по этому фактору имеют уровень безработицы (Х37) и индекс Джини (Х50). Поэтому фактор обозначен безработица и социальное неравенство.
Заключение
Таким образом, посредством факторного анализа была произведена генерализация и разделение на группы всей совокупности показателей, которые в 1 и 2 частях исследования были предназначены для разработки поисковой типологии стран мира. Были предложены следующие наименования 10 факторов (групп взаимосвязанных показателей), которые в дальнейшем могут быть полезны для различных исследований и экспертных работ в области страноведения: уровень социально-экономического развития, размеры экономики, населения и территории, экономическая слабость государства, медицина и смертность населения, рост населения и особенности образа жизни, структура экономики и инвестиции, инфляция, экономический рост и плотность населения, милитаризация, безработица и социальное неравенство. Одним из результатов произведенного факторного анализа является углубление понимания причин и механизмов социально-экономической дифференциации стран мира. В следующей статье серии будет представлен кластерный анализ и типология стран мира по 60 экономическим, демографическим и социальным показателям.
[1] Факторный анализ: что это такое и как его проводить // Practicum.Yandex.ru. URL: https://practicum.yandex.ru/blog/chto-takoe-faktornyj-analiz-vidy-i-metody (дата обращения: 01.08.2025).

