Научный журнал
Вестник Алтайской академии экономики и права
Print ISSN 1818-4057
Online ISSN 2226-3977
Перечень ВАК

THE SEARCH TYPOLOGY OF THE COUNTRIES OF THE WORLD. PART 3. FACTOR ANALYSIS OF INDICATORS

Kashepov A.V. 1
1 The Institute of Demographic Research of the Federal State Budgetary Institution of the Federal Research Sociological Center of the Russian Academy of Sciences
1143 KB
This third article in the series continues the preliminary study of indicators, based on which a typology of 197 countries of the world will be subsequently produced. 60 indicators are divided into groups by means of factor analysis. The method allows us to identify in a wide range of indicators those that most strongly determine the similarity and difference of the countries of the world. It also allows you to repeat and supplement the results of correlation analysis. Latent combinations of statistical indicators (factors) identified in the course of this study are given names that simultaneously contain their interpretation. The following names of 10 factors are proposed: the level of socio-economic development, the size of the economy, population and territory, the level of government intervention in the economy, population dynamics, rates and sources of economic growth, population density and excess labor, poverty and income inequality, inflation, government debt, the level of human development and science. If necessary, you can use a list of factors as a new list of indicators that will replace the several dozen that were relevant at the beginning of the study. But the main result, presumably, is a deeper understanding of the causes and mechanisms of socio-economic differentiation of the countries of the world.
world countries
classification
typology
statistical indicators
factor analysis

Введение

Целью серии статей «Поисковая типология стран мира» является разработка версии разделения стран и территорий мира на группы для анализа их социально-экономического развития. Поисковая типология производится путем автоматического распознавания дифференциации объектов. В отечественной науке подобную методологию первой применила Т.И.Заславская для типологии регионов СССР [1].

В первой статье серии был предложен обзор типологий стран, разработанных ранее органами ООН и отечественными учеными. Было обосновано использование в типологическом страноведении международных баз данных и перечень экономических, демографических, социальных показателей, которые могут быть для этого использованы. Во второй статье были представлены расчеты коэффициентов корреляции и произведен их выборочный обзор. Целью данной работы является факторный анализ выбранных для исследования показателей и интерпретация результатов.

Материалы и методы исследования

В серии статей используются методы сравнительного, корреляционного, факторного, кластерного анализа, ориентированные на реализацию методологии типологической классификации. Статистические расчеты производятся в программах Excel, Stadia, и GRETL. Используются статистические данные ООН, МВФ и других международных организаций, перечень которых с подробными ссылками был представлен в первой статье.

Факторный анализ с оциально-экономических показателей

Под факторным анализом обычно подразумевается перечисление и описание причин, действующих сил и механизмов определенного процесса или явления. Вот как, например, С.В.Олимпиева представляла (со ссылкой на МВФ) факторы развития экономики России в 2021 г.: «В целом экономическая ситуация в России определяется тремя основными факторами. Первый фактор – сохранение прочной макроэкономической основы…Второй фактор – это структурные проблемы, ограничивающие рост…Третий фактор – международные санкции…» [1, с.188]. Аналогичным образом трактуется данное понятие в региональной политологии [2], экономической статистике [3] и экономико-математическом моделировании [4].

В данной статье используется другое понимание: «факторный анализ – это метод статистического анализа, который используется для изучения структуры многомерных данных. Его основная цель – выявить скрытые переменные (факторы), которые объясняют взаимосвязи между наблюдаемыми явлениями»1. При необходимости метод может использоваться для обобщения (генерализации) и сокращения числа переменных. Методология факторного анализа разрабатывается зарубежными [5,6] и российскими статистиками [7,8,9]. Этот метод используется для поиска скрытых (латентных) структур и закономерностей в психологии и социологии, как например у Е.Е.Фоминой [10], исследования распространения инноваций в мировой экономике и построения рейтингов [11] и решения аналогичных задач в различных науках, направлениях и проектах. Метод также используется в многофакторной классификации регионов России как промежуточная ступень между корреляционным анализом данных и кластерным анализом [12].

Факторный анализ в статистическом понимании не претендует на нахождение «причин» и «следствий», «механизмов» развития социально-экономических процессов, но позволяет найти латентные группировки статистических показателей. Можно сказать, что он классифицирует – но не объекты исследования (регионы или страны) – а ряды статистических данных. Факторы, выделенные в результате такого анализа, характеризуются близкими по форме и размерности к коэффициентам корреляции «факторными нагрузками», отражающими взаимосвязь каждого отдельного показателя с латентным фактором. Каждый фактор характеризуется своим вкладом в полную дисперсию всех показателей. После осуществления расчетов исследователь может предложить наименования полученным факторам и далее волен интерпретировать их как «причины» и «следствия», но сама математическая программа не указывает на то, что является причиной или механизмом, а что следствием.

В представленных в данной статье расчетах были использованы 60 показателей, описанных в нашей первой статье данной серии и подвергнутых корреляционному анализу во второй статье. В процессе подготовки данных к факторному анализу был произведен поиск «выбросов» и «пропусков» по всему массиву исходных данных. Было принято решение не считать «выбросами» преимущество крупных держав над малыми странами (США в экономике, Индии и Китая в демографии, России по площади и т.д.) и не удалять данные по этим странам.

Затем в GRETL был осуществлен поиск пропущенных значений: количество наблюдений (строк, то есть стран) с пропущенными значениями = 121 (60,80%), общее количество пропущенных значений 740 (6,20% всех данных). В статистических программах GRETL и STADIA при множественных сопоставлениях пропуски обрабатываются автоматически, однако их наличие может повлиять на точность классификаций, производимых факторным или кластерным анализом. В эконометрике действует общее правило о замене пропусков средними величинами, медианами, интерполяцией и т.д. В данной работе была произведена замена пропусков на медианы. После этого показатели Х1-Х60 были стандартизованы в GRETL делением на стандартное отклонение выборки.

Расчеты для данной статьи производились в программе Stadia посредством корреляции Пирсона c вращением варимакс и нормализацией Кайзера, их результаты представлены в таблице. Показатели Х1-Х60 приводятся в той последовательности, что в таблицах предыдущих статей, только немного сокращены их наименования. Полные ссылки на источники данных были опубликованы в первой статье.

В таблице представлены 10 факторов, которые суммарно объясняют 73,031% полной дисперсии 60 показателей.

Первый из выделенных программой Stadia факторов является самым значимым – на него приходится 27,62% полной дисперсии показателей. Он сильно положительно связан с основными показателями уровня экономического развития – подушевого номинального ВВП (Х5) и ВВП по паритету покупательной способности на душу населения (Х6). Высокую нагрузку по этому фактору также имеют ряды данных, которые эксперты рассматривают как косвенные показатели уровня развития – доля услуг в ВВП (Х18), уровень урбанизации (Х30), индекс человеческого развития (Х32), уровень автомобилизации (Х41), потребление энергии на душу населения (Х51). Другие ряды данных, имеющие положительную нагрузку по первому фактору, можно назвать индикаторами уровня социального и демографического развития. Как показывают результаты корреляционного анализа, опубликованные в предыдущей статье, они достаточно тесно связаны с показателями ВВП на душу населения.

К этой группе относятся средний возраст населения (Х22) и ожидаемая продолжительность предстоящей жизни (Х28). Данные показатели показывают уровень развития медицины и социальной поддержки населения, хотя увеличение доли пожилых возрастов оказывает негативное воздействие на экономику. К группе индикаторов уровня социального развития относятся также средняя заработная плата (Х38), обеспеченность населения врачами (Х43), обеспеченность интернетом (Х53), индекс политической стабильности и отсутствия терроризма (Х55), калорийность рациона питания (Х56), потребление мяса (Х57), и в заключение – индекс демократии (Х59) и индекс счастья (Х60). Как уже отмечалось в нашей предыдущей статье, парадоксальную близость к «позитивным» показателям социально-экономического развития демонстрирует «негативный» индикатор потребления алкоголя (Х45). Здесь он также имеет положительную нагрузку по первому фактору.

Высокие отрицательные нагрузки по первому фактору имеют доля сельского хозяйства в ВВП (Х16) и группа демографических характеристик, отражающих прирост населения (Х23-Х26). Как уже указывалось в предыдущих статьях, статистические векторы демографического и социально-экономического развития в мире имеют противоположную направленность, это проявилось и в факторном анализе. Уровень бедности (Х49) также оказался отрицательно связан с первым фактором. Исходя из этого, мы интерпретировали первый фактор, как уровень социально-экономического развития. «Узким местом» представленной здесь классификации показателей является то, что не удалось выделить «уровень демографического развития» в отдельный фактор, противоположно направленный по отношению к факторам социально-экономического развития.

Второй фактор объясняет 10,94% полной дисперсии 60 переменных. Он положительно связан с абсолютным размером номинального ВВП (Х1) и ВВП по паритету покупательной способности (Х4), ВВП ППС в процентах от мирового (Х9). Все эти показатели коллинеарны, тем не менее они адекватно отражают величину экономики страны. Также положительную нагрузку по данному фактору имеют численность населения (Х19) и коллинеарные с ней численность населения трудоспособного возраста (Х34) и численность занятого населения (Х35), а также площадь страны (Х39).

Результаты факторного анализа (факторные нагрузки) по показателям социально-экономического развития 197 стран мира в 2023 году

 

 

Уровень социально- экономического развития

Размеры экономики, населения и территории

Экономическая недостаточность государства

Медицина и смертность населения

Рост населения и особенности образа жизни

Структура экономики и инвестиции

Инфляция

Экономический рост и плотность населения

Милитаризация

Безработица и социальное неравенство

 

Фактор:

1

2

3

4

5

6

7

8

9

10

 

Процент полной дисперсии, приходящейся на данный фактор:

27,62

10,94

6,911

5,437

4,522

4,27

3,644

3,467

3,285

2,935

Номинальный ВВП

Х1

 

0,8697

 

 

 

 

 

 

 

 

Годовой прирост ВВП

Х2

 

 

 

 

 

 

 

0,9338

 

 

Прирост ВВП за 5 лет

Х3

 

 

 

 

 

 

 

0,5072

 

 

ВВП ППС

Х4

 

0,9819

 

 

 

 

 

 

 

 

Номинальный ВВП на душу населения

Х5

0,7288

 

 

 

 

 

 

 

 

 

ВВП ППС на душу населения

Х6

0,8119

 

 

 

 

 

 

 

 

 

Дефлятор ВВП в %

Х7

 

 

 

 

 

 

-0,9440

 

 

 

Инфляция в % к предыдущему году

Х8

 

 

 

 

 

 

-0,9559

 

 

 

ВВП ППС страны в % от мирового

Х9

 

0,9819

 

 

 

 

 

 

 

 

Общий объем инвестиций в % от ВВП

Х10

 

 

 

 

 

-0,5206

 

 

 

 

Валовые национальные сбережения в % от ВВП

Х11

 

 

 

 

 

-0,6697

 

 

 

 

Государственные доходы, в % от ВВП

Х12

 

 

-0,8535

 

 

 

 

 

 

 

Государственные расходы, в % от ВВП

Х13

 

 

-0,8383

 

 

 

 

 

 

 

Государственный долг в % от ВВП

Х14

 

 

 

 

 

 

 

 

 

 

Относительная сила валюты

Х15

 

 

-0,5738

 

 

 

 

 

 

 

Структура экономики: сельское хозяйство в % от ВВП

Х16

-0,8325

 

 

 

 

 

 

 

 

 

Структура экономики: промышленность в % от ВВП

Х17

 

 

 

 

 

-0,7800

 

 

 

 

Структура экономики: услуги в % от ВВП

Х18

0,5979

 

 

 

 

0,5318

 

 

 

 

Численность

населения

Х19

 

0,8719

 

 

 

 

 

 

 

 

Прирост населения за 5 лет

Х20

 

 

 

 

 

 

 

 

-0,5104

 

Плотность населения

Х21

 

 

 

 

 

 

 

0,7851

 

 

Средний возраст населения (медиана)

Х22

0,8843

 

 

 

 

 

 

 

 

 

Годовой прирост населения

Х23

-0,5542

 

 

 

-0,6354

 

 

 

 

 

Естественный

прирост

Х24

-0,8595

 

 

 

 

 

 

 

 

 

Общий коэффициент рождаемости

Х25

-0,9145

 

 

 

 

 

 

 

 

 

Суммарный

коэффициент

рождаемости

Х26

-0,8861

 

 

 

 

 

 

 

 

 

Общий коэффициент смертности

Х27

 

 

 

0,8019

 

 

 

 

 

 

Ожидаемая продолжительность предстоящей жизни

Х28

0,9175

 

 

 

 

 

 

 

 

 

Коэффициент

младенческой смертности

Х29

-0,8701

 

 

 

 

 

 

 

 

 

Уровень урбанизации

Х30

0,6967

 

 

 

 

 

 

 

 

 

Коэффициент миграционного прироста населения

Х31

 

 

 

 

-0,6694

 

 

 

 

 

Индекс человеческого развития

Х32

0,9078

 

 

 

 

 

 

 

 

 

Среднее время

обучения (ИЧР)

Х33

0,7911

 

 

 

 

 

 

 

 

 

Численность населения трудоспособного возраста (15+)

Х34

 

0,9029

 

 

 

 

 

 

 

 

Численность занятого населения

Х35

 

0,9150

 

 

 

 

 

 

 

 

Уровень занятости

в промышленности

Х36

 

 

 

 

 

 

 

 

 

 

Уровень безработицы

Х37

 

 

 

 

 

 

 

 

 

0,7206

Средняя заработная плата в месяц

в долларах ППС

Х38

0,6692

 

 

 

 

 

 

 

 

 

Площадь стран

Х39

 

0,6407

 

 

 

 

 

 

 

 

Среднегодовая температура по странам

Х40

 

 

 

-0,6046

 

 

 

 

 

 

Уровень автомобилизации

Х41

0,7608

 

 

 

 

 

 

 

 

 

Расходы на здравоохранение в % от ВВП

Х42

 

 

-0,5780

 

 

 

 

 

 

 

Обеспеченность врачами на 1000 человек населения

Х43

0,7590

 

 

 

 

 

 

 

 

 

Обеспеченность больничными койками на 1000 человек населения

Х44

 

 

 

0,5819

 

 

 

 

 

 

Потребление алкоголя на душу населения в год

Х45

0,5695

 

 

0,5397

 

 

 

 

 

 

Распространение ожирения среди взрослого населения

Х46

 

 

-0,6961

 

0,5014

 

 

 

 

 

Употребление табака, в процентах к численности населения

Х47

 

 

 

 

0,5006

 

 

 

 

 

Расходы на образование в % от ВВП

Х48

 

 

-0,6368

 

0,6916

 

 

 

 

 

Население ниже уровня бедности, %

Х49

-0,5787

 

 

 

 

 

 

 

 

 

Индекс Джини

Х50

 

 

 

 

 

 

 

 

 

0,6396

Потребление энергии на душу населения в % к среднему мировому уровню

Х51

0,5920

 

 

 

 

 

 

 

 

 

Мобильные телефоны на 100 чел населения

Х52

 

 

 

 

 

 

 

 

 

 

Пользователи интернета на 100 чел населения

Х53

0,8882

 

 

 

 

 

 

 

 

 

Военные расходы в % от ВВП

Х54

 

 

 

 

 

 

 

 

0,7484

 

Индекс политической стабильности Всемирного банка

Х55

0,6113

 

 

 

 

 

 

 

 

 

Энергетическая обеспеченность рациона (ккал/суточная норма)

Х56

0,7190

 

 

 

 

 

 

 

 

 

Потребление мяса – кг/ чел/год

Х57

0,7449

 

 

 

 

 

 

 

 

 

Индекс научного цитирования Nature

Х58

 

0,8679

 

 

 

 

 

 

 

 

Индекс демократии The Economist

Х59

0,5906

 

 

 

 

 

 

 

 

 

Индекс счастья Oxford – Gallup

Х60

0,6328

 

 

 

 

 

 

 

 

 

Положительную нагрузку по второму фактору также имеет индекс научного цитирования Nature (Х58), который коррелирует с размером экономики стран и с численностью их населения: лидерами рейтинга Nature с большим отрывом от других стран являются Китай и США. Второй фактор можно интерпретировать как «размер страны». В таблице он назван размеры экономики, населения и территории.

Первые два фактора объясняют 38,56% суммарной дисперсии используемых в данном исследовании данных и проявляют статистическую связь с 34 из 60 показателей. Таким образом, можно предположить, что основу дифференцирующих страны признаков в будущей типологии составят уровни развития и размеры подлежащих классификации объектов.

Третий фактор объясняет 6,911% полной дисперсии. Все показатели, связанные с этим фактором, имеют по нему отрицательную нагрузку. Это государственные доходы (Х12) и расходы (Х13), относительная сила валюты (Х15). Как уже было сказано в первых двух статьях, сильная валюта обычно в экономически развитых государствах, которые эффективно участвуют в мировой торговле. В странах, чьи деньги не пользуются спросом на мировом валютном рынке, валюта слабее, в некоторых из них центральные банки специально ослабляют ее, чтобы стимулировать экспорт. Отрицательную нагрузку по третьему фактору имеют также расходы на здравоохранение (Х42) и образование (Х48), которые как правило, также ниже в менее развитых странах. Исключительное значение величины расходов на образование в развитии экономики отмечают М.Г.Колосницына [13], Е.Я.Арапова [14] и другие авторы. Так что недостаток расходов на образование в ряде стран является серьезной проблемой. В то же время в странах с пониженными государственными расходами, менее распространено ожирение населения – отмечается отрицательная нагрузка по показателю Х46. Исходя из того, что основу третьего фактора составляют недостаток государственных расходов и слабость валюты, в таблице этот фактор назван экономическая недостаточность государства.

Четвертый фактор объясняет 5,437% полной дисперсии. Положительную нагрузку по нему имеет общий коэффициент смертности (Х27), который связан как с недостаточностью развития медицины в слаборазвитых странах, так и со старением населения в развитых. Также положительная нагрузка здесь отмечается по обеспеченности больничными койками (Х44) и потреблением алкоголя (Х45). И то, и другое свойственно развитым странам. Отрицательная нагрузка наблюдается по показателю температуры по странам (Х40). Как уже было сказано в предыдущей статье, отрицательная корреляция географического идентификатора – средней температуры с показателями уровня ВВП на душу населения показывает, что страны, находящиеся дальше от экватора, как правило более экономически развиты. Таким образом, четвертый фактор может рассматриваться как дополнительный к первому в части характеристик уровня социально-экономического развития, развития медицины и демографии. В таблице он назван медицина и смертность.

На пятый фактор приходится 4,522% полной дисперсии исследуемых данных. Отрицательную нагрузку по нему имеют годовой прирост населения (Х23) и коэффициент миграционного прироста (Х31). Положительную нагрузку проявляют «вредные привычки» – распространение ожирения (Х46), употребление табака (Х47). Пятый фактор интерпретируется как прирост населения и особенности образа жизни.

Шестой фактор предопределяет 4,27% полной дисперсии данных. Он имеет положительную нагрузку по доле сферы услуг в ВВП (Х18), отрицательную нагрузку по общему объему инвестиции (Х10), по валовым национальным сбережениям (Х11), доле промышленности в ВВП (Х17). Отметим, что государственные инвестиции имеют значение для обеспечения устойчивого развития [15]. Исходя из перечисленных факторных нагрузок данный фактор назван структура экономики и инвестиции.

На седьмой фактор приходится 3,644% полной дисперсии. Высокую отрицательную нагрузку по этому фактору демонстрируют дефлятор ВВП (Х7) и годовая инфляции (Х8). В таблице он назван инфляция.

Восьмой фактор предопределяет 3,467% полной дисперсии всех показателей. Положительную нагрузку по этому фактору имеют годовой прирост ВВП (Х2), прирост ВВП за 5 лет (Х3) и плотность населения (Х21), поэтому в таблице он обозначен, как экономический рост и плотность населения.

Девятый фактор предопределяет 3,285% полной дисперсии и положительную нагрузку по нему имеет показатель доли военных расходов в ВВП (Х54). Как было сказано в предыдущей статье, корреляционный анализ показывает, что уровень военных расходов не связан с экономическими, демографическими и социальными показателями, а также с уровнем демократии, а диктуется в основном геополитическими обстоятельствами. Данный фактор в таблице назван милитаризация.

Процент полной дисперсии, определяемой десятым фактором, составляет 2,935%. Положительную нагрузку по этому фактору имеют уровень безработицы (Х37) и индекс Джини (Х50). Поэтому фактор обозначен безработица и социальное неравенство.

Заключение

Таким образом, посредством факторного анализа была произведена генерализация и разделение на группы всей совокупности показателей, которые в 1 и 2 частях исследования были предназначены для разработки поисковой типологии стран мира. Были предложены следующие наименования 10 факторов (групп взаимосвязанных показателей), которые в дальнейшем могут быть полезны для различных исследований и экспертных работ в области страноведения: уровень социально-экономического развития, размеры экономики, населения и территории, экономическая слабость государства, медицина и смертность населения, рост населения и особенности образа жизни, структура экономики и инвестиции, инфляция, экономический рост и плотность населения, милитаризация, безработица и социальное неравенство. Одним из результатов произведенного факторного анализа является углубление понимания причин и механизмов социально-экономической дифференциации стран мира. В следующей статье серии будет представлен кластерный анализ и типология стран мира по 60 экономическим, демографическим и социальным показателям.

[1] Факторный анализ: что это такое и как его проводить // Practicum.Yandex.ru. URL: https://practicum.yandex.ru/blog/chto-takoe-faktornyj-analiz-vidy-i-metody (дата обращения: 01.08.2025).