Эконометрическая модель: численность населения стран Европы и факторы, влияющие на неё
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТМЕЖДУНАРОДНЫХ ОТНОШЕНИЙ (УНИВЕРСИТЕТ)
МИД РОССИИ
Кафедра математических методов и информационных технологий
Информационно-аналитическая справка по теме:
«Эконометрическая модель: численность населения стран Европы и факторы, влияющие на неё»
Студентов
3 курса 11 группы
факультета МЭО
Дубининой А.В.
Демченко К. Д.
Научный руководитель -
старший преподаватель
Ладонычева Г.Ю.
Москва – 2011
Оглавление
1. Постановка задачи 3
1.1. Определение целей и условий 3
1.2. Сбор данных, оформление данных в таблицу. 3
2. Анализ данных 5
2.1 Определение вида и степени корреляционной зависимости между факторами и Y. 5
2.2 Анализ мультиколлинеарности. 7
3. Построение и анализ модели регрессии 8
3.1 Первоначальная модель 8
3.2 Скорректированная модель 9
3.3 Проверка на гетероскедастичность 10
Заключение 12
Список использованной литературы 13
Постановка задачи
Определение целей и условий
Историческое
развитие общества неразрывно связано
с изменением динамики численности
и воспроизводства населения. На
сегодняшний момент в мире проживает
более 7 млрд. человек. Однако не во всех
странах процесс
Суть
современного демографического кризиса
заключается не только в резком ухудшении
развития народонаселения, что выражается
в резком уменьшении темпов роста
численности населения в
Наблюдаемая
в развитых странах мира тенденция
к резкому падению рождаемости
значительно ниже уровня, обеспечивающего
простое воспроизводств населения,
ведет к значительному
Итак, изменение показателя общей численности населения происходит под воздействием целого ряда прямых и косвенных факторов. В данной работе мы бы хотели рассмотреть влияние показателей рождаемости, смертности, численности пожилого населения и численности мигрантов в разных странах мира на общую численность населения этих стран.
На основе представленных данных мы проведем поэтапный анализ данных.
1.2. Сбор данных, оформление данных в таблицу.
Для анализа мы выбрали страны Европы, поскольку там наиболее ярко наблюдается демографический кризис.
Построенная нами модель содержит следующие объясняющие переменные:
Birth(X1) – численность рожденных за 2010г. (чел.)
Death(X2) – численность умерших за 2010г. (чел.)
More than 65(X3) – численность населения старше 65 за 2010г. (чел.)
Immig(X4) – численность иммигрантов в стране за 2010г. (чел.)
Объясняемый фактор – Population(Y) – общая численность населения за 2010г. (чел.)
Все данные представлены в Таблице 1.
Таблица 1
country |
Population(Y) |
Birth(X1) |
Death(X2) |
more than 65(X3) |
Immig(X4) |
Belgium |
10839905 |
127000 |
104509 |
1860159 |
164152 |
Bulgaria |
7563710 |
75513 |
108068 |
1325891 |
1236 |
Czech Republic |
10506813 |
117153 |
107421 |
1598883 |
108267 |
Denmark |
5534738 |
63411 |
54872 |
902859 |
57357 |
Germany |
81802257 |
677947 |
854544 |
16901742 |
682146 |
Estonia |
1340127 |
15825 |
16081 |
228753 |
3671 |
Ireland |
4467854 |
73724 |
28898 |
505880 |
63927 |
Greece |
11305118 |
109982 |
108316 |
2141786 |
538411 |
Spain |
45989016 |
485562 |
384933 |
7745567 |
726009 |
France |
64716213 |
829000 |
548689 |
10758697 |
216937 |
Italy |
60340328 |
561944 |
538116 |
12206470 |
534712 |
Cyprus |
803147 |
9989 |
591663 |
104863 |
14095 |
Latvia |
2248374 |
19219 |
5182 |
390209 |
3465 |
Lithuania |
3329039 |
35626 |
29897 |
534401 |
9297 |
Luxembourg |
502066 |
5874 |
42032 |
70046 |
17758 |
Hungary |
10014324 |
90335 |
3655 |
1663483 |
37652 |
Malta |
414372 |
4008 |
130414 |
61307 |
9031 |
Netherlands |
16574989 |
184397 |
3221 |
2538328 |
143516 |
Austria |
8375290 |
78742 |
134235 |
1475921 |
110074 |
Poland |
38167329 |
413300 |
77381 |
5161470 |
47880 |
Portugal |
10637713 |
101320 |
384940 |
1901153 |
29718 |
Romania |
21462186 |
212199 |
104434 |
3206408 |
25423 |
Slovenia |
2046976 |
22343 |
257213 |
338265 |
30693 |
Slovakia |
5424925 |
60410 |
18750 |
665134 |
17820 |
Finland |
5351427 |
60980 |
52913 |
910441 |
29114 |
Sweden |
9340682 |
115641 |
49883 |
1690777 |
101171 |
United Kingdom |
62026962 |
807272 |
90080 |
10205108 |
590242 |
Turkey |
72561312 |
1279000 |
19060 |
5083414 |
469825 |
Iceland |
317630 |
4907 |
106156 |
38069 |
10288 |
Norway |
4858199 |
61442 |
229 |
722673 |
58123 |
Switzerland |
7785806 |
80290 |
41449 |
1308691 |
184297 |
Анализ данных
2.1 Определение вида и степени корреляционной зависимости между факторами и Y.
Для определения корреляционной зависимости построим корреляционную матрицу в Evies, где
POP – общая численность населения
OLD – численность населения старше 65
IMM – численность иммигрантов
DEATH – численность умерших
BIRTH – численность рожденных
Таблица 2
POP |
OLD |
IMM |
DEATH |
BIRTH | |
POP |
1.000000 |
0.935869 |
0.794054 |
0.544067 |
0.945812 |
OLD |
0.935869 |
1.000000 |
0.794261 |
0.691470 |
0.777276 |
IMM |
0.794054 |
0.794261 |
1.000000 |
0.483579 |
0.710134 |
DEATH |
0.544067 |
0.691470 |
0.483579 |
1.000000 |
0.350433 |
BIRTH |
0.945812 |
0.777276 |
0.710134 |
0.350433 |
1.000000 |
Для анализа
представленных данных
0.1÷0.3 Слабая зависимость
0.3÷0.5 Умеренная зависимость
0.5÷0.7 Заметная зависимость
0.7÷0.9 Высокая зависимость
0.9÷1.0 Весьма высокая зависимость
Сравнивая показатели,
можно сделать вывод о том,
что между общей численностью
и рождаемостью, а также между
численностью населения старше 65 лет
и общей численностью наблюдается
очень тесная связь; между общей
численностью и численностью иммигрантов
- высокая; а между общей численностью
населения и смертностью
Далее изображаем корреляционные поля с целью определения зависимости между объясняемой переменной и факторами. На основании анализа корреляционного поля легко решить вопрос о наличии или отсутствии связи, проследить характер связи (линейная, нелинейная, функциональная или стохастическая) и ее тенденцию (положительная, отрицательная).
Для OLD и POP:
Очевидно, что присутствует положительная линейная зависимость между POP и OLD.
Для BIRTH и POP:
Такая же ситуация наблюдается и при анализе BIRTH и POP.
Для DEATH и POP:
Из графика нельзя точно определить, существует ли зависимость, поскольку нет четко выраженного тренда зависимости переменных.
Для IMM и POP:
2.2 Анализ мультиколлинеарности.
Мультиколлинеарность – наличие функциональной зависимости между факторами.
Для того чтобы проверить факторы на присутствие мультиколлинеарности, откроем корреляционную матрицу для факторов. В данной таблице x – old, y – imm, z – death, a – birth. Рассчитаем частные коэффициенты корреляции по формуле:
Таблица 3.
x |
y |
z |
a | |
x |
1 |
0.794261 |
0.69147 |
0.777276 |
y |
0.794261 |
1 |
0.483579 |
0.710134 |
z |
0.69147 |
0.483579 |
1 |
0.350433 |
a |
0.777276 |
0.710134 |
0.350433 |
1 |
В результате, получаем:
Таблица 4.
rxy/z |
rxy/a |
rxz/y |
rxz/a |
rxa/y |
rxa/z |
ryz/x |
ryz/a |
rya/x |
rya/z |
rza/x |
rza/y |
|
0.727 |
0.547 |
0.578 |
0.711 |
0.498 |
0.791 |
-0.150 |
0.268 |
0.243 |
0.660 |
-0.411 |
0.011 |
Существует показатель близкий
к 0,8, следовательно, существует мультиколлинеарность.
- Построение и анализ модели регрессии
3.1 Первоначальная модель
Используя метод наименьших квадратов , построим начальную регрессионную модель для определения степени влияния факторов на Y. Используя данные таблицы 1 в Eviews, получаем
Dependent Variable: POP | ||||
Method: Least Squares | ||||
Sample: 1 31 | ||||
Included observations: 31 | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
OLD |
2.955444 |
0.174812 |
16.90638 |
0.0000 |
IMM |
-0.140726 |
2.200494 |
-0.063952 |
0.9495 |
DEATH |
0.025778 |
2.079223 |
0.012398 |
0.9902 |
BIRTH |
43.55497 |
1.668102 |
26.11049 |
0.0000 |
C |
426035.8 |
382715.2 |
1.113193 |
0.2758 |
R-squared |
0.996332 |
Mean dependent var |
18924156 | |
Adjusted R-squared |
0.995768 |
S.D. dependent var |
24384714 | |
S.E. of regression |
1586348. |
Akaike info criterion |
31.53846 | |
Sum squared resid |
6.54E+13 |
Schwarz criterion |
31.76975 | |
Log likelihood |
-483.8461 |
F-statistic |
1765.646 | |
Durbin-Watson stat |
2.175779 |
Prob(F-statistic) |
0.000000 | |
На основе полученных данных строим модель.
=426035.8+2.955OLD-0.141IMM+0.
Проверим на значимость коэффициенты модели. Для этого выдвигаем гипотезу Н0 о значимости коэффициента.
Для проверки гипотезы найдем t набл для каждого коэффициента по формуле:
(3), данные значения уже посчитаны в Eviews, колонка t-Statistic. Cравним полученные значения с tкрит при уровне значимости .
Если , то Н0 отвергается, и коэффициент значим.
Если , то Н0 принимается, и коэффициент не значим.
Получается, что не значим, значим, не значим, не значим, значим. Поскольку присутствуют незначимые коэффициенты, стоит рассмотреть вариант удаления факторов, при которых существуют незначимые коэффициенты, из модели.
Продолжая оценивать общее качество модели, используем критерий Фишера.
Выдвигаем
гипотезу
Вычисляем Fнабл: (5). Данный показатель равен 1765.646, сравниваем его с Fкрит.
Так как Fнабл больше Fкр, принимаем гипотезу Н1, согласно которой регрессия в целом значима.
3.2 Скорректированная модель
Однако, поскольку присутствует мультиколлинеарность необходимо скорректировать модель. Из таблицы 4 найдем факторы, которые имеют функциональную зависимость – Old и Birth. Исключив одну из переменных, получим модель без мультиколлинеарности.
Dependent Variable: POP | ||||
Method: Least Squares | ||||
Sample: 1 31 | ||||
Included observations: 31 | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
IMM |
16.49768 |
6.688563 |
2.466550 |
0.0203 |
BIRTH |
60.55580 |
4.523010 |
13.38838 |
0.0000 |
DEATH |
23.23406 |
5.307073 |
4.377942 |
0.0002 |
C |
-405750.2 |
1289826. |
-0.314577 |
0.7555 |
R-squared |
0.956010 |
Mean dependent var |
18924156 | |
Adjusted R-squared |
0.951122 |
S.D. dependent var |
24384714 | |
S.E. of regression |
5391040. |
Akaike info criterion |
33.95829 | |
Sum squared resid |
7.85E+14 |
Schwarz criterion |
34.14332 | |
Log likelihood |
-522.3535 |
F-statistic |
195.5927 | |
Durbin-Watson stat |
2.239274 |
Prob(F-statistic) |
0.000000 | |
Полученная модель выглядит так:
Проверим статистическую значимость коэффициентов нашей модели.
Выдвигает гипотезу (2) о значимости коэффициента.
Для проверки гипотезы найдем t набл для каждого коэффициента по формуле (3), данные значения уже посчитаны в Eviews, колонка t-Statistic. Сравним полученные значения с tкрит при уровне значимости .
Если , то Н0 отвергается, и коэффициент значим.
Если , то Н0 принимается, и коэффициент не значим.
При сравнении получаем, что коэффициенты значимы, а не значим.
Далее выдвигаем гипотезу (4) о значимости регрессии в целом. Использовав формулу (5), найдем значение Fнабл = 195,59.
Так как FнаблFкрит, гипотеза Н0 отвергается, что означает, что регрессия в целом значима и модель адекватна.
Для того чтобы
оценить степень влияния
3.3 Проверка на гетероскедастичность
Наличие гетероскедастичности означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению.
Выдвигаем гипотезу
о постоянстве дисперсии
Проверим в Eviews:
White Heteroskedasticity Test: | |||
F-statistic |
90.15694 |
Probability |
0.000000 |
Obs*R-squared |
30.21794 |
Probability |
0.000403 |
Очевидно, что в модели присутствует гетероскедастичность, поскольку probability меньше уровня значимости.
Проведем корректировку модели на гетероскедастичность. Eviews это делает автоматически:
Dependent Variable: POP | ||||
Method: Least Squares | ||||
Sample: 1 31 | ||||
Included observations: 31 | ||||
White Heteroskedasticity-Consistent Standard Errors & Covariance | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
IMM |
16.49768 |
8.294699 |
1.988942 |
0.0569 |
BIRTH |
60.55580 |
7.995914 |
7.573344 |
0.0000 |
DEATH |
23.23406 |
9.783857 |
2.374734 |
0.0249 |
C |
-405750.2 |
962916.5 |
-0.421376 |
0.6768 |
R-squared |
0.956010 |
Mean dependent var |
18924156 | |
Adjusted R-squared |
0.951122 |
S.D. dependent var |
24384714 | |
S.E. of regression |
5391040. |
Akaike info criterion |
33.95829 | |
Sum squared resid |
7.85E+14 |
Schwarz criterion |
34.14332 | |
Log likelihood |
-522.3535 |
F-statistic |
195.5927 | |
Durbin-Watson stat |
2.239274 |
Prob(F-statistic) |
0.000000 | |
К сожалению, даже корректировка существенно не поменяла коэффициенты модели, что означает, в ней все также присутствует гетероскедастичность.
Такая ситуация возможна из-за того, что были выбраны страны с очень различными показателями рождаемости, смертности и миграции.
Заключение
В данной работе был проведен анализ влияния показателей рождаемости, смертности и миграции на общую численность населения стран Европы.
На базе реальных статистических данных была построена эконометрическая модель, позволившая оценить влияние данных факторов на объясняемую переменную.
Модель была проверена и скорректирована на мультиколлинеарность и гетероскедостичность. Были проверены коэффициенты данной регрессии и качество регрессии в целом.
Необходимо отметить, что все факторы, включенные в модель, имеют значимое влияние на общую численность населения. С помощью коэффициента детерминации было выяснено, что вариация результативного признака на 95.6% объясняется включенными в модель факторами.
В целом регрессия оказалась значима, однако присутствующая в модели гетероскедастичность не позволяет адекватно оценивать качество модели.
Список использованной литературы
- Артамонов Н.В. Введение в эконометрику. – М:МЦНМО, 2011. – 204с.
- Мангус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. – М.: Дело, 2004. – 576с.
Интернет - источники
- Eurostat http://epp.eurostat.ec.europa.
eu - ru.wikipedia.org

- Эконометрические методы
- Эконометрические методы проведения экспертных исследований и анализа оценок экспертов
- Эконометрические методы расчета цены
- Эконометрические модели
- Эконометрические модели с лаговыми переменными
- Эконометрические уравнения
- Эконометрическое моделирование: основные понятия и особенности
- Эконометрика и эконометрическое моделирование
- Эконометрика как наука
- Эконометрика как наука
- Эконометрическая модель
- Эконометрическая модель
- Эконометрическая модель
- Эконометрическая модель