Экономическое моделирование стоимости квартир в Московской области
Министерство образования и науки Российской Федерации
Филиал государственного образовательного учреждения высшего профессионального образования
ВСЕРОССИЙСКОГО ЗАОЧНОГО
ФИНАНСОВО – ЭКОНОМИЧЕСКОГО ИНСТИТУТА
в г. Брянске
КОНТРОЛЬНАЯ РАБОТА
по дисциплине
ЭКОНОМЕТРИКА
2-е высшее образование
ВЫПОЛНИЛ(А) |
|
СТУДЕНТ(КА) |
|
СПЕЦИАЛЬНОСТЬ |
|
№ ЗАЧ. КНИЖКИ |
|
ПРЕПОДАВАТЕЛЬ |
Брянск — 2011
ЗАДАЧА 1
Эконометрическое
моделирование стоимости
Таблица 1
№ варианта |
Исследуемые показатели |
Номера наблюдений |
1 |
Y, X1, X3, X5 |
1-40 |
Задание
- Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
- Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
- Рассчитайте параметры линейной парной регрессии для всех факторов Х.
- Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.
- Осуществите прогнозирование для лучшей модели среднего значения показателя Y при уровне значимости a=0,1, если прогнозное значение фактора X составит 80 % от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.
- Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счёт значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.
- Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, b- и D-коэффициентов.
Таблица 2
Наименования показателей
Обозначение |
Наименование показателя |
Единица измерения |
Y |
цена квартиры |
тыс. долл. |
X1 |
город области |
1 — Подольск 0 — Люберцы |
X3 |
общая площадь квартиры |
кв. м |
X5 |
этаж квартиры |
Таблица 3
Исходные данные для
эконометрического
№ квартиры |
Y |
X1 |
X3 |
X5 |
|
1 |
115 |
0 |
70,4 |
9 |
2 |
85 |
1 |
82,8 |
5 |
3 |
69 |
1 |
64,5 |
6 |
4 |
57 |
1 |
55,1 |
1 |
5 |
184,6 |
0 |
83,9 |
1 |
6 |
56 |
1 |
32,2 |
2 |
7 |
85 |
0 |
65 |
12 |
8 |
265 |
0 |
169,5 |
10 |
9 |
60,65 |
1 |
74 |
11 |
10 |
130 |
0 |
87 |
6 |
11 |
46 |
1 |
44 |
2 |
12 |
115 |
0 |
60 |
2 |
13 |
70,96 |
0 |
65,7 |
5 |
14 |
39,5 |
1 |
42 |
7 |
15 |
78,9 |
0 |
49,3 |
14 |
16 |
60 |
1 |
64,5 |
11 |
17 |
100 |
1 |
93,8 |
1 |
18 |
51 |
1 |
64 |
6 |
19 |
157 |
0 |
98 |
2 |
20 |
123,5 |
1 |
107,5 |
12 |
21 |
55,2 |
0 |
48 |
9 |
22 |
95,5 |
1 |
80 |
6 |
23 |
57,6 |
0 |
63,9 |
5 |
24 |
64,5 |
1 |
58,1 |
10 |
25 |
92 |
1 |
83 |
9 |
26 |
100 |
1 |
73,4 |
2 |
27 |
81 |
0 |
45,5 |
3 |
28 |
65 |
1 |
32 |
5 |
29 |
110 |
0 |
65,2 |
10 |
30 |
42,1 |
1 |
40,3 |
13 |
31 |
135 |
0 |
72 |
12 |
32 |
39,6 |
1 |
36 |
5 |
33 |
57 |
1 |
61,6 |
8 |
34 |
80 |
0 |
35,5 |
4 |
35 |
61 |
1 |
58,1 |
10 |
36 |
69,6 |
1 |
83 |
4 |
37 |
250 |
1 |
152 |
15 |
38 |
64,5 |
1 |
64,5 |
12 |
39 |
125 |
0 |
54 |
8 |
40 |
152,3 |
0 |
89 |
7 |
Решение. Для решения задачи используется табличный процессор EXCEL.
- С помощью надстройки «Анализ данных… Корреляция» строим матрицу парных коэффициентов корреляции между всеми исследуемыми переменными. Для этого необходимо перейти на рабочий лист, содержащий исходные данные, и далее выбрать пункт меню «Сервис» ® «Анализ данных…» ® «Корреляция».
Таблица 4
Матрица парных коэффициентов корреляции
Фактор |
Значение парного коэффициента корреляции |
Значение коэффициента детерминации |
Значимость Fнабл |
|
Х1 |
-0,4033 |
0,1627 |
7,3828 |
Х3 |
+0,8456 |
0,7150 |
95,3132 |
Х5 |
+0,1464 |
0,0214 |
0,8321 |
Значимость коэффициента детерминации R-квадрат устанавливается с помощью критерия Фишера в таблице Дисперсионный анализ листа Регрессия. Так как наблюдаемое значение (критическое получим с помощью встроенной функции FРАСПОБР(0,05;2;37) Fкр = 3,2519), то R-квадрат значим только для факторов Х1 и Х3 и не значим для Х5.
Оценим, существует ли между самими факторами связь:
Фактор |
Х1 |
Х3 |
Х5 |
Х1 |
1 |
-0,0823 |
0,010902 |
Х3 |
-0,0823 |
1 |
0,22886 |
Х5 |
0,010902 |
0,22886 |
1 |
Так как коэффициент корреляции между фактором Х3 и Y равен 0,8456, то зависимость, согласно Шкале Чеддока высокая, а связь между Х3 и Х5 – прямая слабая.
2. Построим корреляционное поле зависимости Y от наиболее значимого фактора – Х3. Поле корреляции результативного признака Y и фактора X3 строится с помощью «Мастера диаграмм» (меню «Вставка» ® «Диаграмма…» ® «Точечная»)
Рис. 1. Корреляционное поле зависимости цены квартиры от общей площади
3. Для построения парных уравнений регрессии используется надстройка «Анализ данных… Регрессия» (меню «Сервис» ® «Анализ данных…» ® «Регрессия»)
Последовательно проводим регрессионный анализ для каждой парной модели.
Уравнение регрессии адекватно отражает исследуемый экономический процесс. Построим уравнения зависимости от остальных факторов: и
4. Оценим качество каждой парной модели.
- Оценим каждую модель: так как максимальные значения коэффициента детерминации и F-критерия Фишера и минимальное значение коэффициента аппроксимации приходятся на фактор Х3, то лучшая парная линейная модель
|
Фактор в модели |
Значение коэффициента детерминации |
Значение коэффициента аппроксимации |
Значимость Fнабл |
|
Х1 |
0,1627 |
0,3690 |
7,3828 |
Х3 |
0,7150 |
0,2787 |
95,3132 |
Х5 |
0,0214 |
0,4578 |
0,8321 |
Значимость коэффициента регрессии оценивается с помощью -статистики. Наблюдаемое значение статистики tнабл=-4,568. Критическое значение при α=0,05 и числе степеней свободы v=39 с помощью встроенной функции tкр = 2,024.
Так как |tнабл | = | -1,112 | < tкр =2,024, то коэффициент незначим.
Значимость коэффициента регрессии оценивается с помощью -статистики. Наблюдаемое значение статистики tнабл =9,7628. Критическое значение tкр =2,101.
Так как |tнабл | = | 9,7628 | ≥ tкр =2,101, то коэффициент значим.
5. Прогноз при 80% из максимального значения Х3=169,5, т.е. 169,5∙0,8=135,6 кв.м тыс.долл.
РРис. 2. Фактические и модельные значения, точка прогноза
Лучшая модель регрессии всегда соответствует наиболее тесно связанному с результативным признаком Y фактору. Поэтому на поле корреляции, построенное при выполнении пункта 2 , дополнительно поместим линию регрессии вместе с уравнение регрессии и коэффициентом детерминации R2 (меню «Диаграмма» ® «Добавить линию тренда…» ® «Линейная»). Точечный и интервальный прогнозы наносим на график вручную.
6. Используя пошаговую множественную регрессию (метод исключения или метод включения), построим модель формирования цены квартиры за счет значимых факторов:
- все три фактора Х1, Х3 и Х5: коэффициент детерминации R2=0,8285; Fнабл=57,9856;
- два фактора Х1 и Х3: коэффициент детерминации R2=0,8271; Fнабл= 88,4887;
- два фактора Х3 и Х5: коэффициент детерминации R2=0,7173; Fнабл= 46,9406;
- два фактора Х1 и Х5: коэффициент детерминации R2=0,1854; Fнабл= 4,211;
Таким образом, окончательно выбираем два фактора Х1 и Х3 и модель так как по показателю Fнабл= 88,4887 – это максимальное значение, а трёхфакторную модель не учитываем, хотя у неё максимальный показатель коэффициента детерминации по сравнению с двухфакторной (R2=0,8285>0,8271), но между факторами Х3 и Х5 существует незначительная, но все-таки корреляционная зависимость R=0,22886, поэтому фактор Х5 исключаем.
Окончательная модель зависимости стоимости квартир в Московской области от города области и общей площади
где Y – цена квартиры; Х1 – город области (1 – Подольск; 0 – Люберцы) ; а0 – параметр функции, характеризующий влияние основных факторов на цену квартиры; а1 – параметр функции, характеризующий влияние города на цену квартиры; а2 – параметр функции, характеризующий влияние общей площади на цену квартиры.
7. Качество двухфакторной модели выше, чем однофакторной, так как выше коэффициент детерминации и F-критерий Фишера. Частные коэффициенты эластичности для линейной регрессии рассчитывается по формуле: . Так как коэффициент эластичности переменной город области =-0,212, то в среднем цена квартиры изменяется на -0,212% процентов с изменением на 1% фактора Х1 город области при фиксированном значении фактора общая площадь. Так как коэффициент эластичности переменной общая площадь =1,103, то в среднем зависимая стоимость квартиры изменяется на 1,103 процентов с изменением на 1% фактора Х3 общая площадь при фиксированном значении другого фактора город области. Так как = 0,212< =1,103, то фактор Х3 общая площадь оказывает наибольшее влияние на зависимую переменную.
При изменении города области цена квартиры изменяется на 34,558 тысдолл. в сторону уменьшения, а при изменении общей площади на 1 кв.м - цена возрастает на 1,4921 тыс.долл., т.е. можно дать приблизительную цену 1 кв.метра общей площади – 1492 доллара.
Описательная статистика
Y |
X1 |
X3 | |
Среднее |
93,65025 |
0,575 |
69,2075 |
Стандартная ошибка |
8,141631 |
0,079158 |
4,462722 |
Медиана |
79,45 |
1 |
64,5 |
Мода |
115 |
1 |
64,5 |
Стандартное отклонение |
51,4922 |
0,500641 |
28,22473 |
Дисперсия выборки |
2651,446 |
0,250641 |
796,6356 |
Эксцесс |
3,611985 |
-2,0034 |
4,320818 |
Асимметричность |
1,805953 |
-0,31539 |
1,701832 |
Интервал |
225,5 |
1 |
137,5 |
Минимум |
39,5 |
0 |
32 |
Максимум |
265 |
1 |
169,5 |
Сумма |
3746,01 |
23 |
2768,3 |
Счет |
40 |
40 |
40 |
Уровень надежности (95,0%) |
16,46799 |
0,160112 |
9,026699 |
Выводы: Таким образом, мы получили, что результативный признак для 40 наблюдений – стоимость квартиры в Московской области – в основном зависит от двух факторов: общей площади квартиры Х1, и города области – Х3, причем вариация цены квартиры на 82,71% зависит от вариации этих двух факторов. Уравнение регрессии следует признать адекватным, модель считается значимой.
К задаче прилагаются расчеты (см. приложение 1)
ЗАДАЧА 2
Исследовать динамику экономического показателя на основе анализа одномерного временного ряда
В течение девяти последовательных недель фиксировался спрос Y(t) (млн. руб.) на кредитные ресурсы финансовой компании. Временной ряд Y(t) этого показателя приведен в таблице:
t |
yt |
|
1 |
10 |
2 |
14 |
3 |
21 |
4 |
24 |
5 |
33 |
6 |
41 |
7 |
44 |
8 |
47 |
9 |
49 |
Требуется:
- Проверить наличие аномальных наблюдений.
- Построить линейную модель , параметры которой оценить методом наименьших квадратов ( ) — расчетные, смоделированные значения временного ряда).
- Оценить адекватность модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения.
- Оценить точность модели на основе использования средней относительной ошибки аппроксимации.
- Осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности р=70 %).
- Фактические значения показателя, результаты моделирования и прогнозирования представить графически.
Основные промежуточные результаты вычислений привести в таблицах (при использовании компьютера представить соответствующие листинги с комментариями).
Решение. Для решения задачи используется табличный процессор EXCEL.
1. Для выявления аномальных наблюдений используется метод Ирвина. Для всех уровней временного ряда, начиная со второго, рассчитывается l-статистика Ирвина
где — стандартное отклонение уровней ряда.
Стандартное отклонение было определено с помощью встроенной функции «СТАНДОТКЛОН»: Sy»14,7064 млн. руб. Критическое значение критерия Ирвина для уровня значимости a=0,05 и длины временного ряда n=9 составляет lкр=1,5. Видно, что ни одно из значений lt не превышает lкр, что свидетельствует об отсутствии аномальных наблюдений.
- Линейную трендовую модель строим с помощью надстройки «Анализ данных… Регрессия» (меню «Сервис»)
Рис. 3. – Исходные данные и уравнение прямой линии регрессии (расчетные, смоделированные значения временного ряда)
- Значимость коэффициента регрессии оценивается с помощью -статистики. Наблюдаемое значение статистики tнабл=2,690. Критическое значение при α=0,05 и числе степеней свободы v=7 с помощью встроенной функции tкр = 2,365.
Так как |tнабл | = | 2,690 | ≥ tкр =2,365, то коэффициент значим.
Значимость коэффициента регрессии оценивается с помощью -статистики. Наблюдаемое значение статистики tнабл =16,224. Критическое значение tкр =2,365.
Так как |tнабл | = | 16,224 | ≥ tкр =2,365, то коэффициент значим.
Общую оценку уравнения регрессии проведем с помощью F-критерия Фишера:
Fкр =F0,05; 1 ; 7=5,591
Fнабл =263,21
Так как |Fнабл | = | 263,21 | ≥ Fкр =5,591, то уравнения регрессии значимо.
4. Оценим точность модели. Средняя относительная ошибка аппроксимации 0,0565 (5,65%), т.е. менее 0,15 (15,0%), следовательно, уравнение регрессии адекватно отражает изучаемый экономический процесс.
Рис. 4. Прогноз на следующие две недели
5. Прогноз:
- 10 неделя млн. руб.; интервал прогноза по формуле:
.
По условию задачи .
Вычислим среднеквадратическое отклонение с помощью встроенной функции СТАНДОТКЛОН 14,7064 и значение t=1,1192 с помощью функции СТЬЮДРАСПОБР.
- 11 неделя млн. руб.; интервал прогноза 57,7581 – 68,7307 млн.руб.
К задаче прилагаются расчеты (см. приложение 2)