Эконометрическое моделирование линейного уравнения парной регрессии
Расчетно-графическая работа
по дисциплине Эконометрика
Эконометрическое моделирование
линейного уравнения парной регрессии
Содержание
- Таблица исходных данных. Поле корреляции 3
2. Расчет параметров a и b линейного уравнения парной регрессии при помощи МНК. 6
3. Оценка качества и экономическое обоснование модели линейного уравнения парной регрессии. 9
4. Расчет прогнозных значений исследуемой переменной 12
Введение
Целью данной работы является выявление зависимости среднедушевых расходов от средней заработной платы в регионе.
Задачи данной работы:
- создание исходной таблицы данных, построение поля корреляции;
- расчет параметров a и b линейного уравнения парной регрессии при помощи МНК;
- оценка качества и экономическое обоснование модели линейного уравнения парной регрессии;
- расчет прогнозных значений исследуемой переменной.
- Таблица исходных данных. Поле корреляции.
Существует связь между
Статистические данные приведены в таблице 1
Таблица 1 – Исходные данные
Регион |
Среднедушевые денежные расходы, р. у |
Среднедушевые денежные доходы, р. x. |
Брянская обл. |
2818,4 |
2465,4 |
Владимирская обл. |
2795 |
2467,5 |
Ивановская обл. |
2730 |
2415 |
Калужская обл. |
2762,5 |
2440,2 |
Костромская обл. |
2739,1 |
2422,4 |
Орловская обл. |
2735,2 |
2419,2 |
Рязанская обл. |
2752,1 |
2422,4 |
Смоленская обл. |
2748,2 |
2429,7 |
Тверская обл. |
2783,3 |
2458,1 |
Модели парной корреляции и регрессии отражают взаимосвязь двух факторов (переменных). Одна из переменных является независимым фактором, аргументом, вторая – зависимая переменная, функция.
За факторный
признак принимаем
Поле корреляции – это совокупность точек с координатами (хi, yi), отображенных на координатной плоскости. Для того, чтобы отобразить поле корреляции на диаграмме необходимо построить точечную диаграмму. Для этого:
Для зависимости среднедушевого денежного расхода от среднедушевого денежного дохода получена диаграмма (рисунок 1).
Рисунок
1- Зависимость среднедушевых
Расчет параметров a и b линейного уравнения парной регрессии при помощи МНК.
Имеется зависимость средней заработной платы от среднедушевых денежных расходов некоторых регионов России.
Для применения МНК необходимо построить систему вида:
Для этого необходимо определить значения сумм, используемые в системе, далее записать систему с найденными значениями сумм относительно неизвестных параметров a и b.
В MS Excel построим и заполним расчетную таблицу вида.
Таблица 2
i |
xi |
yi |
xi2 |
yi xi |
|
Брянская обл. |
2818,4 |
2465,4 |
||
… |
… |
… |
||
Тверская обл. |
2783,3 |
2458,1 |
||
Сумма |
Значения в столбцах xi2 и yi xi , а также строку Сумма (значения сумм по каждому из столбцов) необходимо рассчитать, вставляя формулы в соответствующие ячейки.
Для нахождения параметров а и b выделим две пустые ячейки и рассчитаем значения, воспользовавшись формулами:
Для того чтобы использовать формулы нужно прежде рассчитать значения средних, поэтому под строкой «Сумма» запишем строку «Среднее», и рассчитаем значения средних величин по каждому из столбцов.
Расчет параметров a и b линейного уравнения парной регрессии при помощи функций НАКЛОН и ОТРЕЗОК.
При применении функции НАКЛОН значение параметра b=1,3887.
При применении функции ОТРЕЗОК значение параметра а= -622,891.
Запишем уравнение:у=1,3887х-622,891
Для определения значений добавим в таблицу такой столбец. Для каждого хi рассчитаем в столбце значения, используя построенное уравнение регрессии, подставляя в него вместо х значения хi.
Аналогично рассчитаем значения . Добавим столбец ; для каждого значения хi рассчитаем в столбце значения, используя формулу (4).
В результате общая организация расчетов в Excel будет иметь вид:
Таблица 3
i |
у i |
х i |
ŷx |
ŷx2 |
y2 |
ε | |||
Брянская обл. |
2818,4 |
2465,4 |
2801,021 |
7845720 |
7943379 |
17,37878 | |||
Владимирская обл. |
2795 |
2467,5 |
2803,938 |
7862066 |
7812025 |
-8,93767 | |||
Ивановская обл. |
2730 |
2415 |
2731,026 |
7458505 |
7452900 |
-1,02642 | |||
Калужская обл. |
2762,5 |
2440,2 |
2766,024 |
7650888 |
7631406 |
-3,52382 | |||
Костромская обл. |
2739,1 |
2422,4 |
2741,303 |
7514745 |
7502669 |
-2,20344 | |||
Орловская обл. |
2735,2 |
2419,2 |
2736,859 |
7490399 |
7481319 |
-1,65932 | |||
Рязанская обл. |
2752,1 |
2422,4 |
2741,303 |
7514745 |
7574054 |
10,79656 | |||
Смоленская обл. |
2748,2 |
2429,7 |
2751,442 |
7570431 |
7552603 |
-3,24157 | |||
Тверская обл. |
2783,3 |
2458,1 |
2790,883 |
7789028 |
7746759 |
-7,58309 | |||
Среднее |
2762,644 |
2437,767 |
2762,644 |
7632947 |
7633013 |
0,0000 | |||
a= |
-622,891 | ||||||||
b= |
1,3887 | ||||||||
Экономический смысл уравнения: у=1,3887х-622,891.
-622,891–
свободный член уравнения,
1,3887–
коэффициент уравнения
Оценка качества и экономическое обоснование мо
дели линейного уравнения парной регрессии.
Результирующая информация для модели линейного уравнения регрессии и оценки его качества зависимости затрат на производство от выпуска продукции после применения инструмента "Регрессия".
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,958769 |
|||||||
R-квадрат |
0,919239 |
|||||||
Нормированный R-квадрат |
0,907701 |
|||||||
Стандартная ошибка |
9,161722 |
|||||||
Наблюдения |
9 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
1 |
6687,702 |
6687,702 |
79,67512 |
4,5E-05 |
|||
Остаток |
7 |
587,56 |
83,93715 |
|||||
Итого |
8 |
7275,262 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 90,0% |
Верхние 90,0% | |
Y-пересечение |
-622,891 |
379,2976 |
-1,64222 |
0,144547 |
-1519,79 |
274,0052 |
-1341,5 |
95,71805 |
Переменная X 1 |
1,388786 |
0,155587 |
8,926092 |
4,5E-05 |
1,02088 |
1,756691 |
1,094014 |
1,683558 |
Значения показателей оценки качества подбора уравнения в целом находятся в верхней части таблицы ВЫВОД ИТОГОВ и представлены в информации о регрессионной статистике и дисперсионном анализе. Коэффициент детерминации R2 представлен показателем "R-квадрат" (регрессионная статистика), линейный коэффициент корреляции R – "Множественный R" (регрессионная статистика), F-критерий Фишера – "F" (дисперсионный анализ).
Значения параметров находятся в нижней части таблицы. Строка Y-пересечение содержит информацию о значении параметра а (столбец "Коэффициенты"), далее по строке – значение стандартной ошибки ma (столбец "Стандартная ошибка"), расчетное значение t-критерия Стьюдента (представлено показателем t-статистика), два доверительных интервала (первый построен по уровню надежности α=90%, второй – по тому, который был указан в диалоговом окне Регрессия; если было выбрано значение α, по умолчанию равное 90%, то второй доверительный интервал построен также по уровню надежности α=95%). Аналогично представлена информация о коэффициенте регрессии – параметре b, которая расположена ниже строки Y-пересечение (строка "Среднедушевые денежные доходы, р. в месяц, Х"). Смотрим по этой строке: значение параметра b – столбец "Коэффициенты", и далее по строке представлены значения показателей существенности этого параметра – стандартная ошибка, t-критерий Стьюдента и два доверительных интервала.
Таким образом, для зависимости среднедушевых денежных расходов от среднедушевых денежных доходов можем записать модель (уравнение):
=1,3887х-622,891
Показатели оценки качества построенной модели:
1. Коэффициент детерминации R2 = 0,92. Следовательно 92 % дисперсии среднедушевых денежных расходов объяснены среднедушевыми денежными доходами. На долю прочих факторов приходится 8 % дисперсии расходов.
2. Коэффициент корреляции rху = 0,96. Значение очень близко к 1, связь между доходами и расходами очень тесная, близка к функциональной.
3. F-критерий Фишера F = 79,7. Показатель "Значимость F" (0,000424) меньше 0,1. Значит расчетное значение (79,7) больше табличного, связь между ден. расходами и доходами значима, а построенное уравнение статистически значимо.
Показатели существенности параметров:
1. Стандартная ошибка:
- для параметра а ma = 1031,78;
- для параметра b mb = 0,575.
2. t-критерий Стьюдента
- для параметра а ta = -4,53;
- для параметра b tb = 6,25.
3. Доверительный интервал для параметра b: bÎ [2,23;4,95] для вероятности 95%. И bÎ [2,50;4,69].-для 90%. b существенный параметр.
Расчет прогнозных значений исследуемой переменной.
В интервале изменения
факторной переменной произвольно
указываются три новых
Я записала три новых значения фактора: 2450р., 2460р., 2420р..
При этом вводив следующую формулу для ячеек в которых должны получиться значения (=(значение параметра а)+(значение параметра b)*(значение параметра х), т.е. получилась формула уравнения регрессии: y=a+b*x.
Получилось:
Таблица 4
Среднедушевые денежные доходы, р. x |
Среднедушевые денежные расходы, р. , y |
2450 |
2780,159 |
2460 |
2794,049 |
2420 |
2738,489 |
Заключение
В своей работе
я провела регрессионный анализ
зависимости среднедушевых
Получаем уравнение регрессии следующего вида:
y = 1,3887x -622,891+ ε,
Свободный член уравнения (а), характеризующий среднедушевые денежные расходы при нулевых среднедушевых денежных доходах равен -622,891.
Коэффициент уравнения регрессии (b), показывающий, на сколько увеличатся среднедушевые денежные расходы при увеличении среднедушевых денежных доходов на 1 р. равен 1,39. То есть, при увеличении среднедушевых денежных доходов на 1 рубль, среднедушевые расходы увеличатся на 1 рубль 39 копеек.
Коэффициент детерминации R2 = 0,92. Следовательно 92 % дисперсии среднедушевых денежных расходов объяснены среднедушевыми денежными доходами. На долю прочих факторов приходится 8 % дисперсии расходов.
Коэффициент корреляции rху = 0,96. Значение очень близко к 1, связь между расходами и доходами очень тесная, близка к функциональной.
F-критерий Фишера F = 79,7. Fтабл.=5,59. Так как, Fрасч.>Fтабл. делается вывод, что связь между расходами и доходами значима и построенное уравнение статистически значимо.
Список литературы
1. Макарова Н.В., Трофимец Н.Я. Статистика в Excel: Учебное пособие – М.: Финансы и статистика, 2002 – 368 С.
2. Практикум по эконометрике/ Елисеева И.И., Курышева СВ., Гордиенко Н.М. и др. – М.: Финансы и статистика, 2001.
3. Эконометрика: Учебник./ Под ред. И.И.Елисеевой. — М.: Финансы и статистика, 2002 – 344 С.