Эконометрическое моделирование

СОДЕРЖАНИЕ 

Введение……………………………………………………………………...2

Исходные  данные……………………………………………………………3

Шаг 1. Выбор  факторных признаков для построения двухфакторной регрессионной модели………………………………………………………4

Шаг 2. Эмпирическое уравнение множественной регрессии…………….5

Шаг 3. Оценивание параметров………………………………………….....8

Шаг 4. Пакет анализа Excel (программа «Регрессия»)…………………13

Шаг 5. Статистическая значимость коэффициентов…………………….18

Шаг 6. Точечный и интервальный прогнозы результирующего  показателя…………………………………………………………………..19

Заключение…………………………………………………………………21

Список  используемой литературы………………………………………...22

 

ВВЕДЕНИЕ

      Закономерности  в экономике выражаются в виде зависимостей экономических показателей  и математических моделей их поведения. Такие зависимости и модели могут  быть получены только путем обработки  реальных статистических данных, с  учетом внутренних связей и случайных  факторов.

      Эконометрика  – наука, изучающая количественные закономерности и взаимозависимости в экономики методами математической статистики.

      Цель  эконометрики –  эмпирический вывод экономических законов.

      Задачи  эконометрики –  построение экономических моделей и оценивание их параметров, проверка гипотез о свойствах экономических показателей и формах их связи.

      Построение  эконометрической модели – центральная  проблема любого эконометрического  исследования, поскольку ее «качество» определяет достоверность и обоснованность результатов анализа тенденций  развития, прогнозов рассматриваемых  социально – экономических процессов. А также вытекающих из них выводов, в том числе и по вопросам разработки необходимых управленческих мероприятий.

      Методы  экономико-математического моделирования  разрабатывают модели взаимосвязей между рассматриваемыми процессами, адекватно отражающими экономические  концепции в рамках выбранной  системы показателей.

      Цель  курсовой работы: построить и оценить  эмпирическое уравнение множественной  регрессии для принятия обоснованных экономических решений.

      Весь  процесс иллюстрируется примерами  с использованием пакета анализа  данных Excel.

Исходные  данные.

По десяти банковским учреждениям полученные данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (X1), по депозитам (X2) и размера внутрибанковских расходов (X3).

                Y               X1                X2             X3
22 176 150 86
30 170 154 94
20 156 146 100
32 172 134 96
44 162 132 134
34 160 126 114
52 166 134 122
56 156 126 118
66 152 88 130
68 138 120 108
       

Исходные  данные (усл. ед.).

Требуется:

- осуществить  выбор факторных признаков для  построения двухфакторной регрессионной  модели;

- рассчитать  параметры модели;

- определить  линейный коэффициент множественной  корреляции, коэффициенты детерминации, средние коэффициенты эластичности, дать их интерпретацию;

- осуществить  оценку надежности уравнения  регрессии;

- оценить  с помощью Т-критерия Стьюдента  статистическую значимость коэффициентов  уравнения множественной регрессии;

- построить  точечный или интервальный прогнозы  результирующего показателя;

- отразить  результаты расчетов на графике,  выполнение задач отразить в  аналитической записке.

 

ШАГ 1. Выбор факторных  признаков для  построения двухфакторной  регрессионной модели

      Проведем  корреляционный анализ, используя пакет  анализа данных «Корреляция» в Excel.

  y X1 X2 X3
y 1      
X1 -0,704528548 1    
X2 -0,792925348 0,606153861 1  
X3 0,675137107 0,435409546 -0,6836784 1
 

     Анализ  матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. накопления, имеет тесную связь  с индексом среднегодовой ставки по депозитам (ryx2= 0,792), по кредитам (ryx1= 0,704) и с размером внутри банковских расходов (ryx3= 0,675). Однако факторы x1 x2 тесно связаны между собой (rx1x2= 0,606), что свидетельствует о наличии мультиколлинеарности. Из трех переменных оставим в модели x1 – ставки по кредитам и x2 – ставки по депозитам. В этом примере n=10, m=3, после исключения незначимых факторов n=10, m=2.

      Составим  исправленную таблицу данных

               Y                 X1               X2
22 176 150
30 170 154
20 156 146
32 172 134
44 162 132
34 160 126
52 166 134
56 156 126
66 152 88
68 138 120
 
   
     
     
     
     
     
     
     
     
     
     

   ШАГ 2. Эмпирическое уравнение  множественной регрессии

  1. Отобразим на диаграмме данные задачи в среднем по десяти банковским учреждениям .

    Рисунок 1.

  1. Модель множественной регрессии имеет вид

      y=β01x12x2+ε,

где β0, β1…- параметры модели, а ε – случайный член. На основе n наблюдений оценивается выборочное уравнение регрессии:

     ŷ=b0+b1x1+b2x2,

где b0, b1… - оценки параметров β0, β1

     Параметр  b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Оценку коэффициента регрессии получаем с помощью МНК. При его применении строим систему нормальных уравнений:

b0*n+b1*x1+b2*x2=*y

b0*x1+b1*x12+b2*x1*x2=*y*x1

b0*x2+b1*x1*x2+b2*x22=*y*x2 

     Рассчитываем  промежуточные значения для построения системы нормальных уравнений.

       X1*Y       X12     X1*X2                   X2*Y         X22
3872 30976 26400 3300 22500
5100 28900 26180 4620 23716
3120 24336 22776 2920 21316
5504 29584 23048 4288 17956
7128 26244 21384 5808 17424
5440 25600 20160 4284 15876
8632 27556 22244 6968 17956
8736 24336 19656 7056 15876
10032 23104 13376 5808 7744
9384 19044 16560 8160 14400
66948 259680 211784 53212 174764
 

 Строим систему уравнений:

      10+584+478=756

      584+37328+29380=47524

      478+29380+24060=38212

     Решение этой системы уравнений осуществляем методом определителя.

10 584 478 756
584 37328 29380 47524
478 29380 24060 38212
∆= 17586208    
 
756 584 478
47524 37328 29380
38212 29380 24060
∆B0= -116677088  
10 756 478
584 47524 29380
478 38212 24060
∆B1= 10477008  
 
10 584 756
584 37328 47524
478 29380 38212
∆B2= 17454752  
b0= -6,6345791
b1= 0,595751398
b2= 0,992525051

 
 
Используя компьютерную программу  получили оценочное уравнение регрессии

            ŷ=-6,64+0,59x1+0,99x2

      Вычисляем это уравнение и строим график

              Ŷ
48,95628
59,27948
53,71756
52,1352
72,77924
87,07491
84,69427
89,45792
99,38553
108,5196
 
 

      График 1. Регрессионная модель 

 

    ШАГ 3. Оценивание параметров 

  1. Рассчитаем  S2 – остаточную дисперсию

      

    * путем вычислений примет вид:

           Ei=        Ei^2=
-12,9563 167,8652
-31,2795 978,4061
12,28244 150,8583
21,8648 478,0697
7,220757 52,13933
-3,07491 9,455091
-2,69427 7,259098
8,542081 72,96715
12,61447 159,1248
-12,5196 156,7404
  *2232,885
 

      S2= 318,98

Величина  S называется стандартной ошибкой регрессии:

      S= .

      S=17,86

  1. Анализ вариации зависимой переменной. Коэффициент детерминации
 

Пусть в уравнении регрессии содержится m объясняющих переменных. Допустим, что можно разложить дисперсию зависимой переменной на объясненную и необъясненную составляющие:

      var(Y)=var(ŷ) +var(e) .

Используя определение выборочной дисперсии  это уравнение представляем в  виде:

      *(yi-yср)2=*i- yср)2+ *

Обозначим:

      TSS= (yi-yср)2 – общий разброс зависимой переменной;

      ESS= (ŷi- yср)2 – разброс, объясненной переменной;

      USS= * - разброс необъясненной регрессией.

Тогда

      TSS=ESS+USS .

Коэффициент детерминации - есть доля объясненной переменной части разброса зависимой переменной, т.е.

      R2=

TSS ESS USS
1568,16 709,8879 167,8651517
2265,76 266,3592 978,4061486
92,16 478,8411 150,8582757
2,56 550,5971 478,0696962
19,36 7,956668 52,1393263
70,56 131,6736 9,455091496
40,96 82,70577 7,259097994
501,76 192,0419 72,96715051
1324,96 565,7516 159,124777
416,16 1083,7 156,7403818
*6302,4 4069,515 2232,885097
 

Отсюда  R2=0,646.

Величина  R2 является мерой объясняющего качества уравнения регрессии по сравнению с горизонтальной линией ŷi=yср.

Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 65% вариации зависимой  переменной учтено в модели и обусловлено  влиянием включенных факторов.

Поскольку коэффициент R2 измеряет долю дисперсии, совместно объясненной зависимыми переменными, то, казалось бы можно определить отдельный вклад каждой независимой переменной и таким образом получить меру ее относительной важности. Однако такое разложение невозможно, если независимые переменные коррелированны, поскольку в этом случае их объясняющие способности будут перекрываться.

С увеличением  объясненной части разброса ESS коэффициент R2 стремится к 1. Кроме того, с добавлением еще одной переменной R2 обычно увеличивается.

Для компенсации  такого увеличения R2 вводим скорректированный коэффициент детерминации с поправкой на число степеней свободы:

      R2=1-

           R2=0,544

Если  увеличение доли объясненной регрессии  при добавлении новой переменной мало, то скорректированный коэффициент  детерминации может уменьшиться, следовательно, добавлять переменную нецелесообразно.

  1. F – тест на качество оценивания.

Для определения  статистической значимости коэффициента детерминации R2 проверяем гипотезу H0:F=0 для F – статистики:

      F=

      F=6,38

Величина  F имеет распределение Фишера с υ1=2, υ2=n-3.

Проверку  значимости R2 можно выполнить двумя способами.

  1. Критическое значение Fкр при заданных α=0,05; υ1=2; υ2=7 определяем по таблице F – распределения Фишера или в Excel с помощью функции

      Fкр=4,73

Из сравнения  наблюдаемого значения F с критическим получаем:

      F> Fкр , значит H0 отвергается, т.е. R2=0,498 значим при 5%-ном уровне, уравнение регрессии следует признать адекватным.

  1. Наблюдаемому (расчетному) значению критерия F соответствует определенная значимость F, которую вычисляем в Excel с помощью функции

      Значимость  F=0,003

Поскольку значимость F<0,05, то R2 значим при 5%-ном уровне.

Чаще  всего F – тест используется для оценки того, значимо ли объяснение, даваемое уравнением в целом. 

  1. Коэффициент эластичности

Различия  в единицах измерения факторов устраняют  с помощью частных коэффициентов  эластичности. Рассчитываем по формуле:

      Эi= bi

                        Y             X1             X2             X3
  36 40 32 60
  28 44 40 68
  66 28 44 80
  74 52 28 76
  80 50 50 44
  84 64 56 96
  82 70 50 100
  98 68 56 104
  112 78 60 106
  96 90 62 98
сумма 756 584 478 832
среднее 75,6 58,4 47,8 83,2
 
b0= -6,6345791
b1= 0,595751398
b2= 0,992525051
 
 
 
 
 
 
 
 
 

      Э1=0,46;   Э2=0,63 

Частные коэффициенты эластичности показывают, на сколько % в среднем изменяется зависимая переменная с изменением на 1% каждого фактора при фиксированном  значении других факторов.

  1. Средняя ошибка аппроксимации

Оценку  качества построенной модели дает не только коэффициент детерминации, но и средняя ошибка аппроксимации.

Ср. ошибка аппроксимации  – среднее отклонение расчетных значений зависимой переменной от фактических.

      

             y-ŷ       (y-ŷ)/y
-12,9563 -0,3599
-31,2795 -1,11712
12,28244 0,186098
21,8648 0,29547
7,220757 0,090259
-3,07491 -0,03661
-2,69427 -0,03286
8,542081 0,087164
12,61447 0,112629
-12,5196 -0,13041
*-6,9E-13 -0,90528
 

      А=9,1%

Допустимый  предел значений не более 8 – 10 %. 

  1. Расчет  β – коэффициентов

    βi = bi*SXi/Sy

    β1= 0,01

    β2=0,03.

Бета  – коэффициент с математической точки зрения показывает, на какую  часть величины среднего квадратичного  отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратичное отклонение при фиксированном на постоянном уровне значении остальных  независимых переменных. Это означает, что при увеличении дохода на 0,469 усл ед накопления увеличатся на 11,7 усл ед.