Контрольная работа по "Эконометрике". 3

Содержание

 

Задание 1

 

Необходимо собрать  данные (экономические показатели), должно быть не менее 10 наблюдений зависимой  переменной (Y) и независимой переменной (Х).

Требуется:

1.Построить регрессионные модели зависимости Y от Х и отобразить на графиках фактические и расчетные данные следующих моделей:

  • линейной;
  • степенной;
  • показательной;
  • гиперболической.

2.Оценить каждую модель, определив:

2.1. Характеристики модели:

  • s 2  (остаточная дисперсия);
  • r XY(индекс корреляции);
  • R2   (коэффициент детерминации);
  • Э (коэффициент эластичности);
  • b (бета-коэффициент).

2.2. Значимость уравнения множественной регрессии в целом (F-критерий Фишера).

2.3.Значимость коэффициентов  уравнения регрессии (t-критерий Стьюдента).

2.4. Произвести проверку выполнения условий для получения «хороших» оценок  методом наименьших квадратов (МНК):

Математическое ожидание случайной компоненты равно 0, иначе  М(ei)=0, (с помощью t-критерия Стьюдента);

Дисперсия должна быть постоянной, т.е. D (ei)= const = s 2 (c помощью F-критерия Фишера);

Ковариация должна быть равна 0, иначе по формуле: cov (eI, ej) = 0 с помощью d-критерия Дарбина-Уотсона (D-W)).

2.5. Найти Еотн. (среднюю относительную ошибку).

3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.

4.Рассчитать прогнозные значения по результативной модели, если прогнозное значение фактора увеличивается на 110% относительно среднего уровня.

5. Отобразить на графике  фактические данные, результаты  расчетов и прогноз по результативной модели.

Вычисления провести с двумя знаками в дробной  части. Основные промежуточные результаты вычислений представить в таблицах.

 

Решение:

Исходные данные (таблица 1)1:

Таблица 1 – Поголовье крупного рогатого скота и внесение органических удобрений

 

Поголовье КРС

Внесение органических удобрений за год

 

млн.голов

млн.тонн

Год

х

у

1997

20,59

86,1

1998

18,05

72,1

1999

17,45

69,1

2000

16,51

66

2001

15,82

59,6

2002

15,02

60,6

2003

13,49

59,9

2004

12,12

53,2

2005

11,04

49,9

2006

10,6

47,5


 

1. Линейная модель имеет вид 

Для  расчёта  коэффициентов  уравнения  линейной  регрессии  и дополнительной  статистики  применяется  функция ЛИНЕЙН (Microsoft Excel). Вручную параметры уравнения a и b, можно найти с помощью МНК решив систему нормальных уравнений для линейной модели:

Оценки    коэффициентов    уравнения    регрессии:

a= 10.58; b= 3.44

Уравнение линейной регрессии будет иметь вид: у = 3,44х +10,58

Подставляя в уравнение известные значения х, получим новые расчетные значения ŷ  (таблица 2).

Таблица 2 – Расчетные и фактические значения по линейной модели

i

Год

х

у факт.

ŷ

1

1997

20,59

86,1

81,41

2

1998

18,05

72,1

72,67

3

1999

17,45

69,1

70,61

4

2000

16,51

66

67,37

5

2001

15,82

59,6

65,00

6

2002

15,02

60,6

62,25

7

2003

13,49

59,9

56,99

8

2004

12,12

53,2

52,27

9

2005

11,04

49,9

48,56

10

2006

10,6

47,5

47,04


На рисунке 1 представлены фактические и расчетные значения по линейной модели.

Рисунок 1 – Фактические и расчетные значения у по линейной модели

Степенная модель имеет вид:

Для построения этой модели необходимо произвести линеаризацию переменных. Проведем логарифмирование обеих частей уравнения:

(таблица 3)

Обозначим Y=lg y;  X = lg x;    A =lg a

Таблица 3 – Промежуточные расчеты для степенной модели

i

Год

y

Y (lg y)

x

Х (lg x)

ŷ

1

1997

86,1

1,9350

20,59

1,3137

80,04

2

1998

72,1

1,8579

18,05

1,2565

72,13

3

1999

69,1

1,8395

17,45

1,2418

70,22

4

2000

66

1,8195

16,51

1,2177

67,22

5

2001

59,6

1,7752

15,82

1,1992

64,99

6

2002

60,6

1,7825

15,02

1,1767

62,37

7

2003

59,9

1,7774

13,49

1,1300

57,30

8

2004

53,2

1,7259

12,12

1,0835

52,65

9

2005

49,9

1,6981

11,04

1,0430

48,90

10

2006

47,5

1,6767

10,6

1,0253

47,35


Уравнение   примет вид:

- линейное уравнение регрессии.

В этом случае необходимо найти значения параметров А и b, используя данные анализа «Регрессия» в Microsoft Excel:

А = 0,86;  b = 0,79

Уравнение регрессии  будет иметь вид у = 0,79Х+0,86

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.

у расч. = 7,32 × х 0, 79

Подставляя в уравнение  известные значения х, получим новые  значения ŷ (табл.3). На рисунке 2 представлены фактические и расчетные значения по степенной модели.

Рисунок 2 - Фактические и расчетные значения у по степенной модели

 

Уравнение показательной  кривой

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим  логарифмирование обеих частей уравнения: lg ŷ = lg a + x  lg b. Обозначим Y = lg ŷ, B = lg b, A = lg a

Получим линейное уравнение  регрессии:

Таблица 4 – Расчеты для показательной модели

i

y

Y (lg y)

х

ŷ

1

86,1

1,9350

20,59

83,42

2

72,1

1,8579

18,05

72,64

3

69,1

1,8395

17,45

70,30

4

66

1,8195

16,51

66,79

5

59,6

1,7752

15,82

64,33

6

60,6

1,7825

15,02

61,58

7

59,9

1,7774

13,49

56,66

8

53,2

1,7259

12,12

52,58

9

49,9

1,6981

11,04

49,58

10

47,5

1,6767

10,6

48,40


Рассчитаем его параметры, используя данные анализа «Регрессия» в Microsoft Excel.

А = 1,4340;  В =  0,0235

Уравнение регрессии  будет иметь вид Y = 1,434+0,0235X

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.

ŷ = 10 1,434 * (10 0,0235) х

ŷ = 27,17*1,056 х

Подставляя в уравнение известные значения х, получим новые значения ŷ (в таблице 4). На рисунке 3 представлены фактические и расчетные значения по показательной модели.

Рисунок 3  - Фактические и расчетные значения у по показательной модели

 

Уравнение гиперболической  функции :

Произведем линеаризацию модели путем замены Х = 1 / х (таблица 5). В результате получим   линейное уравнение .

Таблица 5 – Промежуточные расчеты для гиперболической модели

i

у

х

Х (1/х)

ŷ

1

86,1

20,59

0,0486

76,67

2

72,1

18,05

0,0554

71,97

3

69,1

17,45

0,0573

70,66

4

66

16,51

0,0606

68,42

5

59,6

15,82

0,0632

66,60

6

60,6

15,02

0,0666

64,29

7

59,9

13,49

0,0741

59,10

8

53,2

12,12

0,0825

53,34

9

49,9

11,04

0,0906

47,79

10

47,5

10,6

0,0943

45,20


Рассчитаем его параметры, используя данные анализа «Регрессия» в Microsoft Excel.

а = 110,06;  b =  - 687,57

Получим следующее уравнение  гиперболической модели:

Подставляя в уравнение  известные значения х, получим новые значения ŷ (таблица 5). На рисунке 4 представлены фактические и расчетные значения по гиперболической модели.

Рисунок 4  - Фактические и расчетные  значения у по гиперболической модели

 

2. Оценка моделей

2.1. Характеристики модели 

Остаточная дисперсия относительно регрессионной модели:

,        (1)

где n - число измерений, k - число параметров модели (для линейной градуировки k=2).

Уравнение регрессии всегда дополняется  показателем тесноты связи (индекс корреляции):

 

,       (2)

Коэффициент корреляции находится в пределах -1 < r XY < 1. близость величины данного коэффициента к 1 означает очень тесную зависимость параметров х и у.

Коэффициент  детерминации:

 

R2 = r2yx,        (3)

Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного на 1% и при постоянстве (фиксированном уровне) других факторов. Эластичность ненормирована и может изменяться от - до + . Важно, что она безразмерна. Высокий уровень эластичности означает сильное влияние независимой переменной на объясняемую переменную:

,       (4)

β-коэффициент позволяет оценить меру влияния вариации факторного признака на вариацию результата при фиксированном уровне других факторов:

,       (5)

где               .

Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy  изменится зависимая переменная у с изменением соответствующей независимой переменной хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.

Для проверки значимости модели регрессии используется F-критерий Фишера. Если расчетное значение с n1= k  и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель,  больше табличного при заданном уровне значимости, то модель считается значимой:

,      (6)

Значимость отдельных  коэффициентов регрессии проверяется  по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена):

,       (7)

где Sb — это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии b.

Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым.

Средняя относительная ошибка:

Еотн. = ,      (8)

Показывает на сколько  в среднем расчетные значения у отличаются от фактических значений в %.

Выполнение условий МНК:

1) Проверка равенства математического  ожидания  случайной компоненты  нулю: если она распределена по нормальному закону, осуществляется на основе t-критерия Стьюдента. Расчетное значение задается формулой:

,      (9)

где e - среднеарифметическое значение уровней остаточной последовательности et;

Se -среднеквадратическое отклонение для этой последовательности.

2) Дисперсия случайной составляющей должна быть постоянна для всех наблюдений. .

Fрасч. =      (10)

Чем больше величина F превышает  табличное значение F -критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

3) Проверка независимости значений  уровней случайной компоненты осуществляется с помощью d-критерия Дарбина-Уотсона.

,       (11)

Расчетное значение d сравнивается с табличным верхним d2 и нижним d1 критическими значениями статистики Дарбина-Уотсона для различного числа уровней ряда n и числа определяемых параметров k. Если расчетное значение критерия d больше d2, то гипотеза о независимости  уровней остаточной последовательности, т.е. об отсутствии автокорреляции (cov (ei,ej)=0), принимается. Если значение d меньше табличного d1, то эта гипотеза отвергается и модель неадекватна. Если значение d находится между d1 и d2, то считается, что нет достаточных оснований сделать тот или иной вывод, и необходимы дальнейшие исследования.

2.1.1. Для линейной у = 3,44х +10,58

        

,      

R2 = 0,972   = 0,9416 

х ср. = 15,07;  у ср. = 62,4 

    

Sx = 3,08;   Sу = 10,61

  

Sb =  0,3 ;  b = 3,44

Еотн. = 0,3255/10*100% = 3,26%

Расчет средней относительной  ошибки:

Год

i

У факт.

У расч.

e

|e/у|

1997

1

86,1

81,41

4,69

0,0545

1998

2

72,1

72,67

-0,57

0,0079

1999

3

69,1

70,61

-1,51

0,0218

2000

4

66

67,37

-1,37

0,0208

2001

5

59,6

65,00

-5,40

0,0906

2002

6

60,6

62,25

-1,65

0,0272

2003

7

59,9

56,99

2,91

0,0487

2004

8

53,2

52,27

0,93

0,0174

2005

9

49,9

48,56

1,34

0,0269

2006

10

47,5

47,04

0,46

0,0096

Итого

       

0,3255


Выполнение условий  МНК:

1) t = 0,0174/ 2,78*3,46 = 0,0198

e ср. = 0,0174

Se = 40,92

2) рассчитаем остаточную сумму квадратов для i1 = (1..5), i2 = (6…10)

S1= 55.66

S2= 14.08

Fрасч.= 55,66/14,08 = 3,95

Fтабл.= 6.39 при k1 = 5-1= 4  k2 = 5-1 = 4

Fрасч < Fтабл, значит предпосылка о равенстве дисперсий остаточных величин принимается.

3)

табличные значения: d1 = 0,879 и d2 =1,320

d1 < d расч. > d2, значит по данному критерию нельзя оценить модель

 

2.1.2. Для степенной модели

        

,      

R2 = 0,97072   = 0,9423

Э = 0,7905*1,79/1,17 = 0,52

Sx = 0,091;  Sу = 0,072

  

Sb =  0,07

 

Еотн. = 0,0723 /10 *100% =0,72 %

Выполнение условий  МНК:

1) t расч.= 0,0000

e ср. = 0,0000

t табл. = 2,306

t расч.< t табл.   значит условие 1 выполняется.

2) рассчитаем остаточную сумму квадратов для i1 = (1..5), i2 = (6…10)

S1= 0,0025

S2= 0,0006

Fрасч.= 0,0025/0,0006 = 4,03

Fтабл.= 6,39 при k1 = 5-1= 4  k2 = 5-1 = 4

Fрасч < Fтабл, значит предпосылка о равенстве дисперсий остаточных величин принимается.

3)

табличные значения: d1 = 0,879 и d2 =1,320

d1 < d расч. > d2, значит по данному критерию нельзя оценить модель

 

2.1.3. Для показательной модели ŷ = 27,17*1,05 х

      

R2 = 0,98082   = 0,9620    

    

Sx = Ö95,07/10 = 3,08;  Sу = Ö0,0525/10 = 0,07

  

Sb =  0,0017

 

Еотн. = 0,0581/10*100% = 0,58%

Год

i

У факт.

У расч.

e

|e/у|

1997

1

1,9350

1,9179

0,0171

0,008857

1998

2

1,8579

1,8582

-0,0002

0,000129

1999

3

1,8395

1,8441

-0,0046

0,002499

2000

4

1,8195

1,8220

-0,0024

0,001342

2001

5

1,7752

1,8058

-0,0305

0,017194

2002

6

1,7825

1,7870

-0,0045

0,002523

2003

7

1,7774

1,7510

0,0264

0,014860

2004

8

1,7259

1,7188

0,0071

0,004109

2005

9

1,6981

1,6934

0,0047

0,002745

2006

10

1,6767

1,6831

-0,0064

0,003821

Итого

 

17,8878

17,8812

0,0066

0,058078


Выполнение условий МНК:

1) t расч.= 0,0006/ 0,0021*3,46 = 0,9

e ср. = 0,0006;  Se = 0,0021

t табл. = 2,23

t расч.<  t табл.   значит условие 1 выполняется

2) рассчитаем остаточную сумму квадратов для i1 = (1..5), i2 = (6…10)

S1y’= 0,0013;  S2y’= 0,0008

Fрасч.= 0,0013/0,0008 = 1,51

Fтабл.= 6,39 при k1 = 5-1= 4  k2 = 5-1 = 4

Fрасч < Fтабл, значит предпосылка о равенстве дисперсий остаточных величин принимается.

3)

табличные значения: d1 = 0,879 и d2 =1,320

d > d2, значит гипотеза об отсутствии автокорреляции (cov (ei,ej)=0), принимается и модель считается адекватной.

 

 

 

 

2.1.3. Для гиперболической  модели ŷ =110,06 - 687,57 / х

R2 = 0,9259 2 = 0,8574

Sx= 0,015;  Sу = 10,12

  

 

Sb = 99,15

Еотн. = 0,4556 / 10*100% = 4,56%

Выполнение условий  МНК:

1) t расч.= 0,0032/4,35*3,16 = 0,0023

e ср. = 0,0006;  Se = 0,0021

t табл. = 2,23

t расч.<  t табл.   значит условие 1 выполняется

2) рассчитаем остаточную сумму квадратов для n1 = (1..5), n2 = (6…10)

S1y’= 146,26; S2y’= 24,01

Fрасч.= 146,26 / 24,01 = 6,09

Fтабл.= 6,39  при k1 = 5-1= 4  k2 = 5-1 = 4

Fрасч < Fтабл, значит предпосылка о равенстве дисперсий остаточных величин принимается.

3)

табличные значения: d1 = 0,879 и d2 =1,320

d<d1, значит по данному критерию нельзя оценить модель.

 

3. Сводная таблица  вычислений

Характеристики

Линейная

Степенная

Показательная

Гиперболическая

 

У=3,44х+10,58

У=7,32х0,79

У=27,17*1,056х

У=110,06-687,57/х

a

10.58

7,32

27,166

110,06

b

3.44

0,79

1,0560

-687,57

A

10.58

0,86

1,4340

110,06

B

3.44

0,79

0,0235

-687,57

s2 (остаточная дисперсия)

8,72

0,0004

0,0003

21,28

Чем меньше дисперсия, тем лучше  регрессионное уравнение

rxy (индекс корреляции)

0,9704

0,9707

0,9808

0,9259

Чем ближе rxy к 1, тем сильнее связь

Связь прямая сильная

R2 (коэффициент детерминации)

0,9416

0,9423

0,9620

0,8574

Чем ближе R2 к 1, тем лучше качество подгонки

Хорошее качество подгонки

Эxy (коэффициент эластичности)

0,83

0,52

0,2

-0,76

Показывает на сколько процентов  изменится результативный признак  у при изменении факторного признака х на 1 %

b (бета-коэффициент)

0,9986

1

1,03

-1,02

sх

3,08

0,09

3,08

0,015

sу

10,61

0,07

0,07

10,12

Бета-коэффициент показывает, на какую  часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной хj

F-критерий (Фишера)

128,95

130,71

202,7

48,09

F- табл. = 5,32

Для a=0,05

Все значения превышают F- табличное, значит линейная связь есть

Чем выше значение, тем лучше качество уравнения

t-статистика (Стьюдента)

11,36

11,43

14,24

-6,93

Sb

0,3028

0,0691

0,0017

99,15

МНК

       

t-расч.

0,0198

0,0000

0,90

0,0023

t- табл. = 2,306

t-расч.< t- табл. значит условие 1 выполняется

F-расч.

3,95

4,03

1,51

6,09

F- табл. = 6,39

F-расч.< F- табл. значит условие 2 выполняется

d-расч.

1,21

1,23

1,56

0,87

d1 = 0,879  и d2 = 1,320

Неопределенность 

d-расч.> d2 значит условие 3 выполняется, автокорреляции нет

d1> dрасч. значит условие 3 не выполняется, автокорреляция есть

Еотн. (относительная ошибка) , %

3,26

0,72

0,58

4,56

Если Еотн. менее 15%, то модель построена с приемлемой точностью

Выводы 

Модель адекватна

Модель адекватна

Модель адекватна

Модель не адекватна


 

Наиболее адекватной можно признать показательную модель.

Остаточная дисперсия  отражает разброс значений относительно линии регрессии (модельных значений) и может служить показателем точности воспроизведения значений зависимой переменной. Чем меньше остаточная дисперсия, тем больше уверенности в том, что уравнение регрессии подобрано верно. В степенной модели она минимальна.

Индекс корреляции (0,9808) является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. Значение 0,9808 означает, что связь факторов в уравнении прямая и сильная.

Коэффициент детерминации  показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. вариация признака  у на 96,2% объясняется вариацией фактора х. Чем ближе к 1, тем выше качество модели.

Расчетное значение F-критерия Фишера (202,7) с n1= k  и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель,  больше табличного при заданном уровне значимости 0,95, значит, модель считается значимой.

Расчетное значение t-критерия (14,24) с (n - k - 1) степенями свободы превосходит его табличное значение при уровне значимости 0,95, значит коэффициент регрессии считается значимым.

 

4. Рассчитаем прогнозные  значения по показательной модели. Х возрастает на 110% относительно среднего уровня: 

х ср. = 15,07

х 11 = 15,07*1,1 = 16,58, подставим в уравнение регрессии прогнозное значение х:    

у 11 = 27,17*1,05616,58 = 67,06

Рисунок 5 - Фактические, расчетные и прогнозные значения по показательной модели

Задание 2

 

Необходимо собрать данные (экономические показатели). Должно быть не менее 15 наблюдений зависимой переменной Y и независимых переменных Х123. данные берутся из экономических журналов, сборников, интернета.

Требуется:

  1. С помощью корреляционного анализа осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.
  2. Рассчитать параметры модели.
  3. Для характеристики модели определить:
  • линейный коэффициент множественной корреляции;
  • коэффициент детерминации;
  • средние коэффициенты эластичности;
  • бета-, дельта- коэффициенты.

Дать их интерпретацию.

  1. Осуществить оценку надежности уравнения регрессии (F-критерий Фишера).
  2. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
  3. Произвести проверку выполнения условий для получения «хороших» оценок методом наименьших квадратов (МНК).
  4. Рассчитать и построить точечный прогноз и интервальные прогнозы результирующего показателя на два шага вперед.
  5. Составить сводную таблицу вычислений, дать интерпретацию рассчитанных характеристик. Отразить результаты в аналитической записке, приложить компьютерные распечатки расчетов и графики.
Контрольная работа по "Эконометрике". 3