Контрольная работа по "Эконометрике". 11

 

Задание 1. Оценка параметров уравнения парной регрессии и качества эконометрической модели. Выполнение задания состоит из следующих этапов: определение формы связи, оценка параметров уравнений и показателей тесноты связи, качество уравнений по средней ошибке аппроксимации, статистической значимости коэффициентов регрессии и корреляции по F – критерию Фишера, прогнозирование результативного признака в виде доверительного интервала при увеличении факторного признака на 10 %.

Решение.

Для построения экономической модели используются данные по субъектам Приволжского федерального округа об уровне денежных доходов и оборотов розничной торговли.

 

Оборот розничной торговли на душу населения, тыс.руб., у (1988)

Среднедушевые денежные доходы в год, тыс.руб., х (1988)

Башкортостан

5,2

8,3

Марий Эл

2,9

5,1

Мордовия

3,2

6,2

Татарстан

5,1

9,1

Удмуртия

4,7

7,9

Чувашия

3,3

5,6

Кировская область

4,6

7,3

Нижегородская область

4,6

8,3

Оренбургская область

3,7

7,6

Пензенская область

3,7

5,5

Пермская область

6,9

11,9

Самарская область

11,6

14,4

Саратовская область

4,3

7,3

Ульяновская область

5,2

7,5


 

Поле корреляции

Для расчёта параметров « » и « » линейной регрессии необходимо решить систему нормальных уравнений относительно « » и « »

По исходным данным определяем , , , , , .

Для этого составим вспомогательную таблицу.

 

1

8,3

5,2

43,16

68,89

27,04

5,186

0,014

0,000

0,073

0,066

0,090

0,269

2

5,1

2,9

14,79

26,01

8,41

2,562

0,338

0,114

4,121

5,607

8,410

11,655

3

6,2

3,2

19,84

38,44

10,24

3,464

0,264

0,070

2,993

2,149

3,240

8,250

4

9,1

5,1

46,41

82,81

26,01

5,842

0,742

0,551

0,029

0,832

1,210

14,549

5

7,9

4,7

37,13

62,41

22,09

4,858

0,158

0,025

0,053

0,005

0,010

3,362

6

5,6

3,3

18,48

31,36

10,89

2,972

0,328

0,108

2,657

3,834

5,760

9,939

7

7,3

4,6

33,58

53,29

21,16

4,366

0,234

0,055

0,109

0,318

0,490

5,087

8

8,3

4,6

38,18

68,89

21,16

5,186

0,586

0,343

0,109

0,066

0,090

12,739

9

7,6

3,7

28,12

57,76

13,69

4,612

0,912

0,832

1,513

0,101

0,160

24,649

10

5,5

3,7

20,35

30,25

13,69

2,89

0,81

0,656

1,513

4,162

6,250

21,892

11

11,9

6,9

82,11

141,61

47,61

8,138

1,238

1,533

3,881

10,291

15,210

17,942

12

14,4

11,6

167,04

207,36

134,56

10,188

1,412

1,994

44,489

27,647

40,960

12,172

13

7,3

4,3

31,39

53,29

18,49

4,366

0,066

0,004

0,397

0,318

0,490

1,535

14

7,5

5,2

39

56,25

27,04

4,53

0,67

0,449

0,073

0,160

0,250

12,885

112

69

619,58

978,62

402,08

69,16

7,772

6,733

62,009

55,555

82,620

156,925

Ср.

8

4,93

44,26

69,90

28,72

4,94

0,555

0,481

4,429

3,968

5,901

11,209

5,90

4,43

                   

2,43

2,10

                   

 

.

Решая систему найдём: , .

Следовательно, уравнение линейной регрессии имеет вид: .

Таким образом, при увеличении среднедушевого денежного дохода на 1 тысячу рублей оборот розничной торговли увеличится на 0,82 тысяч рублей.

Тесноту связи для линейного уравнения регрессии определим по линейному коэффициенту парной корреляции:

.

Связь между факторами очень тесная.

Коэффициент детерминации, объясняющий долю дисперсии, вызванной факторным признаком, определяется по формуле:

   или   90,1%

Так как , то 90,1% изменения оборота розничной торговли обусловлено изменением среднедушевого денежного дохода и 9,9% другими факторами.

Величина средней ошибки аппроксимации определяется как среднее отклонение расчётных значений от фактических:

%.

Величина средней ошибки аппроксимации находится за пределами 8 – 12%, следовательно, модель задана  корректно.

Проводим сравнение фактического и критического значений критерия Фишера. определяется по формуле:

 находим с помощью  статистических таблиц на уровне  значимости 

.

Т.к. , то уравнение статистически значимо, то есть, его можно использовать для описания зависимости между доходами и оборотом розничной торговли.

Прогнозное значение « » определяется путём подстановки в уравнение регрессии прогнозного значения « » тыс.руб.

Вычисляем стандартную ошибку прогноза:

, где 

 тыс.руб.

 при вероятности  и

.

То есть, используя линейную модель регрессии с вероятностью 0,95 можно утверждать, что при увеличении денежного дохода населения на 10% от своего среднего значения, оборот розничной торговли будет находиться в интервале от 3,88 тысяч рублей до 7,312 тысяч рублей.

 

Задание 2. Моделирование тенденции временного ряда. Задание предусматривает решение комплекса вопросов в определенной последовательности для аддитивной модели: выявление структуры ряда; выравнивание исходного ряда методом скользящей средней; определение сезонной компоненты; устранение сезонной компоненты из исходных уравнений; аналитическое выравнивание уровней и расчет значений трендовой составляющей (для выполнения задания использовать линейную форму тренда и расчет параметров уравнения способом от условного нуля); оценка качества модели при помощи абсолютных и относительных ошибок; прогнозирование значений уровня ряда на ближайшую перспективу; комментарии экономического содержания расчетов.

Год

Ожидаемая продолжительность жизни при рождении, лет

1

1995

63

2

1996

64

3

1997

65

4

1998

66

5

1999

65

6

2000

64

7

2001

64

8

2002

63

9

2003

62

10

2004

63

11

2005

63

12

2006

63

13

2007

64


 

Решение.

 

Для выявления структуры ряда (т. е. состава компонент) строят автокорреляционную функцию.

Автокорреляция уровней ряда – корреляционная между последовательными уровнями одного и того же ряда динамики (сдвинутыми на определенный промежуток времени L – лаг). То есть связь между рядом: Х1, Х2, ... Хn-L и рядом Х1+L, Х2+L, ... Хn, где L – положительное целое число. Автокорреляция может быть измерена коэффициентом автокорреляции.

Лаг (сдвиг во времени) определяет порядок коэффициента автокорреляции. Если L = 1, то имеем коэффициент автокорреляции 1-го порядка rt,t-1. Если L = 2, то коэффициент автокорреляции 2-го порядка rt,t-2 и т.д.

Следует учитывать, что с увеличением лага на единицу число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается на 1. Поэтому обычно рекомендуют максимальный порядок коэффициента автокорреляции, равный n/4.

Рассчитав несколько коэффициентов автокорреляции, можно определить лаг (I), при котором автокорреляция (rt,t-L) наиболее высокая, выявив тем самым структуру временного ряда.

Если наиболее высоким оказывается значение rt,t-1, то исследуемый ряд додержит только тенденцию. Если наиболее высоким оказался rt,t-L, то ряд содержит (помимо тенденции) колебания периодом L.

Сдвигаем исходный ряд на 1 уровень. Получаем следующую таблицу:

 yt

yt - 1

63

64

64

65

65

66

66

65

65

64

64

64

64

63

63

62

62

63

63

63

63

63

63

64


 

Расчет коэффициента автокорреляции 1-го порядка.

Выборочные средние.

 

 

 

Выборочные дисперсии:

 

 

Среднеквадратическое отклонение

 

 

Линейный коэффициент автокорреляции rt,t-1:

 

В нашем примере связь между рядами - заметная и прямая.

 x

y

x2

y2

x • y

63

64

3969

4096

4032

64

65

4096

4225

4160

65

66

4225

4356

4290

66

65

4356

4225

4290

65

64

4225

4096

4160

64

64

4096

4096

4096

64

63

4096

3969

4032

63

62

3969

3844

3906

62

63

3844

3969

3906

63

63

3969

3969

3969

63

63

3969

3969

3969

63

64

3969

4096

4032


 

Сдвигаем исходный ряд на 2 уровня. Получаем следующую таблицу:

yt

yt - 2

63

65

64

66

65

65

66

64

65

64

64

63

64

62

63

63

62

63

63

63

63

64


 

Расчет коэффициента автокорреляции 2-го порядка.

Выборочные средние.

 

 

 

Выборочные дисперсии:

 

 

Среднеквадратическое отклонение

 

 

Линейный коэффициент автокорреляции rt,t-2:

 

 

x

y

x2

y2

x • y

63

65

3969

4225

4095

64

66

4096

4356

4224

65

65

4225

4225

4225

66

64

4356

4096

4224

65

64

4225

4096

4160

64

63

4096

3969

4032

64

62

4096

3844

3968

63

63

3969

3969

3969

62

63

3844

3969

3906

63

63

3969

3969

3969

63

64

3969

4096

4032


 

Лаг (порядок)

rt,t-L

1

0,68

2

0,27


В данном ряду динамики имеется тенденция и сезонные колебания. 

Построим поле корреляции:

Анализ графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний.

Построим аддитивную модель временного ряда.

№ месяца,

Итого за три периода

Скользящая средняя за три периода

Центрированная скользящая средняя

Оценка сезонной компоненты

1

2

3

4

5

6

1

63

2

64

192

64

3

65

195

65,0

64,5

0,5

4

66

196

65,3

65,2

0,8

5

65

195

65,0

65,2

-0,2

6

64

193

64,3

64,7

-0,7

7

64

191

63,7

64,0

0,0

8

63

189

63,0

63,3

-0,3

9

62

188

62,7

62,8

-0,8

10

63

188

62,7

62,7

0,3

11

63

189

63,0

62,8

0,2

12

63

190

63,3

63,2

-0,2

13

64


 

Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними. Эти оценки используются для расчета сезонной компоненты . Для этого найдем средние за каждый период оценки сезонной компоненты .

Показатели

I

II

III

 

0,5

0,8

-0,2

-0,7

0

-0,3

-0,8

0,3

0,2

Всего за

-й период

1,1

-0,3

-1,0

Средняя оценка сезонной компоненты для

-го периода,

0,367

-0,1

-0,333

Скорректированная сезонная компонента,

0,389

-0,078

-0,311


Имеем .

Определяем корректирующий коэффициент: .

Рассчитываем скорректированные значения сезонной компоненты ( ) и заносим полученные данные в таблицу.

Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.

yt

Si

yt-Si

T

T+S

E= yt-(T+S)

E2

1

2

3

4

5

6

7

8

1

63

0,389

62,611

64,482

64,871

-1,871

3,50064

2

64

-0,078

64,078

64,358

64,28

-0,28

0,0784

3

65

-0,311

65,311

64,234

63,923

1,077

1,15993

4

66

0,389

65,611

64,11

64,499

1,501

2,253

5

65

-0,078

65,078

63,986

63,908

1,092

1,19246

6

64

-0,311

64,311

63,862

63,551

0,449

0,2016

7

64

0,389

63,611

63,738

64,127

-0,127

0,01613

8

63

-0,078

63,078

63,614

63,536

-0,536

0,2873

9

62

-0,311

62,311

63,49

63,179

-1,179

1,39004

10

63

0,389

62,611

63,366

63,755

-0,755

0,57002

11

63

-0,078

63,078

63,242

63,164

-0,164

0,0269

12

63

-0,311

63,311

63,118

62,807

0,193

0,03725

13

64

0,389

63,611

62,994

63,383

0,617

0,38069


Определим компоненту данной модели. Для этого проведем аналитическое выравнивание ряда ( ) с помощью линейного тренда. Результаты аналитического выравнивания следующие: . Т.е. с каждым годом средняя продолжительность жизни снижается в среднем на 0,124 года

Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5).

Для оценки качества построенной модели применяется сумма квадратов полученных абсолютных ошибок.

Следовательно, можно сказать, что аддитивная модель объясняет 22,5% общей вариации уровней временного ряда.

Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих периодов (гр. 6).

Прогнозирование по аддитивной модели. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда

Получим

Значения сезонных компонент за соответствующие периоды: , , . Таким образом,

 лет

 лет

 лет

Вопрос 25. Измерение тесноты связи множественной регрессии и границы его изменения.

Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат. К таким показателям тесноты связи относят: частные коэффициенты эластичности, b –коэффициенты, частные коэффициенты корреляции. 

Частные коэффициенты эластичности Э j рассчитываются по формуле:  . Частный коэффициент эластичности показывают, на сколько процентов в среднем изменяется признак-результат y с изменением признака-фактора х j на один процент от своего среднего уровня при фиксированном положении других факторов модели. В случае линейной зависимости Э j рассчитываются по формуле:  , где   – оценка коэффициента регрессии при j–ом факторе. 

Стандартизированные частные коэффициенты регрессии - b -коэффициенты (b j ) показывают, на какую часть своего среднего квадратического отклонения s у изменится признак-результат y  с изменением соответствующего фактора х j на величину своего среднего квадратического отклонения ( s х j) при неизменном влиянии прочих факторов (входящих в уравнение).  
По коэффициентам эластичности и b -коэффициентам могут быть сделаны противоположные выводы. Причины этого: а) вариация одного фактора очень велика; б) разнонаправленное воздействие факторов на результат.  
Коэффициент bj может также интерпретироваться как показатель прямого (непосредственного) влияния j-ого фактора (xj) на результат (y). Во множественной регрессии  j-ый фактор оказывает не только прямое, но и косвенное (опосредованное) влияние на результат (т.е. влияние через другие факторы модели). Косвенное влияние измеряется величиной:  , где  m- число факторов в модели. Полное влияние j-ого фактора на результат равное сумме прямого и косвенного влияний измеряет  коэффициент линейной парной корреляции данного фактора и результата – rxj,y. 

Коэффициент частной корреляции измеряет «чистое» влияние фактора на результат при устранении воздействия прочих факторов модели. 

Для расчета частных коэффициентов корреляции могут быть использованы парные коэффициенты корреляции. 

Для случая зависимости y от двух факторов можно вычислить 2 коэффициента частной корреляции:  

, (фактор х2 фиксирован). 

 (фактор х1 фиксирован). 

Это коэффициенты частной корреляции 1-ого порядка (порядок определяется числом факторов, влияние которых устраняется).  
Частные коэффициенты корреляции, рассчитанные по таким формулам изменяются от –1 до +1. Они используются не только для ранжирования факторов модели по степени влияния на результат, но и также для отсева факторов. При малых значениях ryxm / x1,x 2… xm -1 нет смысла вводить в уравнение  m-ый фактор, т.к. его чистое влияние на результат несущественно. 

Коэффициенты множественной детерминации и корреляции   характеризуют совместное влияние всех факторов на результат.  
По аналогии с парной регрессией можно определить долю вариации результата, объясненной вариацией включенных в модель факторов ( d 2), в его общей вариации (s 2 y). Ее количественная характеристика – теоретический множественный коэффициент детерминации (R 2 y(x 1,..., xm)). Для линейного уравнения регрессии данный показатель может быть рассчитан через b-коэффициенты, как: 

 - коэффициент множественной  корреляции. Он принимает значения  от 0 до 1 (в отличии от парного  коэффициента корреляции, который  может принимать отрицательные значения). Поэтому R не может быть использован для интерпретации направления связи. Чем плотнее фактические значения yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно,  больше величина Ry(x 1,..., xm). Таким образом, при значении R близком к 1, уравнение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат. При значении R близком к 0 уравнение регрессии плохо описывает фактические данные и факторы оказывают слабое воздействие на результат. 

 

Вопрос 50. При какой структуре лага используется метод Койка.

Метод Койка используется для оценки параметров модели с распределенным лагом.

Предположим, что для описания некоторого процесса используется модель с бесконечным лагом вида:

Очевидно, что параметры такой модели обычным МНК или с помощью иных стандартных статистических методов определить нельзя, поскольку модель включает бесконечное число факторных переменных. Однако, приняв определенные допущения относительно структуры лага, оценки ее параметров все же можно получить. Эти допущения: предполагается геометрическая структура лага, при которой воздействие лаговых значений фактора на результат уменьшается при увеличении лага в геометрической прогрессии.

Контрольная работа по "Эконометрике". 11