Контрольная работа по дисциплине "Эконометрика". 2

Задача 1. По территориям региона приводятся данные за 199X г. ( , )

Номер региона

Среднедушевой прожиточный минимум в день одного трудоспособного, руб.,

Среднедневная заработная плата, руб.,

1

85

142

2

89

148

3

87

142

4

79

154

5

89

164

6

113

195

7

67

139

8

98

167

9

82

152

10

87

162

11

86

155

12

117

173


Требуется:

  1. Построить линейное уравнение парной регрессии по .
  2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
  3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
  4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
  5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
  6. На одном графике отложить исходные данные и теоретическую прямую.
  7. Проверить вычисления в MS Excel.

 

Решение

1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу.

1

2

3

4

5

6

7

8

9

10

1

85

142

12070

7225

20164

153,12

-11,12

123,54

7,83

2

89

148

13172

7921

21904

156,91

-8,91

79,41

6,02

3

87

142

12354

7569

20164

155,01

-13,01

169,34

9,16

4

79

154

12166

6241

23716

147,42

6,58

43,28

4,27

5

89

164

14596

7921

26896

156,91

7,09

50,25

4,32

6

113

195

22035

12769

38025

179,69

15,31

234,49

7,85

7

67

139

9313

4489

19321

136,03

2,97

8,80

2,13

8

98

167

16366

9604

27889

165,45

1,55

2,40

0,93

9

82

152

12464

6724

23104

150,27

1,73

3,00

1,14

10

87

162

14094

7569

26244

155,01

6,99

48,82

4,31

11

86

155

13330

7396

24025

154,06

0,94

0,88

0,60

12

117

173

20241

13689

29929

183,48

-10,48

109,89

6,06

Итого

1079

1893

172201

99117

301381

1893,37

-0,37

874,10

54,64

Среднее значение

89,92

157,75

14350,08

8259,75

25115,08

157,78

72,84

4,55

13,20

15,17

 

174,14

230.02

 


Находим параметры уравнения регрессии

;

.

Получено уравнение регрессии:

.

Параметр регрессии позволяет сделать вывод, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,95 руб. (или 95 коп.).

После нахождения уравнения регрессии заполняем столбцы 7–10 нашей таблицы.

2. Тесноту линейной связи оценит коэффициент корреляции:

;

Т.к. значение коэффициента корреляции больше 0,7, то это говорит о наличии весьма тесной линейной связи между признаками.

Коэффициент детерминации:

.

Это означает, что 68,2% вариации заработной платы ( ) объясняется вариацией фактора – среднедушевого прожиточного минимума.

Качество модели определяет средняя ошибка аппроксимации:

.

Качество построенной модели оценивается как хорошее, так как не превышает 10%.

3. Оценку статистической значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия составит

.

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как , то уравнение регрессии признается статистически значимым.

Оценку статистической значимости параметров регрессии и корреляции проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.

Табличное значение -критерия для числа степеней свободы и уровня значимости составит .

Определим стандартные ошибки , , (остаточная дисперсия на одну степень свободы ):

;

;

.

Тогда

;

;

.

Фактические значения -статистики превосходят табличное значение:

; ; ,

поэтому параметры , и не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительные интервалы для параметров регрессии и . Для этого определим предельную ошибку для каждого показателя:

;

.

Доверительные интервалы

 и  ;

 и 

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.

4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: руб., тогда индивидуальное прогнозное значение заработной платы составит: руб.

5. Ошибка прогноза составит:

.

Предельная ошибка прогноза, которая в случаев не будет превышена, составит:

.

Доверительный интервал прогноза:

 и  .

Выполненный прогноз среднемесячной заработной платы является надежным ( ) и находится в пределах от 141,83 руб. до 185,69 руб.

6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую:

7. Проверим вычисления в MS Excel (Сервис→Анализ данных→Регрессия).

Получаем следующие результаты:

 

ВЫВОД ИТОГОВ

             
                 

Регрессионная статистика

             

Множественный R

0,826638

             

R-квадрат

0,68333

             

Нормированный R-квадрат

0,651664

             

Стандартная ошибка

9,349262

             

Наблюдения

12

             
                 

Дисперсионный анализ

           
 

df

SS

MS

F

Значимость F

     

Регрессия

1

1886,163

1886,163

21,57866

0,000915

     

Остаток

10

874,087

87,4087

         

Итого

11

2760,25

           
                 
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

72,47157

18,5554

3,905687

0,002934

31,12757

113,8156

31,12757

113,8156

x

0,948416

0,204168

4,645284

0,000915

0,493503

1,40333

0,493503

1,40333

                 
                 
                 

ВЫВОД ОСТАТКА

             
                 

Наблюдение

Предсказанное y

Остатки

           

1

153,087

-11,087

           

2

156,8806

-8,88062

           

3

154,9838

-12,9838

           

4

147,3965

6,603545

           

5

156,8806

7,119382

           

6

179,6426

15,35739

           

7

136,0155

2,984541

           

8

165,4164

1,583635

           

9

150,2417

1,758296

           

10

154,9838

7,016214

           

11

154,0354

0,964631

           

12

183,4363

-10,4363

           

 

 

Задача 2. По предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих ( ).

Номер предприятия

Номер предприятия

1

7,0

4,3

11,0

11

9,0

6,9

21,0

2

7,0

3,9

13,0

12

11,0

6,4

22,0

3

7,0

3,7

15,0

13

9,0

6,8

22,0

4

7,0

4,0

17,0

14

11,0

7,2

25,0

5

7,0

4,5

18,0

15

12,0

7,1

28,0

6

7,0

4,8

19,0

16

12,0

8,2

29,0

7

8,0

5,4

19,0

17

12,0

8,1

30,0

8

8,0

4,4

20,0

18

12,0

8,5

31,0

9

8,0

4,9

20,0

19

14,0

9,6

32,0

10

10,0

6,8

21,0

20

14,0

9,9

36,0


Требуется:

  1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
  2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
  3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
  4. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
  5. С помощью -критерия оценить статистическую значимость коэффициентов чистой регрессии.
  6. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
  7. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

Решение

Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:

1

2

3

4

5

6

7

8

9

10

1

7

4,3

11

30,1

77

47,3

18,49

121

49

2

7

3,9

13

27,3

91

50,7

15,21

169

49

3

7

3,7

15

25,9

105

55,5

13,69

225

49

4

7

4,0

17

28,0

119

68,0

16,00

289

49

5

7

4,5

18

31,5

126

81,0

20,25

324

49

6

7

4,8

19

33,6

133

91,2

23,04

361

49

7

8

5,4

19

43,2

152

102,6

29,16

361

64

8

8

4,4

20

35,2

160

88,0

19,36

400

64

9

8

4,9

20

39,2

160

98,0

24,01

400

64

10

10

6,8

21

68,0

210

142,8

46,24

441

100

11

9

6,9

21

62,1

189

144,9

47,61

441

81

12

11

6,4

22

70,4

242

140,8

40,96

484

121

13

9

6,8

22

61,2

198

149,6

46,24

484

81

14

11

7,2

25

79,2

275

180,0

51,84

625

121

15

12

7,1

28

85,2

336

198,8

50,41

784

144

16

12

8,2

29

98,4

348

237,8

67,24

841

144

17

12

8,1

30

97,2

360

243,0

65,61

900

144

18

12

8,5

31

102,0

372

263,5

72,25

961

144

19

14

9,6

32

134,4

448

307,2

92,16

1024

196

20

14

9,9

36

138,6

504

356,4

98,01

1296

196

Сумма

192

125,4

449

1290,7

4605

3047,1

857,78

10931

1958

Ср. знач.

9,6

6,27

22,45

64,535

230,25

152,36

42,889

546,55

97,9


Найдем средние квадратические отклонения признаков:

;

;

.

1. Для нахождения параметров линейного уравнения множественной регрессии

необходимо решить систему линейных уравнений относительно неизвестных параметров , ,

либо воспользоваться готовыми формулами

;

;

.

Рассчитаем сначала парные коэффициенты корреляции:

;

;

.

Находим коэффициенты чистой регрессии и параметр :

;

;

.

Таким образом, получили следующее уравнение множественной регрессии:

.

Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 0,8 тыс. руб., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на 0,128 тыс. руб.

После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации.

, %

1

7

4,3

11

6,558

0,442

0,195

6,314

2

7

3,9

13

6,494

0,506

0,256

7,229

3

7

3,7

15

6,590

0,410

0,168

5,857

4

7

4,0

17

7,086

-0,086

0,007

1,229

5

7

4,5

18

7,614

-0,614

0,377

8,771

6

7

4,8

19

7,982

-0,982

0,964

14,029

7

8

5,4

19

8,462

-0,462

0,213

5,775

8

8

4,4

20

7,790

0,210

0,044

2,625

9

8

4,9

20

8,190

-0,190

0,036

2,375

10

10

6,8

21

9,838

0,162

0,026

1,620

11

9

6,9

21

9,918

-0,918

0,843

10,200

12

11

6,4

22

9,646

1,354

1,833

12,309

13

9

6,8

22

9,966

-0,966

0,933

10,733

14

11

7,2

25

10,670

0,330

0,109

3,000

15

12

7,1

28

10,974

1,026

1,053

8,550

16

12

8,2

29

11,982

0,018

0,000

0,150

17

12

8,1

30

12,030

-0,030

0,001

0,250

18

12

8,5

31

12,478

-0,478

0,228

3,983

19

14

9,6

32

13,486

0,514

0,264

3,671

20

14

9,9

36

14,238

-0,238

0,057

1,700

Сумма

192

125,4

449

191,992

0,008

7,609

110,371

Ср. знач.

9,6

6,27

22,45

9,600

0,380

5,519


Остаточная дисперсия:

.

Средняя ошибка аппроксимации:

.

Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.

Коэффициенты и стандартизованного уравнения регрессии :

;

.

Т.е. уравнение будет выглядеть следующим образом:

.

Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:

.

Вычисляем:

;  .

Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,523% или 0,299% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .

2. Коэффициенты парной корреляции мы уже нашли:

; ; .

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:

;

.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Коэффициент множественной корреляции определить через матрицы парных коэффициентов корреляции:

,

где

– определитель матрицы парных коэффициентов корреляции;

– определитель матрицы межфакторной корреляции.

Находим:

.

Коэффициент множественной корреляции:

.

Аналогичный результат получим при использовании других формул:

;

;

Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом.

3. Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации

определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и .

4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:

.

В нашем случае фактическое значение -критерия Фишера:

.

Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

5. Оценим статистическую значимость параметров чистой регрессии с помощью -критерия Стьюдента. Рассчитаем стандартные ошибки коэффициентов регрессии:

;

.

Фактические значения -критерия Стьюдента:

, .

Табличное значение критерия при уровне значимости и числе степеней свободы составит . Таким образом, признается статистическая значимость параметра и незначимость параметра .

Доверительные интервалы для параметров чистой регрессии:

,

и

, .

6. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул (3.16):

; .

Найдем и :

;

.

Имеем:

;

.

Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, существенным; фактор включать в уравнение после фактора не следует.

Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .

7. Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:

.

Найдем его параметры:

;

.

Таким образом,

,  .

8. Проверим вычисления в MS Excel.

Найдем матрицу парных коэффициентов корреляции (Сервис→Анализ данных→Корреляция):

.

С помощью инструмента Регрессия (Сервис→Анализ данных→Регрессия) получаем следующие результаты:

ВЫВОД ИТОГОВ

             
                 

Регрессионная статистика

             

Множественный R

0,966294

             

R-квадрат

0,933724

             

Нормированный R-квадрат

0,925927

             

Стандартная ошибка

0,668998

             

Наблюдения

20

             
                 

Дисперсионный анализ

           
 

df

SS

MS

F

Значимость F

     

Регрессия

2

107,1915

53,59576

119,7516

9,58E-11

     

Остаток

17

7,608481

0,447558

         

Итого

19

114,8

           
                 
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

1,707175

0,537318

3,177218

0,005511

0,573534

2,840816

0,573534

2,840816

x1

0,78961

0,231638

3,40881

0,003343

0,300897

1,278324

0,300897

1,278324

x2

0,131045

0,067155

1,951388

0,067688

-0,01064

0,27273

-0,01064

0,27273

Контрольная работа по дисциплине "Эконометрика". 2