Корреляционно-регрессионный анализ. 4



Федеральное агентство по образованию

ГОУ ВПО «Санкт-Петербургский государственный университет

экономики и финансов»

(Новгородский филиал)

 

 

 

 

 

 

 

 

 

 

Расчетная работа по «Статистике»

(Вариант 13)




 

 

 

 

 

Выполнила: студентка 2 курса

группы Д.06.2

Селифанова

Ярослава Игоревна

Проверила: доц. Лебедева Г.В.



 

 

 

 

 

 

 

 

 

 

Великий Новгород

2008 г.

Содержание

 

Корреляционно-регрессионный анализ

              Однофакторный корреляционно-регрессионный анализ

              Результаты регрессионного анализа

              Корреляционная матрица

              Однофакторный регрессионный анализ с применением

                            «Мастера функций»

              Многофакторный корреляционно регрессионный анализ

              Результаты анализа

              Многофакторный регрессионный анализ с применением

                            «Мастера функций»

Ряды динамики

              Выравнивание методом скользящей средней

              Выравнивание методом укрупнения интервалов

              Выравнивание с применением линейной функции

              Выравниванием с применением параболической функции

                            второго порядка

              Выравнивание с применением показательной функции

              Выравнивание с применением гиперболической функции

              Характеристика сезонных колебаний

              Прогнозирование


Корреляционно- регрессионный анализ

 

              Имеются данные о производительности труда, среднегодовой численности ППП и фондовооруженности труда нескольких предприятий.

 

Производительность труда, тыс. руб., y

Среднегодовая числен-ность ППП, чел., x1

Фондовооруженность труда, тыс. руб., x2

9,26

26006

6,40

9,38

23935

7,80

12,11

22589

6,76

10,81

21220

7,90

9,35

7394

5,35

9,87

11586

9,90

8,17

26609

4,50

9,12

7801

4,88

5,88

11587

3,46

6,30

9475

3,60

6,22

10811

3,56

5,49

6371

5,65

6,50

29761

4,28

6,61

4210

8,85

4,32

3557

8,52

7,37

14148

7,19

7,07

9872

4,82

8,25

5975

5,46

8,15

16662

6,20

8,72

9166

4,25

6,64

15118

5,38

8,10

11429

5,88

5,52

6462

9,27

9,37

24628

4,36

13,17

49727

10,31


 


              Проведем визуальный анализ данных путем построения корреляционного поля зависимости производительности труда от среднегодовой численности ППП.

 

              Проанализировав данные и их графическое изображение, можно сделать предположение, что связь между ними линейная и она описывается уравнением прямой: ŷx = a0 + a1 ∙ x.

              Определяем параметры уравнения прямой на основе метода наименьших квадратов, решив систему нормальных уравнений:

              n ∙ a0 + a1 ∙ ∑x = ∑y,

              a0 ∙ ∑x + a1 ∙ ∑x2 = ∑yx.

              Вычисляем a0, a1, используя расчетные данные таблицы:

 

 

 

              Вычислив параметры получаем следующее уравнение:

ŷx = 6,0826 + 0,0001x.

              Следовательно, с увеличением среднегодовой численности ППП на 1 тыс. человек, производительность труда увеличится на 0,1 тыс. рублей.

              Значимость коэффициентов регрессии проверим по t-критерию Стьюдента. Вычислим расчетные значения t-критерия:

 

 

 

 

 

              Вычисленные значения сравниваем с критическим t по таблице Стьюдента с учетом уровня значимости α = 0,05 и числом степеней свободы ν = n-k-1 = 25-1-1 = 23. По таблице значение t = 2,069.

              Т.к. tрасч a0 = 18,3063 больше tтабл, параметр a0 признается значимым, т.е. в этом случае практически невероятно, что найденное значение параметра обусловлено только случайными совпадениями; tрасч a1 = 4,0079 больше tтабл, следовательно, параметр a1 признается значимым.

              Выявляем тесноту корреляционной связи между x и y с помощью линейного коэффициента корреляции:

 

 

 

 

              Т.к. r = 0,6413, то связь прямая, умеренная.

              Определяем значимость линейного коэффициента корреляции с помощью t-критерия Стьюдента:

 

 

              Т.к. tрасч = 4,0079 больше tтабл = 2,069, следовательно, коэффициент корреляции признается значимым.

              Определяем линейный коэффициент детерминации r2:

r2 = 0,64132 = 0,4112.

              Он показывает, что 41,12% вариации производительности труда обусловлено вариацией среднегодовой численности ППП.

              Рассчитываем среднюю ошибку аппроксимации:

 

 

              Определяем теоретическое корреляционное отношение η:

 

 

              Т.к. r = η, то считается, что линейная форма связи между y и x1 выбрана верно.

              Экономическую интерпретацию дополнит коэффициент эластичности:

 

 

              Это значит, что при увеличении среднегодовой численности ППП на 1% производительность труда возрастет на 0,2463%.

 


              Проведем визуальный анализ данных путем построения корреляционного поля зависимости производительности труда от фондовооруженности.

 

 

              Проанализировав данные и их графическое изображение, можно сделать предположение, что связь между ними линейная и она описывается уравнением прямой: ŷx = a0 + a1 ∙ x.

              Определяем параметры уравнения прямой на основе метода наименьших квадратов, решив систему нормальных уравнений:

              n ∙ a0 + a1 ∙ ∑x = ∑y,

              a0 ∙ ∑x + a1 ∙ ∑x2 = ∑yx.

              Вычисляем a0, a1, используя расчетные данные таблицы:

 

 

 

              Вычислив параметры получаем следующее уравнение:

ŷx = 6,1073 + 0,3175x.

              Следовательно, с увеличением фондовооруженности на 1 тыс. рублей, производительность труда увеличится на 0,3175 тыс. рублей.

              Значимость коэффициентов регрессии проверим по t-критерию Стьюдента. Вычислим расчетные значения t-критерия:

 

 

 

 

 

              Вычисленные значения сравниваем с критическим t по таблице Стьюдента с учетом уровня значимости α = 0,05 и числом степеней свободы ν = n-k-1 = 25-1-1 = 23. По таблице значение t = 2,069.

              Т.к. tрасч a0 = 14,8148 больше tтабл, параметр a0 признается значимым; tрасч a1 = 1,5419 меньше tтабл, следовательно, параметр a1 признается незначимым.

              Выявляем тесноту корреляционной связи между x и y с помощью линейного коэффициента корреляции:

 

 

 

 

              Т.к. r = 0,3061, то связь слабая.

              Определяем значимость линейного коэффициента корреляции с помощью t-критерия Стьюдента:

 

 

              Т.к. tрасч = 1,5419 меньше tтабл = 2,069, следовательно, коэффициент корреляции признается незначимым.

              Определяем линейный коэффициент детерминации r2:

r2 = 0,30612 = 0,0937.

              Он показывает, что 9,37% вариации производительности труда обусловлено вариацией фондовооруженности.

              Рассчитываем среднюю ошибку аппроксимации:

 

 

              Определяем теоретическое корреляционное отношение η:

 

 

              Т.к. r = η, то считается, что линейная форма связи между y и x2 выбрана верно.

              Экономическую интерпретацию дополнит коэффициент эластичности:

 

 

 

              Это значит, что при увеличении фондовооруженности на 1% производительность труда возрастет на 0,2432%.

 

 

Корреляционная матрица

 

 

Столбец 1

Столбец 2

Столбец 3

Столбец 1

1

 

 

Столбец 2

0,64126

1

 

Столбец 3

0,306081

0,1840157

1


 


Однофакторный регрессионный анализ с применением «Мастера функций»

 

Линейн для x1

0,000128683

6,082627

3,21071E-05

0,596893

0,411214963

1,661352

16,06349271

23

44,33670386

63,4821


 

Лгрфприбл для x1

1,00001506

6,187109

4,1606E-06

0,077348

0,36296843

0,215286

13,1049612

23

0,60738879

1,066004


 

Линейн для x2

0,317532

6,107271

0,205933

1,338004

0,093686

2,061212

2,377508

23

10,10107

97,71773


 

Лгрфприбл для x2

1,029555406

6,521075

0,026255461

0,170589

0,050791154

0,262794

1,230705503

23

0,084993556

1,588399


 


              Теоретический анализ исходных данных позволяет установить наличие причинно-следственной связи факторных признаков с результативным показателем.

              Строим многофакторное уравнение регрессии зависимости производительности труда от фондовооруженности и среднегодовой численности ППП.

              В общем виде уравнение линейной множественной регрессии имеет вид: ŷx = a0 +  + a1 ∙ x1 + a2 ∙ x2.

              Для расчета параметров уравнения записываем систему, подставляя в нее соответствующие значения из таблицы:

              25a0+386099a1+154,53a2=201,75,

              386099a0+8640350757a1+2481859,38a2=3460361,31,

              154,53a0+2481859,38a1+1055,3635a2=1278,8683.

              Решаем данную систему методом Гаусса:

              25                 386099                 154,53              | 201,751

              386099   8640350757   2481859,38  | 3460361,31             

              154,53                 2481859,38                 1055,3635              | 1278,8683

              1                15443,96                 6,1812                | 8,07

→              386099   86403507557   2481859,38  | 3460361,31             

              154,53                 2481859,38                  1055,3635    | 1278,8683

              1                15443,96                    6,1812          | 8,07

→              0                2677453244,96   95304,2412  | 3445542,38

              154,53   2481859,39                    1055,3635                  | 1278,8683

              1   15443,96                       6,1812                     | 8,07

→              0   2677453244,96   95304,2412  | 344542,38

              0   95304,2412         100,1827      | 31,8112

              1   15443,96                       6,1812                                    | 8,07

→              0   2677453244,96   95304,2412                      | 344542,38

              0  0                                     259151500424,8296  | 52336650578,9295

              2677453244,96   0                                    15077999108,8236  | 16286072987,0592

→              0                                 2677453244,96   95304,2412                     | 344542,38

              0                                 0                                     259151500424,8296  | 52336650578,9295

              693866025748712820365,2458                    0                                      0                    |

→              0                                                                            2677453244,96   95304,2412|

              0 693866025748712820365,24583616   0                                      0                    |

 

 

| 3431428279836766986619,1773

| 344542,38

| 52336650578,9295

              693866025748712820365,2458   0                                          0                                          |

→              0                                                              2677453244,96   0                                          |

              0                                                               0                                          259151500424,8296  |

| 3431428279836766986619,1773

| 84300769966567383,7757

| 52336650578,9295

              1   0   1  | 4,9453

→              0   1   0  | 0,0001

              0   0   1  | 0,202

              Полученные значения параметров подставляем в уравнение. Таким образом, получается уравнение следующего вида: ŷx = 4,9453+0,0001x1+0,202x2.

              Анализ коэффициентов уравнения множественной регрессии позволяет сделать вывод о степени влияния каждого из двух факторов на показатель производительности труда. Так, например, параметр a1 = 0,0001 свидетельствует о том, что с увеличением среднегодовой численности ППП на 1 тыс. человек следует ожидать повышение производительности труда на 0,1 тыс. рублей. Повышение фондовооруженности труда на 1 тыс. рублей может привести к увеличению производительности труда на a2 = 0,202 тыс. рублей.

              Далее, чтобы проверить коэффициент регрессии на значимость, рассчитываем значения t-критерия Стьюдента:

 

 

 

 

 

 

 

 

 

 

              Полученные значения t-критерия сравниваем с критическим значением t. По таблице распределения Стьюдента при уровне значимости α = 0,05 и степени свободы ν =  = n-k-1 = 22 значения t-критерия равно 2,074.

              Очевидно, что tрасч.a0>tтабл., а tрасч.a1 и tрасч.a2<tтабл..

              Это говорит о том, что параметры a1 и a2 не значимы. Таким образом, среднегодовая численность ППП и фондовооруженность не оказывают существенного влияния на производительность. Их влияние обусловлено случайностью. Поэтому их следует исключить из модели и заменить более значимыми.

              Находим парные коэффициенты корреляции: