Математика в экономике
Оглавление
Задача 1
Имеются данные, характеризующие выручку (у, млн. руб.) предприятия «АВС» в зависимости от капиталовложений (х, млн. руб.) за последние 10 лет.
Время, t |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 |
Выручка, у |
56,7 |
55,9 |
54,9 |
53,9 |
55,1 |
55,8 |
55,9 |
56,0 |
56,9 |
56,8 |
Объем капитало- |
20,1 |
20,3 |
20,4 |
20,2 |
20,6 |
20,9 |
21,1 |
21,8 |
23,4 |
22,8 |
- Построить поле корреляции.
- Найти параметры уравнения линейной регрессии ; дать экономическую интерпретацию параметров а и b.
- Составить уравнения нелинейных регрессий:
- гиперболической ;
- степной ;
- показательной
- Для каждой из моделей:
- найти коэффициент парной корреляции (для нелинейных регрессий – индекс корреляции);
- найти коэффициент детерминации;
- проверить значимость уравнения регрессии в целом с помощью F – критерия Фишера;
- найти среднюю относительную ошибку аппроксимации.
- Составить сводную таблицу вычислений; выбрать лучшую модель; дать интерпретацию рассчитанных характеристик.
- По лучшей модели составить прогноз на следующие два года показателя у (выручка), если х (объем капиталовложений) увеличивается на 10% по сравнению с последним годом.
- Построить графики уравнений регрессии; отметить точки прогноза.
Решение
Уравнение парной регрессии.
Строим поле корреляции
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Строим таблицу для расчета показателей
x |
y |
x2 |
y2 |
x · y |
20,1 |
56,7 |
404,01 |
3214,89 |
1139,67 |
20,3 |
55,9 |
412,09 |
3124,81 |
1134,77 |
20,4 |
54,9 |
416,16 |
3014,01 |
1119,96 |
20,2 |
53,9 |
408,04 |
2905,21 |
1088,78 |
20,6 |
55,1 |
424,36 |
3036,01 |
1135,06 |
20,9 |
55,8 |
436,81 |
3113,64 |
1166,22 |
21,1 |
55,9 |
445,21 |
3124,81 |
1179,49 |
21,8 |
56 |
475,24 |
3136 |
1220,8 |
23,4 |
56,9 |
547,56 |
3237,61 |
1331,46 |
22,8 |
56,8 |
519,84 |
3226,24 |
1295,04 |
211,6 |
557,9 |
4489,32 |
31133,23 |
11811,25 |
Для наших данных система уравнений имеет вид
10a + 211,6 b = 557,9
211,6 a + 4489,32 b = 11811,25
Решаем систему и получаем: b = 0,513, a = 44,9353
Уравнение регрессии (эмпирическое уравнение регрессии) имеет вид:
y = 0,513 x + 44,9353
Линия регрессии:
Параметры уравнения регрессии.
Выборочные средние.
x = ∑xi;n = 2116;10 = 2116; y = ∑yi;n = 5579;10 = 5579;
xy = ∑xiyi;n = 1181125;10 = 118113
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 448932;10 – 21162 = 119;
S2y = ∑y2i;n – y2 = 3113323;10 – 55792 = 08
Среднеквадратическое отклонение
Sx = S2x = 119 = 1089; Sy = S2y = 08 = 0894
Ковариация.
covxy = x·y – x·y = 118113 – 2116·5579 = 061
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
rxy = x·y –x·y ;Sx·Sy = 118113 – 2116·5579;1089·0894 = 0625
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X заметна и прямая.
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 0,51 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.51.
Коэффициент a = 44.94 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе – обратная). В нашем примере связь прямая.
Коэффициент детерминации,
R2= 0,6252 = 0,3908 т.е. в 39,08 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 60,92 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,25 |
0,83 |
2,11 |
20,3 |
55,9 |
55,35 |
0,0121 |
0,3 |
20,4 |
54,9 |
55,4 |
0,79 |
0,25 |
20,2 |
53,9 |
55,3 |
3,57 |
1,95 |
20,6 |
55,1 |
55,5 |
0,48 |
0,16 |
20,9 |
55,8 |
55,66 |
0,0001 |
0,0206 |
21,1 |
55,9 |
55,76 |
0,0121 |
0,0198 |
21,8 |
56 |
56,12 |
0,0441 |
0,014 |
23,4 |
56,9 |
56,94 |
1,23 |
0,00153 |
22,8 |
56,8 |
56,63 |
1,02 |
0,0285 |
211,6 |
557,9 |
557,9 |
7,99 |
4,87 |
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1; S2 = 487;8 = 0608
S2 = 0,608 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 0608 = 078
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии).
Sa – стандартное отклонение случайной величины a.
Sa = S ∑x2;n Sx
Sa = 078 448932;10 • 1089 = 48
Sb – стандартное отклонение случайной величины b.
Sb = S;n Sx
Sb = 0.78; 10 • 1.089 = 0.23
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика, Критерий Стьюдента,
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = 051;023 = 227
Поскольку 2,27 < 2,306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa
ta = 4494;48 = 937
Поскольку 9,37 > 2,306, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 487;799 = 03908
F = R2;1 – R2n – m –1;m
F = 03908;1 – 0390810–1–1;1 = 513
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 513 = 227
Гиперболическое уравнение регрессии имеет вид y = b/x + a
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид вид y = b/x + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
После линеаризации получим: y=bx + a
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑(1/x) = ∑y
a∑1/x + b∑(1/x2) = ∑y/x
1/x |
y |
1/x2 |
y2 |
y/x |
0,0498 |
56,7 |
0,00248 |
3214,89 |
2,82 |
0,0493 |
55,9 |
0,00243 |
3124,81 |
2,75 |
0,049 |
54,9 |
0,0024 |
3014,01 |
2,69 |
0,0495 |
53,9 |
0,00245 |
2905,21 |
2,67 |
0,0485 |
55,1 |
0,00236 |
3036,01 |
2,67 |
0,0478 |
55,8 |
0,00229 |
3113,64 |
2,67 |
0,0474 |
55,9 |
0,00225 |
3124,81 |
2,65 |
0,0459 |
56 |
0,0021 |
3136 |
2,57 |
0,0427 |
56,9 |
0,00183 |
3237,61 |
2,43 |
0,0439 |
56,8 |
0,00192 |
3226,24 |
2,49 |
0,47 |
557,9 |
0,0225 |
31133,23 |
26,42 |
Для наших данных система уравнений имеет вид
10a + 0,47 b = 557,9
0,47 a + 0,0225 b = 26,42
Решаем систему и получаем: b = –238,6259, a = 67,0958
Уравнение регрессии (эмпирическое уравнение регрессии):
y = –238,6259 / x + 67,0958
Линия регрессии
Выборочные средние.
x = ∑xi;n = 047;10 = 00474
y = ∑yi;n = 5579;10 = 5579
xy = ∑xiyi;n = 2642;10 = 264
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 00225;10 – 004742 = 50E–6
S2y = ∑y2i;n – y2 = 3113323;10 – 55792 = 08
Среднеквадратическое отклонение
Sx = S2x = 50E–6 = 000233
Sy = S2y = 08 = 0894
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
b = x • y–x • y;S2x = 264–00474 • 5579;50E–6 = –2386259
Эмпирическое корреляционное отношение.
η = ∑y – yx2; ∑yi – y2
η = 3088;799 = 0622
где
y – yx2 = 799 – 49 = 3088
Индекс корреляции.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
R = 1 – ∑yi – yx2; ∑yi – y2
R = 1 – 49;799 = 062
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 - ∑yi - yx2; ∑yi - y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации.
R2 = 1 – ∑yi – yx2; ∑yi – y2 ; R2 = 1– 49;799 = 0387
т,е, в 38,66 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 61.34 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,22 |
0,83 |
2,18 |
20,3 |
55,9 |
55,34 |
0,0121 |
0,31 |
20,4 |
54,9 |
55,4 |
0,79 |
0,25 |
20,2 |
53,9 |
55,28 |
3,57 |
1,91 |
20,6 |
55,1 |
55,51 |
0,48 |
0,17 |
20,9 |
55,8 |
55,68 |
0,0001 |
0,0148 |
21,1 |
55,9 |
55,79 |
0,0121 |
0,0129 |
21,8 |
56 |
56,15 |
0,0441 |
0,0224 |
23,4 |
56,9 |
56,9 |
1,23 |
4,0E–6 |
22,8 |
56,8 |
56,63 |
1,02 |
0,029 |
211,6 |
557,9 |
557,9 |
7,99 |
4,9 |
Оценка параметров уравнения регрессии.
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1
S2 = 49;8 = 0613
S2 = 0,613 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 0613 = 078
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии),
Sa – стандартное отклонение случайной величины a,
Sa = S ∑x2;n Sx
Sa = 078 00225;10 • 000233 = 505
Sb – стандартное отклонение случайной величины b,
Sb = S;n Sx
Sb = 078; 10 • 000233 = 10641
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика. Критерий Стьюдента.
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = –23863;10641 = 224
Поскольку 2.24 < 2.306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa
ta = 671;505 = 1329
Поскольку 13.29 > 2.306, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 49;799 = 03866
F = R2;1 – R2n – m –1;m
F = 03866;1 – 0386610–1–1;1 = 504
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 504 = 225
Степенное уравнение регрессии имеет вид y = a·xb
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = a xb + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
После линеаризации получим: ln(y) = ln(a) + b ln(x)
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
ln(x) |
ln(y) |
ln(x)2 |
ln(y)2 |
ln(x) • ln(y) |
3 |
4,04 |
9 |
16,3 |
12,12 |
3,01 |
4,02 |
9,06 |
16,19 |
12,11 |
3,02 |
4,01 |
9,09 |
16,04 |
12,08 |
3,01 |
3,99 |
9,03 |
15,9 |
11,98 |
3,03 |
4,01 |
9,15 |
16,07 |
12,13 |
3,04 |
4,02 |
9,24 |
16,17 |
12,23 |
3,05 |
4,02 |
9,3 |
16,19 |
12,27 |
3,08 |
4,03 |
9,5 |
16,2 |
12,41 |
3,15 |
4,04 |
9,94 |
16,33 |
12,74 |
3,13 |
4,04 |
9,78 |
16,32 |
12,63 |
30,51 |
40,21 |
93,1 |
161,72 |
122,69 |
Для наших данных система уравнений имеет вид
10a + 30,51 b = 40,21
30,51 a + 93,1 b = 122,69
Решаем систему и получаем: b = 0,1989, a = 3,4147
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e3,41467381x0,1989 = 30,40703x0,1989
Линия регрессии
Выборочные средние.
x = ∑xi;n = 3051;10 = 305
y = ∑yi;n = 4021;10 = 402
xy = ∑xiyi;n = 12269;10 = 1227
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 931;10 – 3052 = 000253
S2y = ∑y2i;n – y2 = 16172;10 – 4022 = 0000259
Среднеквадратическое отклонение
Sx = S2x = 000253 = 00503
Sy = S2y = 0000259 = 00161
Эмпирическое корреляционное отношение.
η = ∑y – yx2; ∑yi – y2
η = 311;799 = 0624
где
y – yx2 = 799 – 488 = 311
Индекс корреляции,
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
R = 1 – ∑yi – yx2; ∑yi – y2 ; R = 1 – 488;799 = 062
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 - ∑yi - yx2; ∑yi - y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации.
R2 = 1 – ∑yi – yx2; ∑yi – y2 ; R2 = 1– 488;799 = 0389
т.е. в 38.93 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 61,07 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу:
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,23 |
0,83 |
2,16 |
20,3 |
55,9 |
55,34 |
0,0121 |
0,32 |
20,4 |
54,9 |
55,39 |
0,79 |
0,24 |
20,2 |
53,9 |
55,28 |
3,57 |
1,92 |
20,6 |
55,1 |
55,5 |
0,48 |
0,16 |
20,9 |
55,8 |
55,66 |
0,0001 |
0,0196 |
21,1 |
55,9 |
55,77 |
0,0121 |
0,0181 |
21,8 |
56 |
56,13 |
0,0441 |
0,0166 |
23,4 |
56,9 |
56,92 |
1,23 |
0,000624 |
22,8 |
56,8 |
56,63 |
1,02 |
0,0283 |
211,6 |
557,9 |
557,86 |
7,99 |
4,88 |
Оценка параметров уравнения регрессии.
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1
S2 = 488;8 = 061
S2 = 0,61 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 061 = 078
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии),
Sa – стандартное отклонение случайной величины a,
Sa = S ∑x2;n Sx
Sa = 078 931;10 • 00503 = 1498
Sb – стандартное отклонение случайной величины b,
Sb = S;n Sx
Sb = 078; 10 • 00503 = 491
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика. Критерий Стьюдента.
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = 02;491 = 00405
Поскольку 0,0405 < 2,306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa ; ta = 341;1498 = 023
Поскольку 0.23 < 2.306, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 488;799 = 03893
F = R2;1 – R2n – m –1;m
F = 03893;1 – 0389310–1–1;1 = 51
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 51 = 226
Показательное уравнение регрессии имеет вид y = a·bx
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = a bx + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
После линеаризации получим: ln(y) = ln(a) + x ln(b)
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
x |
ln(y) |
x2 |
ln(y)2 |
x • ln(y) |
20,1 |
4,04 |
404,01 |
16,3 |
81,16 |
20,3 |
4,02 |
412,09 |
16,19 |
81,68 |
20,4 |
4,01 |
416,16 |
16,04 |
81,71 |
20,2 |
3,99 |
408,04 |
15,9 |
80,54 |
20,6 |
4,01 |
424,36 |
16,07 |
82,59 |
20,9 |
4,02 |
436,81 |
16,17 |
84,06 |
21,1 |
4,02 |
445,21 |
16,19 |
84,9 |
21,8 |
4,03 |
475,24 |
16,2 |
87,75 |
23,4 |
4,04 |
547,56 |
16,33 |
94,57 |
22,8 |
4,04 |
519,84 |
16,32 |
92,1 |
211,6 |
40,21 |
4489,32 |
161,72 |
851,05 |
Для наших данных система уравнений имеет вид
10a + 211,6 b = 40,21
211,6 a + 4489,32 b = 851,05
Решаем уравнение и получаем: b = 0,00921, a = 3,8267
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e3,82665604·e0,00921x = 45,90876·1,00925x
Линия регрессии
Выборочные средние.
x = ∑xi;n = 2116;10 = 2116
y = ∑yi;n = 4021;10 = 402
xy = ∑xiyi;n = 85105;10 = 8511
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 448932;10 – 21162 = 119
S2y = ∑y2i;n – y2 = 16172;10 – 4022 = 0000259
Среднеквадратическое отклонение
Sx = S2x = 119 = 1089
Sy = S2y = 0000259 = 00161
Эмпирическое корреляционное отношение.
η = ∑y – yx2; ∑yi – y2
η = 3124;799 = 0625
где
y – yx2 = 799 – 486 = 3124
Индекс корреляции.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
R = 1 – ∑yi – yx2; ∑yi – y2 ; R = 1 – 486;799 = 063
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 – ∑yi – yx2; ∑yi – y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации.
R2 = 1 – ∑yi – yx2; ∑yi – y2 ; R2 = 1– 486;799 = 0391
т,е, в 39,11 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 60,89 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу:
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,24 |
0,83 |
2,13 |
20,3 |
55,9 |
55,34 |
0,0121 |
0,31 |
20,4 |
54,9 |
55,39 |
0,79 |
0,24 |
20,2 |
53,9 |
55,29 |
3,57 |
1,94 |
20,6 |
55,1 |
55,5 |
0,48 |
0,16 |
20,9 |
55,8 |
55,65 |
0,0001 |
0,0227 |
21,1 |
55,9 |
55,75 |
0,0121 |
0,0219 |
21,8 |
56 |
56,11 |
0,0441 |
0,0126 |
23,4 |
56,9 |
56,95 |
1,23 |
0,00204 |
22,8 |
56,8 |
56,63 |
1,02 |
0,0284 |
211,6 |
557,9 |
557,86 |
7,99 |
4,86 |
Оценка параметров уравнения регрессии.
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1
S2 = 486;8 = 0608
S2 = 0.608 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 0.608 = 0.78
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии),
Sa – стандартное отклонение случайной величины a,
Sa = S ∑x2;n Sx
Sa = 078 448932;10 • 1089 = 48
Sb – стандартное отклонение случайной величины b.
Sb = S;n Sx
Sb = 078; 10 • 1089 = 023
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика. Критерий Стьюдента.
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = 000921;023 = 00407
Поскольку 0,0407 < 2,306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa
ta = 383;48 = 08
Поскольку 0,8 < 2,306, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 486;799 = 03911
F = R2;1 – R2n – m –1;m
F = 03911;1 – 0391110–1–1;1 = 514
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 514 = 227
Параметры |
Модель | |||
линейная |
гиперболическая |
степенная |
показательная | |
y = 0,513 x + 44,9353 |
y = –238,6259 / x + 67,0958 |
y = e3,41467381x0,1989 = 30,40703x0,1989 |
y = e3,82665604·e0,00921x = 45,90876·1,00925x | |
Ryx |
0,625 |
0,62 |
0,62 |
0,63 |
Ryx2 |
0,3908 |
0,387 |
0,389 |
0,391 |
Fрасч |
5,13 |
5,1 |
5,1 |
5,14 |

- Математика и естествознание
- Математика (Основы экономического моделирования и исследование операций)
- Математическая задача
- Математическая логика
- Математическая логика
- Математическая модель анализа политики заемных средств
- Математическая модель выбора кондиционеров типа настенных сплит-систем
- Масштаб цен
- Масштабы деятельности ТНК и их роль в мировой экономике
- Масштабы, динамика, темпы капитальных вложений в РФ. Оценка ситуации,проблемы
- Масштабы, динамика, темпы капитальных вложений в РФ. Оценка сложившейся ситуации, проблемы
- Масштабы и динамика развития иностранного инвестирования
- Матвей Яковливич Мудров
- Математика в спеціальній школі