Кореляционно-регрессионный анализ
На основании данных, приведенных в табл. 1:
1. Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.
2. Осуществите двумя способами выбор факторных признаков для построения регрессионной модели:
а) на основе анализа матрицы коэффициентов парной корреляции, включая проверку гипотезы о независимости объясняющих переменных (тест на выявление мультиколлинеарности Фаррара–Глоубера);
б) с помощью пошагового отбора методом исключения.
3. Постройте уравнение множественной регрессии в линейной форме с выбранными факторами. Дайте экономическую интерпретацию коэффициентов модели регрессии.
4. Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, b- и D-коэффициентов.
5. Рассчитайте параметры линейной парной регрессии для наиболее подходящего фактора Хj.
6. Оцените качество построенной модели с помощью коэффициента детерминации, F-критерия Фишера.
7. Проверьте выполнение условия гомоскедастичности.
8. Используя результаты регрессионного анализа ранжируйте компании по степени эффективности.
9. Осуществите прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора Хj составит 80% от его максимального значения. Представьте на графике фактические данные Y, результаты моделирования, прогнозные оценки и границы доверительного интервала.
10. Составьте уравнения нелинейной регрессии:
а) гиперболической;
б) степенной;
в) показательной.
11. Приведите графики построенных уравнений регрессии.
12. Для нелинейных моделей найдите коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравните модели по этим характеристикам и сделайте вывод о лучшей модели.
Таблица 1. Исходные данные
ОАО по добыче сырой нефти и природного газа; предоставление услуг в этих областях |
№ п/п |
Прибыль (убыток) |
Долгосрочные обязательства |
Основные средства |
Дебиторская задолженность (краткосрочная) |
Y |
Х1 |
Х4 |
Х5 | ||
Аганнефтегазгеология, ОАО, многопрофильная компания |
1 |
1 440 075 |
61 749 |
5 165 712 |
3 490 541 |
Азнакаевский горизонт, ОАО |
2 |
5 146 |
17 532 |
19 595 |
23 014 |
Акмай,ОАО |
3 |
13 612 |
20 268 |
81 072 |
8 678 |
Аксоль, ОАО, производственно-коммерческая фирма |
4 |
964 |
211 |
8 446 |
4 821 |
Акционерная нефтяная компания "Башнефть", ОАО |
5 |
19 513 178 |
52 034 182 |
47 002 385 |
23 780 450 |
АЛРОСА-Газ, ОАО |
6 |
28 973 |
602 229 |
1 545 052 |
204 181 |
Арктическая газовая компания,ОАО |
7 |
-780 599 |
311 268 |
740 437 |
1 456 438 |
Барьеганнефтегаз, ОАО |
8 |
2 598 165 |
464 651 |
11 925 177 |
5 566 412 |
Белкамнефть,ОАО |
9 |
628 091 |
214 411 |
2 580 485 |
4 285 041 |
Белорусское управление по повышению нефтеотдачи пластов и капитальному ремонту скважин, ОАО |
10 |
29 204 |
12 039 |
269 908 |
624 393 |
Битран, ОАО |
11 |
1 945 560 |
9 670 |
229 855 |
2 918 345 |
Богородскнефть, ОАО |
12 |
366 170 |
287 992 |
349 643 |
484 537 |
Братсэкогаз, ОАО |
13 |
-20 493 |
1 105 293 |
934 881 |
9 865 |
Булгарнефть,ОАО |
14 |
381 558 |
27 265 |
697 664 |
196 045 |
Варьеганнефть,ОАО |
15 |
1 225 908 |
431 231 |
2 231 651 |
1 095 263 |
Верхнечонскнефтьгаз, ОАО |
16 |
3 293 989 |
37 315 847 |
23 170 344 |
2 477 424 |
Восточная транснациональная компания,ОАО |
17 |
416 616 |
2 122 138 |
3 509 537 |
48 174 |
Восточно-Сибирская нефтегазова |
18 |
-564 258 |
1 395 080 |
1 290 245 |
286 058 |
Геолого-разведочный |
19 |
221 194 |
13 429 |
607 249 |
72 854 |
Грознефтьгаз,ОАО |
20 |
701 035 |
75 554 |
4 616 250 |
1 304 084 |
Губкинский газоперерабатывающий комплекс,ОАО |
21 |
62 200 |
22 195 |
991 114 |
294 575 |
Дагнефтьгаз,ОАО |
22 |
123 440 |
12 350 |
438 262 |
44 889 |
Елабуганефть,ОАО |
23 |
55 528 |
14 686 |
75 442 |
24 275 |
Иделойл,ОАО |
24 |
422 070 |
52 443 |
1 269 731 |
140 535 |
Избербашнефть,ОАО |
25 |
-468 |
239 255 |
10 870 |
114 444 |
Инвестиционная нефтяная компания,ОАО |
26 |
225 452 |
1 292 |
227 132 |
272 147 |
Инга,ОАО |
27 |
-61 237 |
924 951 |
110 970 |
76 561 |
Каббалкнефть,ОАО |
28 |
-540 |
0 |
21 278 |
25 017 |
Калининграднефть,ОАО |
29 |
40 588 |
1 638 |
139 209 |
18 072 |
Камчатгазпром,ОАО |
30 |
53 182 |
54 758 |
113 113 |
496 994 |
Кировское нефтегазодобывающееуправление, |
31 |
-210 |
8 |
12 685 |
602 |
Когалымнефтепрогресс,ОАО |
32 |
63 058 |
235 731 |
873 886 |
474 612 |
Комнедра,ОАО |
33 |
1 197 196 |
2 232 742 |
2 307 478 |
1 040 387 |
Кондурчанефть,ОАО |
34 |
221 177 |
4 682 |
331 954 |
55 155 |
Корпорация"Югранефть",ОАО |
35 |
1 548 768 |
84 262 |
1 138 707 |
7 613 662 |
Краснодарское опытно-экспериментальное управление по повышению нефтеотдачи пластов и капитальному ремонту скважин,ОАО |
36 |
-33 030 |
106 |
16 705 |
5 038 |
Ленинграсланец,ОАО |
37 |
-34 929 |
103 567 |
393 717 |
61 353 |
Меллянефть,ОАО |
38 |
115 847 |
275 386 |
517 290 |
122 062 |
МНКТ,ОАО |
39 |
35 198 |
20 624 |
484 228 |
168 314 |
Мохтикнефть,ОАО |
40 |
788 567 |
33 879 |
42 613 |
317 153 |
Научно-производственное объяединение" |
41 |
309 053 |
99 670 |
18 776 |
212 882 |
Научно-производственное предприятие"Бурсервис",ОАО |
42 |
8 552 |
257 |
12 381 |
63 550 |
НГДУ"Пензанефть",ОАО |
43 |
173 079 |
6 120 |
176 126 |
147 549 |
Негуснефть,ОАО |
44 |
1 227 017 |
33 757 |
2 063 285 |
171 162 |
Ненецкая нефтяная компания,ОАО |
45 |
701 728 |
381 050 |
59 353 |
237 083 |
Нефтебурсервис,ОАО |
46 |
17 927 |
53 260 |
84 818 |
73 343 |
Нефтегазовая компания" |
47 |
2 557 698 |
4 537 040 |
3 841 845 |
33 477 251 |
Нефтеразведка,ОАО |
48 |
0 |
194 091 |
33 112 |
15 161 |
Нефть,ОАО |
49 |
5 406 |
1 185 |
38 560 |
7 540 |
Нефтьинвест,ОАО |
50 |
40 997 |
101 706 |
178 604 |
58 762 |
Решение.
Задание № 1.
Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.
С помощью средств MS excel построим диаграмму рассеяния. Возьмём данные из таблицы 1 и перенесём их в MS excel. Выделим область Y и X1 в области меню нажмём вставка->Точечная диаграмма. Такую же последовательность действий сделаем с Х4 и Х5. Результаты отразим на рисунках 1,2,3.
Рисунок1. Диаграмма рассеяния зависимости Y от фактора X1
Связь прямая и сильная (R2=0,752)
Рисунок2. Диаграмма рассеяния зависимости Y от фактора X4
Связь прямая и сильная (R2=0,878)
Рисунок 3. Диаграмма рассеяния зависимости Y от фактора X5
Связь прямая и слабая (R2 = 0,428).
Задание №2. а) Корреляционный анализ данных.
Прибыль (убыток) – это зависимая переменная Y (тыс. руб.).
Независимые, объясняющие переменные:
X1 – долгосрочные обязательства, руб.;
X4 – основные средства, руб.;
X5 – дебиторская задолженность (краткосрочные), руб.
Количество наблюдений n = 50, количество объясняющих переменных m = 3.
Для проведения корреляционного анализа используем инструмент Корреляция (надстройка Анализ данных Excel).
В результате будет получена матрица коэффициентов парной корреляции (табл. 2).
Таблица 2. Результат корреляционного анализа
Анализ показывает, что зависимая переменная, то есть прибыль (убыток), имеет весьма тесную связь с основными средствами (ryx4 = 0,937) и тесную связь с долгосрочными обязательствами (ryx1 = 0,867). Фактор Х5 имеет слабую связь с зависимой переменной и его не рекомендуется включать в модель регрессии.
Затем перейдем к анализу
остальных столбцов матрицы с
целью выявления
Таким образом, на основе анализа только корреляционной матрицы остаются два фактора – Основные средства и Долгосрочные обязательства (n = 50, k =2).
Одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Мультиколлинеарность приводит к неопределенности значений параметров и к неустойчивости их оценок. Неустойчивость выражается в увеличении статистической неопределенности, в связи с чем конкретные результаты оценки могут сильно различаться.
Для выявления мультиколлинеарности выполняем тест Фаррара–Глоубера по факторам Х1, Х4, Х5.
1)Проверка наличия мультиколлинеарности всего массива переменных
1. Построим матрицу межфакторных корреляций R1 (табл. 3) и найдем ее определитель с помощью функции МОПРЕД.
Таблица 3. Матрица R1
X1 |
X4 |
X5 | ||
R1 = |
Долгосрочные обязательства |
Основные средства |
Дебиторская задолженность (краткосрочная) | |
X1 |
Долгосрочные обязательства |
1 |
0,952609806 |
0,507984957 |
X4 |
Основные средства |
0,952609806 |
1 |
0,565025248 |
X5 |
Дебиторская задолженность (краткосрочная) |
0,507984957 |
0,565025248 |
1 |
2. Вычислим наблюдаемое
значение статистики Фаррара–
где n = 50 – количество наблюдений;
k = 3 – количество факторов.
Фактическое значение этого критерия FGнабл сравниваем с табличным значением χ2 при степени свободы и уровне значимости α = 0,05. Табличное значение χ2 можно найти с помощью функции ХИ2ОБР (рис. 1).
Рис. 1. Получение табличного значения χ2
Так как FGнабл > FGкрит (131,09 > 7,81), то в массиве объясняющих переменных существует мультиколлинеарность.
2)Проверка наличия мультиколлинеарности каждой переменной с другими переменными
1. Вычислим обратную матрицу.
Для этого воспользуемся
X1 |
X4 |
X5 | ||
Долгосрочные обязательства |
Основные средства |
Дебиторская задолженность (краткосрочная) | ||
Долгосрочные обязательства |
10,96621798 |
-10,72198798 |
0,487520145 | |
X4 |
Основные средства |
-10,72198798 |
11,95217291 |
-1,306670865 |
X5 |
Дебиторская задолженность (краткосрочная) |
0,487520145 |
-1,306670865 |
1,49064913 |
2. Вычислим F-критерии , где cjj – диагональные элементы матрицы C:
3. Фактические значения F-критериев сравниваем с табличным значением (функция FРАСПОБР) Fтабл = 2,807 при n1 = 3 и n2 = (n – k – 1) = 46 степенях свободы и уровне значимости α = 0,05, где k – количество факторов.
4. Так как F1 > Fтабл и F4 > Fтабл, то независимые переменные Х1 и Х4 мультиколлинеарны.
3)Проверка наличия мультиколлинеарности каждой пары переменных
1. Вычислим частные коэффициенты корреляции по формуле , где cjj – элементы матрицы C:
2. Вычислим t-критерии по формуле :
t1,4 = 18,028;
t1,5 = -0,821;
t4,5 = 2,211;
Фактические значения t-критериев сравниваются с табличным значением (функция СТЬЮДРАСПОБР) при степенях свободы (n – k – 1)=46 и уровне значимости α = 0,05: tтабл = 2,013. Так как | t1,4 | > tтабл и r1,4 = 0,936 "1, то между независимыми переменными Х1 и Х4 существует мультиколлинеарность.
Для того, чтобы избавиться от мультиколлинеарности, нужно исключить одну из переменных мультиколлинеарной пары Х4, Х6. Удалить следует переменную Х4, так как у нее больше значение F-критерия. Следовательно, она больше влияет на общую мультиколлинеарность факторов.
Выводы, сделанные ранее только на основе корреляционной матрицы различаются с результатами теста Фаррара–Глоубера, после его выполнения делаем выбор в пользу двух факторов Х1 и Х5.
Получим следующую модель регрессии: Ŷ = 81259,86 + 0,2269Х1 + 0,1394Х5
б) Выбор факторных признаков для построения регрессионной модели методом исключения.
Для проведения регрессионного анализа используем инструмент Регрессия (надстройка Анализ данных в Excel).
На первом шаге строится модель регрессии по всем факторам:
Ŷ = - 165474,89 – 0,068Х1 + 0,397Х4 + 0,084Х5
(0,05) (0,06) (0,03)
В скобках указаны значения стандартных ошибок коэффициентов регрессии.
Фрагмент протокола
Таблица 4. Модель регрессии по трем факторам
После построения уравнения регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьший по абсолютной величине коэффициент t при 5%-ном уровне значимости, а именно Х1. Все остальные регрессионные коэффициенты значимы, так как табличное значение критерия Стьюдента равно: tтабл (α = 0,01; df = n – k-1 = 46) = 2,69 и tрасч > tтабл
Таблица 5. Модель регрессии со значимыми факторами
Получаем уравнение регрессии, коэффициенты которого значимы не только при 5%-ном уровне значимости, но и при 1%-ном уровне значимости:
Ŷ = - 120917,83 + 0,32Х4 + 0,09Х5
(0,02) (0,03)
Сравнивая результаты выбора факторных признаков для построения регрессионной модели: а) на основе анализа матрицы коэффициентов парной корреляции с проверкой гипотезы о независимости объясняющих переменных на основе теста Фаррара–Глоубера и б) методом исключения приходим к выводу о необходимости применения теста на выбор «длинной» и «короткой» регрессии.
Этот тест используется для отбора наиболее существенных объясняющих переменных. Иногда переход от большего числа исходных показателей анализируемой системы к меньшему числу наиболее информативных факторов может быть объяснен дублированием информации, из-за сильно взаимосвязанных факторов. Стремление к построению более простой модели приводит к идее уменьшения размерности модели без потери ее качества. Для этого используют тест проверки «длинной» и «короткой» регрессий.
Алгоритм проверки следующий:
1. Построим по МНК «длинную» регрессию по всем факторам Х1, Х4, Х5 и найдем для нее сумму квадратов остатков ESSдлин.
2. Построим по МНК «короткую» регрессию по факторам Х1, Х5 и найдем для нее сумму квадратов остатков ESSкор(2,6) и вычислим F-статистику.
3. Построим по МНК «короткую» регрессию по факторам Х4, Х5 и найдем для нее сумму квадратов остатков ESSкор(4,6) и вычислим F-статистику.
4. Если Fнабл > Fтабл (α, ν1 = q, ν2 = n – k – 1), то выбираем «длинную» регрессию, в противном случае – «короткую» регрессию.
На основании данных сравним три модели – «длинную» (с факторами X1, X4, X5) и две «короткие» (с факторами X1, X5 и Х4, Х5).
1) Построим «длинную» регрессию по всем факторам X2, X4, X6 и найдем для нее сумму квадратов остатков ESSдлин , а также рассчитаем Fтабл с помощью функции FРАСПОБР.
2) Построим «короткую» регрессию по факторам X1, X5 и найдем для нее сумму квадратов остатков ESSкор , а также вычислим Fнабл(1,5) .
3) Построим «короткую» регрессию по факторам X4, X5 и найдем для нее сумму квадратов остатков ESSкор , а также вычислим Fнабл(4,6) .
4) Так как Fнабл(4,5) < Fтабл < Fнабл(1,5) (2,08 < 4,052 < 44,30), выбираем «короткую» регрессию с факторами Х4, Х5.
Ŷ = - 120917,83 + 0,32Х4 + 0,09Х5
3. Построение уравнения множественной регрессии в линейной форме с выбранными факторами.
Для учета влияния факторов, воздействующих на прибыль (убыток) от добычи сырой нефти и природного газа используется множественная регрессия:
yi = a0 + a1· xi1 + a2· xi2 + … + aj · xij +…+ am· xim + εi ,
где i = 1,2,…,n – номер наблюдения,
j = 1,2,…,m – номер фактора,
Уравнение множественной регрессии рассчитываем с помощью функции ЛИНЕЙН.
Ŷ = - 120 917,83 + 0,32Х4 + 0,09Х5
Коэффициент регрессии при каждом из двух факторов характеризует среднее изменение Прибыли (убытка) Y с изменением Основных средств X4 и Дебиторской задолженности (краткосрочной) X5 на одну единицу, при условии, что другой не изменяется. Например, величина, равная 0,09 (коэффициент при X5), показывает, что при увеличении запасов готовой продукции и товаров для перепродажи на 1000 руб. прибыль увеличится на 0,09 тыс. руб.
Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения, или из последней таблицы регрессионного анализа Вывод остатка (столбец Предсказанное Y).
4. Сравнительная оценка силы связи факторов с результатом с помощью коэффициентов эластичности, b- и D-коэффициентов.
Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения и разной колеблемости факторов, используем коэффициенты эластичности и бета-коэффициенты:
Э4 = 0,32 ´ 2467176,64 / 826148,04 = 0,81;
Э5 = 0,09 ´ 1883334,96 / 826148,04 = 0,21.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
β4 = 0,32 ´ 7413147,46 / 2811671,66 = 0,71;
β5 = 0,09 ´ 5804522,84 / 2811671,66 = 0,19.
Бета-коэффициент с
Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэффициентов Dj:
D4 = 0,953 × 0,71 / 0,91 = 0,74;
D5 = 0,508 × 0,19 / 0,91 = 0,106.
Вывод: на прибыль (убыток) более сильное влияние оказывает фактор Основные средства.
5. Расчет параметров линейной парной регрессии для наиболее подходящего фактора Хj.
Уравнение линейной регрессии имеет следующий вид:
yрасч = a0 + a1·x
Найдем значения параметров модели:
…
yрасч = -50626,66 + 0,36∙х4
С увеличением основных средств Х4 на 1 млн. руб. прибыль Y увеличится в среднем на 360 тыс. руб., что свидетельствует об эффективной работе предприятий по добыче сырой нефти и природного газа.
6. Оценка качества построенной модели с помощью коэффициента детерминации, F-критерия Фишера.
Для модели линейной парной регрессии:
– значение коэффициента детерминации можно вычислить по формуле:
Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемого фактора. Следовательно, вариация прибыли (убытка) Y на 87,8 % объясняется вариацией фактора X4 – основных средств.
– значение F-критерия Фишера можно вычислить по формуле:
Табличное значение F-критерия при доверительной вероятности α = 0,05 и числе степеней свободы, равном k1= m =1 и k2 = n - m -1= 50 - 1- 1=48 составляет 4,04.
Поскольку Fрасч > Fтабл, уравнение регрессии с вероятностью 0,95 следует признать значимым, то есть его можно использовать для анализа и прогнозирования.
7. Проверка выполнения условия гомоскедастичности.
Гомоскедастичность – дисперсия каждого отклонения одинакова для всех Х.
Проверка на гомоскедастичность осуществляется с помощью теста Гольдфельда–Квандта.
График можно получить
в отчете, который формируется
в результате использования инструмента Регр
Рис. 2. График остатков
1. Упорядочим переменную Y по возрастанию фактора X4 (в Excel для этого можно использовать команду Данные – Сортировка – по возрастанию X4):
2. Уберем из середины упорядоченной совокупности С = 1/4 · n = 1/4 · 50 = 12 значений. В результате получим две совокупности соответственно с малыми и большими значениями Х4.
3. Для каждой совокупности
выполним расчеты. Результаты
получены с помощью
4. Найдем отношение полученных остаточных сумм квадратов (в числителе должна быть большая сумма):
Fнабл = 40418798738560,10 / 536978115257,97 =75,27.
5. Вывод о наличии
Так как , то подтверждается гетероскедастичность в остатках двухфакторной регрессии.
Проблема гетероскедастичности в большей степени характерна для перекрестных данных и довольно редко встречается при рассмотрении временных рядов. Это можно объяснить следующим образом: при перекрестных данных учитываются экономические субъекты (потребители, домохозяйства, фирмы, отрасли, страны и т. п.), имеющие различные доходы, размеры, потребности. Но в этом случае возможны проблемы, связанные с эффектом масштаба.
Во временных рядах обычно рассматриваются одни и те же показатели в различные моменты времени (например, ВНП, чистый экспорт, темпы инфляции и т. д. в определенном регионе за определенный период времени). Однако при увеличении (уменьшении) рассматриваемых показателей с течением времени может также возникнуть проблема гетероскедастичности.
8. Используя результаты регрессионного анализа, выполнение ранжирования компаний по степени эффективности.
Эффективность деятельности компаний по добыче сырой нефти и природного газа определяется прибылью. Упорядочим переменные, воспользовавшись командой Данные – Сортировка – по возрастанию Прибыль (убыток).
…
Далее с помощью инструмента Регрессия проанализируем вывод остатка по нашим данным.
В результате по степени эффективности:
– на первом месте находится предприятие №5;
– на втором месте находится предприятие №16;
– на третьем месте находится предприятие № 8.
9. Осуществление прогнозирования среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора Хj составит 80% от его максимального значения. Представление на графике фактических данных Y, результатов моделирования, прогнозных оценок и границ доверительного интервала.
Прогнозируемое значение
переменной получается при подстановке
в уравнение регрессии
Для того, чтобы осуществить прогноз, необходимо рассчитать интервалы, в которых будет находиться значение показателя. Воспользуемся формулой:
Расчет элементов данной формулы представлен ниже:
…
E53 = СУММ (E3:E52)
F53 = (B53-B54)^2
Регрессионная статистика:
…
Критерий Стьюдента = 1,68 (СТЬЮДРАСПОБР (0,1;48).
Стандартная ошибка (из Регрессионной статистики) = 992604,61.
Интервал U по формуле = 1683248,20.
В результате получаем: -1733846,44 < Yпрогн < 1632649,97.
Таким образом, с вероятностью 90% прибыль (убыток) в среднем составит от -1733846,44 млн руб. до 1632649,97 млн руб. при основных средствах, составляющих 80% от максимального значения показателя.
Полученные данные представим на графике:
Рис.3. График прогноза показателя «Прибыль (убыток)» с помощью Мастера диаграмм.
10. Составление уравнения нелинейной регрессии:
а) гиперболической;
б) степенной;
в) показательной.
а) Уравнение гиперболической модели:
ŷ = a0 + a1 / x .
Для построения этой модели произведем ее линеаризацию путем замены переменных: X= 1 / x .
Получим линейное уравнение регрессии:
ŷ = a0 + a1 ·X.
Далее рассчитаем параметры модели с помощью регрессии.
Уравнение гиперболической модели:
ŷ = 1069444 – 15776768621,62 / х
б) Уравнение степенной модели:
ŷ = a0·x a1.
Произведем линеаризацию
уравнения путем
lg ŷ = lg a0 + a1· lg x .
Обозначим: Y = lg ŷ, A = lg a0 , X = lg x.
С учетом этого получим линейное уравнение регрессии:
Y = A + a1 · X
Далее рассчитаем параметры модели.
Уравнение регрессии имеет вид:
Перейдем к исходным переменным x и y, выполнив потенцирование последнего уравнения: ŷ = 10-7503314,6·x 652996,55.
Тогда окончательно имеем уравнение степенной модели:
в) Уравнение показательной кривой:
ŷ = a0·a1 x.
Для построения этой модели произведем линеаризацию путем логарифмирования обеих частей уравнения:
lg ŷ = lg a0 + x · lg a1
Обозначим Y = lg ŷ, A = lg a0 , B = lg a1.
Получим линейное уравнение регрессии: Y = A + B ·x .
Далее рассчитаем параметры модели.
Уравнение будет иметь вид: Y=11,03 + 0,0000017·x
Выполним потенцирование и перейдем к исходным переменным x и y:
ŷ = 1011,03 · (100,0000017) x = 106 025 715 881,33· 1,00000038 x
11. Приведение графиков построенных уравнений регрессии.
12. Для нелинейных моделей нахождение коэффициентов детерминации и средних относительных ошибок аппроксимации. Сравнение модели по этим характеристикам и вывод о лучшей модели.
а) гиперболическая модель:
б) степенная модель:
в) показательная модель:
Для выбора лучшей модели строим сводную таблицу результатов расчета:
Параметры Модель |
Коэффициент детермин. R2 |
Средняя отн. Ошибка εотн |
|
Линейная |
0,878 |
0,028 |
Степенная |
0,233 |
0,000 |
Показательная |
0,172 |
1,99997 |
Гиперболическая |
0,024 |
0,000054 |
Вывод. Большее значения коэффициента детерминации R2 имеет линейная модель. По значению ошибки аппроксимации все модели практически одинаковы. Выбор сделаем в пользу линейной модели, т.к. по сравнению с другими она всё же самая лучшая.

- Коренной перелом в Великой Отечественной войне
- Коренной перелом в Великой Отечественной войне
- Коренной перелом в Великой Отечественной войны: битва под Сталинградом, сражение на Курской дуге
- Коренные жители Южного Урала (первобытное общество)
- Корисна та шкідлива деформація в автомобільному транспорті
- Корисні копалини України
- Корковая дизартрия
- Копченые рыбные товары
- Копченые рыбные товары. Классификация, ассортимент. Оценка качества, возможные дефекты
- Корабли в эпоху великих географических открытий
- Корейская война (1950-1953 гг)
- Корейская война 1950-1953 г. и Советский союз
- Корейская война, как первый опт эпохи "Холодный войны". Высадка войск ООН в Корее. Роскол Кореи
- Корелляционный анализ