Анализ зависимости валового дохода от стоимости основных фондов предприятия
Творческое задание № 5
«Анализ зависимости валового дохода от стоимости основных фондов предприятия»
Пояснение к ТЗ
Для выполнения работы необходимо собрать или использовать готовые данные о величинах валового дохода различных предприятий и организаций и стоимостях их основных фондов. Объем выборки должен содержать не менее 15 наблюдений. В качестве статистических наблюдений можно использовать данные статистических исследований, опубликованные в научных журналах и на специализированных сайтах. Затем необходимо провести обработку данных по следующей схеме:
- Построить поле корреляции и сформулировать гипотезу о форме связи.
- Рассчитать параметры уравнений линейной, степенной и экспоненциальной парной регрессий.
- Оценить тесноту связи с помощью показателей корреляции и детерминации.
- Оценить качество уравнений с помощью средней ошибки аппроксимации.
- С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования. Выбрать лучшее уравнение регрессии и дать его обоснование.
- Рассчитать прогнозное значение результата, при условии , что прогнозное значение фактора увеличится на 10% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости 0,05.
Работу нужно выполнить в двух вариантах. Вариант 1: работа выполняется вручную, все необходимые расчеты проводятся с помощью калькулятора или ППП Excel (но в функции калькулятора). Вариант 2: Решение задачи с помощью ППП Excel с использованием статистических функций. В заключении сравнение результатов, полученных в двух вариантах расчетов.
Предприятия легкой промышленности (на 01.01.2017). Источник данных «Центр раскрытия корпоративной информации» (e-disclosure.ru).
тыс. руб.
№ |
Название |
Город |
Величина валового дохода |
Остаточная стоимость основных фондов |
ОАО "ДО "Орел" |
г. Домодедово |
32769 |
10069 | |
АО "Волжанка" |
г. Саратов |
33932 |
26140 | |
ОАО "Заря" |
г. Владивосток |
130874 |
506456 | |
ПАО "Митра" |
г.Горбатов |
19123 |
6659 | |
ОАО "Коломнатекмаш" |
г. Коломна |
93540 |
112809 | |
ОАО "Обувная фабрика "Спартак" |
г.Казань |
559051 |
1127041 | |
ОАО "Павловопосадская платочная мануфактура" |
г. Павловский Посад |
846064 |
172961 | |
ОАО "Адонис" |
г.Казань |
41182 |
0 | |
АО "ТП "КРАСНЫЙ ВОСТОК" |
г. Москва |
41875 |
2495 | |
ОАО "Трехгорная мануфактура" |
г. Москва |
1437649 |
317539 | |
АО "Красный Перекоп" |
г.Ярославль |
456915 |
68411 | |
ОАО "Павлово-Посадский камвольщик" |
г.Павловский Посад |
282241 |
57020 | |
ОАО "Никологорская швейная фабрика" |
п. Никологоры |
2605 |
2660 | |
ОАО БШФ "Россиянка" |
г. Белгород |
64742 |
12509 | |
ПАО «Победа труда» |
г. Москва |
94020 |
23295 |
- Построить поле корреляции и сформулировать гипотезу о форме связи.
Величина валового дохода, Y |
Остаточная стоимость основных фондов, X |
32769 |
10069 |
33932 |
26140 |
130874 |
506456 |
19123 |
6659 |
93540 |
112809 |
559051 |
1127041 |
846064 |
172961 |
41182 |
0 |
41875 |
2495 |
1437649 |
317539 |
456915 |
68411 |
282241 |
57020 |
2605 |
2660 |
64742 |
12509 |
94020 |
23295 |
По графику видно, что зависимость валового дохода от остаточной стоимости ОФ является нелинейной.
- Рассчитать параметры уравнений линейной, степенной и экспоненциальной парной регрессий.
Линейное уравнение регрессии имеет вид y = bx + a
Система нормальных уравнений.
an + b∑x = ∑y
a∑x + b∑x2 = ∑yx
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x • y |
10069 |
32769 |
101384761 |
1073807361 |
329951061 |
26140 |
33932 |
683299600 |
1151380624 |
886982480 |
506456 |
130874 |
256497679936 |
17128003876 |
66281922544 |
6659 |
19123 |
44342281 |
365689129 |
127340057 |
112809 |
93540 |
12725870481 |
8749731600 |
10552153860 |
1127041 |
559051 |
1270221415681 |
312538020601 |
630073398091 |
172961 |
846064 |
29915507521 |
715824292096 |
146336075504 |
0 |
41182 |
0 |
1695957124 |
0 |
2495 |
41875 |
6225025 |
1753515625 |
104478125 |
317539 |
1437649 |
100831016521 |
2066834647201 |
456509625811 |
68411 |
456915 |
4680064921 |
208771317225 |
31258012065 |
57020 |
282241 |
3251280400 |
79659982081 |
16093381820 |
2660 |
2605 |
7075600 |
6786025 |
6929300 |
12509 |
64742 |
156475081 |
4191526564 |
809857678 |
23295 |
94020 |
542657025 |
8839760400 |
2190195900 |
2446064 |
4136582 |
1679664294834 |
3428584417532 |
1361560304296 |
Для наших данных система уравнений имеет вид
15a + 2446064 b = 4136582
2446064 a + 1679664294834 b = 1361560304296
Домножим уравнение (1) системы на (-163070.93), получим систему, которую решим методом алгебраического сложения.
-2446064a -398881931319.52 b = -674556273761.26
2446064 a + 1679664294834 b = 1361560304296
Получаем:
1280782363514.5 b = 687004030534.74
Откуда b = 0.5364
Теперь найдем коэффициент «a» из уравнения (1):
15a + 2446064 b = 4136582
15a + 2446064*0.5364 = 4136582
15a = 2824527.87
a = 188301.8582
Получаем эмпирические коэффициенты регрессии: b = 0.5364, a = 188301.8582
Уравнение регрессии: y = 0.5364 x + 188301.8582
Это означает, что с ростом основных средств на 1тыс. руб., валовой доход растет на 0.5364 тыс. руб.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
3. Коэффициент корреляции.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между валовым доходом и величиной основных фондов умеренная и прямая.
4.
Оценим качество уравнения
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
В среднем, расчетные значения отклоняются от фактических на 718.21%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= 0.4012 = 0.1611, т.е. в 16.11% случаев изменения стоимости ОФ приводят к изменению величины валового дохода. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 83.89% изменения валового дохода Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
|y - yx|:y |
10069 |
32769 |
193702.81 |
59050522809.816 |
25899691109.342 |
4.911 |
26140 |
33932 |
202323.198 |
58486650090.683 |
28355595621.465 |
4.963 |
506456 |
130874 |
459961.833 |
20995469043.484 |
108298801884.24 |
2.515 |
6659 |
19123 |
191873.706 |
65868777640.749 |
29842806448.572 |
9.034 |
112809 |
93540 |
248811.932 |
33208550419.217 |
24109372977.899 |
1.66 |
1127041 |
559051 |
792839.922 |
80246916299.953 |
54657260139.711 |
0.418 |
172961 |
846064 |
281077.106 |
325232813186.16 |
319210190335.69 |
0.668 |
0 |
41182 |
188301.858 |
55032530657.35 |
21644252684.674 |
3.572 |
2495 |
41875 |
189640.161 |
54707868981.55 |
21834542903.369 |
3.529 |
317539 |
1437649 |
358627.882 |
1349957853295.2 |
1164286572833.2 |
0.751 |
68411 |
456915 |
224997.11 |
32812738144.219 |
53785907603.195 |
0.508 |
57020 |
282241 |
218887.046 |
41846235.951 |
4013723510.571 |
0.224 |
2660 |
2605 |
189728.666 |
74620282733.549 |
35015266506.994 |
71.833 |
12509 |
64742 |
195011.611 |
44533717174.683 |
16970171588.669 |
2.012 |
23295 |
94020 |
200797.157 |
33033837971.217 |
11401361290.242 |
1.136 |
2446064 |
4136582 |
4136582 |
2287830374683.8 |
1919325517437.8 |
107.732 |
5. Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
5.1. Выдвигается
нулевая гипотеза о том, что
уравнение в целом
5.2. Далее
определяют фактическое
или по формуле:
где m=1 для парной регрессии.
5.3. Табличное
значение определяется по
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05.
5.4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=13, Fтабл = 4.67
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Степенное уравнение регрессии имеет вид y = a xb
Для наших данных система уравнений имеет вид
14a + 148.91 b = 161.6
148.91 a + 1631.3 b = 1752.77
Получаем эмпирические коэффициенты регрессии: b = 0.7157, a = 3.9302
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e3.93018006x0.7157 = 50.91614x0.7157
3. Индекс корреляции.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
Полученная величина свидетельствует о том, что стоимость ОС умеренно влияет на величину валового дохода.
4. Ошибка аппроксимации.
В среднем, расчетные значения отклоняются от фактических на 114.65%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.
Индекс детерминации.
т.е. в 11.89% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 88.11% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
5. F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=12, Fтабл = 4.75
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Экспоненциальное уравнение регрессии имеет вид y = a ebx
Для наших данных система уравнений имеет вид
15a + 2446064 b = 172.22
2446064 a + 1679664294834 b = 31539431.24
Получаем эмпирические коэффициенты регрессии: b = 3.0E-6, a = 11.0428
Уравнение регрессии:
y = e11.04284492 e2.7E-6x = 62418.62e2.7E-6x
3. Вычислить индекс детерминации и проверить качество модели, используя вычисления по формулах не представляется возможным из-за слишком больших чисел. Для этого используем результаты функций Excel (Сервис/ Анализ данных / Регрессия)
4. Ошибка аппроксимации.
Уравнение регрессии: y = 62418.62e2.7E-6x
4. Ошибка аппроксимации.
3. Коэффициент детерминации
R2 = 0,24
Индекс детерминации.
R = 0,4934
5. F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=12, Fтабл = 4.75
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Показатель |
Линейная регрессия |
Степенная регрессия |
Экспоненциальная регрессия |
Коэффициент детерминации |
0.1611 |
0.1189 |
0,24 |
Средняя ошибка аппроксимации |
718.21 |
114.65 |
22 9.05 |
По максимальному коэффициенту детерминации и минимальной ошибке аппроксимации выбираем уравнение экспоненциальной регрессии.
y = 62418.62e2.7E-6x
6. Рассчитать прогнозное значение результата, при условии , что прогнозное значение фактора увеличится на 10% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости 0,05.
Xp = 163070.933*110% = 179378.03
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 179378.03
tкрит (n-m-1;α/2) = (13;0.025) = 2.16
y(179378.03) = 62418.62e2.7E-6x = 101264.8
Вычислим ошибку прогноза для уравнения y = a ebx
Несмещенной оценкой дисперсии возмущений является величина:
101252.413 ± 268010.87
(-166746,0447; 369275,6987)
С вероятностью 95% можно гарантировать, что значения валового дохода при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
Выводы: Изучена зависимость валового дохода предприятий легкой промышленности от их основных средств. На этапе спецификации были выбраны парная линейная, степенная и экспоненциальная регрессии. Оценены их параметры методом наименьших квадратов. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. По наилучшим показателям было выбрано уравнение экспоненциальной зависимости. Установлено, что в исследуемой ситуации 24% общей вариабельности валового дохода объясняется изменением величины основных средств. Доверительный интервал при изменении ОС на 10% от их средней величины составит: -166746,0447 ≤ y ≤ 369275,6987.
Сравнительная характеристика методов вычислений.
Виды регрессии |
Линейная |
Степенная |
Экспоненциальная | |||
Функции Excel |
Сервис Excel |
Функции Excel |
Сервис Excel |
Функции Excel |
Сервис Excel | |
Коэффициент детерминации |
0.1611 |
0,161072 |
0.1189 |
0,648845 |
-0,3077 |
0,24 |
Параметры уравнения |
0,536394 188301,9 |
0,536394 188301,9 |
3,93018 0,715706 |
3,93018 0,715706 |
2,69752E-06 11,04161897 |
2,69752E-06 11,04161897 |
Несоответствие данных по R2 в степенной регрессии вызвано различными методиками расчета, т.к. расчет через сервис Excel происходил на основании логарифмированных данных.
Несоответствие данных по R2 в экспоненциальной регрессии вызвано ошибками округления при оперировании больших значений.
Литература и источники:
1. Мхитарян В. С. Эконометрика : Москва: Евразийский открытый институт, 2012: 224 с.
2. Яковлева А. В. Эконометрика : Саратов: Научная книга, 2012 -223с.
3. Новиков А.И. Эконометрика [Электронный ресурс]: учебное пособие/ Новиков А.И.— Электрон. текстовые данные.— М.: Дашков и К, 2015.- 224 c.
4. Шилова З.В. Эконометрика [Электронный ресурс]: учебное пособие/ Шилова З.В.— Электрон. текстовые данные.— Саратов: Ай Пи Ар Букс, 2015.— 148 c.
5. Кремер Н.Ш. Эконометрика [Электронный ресурс]: учебник для студентов вузов/ Кремер Н.Ш., Путко Б.А.— Электрон. текстовые данные.— М.: ЮНИТИ-ДАНА, 2012.— 328 c.
6. Соколов Г.А. Эконометрика: теоретические основы: Учебное пособие / Г.А. Соколов. - М.: ИНФРА-М, 2012. - 216 с.
7. Балдин, К. В. Эконометрика [Электронный ресурс] : учеб. пособие для вузов / К. В. Балдин, О. Ф. Быстров, М. М. Соколов. - 2-е изд. перераб. и доп. - М. : ЮНИТИ-ДАНА, 2012 – 254с.
8. Эконометрика. Практикум: Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с.
9. Горидько Н.П. Регрессионное моделирование инфляционных процессов [Электронный ресурс]: монография/ Горидько Н.П.— Электрон. текстовые данные.— М.: Российский новый университет, 2012.— 248 c

- Анализ зависимости «Затраты-объем-прибыль»
- Анализ зависимости уровня заболеваемости раком молочной железы среди населения промышленных центров Архангельской области от концентра
- Анализ заготовительно-складских расходов посреднической организацией
- Анализ загрязнения окружающей среды автотранспортом
- Анализ загрязнения среды обитания от предприятий автотранспорта
- Анализ задач и целей СЗИ предприятия
- Анализ закона
- Анализ жанров информационно-аналитической программы "Неделя с Марианной Максимовской"
- Анализ жизненного цикла и процессов нефтегазового проекта
- Анализ жизненного цикла товара
- Анализ жизненного цикла товара
- Анализ жизненного цикла товара на примере компании ОАО «Живая вода»
- Анализ журналистского текста на предмет этической составляющей
- Анализ заболеваемости скарлатиной в г. Чебоксары