Корреляционно- регрессионный анализ взаимосвязей производственных показателей фирмы

МИНОБРНАУКИ РОССИИ

Федеральное  государственное бюджетное  образовательное учреждение

высшего  профессионального  образования

«Всероссийский заочный финансово-экономический  институт»

(ВЗФЭИ)

Филиал ВЗФЭИ в г.Туле

 

 

 

 

                                          

КУРСОВАЯ  РАБОТА

по  дисциплине  «Статистика»

вариант №8

«Корреляционно- регрессионный анализ взаимосвязей   производственных показателей фирмы (на примере фондовооружённости и производительности труда)»

 

 

 

 

 

 

                                          Выполнил: студент  3  курса

                                                        Факультета  МиМ 

                                                        специальности  МО

                                                        группы  дневной

                                                        № л.д

 

                                           Проверил:

 

 

 

 

 

                                                 Тула 2012 г.

Содержание.

 

Введение……………………………………………………………………..3

1.Теоретическая часть:

1.1.Корреляционно-регрессионный анализ как объект статистического изучения ………………………………………………………………………………..4

1.2.Система статистических показателей, характеризующих корреляционно-регрессионный анализ………………………………………………… …..6

1.3Применение метода корреляционно-регрессионного анализа в

статистике …………………………………………………………………   9

2. Расчетная часть…………………………………………………………..11

3. Аналитическая часть…………………………………………….………37

Заключение………………………………………………………………….42

Литература…………………………………………………………………..43

Приложения………………………………………………………………....44

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Слово корреляция ввел в  употребление в статистику английский биолог и статистик Френсис Гальтон в конце в. Тогда оно писалось как «corelation» (соответствие), но не просто «связь» (relation), а «как бы связь», т.е. связь, но не привычной в то время функциональной форме. В науке вообще, а именно в палеонтологии, термин «корреляция» применил ещё раньше, в конце в., знаменитый      французский палеонтолог (специалист по ископаемые останками животных и растений прошлых эпох) Жорж Кювель. Он ввел даже «закон корреляции» частей и органов животных.

Корреляционная связь  существует там, где взаимосвязанные  явления характеризуются только случайными величинами. Наличие корреляционных связей присуще многим общественным явлениям.

Цель данной работы ознакомится  с понятием корреляционно-регрессионного анализа, рассмотреть понятия, характеризующие его, узнать где и как можно применять метод корреляционно- регрессионного анализа.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.1.Корреляционно-регрессионный анализ как объект статистического изучения.

Современная наука исходит  из взаимосвязи всех явлений природы  и общества. Объем продукции предприятия связан с численностью работников, мощностью двигателей, стоимостью производственных фондов и ещё многими признаками.

Невозможно управлять  явлениями, предсказывать их развитие без изменения характера, силы и других особенностей связей, поэтому методы исследования, измерения связей составляют чрезвычайно важную часть методологии научного исследования, в том числе и статистического.

Различают два вида связи  между различными явлениями и  их признаками: функциональную и жестко детерминированную, с одной стороны, и статистическую или стохастически детерминированную – с другой. Строго определить различия этих типов связи можно тогда, когда они получают математическую формулировку.

Если с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е. значению одной переменной обязательно  соответствует одно или несколько точно заданных значений другой переменой, связь между ними является функциональной.

Стохастически детерминированная  связь не имеет ограничений и  условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но её среднее значение или иные статистические (массовые) характеристики изменяются по определенному закону – связь является статистической. Иными словами, при статистической связи разным значениям одной переменной соответствует разные распределения значений другой переменой.

В настоящее время  наука не знает более широкого определения связи. Все связи, которые  могут быть измерены и выражены численно, подходят под определение «статистические связи», в том числе и функциональные. Последние представляют собой частный случай статистических связей, когда значения одной переменной соответствуют «распределения» значений второй, состоящие из одного или нескольких значений и имеющие вероятность, равную единице. Конечно, качественное различие действительно вероятных распределений и отдельных значений, имеющих вероятность единицы (достоверных), настолько велико, что хотя функциональные связи и подходят в широком смысле под определение статистической связи, все же с полным основанием можно говорить о двух типах связей.

Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной  соответствуют различные средние значения другой. С изменением значения признака x закономерным образом изменяется среднее значение признака y; в то время как в каждом отдельном случае значение признака y (с различными вероятностями) может принимать множество различных значений.

Если же с изменением значения признака x среднее значение признака y не изменяется закономерным образом, но закономерно изменяется другая статистическая характеристика (показатели вариации, ассиметрии, эксцесса и т.п.), то связь является не корреляционной, хотя и статистической.

Корреляционная связь  между признаками может возникать  разными путями. Важнейший путь- причинная зависимость результативного признака (его вариации) от вариации факторного признака.

Совершенно иная интерпретация  необходима при изучении корреляционной связи  между двумя следствиями общей причины. Данную корреляцию нельзя интерпретировать  как связь причины и следствия;

Третий путь возникновения корреляции – взаимосвязь признаков, каждый из которых и причина и следствие.

Совершенно иная интерпретация  необходима при изучении корреляционной связи между двумя следствиями общей причины.

Третий путь возникновения корреляции – взаимосвязь признаков, каждый из которых  и причина, и следствие.

 

1.2.  Система статистических показателей, характеризующих

 корреляционно-регрессионный анализ

 

В соответствии с сущностью  корреляционной связи её изучение имеет  две цели:

1. Измерение параметров уравнения,  выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);

2. измерение тесноты связи двух (или большего числа) признаков между собой.

Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнение связи является  метод наименьших квадратов, разработанный К.Ф. Гауссом. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной y от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) x.

Для изменения тесноты связи  применяется несколько показателей. При парной связи теснота связи  изменяется прежде всего корреляционным отношением, которое означается греческой группой η. Квадрат корреляционного отношения – это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднею величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации:

                                                                                 (1)

число групп по факторному признаку;

- число единиц совокупности;

- индивидуальные значения результативного  признака;

- его средние групповые значения;

- его общее среднее значение;

- частота в j-й группе.

 

Формула (1) применяется  при расчете показателя тесноты  связи по аналитической группировке. При вычислении корреляционного отношения по уровню связи (уравнению парной или множественной регрессии) применяется формула (2):

                                                                                       (2),

где - индивидуальные значения  y по уравнению связи.

 

Сумма квадратов  в числителе  – это объясненная связью с  фактором x (факторами) дисперсия результативного признака y. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.

Если уравнение выбрано неверно  или сделана ошибка при расчете  его параметров, то сумма квадратов в числителе может оказаться большей, чем в знаменателе, и отношение утратит тот смысл, которое оно должно иметь, а именно каково доля общей вариации результативного признака, объясняемая на основе выбранного уравнения в связи с его факторным признаком (признаками). Чтобы избежать ошибочного результата, лучше вычислять корреляционное отношение по другой формуле (3), не столь наглядно выявляющей сущность показателя, но зато полностью гарантирующей от возможного искажения:

                                                                                        (3)

В числителе формулы (3) стоит сумма  квадратов отклонений фактических значений признака от его индивидуальных расчетных значений, т.е. доля вариации этого признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать раной нулю, если связь не является функциональной. При неверной формуле уравнения связи или ошибке в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается, как логически и должно быть.

В основе перехода от формулы (2) к формуле (3) лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:

Dобщ = Dмежгр + Dвнутригр

Согласно этому правилу можно  вместо межгрупповой (факторной) дисперсии использовать разность:

Dобщ – Dвнутригр

что дает:

При расчете  не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу (3). В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как:

Dобщ =  Dобъяснена  +  Dост

            уравнением

                    регрессии

 

Важнейшее положение, которое  следует теперь усвоить любому, желающему правильно применять метод корреляционно-регрессионного анализа, состоит интерпретации формул (2) и (3). Это положение гласит:

Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков). Меры тесноты связи измеряют долю вариации результативного признака, которая связана с вариацией факторного признака (признаков).

Интерпретировать корреляционные показатели строго следует лишь в терминах вариации (различий  в пространстве) отклонений от средней величины. Если же задача исследования состоит в измерении связи не между вариацией двух признаков в совокупности, а между изменениями признаков объекта во времени, то метод корреляционно-регрессионного анализа требует значительного изменения.

Итак, строго говоря, метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. Это очень серьезное ограничение метода, о котором не следует забывать.

 

1.3.Применение метода корреляционно-регрессионного анализа

 в статистике

 

Коренное отличие метода корреляционно-регрессионного анализа от аналитической группировки состоит в том, что корреляционно-регрессионный анализ позволяет разделить влияние комплекса факторных признаков, анализировать различные стороны сложной системы взаимосвязей. Если метод комбинированной аналитической группировки, как правило, не дает возможность анализировать более 3 факторов, то корреляционный метод при объеме совокупности около ста единиц позволяет вести анализ системы с 8-10 факторами и разделить их влияние.

Развивающиеся на базе корреляционно-регрессионного анализа многомерные методы (метод главных компонентов, факторный анализ) позволяют синтезировать влияние признаков (первичных факторов), выделяя из них непосредственно не учитываемые глубинные факторы (компоненты). Например, изучая корреляцию ряда признаков интенсификации сельскохозяйственного производства, таких, как фондообеспеченность, затраты труда на единицу площади, энергообеспеченность, внесение удобрений на единицу площади, плотность поголовья скота, можно синтезировать общую часть их влияния на уровень продукции с единицы площади или на производительность труда, получив обобщенный фактор «интенсификация производства», непосредственно не измеримый, не отражаемый единым показателем.

Правильное применение и интерпретация результатов  корреляционно-регрессионного анализа возможны лишь при понимании всех специфических черт, достоинств и ограничений метода.

Необходимо сказать  и о других задачах применения корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер.

1. Задача выделения  важнейших факторов, влияющих на  результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе мер тесноты связи факторов с результативным признаком.

2.   Задача оценки  хозяйственной деятельности по  эффективности использования имеющихся факторов производства.

3.     Задача  прогнозирования возможных значений  результативного признака при задаваемых значениях факторных признаков.

4.     Задача  подготовки данных, необходимых  в качестве исходных для решения  оптимизационных задач.

При решении каждой из названных  задач нужно учитывать особенности и ограничения  корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата. Трудно обеспечить раздельную оценку влияния каждого из факторов. В этом отношении корреляционные методы глубоко противоречивы.  С одной стороны, их идеал – измерение чистого влияния каждого фактора. С другой стороны, такое измерение возможно при отсутствии связи между факторами и случайной вариации признаков. А тогда связь является функциональной, и корреляционные методы анализа излишни.  В реальных системах связь всегда имеет статистический характер,  и тогда идеал методов корреляции становится недостижимым. Но это не значит, что эти методы не нужны.

Данное противоречие означает простоту  недостижимость абсолютной истины в познании реальны связей. Приближенный характер любых результатов корреляционно-регрессионного анализа не является поводом для отрицания их полезности. Всякая научная истина – относительна. Забывать об этом и абсолютизировать параметры регрессионных уравнений, меры корреляции было бы ошибкой, так же как и отказаться от использования этих мер.

 

2. Расчетная часть

 

Имеются следующие выборочные данные за отчётный период по предприятиям одной из финансово-промышленных групп (выборка 10%-ная, механическая):

 

Таблица 1 – Исходные данные

 

предприятия

Фондовоору-жённость труда, тыс. руб./чел.

Производитель-ность труда,

тыс. руб./чел.

предприятия

Фондовоору-жённость труда,

тыс.руб./чел.

Производитель-ность труда,

тыс. руб./чел.

1

404,1

2340,6

16

330,8

1750,0

2

368,1

2125,8

17

390,6

1929,6

3

398,4

2325,3

18

360,6

2012,3

4

361,2

2012,7

19

426,4

2527,1

5

379,0

2194,5

20

416,1

2416,8

6

440,6

2550,0

21

387,8

2229,3

7

423,4

2512,0

22

377,2

2153,6

8

388,5

2250,0

23

358,4

1969,3

9

366,8

2069,9

24

380,4

2225,4

10

405,8

2382,1

25

347,2

1858,6

11

362,5

2038,0

26

358,9

1991,0

12

344,8

1797,4

27

355,2

1940,2

13

401,5

2329,1

28

392,5

2255,5

14

414,1

2390,0

29

375,4

2129,3

15

352,8

1909,1

30

367,3

2074,5


 

Задание 1

По исходным данным:

1.Постройте статистический ряд распределения организаций по признаку фондовооруженность труда , образовав пять групп с равными интервалами.

2.Графическим методом и путём расчётов определите значения моды и медианы полученного ряда распределения.

3.Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.

Сделайте выводы по результатам выполнения пунктов 1, 2, 3 задания.

4.Вычислите среднюю арифметическую по исходным данным, сравните её с аналогичным показателем, рассчитанным в п.3 для интервального ряда распределения. Объясните причину их расхождения.

 

Решение:

1.Построение интервального  ряда распределения предприятий по признаку фондовооруженность труда.

Для построения интервального  вариационного ряда, характеризующего распределение банков по объему кредитных  вложений, необходимо вычислить величину и границы интервалов ряда.

При построении ряда с  равными интервалами величина интервала h определяется по формуле

,

при заданных k = 5,  xmax = 440,6 тыс руб/чел. , xmin =380,8 тыс руб/чел.

 

При h = 21,96 тыс руб/чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):

 

Таблица 2 – Определение границы интервалов рядов распределения.

Номер группы

Нижняя граница, млн руб.

Верхняя граница, млн руб.

1

330,8

352,76

2

353,76

374,72

3

374,72

396.68

4

396,68

418,64

5

418,64

440,6


 

Процесс группировки  единиц совокупности по признаку Объем кредитных вложений представлен во вспомогательной (разработочной) таблице 3

Таблица 3 - Разработочная таблица  для построения интервального ряда распределения и аналитической группировки

Группы предприятий по фондовооруженности труда

тыс.руб/чел

Номер предприятия

Фондовооруженность труда

тыс.руб/чел

Производительность труда

тыс.руб/чел

1

2

3

4

330,8 – 352,76

16

330,8

1750,0

 

12

344,8

1797,4

 

25

347,2

1858,6

Всего

3

1022,8

5406

352,76 – 374,72

15

352.8

1909.1

 

27

355,2

1940,2

 

23

358,4

1969,3

 

26

358,9

1991,0

 

18

360,6

2012,3

 

4

361,2

2012,7

 

11

362.5

2038,0

 

9

366,8

2069,9

 

30

367,3

2074,5

 

2

368,1

2125.8

Всего

10

3611,8

20142,7

374,72-396,68

29

375,4

2129.3

 

22

377,2

2153,6

 

5

379,0

2194,5

 

24

380,4

2225,4

 

21

387,8

2229,3

 

8

388,5

2250,0

 

17

390,6

1929,6

 

28

392,5

2255,5

Всего

8

3071,4

17367,2

396,68- 418,64

3

398,4

2325,3

 

13

401,5

2329.1

 

1

404,1

2340,6

 

10

405,8

2382,1

 

14

414.1

2390,0

 

20

416,1

2416.8

Всего

6

2440

14183,9

418,64-440,6

7

423,4

2512,0

 

19

426,4

2527,1

 

6

440,6

2550,0

Всего

3

1290,4

7589,1

Итого

30

11436,4

29362,1


На основе групповых  итоговых строк «Всего» табл. 3 формируется  итоговая табл. 4, представляющая интервальный ряд распределения банков по объему кредитных вложений.

Таблица 4 - Распределение предприятий по фондовооруженности труда.

Номер группы

Группы предприятий по фондовооруженности труда

тыс.руб/чел  х

Число предприятий

f

1

330,8 - 352,76

3

2

352,76 – 374,2

10

3

374,72 – 396,68

8

4

396,68 – 418,64

6

5

418,64 – 440,6

3

 

Итого

30


 

Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .

 

Таблица 5 - Структура  предприятий по фондовооруженности труда

№ группы

Группы предприятий по фондовооруженности труда

тыс.руб/чел

Число предприятий, fj

Накопленная

частота,

Sj

Накопленная

частоcть, %

в абсолютном выражении

в % к итогу

1

2

3

4

5

6

1

330,8 - 352,76

3

10,0

3

10,0

2

352,76 – 374,2

10

33,0

13

43,0

3

374,72 – 396,68

8

27,0

21

70,0

4

396,68 – 418,64

6

20,0

27

90,0

5

418,64 – 440,6

3

10,0

30

100,0

 

Итого

30

100,0

   

Вывод. Анализ интервального  ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по фондовооруженности труда не является равномерным: преобладают предприятия с фондовооруженностью от 374,72 млн руб/чел. до 396,68 млн руб./чел(это 8 предприятий, доля которых составляет 70%);  и 396,68 млн руб./чел до 418,64 (это 6 предприятий, доля которых составляет 90%).

 

2. Нахождение моды  и медианы полученного интервального  ряда распределения графическим методом и  путем расчетов.

 

 

 


 

 

 

 

 

 

 

 

 

Рисунок 1 - Определение  моды графическим методом

 

Конкретное значение моды для интервального ряда рассчитывается по формуле:

где   хМo – нижняя граница модального интервала,

h –величина модального интервала,

fMo – частота модального интервала,

fMo-1 – частота интервала, предшествующего модальному,

fMo+1 – частота интервала, следующего за модальным

Вывод: Для рассматриваемой совокупности предприятий наиболее распространенная фондовооруженность характеризуется средней величиной 369,84 тыс руб/чел.

 

Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5)

 

 


Рисунок 2 - Определение медианы графическим методом

 

 

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

,                              (4)

где    хМе– нижняя граница медианного интервала,

h – величина медианного интервала,

– сумма всех частот,

fМе – частота медианного интервала,

SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Вывод: В рассматриваемой  совокупности предприятий половина имеет фондовооруженность не более 380,21 млн руб./чел, а другая половина – не менее 380,21 млн руб./чел.

3. Расчет характеристик ряда  распределения

Для расчета характеристик  ряда распределения  , σ, σ2, Vσ на основе табл. 5 строится вспомогательная табл. 6 ( – середина j-го интервала).

Таблица 6 - Расчетная таблица для  нахождения характеристик ряда распределения

Группы предприятий по фондовооруженности, млн руб./чел

Середина интервала,

Число предприятий,

fj

1

2

3

4

5

6

7

330,8-352,76

341,78

3

1025,34

-40,99

1680,18

5040,54

352,76 – 374,2

363,74

10

3637,4

-19,03

362,14

3621,4

374,72– 396,68

385,7

8

3085,6

2,93

8,58

68,64

396,68– 418,64

407,66

6

2445,96

24,89

619,51

3717,06

418,64 – 440,6

429,62

3

1288,86

46,85

2194,92

6584,76

Итого

 

30

11483,16

   

19032,4


 

 

 

 

Расчет средней арифметической взвешенной:

                                        (5)

Расчет дисперсии:

                                                  (6)

Расчет среднего квадратического  отклонения:

                                   

Расчет коэффициента вариации:

                                                                (7)

Вывод. Анализ полученных значений показателей  и σ говорит о том, что средняя фондовооруженность составляет  382,77 тыс руб./чел, отклонение от среднего объема в ту или иную сторону составляет в среднем 25,19 млн руб./чел (или 6,58%), наиболее характерные значения объема кредитных вложений находятся в пределах от 357,59 млн руб/чел. до 407,95 млн руб/чел. (диапазон ).

Корреляционно- регрессионный анализ взаимосвязей производственных показателей фирмы