Обработка статистических данных (статистика затрат). 2

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ  ОБЩЕОБРАЗОВАТЕЛЬНОЕ  УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО  ОБРАЗОВАНИЯ                                                                      «УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ ГОРНЫЙ УНИВЕРСИТЕТ»

 

 

 

Курсовая работа по дисциплине «Статистика»

Тема: «Обработка статистических данных

(статистика затрат)»

 

 

 

 

 

 

 

 

 

 

 

Екатеринбург

2012

ОГЛАВЛЕНИЕ

 

ВВЕДЕНИЕ 3

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 4

1.1. Аналитическая группировка. Структурные средние 4

1.2. Ряд динамики 6

1.3. Показатели вариации 8

1.4. Метод корреляционно – регрессионного анализа 10

2. АНАЛИТИЧЕСКАЯ ЧАСТЬ 13

2.1. Аналитическая группировка. Структурные средние 13

2.2. Оценка динамики изменения показателей 16

2.3. Расчет показателей вариаций 18

2.4. Распределение затрат на постоянные и переменные, методом корреляционно-регрессионного анализа 19

ЗАКЛЮЧЕНИЕ 23

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 24

 

 

 

ВВЕДЕНИЕ

 

 

Статистика — это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы. Данные, изучаемые в статистике, затрагивают не отдельные объекты, а их совокупности¹.

Главным методом сбора  данных для статистики является полное обследование объектов, имеющих отношение  к изучаемой проблеме.   Обработка  статистических данных  уже давно  применяется в  самых разнообразных видах человеческой деятельности. Трудно назвать ту сферу, в которой она бы не использовалась. Но, пожалуй, ни в одной области знаний и практической деятельности обработка статистических данных  не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах.

Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных  методов, важное место среди которых  занимает корреляционный и регрессионный  анализы обработки статистических данных.

Цель курсовой работы –  освоить инструменты статистики для дальнейшего применения в  решении управленческих задач. Можно  выделить следующие задачи данного  курсового проекта:

  • приобрести навыки работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
  • освоить методы выполнения оценок параметров больших множеств по данным выборочного наблюдения;
  • развить аналитические навыки в ходе применения вариационного и корреляционного методов и интерпретации полученных результатов.

 

 

  1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

 

    1. Аналитическая группировка. Структурные средние

Аналитическая группировка - статистическая группировка, предназначенная  для изучения взаимосвязей между  признаками. Аналитическую группировку  строят по одному из взаимосвязанных  признаков, например факторному, а далее  вычисляют по каждой выделенной группе средние (или относительные) значения другого признака. Параллельно сопоставляя  значения обоих признаков по характеру  их совместных изменений, делают заключение о наличии и направлении связи.

Важная проблема аналитических  группировок – правильный выбор  числа групп и определение  их границ, что в последующем обеспечивает объективность характеристик связи. Количество и величину интервалов определяют по формулам:

                                          (1.1)

                                        (1.2.)

                                                              (1.3.)

где

  • максимальное значение признаков совокупности
  • минимальное значение признаков совокупности
  • размах вариации
  • количество единиц в совокупности
  • количество интервалов
  • величина интервала

В процессе аналитических  группировок следует соблюдать  общие правила группировки, т. е. единицы в образованных группах должны быть существенно – различны, количество единиц в группах должно быть достаточным для расчета надежных статистических характеристик. Кроме того, групповые средние должны подчиняться определенной закономерности: последовательно увеличиваться или уменьшаться.

Мода - это наиболее часто  встречающийся вариант ряда. Мода применяется, например, при определении  размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального  вариационного ряда необходимо сначала  определить модальный интервал (по максимальной частоте), а затем - значение модальной величины признака по формуле:

                            (1.4)

где

  • – нижняя граница модального интервала;
  • величина интервала;
  • частота модального интервала;
  • частота интервала, предшествующего модальному;
  • частота интервала, следующего за модальным.

Медиана - это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две  равные по численности части. Если отсортированный  ряд содержит нечетное число признаков, то номер медианы вычисляют по формуле:

                                                 (1.5)

где

n – число признаков совокупности.

В случае четного числа признаков медиана будет равна средней из двух признаков находящихся в середине ряда.

При вычислении медианы для  интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы  по формуле:

                                        (1.6)

где

  • нижняя граница интервала, который содержит медиану;
  • величина интервала;
  • полусумма накопительных частот
  • сумма накопительных частот интервалов, предшествующих медианному;
  • частота медианного интервала;

 

 

    1. Ряд динамики

Ряд динамики – это временная  последовательность значений, состоящая  из статистических показателей. Каждый динамический ряд содержит две составляющие:

  • показатели периодов времени (годы, кварталы, месяцы, дни или даты);
  • показатели, характеризующие исследуемый объект за временные периоды или на соответствующие даты, которые называют уровнями ряда.

Классификация рядов динамики производится по следующим признакам:

    1. По времени
      1. Моментный ряд – выражается величина на определенные моменты времени (на начало недели, месяца, года т т.п.)
      2. Интервальный ряд – величина на определенные интервалы времени (например, за сутки, месяц, год и т.п.)
    2. По полноте времени:
      1. Равностоящий ряд – периоды указываются друг за другом без промежутков
      2. Не равностоящий ряд – периоды указываются с промежутками
    3. По способу выражения уровней:
      1. Ряд абсолютных показателей
      2. Ряд относительных показателей
      3. Ряд Средних показателей

 

Для характеристики интенсивности  развития во времени используются статистические показатели, получаемые сравнением уровней  между собой, в результате чего получаем систему абсолютных и относительных  показателей динамики: абсолютный прирост, темп роста (коэффициент и показатель в % выражении), темп прироста (коэффициент  и показатель в % выражении).

В ходе исследования необходимо сравнить несколько последовательных уровней, их можно получить путем  сравнения с постоянной базой (базисные показатели), или сравнение с переменной базой (цепные показатели).

Базисные показатели характеризуют  итоговый результат всех изменений  в уровнях ряда от периода базисного  уровня до данного (i-го) периода.

Цепные показатели характеризуют  интенсивность изменения уровня от одного периода к другому в  пределах того промежутка времени, который  исследуется.

Абсолютный прирост выражает абсолютную скорость изменения ряда динамики и определяется как разность между данным уровнем и уровнем, принятым за базу сравнения.

                                              (2.1)

                                           (2.2)

где

  • уровень базисного периода
  • уровень сравниваемого периода
  • уровень периода, предшествующий сравниваемому

 

Темп роста – относительный  показатель, показывающий процентное изменение уровня ряда по сравнению  с базисным или цепным показателем. Может быть представлен в виде коэффициента или в процентах

                                      (2.3)

                                   (2.4)

Темп прироста – относительный  показатель, показывающий на сколько  процентов один уровень ряда динамики больше или меньше другого, принимаемого за базу для сравнения

                                    (2.5)

 

    1. Показатели  вариации

Вариация - это различия индивидуальных значений признака у единиц изучаемой  совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в  экономическом анализе. Необходимость  изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с  разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно, по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.

Изменение вариации признака в совокупности осуществляется с  помощью абсолютных и относительных  показателей.

Абсолютные показатели вариации включают:

  1. Размах вариации – представляет собой разность между max и min значением в изученной совокупности

                                     (3.1)

  1. Среднее линейное отклонение  используется для сравнения всех имеющихся элементов затрат со средней величиной, и дает обобщенную характеристику степени колеблемого элемента затрат. Вычисляется как среднее арифметическое из абсолютных значений отклонения индивидуального значения затрат элементов от средней величины:

 – для сгруппированных  данных               (3.2)

 – для не сгруппированных данных       (3.3)

где

    • индивидуальное значение признака совокупности;
    • среднее значение признака совокупности;
    • количество рядов;
    • значение объема продаж;
  1. Дисперсия – представляет собой среднее арифметическое из квадратов отношений индивидуального значения от их средней величины. Измеряет вариацию затрат во всей совокупности под влиянием всех факторов обуславливающих эту вариацию

 – для не сгруппированных данных               (3.4)

 – для сгруппированных  данных       (3.5)

  1. Среднеквадратичное откллонение:

 – для не сгруппированных данных               (3.6)

 

 – для сгруппированных данных       (3.7)

Относительные показатели:

  1. Линейный коэффициент вариации

                                        (3.8)

  1. Коэффициент вариации – оценивает однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%

                                        (3.9)

  1. Коэффициент осцилляции

                                        (3.10)

 

    1. Метод корреляционно  – регрессионного анализа

Корреляционный анализ является одним из методов статистического  анализа взаимосвязи нескольких признаков.

Он определяется как метод, применяемый тогда, когда данные наблюдения можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному  закону. Основная задача корреляционного  анализа (являющаяся основной и в  регрессионном анализе) состоит  в оценке уравнения регрессии.

 Корреляция – это  статистическая зависимость между  случайными величинами, не имеющими  строго функционального характера,  при которой изменение одной  из случайных величин приводит  к изменению математического  ожидания другой.

Корреляционный анализ - метод установления связи и измерения  ее тесноты между наблюдениями. Корреляционная связь проявляется в среднем  для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд  вероятных значений независимой  переменной.

В статистике теснота связи  может определяться с помощью  различных коэффициентов (Фехнера, Пирсона, коэффициентные ассоциации и  т. д.).

При линейной зависимости  коэффициент корреляции между факторами х и у определяется следующим образом:

                                        (4.1)

где

  • r – линейный коэффициент корреляции;
  • – индивидуальное значение факторного признака в совокупности;
  • – среднее значение факторного признака в совокупности;
  • – индивидуальные значения результативного признака в совокупности;
  •   – среднее значение результативного признака в совокупности.

 

Значения коэффициента корреляции изменяются в интервале [- 1; + 1].

Значение r = - 1 свидетельствует о наличии жестко детерминированной обратно пропорциональной связи между факторами; r = + 1 - соответствует жестко детерминированной связи с прямо пропорциональной зависимостью факторов. Если линейной связи между факторами не наблюдается, r — 0.

Другие значения коэффициента корреляции свидетельствуют о наличии  стохастической связи, причем чем ближе  г к единице, тем связь теснее.

При r < 0,3 - связь можно считать слабой; при 0,3 < r  < 0,7 - связь средней тесноты; r > 0,7 - тесная.

 

Регрессионный анализ - это  метод установления аналитического выражения стохастической зависимости  между исследуемыми признаками.

Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из x, и имеет вид:

                                             (4.2)

где

  • зависимая переменная
  • независимая переменная

В ходе регрессионного анализа  решаются две основные задачи:

  • построение уравнения регрессии, т. е. нахождение вида зависимости между результативным показателем и независимыми факторами.
  • оценка значимости полученного уравнения, т. е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

Регрессионный анализ - один из наиболее разработанных методов  математической статистики.

При линейной зависимости  уравнение регрессии имеет вид:

                                             (4.3)

где: и – параметры уравнения, из которых – коэффициент регрессии.

По методу способом наименьших квадратов для нахождения параметров линейной регрессии систему нормальных уравнений:

                                       (4.4)

 – характеризует значение неучтенных факторов, влияющих на формирование результативного признака;

 – показывает изменение факторного признака на единицу собственного изменения.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. АНАЛИТИЧЕСКАЯ ЧАСТЬ

 

 

  1. Провести аналитическую группировку, рассчитать структурные средние (,).
  2. Оценить динамику изменения показателей. Построить графики, характеризующие изменения показателей.
  3. Рассчитать показатели вариации.
  4. Методом корреляционно – регрессионного анализа, распределить затраты на постоянные и переменные.

 

Расчетные данные                                      Таблица 2.1

Месяц

Объем производства, X, 
тонн

Суммарные издержки, Y, 
тыс. руб.

Январь

6 542,30

2 234,77

Февраль

6 842,30

2 258,93

Март

7 751,40

2 524,68

Апрель

8 072,68

2 624,34

Май

7 023,10

2 404,40

Июнь

8 001,19

2 581,39

Июль

8 023,26

2 618,30

Август

8 020,25

2 577,89

Сентябрь

7 990,73

2 561,53

Октябрь

8 042,89

2 579,74

Ноябрь

8 035,00

2 585,09

Декабрь

9 851,90

2 648,50

Итого

94 197,00

30 199,56

Среднее значение

7 849,75

2516,63


 

    1. Аналитическая группировка. Структурные средние

Факторный признак – объем  производства. Результативный признак  – суммарные издержки. Группировочным признаком будет являться объем производства.

  1. Определяем размах вариации, количество и величину интервалов по формулам (1.1.), (1.2), (1.3)

 9 851,90 тонн

 6 542,30 тонн

9 851,90 - 6 542,30 = 3 309,60 тонн.

 

       

  1. Определяем интервалы и группируем месяца по суммарным издержкам                                                    

 

Построение интервалов                        Таблица 2.2.

№ интервала

Начало интервала

Конец интервала

Месяца, входящие  в интервале

Кол-во месяцев в интервале

1

6 542,30

7 204,22

Январь, Февраль, Май

3

2

7 204,22

7 866,14

Март

1

3

7 866,14

8 528,06

Апрель, Июнь, Июль, Август, Сентябрь, Октябрь, Ноябрь

7

4

8 528,06

9 189,98

-

0

5

9 189,98

9 851,90

Декабрь

1


 

  1. Заносим данные  в группировочную таблицу 

Группировочная таблица                        Таблица 2.3.

Группы месяцев по объему производства, тонн

Количество

Среднее значение

Ед.

%

Объем производства, (тонн)

Суммарные издержки

(тыс. руб.)

1

6 542,30 - 7 204,22

3

25,00%

6 802,57

2 299,37

2

7 204,22 - 7 866,14

1

8,33%

7 751,40

2 524,68

3

7 866,14 - 8 528,06

7

58,33%

8 018,89

2 583,99

4

8 528,06 - 9 189,98

0

0,00%

-

-

5

9 189,98 - 9 851,90

1

8,33%

9 851,90

2 648,50


 

Вывод: наименьшее среднее значение суммарных издержек на производство составляет 2 299, 37 тыс. руб. В данную группу входит три месяца. При этом среднее значение объёма производства составляет 6 802, 57 тонн. Уровень объёма производства составляет [6 542,30 - 7 204,22]

Наибольшее среднее значение затрат на производства составляет 2 648,50 тыс. руб., в данную группу входит один месяц. При этом среднее значение объёма производства составляет 9 851,90 тонн. Уровень объёма производства составляет [9 189,98 - 9 851,90]

Наибольшее количество месяцев попадают в группу по объему производства [7 866,14 - 8 528,06], при средних суммарных затратах           2 583,99 тыс. руб. среднее значение объема составляет 8 018,89 тонн. Группа состоит из 7 месяцев или 58, 33% от общего их количества.

Рис. 2.1 Средние значения сгруппированных данных

  1. Структурные средние

По формуле (1.4.) определяем моду

 7 866,14 тонн, , , , =0

 

Вывод: в среднем в более половины месяцев объем производства оценивается на уровне 8 171, 64 тонн.

 

По формуле (1.6.) определяем медиану:

Воспользуемся таблицей №2.4. для определения накопительной  частоты

Группы месяцев по объему производства                Таблица 2.4.

Группы месяцев по объему производства, тонн

Количество месяцев в  группе

Накопительная частота

6 542,30 - 7 204,22

3

3

7 204,22 - 7 866,14

1

4

7 866,14 - 8 528,06

7

11

8 528,06 - 9 189,98

0

11

9 189,98 - 9 851,90

1

12


 

, входит в третий интервал [7 866,14 - 8 528,06]

=7 866,14 тонн, 661,92 тонн, =4, 7

 8 149,82 тонн

Вывод: в среднем в более половины месяцев объем производства оценивается на уровне 8 149, 82 тонн.

 

    1. Оценка динамики изменения показателей
  • Определяем базисные и цепные показатели:
  • Абсолютного прироста – по формулам (2.1) и (2.2)
  • Темпа прироста – по формулам (2.3) и (2.4)
  • Темпа прироста – по формулам (2.5)

Динамика изменения показателей               Таблица  2.5.

Месяц

Объем производства, тонн

Абсолютный прирост, тонн

Темп роста, %

Темп прироста,%

Базисный

Цепной

Базисный

Цепной

Базисный

Цепной

Январь

6 542,30

-

-

-

-

-

-

Февраль

6 842,30

300,00

300,00

104,59%

104,59%

4,59%

4,59%

Март

7 751,40

1 209,10

909,10

118,48%

113,29%

18,48%

13,29%

Апрель

8 072,68

1 530,38

321,28

123,39%

104,14%

23,39%

4,14%

Май

7 023,10

480,80

-1 049,58

107,35%

87,00%

7,35%

-13,00%

Июнь

8 001,19

1 458,89

978,09

122,30%

113,93%

22,30%

13,93%

Июль

8 023,26

1 480,96

22,07

122,64%

100,28%

22,64%

0,28%

Август

8 020,25

1 477,95

-3,01

122,59%

99,96%

22,59%

-0,04%

Сентябрь

7 990,73

1 448,43

-29,52

122,14%

99,63%

22,14%

-0,37%

Октябрь

8 042,89

1 500,59

52,16

122,94%

100,65%

22,94%

0,65%

Ноябрь

8 035,00

1 492,70

-7,89

122,82%

99,90%

22,82%

-0,10%

Декабрь

9 851,90

3 309,60

1 816,90

150,59%

122,61%

50,59%

22,61%

Обработка статистических данных (статистика затрат). 2