Показатели вариации и их значения в статистике

Введение 
 Статистика – это наука, изучающая величину, количественную сторону массовых общественных явлений в неразрывной связи с качественной стороной этих явлений, с их социально-экономическим содержанием.

      Массовые общественные явления,  которые изучает статистика:

  • численность населения страны;
  • сколько студентов;
  • сколько мужчин и женщин;
  • какова добыча нефти в стране;
  • сколько производится молока;
  • сколько потребляется сахара на душу населения.

     Ответом  на подобные вопросы являются  данные о размерах общественных примеров – статистические данные. Эти данные и разрабатываются общественной наукой – статистикой.

     И  предметом статистики и являются  размеры массовых общественных  явлений в конкретных условиях  места и времени. Но она не  только устанавливает факты, но и объясняет, почему они проявляются так, а не иначе, используя дополнительные статистические данные.

     Статистике  принадлежит большая роль в  информационно-аналитическом обеспечении  развития экономической реформы.  Единой целью этого процесса является оценка, анализ и прогнозирование состояния и развития экономики на современном этапе.

     Важнейшими  задачами статистики в наше  время, условиях являются:

  • всестороннее исследование проходящих в обществе глубоких преобразований экономических и социальных процессов на основе научно обоснованной системы показателей;
  • обобщение и прогнозирование тенденций развития различных отраслей и экономики в целом;
  • выявление имеющихся резервов выхода из кризиса экономики;
  • своевременное обеспечение надежной информацией государственных, хозяйственных органов и мировой общественности.

Данные статистики очень важны для других общественных наук (для

экономики, социологии, политологии).

     Для  решения задач статистики на  различных стадиях статистического  исследования применяются приемы и методы, образующие статистическую методологию и обусловленные спецификой предмета статистики. Это:

  • метод массовых наблюдений;
  • выборочный метод;
  • метод группировки;
  • метод анализа с помощью обобщенных показателей;
  • метод анализа рядов динамики;
  • индексный метод;
  • корреляционно-регрессионный метод.

 

   Целью данной курсовой работы является приобретение навыков по расчету и анализу обобщающих статистических показателей, характеризующих закономерности исследуемых экономических явлений, и получение практических навыков в применении положений теории конкретных исследований.

В связи с  недостаточностью финансовой информации о предприятии, объектом примерного исследования были взяты произвольные числа о 30-ти разные предприятиях.

 

 

Глава 1. Показатели вариации 
 

1.1 Показатели  вариации и их значения в статистике 
 
 Термин «вариация»  произошел от латинского varito –изменение, колеблемость, различие.  Однако не всякое различие называется вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака  в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов.

Исследование  вариации в статистике имеет важное значение, т.к. дает возможность оценить  степень воздействия на данный признак других варьирующих признаков. Определение вариации необходимо при организации выборочного наблюдения, построения статистических моделей, разработке материалов экспертных опросов и т.д.

Средняя величина – это обобщающая характеристика признака изучаемой совокупности. Она не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней. Поэтому для характеристики колеблемости признака используют показатели вариации.

Показатели  вариации делятся на  две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратичное отклонение.

1. Самым распространенным  абсолютным показателем является размах вариации, определяемый как разность между наибольшим (Хmax) и наименьшим (Хmin) значениями вариантов.

Этот показатель прост для расчета, что и обусловило его широкое распространение. Однако, он улавливает только крайние отклонения и не отражает отклонений всех вариант в ряду.

2. Для обобщающей характеристики  распределения отклонений рассчитывают  среднее линейное отклонение  , определяемое как средняя арифметическая из отклонений индивидуальных значений от средней, без учета знака этих отклонений:

 

- невзвешенное среднее линейное  отклонение

           - взвешенное среднее линейное отклонение

 

Среднее линейное отклонение как меру вариации признака применяют  в статистической практике  редко, т.к. во многих случаях этот показатель не устанавливает степень рассеивания.

3. Меру вариации более  объективно отражает показатель дисперсии ( - средний квадрат отклонений), определяемый как средняя из отклонений, возведенных в квадрат:

- невзвешенная или  -  взвешенная

4. Корень квадратный  из дисперсии  s «среднего квадрата отклонений» представляет собой среднее квадратическое отклонение:

       

Среднее квадратическое отклонение (СКО) выражается в тех же единицах измерения, что и признак ( в литрах, тоннах, рублях, %-х и т.д.). СКО является мерилом надежности средней. Чем меньше СКО, тем лучше средняя арифметическая отражает собой представляющую совокупность.

К относительным показателям, позволяющим сравнивать характер рассеивания в различных распределениях, относятся следующие:

  1. Коэффициент осциляции – отражающий относительную колеблемость крайних значений признака вокруг средней:

  1. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:

3.Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средней величины.

Если   n>33% , то это говорит о большой колеблемости признака в изучаемой совокупности.

 

Целью статистического исследования является выявление основных свойств  и закономерностей изучаемой  статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения – атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит названиевариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней  величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум – это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k – число вариантов значений признака. Частоты удобно заменять частостями – wi. Частость – относительный показатель частоты – может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой  совокупности величины. Такие показатели

вариации, как среднее  линейное отклонение, дисперсия и  среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

– абсолютное значение (модуль) отклонения варианта от средней арифметической; f–частота.

Первая формула применяется, если каждый из вариантов встречается  в совокупности только один раз, а  вторая – в рядах с неравными  частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия (σ2) – средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется  при наличии у вариантов своих  весов (или частот вариационного  ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее  квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость  сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных  признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:

– наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

1.2 Виды  дисперсий и закон сложения  дисперсий.

Наряду с изучением  вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

Выделяют общую, межгрупповую и внутригрупповую  дисперсии.

Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности:

 

                       где   - общая средняя для всей изучаемой совокупности

 

Межгрупповая  дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних     около общей средней :

где  – средняя по отдельным группам,

        – общая средняя,

           - численность отдельных групп.

 

Средняя внутригрупповая дисперсия  характеризует случайную вариацию в каждой группе. Эта вариация возникает под влиянием других неучитываемых факторов и не зависит от условия (признака-фактора), положенного в основу группировки:

  

Существует  закон, связывающий три вида дисперсии (правило сложения дисперсий): общая дисперсия равна сумме средних из внутригрупповой и межгруповой  дисперсии:   

 

 

 

 

 

 

 

 

 

 

 

 

Глава 2. Практическая часть.

2.1 Исходные данные

Номер предприятия

 Выпуск товаров и услуг в 1 квартале текущего года, тыс. руб.

Среднесписочная численность работников, чел.

Среднемесячная  стоимость ОПФ в марте

 

Январь

Февраль

Март

Февраль

Март

 

1

2

3

4

5

6

7

43

1869

1912

1950

115

112

1027

44

2060

2110

2195

133

135

1203

45

550

577

603

76

79

468

46

1404

1299

1496

94

92

784

47

1210

1274

1302

79

74

512

48

2045

2190

2300

123

130

998

49

1564

1618

1745

100

97

848

50

772

790

808

76

74

672

51

560

587

613

79

82

448

52

1482

1513

1562

102

97

785

53

1200

1200

1286

77

74

672

54

1020

1000

1178

80

76

800

55

1504

1558

1705

100

96

859

56

1852

1894

1935

115

113

1020

57

1652

1739

1800

103

108

999

58

1562

1618

1598

102

105

845

59

1760

1810

1880

120

114

894

60

1332

1458

1519

95

98

754

61

778

799

832

79

77

596

62

1702

1653

1690

102

98

989

63

1116

1120

1190

86

84

672

64

450

480

500

70

66

395

65

1632

1743

1812

103

108

942

66

1270

1305

1410

92

95

754

67

1742

1703

1720

105

94

939

68

1745

169

1735

103

100

981

69

1855

1900

1920

117

112

1035

70

792

810

828

76

72

593

71

2090

2184

2210

140

142

1048

72

1720

1770

1830

115

103

1280


 

2.2 Группировка статистических данных

 

xi

395

448

468

512

593

596

672

754

784

785

800

mi

1

1

1

1

1

1

3

2

1

1

1

1234567891011

                     
                       

xi

845

848

859

894

939

942

981

989

998

999

1020

mi

1

1

1

1

1

1

1

1

1

1

1

1213141516171819202122

                     
                 

xi

1027

1035

1048

1203

1280

   

mi

1

1

1

1

1

       

2324252627

                 

 

Величина равных интервалов определяется по формуле:

 

K=

 

Результаты  группировки и сводки излагаются в виде статистической таблицы.

 

Табл.1 Зависимость между размером предприятия по стоимости ОПФ и выпуском товаров и услуг

№ п/п 

Группы предприятий по среднемесячной стоимости ОПФ, тыс. руб.

Количество  предприятий

Выпуск товаров  и услуг в целом по группе, тыс. руб.

Средний выпуск товаров и услуг, тыс. руб.

Изменение среднего выпуска товаров и услуг по сравнению с 1й группой, %

1

2

3

4

5

6

1

395,00-542,50

4

1823

455.75

100

2

542,50-690,00

6

3205

641

140,6

3

690,00-837,50

5

3877

775,4

170,1

4

837,50-985,00

7

6308

901,1

197,7

5

985,00-1132,50

7

7116

1016,6

223

6

1132,50-1280,00

2

2483

1241,5

272,4

Итого

30

24812

827,07

181,5


 

2.3 Ряды распределения

 

xi

500

603

613

808

828

832

1178

1190

1286

1302

1410

mi

1

1

1

1

1

1

1

1

1

1

1

∑ mi

1

2

3

4

5

6

7

8

9

10

11

                       

xi

1496

1519

1562

1598

1690

1705

1720

1735

1745

1800

1812

mi

1

1

2

1

1

1

1

1

1

1

1

∑ mi

12

13

15

16

17

18

19

20

21

22

23

                       

xi

1830

1880

1920

1935

1950

2210

2300

       

mi

1

1

1

1

1

1

1

       

∑ mi

24

25

26

27

28

29

30

       

 

 

Формула Стерджисса:

 

Расчёт средней  арифметической и показателей вариации

Интервалы по xi

2

 

500-800*

3

650

1950

3

782

2346

611524

1 834 572

800-1100

3

950

2850

6

482

1446

232324

696 972

1100-1400

4

1250

5000

10

182

728

33124

132 496

1400-1700

6

1550

9300

16

118

708

13924

83 544

1700-2000

11

1850

20350

27

418

4598

174724

1 921 964

2000-2300

2

2150

4300

30

718

1436

515524

1 031 048

Итого:

30

-

43750

-

-

11262

-

5 700 596


*- верхняя граница  включительно.

 

 

Средняя арифметическая для дискретного ряда

 

 

где xi - варианты признака;

mi - соответствующие частоты.

Средняя арифметическая для интервального ряда

 

 

где хсрi - центр i-ого интервала;

mi - частота в i-ом интервале

Мода и  медиана

1) для дискретного ряда

При четном числе  вариантов медиана будет равна  средней арифметической из двух срединных  вариантов.

 

 

2) для интервального ряда

Медианным является первый интервал, для которого ∑mi превышает половину от общего числа наблюдений. Т.е. интервал 1401,5 - 1702 - медианный.

 

где хМеmin - нижняя граница медианного интервала;

∆х - длина интервала;

- половина накопленных частот;

νm-1 - накопленная частота интервалов, предшествующая медианному интервалу

mMe - частота медианного интервала.

Мода - это вариант, наиболее часто встречающийся в данном вариационном ряду.

1) для дискретного ряда - это вариант с наибольшей частотой.

Мо1 = 1417;

2) для интервального ряда определяют модальный интервал по наибольшей частоте (mМо = 10)

 

 

где  хМоmin - нижняя граница модального интервала;

К - величина интервала;

mМо - частота интервала;

mMo-1 - частота интервала, предшествующего модальному;

mMo+1 - частота интервала, следующего за модальным.

Показатели  вариации

1. Размах вариации:

 

R = xmax - xmin = 2300-500=1800

 

. Среднее линейное  отклонение (для интервального ряда):

 

3. Дисперсия:

 

 

где  - средняя из квадратов значений признака;

- квадрат средней арифметической;

4. Среднее квадратичное отклонение

 

 

5. Коэффициенты вариации:

 

 

2.4 Дисперсия. Виды дисперсий. Закон сложения дисперсий

 

1. Общая дисперсия

 

,

 

где - общая средняя для всей совокупности.

 

xi

mi

xi*mi

 

500

1

500

932

868 624

603

1

603

829

687 241

613

1

613

819

670 761

808

1

808

624

389 376

828

1

828

604

364 816

832

1

832

600

360 000

1178

1

1178

254

64 516

1190

1

1190

242

58 564

1286

1

1286

146

21 316

1302

1

1302

130

16 900

1410

1

1410

22

484

1496

1

1496

64

4096

1519

1

1519

87

7569

1562

2

1562

130

16 900

1598

1

1598

156

24 336

1690

1

1690

248

61 504

1705

1

1705

263

69 169

1720

1

1720

278

77 284

1735

1

1735

293

85 849

1745

1

1745

308

94 864

1800

1

1800

363

131 769

1812

1

1812

375

140 625

1830

1

1830

393

154 449

1880

1

1880

443

196 249

1920

1

1920

483

233 289

1935

1

1935

498

248 004

1950

1

1950

513

263 169

2210

1

2210

778

605 284

2300

1

2300

868

753 424

Итого:

30

42957

 

 

6 581 364


 

 

2. Внутригрупповая дисперсия

 

 

где  - среднее значение признака в i-й группе;

- повторяемость отдельных значений  признака в i-й группе.

 

1 группа

xi

fi

xi * fi

 

500

1

500

51.5

2652,25

603

1

603

48.5

2352,25

Итого:

2

1103

 

5004,5


 

 

 

2 группа

 xi

fi

xi * fi

 

613

1

613

238,8

57 025, 44

808

1

808

43,8

1918, 44

828

1

828

23,8

566,44

832

1

832

19,8

392,04

1178

1

1178

326,2

106 406, 44

Итого:

5

4259

 

166 308,8


 

 

группа

xi

fi

xi * fi

 

1190

1

1190

205

42 025

1286

1

1286

109

11 881

1302

1

1302

93

8649

1410

1

1410

15

225

1496

1

1496

101

10 201

1519

1

1519

124

15 376

1562

1

1562

167

27 889

Итого:

7

9765

 

116 246


 

 

группа

xi

fi

xi * fi

 

1598

1

1598

91.6

8390,56

1690

1

1690

0,4

0,16

1705

1

1705

15,4

237,16

1720

1

1720

30,4

924,16

1735

1

1735

45,4

2061,16

Итого:

5

8448

 

11613,2


 

 

группа

xi

fi

xi * fi

 

1745

1

1745

40,6

1648,36

1800

1

1800

14,4

207,36

1812

1

1812

26,4

696,96

Итого:

3

5357

 

2552,68

Показатели вариации и их значения в статистике