.Понятие статистических рядов распределения и их виды

Содержание

I Теоретическая часть

1.Понятие статистических рядов распределения и их виды………………4

2.Графическое изображение статистических данных………………………6

3.Расчет моды и медианы………………………………………….………….10

II Расчетная часть……………………………………………………...………12

Заключение…………………………………………………………...…………39

Список литературы…………………………………………….………………40

 

Введение

 

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения. Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

В теоретической части курсовой работы рассмотрены следующие аспекты:

  1. Понятие статистических рядов распределения, их виды;
  2. Расчет средних величин, моды и медианы и представление рядов распределения графически;

Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания: Работа с таблицей «Выборочные данные торговых предприятий района: товарооборот и средние товарные запасы». Предметом исследования в работе будут служить так же торговые предприятия района (каждое предприятие, из которых, со своим товарооборотом). Работа содержит расчеты всех данных по ним, так же полное описание шагов действий для достижения конечного результата (вывода).

При написании курсовой работы использовались учебники курса, дополнительная литература, Интернет-ресурсы; при работе с табличными данными - персональный компьютер конфигурации:

Процессор - ADM Sempron 28000+S754

Память - DDR 512Mb PC3200 (DDR400)

Жесткий диск - 120Gb 7200/8 Mb/SATA

Принтер - hp deskjet 3325, струйный

OC - Windows XP Professional

ППП - Microsoft Word 2002, Excel

 

I. Теоретическая часть

 

1. Понятие статистических рядов распределения и их виды

 

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на следующие:

атрибутивные (качественные);

вариационные (количественные):

дискретные;

интервальные.

а) Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д. В правовой статистике - это виды преступлений (убийства, грабежи, разбои); занимаемая должность лиц, совершивших административные правонарушения; образование и т.д.

Пример атрибутивных рядов распределения:

 

Таблица 1. Распределение преступлений в г. Москве за сутки по видам

Виды преступлений

Количество преступлений

 

абсолютное

в % к итогу

Убийства

3

3,2

Тяжкие телесные повреждения

3

3,2

Изнасилования

1

1,1

Разбои

4

4,3

Грабежи

15

16,1

Кражи

52

56,0

Изъятия наркотиков

15

16,1

Итого

93

100


 

В данном примере группировочным признаком выступают виды преступлений. Данный ряд распределения является атрибутивным, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число правонарушений составляют кражи 56%; далее правонарушения распределяются поровну между грабежами и случаями изъятия наркотиков (16%) и убийствами и случаями нанесения тяжких телесных повреждений (3%); разбои составили 4.5%, и наименьшее число зарегистрированных правонарушений составили изнасилования -1%.

б) Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными).

Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (число раскрытых преступлений и т.д.). Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака , а затем подсчитывается частота повторения варианта . Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование - расположение всех вариантов в возрастающем (убывающем) порядке

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число интервалов, на которые следует разбить все единицы изучаемой совокупности.

 

2.Графическое изображение статистических данных

 

Статистический график - это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.

Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.

 

Таблица 2. Распределение студентов по возрасту

Возраст студентов

Число студентов данного возраста

17

1

18

4

19

2

20

2

21

5

Итого

14


 

График 1

 

Расчет показателей вариации.

Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации:

а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:

 

R = Xmax - Xmin

 

Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

б) Среднее линейное отклонение

 

(7)   - невзвешенное;

(8)   - взвешенное,

 

где: Х - варианты;

`Х - средняя величина;

n - число признаков;

f - частоты.

Линейное отклонение учитывает различия всех единиц изучаемой совокупности.

в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.

 

(9)  - невзвешенная;

(10)  - взвешенная.

 

Показатель дисперсии более объективно отражает меру вариации на практике.

г) Среднее квадратическое отклонение

 

(11)  - взвешенное;

(12)  - невзвешенное.

 

Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.

д) Показатель вариации.

 

(13) 

 

Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.

3.Расчет моды и медианы.

Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.

Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.

В интервальном ряду распределения мода находится по следующей формуле:

 

(4)  ,

 

где: минимальная граница модального интервала;

 - величина модального интервала;

{частоты модального интервала, предшествующего и следующего за ним

Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.

Медиана - варианта, находящаяся в середине ряда распределения.

Медиана делит ряд на две равные (по числу единиц) части - со значениями признака меньше медианы и со значениями признака больше медианы.

В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:

 

(5)  ,

 

где - варианты, находящиеся в середине ряда

В интервальном ряду распределения медиана рассчитывается следующим образом:

 

(6)  ,

 

где: - нижняя граница медианного интервала;

 - величина медианного интервала;

 - полусумма частот ряда;

 - сумма накопленных частот, предшествующих медианному интервалу;

 - частота медианного интервала.

Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства - сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:

 

2. Расчетная часть

 

По результатам 20%-ного выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.)

 

Таблица 1. Исходные данные

№ п\п

Товарооборот

Средние товарные запасы

№ п\п

Товарооборот

Средние товарные запасы

1

614

256

16

653

254

2

396

168

17

704

251

3

681

252

18

759

293

4

543

221

19

384

158

5

540

210

20

492

188

6

706

278

21

610

237

7

576

214

22

591

239

8

537

169

23

550

191

9

744

288

24

603

236

10

523

213

25

528

215

11

375

150

26

795

301

12

429

208

27

611

228

13

552

218

28

589

230

14

642

227

29

627

263

15

618

238

30

698

246


 

Цель статистического исследования - анализ совокупности предприятий по признакам Товарооборот и Средние товарные запасы, включая:

изучение структуры совокупности по признаку Товарооборота;

выявление наличия корреляционной связи между признаками Товарооборота и Средними товарными запасами предприятий, установление направления связи и оценка её тесноты;

применение выборочного метода для определения статистических характеристик генеральной совокупности фирм.

 

Задание 1

 

По исходным данным (табл. 1) необходимо выполнить следующее:

Построить статистический ряд распределения предприятий по товарообороту, образовав пять групп с равными интервалами.

Графическим методом и путем расчетов определить значения моды и медианы полученного ряда распределения.

Рассчитать характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.

Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным для интервального ряда распределения. Объяснить причину их расхождения.

Сделать выводы по результатам выполнения Задания 1.

Выполнение Задания 1

Целью выполнения данного Задания является изучение состава и структуры выборочной совокупности предприятий путем построения и анализа статистического ряда распределения фирм по признаку Товарооборот.

1. Построение интервального ряда распределения предприятий по товарообороту

Для построения интервального ряда распределения определяем величину интервала h по формуле:

 

,

 

где -наибольшее и наименьшее значения признака в исследуемой совокупности, k - число групп интервального ряда.

При заданных k = 5, xmax = 795 тыс.руб. и xmin = 375тыс руб.

 

h = тыс.руб.

 

При h = 5 чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):

 

Таблица 2

Номер группы

Нижняя граница, тыс.руб.

Верхняя граница, тыс.руб

1

375

459

2

459

543

3

543

627

4

627

711

5

711

795


 

Определяем число предприятий, входящих в каждую группу, используя принцип полуоткрытого интервала [ ), согласно которому предприятия со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов (459, 543, 627, и 711 тыс.руб), будем относить ко второму из смежных интервалов.

Для определения числа предприятий в каждой группе строим разработочную таблицу 3 (данные графы 4 потребуются при выполнении Задания 2).

 

Таблица 3. Разработочная таблица для построения интервального ряда распределения и аналитической группировки

Группы предприятий по товарообороту, тыс.руб.

Номер

предприятия

Товарооборот,

тыс.руб.

Средние товарные запасы,

Тыс. руб.

1

2

3

4

375-459

11

375

150

 

19

384

158

 

2

396

168

 

12

429

2208

Всего

4

1584

684

459-543

20

492

188

 

10

523

213

 

25

528

215

 

8

537

169

 

5

540

210

Всего

5

2620

995

543-627

4

543

221

 

23

550

191

 

13

552

218

 

7

576

214

 

28

589

230

 

22

591

239

 

24

603

236

 

21

610

237

 

27

611

228

 

1

614

256

 

15

618

238

Всего

11

6457

2508

627-711

29

627

263

 

14

642

227

 

16

653

254

 

3

681

252

 

30

698

246

 

17

704

251

 

6

706

278

Всего

7

4711

1771

711-795

9

744

288

 

18

759

293

 

26

795

301

Всего

3

2298

882

Итого

30

17670

6840


 

На основе групповых итоговых строк «Всего» табл. 3 формируем итоговую таблицу 4, представляющую интервальный ряд распределения предприятий по товарообороту.

 

Таблица 4. Распределение предприятий по товарообороту

Номер

группы

Группы предприятий по товарообороту, тыс.руб. x

Число предприятий,

fj

1

375-459

4

2

459-543

5

3

543-627

11

4

627-711

7

5

711-795

3

 

ИТОГО

30


 

Приведем еще три характеристики полученного ряда распределения - частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле

 

.

 

Таблица 5. Структура предприятий по товарообороту

Номер

группы

Группы предприятий по товарообороту, тыс.руб.x

Число предприятий,

f

Накопленная частота

Sj

Накопленная частость, %

в абсолютном выражении

в % к итогу

1

2

3

4

5

6

1

375-459

4

13,3

4

13,3

2

459-543

5

16,7

9

30,0

3

543-627

11

36,7

20

66,6

4

627-711

7

23,3

27

90,0

5

711-795

3

10

30

1000

 

ИТОГО

30

100

   

 

Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по товарообороту не является равномерным: преобладают предприятия с товарооборотом от 543 тыс.руб. до 627 тыс.руб. (это 11 предприятий, доля которых составляет 36,7%); самые малочисленная группа предприятий имеет 711-795 тыс.руб.. Группа включает 3 предприятия, что составляет по 10% от общего числа фирм.

2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов

Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения фирм по изучаемому признаку.

 

Рис. 1. Определение моды графическим методом

 

Расчет конкретного значения моды для интервального ряда распределения производится по формуле:

 

 

 

где хМo - нижняя граница модального интервала,

h - величина модального интервала,

fMo - частота модального интервала,

fMo-1 - частота интервала, предшествующего модальному,

fMo+1 - частота интервала, следующего за модальным.

Согласно табл. 4 модальным интервалом построенного ряда является интервал 35 - 40 чел., т.к. он имеет наибольшую частоту (f4=10). Расчет моды:

 

 

Вывод. Для рассматриваемой совокупности предприятий наиболее распространенный товарооборот характеризуется средней величиной 593,4 тыс. руб.

Для определения медианы графическим методом строим по данным табл. 5 кумуляту распределения предприятий по изучаемому признаку.

 

Рис. 2. Определение медианы графическим методом

 

Расчет конкретного значения медианы для интервального ряда распределения производится по формуле

 

,

 

где хМе- нижняя граница медианного интервала,

h - величина медианного интервала,

- сумма всех частот,

fМе - частота медианного интервала,

SMе-1 - кумулятивная (накопленная) частота интервала, предшествующего медианному.

Определяем медианный интервал. Медианным интервалом является интервал 543-627 тыс.руб., т.к. именно в этом интервале накопленная частота Sj=20 впервые превышает полусумму всех частот ( ).

Расчет медианы:

 

 

Вывод. В рассматриваемой совокупности предприятий половина из них имеют товарооборот не более 588,3 тыс.руб., а другая половина - не менее 588,3 тыс.руб.

3. Расчет характеристик ряда распределения

Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 5 строим вспомогательную таблицу 6 ( - середина интервала).

 

Таблица 6. Расчетная таблица для нахождения характеристик ряда распределения

Группы предприятий по товарообороту, тыс.руб.

Середина интервала,

Число предприятий,

fj

1

2

3

4

5

6

7

375-459

417

4

1668

-168

28224

112896

459-543

501

5

2505

-84

7056

35280

543-627

585

11

6435

0

0

0

627-711

669

7

4683

84

7056

49392

711-795

753

3

2259

168

28224

84672

ИТОГО

 

30

17550

   

282240


 

Рассчитаем среднюю арифметическую взвешенную:

 

 

Рассчитаем среднее квадратическое отклонение:

 

 

Рассчитаем дисперсию:

 

σ2 = 972 = 9409

 

Рассчитаем коэффициент вариации:

 

 

Вывод. Анализ полученных значений показателей и σ говорит о том, что средняя величина товарооборота составляет 585 тыс.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 97 тыс. руб. (или 16,5%), наиболее характерный товарооборот находится в пределах от 488 до 628 тыс. руб. (диапазон ).

Значение Vσ = 16,5% не превышает 33%, следовательно, вариация товарооборота в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями , Мо и Ме незначительно ( =585 тыс. руб., Мо=593,4 тыс. руб., Ме=588,3 чел.), что подтверждает вывод об однородности совокупности фирм. Таким образом, найденное среднее значение среднесписочной численности менеджеров (585тыс.руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.

4. Вычисление средней арифметической по исходным данным о среднесписочной численности менеджеров фирм

Для расчета применяется формула средней арифметической простой:

 

,

 

Причина расхождения средних величин, рассчитанных по исходным данным (17550 тыс. руб.) и по интервальному ряду распределения (17670 тыс. руб.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти фирм, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении товарооборота внутри каждой группы интервального ряда.

 

Задание 2

 

По исходным данным (табл. 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:

Установить наличие и характер корреляционной связи между признаками товарооборот и средние товарные запасы, образовав шесть групп с равными интервалами по каждому из признаков, используя методы:

а) аналитической группировки;

б) корреляционной таблицы.

2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.

Сделать выводы по результатам выполнения задания 2.

.Понятие статистических рядов распределения и их виды