Статистические ряды
Содержание
Введение
Одним из наиболее важных элементов статистики являются статистические ряды распределения. Они используются практически во всех статистических исследованиях, т.к. информация, полученная в трезультате наблюдений оформляется именно в виде статистических рядов.
Первичные данные, получаемые в результате наблюдений, обрабатываются, на основании этой обработки получают обобщающие характеристики изучаемого явления. В дальнейшем осуществляется анализ и прогнозирование, составляются статистические таблицы. Таким образом информация представляется в наглядном виде. Графики и таблицы, полученные в результате анализа позволяют более наглядно воспринимать результаты анализа. На основе статистических рядов вычисляются основные статистические величины: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д. С их помощью проводится прогнозирование, что является конечным итогом исследования
Актуальность данной темы обуславливается тем, что понимание процесса построения и анализа статистических рядов распределения необходимо в различных областях экономических исследований и, овладев этим аппаратом, менеджер любого ранга становится выше профессионально.
1 Статистические ряды
1.1 Понятие и виды статистических рядов
Статистический ряд – это упорядоченная совокупность значений показателей. Ряды подразделяются на ряды распределения и ряды динамики.
Ряд распределения – это
Статистические признаки которые учитываются в исследовании носят различную природу. В связи с этим и ряды, которые получаются в результате исследования различаются по типу:
Для различных статистических признаков строятся ряды распределения разного типа.
Если в исследовании участвуют описательные признаки (пол, профессия и пр.), то строятся атрибутивные ряды. В них признаки распределяются в порядке возрастания или убывания наблюдаемых значений признака.
Если же мы наблюдаем количественные признаки, например, распределение трудящихся по уровню зарплаты, то строятся вариационные ряды.
Вариационные ряды, в свою очередь, бывают дискретными и интервальными.
В дискретных рядах признак принимает только целые значения, например, группа инвалидности.
В интервальных рядах признак может принимать любые значения из допустимого интервала, в том числе, отрицательные и дробные. Т.е. можно сказать, что значение признака – непрерывно. В этом случае значение признака группируется. Ширина интервала группировки может быть постоянной (равноинтервальная группировка) и различной для разных групп (неравноинтервальная группировка).
Кроме уже названных статистических рядов, можно построить ряды динамики. Они используются для отображения некоторых динамических процессов, когда важно исследовать изменение наблюдаемого показателя во времени. Динамические (временные или хронологические) ряды представляют собой значения статистического показателя, упорядоченные во времени.
Ряд динамики состоит из двух элементов:
1. Время, дискретизированное на моменты или периоды ( );
2. Значения показателя, которые
относятся к конкретному
Временные ряды можно представклять как в табличной форме, так и в графической. Это зависит от целей представления: рассчет параметров (табличное представление) или качественная оценка внешнего вида изменений (тенденция и пр.).
Исследование временных рядов позволяет решить такие задачи:
- Выяснение интенсивности изменения параметра во времени;
- Получение количественных основной долговременной тенденции развития исследуемого явления;
- Изучение периодических и сезонных колебаний;
- Экстраполяция и прогнозирование.
Ряды динамики различают по:
- Времени. Бывают моментные и интервальные временные ряды. В моментных рядах значения показателя выражают состояние показателя в данный момент времени. В таких рядах сумма значений показателя не имеет смысла. Например, остаток средств на конец квартала. Здесь сумма значений ничего не отражает.
В интервальных рядах значение показателя отражает его состояние за некоторый период (например, прибыль за квартал). Эти значения можно суммировать и это значение имеет реальный смысл, в данном случае -, например, прибыль за год.
- Форме представления уровней. Значения показателей может представлять ряды абсолютных, относительных и средних величин.
- Числу показателей. Бывают изолированные и комплексные временные ряды (многомерные). Изолированный ряд строится по отдельному показателю, комплексный – по системе взаимосвязанных показателей.
- Расстоянию между датами или интервалами. Если временные «метки» расположены с одинаковыми дискретами времени, то такие ряды называют рядами с равноотстоящими уровнями, в противном случае – с неравноотстоящими уровнями.
1.2. Показатели рядов распределения
1.2.1 Основные элементы рядов распределения
Основными элементами рядов распределения являются:
1) значение признака (варианта):
2) частота (n) - число единиц совокупности, обладающих данным значением признака. Частота показывает, сколько раз данное значение признака встречается в совокупности; сумма всех частот всегда равна объему статистической совокупности.
Она является исходной характеристикой любого ряда распределения. На ее основе можно рассчитать и другие характеристики:
Частость (q) – удельный вес (доля) единиц совокупности, имеющих определенное значение признака, т. е. это частота, выраженная в виде относительной величины (доли единицы или процента).
Накопленная частота (N) – число единиц совокупности, у которых значение признака не превышает данного, т. е. это частота нарастающим итогом:
Накопленная частость (Q) – удельный вес (доля) единиц, у которых значение признака не превосходит данное, т. е. это частость нарастающим итогом:
Плотность распределения – универсальная частотная характеристика, позволяющая перейти от эмпирического к теоретическому распределению. Для рядов с неравными интервалами только эта характеристика дает правильное представление о характере распределения. Плотность распределения рассчитывается в 2-х вариантах:
- как абсолютная плотность распределения
- как относительная плотность распределения
Плотность распределения обеспечивает сопоставимость различных рядов распределения. Разные ряды распределения характеризуются разным набором частотных характеристик.
1.2.2 Средние величины
Средние величины – это наиболее часто используемые показатели, используемые при анализе статистических рядов. Они относятся к обобщающим характеристикам.
Общая формула для средней величины имеет вид:
(1),
где `Х - средняя величина;
X – измеренная величина признака;
n - число признаков ;
m - показатель степени средней.
В зависимости от n различают такие средние:
а). Средняя арифметическая невзвешенная (m=1):
(2)
б). Средняя арифметическая взвешенная:
(3)
где f - частоты или веса
1.2.3 Мода и медиана
Для изучения внутреннего строения
и структуры рядов
Мода - это значение признака, который наиболее часто встречается в данной совокупности. Для этого значения признака в статистическом ряду будет наблюдаться наибольшая частота повторения
В интервальном ряду распределения мода находится по следующей формуле:
(4)
где: минимальная граница модального интервала;
- величина модального интервала;
{частоты модального интервала, предшествующего и следующего за ним
Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.
Медиана – это среднее значение признака ряда
Медиана делит ряд на две равные по суммарной частоте наблюдения части – со значениями признака меньше медианы и со значениями признака больше медианы.
Если вариационный ряд имеет число значений признака четное, то расчет медианы производится по следующей формуле:
, (5)
где - значения признака, находящиеся в середине ряда
В интервальном
ряду распределения медиана
, (6)
где: - нижняя граница медианного интервала;
- величина медианного интервала;
- полусумма частот ряда;
- сумма накопленных частот, предшествующих медианному интервалу;
- частота медианного интервала.
Мода и медиана при анализе рядов отражают следующее. Мода – это именно то число, которое в действительности встречается наиболее часто. Медиана же обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности.
Если статиский ряд
1.2.4 Графическое изображение статистических данных
Ряды распределения удобно анализировать и оценивать качественно, если они представлены в виде графиков и диаграмм
На графике статистические совокупности в виде неких геометрических образов представляют интересующие нас показатели. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.
Значение графического метода в
анализе и обобщении данных велико.
Простое сопоставление табличны
Наряду с графиками широко используются и диаграммы различных видов: столбчиковые, круговые и пр. Выбор вида диаграммы зависит в основном от особенностей исходных данных, цели исследования. Например, если имеется ряд динамики с несколькими неравноотносящимися уровнями во времени (1913, 1940, 1950, 1980, 1985, 1997 гг.), то часто для наглядности используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не годны для изображения большого числа уровней, так как громоздки. Когда число уровней в ряду динамики велико, целесообразно применять линейные диаграммы, которые воспроизводят непрерывность процесса развития в виде непрерывной ломанной линии. Кроме того, линейные диаграммы удобно использовать: если целью исследования является изображение общей тенденции и характера развития явления; когда на одном графике необходимо изобразить несколько динамических рядов с целью их сравнения; если наиболее существенным является сопоставление темпов роста, а не уровней.
1.2.5 Расчет показателей вариации.
Анализ средних величин не дает полной картины при исследовании случайных процессов. Нам не достаточно знать только некоторое среднее. Нам еще, как минимум, надо выяснить, в каких пределах оно изменяется. Для этого вычисляют показатели вариации.
Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности.
Различают следующие показатели вариации:
а) Размах вариации R. Это – разность между максимальным и минимальным значениями признака:
R = Xmax – Xmin
Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.
б) Среднее линейное отклонение
невзвешенное;
(7)
взвешенное,
(8)
где: Х - варианты;
`Х - средняя величина;
n - число признаков;
f - частоты.
Линейное отклонение учитывает различия всех единиц изучаемой совокупности.
в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.
невзвешенная;
(9)
взвешенная.
(10)
Показатель дисперсии более объективно отражает меру вариации на практике.
г) Среднее квадратическое отклонение
взвешенное;
(11)
невзвешенное.
(12)
Среднее квадратическое отклонение является
показателем надежности средней: чем
меньше среднее квадратическое отклонение,
тем лучше средняя
д) Показатель вариации.
(13)
Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.
1.3 Показатели временных рядов
1.3.1 Компоненты временных рядов
При исследовании временных рядов берутся в рассмотрение следующие компоненты, которые могут в них присутствовать:
- тренд;
- случайная составляющая;
- сезонные изменения;
- циклические изменения.
Треннд - это изменение, которое определяет общее направление развития, т.е. основная тенденция временного ряда. Это систематическая составляющая долговременного действия.
Кроме этого, во временных рядах часто присутствуют периодические составляющие, т.е сезонные и циклические коледания.
Сезонные колебания – это такие колебания, период которых не более одного года. Чаще всего к их возникновению причастны природные условия, например, колебания цен на сельскохозяйственную продукцию. Так, ежегодно в период сбора урожая происходит снижение цен на такую продукцию. В дальнейшем цена возрастает, так как продукцию надо хранить, а это происходит, обычно уже не в самих сельхоз предприятиях, а где-то на стороне. Сюда же приплюсовывается и стоимость перевозок, различные «накрутки» и пр. Поэтому говорят, что в колебаниях цен присутствует годовая периодичность
Иногда причины сезонных колебаний имеют социальный характер, например, увеличение закупок в предпраздничный период, увеличение платежей в конце квартала и т.д.
Говорят, что во временном ряде присутствует циклическая составляющая, если период колебаний более года. Она может появляться в связи, например, с какими-либо демографическими циклами.
При удалении из временного ряда выше перечисленных составляющих, в нем остается нерегулярная компонента. Она может формироваться под воздействием следующих факторов:
- факторы внезапного действия;
- текущие факторы.
Факторы внезапного действия чаще всего обусловлены какими-то катаклизмами, стихийные бедствия, например. Они вызывают значительные отклонения наблюдаемых величин ряда.
Текущие факторы определяют случайные колебания. Случайные колебания связаны с действием большого числа некоторых побочных причин. По отдельности эти причины мало влияют на наблидаемые величины, но в своей массе могут привести к существенным отклонениям.
Таким образом, временной ряд можно представить, как сочетание выще перечисленных компонент. Если эти компоненты суммируются, то такое представление называется аддитивным (14), если компоненты перемножаютя – то мультипликативным (15), а если прсутствует некая комбинация – то смешанным (16).
где yt — уровни временного ряда;
ut — трендовая составляющая;
st — сезонная срставляющая;
vt — циклическая составляющая;
et — случайная составляющая.
Анализировать временные ряды начинают с построения его графика – зависимости наблюдаемой компоненты от времени. Это легко делается с помощью, например, какого-нибудь офисного пакета. Часто по графику можно определить, являются ли сезонные коледания аддитивного типа или мультипликативного. Например, если отклонение сезонных колебаний от тренда остается приблизительно постоянной, то они нося характер мультипликативный
Рассмотрим пример. На рис. 1 приведен временной ряд производства электроэнергии в России в 1994 – 1999 гг.
Проанализировав график, можно сделать вывод, что его тренд, скорее всего, представляет собой кривую первого порядка, т.е. прямолинен. Кроме того, на графике явно наблюдаются сезонные колебания. Мы наблюдаем подъем потребления электроэнергии осенью и зимой, а весной и летом наблюдается спад потребления. Внутри года амплитуда сезонных колебаний приблизительно одинакова и не зависит от уровня тренда. Таким образом, можно сделать вывод об аддитивном характере сезонных
Таким образом, на стадии проведения графического анализа можно исследовать компонентный состав временных рядов, а также сделать первые шаги к выбору модели для описания их динамики и последующего прогнозирования.
В тех случаях, когда «на глаз» трудно выявить тренд временного ряда, необходимо для начала выяснить, а есть ли в данном процессе тренд вообще?
Рис. 1. График производства электроэнергии в Российской Федерации за период с 1994 по 1999 гг. (млн. кВт.ч )
Решение этой задачи связано с проверкой гипотез. Наиболее часто для этих целей используется метод Фостера-Стюарта.
Алгорим этого метода таков:
1) Сравниваем каждый уровень временного ряда с предшествующими и определяем характеристики mt и lt:
Т.е, mt = 1, если yt больше всех предшествующих уровней, а lt = 1, если yt меньше всех предшествующих уровней.
2) Вычисляем .
Т.е.
3) Находим
4) Проверяется нулевая гипотеза Н0 такая, что разность - случайная, т.е. ряд не содержит тренда. Проверка проводится по критерию Стьюдента.
Вычисляем
где :
Значения sD затабулированы.
Таблица 1
Значения стандартных ошибок σD для n от 10 до 100
п |
sD |
п |
sD |
п |
sD |
п |
sD |
|
10 |
1,964 |
35 |
2,509 |
60 |
2,713 |
85 |
2,837 |
15 |
2,153 |
40 |
2,561 |
65 |
2,742 |
90 |
2,857 |
20 |
2,279 |
45 |
2,606 |
70 |
2,769 |
95 |
2,876 |
25 |
2,373 |
50 |
2,645 |
75 |
2,793 |
100 |
2,894 |
30 |
2,447 |
55 |
2,681 |
80 |
2,816 |
Сравниваем tнабл с критическим значением tкр, который находим по таблицам t — распределения Стьюдента для
заданного уровня значимости а и числа степеней свободы
v =п-1. Если |tнабл|> tкр, то гипотеза
об отсутствии тренда отвергается.
1.3.2 Основные показатели динамики экономических явлений
Для оценки изменения показателей во времени используются, в основном, такие показатели:
- абсолютные приросты;
- темпы роста;
- темпы прироста.
При этом каждый показатель может быть:
- цепным;
- базисным;
- средним.
При расчете показателей динамики происходит сравнение уровней временного ряда. Если каждый уровень ряда сравнивается с одним и тем же уровнем, который принято называть базисным, то вычисляются базисные показатели. В качестве базисного обычно выбирается начальный уроверь ряда.
Если каждый последующий уровень сравнивается с предыдущим, то такие показатели называют цепными.
Разность двух сравниваемы уровней определяет абсолютный прирост Dу.
Отношение двух сравниваемых уровней ряда, выраженное в процентах, характеризует темп роста Т .
Абсолютный прирост в относительных величинах характеризует темп прироста К.
В таблице 2 приведены выражения для описанных величин. В таблице использованы обозначения:
yl, y2,...,yt,...,yn — уровни временного ряда, t = 1, 2, ... , n;
п — длина временного ряда;
уб — уровень временного ряда, принятый за базу сравнения.
Обобщающими показателями для временных рядов являются средние значения абсолютного прировта, темпа роста и темпа прироста. Они очень интересны для статистического анализа. Так как позволяют строить прогнозы.
Например, если воспользоваться формулой
где уп — фактическое значение конечного уровня ряда (в последней, n-й точке ряда);
— прогнозное значение (п + L)-го уровня ряда;
— значение среднего абсолютного прироста, рассчитанное для временного ряда yl, y2,...,yt,...,yn;
L – период упреждения (количество шагов вперед),
то можно получить оценку прогнозного состояния процесса на L шагов вперед.
Таблица 2
Однако, такой подход приемлем, если тенденция развития близка к линейной. Признаком линейности могут быть примерно одинаковые значения цепных абсолютных приростов.
Если же динамика развития процесса близка к показательному или экспоненциальному закону, то используют средние темпы роста или прироста. Прогноз на L шагов вперед мы можем получить по формуле:
где уn — конечный уровень временного ряда;
— прогнозное значение (п + L)-го уровня ряда;
— значение среднего темпа роста временного ряда в абсолютном выражении.
К недостаткам рассчетов с использованием средних величин можно отнести то, что они используют только две крайние точки временного ряда и не учитывают промежуточных значений. Однако, они имеют очень широкую сферу применения из-за простоты вычисления и могут быть использованы для приблизительных рассчетов или прикидок.
2. Практическая часть
1.1 Анализ вариационного ряда
При регистрации размеров продаваемой обуви в магазине получены следующие результаты: 39, 35, 40, 40, 36, 39, 42, 42, 38, 37, 37, 51, 43, 38, 38, 42, 39, 41, 42, 39, 37, 40, 42, 41, 38, 42, 41, 45, 43, 41, 41, 43, 45, 40, 42, 40, 38, 42, 38, 41, 39, 37, 39, 42, 39, 38.39.40,41.37,39.36.40, 41, 40, 44, 37, 43, 41, 43, 43, 40, 40, 41, 38, 51, 44, 40, 38, 44, 38, 38, 36, 40, 41, 39, 46, 39, 40, 42, 34, 42, 39, 40, 40, 44, 38, 38, 37, 38.
- Представить результаты наблюдения в виде простого статистического ряда (дискретного вариационного ряда);
- Найти выборочное среднее, выборочную моду, выборочную медиану и выборочную дисперсию;
- Построить полигон относительных частот;
- Найти доверительный интервал для оценки математического ожидания и среднего квадратического отклонения наблюдаемой случайной величины с надежностью 0.95;
a). Простой статистический ряд имеет такой вид:
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
X |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
49 |
50 |
51 |
N |
1 |
1 |
3 |
7 |
14 |
12 |
15 |
11 |
11 |
6 |
4 |
2 |
1 |
0 |
0 |
0 |
0 |
2 |
p* |
0,01 |
0,01 |
0,03 |
0,08 |
0,16 |
0,13 |
0,17 |
0,12 |
0,12 |
0,07 |
0,04 |
0,02 |
0,01 |
0,00 |
0,00 |
0,00 |
0,00 |
0,02 |
X |
7-9 |
9-11 |
11-13 |
13-15 |
15-17 |
17-19 |
n |
3 |
10 |
18 |
13 |
4 |
2 |
b). Выборочное среднее находим по формуле:
Выборочная дисперсия и среднее квадратическое отклонение равны:
Выборочная мода, наиболее часто встречаемое значение, равна 40, и выборочная медиана также равна 40, т.к. .
c). Построим полигон относительных частот.
d). Вычислим доверительный интервал для мат. ожидания.
Сначала по таблице для функции Лапласа найдем значение t из равенства F (t) = g / 2 = 0,475. По полученному значению t = 1,96 определим точность оценки (или половину длины доверительного интервала) d:
Отсюда получаем искомый доверительный интервал: (39.64; 40.82).
Вычислим доверительный
По числу степеней свободы, равному 89, и по вероятности (1 – 0,95)/2 = 0,025 находим из таблицы распределения c2 величину c22 = 117. Аналогичным образом при вероятности (1 + 0,95)/2 = 0,975 получаем c12 = 65. Используя формулу, получаем искомый доверительный интервал:
1.2 Анализ временного ряда
В таблице 3 приводятся сведения о вводе в действие жилых домов.
Требуется
- Рассчитать цепные, базисные и средние показатели абсолютного прироста, темпов роста и темпов прироста. За базисный принять начальный уровень ряда..
- Используя показатель среднего абсолютного прироста, определить прогнозное значение общей площади вводимого жилья в течение следующего года (L = 1), .
Таблица 3
Решение
Рассчет показателей представим в виде таблицы: (табл. 4).
Таблица 4
Определим средний абсолютный прирост, средний темп роста и прироста.
Средний абсолютный прирост равен:
Данный показатель указывает на то, что объем вводимого жилья в среднем ежегодно уменьшался на 0,525млн. м2.
Средний темп роста вычислим, как:
Этот показатель говорит о том, что в каждом последующем году в среднем жилья вводилось лишь 91,47% от уровня предыдущего года.

- Статистические ряды распределения, их значение и применение в статистике
- Статистические сведения о состояние преступности в России
- Статистические сводки
- Статистические службы международных организаций
- Статистические таблицы
- Статистические таблицы
- Статистические таблицы
- Статистические показатели их применения
- Статистические показатели населения
- Статистические показатели оплаты труда
- Статистические показатели рынка труда РФ
- Статистические показатели травматизма
- Статистические показатели, характеризующие уровень жизни населения. Занятость и безработица
- Статистические признаки и их классификация