Обработка статистических данных. 5
Федеральное агентство по образованию
ГОУ ВПО
Уральский
Государственный Горный Университет
Кафедра
экономики и менеджмента
Курсовая
работа
«Обработка статистических данных»
(группировка,
динамика, вариация, корреляционно-регрессионный
анализ)
Студент: Гаубрих О.В.
Группа:
МОГ-04-1
Екатеринбург
2006
Содержание
Введение…………………………………………………………
Глава I. Общее описание методов обработки
статистических данных……………………………………………4
- Группировка статистических данных………………………….4
1.1.1Структурные средние значения……………………………….6
1.2 Ряд динамики…………………………………………………….7
1.3 Вариация…………………………………………………………
1.4 Корреляционно-регрессионный анализ………………………..10
Глава II. Обработка статистических данных……………………………..13
2.1 Аналитическая группировка……………………………………13
2.1.1 Структурные средние значения………………………………15
2.2 Ряды
динамики…………………………………………………..
2.3 Вариация…………………………………………………………
2.4 Корреляцинно-регрессионный анализ…………………………21
Заключение……………………………………………………
Список использованной литературы……………………………………...24
Приложение……………………………………………………
Глава I. Общее описание
методов обработки статистических
данных
- Группировка статистических данных
Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка. Понятие статистической группировки в широком смысле слова охватывает целый комплекс статистических операций, направленных не объединение зарегистрированных при наблюдении единичных случаев в группы, сходные в том или ином отношении, поскольку целостную характеристику совокупности необходимо сочетать с характеристикой основных ее частей, классов и т.д.; подсчет итогов по выделенным группам и по всей совокупности в целом и, наконец, оформление результатов группировки в виде статистических таблиц.
Под группировкой в статистике понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучение их структуры и взаимосвязи.
Существует три вида группировки статистических данных: типологическая, структурная и аналитическая.
Аналитическая группировка характеризует взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой как фактор.
Совокупность признаков в данной ситуации делятся на две группы:
- Факторные – это признаки влияющие на формирование результативного.
- Результативные – это признаки изменяющиеся под воздействием факторных.
Особенностями аналитической группировки является то, что в основу положен факторный признак и каждая выделенная группа характеризует среднее значение результативного признака.
Группировочный признак – это признак, по которому проводится разбивка единиц совокупности на отдельные группы. От правильности выбора группировочного признака зависят выводы, которые получатся в результате исследования.
Интервалы группировочного признака – это значение варьирующегося признака меняющегося в определенных границах. Границы бывают двух видов: нижняя (наименьшее значение признака в интервале) и верхняя (наибольшее значение признака в интервале).
Величина интервала представляет собой разность между верхней и нижней границами интервала, в свою очередь интервалы подразделяются на равные и неравные, а так же они бывают открытыми и закрытыми.
Величина интервала рассчитывается по формуле:
,
где – максимальное значение признака в совокупности,
– минимальное значение признака в совокупности.
Для нахождения интервального шага, нужно воспользоваться следующей формулой:
, (1.2)
где n – количество групп или интервалов, которые можно посчитать следующим образом:
,
где N – количество единиц в совокупности.
Эти формулы нам необходимы для того, чтобы произвести группировку исходных статистических данных и на полученных результатах построить таблицу.
- Структурные средние значения
В процессе обработки и обобщения статистических данных возникает необходимость определения средних величин. Как правило, индивидуальные значения одного и того же признака у различных единиц совокупности неодинаковы. Средняя величина – обобщающая характеристика изучаемого принципа в исследуемой совокупности. Она отражает его типичный уровень в расчете на единицу совокупности конкретных условий места и времени. Существует два вида средних величин: степенные и структурные средние.
К структурным средним величинам относятся:
- Мода
- Медиана
Моду и медиану часто используют как среднюю характеристику в тех совокупностях, где расчет средне- степенной невозможен или нецелесообразен.
Мода представляет собой значение изучаемого признака, повторяющегося с наибольшей частотой. Мода рассчитывается по формуле:
,
где - нижняя граница модального ряда,
- величина модального интервала,
- частота модального интервала,
- частота интервала предшествующего модальному,
- частота интервала следующего за модальным.
Медианой называют значение признака, приходящегося на середину упорядоченного ряда, который делит частоты пополам. Для ее определения существует формула:
,
где - нижняя граница медианного интервала,
- величина медианного интервала,
- половина накопительной частоты,
- накопительная частота интервала предшествующего медиану,
- частота медианного интервала.
1.2
Ряд динамики
Важной
задачей статистики является изучение
изменений анализируемых
Ряд
динамики – это временная
Показатели ряда динамики делятся на два класса:
- Цепные показатели ряда динамики характеризуют изменение каждого последующего показателя по сравнению к предыдущим;
- Базисный показатель ряда динамики характеризует изменение уровня ряда по сравнению с базисным показателем.
Расчет показателей изменения уровня ряда динамики.
- Абсолютный прирост характеризует размер увеличения, и уменьшения ряда за определенный период времени.
Для цепного показателя:
,
.
Для базисного показателя:
,
,
где - базисный уровень ряда,
, - каждый последующий уровень ряда за базисным.
- Темп роста показывает процентное изменение уровня ряда по сравнению с цепным или базисным показателем.
Для цепного показателя:
,
.
Для базисного показателя:
,
.
- Темп прироста показывает на какой процент уровень данного периода изменился по сравнению к цепному или базисному показателю.
Для цепного показателя:
.
Для базисного показателя:
.
Расчет средних показателей ряда динамики.
- Средний уровень ряда:
,
где - число уровней.
- Средний абсолютный прирост – это обобщающий показатель скорости изменения явления во времени.
.
где - конечный уровень ряда динамики,
- начальный уровень ряда динамики.
- Средний темп роста:
Для цепного показателя:
.
Для базисного показателя:
.
- Средний темп прироста:
.
1.3
Вариация
Составной частью обработки данных статистического наблюдения является построение рядов распределения. Цель его – выявление основных свойств и закономерностей исследуемой статистической совокупности. В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают соответственно два типа рядов распределения – атрибутивные и вариационные. Ряды распределения, построенные по качественным признакам, называют атрибутивными, а по количественному – вариационными. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие в величине признака носит название вариации.
Расчет показателей вариации.
Среднее значение совокупности:
,
где - значение единиц совокупности,
- количество единиц совокупности.
Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности под влиянием отдельных факторов.
.
Коэффициент вариации оценивает однородность совокупности. Совокупность считается однородной, если коэффициент не превышает 33%.
.
Проверка на однородность совокупности.
Необходимыми
предпосылками корректного
.
1.4
Корреляционно-регрессионный
анализ
Суть
корреляционного анализа
Линейный коэффициент корреляции наблюдается при линейной зависимости, изменяемой в интервале от -1 до 1. Если , то связь прямая. Если , то – обратная. Этот коэффициент можно найти по формуле:
,
где - значение факторного признака,
- значение результативного признака,
- среднее квадратическое отклонение факторного признака,
- среднее квадратическое отклонение результативного признака.
В свою очередь среднее квадратическое отклонение рассчитывается:
Для факторного признака
,
для результативного признака
.
Регрессионный анализ – это метод установления аналитического выражения зависимости между исследуемыми признаками в процессе сбора и анализа полученных результатов.
Уравнение регрессии показывает, как в среднем изменяется результативный признак при изменении факторного.
Уравнение регрессии следующее:
,
.
где - характеризует значение неучтенных факторов влияющих на формирование результативного признака,
- показывает изменение факторного признака на единицу собственного измерения.
Уравнение линейной регрессии:
.
где - общие затраты,
- переменные затраты,
- постоянные затраты,
- объем производства.
При учете и оценки затрат проводится группировка с учетом объемов производства. В результате затраты делятся на переменные и постоянные .
Постоянные затраты не зависят от изменения объемов.
Переменные
затраты изменяются прямо-пропорционально
объему производства.
Глава
II. Обработка статистических
данных
- Аналитическая группировка
Исходные данные смотри в Приложении.
В последующих вычислениях за x принят факторный признак, а за y результативный.
- Группировочный признак – объем производства.
- Определяем величину интервала R:
,
значит
.
- Определим количество групп и интервалов n:
.
- Найдем интервальный шаг h:
.
- Таким образом, у меня получились следующие интервалы:
Таблица 1. Интервалы
| № | Интервалы | Месяца, входящие в интервал | Количество месяцев |
| 1 | (34,13 - 35,66) | январь, июль, сентябрь, октябрь | 4 |
| 2 | (35,66 - 37,19) | февраль | 1 |
| 3 | (37,19 - 38,72) | май, ноябрь | 2 |
| 4 | (38,72 - 40,25) | март, июнь | 2 |
| 5 | (40,25 - 41,78) | август | 1 |
| 6 | (41,78 - 43,31) | 0 | |
| 7 | (43,31 - 44,84) | апрель | 1 |
| 8 | (44,84 - 46,37) | 0 | |
| 9 | (46,37 - 47,90) | декабрь | 1 |
- Строим группировочную таблицу:
Таблица 2. Группировочная таблица
| № | Группировка месяцев по объему производства | Количество месяцев | Среднее значение | |
| Затраты на производство, тыс.руб. | Объем производства, кг | |||
| 1 | (34,13 - 35,66) | 4 | 15651,53 | 35,02 |
| 2 | (35,66 - 37,19) | 1 | 16773,54 | 36,08 |
| 3 | (37,19 - 38,72) | 2 | 15983,19 | 37,55 |
| 4 | (38,72 - 40,25) | 2 | 17902,85 | 39,99 |
| 5 | (40,25 - 41,78) | 1 | 16266,9 | 40,45 |
| 6 | (41,78 - 43,31) | 0 | 0 | 0 |
| 7 | (43,31 - 44,84) | 1 | 15399,52 | 43,99 |
| 8 | (44,84 - 46,37) | 0 | 0 | 0 |
| 9 | (46,37 - 47,90) | 1 | 19242,44 | 47,99 |
Вывод: наибольшее количество месяцев входит в группу по объему производства (34,13 - 35,66), что составляет примерно 33,3%, при средних затратах на производство 15651,53 тыс.руб.
- Проанализируем полученные данные:
Таблица 3. Общие данные по выбранному интервалу
| январь | июль | сентябрь | октябрь | |
| Затраты на производство, тыс.руб. | 15421,22 | 16736,03 | 14536,11 | 15912,76 |
| Объем производства, кг | 34,13 | 35,21 | 35,16 | 35,61 |

- Обработка статистических данных
- Обработка статистических данных предприятия
- Обработка статистических данных предприятия
- Обработка статистических данных предприятия
- Обработка статистических данных средствами пакета Statgraphics
- Обработка статистических данных (статистика затрат)
- Обработка статистических данных (статистика затрат)
- Обработка результатов прямых многократных неровностей измерений, метрология
- Обработка результатов теодолитной съемки составление плана участка
- Обработка результатов эксперимента
- Обработка рук
- Обработка статистических данных
- Обработка статистических данных
- Обработка статистических данных