Обработка статистических данных. 5

Федеральное агентство по образованию

ГОУ ВПО 

Уральский Государственный Горный Университет 

Кафедра экономики и менеджмента 
 
 
 

Курсовая  работа  

«Обработка  статистических данных»

(группировка,  динамика, вариация, корреляционно-регрессионный  анализ) 
 
 
 

                                  Преподаватель: Юркова Е.И.

              Студент: Гаубрих О.В.

              Группа: МОГ-04-1 
               
               
               
               
               
               
               
               

Екатеринбург

2006

    Содержание 

Введение……………………………………………………………………3

Глава I. Общее описание методов обработки

       статистических  данных……………………………………………4

    1. Группировка статистических данных………………………….4

    1.1.1Структурные  средние значения……………………………….6

    1.2 Ряд  динамики…………………………………………………….7

    1.3 Вариация………………………………………………………….9

    1.4 Корреляционно-регрессионный  анализ………………………..10

Глава II. Обработка статистических данных……………………………..13

    2.1 Аналитическая группировка……………………………………13

    2.1.1 Структурные  средние значения………………………………15

    2.2 Ряды  динамики…………………………………………………..15

    2.3 Вариация…………………………………………………………19

    2.4 Корреляцинно-регрессионный  анализ…………………………21

Заключение…………………………………………………………………23

Список  использованной литературы……………………………………...24

Приложение………………………………………………………………...25 
 
 
 
 
 
 
 

      Глава I. Общее описание методов обработки статистических данных 

    
    1. Группировка статистических данных
 

    Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка. Понятие статистической группировки в широком смысле слова охватывает целый комплекс статистических операций, направленных не объединение зарегистрированных при наблюдении единичных случаев в группы, сходные в том или ином отношении, поскольку целостную характеристику совокупности необходимо сочетать с характеристикой основных ее частей, классов и т.д.; подсчет итогов по выделенным группам и по всей совокупности в целом и, наконец, оформление результатов группировки в виде статистических таблиц.

    Под группировкой в статистике понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучение их структуры и взаимосвязи.

    Существует  три вида группировки статистических данных: типологическая, структурная  и аналитическая.

    Аналитическая группировка характеризует взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой как фактор.

    Совокупность  признаков в данной ситуации делятся  на две группы:

    1. Факторные – это признаки влияющие на формирование результативного.
    2. Результативные – это признаки изменяющиеся под воздействием факторных.

    Особенностями аналитической группировки является то, что в основу положен факторный признак и каждая выделенная группа характеризует среднее значение результативного признака.

    Группировочный  признак – это признак, по которому проводится разбивка единиц совокупности на отдельные группы. От правильности выбора группировочного признака зависят выводы, которые получатся в результате исследования.

    Интервалы группировочного признака – это значение варьирующегося признака меняющегося в определенных границах. Границы бывают двух видов: нижняя (наименьшее значение признака в интервале) и верхняя (наибольшее значение признака в интервале).

    Величина  интервала представляет собой разность между верхней и нижней границами  интервала, в свою очередь интервалы  подразделяются на равные и неравные, а так же они бывают открытыми и закрытыми.

    Величина  интервала рассчитывается по формуле:

     ,                                                                                 (1.1)

    где – максимальное значение признака в совокупности,

          – минимальное значение признака в совокупности.

    Для нахождения интервального шага, нужно воспользоваться следующей формулой:

        ,                                                                                      (1.2)

    где n – количество групп или интервалов, которые можно посчитать следующим образом:

      ,                                                                      (1.3)

    где N – количество единиц в совокупности.

    Эти формулы нам необходимы для того, чтобы произвести группировку исходных статистических данных и на полученных результатах построить таблицу.

      1. Структурные средние значения
 

    В процессе обработки и обобщения  статистических данных возникает необходимость определения средних величин. Как правило, индивидуальные значения одного и того же признака у различных единиц совокупности неодинаковы.  Средняя величина – обобщающая характеристика изучаемого принципа в исследуемой совокупности. Она отражает его типичный уровень в расчете на единицу совокупности конкретных условий места и времени. Существует два вида средних величин: степенные и структурные средние.

    К структурным средним  величинам  относятся:

    • Мода
    • Медиана

    Моду  и медиану часто используют как среднюю характеристику в тех совокупностях, где расчет средне- степенной невозможен или нецелесообразен.

    Мода  представляет собой значение изучаемого признака, повторяющегося с наибольшей частотой. Мода рассчитывается по формуле:

       ,                                                (1.4)

    где   - нижняя граница модального ряда,

             - величина модального интервала,

            - частота модального интервала,

            - частота интервала предшествующего модальному,

            - частота интервала следующего за модальным.

    Медианой  называют значение признака, приходящегося  на середину упорядоченного ряда, который делит частоты пополам. Для ее определения существует формула:

     ,                                                     (1.5)

    где - нижняя граница медианного интервала,

           - величина медианного интервала,

          - половина накопительной частоты,

           - накопительная частота интервала предшествующего медиану,

           - частота медианного интервала. 

    1.2 Ряд динамики 

    Важной  задачей статистики является изучение изменений анализируемых показателей  во времени. Эти изменения можно  изучать, если иметь данные по определенному  кругу показателей на ряд моментов времени или за ряд промежутков времени, следующих друг за другом.

    Ряд динамики – это временная последовательность значений, состоящая из статистических показателей. Статистические показатели, характеризующие изучаемый объект, называют уровнями ряда.

    Показатели  ряда динамики делятся на два класса:

    • Цепные показатели ряда динамики характеризуют изменение каждого последующего показателя по сравнению к предыдущим;
    • Базисный показатель ряда динамики характеризует изменение уровня ряда по сравнению с базисным показателем.

    Расчет  показателей изменения уровня ряда динамики.

    1. Абсолютный прирост характеризует размер увеличения, и уменьшения ряда за определенный период времени.

    Для цепного показателя:

      ,

        .                                                                                              (1.6)

    Для базисного показателя:

      ,

       ,                                                                                               (1.7)

    где - базисный уровень ряда,

           ,   - каждый последующий уровень ряда за базисным.

    1. Темп роста показывает процентное изменение уровня ряда по сравнению с цепным или базисным показателем.

    Для цепного показателя:

        ,

     .                                                                                         (1.8)

    Для базисного показателя:

     ,

     .                                                                                        (1.9)

    1. Темп прироста показывает на какой процент уровень данного периода изменился по сравнению к цепному или базисному показателю.

    Для цепного показателя:

     .                                                                                           (1.10)

    Для базисного показателя:

     .                                                                                           (1.11)

    Расчет  средних показателей ряда динамики.

    1. Средний уровень ряда:

    ,                                                                                                 (1.12)

    где - число уровней.

    1. Средний абсолютный прирост – это обобщающий показатель скорости изменения явления во времени.

     .                                                                                            (1.13)

    где - конечный уровень ряда динамики,

           - начальный уровень ряда динамики.

    1. Средний темп роста:

    Для цепного показателя:

    .                                                          (1.14)

    Для базисного показателя:

    .                                                                                     (1.15)

    1. Средний темп прироста:

    .                                                                                       (1.16) 

    1.3 Вариация 

    Составной частью обработки данных статистического  наблюдения является построение рядов распределения. Цель его – выявление основных свойств и закономерностей исследуемой статистической совокупности. В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают соответственно два типа рядов распределения – атрибутивные и вариационные. Ряды распределения, построенные по качественным признакам, называют атрибутивными, а по количественному – вариационными. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие в величине признака носит название вариации.

    Расчет  показателей вариации.

    Среднее значение совокупности:

        ,                                                                                       (1.17)

    где - значение единиц совокупности,

           - количество единиц совокупности.

    Среднее квадратическое отклонение – это  обобщающая характеристика размеров вариации признака в совокупности под влиянием отдельных факторов.

     .                                                                                        (1.18)

    Коэффициент вариации оценивает однородность совокупности. Совокупность считается однородной, если коэффициент не превышает 33%.

     .                                                                                        (1.19)

    Проверка на однородность совокупности.

    Необходимыми  предпосылками корректного использования  статистических методов анализа  является однородность совокупности. Неоднородность совокупности возникает  вследствие значительного вариации признака или попадания в совокупность резко выделяющихся, так называемых «аномальных наблюдений». Для их выявления используется правило трех сигм, которое состоит в том, что аномальными будут те явления, у которых значение анализируемого признака будут выходить за пределы интервала:

     .                                                                               (1.20) 

    1.4 Корреляционно-регрессионный  анализ 

    Суть  корреляционного анализа установить связи и измерить ее тесноту между  наблюдениями, которые можно считать  случайными или выбранными из совокупности. Корреляционной связью называется такая  статистическая связь, при которой различным значениям одной переменной соответствуют разные средние значения другой переменной. Теснота связи определяется линейным коэффициентом корреляции, обозначается .

    Линейный  коэффициент корреляции наблюдается при линейной зависимости, изменяемой в интервале от -1 до 1. Если , то связь прямая. Если , то – обратная. Этот коэффициент можно найти по формуле:

     ,                                                                                          (1.21)

    где - значение факторного признака,

          - значение результативного признака,

          - среднее квадратическое отклонение факторного признака,

          - среднее квадратическое отклонение результативного признака.

    В свою очередь среднее квадратическое отклонение рассчитывается:

    Для факторного признака

     ,                                                                                          (1.22)

    для результативного признака

     .                                                                                          (1.23)

    Регрессионный анализ – это метод установления аналитического выражения зависимости между исследуемыми признаками в процессе сбора и анализа полученных результатов.

    Уравнение регрессии показывает, как в среднем  изменяется результативный признак  при изменении факторного.

     Уравнение регрессии следующее:

     ,

     .                                                                           (1.24)

    где - характеризует значение неучтенных факторов влияющих на формирование результативного признака,

             - показывает изменение факторного признака на единицу собственного измерения.

    Уравнение линейной регрессии:

     .                                                                                            (1.25)

    где - общие затраты,

          - переменные затраты,

          - постоянные затраты,

          - объем производства.

    При учете и оценки затрат проводится группировка с учетом объемов  производства. В результате затраты  делятся на переменные и постоянные .

    Постоянные  затраты не зависят от изменения  объемов.

    Переменные  затраты изменяются прямо-пропорционально объему производства. 
 

                                       

      
 
 
 

                                                                                                                                                             

    

                                    
 
 
 
 

    Глава II. Обработка статистических данных 

    1. Аналитическая группировка
 

    Исходные данные смотри в Приложении.

    В последующих вычислениях за x принят факторный признак, а за y результативный.

  1. Группировочный признак – объем производства.
  2. Определяем величину интервала R:

     ,

    

    значит  .                                                          См (1.1)

  1. Определим количество групп и интервалов n:

    

     .                                                                     См (1.3)

  1. Найдем интервальный шаг h:

     .                                                                                  См (1.2)

  1. Таким образом, у меня получились следующие интервалы:
 

                  Таблица 1. Интервалы

Интервалы Месяца, входящие в  интервал Количество месяцев
1 (34,13 - 35,66) январь, июль, сентябрь, октябрь 4
2 (35,66 - 37,19) февраль 1
3 (37,19 - 38,72) май, ноябрь 2
4 (38,72 - 40,25) март, июнь 2
5 (40,25 - 41,78) август 1
6 (41,78 - 43,31)   0
7 (43,31 - 44,84) апрель 1
8 (44,84 - 46,37)   0
9 (46,37 - 47,90) декабрь 1
 
  1. Строим  группировочную таблицу:
 
 

                Таблица 2. Группировочная таблица

Группировка месяцев по объему производства Количество  месяцев Среднее значение
Затраты на производство, тыс.руб. Объем производства, кг
1 (34,13 - 35,66) 4 15651,53 35,02
2 (35,66 - 37,19) 1 16773,54 36,08
3 (37,19 - 38,72) 2 15983,19 37,55
4 (38,72 - 40,25) 2 17902,85 39,99
5 (40,25 - 41,78) 1 16266,9 40,45
6 (41,78 - 43,31) 0 0 0
7 (43,31 - 44,84) 1 15399,52 43,99
8 (44,84 - 46,37) 0 0 0
9 (46,37 - 47,90) 1 19242,44 47,99
 
 

    Вывод: наибольшее количество месяцев входит в группу по объему производства (34,13 - 35,66), что составляет примерно 33,3%, при средних затратах на производство 15651,53 тыс.руб.

  1. Проанализируем полученные данные:

              Таблица 3. Общие данные по выбранному интервалу

  январь июль сентябрь октябрь
Затраты на производство, тыс.руб. 15421,22 16736,03 14536,11 15912,76
Объем производства, кг 34,13 35,21 35,16 35,61
Обработка статистических данных. 5