Обработка статистических данных предприятия. 3



 

Федеральное агентство по образованию

ГОУ ВПО

«Уральский государственный горный

университет»

 

 

 

 

Кафедра Экономики и менеджмента

 

 

КУРСОВАЯ РАБОТА

по дисциплине «Статистика»

Тема: Обработка статистических данных

предприятия

 

 

 

 

 

 

Студент:

Группа:

Преподаватель:

 

 

 

 

 

 

Екатеринбург

2009

 

СОДЕРЖАНИЕ

 

Введение………………………………………………………………….….3

 

1. Сущность статистических методов обработки информации

1.1. Аналитические группировки……………………………………….4

1.2. Структурные средние……………………………………………….7

1.3. Ряды динамики………………………………………………………8

1.4. Показатели вариации………………………………………….…….10

1.5. Метод корреляционно-регрессионного анализа…………….…….12

 

2. Статистическая обработка данных предприятия                                      

2.1. Аналитическая группировка данных предприятия

Расчет структурных средних……………………………………….16

2.2. Оценка динамики изменения показателей…………………………18

2.3. Расчет показателей вариации………………………………………..24

2.4. Оценка взаимосвязи между факторным и результативным

признаками методом корреляционно-регрессионного анализа…..26

2.5. Определение объема выпускаемой продукции по периодам…...…32

 

Заключение……………………………………………………………………35

Список используемой литературы…………………………………………..36

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Обработка статистических данных уже давно применяется в самых разнообразных видах человеческой деятельности. Трудно назвать ту сферу, в которой она бы не использовалась – это и различные области знаний, и практическая деятельность людей, и наблюдение за социально-экономическими явлениями в обществе. Однако, одну из главных ролей статистика играет в обработке статистических данных предприятий.

Всесторонний и глубокий анализ информации (статистических данных) предполагает использование различных специальных методов, многими из которых мы и воспользуемся в данной курсовой работе.

Предметом исследования являются особенности статистической обработки данных предприятия по производительности, фондовооруженности и фондоотдаче.

Цель работы – применение на практике различных статистических методов для обработки информации.

В соответствии с целью поставлены следующие задачи:

1. провести аналитическую группировку, рассчитать структурные средние по данным статотчетности предприятия;

2. оценить динамику изменения показателей;

3. рассчитать показатели вариации;

4. используя метод корреляционно-регрессионного анализа, оценить взаимосвязь между факторным и результативным признаками.

 

 

 

 

 

 

 

 

 

1.       СУЩНОСТЬ СТАТИСТИЧЕСКИХ МЕТОДОВ ОБРАБОТКИ ИНФОРМАЦИИ

 

 

1.1.           АНАЛИТИЧЕСКАЯ ГРУППИРОВКА

 

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях:

      группировочный признак

      интервал группировки

      число групп.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он вытекает из цели исследования. Признаки делятся

o        по форме на:

-         количественные;

-         качественные (атрибутивные);

o        по содержанию на:

-         факторные, оказывающие влияние на изменение результативного признака;

-         результативные, изменяющиеся под влиянием факторных.

 

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают:

- равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

-   неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

-  открытые, когда имеется только либо верхняя, либо нижняя граница;

-  закрытые, когда имеются и нижняя, и верхняя границы.

 

Виды группировок:

Типологическая группировка – разбиение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений.

Аналитическая группировка – группировка, выявляющая взаимосвязи между изучаемыми явлениями и признаками.

Структурная группировка – группировка для изучения состава однородной совокупности по какому–либо варьирующему признаку.

 

В практической части данной курсовой работы выполнена аналитическая группировка статистических данных предприятия, поэтому рассмотрим её суть более подробно.

Аналитические группировки предназначены для выявления связи между изучаемыми признаками. Они позволяют выявить наличие и направление связи и измерить ее тесноту и силу. Все исследуемые признаки в данном случае делятся на 2 группы: результативные и факторные.

Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Аналитические группировки отличаются от структурных и типологических по технике выполнения, которая заключается в следующем:

1.            производится группировка единиц совокупности по факторному признаку;

2.            в любой выделенной группе отбираются соответствующие значения результативного признака, на их основе рассчитывается некоторый обобщающий показатель, обычно, среднее значение;

3.            анализируются изменения обобщающего показателя - среднего значения результативного признака по группам, делается вывод о наличии либо отсутствии взаимосвязи и ее направлении.

 

В случае, если при изменении значений факторного признака, который положен в основу группировки изменяется величина результативного, то признается наличие связи между признаками; при этом, в случае, если с увеличением значений факторного признака увеличивается значение результативного, то связь относится к прямой; иначе – к обратной.

Для расчета оптимального числа групп или количества интервалов используется формула Стерджесса:

             

               n = 1 + 3,322 lg N,                                 (1)

где  n – оптимальное число групп или количества интервалов;

       N – число единиц совокупности.

 

Величина интервала определяется по формуле:

 

     h = R / n,                                            (2)

                                          R = Хmax - Хmin,                                     (3)

где  h – величина интервала;

R – разность между наибольшим и наименьшим вариантом признака в  исследуемой совокупности;

n – количество групп или интервалов;

х max  и x min – соответственно наибольший и наименьший варианты признака в исследуемой совокупности.

 

1.2.           СТРУКТУРНЫЕ СРЕДНИЕ

 

В статистических исследованиях в качестве вспомогательных описательных статистических характеристик распределения варьирующего признака широко применяются мода и медиана.

Модой в статистике называется величины признака (варианта), которая чаще всего встречается в данной совокупности. Определяется мода по фомуле:

                  ,                  (4)

где  х0 – нижняя граница модального интервала;

h – величина интервала;

fМо – частота модального интервала;

fМо-1 – частота интервала, предшествующего модальному;

fМо+1 – частота, следующего за модальным интервала.

 

Медианой в статистике называется величина, которая находится в середине вариационного ряда. Медиана делит ряд пополам и определяется по формуле:

                  ,                          (5)

 

где  х0 – нижняя граница медианного интервала;

½  f – половина накопительной частоты;

Sмe-1 – накопленные частоты до медианного интервала;

fмe – частота медианного интервала.

 

 

 

 

 

1.3.           РЯДЫ ДИНАМИКИ

 

Ряд динамики, хронологический ряд, динамический ряд, временной ряд – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Всякий ряд динамики включает, следовательно, два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Ряды динамики различаются по следующим признакам.

1. По времени – моментные и интервальные ряды.

Интервальный ряд динамики – последовательность, в которой уровень явления относится к результату, накопленному или вновь произведенному за определенный интервал времени. Таковы, например, ряды показателей объема продукции по месяцам года, количества отработанных человеко-дней по отдельным периодам и т.д.

Если же уровень ряда показывает фактическое наличие изучаемого явления в конкретный момент времени, то совокупность уровней образует моментный ряд динамики. Примерами моментных рядов могут быть последовательности показателей численности населения на начало года, величины запаса какого-либо материала на начало периода и т.д.

Важное аналитическое отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель – общий выпуск продукции за год, общие затраты рабочего времени, общий объем продаж акций и т.д., сумма же уровней моментного ряда, хотя иногда и подсчитывается, но реального содержания, как правило, не имеет.

2. По форме представления уровней – ряды абсолютных, относительных и средних величин.

3. По расстоянию между датами или интервалам времени выделяют полные и неполные хронологические ряды.

Полные ряды динамики имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Это равноотстоящие ряды динамики. Неполные – когда принцип равных интервалов не соблюдается

 

Для анализа развития изучаемых явлений за отдельные периоды времени используют следующую систему показателей:

1.   Абсолютный прирост (y ) – характеризует размер увеличения или уменьшения уровня ряда за определенный промежуток времени:

                            yц = yi – yi-1 – цепной;                            (6.1)

                            yб = yi – y0 – базисный;                          (6.2)

где уi – уровень ряда;

уi-1 – уровень ряда, предшествующий уi;

у0 – уровень, принятый за базу сравнения.

 

2.   Темп роста (Тр) – показывает процентное изменение уровня ряда по сравнению с базисным или цепным показателем:

                            Tр = (yi / (yi – 1))  100 % - цепной;                      (7.1)

                             Тр = (yi / y0)  100 % - базисный.                       (7.2)

 

 

3.                 Темп прироста (Тпр) – это показатель динамики, отражающий относительное изменение абсолютного прироста к уровню динамики, по сравнению с которым он рассчитан:

                                           Тпр = Тр – 100 %.                                   (8)

 

4.   Средний уровень ряда (уср) – даёт обобщённую характеристику показателя за весь период, охватываемый рядом динамики.

Интервальный ряд:

            уср =  yi / n – равные промежутки времени;            (9.1)

      уср =  yiti /  ti – неравные промежутки времени,        (9.2)

где yi – уровень ряда;

n – число уровней;

ti – длительность интервала времени между уравнениями.

 

Моментный ряд:

уср = (y1 / 2 + y2 + y3 +…+ yn / 2) / (n – 1) – равные промежутки             (10.1)

времени;

уср = ((y1 + y2)  t1 + (y2 + y3)  t2 + …+ (yn – 1 + yn)  tn – 1) /                         (10.2)

/(2  (t1 + t2 + t3 + ..+ tn – 1)) – неравные промежутки времени.

 

5. Средний абсолютный прирост ( уср) – обобщающий показатель скорости изменения явления во времени.

                                      уср = (yn – y1) / (n – 1),                                  (11)

где yn – конечный уровень ряда;

        y1 – начальный уровень ряда.

 

 

1.4             ПОКАЗАТЕЛИ ВАРИАЦИИ

 

Показатели вариации — числовые характеристики статистического распределения, демонстрирующие степень рассеяния наблюдаемых значений измеряемого показателя относительно их среднего значения.

Чем выше показатели вариации, тем больший наблюдается разброс в значениях измеряемого показателя, и тем менее надежны результаты измерений. И наоборот: чем ниже показатели вариации, тем плотнее группируются наблюдаемые значения вблизи среднего значения, и тем достовернее результаты эксперимента.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации, как разницы между максимальным (Xmax ) и минимальным (Xmin) наблюдаемыми значениями признака:

                                         R = Xmax - Xmin,                                        (12)

где  Xmax – максимальное значение совокупности;

Xmin – минимальное значение совокупности.

 

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колебаемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение, которое дает обобщенную характеристику колебаемости признаков совокупности и вычисляется как среднее арифметическое из средних значений отклонений индивидуального значения признака от средней величины:

 

          =   xi - x  / n - для не сгруппированных данных         (13.1)

        = (  xi - x  fi) / fi,- для сгруппированных данных       (13.2)

где xi – уровень ряда;

x – средний уровень ряда;

  n – количество единиц в совокупности.

 

              Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обуславливающих эту вариацию. Представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины:

           2 = (xi - x)2  / n - для сгруппированных данных             (14.1)

     2 = (xi - x)2 fi /  fi  - для не сгруппированных данных        (14.2) 

 

Показатель, равный ,  называется средним квадратическим отклонением. Это обобщающая характеристика размеров вариации признаков в совокупности.

                                       =                                        (15)

Коэффициент вариации определяется по формуле:

                                     Vϭ = (ϭ/хср) * 100 %                                     (16)

 

 

1.5.  Метод корреляционно-регрессионного анализа

 

 

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно  положительными и отрицательными.

Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения, а коэффициент корреляции проявляется следующим образом:

                      r =  ,                              (17)

где  r – линейный коэффициент корреляции;

xi – индивидуальное значение факторного признака в совокупности;

x – среднее значение факторного признака в совокупности;

yi – индивидуальные значения результативного признака в совокупности;

y – среднее значение результативного признака в совокупности.

 

Значения коэффициента корреляции изменяются в интервале - 1; + 1.

Значение r = - 1 свидетельствует о наличии жестко детерминированной обратно пропорциональной связи между факторами; r = + 1 – соответствует жестко детерминированной связи с прямо пропорциональной зависимостью факторов. Если линейной связи между факторами не наблюдается, r = 0.

Другие значения коэффициента корреляции свидетельствуют о наличии стохастической связи, причем чем ближе (r) к единице, тем связь теснее.

При r  0,3 - связь можно считать слабой; при 0,3  r 20,7 – связь средней тесноты; r  0,7 – тесная.

 

Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.

Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.

В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi и имеет вид:

                             y = f (x1 x2…xn),                                        (18)

где у – зависимая переменная;

xi – независимая переменная.

 

В ходе регрессионного анализа решаются две основные задачи:

- построение уравнения регрессии, т. е. нахождение вида зависимости между результативным показателем и независимыми факторами х1 , х2 …хn ;

-            оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

 

Для реализации регрессионного анализа необходимо выполнение ряда специальных требований:

o     множество значений - х1 , х2 …хn ;

o   у – должен быть независимым ;

o нормальное распределение случайных величин.

При линейной зависимости уравнение регрессии имеет вид:

                                              у = а + в х,                                           (19)

где а, в – параметр уравнения, из которых «в» – коэффициент регрессии.

 

Система нормальных уравнений способом наименьших квадратов для нахождения параметров линейной регрессии выглядит следующим образом:

an + вх = у                            

                                       ах + вх2 = ух,                          (20)

где n - число наблюдений;

параметр a – начальное значение результативного признака;

параметр в – значение характеризует насколько в среднем изменится значение факторного признака.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ ПРЕДПРИЯТИЯ

 

 

2.1. АНАЛИТИЧЕСКАЯ ГРУППИРОВКА. РАССЧЕТ СТРУКТУРНЫХ СРЕДНИХ

 

Проведем аналитическую группировку данных предприятия. За группировочный признак примем фондоотдачу.

 

Определим величину интервала:

Хmax = 1,34 (руб/руб),

Хmin = 0,89 (руб/руб),

N = 15.

R = Хmax - Хmin = 1,34 – 0,89 = 0,45,                                                           (3)

n = 1 + 3,32 *lgN = 1 + 3,32*lg15 = 4,85 ≈ 5,                                            (1)

h = 0,45/5 = 0,09                                                                                          (2)

 

Рассчитаем интервалы:

1.                  [0,89 – 0,98]          0,98; 0,98; 0,89                           

2.                  [0,98 – 1,07]          -                                                   

3.                  [1,07 – 1,16]          1,12; 1,1; 1,1                               

4.                  [1,16 – 1,25]          1,2; 1,23; 1,2; 1,25; 1,2; 1,2      

5.                  [1,25 – 1,34]          1,34; 1,34; 1,3                             

 

Все полученные результаты сведем в таблицу (Талица 2.1.1). Как мы видим, наибольшее среднее значение производительности отмечено в последнем интервале, в группе с показателями фондоотдачи от 1,25 руб/руб до 1,34 руб/руб. В эту группу входят данные за три месяца: февраль и август 2007 года и март 2008.

 

 

 

Таблица 2.1.1 

                 Аналитическая группировка по фондоотдаче

№ п/п

Группы по показателю

фондоотдачи

Кол-во

Средние значения

единиц

%

ПТ

ФВ

1

0,89 – 0,98

3

20

0,681

5,6

2

0,98 – 1,07

-

-

-

-

3

1,07 – 1,16

3

20

0,750

5,5

4

1,16 – 1,25

6

40

0,714

5,4

5

1,25 – 1,34

3

20

0,753

5,7

Обработка статистических данных предприятия. 3