Обработка статистических данных. 2

Министерство  Российской Федерации

Уральский Государственный

Горный  Университет 
 

Кафедра экономики и менеджмента 

Курсовая  работа на тему

«Обработка статистических данных»

(Статистика  трудовых ресурсов) 
 
 

Преподаватель:

Юркова Е.И.

                                              Студентка:

                                                Гр. МОГ -09-2

                                                    Лямина Д.Н. 

Екатеринбург

2011

 

Содержание 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Введение

Статистика  как наука рассматривает совокупности методов, с помощью которых можно  исследовать ту или иную конкретную совокупность социально-экономических  явлений. Эти методы и показатели в чистом виде безупречны, но у каждой свои строго определенные условия и  границы применения. Нарушение этих условий приводит к сбору необъективной  информации и, следовательно, выводы, сделанные  на основе статистики не всегда однозначны.

Статистика  – общественная наука, которая изучает  количественную сторону количественно-определенных массовых социально-экономических  явлений и процессов, их структуру  и распределение, размещение в пространстве, движение во времени, выявляя действующие  количественные зависимости, тенденции  и закономерности в конкретных условиях места и времени.

Предметом статистики как общественной науки  являются особые объективные признаки состояния и развития общества и  материальных условий его жизни. Такие признаки получили название объективных  статистических показателей.

Цель  данной работы – систематизация и  обработка материала с помощью  методов экономической статистики.

Основные  задачи курсовой работы:

1.Провести  аналитическую группировку, рассчитать  структурные средние. Построить гистограмму.

2.Оценить  динамику изменения показателей.  Построить графики, характеризующие  изменения показателей.

3.Рассчитать  показатели вариации.

4.Оценить  зависимость показателей, используя  метод корреляционно-регрессионного  анализа.  

 

Глава 1.ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

Методы  обработки статистических данных

1.1Аналитическая  группировка

Группировка — это метод, при котором вся исследуемая совокупность разделяется на группы по какому-то существенному признаку.

Признак, по которому осуществляется группировка называется группировочным признаком или основанием группировки.

Группировка представляет собой способ подразделения рассматриваемой совокупности данных на однородные по изучаемым признакам группы. Это делается с целью изучения структуры этой совокупности либо взаимосвязей между отдельными элементами этой совокупности. С помощью группировки можно выявить влияние отдельных единиц на средние итоговые показатели. Так, например, группировка рабочих данной организации по уровню производительности труда используется с целью выявления влияния высокой производительности труда отдельных рабочих на среднюю производительность по организации и для определения резерва, кроющегося в повышении производительности труда всех рабочих до уровня передовых рабочих.

Наибольшее распространение в экономическом анализе имеет группировка по факторам, связанным:

  • с трудовыми ресурсами, т.е. с живым трудом;
  • со средствами труда, т.е. с основными производственными фондами;
  • с предметами труда, т.е. с материальными ресурсами.

Эти три  группы факторов оказывают влияние  на объем продукции, выпускаемой данной организацией.

Виды  группировок:

Выбор группировочного признака зависит  от цели данной группировки и предварительного экономического анализа явления.

В зависимости  от степени сложности массового явления и задач анализа - группировки могут производится по одному или нескольким признакам:

  • Если производится группировка только по одному признаку, то она называется простой.
  • Если по двум и более признакам, то такая группировка называется сложной или комбинационной.

В зависимости  от решаемых задач различают типологические, структурные и аналитические  группировки:

  • Типологическая группировка — представляет собой разделение исследуемой совокупности на однородные группы. (группировка предприятий по формам собственности)
  • Структурная группировка — группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку. (группировка населения по уровню дохода). Анализ статистических данных структурных группировок, взятых за ряд периодов показывает изменение структуры изучаемых явлений, то есть структурные сдвиги.
  • Аналитическая (факторная) группировка — позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками. (группировка банков по сумме уставного капитала, величине активов и балансовой прибыли)

В процессе проведения экономического анализа, как правило, применяются два основных вида группировок: структурные и аналитические.

Структурные группировки используются с целью  исследования состава и структуры  совокупности данных, а также с  целью изучения тех изменений  в этой совокупности, которые имеют  место в соответствии с выбранным  изменяющимся признаком.

Аналитические же группировки используются для  исследования взаимных связей, существующих между показателями, характеризующими рассматриваемую совокупность данных. В этих условиях один из показателей  является обобщающим, результативным, а другие показатели рассматриваются  как факторы, влияющие на обобщающий показатель.

  1.2. Структурные средние величины.

Моду  и медиану часто используют как  среднюю характеристику в тех  совокупностях, где расчет среднестепенной невозможен или нецелесообразен.

Мода представляет собой значение изучаемого признака повторяющегося с наибольшей частотой.

    1. определение моды по несгруппированным данным:

пример: бригада состоит из девяти человек. Определить среднетарифный разряд бригады.

1 2 3 4 5 6 7 8 9
4 3 4 5 3 3 6 2 6

       Так как в данной таблице больше всего  рабочих третьего разряда, данный разряд является модальным.

       Мо= 3 р.

       Хср.= 36/4= 4 Р.

       2. определение моды по сгруппированным  данным (интервальный ряд)

       Мо= (хо+h * (fmo- fmo-1) ) / ((fmo- fmo-1) + (fmo+ fmo+1)) , где 

       хо – нижняя граница модального интервала;

       h – величина модального интервала;

       fmo – частота модального интервала;

       fmo-1 – частота интервала, предшествующего модальному;

       fmo+1 - частота интервала следующего за модальным.

       Медиана – значение признака, приходящегося на середину упорядоченного ряда, который делит частоты попалам.

    1. определение медианы по несгруппированным данным:

      хср= ∑хi*fi / ∑fi

      2. определение медианы по сгруппированным  данным (дискретный ряд):

      Ме= хо+ h * (1/2∑fi – SMe-1) / (fMe) , где

             хо – нижняя граница медианного интервала;

       h – величина медианного интервала;

       1/2∑fi – половина накопительной части;

       SMe-1 – накопительная частота интервала предшествующего медианному;

       fMe – частота медианного интервала.

1.3. Динамика изменения  показателя

    Для характеристики интенсивности развития во времени используются статистические показатели, получаемые сравнением уровней  между собой, в результате чего получаем систему абсолютных и относительных  показателей динамики: абсолютный прирост, коэффициент роста, темп роста, темп прироста, абсолютное значение 1% прироста. Для характеристики интенсивности  развития за длительный период рассчитываются средние показатели: средний уровень  ряда, средний абсолютный прирост, средний  коэффициент роста, средний темп роста, средний темп прироста, среднее  абсолютное значение 1% прироста. В своей  работе я не воспользовалась абсолютным значением 1% прироста и средним абсолютным значением 1% прироста.

    Если  в ходе исследования необходимо сравнить несколько последовательных уровней, то можно получить или сравнение  с постоянной базой (базисные показатели), или сравнение с переменной базой (цепные показатели).

    Базисные показатели характеризуют итоговый результат всех изменений в уровнях ряда от периода базисного уровня до данного (i-го) периода.

    Цепные показатели характеризуют интенсивность изменения уровня от одного периода к другому в пределах того промежутка времени, который исследуется.

    Абсолютный прирост выражает абсолютную скорость изменения ряда динамики и определяется как разность между данным уровнем и уровнем, принятым за базу сравнения.

    Абсолютный  прирост (базисный)

    

    где yi - уровень сравниваемого периода; y0 - уровень базисного периода.

    Абсолютный  прирост с переменной базой (цепной), который называют скоростью роста,

    

    где yi - уровень сравниваемого периода; yi-1 - уровень предшествующего периода.

    Коэффициент роста Ki определяется как отношение данного уровня к предыдущему или базисному, показывает относительную скорость изменения ряда. Если коэффициент роста выражается в процентах, то его называют темпом роста.

    Коэффициент роста базисный

    

    Коэффициент роста цепной

    

    Темп роста

    

    Темп прироста ТП определяется как отношение абсолютного прироста данного уровня к предыдущему или базисному.

    Темп  прироста базисный

    

    Темп  прироста цепной

    

    Темп  прироста можно рассчитать и иным путем: как разность между темпом роста и 100 % или как разность между  коэффициентом роста и 1 (единицей):

  1. Тп = Тр - 100%; 2) Тп = Ki - 1.

       Абсолютное  значение 1% прироста – показывает абсолютное значение 1 процента прироста.

       Цепной: ∆% = ∆ / Тп% 

1.4. Вариация.

       Как уже было сказано, статистика изучает  массовые явления и процессы. Каждое из таких явлений обладает как общими для всей совокупности, так и особенными, индивидуальными свойствами. Различие между индивидуальными явлениями называют вариацией.

       Средней арифметической величиной называется такое значение признака в расчете на единицу совокупности, при вычислении которого общий объем признака в совокупности сохраняется неизменным.

       Иными словами, средняя арифметическая величина – среднее слагаемое. При ее вычислении общий объем признака мысленно распределяется поровну между всеми единицами  совокупности.

показатели  вариации
показатель несгруппированные данные сгруппированные данные характеристика
абсолютные  показатели: R=xmax-xmin характеризует различия между единицами совокупности, имеющими максимальное и минимальное значение признака
1.1. размах вариации
1.2. среднее линейное отклонение: d¯= ∑(xi-x¯)/n d¯= ∑(xi-x¯)*fi / ∑fi дает обобщенную характеристику степени колебаемости признаков совокупности и вычисляется как среднее арифметическое из абсолютных значений: отклонение индивидуального значения от средней величины
1.3. дисперсия δ²=∑(xi - x¯)²/n δ²=∑(xi - x¯)²*fi / ∑fi измеряет вариацию признаков во всей совокупности под  влиянием всех факторов, обуславливающих  эту вариацию. Представляет собой средний квадрат отклонений индивидуальных значений признаков от средней величины.
1.4. среднеквадратичное отклонение δ=√∑(xi - x¯)²/n, δ=√δ² δ=√∑(xi - x¯)²*fi / ∑fi, δ=√δ² обобщающая  характеристика размеров вариационных признаков в совокупности под  влиянием отдельных факторов
относительные показатели: Vd=d¯/x*100% отклонение  к среднему значению
2.1. линейный коэффициент вариации
2.2. коэффициент вариации Vδ=δ¯/x*100% оценивает однородн7ость совокупности. Совокупность не является однородной, если коэффициент больше 33%
2.3. коэффициент осциляции Vr=R/x*100%  
 

    1.5. Корреляционно- регрессионный анализ.

    Корреляционная  связь – связь, при которой  различным значениям одной переменной соответствуют разные средние значения другой переменной.

    Графически  взаимосвязь изображается с помощью  поликорреляции. На оси абсцисс- фактический признак, а на оси ординат- результативный признак. На графике наблюдается поле корреляции. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

    В статистике теснота связи может  определяться с помощью различных  коэффициентов, в практике чаще используется линейный коэффициент корреляции.

    Линейный  коэффициент корреляции наблюдается  при линейной зависимости.

    Оценка  линейного коэффициента корреляции

 
    Значение  линейного                                   коэффициента, r Характер связи Интерпретация связи
    0 Отсутствует     
    0-1 Прямая С увеличением  x увеличивается y
    -1-0 Обратная С увеличением  x уменьшается у и наоборот
    1 Функциональная Каждое значение факторного признака строго соответствует  одному значению результативного признака
 

     , где n – количество единиц в совокупности.

      Регрессионный анализ – метод установления аналитического выражения зависимости между исследуемыми признаками.

    Уравнение регрессии показывает, как в среднем  изменяется у при изменении любого значения x.

     , где 

    y – зависимая переменная,

    x – независимая переменная.

    Если  независимая переменная одна – простой  регрессионный анализ, если несколько  – многофакторный.

    В ходе регрессионного анализа решается:

  • Построение уравнения регрессии (нахождение вида зависимости между результативным показателем и независимыми факторами);
  • Оценка значимости получаемого уравнения (определение того, на сколько выбранные факторные признаки объясняют вариацию результативного признака).

    Применение : для планирования показателей и оценки нормативной базы.

    По  форме зависимости различают:

    А) линейная регрессия : ;

    Б) нелинейная регрессия: + - парабола, - гипербола.

    Построение  уравнения регрессии осуществляется, как правило, методом наименьших квадратов, суть которых состоит  в минимизации суммы квадратов отклонений фактических значений результативного признака от его расчетных значений.

     ,

     .

    В результате математических преобразований формируется система нормальных уравнений для нахождения параметров уравнения регрессии.

    

      характеризует значение неучтенных  факторов, влияющих на формирование  результативного признака.

       показывает изменение факторного признака на единицу собственного измерения.

Корреляционно- регрессионный анализ - объединяет в себе основные действия двух вышеперечисленных анализов. 

Глава 2. ПРАКТИЧЕСКАЯ ЧАСТЬ

2.1 Исходные данные.

Показатели  производительности и оплаты труда на ОАО "Дюрал" 

Год 2004
Месяц январь февраль март апрель май июнь
Производительность  труда, руб./раб. 25467,2 31434,7 30390,8 24535,5 27652,9 30186,2
Оплата  труда, руб. 7758,96 8114,48 8571,09 8613 9093,04 10018,58
Месяц июль август сентябрь октябрь ноябрь декабрь
Производительность  труда, руб./раб. 34953,6 42012,3 42619,39 44773,85 40474,61 40530,71
Оплата  труда, руб. 11743,6 12396,67 16226,617 11934,56 11289,96 12129,81
 

2.1.1. Аналитическая группировка.

В качестве группировочного  признака в аналитической группировке  берется факторный признак, в данном случае, это производительность труда.

Определяем величину интервала:

         хmax = 44773,85

         xmin = 24535,5

         R = хmax - xmin =44773,85- 24535,5=20238,35

         N = 12

         n= 1 + 3.32 * lg 12 = 1 + 3.32 * lg12 = 4,6=5

         h = 20238,35 / 4,6 = 4399,6

Построение интервалов:

[24535,5-28935,1] Апрель, январь, май
[28935,1-33334,7] Февраль, март, июнь
[33334,7-37734,3] Июль
[37734,3-42133,9] Ноябрь, декабрь, август
[42133,9-46533,5] Сентябрь, октябрь
 

Построение группировочной таблицы: 

Группы  отчетных месяцев по производительности труда Количество месяцев Месяцы Среднее значение
Производи-тельность Оплата труда
1 [24535,5-28935,1] 3 Апрель, январь, май 25885,2 8488,3
2 [28935,1-33334,7] 3 Февраль, март, июнь 30670,56 8911,38
3 [33334,7-37734,3] 1 Июль 34953,6 11743,6
4 [37734,3-42133,9] 3 Ноябрь, декабрь, август 161005,87 11938,8
5 [42133,9-46533,5] 2 Сентябрь, октябрь 43696,62 14080,58
 

Наибольшее количество месяцев сгруппировано в группы по производительности [24535,5-28935,1], [28935,1-33334,7], [37734,3-42133,9].

       
Период Ноябрь Декабрь Август
Производительность  руб./раб. 40474,61 40530,71 42012,3
Оплата  труда, руб. 11289,96 12129,81 12396,67

Наименьшая  производительность, характеризующая  среднее значение, составляет 25885,2 руб.раб. В данную группу по производительности попадает 3 месяца со средней оплатой труда 8488,3 руб.

Наибольшее среднее  значение производительности составляет 161005,87 руб. В данную группу по производительности попадают значения 3 месяцев со средним значением оплаты труда 11938,8 руб. 

2.1.2. Структурные средние.

   МОДА:

группы по производительности труда количество  месяцев накопительная частота
[24535,5-28935,1] 3 3
[28935,1-33334,7] 3 6
[33334,7-37734,3] 1 7
[37734,3-42133,9] 3 10
[42133,9-46533,5] 2 12
 

 

=

=

=

=

=

МЕДИАНА: 

Обработка статистических данных. 2