Основные приемы и методы обработки и анализа статистических данных

Содержание

Введение………………………………………………………………….……..3

Тема 1. «Средние величины»…………………………………………….……6

Задание 1…………………………………………………………….…..….8

Тема 2. «Ряды распределения и их основные характеристики»……..……..10

Задание 2……………………………………………………………....…..15

Тема 3. «Ряды динамики»……………………………………………….……18

Задание 3……………………………………………………...…………..22

Тема 4. «Методы выравнивания рядов динамики»……………..………….30

Задание 4………………………………………………………..…….…..31

Тема 5. «Индексы»………………………………………………….….…….35

Задание 5…………………………………………………………………41

Тема 6. «Выборочные наблюдения»………………………………………. Задание 6………………………………………………………………

Тема 7. «Статистика населения»………………………………………

Задание 7………………………………………………………….

Тема 8. «Система национальных счетов»……………………………..

Задание 8………………………………………………………..

Заключение……………………………………………………………

Список использованной литературы……………………………………………………

Приложение…………………………………………………………………

ВВЕДЕНИЕ

          В настоящее время насчитывается около тысячи определений статистики. Первое из них относится к 1749 году. Затем на протяжении 250 лет определение уточнялось и дополнялось. Определить статистику как науку пытались философы, математики, экономисты, социологи, государственные деятели и, конечно, сами статистики. Сначала статистику определяли как «Staaten Kunde» - государствоведение (описание достопримечательностей государств). Оставаясь на протяжении многих лет государствоведением, статистика постепенно отходила от описания достопримечательностей (их текстового изложения). Тем более что с развитием знаний вопросами государствоведения стали заниматься многие науки. Во второй половине XVII столетия в Германии возникла школа государствоведения. Её основателем был немецкий ученый Г. Конринг (1606-1681). Дальнейшее развитие это направление получило в работах Готфрида Ахенваля и А. Шлецера. Так Готфрид Ахенваль (1719-1772) в 1746 г. впервые в Марбугском, а затем в Геттингенском университете ввёл в научный обиход термин «статистика». Заменив название курса «государствоведения» на «статистику», положив тем самым начало развитию статистики как науки и учебной дисциплины. В настоящее время под термином «статистика» чаще всего понимают следующее:

  • Статистика – это наука, изучающая количественную сторону массовых явлений и процессов в неразрывной связи с их качественным содержанием.
  • Статистика – это совокупность цифровых сведений характеризующихся состоянием массовых явлений и процессов общественной жизни.
  • Статистика – это отрасль практической деятельности по сбору, обработке, анализу и публикации массовых цифровых данных о самых различных явлениях и процессах общественной жизни.
  • Статистика – это некий параметр ряда случайных величин, получаемый по определенному алгоритму из результативных наблюдений.

 

Основные черты и особенности предмета статистической науки:

  1. Первая особенность статистики как науки заключается в исследовании ею не отдельных факторов, а массовых социально-экономических явлений и процессов, выступающих как множества отдельных факторов, обладающих как индивидуальными, так и общими признаками.
  2. Вторая особенность статистики как науки в том, что она изучает прежде всего количественную сторону общественных явлений и процессов в конкретных условиях места и времени, т.е. предметом статистики являются размеры и количественные соотношения социально – экономических явлений, закономерности их связи и развития.
  3. Третья особенность статистики как науки заключается в том, что она характеризует структуру общественных знаний. Структура – это внутреннее строение массовых явлений, то есть внутреннее строение статистического множества.
  4. Четвертая особенность статистики как науки заключается в изменении в пространстве, то есть в статике, выявляются анализом структуры общественного явления, а изменения во времени, то есть в динамике – исследованием уровня и структуры явления.
  5. Пятая особенность заключается в том, что познание действительности невозможно без познания всех или по крайне мере основных взаимосвязей общественных явлений.

 

          Распространенное представление о возможности доказать любое явление с помощью статистики, конечно, слишком преувеличено, но и не лишено основания, однако несомненно, что и статистические методы могут ввести людей в заблуждение. Иногда даже квалифицированные специалисты, во всех тонкостях знающие статистику, одно и то же явление могут объяснить по разному, принять ложное утверждение и отвергнуть правильное. Принятие утверждения как истинное в известной мере зависит от субъективных особенностей исследователя. Следовательно, выводы, которые делаются на основании статистических данных, не всегда однозначны. Думается основная задача и предназначение статистики в том, чтобы помочь людям лучше понять многие современные явления нашей жизни.

 

 

 

Целью данной курсовой работы является обучение приемам и методам обработки статистических данных.

 

Задачей данной курсовой работы является практическое ознакомление с основными разделами дисциплины «Статистика», такими как:

  • Средние величины;
  • Ряды распределения и их основные характеристики;
  • Показатели ряда динамики, индексы сезонности;
  • Методы выравнивания рядов динамики;
  • Индексы;
  • Выборочное наблюдение;
  • Статистика численности и состава населения.
  • Система национальных счетов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тема 1. «Средние величины»

          Средними величинами в статистике называют обобщающие показатели, которые выражают типичные характерные для определенных условий места и времени размеры и количественные соотношения явлений общественной жизни.

          В статистике различают несколько видов средних величин, а именно: арифметическую, гармоническую, геометрическую и другие. В зависимости от частоты повторения вариантов средние исчисляются как простые (невзвешенные) или взвешенные.

  • Среднюю арифметическую невзвешенную рассчитывают по формуле:

                                                                            (1.1)

где – значение осредняемого признака,

       n – число единиц совокупности.

 

  • Средняя арифметическая взвешенная имеет следующий вид:

                                                              (1.2)

где – значение осредняемого признака,

       - частота,

       - сумма всех частот.

Свойства средней арифметической:

  1. Сумма отклонений индивидуальных значений признака от его среднего значения равна 0.
  2. Если каждое индивидуальное значение признака умножить или разделить на постоянное число, то и средняя увеличится или уменьшится во столько же раз.
  3. Если к каждому индивидуальному значению признака прибавить или из каждого значения вычесть постоянное число, то средняя величина возрастет или уменьшится на это же число.
  4. Если веса средней взвешенной умножить или разделить на постоянное число, то средняя величина не изменится.
  5. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа.

 

  • Когда статистическая информация не содержит частот f по отдельным вариантам X совокупности, а представлена как их произведение x*f, тогда применяется формула средней гармонической взвешенной, для получения которой обозначим x*f=w, откуда f=w/x.

 

                            (1.3)

 

  • Если при замене индивидуальных величин признака на среднюю величину, необходимо сохранить неизменным произведение индивидуальных величин, то следует применить геометрическую среднюю величину.

                                            (1.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 1

          Имеются следующие данные по трем предприятиям, выпускающим одноименную продукцию:

Таблица 1.1

Предприятие

Фактический выпуск продукции, млн руб.

Выполнение плана, %

I

340,0

95

II

510,0

110

III

630,0

114


 

          Вычислите по трем предприятиям:

1) средний процент выполнения плана по выпуску продукции;

2) абсолютный прирост стоимости фактического выпуска продукции по сравнению с планом.

 

Решение:

          1) Для решения данной задачи необходимо использовать формулу средней геометрической (1.4) для определения среднего процента выполнения плана по выпуску продукции:

 

106% - 100% = 6 % следовательно план перевыполнен на 6%.

          2) Для нахождения абсолютного прироста стоимости необходимо найти отношение фактического выпуска продукции к плановому выпуску продукции.

          Находим фактический выпуск продукции:

Фактический = (340+510+630)/3=493,33 (млн. руб.)

          Находим плановый выпуск продукции:

Плановый = (+ + ) / 3= 458,06 (млн. руб.)

          Абсолютный прирост стоимости фактического выпуска продукции по сравнению с планом:

493,33 – 458,06 = 35,27 (млн. руб.)

 

          Вывод: Изучены основные средние величины, вычислен средний процент выполнения плана по выпуску продукции (106 %) и абсолютный прирост стоимости фактического выпуска продукции по сравнению с планом (35,27 млн. руб.).

 

 

 

 

 

 

 

 

 

 

 

 

Тема 2. «Ряды распределения и их основные характеристики»

          Ряд распределения – это групповая таблица, имеющая две графы: группы по выделенному признаку (графа вариант) и численность групп (графа частот).

          Ряды распределения делятся на вариационные (группировка по количественному признаку) и атрибутивные (группировка по качественному признаку).

          Главное предназначение рядов распределения – изучение вариации признаков.

          В зависимости от характера вариации значений признака вариационные ряды распределения бывают дискретные и интервальные.

          В дискретных рядах признак может принимать лишь конечное число определенных значений (например, тарифный разряд рабочих, число детей в семье, число станков, обслуживаемых одним рабочим).

          В интервальных рядах признак изменяется непрерывно и может принимать в определенных границах любые значения (например, стаж работы, пробег автомобиля, размер дохода и прочее).

          Число групп интервального ряда приближенно определяется по формуле Стерджесса:

                         N = 1 + 3,322 * lg N,                         (2.1)

где N – общее число совокупности.

          Затем определяется величина интервала:

                         h = (                           (2.2)

где – соответственно максимальное и минимальное значения признака в совокупности.

          Достаточно часто в ряд распределения вводится графа, в которой подсчитываются накопленные частоты (S). Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и исчисляются путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

          Для анализа вариационных рядов используются показатели центра распределения (мода и медиана) и показатели вариации.

          Мода () – наиболее часто встречающееся значение признака. В дискретном ряду это варианта с наибольшей частотой. В интервальном ряду наибольшая частота указывает не на модальную варианту, а на содержащий моду интервал. Поэтому в модальном интервале необходимо определить модальную варианту. При этом надо иметь ввиду, что при расчетах будет получено не точное, а некоторое условное значение моды, так как неизвестен характер распределения частоты внутри модального интервала.

          Вычисление моды в интервальном ряду производится по следующей формуле:

                                                      (2.3)

где – мода

 – нижнее значение модального интервала

- частота в  модальном интервале

- частота в  предыдущем интервале

- частота в  следующем интервале

- величина интервала

 

          Медиана () – варианта, находящаяся в середине ряда распределения. Для ее определения достаточно проранжировать все варианты, то есть расположить их в порядке возрастания или убывания. Для дискретного ряда срединная варианта и будет являться медианой. Для интервального ряда расчет медианы производится по формуле:

 

                                (2.4)

 

 

 – медиана

- нижняя граница  интервала, в которой находится  медиана

- величина (размах) интервала

- накопленная  частота в интервале, предшествуя  медианному

- частота в  медианном интервале

-  сумма частот ряда

 

          Моду и медиану можно определить на основе графического изображения ряда. Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

          Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.

          Для характеристики размеров колеблемости признаков в статистике применяются следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

    1. Размах вариации (R) показывает насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака.

                                                   (2.5)

 

где, и соответственно наибольшее и наименьшее значение варьирующего признака.

 

 

    1. Среднее линейное отклонение (d) – представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как взвешенной, так и невзвешенной.

 

 невзвешенное  среднее линейное отклонение           (2.6)

 

 взвешенное  среднее линейное отклонение            (2.7)

 

 

    1. Дисперсия ( ) представляет собой среднее квадратическое отклонение индивидуального значения признака от их средней величины. Дисперсия вычитается по формулам простой невзвешенной и взвешенной:

 

                            невзвешенная                      (2.8)

 

                           взвешенная                     (2.9)

 

 

    1. Среднее квадратическое отклонение () представляет собой корень второй степени из среднего квадратического отклонения отдельного значения признака от их средней:

 

                         невзвешенное                        (2.10)

 

                         взвешенное                       (2.11)

 

 

    1. Коэффициент вариации:

 

     (2.12)

 

                        (2.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 2

 

          Основываясь на ниже приведенных данных, определить аналитическим и графическим методами показатели центра распределения (моду и медиану), а так же показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию и коэффициент вариации.

Имеются следующие данные о тарифных разрядах рабочих механического цеха:

3

2

4

5

5

6

5

5

4

5

6

5

2

4

3

4

6

3

4

3

4

2

6

6

5

3

2

3

5

3

4

2

6

6

5

3

2

3

5

3


Постройте дискретный ряд распределения. Вычислите показатели центра распределения  и показатели вариации.

Решение:

Определим число групп дискретного ряда (n), оно соответствует числу вариантов признака, то есть n=5.

Общее число единиц совокупности (N) по данным из задания равно числу 40.

Сгруппируем  данные о тарифных разрядах рабочих механического цеха:

 

 

Таблица 2.1

Группировка данных  рабочих по тарифным разрядам.

Тарифные разряды (x)

Количество рабочих, чел. (f)

Накопленные частоты (S)

2

6

6

3

10

16

4

7

23

5

10

33

6

7

40


 

S = 6


= 6+10=16                               Посчитали накопленную частоту

= 16+7=23

= 23+10=33

= 33+7=40

 

Далее вычислим показатели вариации:

  1. Размах вариации (по формуле 2.5):

R= 6 - 2 =4 (разряд)

То есть разряд равен 4

  1. Среднее линейное отклонение (по формуле 2.7):

Вычислим среднюю арифметическую взвешенную, т.к. исходные значения признака представлены в виде вариационного ряда.

x =


d =


 

Таким образом, среднее линейное отклонение количества рабочих механического цеха составило: 1,16

  1. Дисперсия (по формуле 2.9):

 

 

  1. Среднее квадратическое отклонение (по формуле 2.11):

 

 

  1. Коэффициент вариации (по формуле 2.13):

 

Совокупность однородна, так как коэффициент вариации

не превышает 33%.

 

Вычислим показатели центра распределения (моду и медиану).

  • Вычислим моду, (в дискретном ряду это варианта с наибольшей частотой):

 

Так как в этом дискретном ряду варианта с наибольшей частотой встречается 2 раза. (f=10)

  • Вычислим медиану (срединная варианта):

Анализируя данные из таблицы 2.1. можно сделать вывод, что x=4, f=7, следовательно, упорядоченный ряд состоит из 5 членов, поэтому Ме=4.

 

Графическое изображение моды и медианы представлено в приложении.

 

Вывод: построен дискретный ряд распределения, рассчитан размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации для того что бы узнать однородна или неоднородна совокупность дискретного ряда. Так же вычислена мода и построен график, затем медиана и построен график.

 

 

Тема 3. «Ряды динамики»

Для характеристики и анализа социально – экономических явлений за некоторый период применяют показатели и методы, характеризующие эти процессы во времени (динамики).

Ряд динамики – это ряд последовательно расположенных статистических показателей в хронологическом порядке, изменение которых показывает определенную тенденцию развития изучаемого явления.

В каждом ряду динамики имеются 2 основных элемента:

  1. Показатель времени (t)
  2. Уровень ряда (y)

Классификация рядов динамики:

  • В зависимости от способа выражения уровней ряды динамики подразделяются на ряды: абсолютных, относительных и средних величин.
  • В зависимости от того, выражают ли уровни ряда величину явления на определенные моменты времени (даты) или его величину за определенные интервалы времени, различают соответственно моментные и интервальные ряда динамики. Уровни интервального ряда динамики абсолютных величин характеризуют суммарный итог какого-либо явления за определенный отрезок времени. Они зависят от продолжительности этого периода и поэтому их можно суммировать. Отдельные уровни моментного ряда динамики абсолютных величин суммировать нельзя.
  • В зависимости от расстояния между уровнями ряды динамики подразделяются на ряды динамики с равностоящими уровнями и неравностоящими уровнями во времени.

 

Средний уровень интервального ряда определяют по формуле:

 

                                                                                        (3.1)

 

где – уровень ряда динамики

       n - число членов ряда динамики.

 

Средний уровень моментного ряда определяют по формуле средней хронологической:

                         (3.2)

 

Абсолютный прирост DY показывает на сколько единиц увеличился (или уменьшился) анализируемый уровень ряда относительно базисного уровня (по базисной схеме) или уровня предшествующего года   (по цепной схеме). Соответственно его определяют по формулам:

                        - (по базисной схеме)                (3.3)

                        (по цепной схеме)              (3.4)

 

Темп роста показывает, во сколько раз анализируемый уровень ряда увеличился (или уменьшился) по сравнению с уровнем, принятым за базу сравнения (по базисной схеме) или предшествующим уровнем (по цепной схеме). Темп роста выражают в процентах или отвлеченных числах (коэффициент роста). Его определяют по формулам:

               *100% (по базисной схеме)                     (3.5)

               (по цепной схеме)                      (3.6)

 

Темп прироста показывает, на сколько процентов увеличился (или уменьшился) анализируем уровень ряда по сравнению с базисным (по базисной схеме) ли предшествующим уровнем (по цепной схеме). Его определяют как отношение абсолютного прироста к уровню, принятому за базу сравнения, по формулам:

              (по базисной схеме)             (3.7)

              ( по цепной схеме)               (3.8)

 

Темпы роста и прироста связаны между собой, что видно из формул их расчеты:

       (3.9)

 

Это дает основание определить темп прироста через темп роста:

                                                                                 (3.10)

 

Средний темп роста и средний темп прироста характеризуют соответственно темпы роста и прироста за период в целом. Средний темп роста рассчитывается по данным ряда динамики по формуле средней геометрической:

                                                                            (3.11)

где n – количество уровней ряда.

Исходя из соотношения темпов роста и прироста, средний темп прироста определяется по формуле:

                                                                                (3.12)

Абсолютное значение одного процента прироста A - это отношение цепного абсолютного прироста к цепному темпу прироста, выраженному в процентах. Оно определяется по формуле:

                                                                          (3.13)

Как видно из расчета, абсолютное значение одного процента прироста равно 0,01 предшествующего уровня.

С помощью рядов динамики изучают явления, имеющие сезонный характер. Сезонными колебаниями называются устойчивые внутригодовые колебания в ряду динамики, обусловленные специфическими условиями производства, потребления или продажи продукции или услуг.

Уровень сезонности оценивается с помощью индексов сезонности. Индекс сезонности показывает, во сколько раз фактический уровень ряда в тот или иной момент времени больше среднего уровня. Он определяется по формуле:

 

                                                                               (3.14)

 

где – текущий уровень ряда динамики;

- средний  уровень ряда.

Графически индекс сезонности может быть представлен с помощью полигона – основного вида графиков, используемого для графического изображения рядов динамики.

 

 

 

 

 

 

Задание 3

По данным таблицы 3.1 вычислите:

1)Основные аналитические  показатели ряда динамики (по  цепной и базисной схемам):

  • Абсолютный прирост;
  • Темпы роста;
  • Темпы прироста;
  • Абсолютное значение 1% прироста.
Основные приемы и методы обработки и анализа статистических данных