Контрольная работа по "Статистике". 529

 

Статистика

Задание

I. Анализ динамики социально-экономических явлений и процессов (для проведения исследования необходимо, как минимум, два динамических ряда количественных показателей не менее, чем за 24 периода, один из которых используется во всей работе, а второй - только в п. 8)

1. Общая характеристика исследуемой совокупности:

  1. Описание данных, источник получения, рассматриваемый период и пространственные рамки
  2. Характеристика используемых статистических показателей, в том числе вид и единица измерения, тип (интервальный или моментный)
  3. Оценка среднего значения выбранного показателя
  4. Оценка структурных средних (моды, медианы) на основе структурной группировки
  5. Оценка показателей вариации
  6. Графическое представление распределения значений (гистограмма)
  7. Оценка абсолютных и относительных показателей динамики для выбранного показателя
  8. Выравнивание ряда методом скользящей средней
  9. Выявление наличия тренда в рассматриваемых рядах (проверка гипотезы о разности средних у первой и второй половины ряда)
  10. Аналитическое выравнивание (построение тренда), прогноз при помощи тренда на 3 периода вперед
  11. Анализ колеблемости динамического ряда, расчет индексов сезонности (если возможно)
  12. Экспоненциальное сглаживание динамического ряда (метод выбирается в зависимости от наличия в динамическом ряду тренда и цикла)
  13. Анализ взаимосвязи между динамическими рядами (корреляция приростов, отклонений от тренда)
  14.  
  15. Общая характеристика исследуемой совокупности.

Исходные данные представлены в таблице 1. Исходные данные представляют собой информацию о выручке и величине основных фондов ОАО «Уралсвязьинформ» за 2004 – 2009 гг поквартально (24 периода). Источник получения – бухгалтерская информация ОАО «Уралсвязьинформ».

Таблица 1

год

квартал

выручка

основные средства

2004

1

5 524,3

21 615,6

2

5 742,4

22 396,0

3

6 060,6

23 701,9

4

6 772,4

28 670,2

2005

1

6 543,8

28 541,0

2

6 864,3

29 222,5

3

7 945,5

32 376,6

4

8 941,1

37 386,3

2006

1

7 630,4

36 825,2

2

7 990,4

37 252,1

3

8 858,5

38 624,5

4

9 371,7

40 546,9

2007

1

9 489,6

39 484,0

2

10 468,8

41 574,1

3

8 938,8

41 346,3

4

10 255,5

42 863,1

2008

1

9 879,9

41 857,6

2

10 078,4

41 574,1

3

10 234,0

43 105,1

4

10 388,6

47 104,4

2009

1

10 024,9

45 774,3

2

10 078,5

44 851,6

3

10 140,8

44 295,9

4

10 499,8

45 248,6


 

Тип данных – моментный. Анализ ведется по показателю – выручка. Единица измерения – тыс.руб.

Рассчитаем среднюю  величину за весь рассматриваемый период. Среднюю можно рассчитать по формуле  средней арифметической

Хср = 8696,8 тыс.руб.

Произведем структурную группировку данного ряда.

Построим интервальный вариационный ряд.

Для определения числа  групп можно воспользоваться  формулой Стерджесса:

,

где n – число групп;

  N – число единиц в совокупности.

n = 1+3.322 lg24 = 5,58 ≈ 5

Величина интервала определяется по формуле:

,

где Хmax - максимальное значение признака в ряду;

Xmin – минимальное значение признака в ряду.

Величина интервала для вариационного ряда распределения по величине незанятых

H = (10499,8 – 5524,3) / 5= 995,1 тыс.руб.

В таблице 2 приведена  группировка кварталов по величине выручки

Таблица 2

№ группы

Начало интервала, тыс.руб.

Конец интервала, тыс.руб.

Число кварталов, шт

Средняя величина интервала, тыс.руб.

Общая величина выручки в группе, тыс.руб.

Средняя величина выручки в группе, тыс.руб.

1

5 524,3

6 519,4

3

6021,9

17 327,4

5775,8

2

6 519,4

7 514,5

3

7017,0

20 180,6

6726,9

3

7 514,5

8 509,6

3

8012,1

23 566,3

7855,4

4

8 509,6

9 504,7

5

9007,2

45 599,7

9119,9

5

9 504,7

10 499,8

10

10002,3

102 049,3

10204,9

Итого

   

24

 

208 723,2

8696,8


 

Среднее значение величины выручки по сгруппированным данным определяется по формуле

Хср = ∑хсрifi / ∑fi, где

хсрi – середина i-го интервала

Хср = 8675,5 тыс.руб.

Рассчитаем структурные  средние на основе группировки

Мода – значение признака, которое наиболее часто встречается  в ряду распределения. Для интервального  ряда мода определяется по наибольшей частоте. Мода находится по формуле:

где x0 – нижняя (начальная) граница модального интервала;

k – величина интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+1 – частота интервала, следующего за модальным.

Мо = 9504,7 + 995,1 * (10 – 5) / ((10 – 5) + (10 – 0)) = 9836,4 тыс.руб. – данное значение выручки наиболее часто встречается в группировке.

Медиана – значение признака, которое делит совокупность на две  равные части, т.е. 50% единиц совокупности имеют значение меньше медианы, а  остальные – больше медианы.

Для определения медианы рассчитывается ее порядковый номер по формуле:

= 25 / 2 = 12,5

где n – число единиц совокупности.

Затем рассчитывается накопленные  частоты. После смотрят, какая из накопленных частот впервые превышает  номер медианы. 

Медиану рассчитывают по формуле:

,

где x0 – нижняя граница медианного интервала;

k – величина интервала;

∑f = n – число единиц совокупности;

SMe-1 – накопленная частота (кумулятивная частота) интервала, предшествующего медианному;

fMe – медианная частота.

Ме = 8509,6 + 995,1 * (12 – 9) / 14 = 9149,3 тыс.руб. – данная величина выручки находится в середине совокупности.

Как видим, средняя величина выручки и структурные средние  отличаются друг от друга. Величина структурных  средних выше, чем среднее значение выручки по группировке. Медиана находится в четвертом интервале (как и средняя), но больше нее. Величина моды самая большая из средних, что говорит о том, что наиболее встречающееся значение величины выручки выше средней.

Степень близости данных отдельных единиц совокупности к средней величине измеряется рядом абсолютных и относительных показателей вариации.

К абсолютным показателям  вариации относятся:

- размах вариации;

- среднее линейное  отклонение;

- дисперсия;

- среднее квадратическое отклонение.

Размах вариации представляет собой разность между максимальным и минимальным значениями признака совокупности, и находится по формуле:

R = 10 499,8 – 5 524,3 = 4975,5 тыс.руб.

Среднее линейное отклонение представляет собой среднюю величину из отклонений значений признака от их средней величины, которое рассчитывается по формуле:  

= 1433,1 – среднее линейное отклонение по несгруппированным данным

Так же среднее линейное отклонение можно рассчитать по формуле

В таблице 3 представлены дополнительные расчеты для исчисления показателей вариации

Таблица 3

№ группы

Начало интервала, тыс.руб.

Конец интервала, тыс.руб.

Число кварталов, шт

Средняя величина интервала, млн.долл.

|х-хср|

|х-хср|*fi

(х-хср)2*fi

1

5524,3

6519,4

3

6021,9

2674,9

8024,7

21465304,4

2

6519,4

7514,5

3

7017,0

1679,8

5039,4

8465221,83

3

7514,5

8509,6

3

8012,1

684,7

2054,1

1406464,21

4

8509,6

9504,7

5

9007,2

310,4

1552,0

481719,254

5

9504,7

10499,8

10

10002,3

1305,5

13054,9

17043079,5

Итого

   

24

   

29725,1

48861789,2

Средняя

         

1238,5

2035907,9


 

d = 1238,5 тыс.руб.

Дисперсия – это средний квадрат  отклонений индивидуальных значений признака от их средней величины. Дисперсия  находится по формуле:

-простая (невзвешенная) дисперсия

- дисперсия взвешенная

σ2 = 2 781 740,9 – невзвешенная дисперсия

σ2 = 2 035 907,9 – взвешенная дисперсия

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии, т.е. корень квадратный из среднего квадрата отклонений индивидуальных значений признака от их средней величины. Среднее квадратическое отклонение находится по формуле:

Найдем среднее квадратическое отклонение по объему кредитных вложений:

= 1667,9 тыс.руб.– невзвешенное значение

= 1429,9 тыс.руб. – взвешенное значение

Относительные показатели вариации в общем виде показывают отношение абсолютных показателей  вариации к их средней величине.

К относительным показателям  вариации относятся:

- коэффициент осцилляции;

- относительное линейное  отклонение;

- коэффициент вариации.

Коэффициент осцилляции находится по формуле:

Коэффициент осцилляции для выборки по величине чистых активов равен:

VR = 4975,5 / 8696,8 * 100% = 57,2%

Относительное линейное отклонение рассчитывается по формуле:

Относительное линейное отклонение

VD = 1433,1 / 8696,8 * 100% = 16,5%

VD = 1238,5 / 8696,8 * 100% = 14,24%

Коэффициент вариации характеризует однородность совокупности. Совокупность считается однородной, если коэффициент вариации меньше либо равен 33%, иначе признается неоднородной. Коэффициент вариации определяется по формуле:

Тогда, коэффициент вариации для выборки по величине чистых активов равен:

Vσ = 1667,9 / 8696,8 * 100% = 19,2%

Vσ = 1429,9 / 8696,8 * 100% = 16,44%

Коэффициент вариации имеет значение меньше 33%, следовательно совокупность однородна.

Гистограмма распределения представлена на рисунке 1.

Рис.1

Рассчитаем показатели динамики для показателя.

К абсолютным показателям  динамики относят абсолютный прирост, рассчитанные по цепной и базисной схеме. К относительным показателям  динамики относят темпы роста  и прироста так же рассчитанные по цепной и базисной схеме.

Абсолютный прирост ( ) – это разность между последующим и предыдущим уровнями ряда (цепные) или начальным уровнем ряда (базисные). Цепной абсолютный прирост характеризует последовательное изменение уровней ряда, а базисный абсолютный прирост – изменение нарастающим итогом. Абсолютный прирост показывает, на сколько абсолютных единиц изменился данный уровень по сравнению:

а) с предыдущим уровнем  при цепном способе;

б) с начальным уровнем при  базисном способе.

,       

где уi – i-ый уровень ряда,

      уi – 1 – i-1-ый уровень ряда.

,        

где уi – i-ый уровень ряда,

       у1 – начальный, базисный уровень ряда.

Между цепным и базисным абсолютным приростом существует взаимосвязь – сумма цепных дает соответствующий базисный абсолютный прирост.

Темп роста (Тр) – это соотношение последующего уровня ряда к предыдущему (цепные темпы роста) или постоянному, принятому за базу сравнения (базисные темпы роста):

Цепные коэффициенты (темпы) роста рассчитываются по формуле:

,  

где уi – i-ый уровень ряда,

      уi – 1 – i-1-ый уровень ряда.

 базисные коэффициенты (темпы) роста рассчитываются  по формуле:

где уi – i-ый уровень ряда,

 у1 – начальный, базисный уровень ряда.

Цепной способ характеризует  последовательное изменение, а базисный способ – изменение нарастающим  итогом.

Между цепными и базисными  темпами роста существует взаимосвязь  – произведение цепных темпов роста  дает соответствующий базисный темп роста.

Темп прироста показывает, на сколько процентов изменяется данный уровень по сравнению:

а) с предыдущим уровнем  ряда при цепном способе,

б) с базисным, начальным  уровнем ряда при базисном способе.

,  

где  - цепной абсолютный прирост i-го уровня ряда,

        уi – 1 – i-1-ый уровень ряда.

,

где - базисный абсолютный прирост i-го уровня ряда,

       у1 – начальный, базисный уровень ряда.

Темп прироста обычно выражается в процентах и показывает, на сколько процентов увеличился (+) или уменьшился (-) текущий уровень по сравнению с предыдущим (базисным).

Темп прироста также  можно определить исходя из темпа  роста:

,

где - цепной темп роста (в коэффициентах или в процентах).

,

,

где - базисный темп роста (в коэффициентах или в процентах).

Результаты расчетов по вышеприведенным формулам за 2003 – 2009 гг поквартально представлены в таблице 4.

 

Таблица 4

год

квартал

выручка

Абсолютный прирост

Темп роста, %

Темп прироста, %

Базисный

Цепной

Базисный

Цепной

Базисный

Цепной

2004

1

5 524,3

-

-

-

-

-

-

2

5 742,4

218,0

218,0

103,9%

103,9%

3,9%

3,9%

3

6 060,6

536,3

318,2

109,7%

105,5%

9,7%

5,5%

1

6 543,8

1 019,5

483,2

118,5%

108,0%

18,5%

8,0%

2005

4

6 772,4

1 248,1

228,6

122,6%

103,5%

22,6%

3,5%

2

6 864,3

1 340,0

91,9

124,3%

101,4%

24,3%

1,4%

1

7 630,4

2 106,1

766,1

138,1%

111,2%

38,1%

11,2%

3

7 945,5

2 421,1

315,1

143,8%

104,1%

43,8%

4,1%

2006

2

7 990,4

2 466,1

44,9

144,6%

100,6%

44,6%

0,6%

3

8 858,5

3 334,1

868,1

160,4%

110,9%

60,4%

10,9%

3

8 938,8

3 414,4

80,3

161,8%

100,9%

61,8%

0,9%

4

8 941,1

3 416,8

2,4

161,8%

100,0%

61,8%

0,0%

2007

4

9 371,7

3 847,3

430,5

169,6%

104,8%

69,6%

4,8%

1

9 489,6

3 965,2

117,9

171,8%

101,3%

71,8%

1,3%

1

9 879,9

4 355,6

390,3

178,8%

104,1%

78,8%

4,1%

1

10 024,9

4 500,5

144,9

181,5%

101,5%

81,5%

1,5%

2008

2

10 078,4

4 554,1

53,5

182,4%

100,5%

82,4%

0,5%

2

10 078,5

4 554,1

0,1

182,4%

100,0%

82,4%

0,0%

3

10 140,8

4 616,5

62,3

183,6%

100,6%

83,6%

0,6%

3

10 234,0

4 709,7

93,2

185,3%

100,9%

85,3%

0,9%

2009

4

10 255,5

4 731,2

21,5

185,6%

100,2%

85,6%

0,2%

4

10 388,6

4 864,2

133,1

188,1%

101,3%

88,1%

1,3%

2

10 468,8

4 944,4

80,2

189,5%

100,8%

89,5%

0,8%

4

10 499,8

4 975,5

31,1

190,1%

100,3%

90,1%

0,3%


 

Средний уровень и  среднегодовой темп ряда динамики

Средний уровень ряда = (у1 + у2 + …. + уn) / n = 8696,8 тыс.руб.

Среднегодовой абсолютный прирост определяется по формуле

∆уср = ∑∆уцепн / (n - 1), где

n – число цепных (погодовых) абсолютных приростов.

∆уср = 216,3 тыс.руб.

Средний темп роста можно  определить исходя из цепных коэффициентов (темпов) роста:

,

или абсолютных уровней  ряда (базисного темпа роста):

,

где - соответствующие цепные темпы роста (yi / yi-1),

       - базисный темп роста за весь период (yn / y0),

       n-1 – количество изменений за данный период. 

Трср = 1,0283 = 102,83 %

Средний темп прироста ( ) – характеризует темп прироста в среднем за период  и определяется на основе среднего темпа роста:

,

где - средний темп роста (в коэффициентах или в процентах).

Тпрср = 2,83%

Произведем выравнивание ряда методом скользящей трехчленной  средней.

Результаты выравнивания в таблице 5.

Таблица 5

год

квартал

выручка

Скользящая  средняя

2004

1

5 524,3

 

2

5 742,4

5775,8

3

6 060,6

6191,8

4

6 772,4

6459,0

2005

1

6 543,8

6726,9

2

6 864,3

7117,9

3

7 945,5

7917,0

4

8 941,1

8172,3

2006

1

7 630,4

8187,3

2

7 990,4

8159,8

3

8 858,5

8740,2

4

9 371,7

9239,9

2007

1

9 489,6

9776,7

2

10 468,8

9632,4

3

8 938,8

9887,7

4

10 255,5

9691,4

2008

1

9 879,9

10071,3

2

10 078,4

10064,1

3

10 234,0

10233,7

4

10 388,6

10215,8

2009

1

10 024,9

10164,0

2

10 078,5

10081,4

3

10 140,8

10239,7

4

10 499,8

 

 

График исходных и  выровненных данных представлен  на рис.2

Рис.2

Выявим наличие тренда в рассматриваемых рядах при  помощи проверки существенности разности средних.

За основу проверки берется t-критерий Стьюдента. При t ≥ tтабл гипотеза об отсутствии тренда отвергается, и наоборот, при t меньше или равном tα гипотеза (H0 ) принимается. Здесь t - расчетное значение, найденное для анализируемых данных. tтабл - табличное значение критерия при уровне вероятности ошибки, равном α. Разделим совокупность на две части – данные за 2004 год – 2006 года и 2007 – 2009 гг.

В случае равенства или  при несущественном различии дисперсий  двух исследуемых совокупностей  определение расчетного значения t производится по формуле:

где и - средние для первой и второй половин ряда динамики;

n1 и n2 — число наблюдений в этих рядах;

σ — среднеквадратическое отклонение разности средних, определяемое по формуле:

Дисперсии для первой и второй частей ряда рассчитываются по формуле:

Дисперсия для первой половины выборки  = 1 685 169

Дисперсия для второй половины выборки  =159 954,6

= 3216,55

= -2,045

Табличное значение t-критерия Стьюдента составляет при m = n – к – 1, к = 1 и α = 0,05

Tтабл = 2,07

Поскольку tрасч < t табл, то гипотеза об отсутствии тренда принимается.

Произведем аналитическое  выравнивание ряда при помощи уравнения прямой, которая имеет вид

У = а + bt, где

У – численность незанятых

t – фактор времени

а и b – параметры уравнения

а = ∑у / n

b = ∑у*t / ∑t2

Для расчета параметров уравнения составим таблицу 6.

Таблица 6

год

квартал

выручка

t

уt

t2

урасч

2004

1

5 524,3

-23

-127060

529

6197,4

2

5 742,4

-21

-120590

441

6414,7

3

6 060,6

-19

-115152

361

6632,0

4

6 772,4

-17

-115132

289

6849,4

2005

1

6 543,8

-15

-98157,5

225

7066,7

2

6 864,3

-13

-89236,3

169

7284,1

3

7 945,5

-11

-87400,3

121

7501,4

4

8 941,1

-9

-80470,3

81

7718,8

2006

1

7 630,4

-7

-53412,9

49

7936,1

2

7 990,4

-5

-39952,1

25

8153,4

3

8 858,5

-3

-26575,5

9

8370,8

4

9 371,7

-1

-9371,67

1

8588,1

2007

1

9 489,6

1

9489,598

1

8805,5

2

10 468,8

3

31406,27

9

9022,8

3

8 938,8

5

44693,87

25

9240,2

4

10 255,5

7

71788,63

49

9457,5

2008

1

9 879,9

9

88919,42

81

9674,8

2

10 078,4

11

110862,6

121

9892,2

3

10 234,0

13

133042,4

169

10109,5

4

10 388,6

15

155828,6

225

10326,9

2009

1

10 024,9

17

170422,8

289

10544,2

2

10 078,5

19

191491,3

361

10761,6

3

10 140,8

21

212957,2

441

10978,9

4

10 499,8

23

241496,3

529

11196,2

Итого

 

208 723,2

 

499888,9

4600

 

а = ∑у / n = 8696,8

b = ∑у*t / ∑t2 = 499 888,9 / 4600 = 108,67

Уравнение ряда имеет  вид

У = 8696,8 + 108,67t

Эмпирические и аналитические  значения представлены на рисунке 3.

Рис.3

Сделаем прогноз на 3 периода вперед при помощи уравнения.

Прогноз величины выручки на первый квартал 2010 года = 8696,8 + 108,67t  = 8696,8 + 108,67* 25 =11 413,55 тыс.руб.

Прогноз величины выручки на второй квартал 2010 года = 8696,8 + 108,67t  = 8696,8 + 108,67* 27 = 11630,89 тыс.руб.

Прогноз величины выручки на третий квартал 2010 года = 8696,8 + 108,67t  = 8696,8 + 108,67* 29 = 11848,23 тыс.руб.

Расчет индексов сезонности

Индекс сезонности можно  рассчитать как процентное отношение  средней величины из фактический  уровней одноименных месяцев к общему среднему уровню

В данном случае нет зависимости  величины выручки от сезона, поэтому  анализ сезонности не имеет значения.

Проведем экспоненциальное сглаживание динамического ряда при помощи пакета анализ данных Excel (вкладка «экспоненциальное сглаживание»). Результаты расчета представлены в таблице 7.

Таблица 7

год

квартал

выручка

экспоненциальное сглаживание

2004

1

5 524,3

 

2

5 742,4

5 524,3

3

6 060,6

5 677,0

4

6 772,4

5 945,5

2005

1

6 543,8

6 524,4

2

6 864,3

6 538,0

3

7 945,5

6 766,4

4

8 941,1

7 591,8

2006

1

7 630,4

8 536,3

2

7 990,4

7 902,2

3

8 858,5

7 963,9

4

9 371,7

8 590,1

2007

1

9 489,6

9 137,2

2

10 468,8

9 383,9

3

8 938,8

10 143,3

4

10 255,5

9 300,1

2008

1

9 879,9

9 968,9

2

10 078,4

9 906,6

3

10 234,0

10 026,9

4

10 388,6

10 171,9

2009

1

10 024,9

10 323,6

2

10 078,5

10 114,5

3

10 140,8

10 089,3

4

10 499,8

10 125,4

Контрольная работа по "Статистике". 529