Ирина Эланс

Автор который поможет с любыми образовательными и учебными заданиями

Экономико-математические методы моделирования и анализ временных рядов

АКАДЕМИЯ УПРАВЛЕНИЯ ПРИ ПРЕЗИДЕНТЕ

РЕСПУБЛИКИ БЕЛАРУСЬ

ИНСТИТУТ ГОСУДАРСТВЕННОГО УПРАВЛЕНИЯ

Кафедра экономико-математических методов управления

Курсовая работа

По дисциплине: «Экономико-математические методы и модели»

на тему: Экономико-математические методы моделирования и анализ временных рядов

Выполнила: Студентка 3-его курса

специальности УИР гр. УИР-4

Черноусик Ю.С.

Проверил: преподаватель кафедры

Северин Г.М.

Минск, 2009

Содержание

ВВЕДЕНИЕ 3

1. Временные ряды 4

1.1. Анализ тренда 7

1.2 Измерение циклической компоненты 10

1.3 Определение сезонной составляющей 11

1.4 Процедура общей декомпозиции ряда 15

2. Модели временных рядов 17

2.1 Модели стационарных временных рядов и их идентификация 17

2.2 Модели авторегрессии порядка p (AR(p)-модели) 18

3. Практическая часть 23

ЗАКЛЮЧЕНИЕ 24

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 26

ВВЕДЕНИЕ

На протяжении многих лет большое внимание уделяется исследованию рядов динамики временных показателей. Разнообразные содержательные задачи экономического анализа требуют использования статистических данных, характеризующих исследуемые экономические процессы и развернутых во времени в форме временных рядов. При этом нередко одни и те же временные ряды используются для решения разных содержательных проблем.

В ситуациях, когда временной ряд формируется под воздействием некоторого набора случайных и неслучайных факторов, анализ отдельных временных рядов имеет огромное значение. Это необходимо для правильной идентификации моделей, которые строятся по информации об исследуемых процессах. При анализе временных рядов основное внимание уделяется исследованию, описанию и/или моделированию их структуры. Цель таких исследований, как правило, шире просто моделирования исследования соответствующих процессов. Построенная модель обычно используется для экстраполяции или прогнозирования временного ряда, и тогда качество прогноза может служить полезным критерием при выборе среди нескольких альтернативных моделей. Построение хороших моделей ряда необходимо и для других приложений, таких, как корректировка сезонных эффектов и сглаживание.

Объектом исследования являются понятия: временной ряд, тренд.

Цель данной работы - апробировать теоретические и методологические основы анализа временных рядов. Достижение поставленной цели предполагает решение следующих задач: определить понятие и сущность временных рядов, проанализировать особенности составляющих компонент временного ряда, рассмотреть его модели, а также рассмотреть методику построения временных рядов на практическом примере.

1. Временные ряды

Достаточно часто в экономике приходится получать данные в виде временных рядов. Под временным рядом (или динамическим рядом) понимается ряд значений некоторого показателя, взятых по состоянию на определенные моменты или периоды времени. Количественные значения показателя во временном ряду называются уровнями. Уровни расположены в хронологическом порядке, обычно через равные промежутки времени. Если они агрегированы так, что отражают состояние показателя на некоторые периоды времени, то такой ряд называется интервальным. В качестве таких периодов могут выступать, например, годы, кварталы, месяцы, недели. Моментные временные ряды характеризуют состояние показателя на короткий промежуток времени, например на день, час.

Временные ряды отражают динамику социально-экономических явлений. Если уровни временного ряда формируются под влиянием факторов и условий, которые будут незначительно изменяться в будущем, то временной ряд можно использовать для прогнозирования. При этом его методологической основой будет экстраполяция, т. е. перенесение в будущее тенденции, которая сформировалась в прошлом.

Действие факторов, влияющих на величины уровней временного ряда, носит различный временной характер. Влияние одних факторов проявляется постоянно в течение продолжительных промежутков времени, влияние других — периодически, с разной длиной периода. Некоторые факторы проявляют себя случайно и нерегулярно

В этой связи каждый уровень временного ряда можно рассматривать как результат наложения компонент, имеющих разный временной характер действия. Метод анализа временных рядов заключается в выделении этих компонент.

Среди компонент временного ряда выделяют: тренд, циклическую компоненту, сезонную компоненту и нерегулярную компоненту (Рис. 1.1).

Рисунок 1.1 - Компоненты временного ряда

Под трендом понимается долгосрочная составляющая, характеризующая общую тенденцию изменения временного рядов течение длительного периода времени. Под тенденцией понимается возрастание или убывание уровней временного ряда. Факторами, порождающими тренд, могут быть, например, изменение состава населения, инфляция, технологические изменения, рост производства, рост цен и т. д.

Циклическая компонента характеризует повторяющиеся и волнообразные изменения длительностью более года. Она отражает цикл деловой активности, периоды подъема и спада. Длина цикла, т. е. время между соседними максимумами (или соседними минимумами), может колебаться от года до 15—20 лет. Циклическая компонента определяется изменением остатков, разностей между трендом и фактическими значениями уровней ряда вдоль линии тренда.

Сезонная компонента также носит циклический характер. Она характеризует изменения, которые регулярно повторяются и завершаются в пределах года. Например, сезонным фактором являются погодные условия, соответствующие какому-либо времени года, так как влияют на продажи потребительских товаров.

Нерегулярная компонента отражает быстрые изменения, как правило, малой длительности. Они вызываются непредсказуемыми и редкими событиями: природными катаклизмами, войной, эпидемией, сменой власти и т. д.

Основная задача анализа временных рядов заключается в определении каждой компоненты и исключении ее воздействия на уровни временного ряда. Этот процесс называется декомпозицией, или разложением временного ряда. Формально модель декомпозиции временного ряда можно представить в виде.

y=TR*C*S*I, (1.1)

где у - уровень временного ряда, TR - тренд, С - циклическая компонента, S - сезонная компонента, I - нерегулярная компонента.

Данная модель называется моделью с мультипликативной компонентой. Она строится на предположении о том, что любой уровень временного ряда является произведением воздействующих компонент.

В анализе временных рядов рассматривается также альтернативный подход к агрегированию компонент — каждый уровень представляется как сумма воздействующих компонент:

y=TR+C+S+I (1.2)

При допущении модели (1.2) вклад сезонной компоненты остается постоянным с течением времени для данной части года.

Для мультипликативной модели (1.1) абсолютная величина сезонной колебаемости возрастает по мере роста уровней временного ряда. Эта модель чаще используется на практике, ее мы и будем рассматривать.

1.1. Анализ тренда

Тренд является долгосрочной составляющей временного ряда. При анализе тренда независимой переменной х является время, а зависимой у — уровень временного ряда. Вид тренда можно выявить, если построить график временного ряда, откладывая на оси абсцисс периоды времени, а на оси ординат — значения уровней. Визуальный анализ расположения точек графика поможет сделать вывод о форме сглаживающей линии. Если тренд окажется линейным, то для вычисления параметров уравнения применяется метод наименьших квадратов. При нелинейном тренде его также можно использовать, делая соответствующие преобразования переменных.

Пусть рассматривается линейный тренд:

ŷ=b₀+b₁t, (1.3)

где t — время (независимая переменная); ŷ — оценка уровня временного ряда (зависимая переменная).

Коэффициенты b₁ и b₀ определяются по следующим формулам:

b₁=(∑t*y_t-(∑t)*(∑y_t)/T)/(∑t²-(∑t)²/T) , (1.4)

b₀=y(c)-b₁*t(c), (1.5)

где у(с) = (у1+у2+у3+у4+…+уТ)/Т,

t(c)=(1+2+3…+T)/T=(T+1)/2.

Прогнозный год следует обозначать по той же системе. Если t = Т — последний год в ряду наблюдений, на основе которых было получено уравнение (1.3), то, прогнозируя в году T на k лет вперед, следует в уравнение (1.3) подставить значение t = Т +k:

ŷT+k= b₀+ b₁ (T+k) (1.6)

Пример 1. Имеются данные за ряд лет о численности работников одной компании:

Таблица 1.1 – Численность работников компании

Год	Численность работников (тыс.чел.)
2001	1,1
2002	2,4

Окончание таблицы 1.1

2003	4,6
2004	5,4
2005	5,9
2006	8
2007	9,7
2008	11,2

График временного ряда приведен на рисунке 1.2

Рисунок 1.2 - Временной ряд численностей работников компании сглаживающий линейный тренд

На рисунке 1.2 ясно просматривается линейный тренд. Найдем его параметры, используя формулы (1.4) и (1.5). Для этого закодируем значения независимой переменной.

Таблица 1.2 –Кодируемые переменные

t	yt
1	1,1
2	2,4
3	4,6
4	5,4
5	5,9
6	8
7	9,7
8	11,2

Предварительно вычислим:

t=1 + 2 + 3 + ... + 8 = 36,

∑t² = 1*1 + 2*2 + … + 8*8 = 204,

∑y_t = 1,1 + 2,4 + … + 11,2 = 48,3,

∑ty_t = 1*1,1 + 2* 2,4 + … + 8*11,2 = 276,3,

t(c)=(8+1)/2=4,5,

y(c)t=48,3/8=6,0375.

Подставляя результаты промежуточных вычислений в формулы (1.4) и (1.5), получим:

b₁=(276,3-36*48,3/8)/(204-36*36/8)=58,95/42=1,4036,

b₀=6,0375-1,4036*4,5= -0,279.

Отсюда уравнение тренда будет иметь вид:

y(c)t = -0,279 + 1,404t.

Спрогнозируем численность работников компании на 2009 г., полагая, что он соответствует t=Т+1=8+1=9:

ŷ9= -0,279 + 1,404 * 9 = 12,357, что соответствует 12 357 работникам.

Аналогичную процедуру кодирования значений переменной можно использовать при вычислении нелинейных трендов. Например, пусть требуется провести сглаживание временного ряда по параболе второго порядка:

Y= b₀+ b₁t+b₂t*t (1.7)

Система нормальных уравнений тогда записывается следующим образом:

b₀T+ b₁∑t+ b₂∑t*t = ∑yt,

b₀∑t+ b₁∑t²+ b₂∑t³ = ∑y_tt,

b₀∑t²+ b₁∑t³+ b₂∑t⁴ = ∑y_tt².

А коэффициенты будут рассчитываться по следующим формулам:

b₀=(∑t⁴∑y-∑t²∑t²y)/(T∑t⁴∑t²∑t²),

b₁=(∑t*y)/( ∑t²),

b₂=(T∑t² y-∑t²∑y)/(T∑t⁴∑t²∑t²).

Эти коэффициенты рассчитываются для t зашифрованного так , что сумма t равна 0.

Для прогноза часто используется полулогарифмическая функция:

у = b₀+ b₁*lgt , (1.8)

b₀=(∑y∑(lgt)²-∑ylgt∑lgt)/(T∑(lgt)² - ∑lgt∑lgt), (1.9)

b₁= ( T∑ylgt - ∑y∑lgt)/( T∑(lgt)² - ∑lgt∑lgt). (1.10)

1.2 Измерение циклической компоненты

Практически любой временной ряд в бизнесе содержит элемент цикличности. Цикличность присуща экономике, а также другим долговременным явлениям.

Одним из способов описания циклической компоненты является представление ее как доли тренда. Предположим, что рассматривается временной ряд, не содержащий сезонной составляющей. Например, таким будет ряд, основанный на годовых наблюдениях. В этом случае можно положить, что каждый уровень ряда у_t является произведением компонент:

y_t=TR_t*C_t*I_t (1.11)

Пусть построена модель тренда ŷ_t=TR_t

Тогда оценка циклической компонент получается делением значения уровня временного ряда на величину тренда:

y_t / ŷ_t= (TR_t*C_t *I_t)/ TR_t = C_t *I_t (1.12)

Если нерегулярная составляющая I_t оказывает незначительное влияние на уровни временного ряда, то ею можно пренебречь. Отсюда оценкой циклической компоненты будет отношение:

C_t ≈ y_t/ ŷ_t (1.13)

Если С > 1, то фактическое значение уровня ряда y_t будет больше, чем оценочное значение тренда. Это означает, что величина циклической компоненты находится где-то над линией тренда. Аналогично при С < 1 значения циклической компоненты будут ниже линии тренда.

Пример 2. В примере 1 на основе временного ряда численности работников компании был вычислен линейный тренд:

y_t = -0,279+ 1,404t,

где t= 1 соответствует 2001 г.,t = 2 — 2002 г. и т. д.

Определим циклическую компоненту. Для этого вычислим оценки у_t при t = 1,2, ..., 8 и определим отношения. Результаты вычислений сведем в следующую таблицу.

Таблица 1.3

t	y_t	ŷ_t	C_t ≈ y_t / ŷ_t
1	1,1	1,125	0,977
2	2,4	2,529	0,949
3	4,6	3,933	1,169
4	5,4	5,337	1,012
5	5,9	6,741	0,875
6	8	8,145	0,982
7	9,7	9,549	1,016
8	11,2	10,953	1,022

Как видно из таблицы 1.3, для первого периода оценка циклической компоненты равна 0,977. Это означает, что фактическое значение уровня составляет 97,7% трендового значения. Аналогично для второго периода — 94,9%, для третьего — 116,9% и т. д.

Следует отметить, что на практике прогнозирование циклов является достаточно сложной задачей. Предсказать период цикла, используя только данные временного ряда, практически невозможно. Выделение циклической компоненты может помочь при установлении стадии, на которой находится деловая активность.

1.3 Определение сезонной составляющей

Сезонная компонента проявляется, когда временной ряд составляют квартальные или месячные наблюдения. Рассмотрим уровень ряда только как результирующую сезонности и тренда, т. е. представим его как произведение тренда и сезонной компоненты:

y_t= TR_t*S_t (1.14)

Из соотношения (1.13) видно, что сезонность можно рассматривать как индекс, который умножается на величину тренда. Этот индекс остается постоянным каждый год для определенной части года. Например, если имеет место квартальная сезонность, то S₁ = S₅ = S₉ = ..., S₂ = S₆ = S_|0 = ... и т. д. Способом вычисления индексов сезонности является метод отношения к центрированной скользящей средней. Проиллюстрируем его на конкретном примере.

Пример 3. В таблице 1.4 приведены квартальные данные о продажах фирмы за период 2004 - 2007 гг. (в млн долл.), где в скобках указаны обозначения соответствующих уровней временного ряда.

Таблица 1.4 - Квартальные данные об объеме продаж (млн долл.)

Год	Квартал 1	Квартал 2	Квартал 3	Квартал 4
2004	20 (у1)	12 (y2)	47 (у3)	60 (у4)
2005	40 (у5)	32 (y6)	65 (у7)	76 (У8)
2006	56 (у9)	50 (y10)	85 (у11)	100 (у12)
2007	75 (y13)	70 (у14)	101 (у15)	123 (y16) )

Будем находить индекс сезонности для каждого квартала в течение года, т. е. вычислим четыре значения индекса. Идея метода отношения к центрированной скользящей средней состоит в том, что вначале на основе исходного временного ряда определяется новый временной ряд, не содержащий компоненту сезонности. Уровни нового ряда рассчитываются как центрированные скользящие средние.

Для вычисления центрированных скользящих средних определяются так называемые скользящие суммы. Для квартальной сезонности первая скользящая сумма будет включать значения первых четырех квартальных уровней исходного временного ряда:

(1) = y1 + y2+ y3 + y4 = 20 + 12 + 47 + 60 = 139.

Во вторую скользящую сумму входят первые четыре уровня ряда, сдвинутого на один квартал вперед:

(2) = y2 + y3+ y4 + y5 = 12 + 47 + 60 + 40 = 159 и т.д.

(13) y13 + y14+ y15 + y16 = 75 + 70 + 101 + 123 = 369.

Таблица 1.5 - Вычисление центрированных скользящих средних

Год	Квартал	t	yt	Скользящая сумма	Скользящая средняя	Отнош. к скольз. ср.
2004	1	1	20	-	-	-
	2	2	12	139	-	-
	3	3	47	159	37,25	1,26
	4	4	60	179	42,25	1,42
2005	1	5	40	197	47	0,85
	2	6	32	213	51,25	0,62
	3	7	65	229	55,25	1,18
	4	8	76	247	59,5	1,28
2006	1	9	56	267	64,25	0,87
	2	10	50	291	69,75	0,72
	3	11	85	310	75,13	1,13
	4	12	100	330	80	1,25
2007	1	13	75	346	84,5	0,89
	2	14	70	369	89,38	0,78
	3	15	101	-	-	-
	4	16	123	-	-	-

Для определения скользящей средней, вычисляя скользящую сумму по нечетному числу лет, можно просто разделить сумму на число лет. В нашем случае нужно провести центрирование: вычисляем двухлетние скользящие суммы и делим их на 8.

(139+159)/8=37,52 и.т.д.

С помощью этой процедуры вычисляются 12 центрированных скользящих средних (Таблица 1.5). Понятно, что их расчет для t = 1, 2, 15, 16 невозможен. В общем случае, если ряд содержит Т наблюдений, то для определения квартальной сезонности можно вычислить Т-4 центрированных скользящих средних. Усреднение помогает также уменьшить влияние нерегулярной компоненты.

Сведем все 14 отношений по кварталам и вычислим средние значения по каждому кварталу (Таблица 1.6). Эти средние значения будем рассматривать в качестве соответствующих индексов.

Таблица 1.6 - Вычисление квартальных индексов сезонности

Квартал 1	Квартал 2	Квартал 3	Квартал 4
-	-	1,26	1,42
0,85	0,62	1,18	1,28
0,87	0,72	1,13	1,25
0,89	0,78	-	-
Сумма 2,61	2,12	3,57	3,95
Средняя 0,87	0,707	1,190	1,317

Данная процедура позволяет значительно сократить эффект воздействия нерегулярной компоненты и получить практически в чистом виде квартальные индексы сезонности. Сумма квартальных индексов сезонности должна равняться 4. Если она не равна 4 (как у нас: 0,87 + 0,707 + 1,19 + 1,317 = 4,084) , то нужно найти корректирующий множитель.

4/4,084 = 0,9794.

Скорректируем квартальные индексы:

0,9794*0,870=0,852 1 квартал

0,9794*0,707 =0,692 2 квартал

0,9794*1,190 =1,166 3 квартал

0,9794*1,317 = 1,290 4 квартал

Индексы сезонности часто измеряют в процентах. Например, индекс первого квартала 85,2%. Это означает, что средний объем продаж по первому кварталу на 14,8% меньше четверти среднегодового объема продаж. Индекс третьего квартала, равный 116,6%, означает, что средний объем продаж по третьему кварталу на 16,6% больше четверти среднегодового объема продаж.

В рассмотренном примере анализировалась квартальная сезонная компонента. Аналогичные заключения будут верны и для месячной сезонности, и т.д.

Для определения тренда удобно использовать десезонализированные данные. Десезонализацией данных временного ряда называется устранение влияния сезонной компоненты на его уровни с целью изучения тренда и долговременных циклических изменений. Десезонализированные данные (d_t) определяются как отношение:

d_t= y_t /соответствующий индекс S_t =TR_t*C_t * S_t *I_t/S_t=TR_t*C_t * I_t

1.4 Процедура общей декомпозиции ряда

В предыдущих разделах данной главы рассматривались отдельные действия по оценке каждой компоненты временного ряда. Эти действия можно рассматривать как этапы процедуры общей декомпозиции временного ряда.

Этап 1. Определение методом отношения к центрированной скользящей средней сезонного индекса S для каждой части года. Для квартальных данных вычисления сводятся к нахождению четырех квартальных индексов S1, S2, S3, и S4. В случае месячных наблюдений определяется 12 индексов, для каждого месяца свой индекс.

Этап 2. Десезонализация данных. Этот этап заключается в выравнивании эффекта сезонности, т. е. исключении сезонной компоненты. Десезонализация осуществляется делением каждого фактического уровня на соответствующий сезонный индекс.

Этап 3. Определение тренда TR_t. Оценка тренда осуществляется по методу наименьших квадратов на основе десезонализированных данных d_t.

Этап 4. Определение циклической компоненты С. Эта компонента определяется делением каждой десезонализированной компоненты C_t на соответствующее значение тренда, полученное на этапе 3.

d_t / TR_t= C_t*I_t (1.15)

Для исключения нерегулярной компоненты можно вычислять, например, трехпериодные скользящие средние для величин C_t*I_t. В этом случае эффект нерегулярной компоненты значительно сокращается. Выбор именно трехпериодной скользящей средней был произволен. Он был связан с тем, что в случае нечетного числа слагаемых скользящей суммы скользящие средние не надо центрировать.

Итак, существует отработанный алгоритм действий анализа и прогноза временного ряда.

2. Модели временных рядов

2.1 Модели стационарных временных рядов и их идентификация

В этом разделе рассматривается набор линейных параметрических моделей и методы их идентификации. Так как здесь описывается поведение случайных остатков, то моделируемый временной ряд будет обозначаться e_t, и будет полагаться, что при всех t его математическое ожидание равно нулю, т.е. Ee_t, º 0. Временные последовательности, образующие «белый шум», обозначим d_t.

Описание и анализ, рассматриваемых ниже моделей, формулируется в терминах общего линейного процесса, представимого в виде взвешенной суммы настоящего и прошлых значений белого шума, а именно:

, (2.1)

где b₀ = 1 и .

Таким образом, белый шум представляет собой серию импульсов, в широком классе реальных ситуаций генерирующих случайные остатки исследуемого временного ряда.

Временной ряд e_t можно представить в эквивалентном (2.1) виде, при котором он получается в виде классической линейной модели множественной регрессии, в которой в качестве объясняющих переменных выступают его собственные значения во все прошлые моменты времени:

(2.2)

При этом весовые коэффициенты p₁, p₂,… связаны определенными условиями, обеспечивающими стационарность ряда e_t. Переход от (2.2) к (2.1) осуществляется с помощью последовательной подстановки в правую часть (2.2) вместо e_t_-₁, e_t_-₂,… их выражений, вычисленных в соответствии с (2.2) для моментов времени t - 1, t - 2 и т.д.

2.2 Модели авторегрессии порядка p (AR(p)-модели)

Существуют следующие простейшие частные случаи.

Модель авторегрессии 1-го порядка - AR(1) (марковский процесс). Эта модель представляет собой простейший вариант авторегрессионного процесса типа (2.2), когда все коэффициенты кроме первого равны нулю. Соответственно, она может быть определена выражением:

e_t = ae_t_-₁ + d_t, (2.3)

где a - некоторый числовой коэффициент, не превосходящий по абсолютной величине единицу (|a| < 1), а d_t - последовательность случайных величин, образующая белый шум.

При этом e_t зависит от d_t и всех предшествующих d, но не зависит от будущих значений d. Соответственно, в уравнении (2.3) d_tне зависит от e_t_-₁и более ранних значений e. В связи с этим, d_t называют инновацией (обновлением).