Прогнозирование в рядах динамики, оценка адекватности выбранного метода

Введение

В недавнем прошлом прогнозирование  как специфический вид научного анализа находило более или менее  широкое применение в области  естественных явлений (прогноз погоды, паводков, урожайности и т. д.), ныне оно охватило самые различные  сферы деятельности людей: политику, экономику, научно-технический прогресс, социальные процессы.

Интерес к будущему возникает из непосредственной и острой практической потребности сегодняшнего дня. Необходимость  предвидения вероятного исхода событий  в будущем никогда прежде не была столь насущной, как сейчас. Предвидение событий дает возможность заблаговременно приготовиться к ним, учесть их положительные и отрицательные последствия, а если это возможно,- вмешаться в ход развития, контролировать его, и что более важно - работать для претворения в жизнь одной из выявленных альтернатив будущего.

Под прогнозом  понимается научно обоснованное описание возможных состояний объектов в будущем, а также альтернативных путей и сроков достижения этого состояния.

Статистические методы прогнозирования позволяют выявлять закономерности изменения уровней экономических показателей на фоне случайностей, делать обоснованные прогнозы и оценивать вероятность их выполнения.

Процесс прогнозирования базируется на выявлении закономерностей, объясняющих динамику процесса в прошлом, и использовании этих закономерностей для описания развития в будущем.

 

Упрощенные  методы прогнозирования

Прогнозирование на основе средних показателей динамики

Описание  динамики ряда с помощью среднего абсолютного прироста соответствует его представлению в виде прямой, проведенной через две крайние точки. В этом случае, чтобы получить прогноз на один шаг вперед, достаточно к последнему наблюдению прибавить значение среднего абсолютного прироста:

,                                                                            

где yn - фактическое значение в последней n- ой точке ряда;

  - прогнозная оценка значения  уровня в точке n+1;

- значение среднего прироста, рассчитанное для временного ряда .

Чтобы получить прогноз  на К шагов вперед, нужно к последнему наблюдению прибавить значение среднего абсолютного прироста, умноженное на К:

.                                                                        

Такой подход к получению  прогнозного значения корректен, если характер развития близок к линейному. На такой равномерный характер развития могут указывать примерно одинаковые значения цепных абсолютных приростов.

Применение среднего темпа роста (и среднего темпа прироста) для описания динамики ряда соответствует его представлению в виде показательной или экспоненциальной кривой, проведенной через две крайние точки. Использование этого показателя для прогноза целесообразно для процессов, изменение динамики которых происходит примерно с постоянным темпом роста. В этом случае прогнозное значение на К шагов вперед может быть получено по формуле:

,                                                             

К недостаткам среднего прироста и среднего темпа роста следует отнести то, что они учитывают лишь конечный и начальный уровни ряда, исключают влияние промежуточных уровней. Тем не менее, эти показатели имеют широкую область применения, что объясняется простотой их вычисления. Они могут быть использованы как приближенные, простейшие способы прогнозирования, предшествующие более глубокому количественному и качественному анализу.

 

Прогнозирование по методу экспоненциальных средних

В настоящее время  одним из наиболее перспективных  направлений

исследования и прогнозирования  одномерных временных рядов являются адаптивные методы.

При обработке временных  рядов, как правило, наиболее ценной является информация последнего периода, т.к. необходимо знать, как будет развиваться тенденция, существующая в данный момент, а не тенденция, сложившаяся в среднем на всем рассматриваемом периоде. Адаптивные методы позволяют учесть различную информационную ценность уровней временного ряда, степень "устаревания" данных.

Прогнозирование методом  экстраполяции на основе кривых роста  в какой-то мере тоже содержит элемент  адаптации, поскольку с получением

"свежих" фактических  данных параметры кривых пересчитываются  заново.

Оценивание коэффициентов  адаптивной модели обычно осуществляется на основе рекуррентного метода, который формально отличается от метода наименьших квадратов, метода максимального правдоподобия и других методов тем, что не требует повторения всего объема вычислений при появлении новых данных.

Примером простейшей адаптивной модели является экспоненциальная средняя. Экспоненциальное сглаживание временного ряда производится пошагово, причем массив прошлой информации представлен единственным значением сглаженного уровня ряда в предыдущий момент времени.

Для экспоненциального  сглаживания ряда используется рекуррентная

формула:

   ,                                                     

где St- значение экспоненциальной средней в момент t;

α - параметр сглаживания, α =сonst, 0< α <1;

β = 1- α .

Если последовательно  использовать это соотношение, то экспоненциальную среднюю St можно выразить через предшествующие значения уровней временного ряда. При

         .                                      

Таким образом, величина St является взвешенной суммой всех членов ряда. При этом, веса отдельных уровней ряда убывают по мере их удаления в прошлое соответственно экспоненциальной функции (в зависимости от "возраста" наблюдений). Поэтому величина St названа экспоненциальной средней.

Например, если α = 0,3, то вес текущего наблюдения yt будет равен 0,3; вес предыдущего уровня yt-1 будет соответствовать α*β = 0,3*0,7=0,21; для уровня yt-2 вес составит α*β2 = 0,3*0,72=0,147; для yt-3 вес α*β3 = 0,3*0,73 = 0,1029 и т.д.

Пусть модель временного ряда имеет вид:   

.

Английский математик  Р. Браун показал, что дисперсия  экспоненциальной средней D[St] меньше дисперсии временного ряда :

.                                                    

Из этого следует, что при высоком значении α дисперсия экспоненциальной средней незначительно отличается от дисперсии ряда. С уменьшением α дисперсия экспоненциальной средней уменьшается, возрастает ее отличие от дисперсии ряда. Тем самым, экспоненциальная средняя начинает играть роль «фильтра», поглощающего колебания временного ряда.

Таким образом, с одной стороны, необходимо увеличивать вес более свежих наблюдений, что может быть достигнуто повышением α, с другой стороны, для сглаживания случайных отклонений величину α нужно уменьшить.

Эти два требования находятся  в противоречии. Поиск компромиссного

значения параметра  сглаживания α  составляет задачу оптимизации модели.

Часто поиск оптимального значения α осуществляется путем  перебора и в качестве оптимального выбирается такое значение, при котором  получена наименьшая дисперсия ошибки. Обычно параметр сглаживания принимается  равным в интервале от 0,1 до 0,3.

 

Прогнозирование на основе экстраполяции тренда

  Аппроксимация временных рядов  с помощью кривых роста 

Удобным средством описания одномерных временных рядов является их выравнивание с помощью тех  или иных функций времени (кривых роста). Кривая роста позволяет получить теоретические значения уровней динамического ряда. Это те уровни, которые наблюдались бы в случае полного совпадения динамики явления с кривой.

Алгоритм прогнозирования с  использованием кривых роста приведен на следующем рисунке:


 




 

 


 

 

 

 

Кривые  роста условно могут быть разделены на три класса в зависимости от того, какой тип динамики развития они хорошо описывают.

К I типу относятся  функции, используемые для описания процессов с монотонным характером развития и отсутствием пределов роста. Эти условия справедливы для многих экономических показателей, например, для большинства натуральных показателей промышленного производства.

Ко II классу относятся  кривые, описывающие процесс, который имеет предел роста в исследуемом периоде. С такими процессами часто сталкиваются в демографии, при изучении потребностей в товарах и услугах (в расчете на душу населения), при исследовании эффективности использования ресурсов и т.д.

Функции, относящиеся ко II классу, называются кривыми насыщения. Если кривые насыщения имеют точки перегиба, то они относятся к III типу кривых роста - к S-образным кривым. Эти кривые описывают как бы два последовательных лавинообразных процесса (когда прирост зависит от уже достигнутого уровня): один с ускорением развития, другой - с замедлением.

 

Рекомендации  для выбора кривых роста:

Существует несколько  практических подходов, облегчающих  процесс выбора формы кривой роста.

1. Наиболее простой  путь - это визуальный, опирающийся на графическое изображение временного ряда. Подбирают такую кривую роста, форма которой соответствует фактическому развитию процесса. Если на графике исходного ряда тенденция развития недостаточно четко просматривается, то можно провести некоторые стандартные преобразования ряда (например, сглаживание), а потом подобрать функцию, отвечающую графику преобразованного ряда. В современных пакетах статистической обработки имеется богатый арсенал стандартных преобразований данных и широкие возможности для графического изображения, в том числе в различных масштабах. Все это позволяет существенно упростить для исследователя проведение данного этапа.

2. В литературе по  статистическим методам прогнозирования  рассматривается метод последовательных  разностей, помогающий при выборе кривых параболического типа. Этот метод применим при выполнении следующих предположений: уровни временного ряда могут быть представлены в виде суммы систематической составляющей и случайной компоненты, подчиненной нормальному закону распределения с математическим ожиданием, равным 0, и постоянной дисперсией. Метод предполагает вычисление первых, вторых и т. д. разностей уровней ряда.

Например,

- для выбора прямой необходимо равенство первых разностей, т.е. цепных абсолютных приростов при t = 1,2,…n:

;

- для выбора параболы второго порядка  необходимо равенство вторых разностей временного ряда, т.е. скоростей абсолютных приростов:

   и т.д.

Расчет ведется до тех пор, пока разности не будут примерно равными. Порядок разностей принимается за степень выравнивающего полинома.

3. Существенную помощь  при выборе кривых роста из  более широкого класса функций  может оказать метод характеристик  прироста. Процедура выбора кривых  с использованием этого метода включает следующие шаги:

1) выравнивание ряда  по скользящей средней;

2) определение средних  приростов;

3) вычисление производных  характеристик прироста.

Для многих видов кривых были найдены такие преобразования приростов, которые линейно изменялись относительно t или были постоянны. В связи с этим исследование рядов характеристик приростов часто оказывает существенную помощь при определении законов развития исходных временных рядов. Данный метод является более универсальным по сравнению с методом последовательных разностей.

Таким образом, использование  этого подхода должно проходить  в два этапа. На первом - происходит ограничение приемлемых функций, исходя из содержательного анализа задачи. На втором - осуществляется расчет значений критерия и выбор на его основе наиболее подходящей кривой роста.

 

Оценка  адекватности и точности моделей

Проверка  адекватности выбранных моделей

 

Проверка  адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста) строится на анализе случайной компоненты. Случайная остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном

Модель  адекватна реальному процессу, если значения остаточной компоненты удовлетворяют свойствам случайности, независимости, а также случайная компонента подчиняется нормальному закону распределения.

При правильном выборе вида тренда отклонения от него будут носить случайный характер. Это означает, что изменение остаточной случайной величины не связано с изменением времени. Таким образом, по выборке, полученной для всех моментов времени на изучаемом интервале, проверяется гипотеза о зависимости последовательности значений et от времени, или, иначе, о наличии тенденции в ее изменении. Поэтому для проверки данного свойства может быть использован один из вероятностных критериев, например, критерий серий или Фостера-Стюарта.

Если вид функции, описывающей  систематическую составляющую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок. В условиях автокорреляции оценки параметров модели, полученные по методу наименьших квадратов, будут обладать свойствами несмещенности и состоятельности, но  эффективность этих оценок будет снижаться, следовательно, доверительные интервалы будут ненадежны.

Проверка модели на наличие автокорреляции в остатках

Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Дарбиным и Уотсоном. Критерий Дарбина-Уотсона связан с гипотезой о существовании автокорреляции первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. Значение этого критерия определяется по формуле:

          .                                                 

Величина критерия d приближенно  равна:

,                                                               

где r1- коэффициент автокорреляции первого порядка

При отсутствии автокорреляции (r1≈0) d = 2.

Применение на практике критерия Дарбина-Уотсона основано на сравнении величины d с теоретическими значениями d1 и d2, взятыми из таблицы.

 

 

 

 

При сравнении величины d с d1 и d2 возможны следующие варианты:

1) Если d < d1, то гипотеза о независимости случайных отклонений (отсутствие автокорреляции) отвергается и модель считается не адекватной;

2) Если d > d2, то гипотеза о независимости случайных отклонений не отвергается и модель считается адекватной;

3) Если d1 ≤ d ≤ d2, то нет достаточных оснований для принятия решений, т.е. величина попадает в область "неопределенности".

Рассмотренные варианты относятся к случаю, когда в  остатках имеется

положительная автокорреляция.

Оценка  точности моделей

Важнейшими характеристиками качества модели, выбранной для

прогнозирования, являются показатели ее точности. Они описывают  величины случайных ошибок, полученных при использовании модели. Чтобы  судить о качестве выбранной модели, необходимо проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность.

О точности прогноза можно  судить по величине ошибки (погрешности)

прогноза. Ошибка прогноза- величина, характеризующая расхождение между фактическим и прогнозным значением показателя.

Абсолютная ошибка прогноза определяется по формуле:     

     ,                                                               

где  - прогнозное значение показателя,

         - фактическое значение.

 

Если абсолютная и относительная ошибка больше 0, то это свидетельствует о "завышенной" прогнозной оценке, если- меньше 0, то прогноз был занижен.

На практике считается, что точной моделью является модель, для которой ошибка аппроксимации не превышает 5%.  Если ошибка находится в пределах от 5 до 10 процентов, то говорят, что точность модели удовлетворительна. Если ошибка превосходит 10%, то согласно алгоритму прогноза необходимо выбрать другую модель.

В экономическом анализе  при проведении сравнительной оценки моделей могут использоваться такие  характеристики качества модели как  дисперсия (S2) или среднеквадратическая ошибка прогноза (S):

          ;          .                     

Чем меньше значения этих характеристик, тем выше точность модели.

 

 


Прогнозирование в рядах динамики, оценка адекватности выбранного метода