Анализ и прогнозирование количества клиентов в банке у одного сотрудника за период с 01.03.2013 по 30.03.2013

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И  НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ  УНИВЕРСИТЕТ

БЕРДСКИЙ ФИЛИАЛ

 

 

Контрольная работа

По дисциплине: «Эконометрика»

На тему: «Анализ и прогнозирование  количества клиентов в банке у  одного сотрудника  за период с 01.03.2013 по 30.03.2013»

 

Выполнила:  
Студентка 3 курса 
Группы ЭУБ-01 
Шифр: 505660104 
Добровольская П.Ю. 
Проверил: 
Джафаров К.А.

 

 

 

 

 

Бердск, 2013 г

 

Содержание

Введение 2

Теоретическая часть 7

Практическая часть 19

Вывод 32

Список использованной литературы: 34

 

 

 

Введение

 

Эконометрика — наука, изучающая количественные и качественные экономические взаимосвязи с помощью математических и статистических методов и моделей. Современное определение предмета эконометрики было выработано в уставе Эконометрического общества, которое главными целями назвало использование статистики и математики для развития экономической теории. Теоретическая эконометрика рассматривает статистические свойства оценок и испытаний, в то время как прикладная эконометрика занимается применением эконометрических методов для оценки экономических теорий. Эконометрика дает инструментарий для экономических измерений, а также методологию оценки параметров моделей микро- и макроэкономики. Кроме того, эконометрика активно используется для прогнозирования экономических процессов как в масштабах экономики в целом, так и на уровне отдельных предприятий. При этом эконометрика является частью экономической теории, наряду с макро- и микроэкономикой.

Термин «эконометрика» состоит  из двух частей: «эконо» — от «экономика» и «метрика» — от «измерение». Эконометрика входит в обширное семейство дисциплин, посвященных измерениям и применению статистических методов в различных областях науки и практики. К этому семейству относятся, в частности, биометрия, технометрика,наукометрия, психометрия, хемометрия, квалиметрия. Особняком стоит социометрия — этот термин закрепился за статистическими методами анализа взаимоотношений в малых группах, то есть за небольшой частью такой дисциплины, как статистический анализ в социологии.

Последние 10-30 лет эконометрика как научная дисциплина стремительно развивается. Увеличивается число научных публикаций и исследований с применением эконометрических моделей и методов. Доказательством всемирного признания эконометрики является присуждение за самые выдающиеся разработки в этой области Нобелевских премий по экономике Р. Фришу (1969), Л. Клейну (1980), Т. Хаавельмо (1989), Дж. Хекману и Д. Макфаддену (2000). 
Достижения современной эконометрики предъявляют высокие требования к высшему профессиональному образованию экономистов. Современное экономическое образование, держится на трех основах: макроэкономике, микроэкономике и эконометрике. Если в период плановой экономики упор делался на балансовых и оптимизационных методах исследования, то в период современной рыночной экономике высока роль эконометрических методов. 

К 1930-м годам сложились все предпосылки для выделения эконометрики в отдельную науку. Стало ясно, что для более глубокого понимания экономических процессов стоит использовать в той или иной степени статистику и математику. Возникла необходимость появления новой науки со своим предметом и методом, объединяющей все исследования в этом направлении. 29 декабря 1930 г. по инициативе И. Фишера, Р. Фриша, Я. Тинбергена, Й. Шумпетера, О. Андерсона и других ученых было создано эконометрическое общество. В 1933 г. Р. Фриш основал журнал «Эконометрика», который и сейчас имеет большое значение для развития эконометрики. А уже в 1941 г. появляется первый учебник по новой научной дисциплине, написанный Я. Тинбергеном. В 1969 г. Фриш и Тинберген стали первыми исследователями, получившими Нобелевскую премию по экономике. Как говорится в официальном сообщении нобелевского комитета: «за создание и применение динамических моделей к анализу экономических процессов».

Существует несколько эконометрических методов: 1) Регрессионный анализ — статистический метод исследования зависимости между зависимой переменной Y и одной или несколькими независимыми переменными X1,X2,...,Xp. При этом терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения. Для адекватного описания сложных внутренне неоднородных экономических процессов, как правило, применяются системы эконометрических уравнений. В более простых случаях можно использовать и простые изолированные уравнения; 2) Анализ временных рядов — совокупность математико-статистических методов анализа, предназначенных для выявления структуры временных рядов и для их прогноза. Выявление структуры временного ряда необходимо для того, чтобы построить математическую модель того явления, которое является источником анализируемого временного ряда. Прогноз будущих значений временного ряда используется при принятии решений. Прогнозирование также интересно тем, что оно рационализирует существование анализа временных рядов отдельно от экономической теории. 3) Панельные данные представляют собой прослеженные во времени пространственные микроэкономические выборки, т.е. они состоят из наблюдений одних и тех же экономических единиц, которые осуществляются в последовательные периоды времени. Панельные данные насчитывают три измерения: признаки — объекты — время. Их использование дает ряд существенных преимуществ при оценке параметров регрессионных зависимостей, так как они позволяют проводить как анализ временных рядов, так и анализ пространственных выборок. С помощью подобных данных изучают бедность, безработицу, преступность, а также оценивают результативность государственных программ в области социальной политики.

        Сегодня эконометрика  занимает достойное место в  ряду экономических наук. В мире  выпускается ряд научных журналов, полностью посвященных эконометрике, в том числе: Journal of Econometrics (Швеция), Econometric Reviews (США), Econometrica (США), Sankhya. Indian Journal of Statistics. Ser.D. Quantitative Economics (Индия), Publications Econometriques (Франция). Эконометрику изучают в ведущих мировых университетах, пришло понимание, что без эконометрических методов невозможно проводить современный макро- и микроэкономический анализ.

На русском языке также существуют специализированные журналы. К ним относятся «Прикладная эконометрика» и «Квантиль». Отдельные публикации по эконометрике появляются в журналах «Экономика и математические методы», «Вопросы статистики», «Вопросы экономики» и некоторых других.

Ранее в России по ряду причин эконометрика не была сформирована как самостоятельное направление научной и практической деятельности. Хотя в настоящее время начинают развертываться эконометрические исследования. В связи с этим начинается широкое преподавание этой дисциплины.

 

 

 

Теоретическая часть

 

Анализ  временных рядов.

 Последовательность наблюдений  некоторого показателя упорядоченных  в зависимости  от последовательно  возрастающих или убывающих значений  другого показателя называется  динамическим рядом или рядом  динамики.

        Если  в качестве показателя, в зависимости  от которого идет упорядочение  берется время, то такой ряд  называется временным рядом.

        Элементы временного ряда:

Уровни временного ряда:

Моменты времени: t = 1, 2, … n

        Структурный временной ряд. Систематические компоненты (элементы):

Тренд:

        Тренд  – если во временном ряду  имеется длительная (по времени)  тенденция к изменению показателя, то говорят, что в этом ряду  есть тренд.

        Случайная компонента (ряд остатков):

        Если  из временного ряда вычесть  регулярные компоненты, то остаток  будет называться случайной компонентой  – рядом остатков.

        Временной ряд:

Предварительный анализ и  сглаживание временного ряда.

        Предварительный  анализ – выявление и устранение  аномальных значений уравнений  ряда, а также определение наличия  тренда. 

        Аномальный  уровень – отдельное значение  уровня временного ряда, которое  не отвечает потенциальным возможностям  исследуемого показателя и оказывает  существенное влияние на значение  основных характеристик временного  ряда.

 Причины аномальных наблюдений (появления аномальных уровней):ошибки первого рода – ошибки технического порядка (при передаче информации, например) – подлежат устранению.

ошибки второго рода –  возникают из-за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически.

Для выявления аномальных уровней воспользуемся следующим  статистическим методом:  
    Метод Ирвина

  Проверяем гипотезу: сравниваем значения   (расчетное значение) и (табличное значение).

, где

 Из таблицы распределения  Ирвина берем  и сравниваем с .  Если , то уровень считается аномальным и его нужно заменить. После выявления аномальных уровней определяется их причина. Если известно, что аномальные уровни вызваны ошибкой первого рода, то они заменяются либо средним арифметическим двух соседних значений, либо соответствующими значениями, определенными по кривой аппроксимирующий данный временной ряд.

        Определение наличия тренда.

        I метод. Метод проверки разностей  средних уровней.

        Больше  подходит для монотонно изменяющихся  рядов.

        1. ряд  разбивается на равные части:

 


       +               =

        2. для  каждой из частей вычисляются  средние и дисперсии:

,  

   ,  

      3. проверяется  гипотеза о равенстве дисперсий  обеих частей с помощью критерия  Фишера:

,  
где

При уровне значимости  находим . Если

4.критерий Стьюдента: 

 

При заданном уровнем значимости и числом степеней свободы     находим табличное значение и сравниваем с расчетным. Если => тренда нет, иначе если => тренд есть.

II метод. Метод  Фостера-Стюарта.

Обладает большими возможностями  чем предыдущий метод. Он позволяет  установить кроме тренда самого ряда еще и тренд дисперсии временного ряда.

1. производится сравнение  каждого уровня временного ряда (начиная со второго) со всеми  предыдущими и определяются две  числовые характеристики.

        Для 

 

 

2. S характеризует изменение  временного ряда (принимает значения от 0 до ) , d характеризует изменение дисперсии

(принимает значения от  – ).

 

 

,  

,  

При уровне значимости и числом степеней свободы , из таблицы значений распределения Стьюдента находим и сравниваем с каждым .

        Сглаживание (выравнивание) временного ряда.

        С  целью более четко выявить  тенденцию развития в том числе  для дальнейшего применения методов  прогнозирования на основе трендовых  моделей производят сглаживание  временных рядов.

        Методы  сглаживания делятся на две  группы:

        - аналитическое  – сглаживание с использованием  кривой, проведенной между конкретными  уровнями ряда, чтобы она отображала  тенденцию, присущую ряду и,  одновременно, освобождала его от  незначительных колебаний.

        - механическое  – сглаживание отдельных уровней  с использованием фактических  значений соседних уровней.

 

        Рассмотрим  первый метод сглаживания: метод  простой скользящей средней (МПСС).

        – интервал сглаживания – сколько элементов нужно взять для сглаживания.

       

        Если  необходимо сгладить мелкие колебания,  то интервал сглаживания берут  большим. Интервал сглаживания  уменьшают, если нужно сохранить  мелкие колебания.

        При  прочих равных условиях интервал  сглаживания рекомендуется брать  нечетным.

        Для  первых   уровней выясняется их средняя арифметическая – это будет сглаженное значение уровня, находящееся в середине интервала сглаживания.

        Затем  интервал сдвигается на один  уровень вправо и повторяется  вычисление средней арифметической  и т.д.

 
 

А для первого и последнего рядов рекомендуется:

 

 

 

  Трендовые  модели.

        Существует  большое количество трендовых  моделей, которые описывают временной  ряд. 

Наиболее часто используются:

Полиномиальные;

Экспоненциальные;

S-образные кривые.

        Полиномиальные  кривые используются для приближения  (аппроксимации) и прогнозирования  временных рядов, в которых  последующее развитие не зависит  от достигнутого уровня.

        В  отличие от полиномиальных моделей,  использование моделей экспоненциальных  предполагает, что дальнейшее развитие  зависит от достигнутого уровня.

        В  экономике распространены процессы, которые сначала растут медленно, затем ускоряются, затем снова  замедляют свой рост и т.д.  
S-образные кривые применяются для описания именно этих процессов.

 

       Выбор вида кривой роста для конкретного временного ряда.

        Для  выбора вида полиномиальной кривой  используется метод конечных  разностей или метод Тинтнера.

        Ограничения  метода Тинтнера:

        - уровни  временного ряда состоят только  из двух компонент: тренд и  случайная компонента.

        - тренд  является достаточно гладким,  чтобы его можно было приближать (аппроксимировать) к полиному.

        Как  работает метод:

Вычисляются разности до порядка включительно.

  
и т.д. до порядка включительно.

        Обычно  вычисляются конечные разности  до 4-ого порядка включительно.       Затем вычисляется дисперсия:

 

 

далее производится сравнение  отклонений каждой последующей дисперсии  от предыдущей.

 

Если эти величины меньше некоторой наперед заданной положительной  величины, то степень полинома должна быть равна 

 

        После  того, как модель выбрана и  ее параметры оценены, мы должны  проверить модель на адекватность.

        Трендовая  модель считается адекватной, если  правильно отражает систематические  компоненты временного ряда.

        Эти  требования эквивалентны следующему  требованию:

         Остаточная компонента (случайная)

    (исходный  временной ряд минус найденная  модель)

Должна отвечать (соответствовать) следующим условиям (свойствам)

  1. Случайность колебаний уровней  ( - случайная величина)
  2. Соответствие распределения случайной компоненты нормальному закону распределения

( - подчиняется нормальному закону распределения)

  1. Равенство математического ожидания случайной компоненты нулю

( – при 2-ом условии = 0)

  1. Независимость значений уровней случайной компоненты (отсутствие автокорреляции)

(уровни  – независимые, т.е. внутренняя корреляция отсутствует)

 

Свойство №1. Случайность  колебаний уровней = проверка гипотезы о правильности выбора вида модели (тренда).

        Критерии проверки

        I Критерий серий

Основан на медиане выборки 

- медиана выборки 

 

(Расставить ряд   в порядке возрастания и найти середину)

Если >=>+

Если <=>-

Если ==>.

Получаем серии из плюсов и минусов. Один + => серия количества 1, затем считаем количество серия и обозначаем

Выбираем серию max длины, и обозначаем как K max.

Чтобы модель считалась адекватной и верной, должно выполняться:

 

         Если  соответствуют условиям, то с вероятностью наша выборка считается случайной, т.е. гипотеза о случайности выбранных данных будет иметь место.

        Если  хотя бы одно из условий  будет нарушено, модель считается неверной, неадекватной.

        II. критерий поворотных точек (критерий пиков).

        сравниваем с двумя соседними значениями . 
         Если , больше, чем и , то считается максимумом (+).Если , меньше, чем и , то считается максимумом (-).

         И в том и в другом случает , отличная от других, является поворотной точкой. Общее количество поворотных точек (min и max) обозначается как .

        Математическое  ожидание числа поворотных точек  определяется по таблице или по формуле: .

        Дисперсия  числа поворотных точек определяется, также, по таблице или по  формуле: 

        При  проверяется следующее условие: . Если это условие выполняется, то считается, что выборка случайная и 1ое условие выполнилось, иначе – выборка не случайная и модель не адекватна.

        Свойство  №2. Проверка соответствия распределения  случайной компоненты нормальному  закону распределения.

        1ый  способ. Это свойство может проверяться  с помощью показателей асимметрии  и эксцесса.

        Находятся  коэффициенты асимметрии и эксцесса  для ряда . Затем для этих коэффициентов находятся дисперсии по формулам:

 

 

         А далее должно выполняться  следующее условие:

 

        Если  это условие выполняется, то  второе свойство верно и распределение  случайной компоненты соответствует  нормальному закону распределения.

Если же  , модель не адекватна.

         2ой способ. Также свойство №2  может проверяться с помощью  критерия согласия .

        Последовательность  действий:

Разбиваем на группы по формуле: , где , соответственно, количество групп (но чаще всего количество групп принимается равным 6, для упрощения расчетов).

        Находим  размах вариации:

и длину интервала:    ,

Затем разбиваем нашу выборку  на интервалы:

 

 

и т.д. до

 

         После разбиения выборки на  интервалы считаем количество  значений , попадающих в интервалы (или так, чтобы .

        Находим  вероятность попадания значений  в , при этом считаем, что

 

        Т.к.  мы проверяем нормальное распределение,  то берем вместо  функцию нормального распределения:

 

        После  того, как мы нашли все вероятности  попадания в интервалы нужно  проверить условие: . Если это условие не выполняется, нужно объединять соседние интервалы так, чтобы это условие выполнилось.

 

 

 

        Свойство  №3. О равенстве математического  ожидания случайной компоненты  нулю.

        Критерий Стьюдента.

Находим значение показателя  по формуле:

 

 

         При заданном уровне значимости  и числом степеней свободы находим .

Свойство №4. Об отсутствии автокорреляции (уровни между собой не зависят).

         Критерий Добина – Уотсона.

Определяется расчетный  критерий  по формуле:

 

 

 

 

 

 

 

 

Практическая часть

        Временной  ряд (или ряд динамики) — это собранный в разные моменты времени статистический материал о значении каких либо параметров (в простейшем случае одного) исследуемого процесса. Во временном ряде каждому отчету должно быть указано время измерения или номер измерения по порядку. Временной ряд существенно отличается от простой выборки данных, так как при анализе учитывается взаимосвязь измерений со временем, а не только статистическое разнообразие и статистические характеристики выборки.

t=1, 2, … n

Yt=y1,y2,y3, …yn

     

Имеются исходные данные:

Имеются исходные данные:

Yt

t

22

1

22

2

31

3

20

4

30

5

26

6

20

7

24

8

26

9

19

10

17

11

32

12

28

13

25

14

29

15

26

16

28

17

25

18

29

19

24

20

25

21

31

22

28

23

24

24

21

25

33

26

25

27

27

28

28

29

34

30


 

t- число. с 01.03.2013 по 30.03.2013

Yt - количество клиентов одного сотрудника в банке

  1. Предварительный Анализ

 Предварительный анализ - выявление и устранение аномальных значений уровней временного ряда, а также выявление наличия тренда в исходно-временном ряду.

Аномальность уровней - отдельное  значение уровня, который не отвечает потенциальным возможностям исследуемой  системы и оказывает существенное влияние на значения основных характеристик.

Причина аномальности наблюдений - ошибки технического рода (ошибки 1 рода) и ошибки 2 рода, это ошибки, возникающие  из-за воздействия факторов, имеющих  объективный характер, но проявляющийся  эпизодически. Ошибки 1 рода подлежат устранению и выявлению, а ошибки 2 рода устранению не подлежат.

Найдем средний показатель за 30 дней:

Ytsr = 25,97

Рассчитаем среднеквадратическое отклонение (используя метод Ирвина):

σy== 4,25468

        Аномальные  уровни:

Если λt>λα, то соответствующее значение уровня является аномальным

где, λα=1.2 (табличное значение при n=30, α=0.05)

λt =

Yt

t

22

1

λt

22

2

0,00

31

3

2,12

20

4

-2,59

30

5

2,35

26

6

-0,94

20

7

-1,41

24

8

0,94

26

9

0,47

19

10

-1,65

17

11

-0,47

32

12

3,53

28

13

-0,94

25

14

-0,71

29

15

0,94

26

16

-0,71

28

17

0,47

25

18

-0,71

29

19

0,94

24

20

-1,18

25

21

0,24

31

22

1,41

28

23

-0,71

24

24

-0,94

21

25

-0,71

33

26

2,82

25

27

-1,88

27

28

0,47

28

29

0,24

34

30

1,41




 

 

       

 

 

При сравнении получившихся значений λt с табличным λα, было найдено 5 аномальных уровней, они устранению не подлежат, так как не связаны с техническими ошибками.

Определение тренда.

Метод проверки разностей  средних уровней:

Разбиваем данные на 2 группы по 15 значений, затем находим средние  величины и дисперсии для каждой группы.

Yt

t

22

1

22

2

31

3

20

4

30

5

26

6

20

7

24

8

26

9

19

10

17

11

32

12

28

13

25

14

29

15

26

16

28

17

25

18

29

19

24

20

25

21

31

22

28

23

24

24

21

25

33

26

25

27

27

28

28

29

34

30


 

Y1sr =24,73, = 1/n1-1*Σ ( Yt- Y1sr)2 =21,78095238

Y2sr =27,2,=1/n2-1*Σ ( Yt- Y2 sr) =12,45714286

Анализ и прогнозирование количества клиентов в банке у одного сотрудника за период с 01.03.2013 по 30.03.2013