Математические методы в экономике. 2

     ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

     ГОСУДАРСТВЕННОЕ ОБАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИАНАЛЬНОГО  ОБРАЗОВАНИЯ 

     НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ 
ИМ. Н.И. ЛОБАЧЕВСКОГО
 

     Экономический факультет 
 

Контрольная работа. Математические методы в экономике.

Вариант № 9. 
 
 

     Выполнил  студент 
заочного отделения 
7МФ – 12 группы 
экономического факультета 
Сусленникова Дарья
 
 

     Преподаватель: 
Мамаева
Зинаида Михайловна 
 

      

Нижний  Новгород, 2011 год 

   Задание №1

  1. Построить модель парной регрессии, определяющую зависимость между объемом выпуска продукции Y (в тыс. р.) и затратами труда X (в чел./днях);
  2. Оценить качество построенной модели;
  3. Построить точечный и интервальный прогноз для X = Х0.

    Таблица №1 – Данные об объеме выпуска продукции  и затратах труда.

X 2 4 6 9 12 15 18 20 22
Y 41 38 34 29 25 26 24 21 18
X0= 16                

   Решение.

   1. Построение модели

   Предположим, что между исследуемыми показателями существует линейная зависимость:

             Y = α + β X + ε.

   Оценим  параметры этой модели на основе метода наименьших квадратов. Уравнение оценочной  модели: Ŷ = a + b X  . Построим вспомогательную таблицу для расчета параметров и характеристик модели.

    Таблица №2 – Вспомогательная  таблица для расчета  параметров и характеристик  модели.

N X Y X2 XY Ŷ e (Yi - Yср)2 i - Yср)2 e2 (Xi - Xср)2 Точность
1 2 41 4 82 38,8511 2,14886 157,642 108,2994 4,61759 100 5,24111
2 4 38 16 152 36,7698 1,2302 91,30864 69,3116 1,51338 64 3,23736
3 6 34 36 204 34,6885 -0,6885 30,8642 38,98778 0,47398 36 2,02489
4 9 29 81 261 31,5665 -2,5665 0,308642 9,746944 6,58669 9 8,84984
5 12 25 144 300 28,4444 -3,4444 11,8642 0 11,8642 0 13,7778
6 15 26 225 390 25,3224 0,67757 5,975309 9,746944 0,45909 9 2,60602
7 18 24 324 432 22,2004 1,79957 19,75309 38,98778 3,23847 36 7,49823
8 20 21 400 420 20,1191 0,88091 55,41975 69,3116 0,77601 64 4,19483
9 22 18 484 396 18,0377 -0,0377 109,0864 108,2994 0,00142 100 0,2097
108 256 1714 2637 256 0 482,2222 452,6914 29,5308 418 47,6398
ср. 12 28,4444 190,444 293 28,4444           5,29331

Запишем систему  нормальных уравнений и найдем ее решение.

   
b= -1,04067
a= 40,93248
TSS= 482,2222
ESS= 452,6914
RSS= 29,53083
 
 
 
 

   В результате получили следующее уравнение  модели: Ŷ = 40,93-1,04 X

   Рисунок 1 – Зависимость объема выпуска  продукции от затрат труда (маркер) и уравнение модели (прямая).

   2. Оценка качества  построенной модели

   a) Проверка статистической значимости параметров модели

   Так как модель построена на основе выборочных данных, необходима проверка статистической значимости параметров модели.

   Для параметра b:

       ,где           - остаточная оценочная дисперсия:      ;

    ;                                          ;                 ; 

   Se2=4.218691; Sb2=0.010093; tb=10.35887

   Для параметра а:

    ; ;     
 

   Sa2=1.922072; ta=29.52455

   Теоретическое значение статистики Стьюдента tтабл =2.365 при α=0.05 и числе степеней свободы n-2=9-2=7  .

   Так как для и а и b коэффициентов tрасч>tтабл , то оба параметра уравнения модели признаются статистически значимыми с вероятностью 95%.

   Статистическая  значимость параметра b подтверждает наличие связи между объемом выпуска продукции и затратами труда.

    Построим доверительный  интервал для параметра b: 

   Таким образом:

-1,27826 ≤M(b)=β≤ -,80308
 

   б) Проверка общего качества

    Для проверки общего качества рассчитывается коэффициент  детерминации R2 .

      

   R2=0.938761

   Значение  R2 свидетельствует о сильной связи между X и Y и при условии статистической значимости коэффициента корреляции R обеспечивает адекватность модели.

   Проверим  коэффициент корреляции  на статистическую значимость. Найдем расчетное значение статистики Стьюдента:

        , где , тогда

   tR=10.35887

   что больше табличного значения t=2.365 (для α=0.05).

   Следовательно, коэффициент корреляции является статистически  значимым, а так как он характеризует  сильную связь факторной переменной X и результативного показателя Y, модель можно считать адекватной.

   Рассчитаем  скорректированный коэффициент  детерминации:

    

   R2kor=0.93001

   Оба коэффициента детерминации свидетельствуют  о сильной связи между факторными и результативным показателем.

   Проверим  статистическую значимость R2 (т.е. уравнения в целом) на основе критерия Фишера.

   Рассчитаем  статистику Фишера:

    ;      F=107.306 .

   Табличное значение статистики  Fтабл (α=0.05;1,7)=5.59  . Так как расчетное значение статистики F много больше критического значения F, то модель признается адекватной и надежной с вероятностью 95%.

   в) Точность модели

   Точность  модели определяется на основе средней  относительной ошибки аппроксимации:

   

   δ= 5.293307

   Так как средняя относительная ошибка аппроксимации менее 10%, точность модели признается хорошей.

   Проведенный анализ качества модели свидетельствует  о том, что построена адекватная, надежная и точная модель.

   3. Построение точечного  и интервального  прогноза для X = Х0

   Для нахождения точечного прогноза подставим  X=16 в уравнение модели:

   Y(16) = 40.93 – 1.04 16= 24.28;

   Y(16) = 24.28177

   Найдем  интервал разброса средних значений объема выпуска при выбранном  объеме затрат труда X=16.

   Для этого сначала рассчитаем выборочную дисперсию Y в точке X=16.

     S2Y(X0) = 0.630224 
 
 

Построим  доверительный интервал (уровень  доверия 95%) для среднего значения Y при Х0=16:

   

   Следовательно, ожидаемое значение объема выпуска  при затратах труда в 16 единиц с  вероятностью 95% будет находиться в  интервале: 22.4043<=M<=26.1593 

   Задание №2

   Построить линейную модель множественной регрессии, используя Пакет анализа EXCEL. Объяснить результаты.

    Таблица №3 – Начальные  данные.

Y(t) 76 78 81 80 84
X1(t) 74 72 70 66 62
X2(t) 32 34 41 38 40

   Решение.

   Выбираем  линейную модель:   .

   Найдем  ее параметры и оценим качество с  использованием средств ППП "EXCEL".

   1. Запишем исходные данные в  таблицу:

    Таблица №4 – Вспомогательная  таблица.

Y X1 X2
76 74 32
78 72 34
81 70 41
80 66 38
84 62 40
 

   2. Выбираем Данные -> Анализ данных. На экране появится окно, в котором выбираем пункт Регрессия.

   В результате получаем Таблицу №5 - Вывод итогов со следующими значениями: 
 
 
 
 
 
 
 
 
 

Вывод этогов

Регрессионная статистика
Множественный R 0,971965887
R-квадрат 0,944717686
Нормированный R-квадрат 0,889435373
Стандартная ошибка 1,008560643
Наблюдения 5
 
Дисперсионный анализ  
  df SS MS F Значимость F
Регрессия 2 34,76561086 17,38280543 17,08896797 0,055282314
Остаток 2 2,03438914 1,01719457    
Итого 4 36,8      
 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 89,4733032 16,22695552 5,513868762 0,031353087 19,6543487 159,2922576 19,6543487 159,2922576
X1 -0,34841629 0,151701852 -2,29671745 0,148482209 -1,00113668 0,304304097 -1,0011367 0,304304097
X2 0,38642534 0,18866409 2,048218819 0,177096944 -0,42533072 1,198181401 -0,4253307 1,198181401
 
 
 
 
 
 
 
 
 
 
 

   Дадим расшифровку результатам моделирования.

   Рассмотрим  регрессионную статистику (Таблица  №5.1)

   1. R–квадрат или квадрат коэффициента множественной корреляции (Множественный R)

   

   R2=0.972 свидетельствует о том, что изменения зависимой переменной Y на 97.2% можно объяснить изменениями включенных в модель объясняющих переменных. То есть 97.2% вариации результирующего признака Y объясняется вариацией регрессоров X1 и X2. Другими словами, 97.2% изменений признака Y описывается регрессионным уравнением, а 2.8% – другими причинами.

   2. Нормированный R–квадрат скорректированный коэффициент детерминации

   

   Недостатком коэффициента детерминации R2 является то, что он увеличивается при добавлении новых регрессоров, потому что при этом всегда увеличивается сумма ESS. Но это не обязательно означает улучшение качества регрессионной модели. Коэффициент нового регрессора может оказаться незначимым, слишком широк его доверительный интервал..

   В этом смысле предпочтительнее использовать Нормированный R–квадрат. Добавление нового регрессора увеличивает ESS и как следствие R2. В тоже время увеличивается знаменатель дроби для "нормированного R-квадрата" (к увеличивается на 1). Формула устроена так, что увеличивается, если только достаточно значимо возрастает сумма ESS. При добавлении или исключении из уравнения очередного регрессора нужно сравнивать с предыдущим значением.

   В нашем случае R2kor=0.889 что отличается от R2 на 8.5%. Так как отличие незначительное, можно говорить о высоком доверии коэффициенту R2 .

   3. Стандартная ошибка регрессии  S=1.009

       ;

   Исходя  из формулы видно, что нельзя вычислить  выборочное остаточное стандартное  отклонение, когда число исходных точек равно числу коэффициентов  уравнения регрессии, или меньше.

   Стандартная ошибка оценки регрессии  является показателем качества аппроксимации результатов наблюдений. Ее квадрат интерпретируется как дисперсия остатков, представляющая ошибку измерения, с которой любое измеренное значение Y предсказывается для данного значения X по известному уравнению. При поиске лучшей модели стоит минимизировать "Стандартную ошибку".

   Дисперсионный анализ (Таблица №5.2)

   Столбец df содержит число степеней свободы k. Для регрессии это число регрессоров крег=m=2. Для остатка это кост=N−(m+1) , число исходных точек минус число коэффициентов     уравнения регрессии и минус свободный член. Для выборочной общей дисперсии, строка «Итого», число степеней свободы кобщ=N−1. Одна степень свободы «украдена» свободным членом регрессионного уравнения. Степени свободы связаны соотношением: кобщ= крег + кост

   Столбец SS содержит суммы квадратов отклонений от среднего значения результирующего признака.

   ESS -  регрессионная или факторная, сумма квадратов уклонений от среднего значения результирующего признака теоретических значений, рассчитанных по регрессионному уравнению.

   RSS - остаточная, сумма квадратов уклонений исходных значений от теоретических значений.

   TSS - общая, сумма квадратов уклонений исходных значений от среднего значения результирующего признака. Она записана в строке «Итого».

   Суммы связаны основным соотношением дисперсионного анализа: TSS = ESS + RSS.

   Чем больше ESS (или чем меньше RSS), тем лучше регрессионное уравнение аппроксимирует облако исходных точек. В нашем случае RSS мала по сравнению с TSS (RSS=2.03; TSS=36.8   т.о. RSS составляет всего 5.5% от TSS) Следовательно уравнение регрессии хорошо аппроксимирует облако исходных точек.   

   Столбец MS содержит несмещенные выборочные дисперсии, регрессионную и остаточную, степени свободы взяты из столбца df.

     

   F и значимость F позволяют проверить значимость уравнения регрессии. По эмпирическому значению статистики F проверяется гипотеза равенства нулю одновременно всех коэффициентов модели.  Уравнение регрессии значимо на уровне α, если F>Fкр, где Fкр - табличное значение F-критерия Фишера. В нашем случае F=17.09, что больше Fкр=19.00, значит уравнение регрессии значимо.

   Значимость  F < 0.05, следовательно, уравнение регрессии статически значимо с вероятностью 95%.

   Таблица №5.3 содержит коэффициенты для регрессоров и их оценки.

   Названия  строк показывают, с каким регрессором  связаны рассчитанные значения.

   Строка  Y-пересечение не связана ни с одним регрессором, это свободный коэффициент.

   Столбец Коэффициенты cодержит значения коэффициентов уравнения регрессии. Таким  образом, получилось уравнение: Y=89.47-0.35X1+0.39X2.

   Регрессионное уравнение должно проходить через  центр облака исходных точек.

       19.65≤M(b)≤159.29

   Столбец Стандартная ошибка содержит выборочные стандартные отклонения по каждому коэффициенту уравнения регрессии, стандартные ошибки коэффициентов. Если стандартная ошибка больше абсолютной величины коэффициента, это коэффициент незначимый.

   В нашем случае стандартная ошибка превышает абсолютное значение коэффициента лишь для регрессора X2, поэтому его следует исключить из уравнения регрессии. Но это грубый анализ. Столбец t-статистика дает более точную оценку значимости коэффициентов.

   Общая причина большой стандартной  ошибки – большое значение остаточной суммы квадратов уклонений RSS, малое число исходных точек n и малое значение дисперсии по X. Для отдельных регрессоров это может быть компенсировано большой дисперсией по X (она в знаменателе стандартной ошибки). Регрессоры с малыми единицами измерения – первые кандидаты на удаление. Положение может поправить нормализация исходных данных.

   Столбец t-статистика содержит значения t-критерия, рассчитанные по формуле:

   tр= (Коэффициент) / (Стандартная ошибка)

   Этот  критерий имеет закон распределения  Стьюдента с числом степеней свободы  n−(k+1): число исходных точек, минус число регрессоров, минус свободный член (если есть).

   В нашем случае α=0.05; n-k-1=5-2-1=2; следовательно tтабл=4.303   .

   Сравнивая  tтабл  с  tр  можно сделать выводы, что  в данном случае коэффициенты регрессоров X1 и X2 статистически незначимы.

   Столбец p-значение представляет вероятность того, что критическое значение статистики используемого критерия (в данном случае t-статистики Стьюдента) превысит значение, вычисленное по выборке. Решение о принятии или отклонении нулевой гипотезы принимается в результате сравнения p-значения с выбранным уровнем значимости α (в нашем случае α=0.05).

   В данном случае незначимыми можно  считать коэффициенты регрессоров  X1 и X2, так как P(X1)=0.15>0.05; P(X2)=0.18>0.05   .

   Столбцы Нижние 95% и Верхние 95% содержат границы 95%-го доверительного интервала.

   Для каждого коэффициента – свои границы: Коэффициент ± tтабл  × Стандартная ошибка, где tтабл =4.303 общая для всех коэффициентов.

   Доверительные интервалы строятся только для статистически  значимых величин. Таким образом, для  свободного члена доверительный  интервал будет находится в диапазоне: т.е. с надежностью 95% истинное значение параметра лежит в указанном интервале. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

   Задание №3

   Значения  показателя Y в задании №1 являются уровнями временного ряда.

    1. Проверить наличие тренда в этом ряду.
    2. Выбрать и построить трендовую модель.
    3. Провести оценку ее качества.

      Таблица №6 – Исходные данные.

t 1 2 3 4 5 6 7 8 9
Y 41 38 34 29 25 26 24 21 18
U   0 0 0 0 0 0 0 0
V   1 1 1 1 0 1 1 1