Ирина Эланс

Автор который поможет с любыми образовательными и учебными заданиями

Математические методы в экономике. 2

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИАНАЛЬНОГО ОБРАЗОВАНИЯ

НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ИМ. Н.И. ЛОБАЧЕВСКОГО

Экономический факультет

Контрольная работа. Математические методы в экономике.

Вариант № 9.

Выполнил студент
заочного отделения
7МФ – 12 группы
экономического факультета
Сусленникова Дарья

Преподаватель:
Мамаева Зинаида Михайловна

Нижний Новгород, 2011 год

Задание №1

Построить модель парной регрессии, определяющую зависимость между объемом выпуска продукции Y (в тыс. р.) и затратами труда X (в чел./днях);
Оценить качество построенной модели;
Построить точечный и интервальный прогноз для X = Х_0.

Таблица №1 – Данные об объеме выпуска продукции и затратах труда.

X	2	4	6	9	12	15	18	20	22
Y	41	38	34	29	25	26	24	21	18
X₀=	16

Решение.

1. Построение модели

Предположим, что между исследуемыми показателями существует линейная зависимость:

Y = α + βX + ε.

Оценим параметры этой модели на основе метода наименьших квадратов. Уравнение оценочной модели: Ŷ = a + bX . Построим вспомогательную таблицу для расчета параметров и характеристик модели.

Таблица №2 – Вспомогательная таблица для расчета параметров и характеристик модели.

N	X	Y	X²	XY	Ŷ	e	(Y_i - Y_ср)²	(Ŷ_i - Y_ср)²	e²	(X_i - X_ср)²	Точность
1	2	41	4	82	38,8511	2,14886	157,642	108,2994	4,61759	100	5,24111
2	4	38	16	152	36,7698	1,2302	91,30864	69,3116	1,51338	64	3,23736
3	6	34	36	204	34,6885	-0,6885	30,8642	38,98778	0,47398	36	2,02489
4	9	29	81	261	31,5665	-2,5665	0,308642	9,746944	6,58669	9	8,84984
5	12	25	144	300	28,4444	-3,4444	11,8642	0	11,8642	0	13,7778
6	15	26	225	390	25,3224	0,67757	5,975309	9,746944	0,45909	9	2,60602
7	18	24	324	432	22,2004	1,79957	19,75309	38,98778	3,23847	36	7,49823
8	20	21	400	420	20,1191	0,88091	55,41975	69,3116	0,77601	64	4,19483
9	22	18	484	396	18,0377	-0,0377	109,0864	108,2994	0,00142	100	0,2097
∑	108	256	1714	2637	256	0	482,2222	452,6914	29,5308	418	47,6398
ср.	12	28,4444	190,444	293	28,4444						5,29331

Запишем систему нормальных уравнений и найдем ее решение.

b=	-1,04067
a=	40,93248
TSS=	482,2222
ESS=	452,6914
RSS=	29,53083

В результате получили следующее уравнение модели: Ŷ = 40,93-1,04X

Рисунок 1 – Зависимость объема выпуска продукции от затрат труда (маркер) и уравнение модели (прямая).

2. Оценка качества построенной модели

a) Проверка статистической значимости параметров модели

Так как модель построена на основе выборочных данных, необходима проверка статистической значимости параметров модели.

Для параметра b:

,где - остаточная оценочная дисперсия: _;

; ; ;

S_e²=4.218691; S_b²=0.010093; t_b=10.35887

Для параметра а:

; ;

S_a²=1.922072; t_a=29.52455

Теоретическое значение статистики Стьюдента t_табл =2.365 при α=0.05 и числе степеней свободы n-2=9-2=7 .

Так как для и а и b коэффициентов t_расч>t_табл , то оба параметра уравнения модели признаются статистически значимыми с вероятностью 95%.

Статистическая значимость параметра b подтверждает наличие связи между объемом выпуска продукции и затратами труда.

Построим доверительный интервал для параметра b:

Таким образом:

-1,27826

≤M(b)=β≤

-,80308

б) Проверка общего качества

Для проверки общего качества рассчитывается коэффициент детерминации R² .

_R²=0.938761

Значение R² свидетельствует о сильной связи между X и Y и при условии статистической значимости коэффициента корреляции R обеспечивает адекватность модели.

Проверим коэффициент корреляции на статистическую значимость. Найдем расчетное значение статистики Стьюдента:

, где , тогда

t_R=10.35887

что больше табличного значения t=2.365 (для α=0.05).

Следовательно, коэффициент корреляции является статистически значимым, а так как он характеризует сильную связь факторной переменной X и результативного показателя Y, модель можно считать адекватной.

Рассчитаем скорректированный коэффициент детерминации:

;

_{R²kor=0.93001}

Оба коэффициента детерминации свидетельствуют о сильной связи между факторными и результативным показателем.

Проверим статистическую значимость R² (т.е. уравнения в целом) на основе критерия Фишера.

Рассчитаем статистику Фишера:

; F=107.306 .

Табличное значение статистики F_табл (α=0.05;1,7)=5.59 . Так как расчетное значение статистики F много больше критического значения F, то модель признается адекватной и надежной с вероятностью 95%.

в) Точность модели

Точность модели определяется на основе средней относительной ошибки аппроксимации:

δ= 5.293307

Так как средняя относительная ошибка аппроксимации менее 10%, точность модели признается хорошей.

Проведенный анализ качества модели свидетельствует о том, что построена адекватная, надежная и точная модель.

3. Построение точечного и интервального прогноза для X = Х₀

Для нахождения точечного прогноза подставим X=16 в уравнение модели:

Y(16) = 40.93 – 1.0416= 24.28;

Y(16) = 24.28177

Найдем интервал разброса средних значений объема выпуска при выбранном объеме затрат труда X=16.

Для этого сначала рассчитаем выборочную дисперсию Y в точке X=16.

S²_Y(X0) = 0.630224

Построим доверительный интервал (уровень доверия 95%) для среднего значения Y при Х₀=16:

Следовательно, ожидаемое значение объема выпуска при затратах труда в 16 единиц с вероятностью 95% будет находиться в интервале: 22.4043<=M<=26.1593

Задание №2

Построить линейную модель множественной регрессии, используя Пакет анализа EXCEL. Объяснить результаты.

Таблица №3 – Начальные данные.

Y(t)	76	78	81	80	84
X₁(t)	74	72	70	66	62
X₂(t)	32	34	41	38	40

Решение.

Выбираем линейную модель: .

Найдем ее параметры и оценим качество с использованием средств ППП "EXCEL".

1. Запишем исходные данные в таблицу:

Таблица №4 – Вспомогательная таблица.

Y	X1	X2
76	74	32
78	72	34
81	70	41
80	66	38
84	62	40

2. Выбираем Данные -> Анализ данных. На экране появится окно, в котором выбираем пункт Регрессия.

В результате получаем Таблицу №5 - Вывод итогов со следующими значениями:

Вывод этогов

Регрессионная статистика
Множественный R	0,971965887
R-квадрат	0,944717686
Нормированный R-квадрат	0,889435373
Стандартная ошибка	1,008560643
Наблюдения	5

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	34,76561086	17,38280543	17,08896797	0,055282314
Остаток	2	2,03438914	1,01719457
Итого	4	36,8

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%	Нижние 95,0%	Верхние 95,0%
Y-пересечение	89,4733032	16,22695552	5,513868762	0,031353087	19,6543487	159,2922576	19,6543487	159,2922576
X1	-0,34841629	0,151701852	-2,29671745	0,148482209	-1,00113668	0,304304097	-1,0011367	0,304304097
X2	0,38642534	0,18866409	2,048218819	0,177096944	-0,42533072	1,198181401	-0,4253307	1,198181401

Дадим расшифровку результатам моделирования.

Рассмотрим регрессионную статистику (Таблица №5.1)

1. R–квадрат или квадрат коэффициента множественной корреляции (Множественный R)

R²=0.972 свидетельствует о том, что изменения зависимой переменной Y на 97.2% можно объяснить изменениями включенных в модель объясняющих переменных. То есть 97.2% вариации результирующего признака Y объясняется вариацией регрессоров X1 и X2. Другими словами, 97.2% изменений признака Y описывается регрессионным уравнением, а 2.8% – другими причинами.

2. Нормированный R–квадрат скорректированный коэффициент детерминации

Недостатком коэффициента детерминации R² является то, что он увеличивается при добавлении новых регрессоров, потому что при этом всегда увеличивается сумма ESS. Но это не обязательно означает улучшение качества регрессионной модели. Коэффициент нового регрессора может оказаться незначимым, слишком широк его доверительный интервал..

В этом смысле предпочтительнее использовать Нормированный R–квадрат. Добавление нового регрессора увеличивает ESS и как следствие R². В тоже время увеличивается знаменатель дроби для "нормированного R-квадрата" (к увеличивается на 1). Формула устроена так, что увеличивается, если только достаточно значимо возрастает сумма ESS. При добавлении или исключении из уравнения очередного регрессора нужно сравнивать с предыдущим значением.

В нашем случае R²_kor=0.889 что отличается от R² на 8.5%. Так как отличие незначительное, можно говорить о высоком доверии коэффициенту R².

3. Стандартная ошибка регрессии S=1.009

;

Исходя из формулы видно, что нельзя вычислить выборочное остаточное стандартное отклонение, когда число исходных точек равно числу коэффициентов уравнения регрессии, или меньше.

Стандартная ошибка оценки регрессии является показателем качества аппроксимации результатов наблюдений. Ее квадрат интерпретируется как дисперсия остатков, представляющая ошибку измерения, с которой любое измеренное значение Y предсказывается для данного значения X по известному уравнению. При поиске лучшей модели стоит минимизировать "Стандартную ошибку".

Дисперсионный анализ (Таблица №5.2)

Столбец df содержит число степеней свободы k. Для регрессии это число регрессоров к_рег=m=2. Для остатка это к_ост=N−(m+1) , число исходных точек минус число коэффициентов уравнения регрессии и минус свободный член. Для выборочной общей дисперсии, строка «Итого», число степеней свободы к_общ=N−1. Одна степень свободы «украдена» свободным членом регрессионного уравнения. Степени свободы связаны соотношением: к_общ= к_рег + к_ост

Столбец SS содержит суммы квадратов отклонений от среднего значения результирующего признака.

ESS - регрессионная или факторная, сумма квадратов уклонений от среднего значения результирующего признака теоретических значений, рассчитанных по регрессионному уравнению.

RSS - остаточная, сумма квадратов уклонений исходных значений от теоретических значений.

TSS - общая, сумма квадратов уклонений исходных значений от среднего значения результирующего признака. Она записана в строке «Итого».

Суммы связаны основным соотношением дисперсионного анализа: TSS = ESS + RSS.

Чем больше ESS (или чем меньше RSS), тем лучше регрессионное уравнение аппроксимирует облако исходных точек. В нашем случае RSS мала по сравнению с TSS (RSS=2.03; TSS=36.8 т.о. RSS составляет всего 5.5% от TSS) Следовательно уравнение регрессии хорошо аппроксимирует облако исходных точек.

Столбец MS содержит несмещенные выборочные дисперсии, регрессионную и остаточную, степени свободы взяты из столбца df.

F и значимость F позволяют проверить значимость уравнения регрессии. По эмпирическому значению статистики F проверяется гипотеза равенства нулю одновременно всех коэффициентов модели. Уравнение регрессии значимо на уровне α, если F>F_кр, где F_кр - табличное значение F-критерия Фишера. В нашем случае F=17.09, что больше F_кр=19.00, значит уравнение регрессии значимо.

Значимость F < 0.05, следовательно, уравнение регрессии статически значимо с вероятностью 95%.

Таблица №5.3 содержит коэффициенты для регрессоров и их оценки.

Названия строк показывают, с каким регрессором связаны рассчитанные значения.

Строка Y-пересечение не связана ни с одним регрессором, это свободный коэффициент.

Столбец Коэффициенты cодержит значения коэффициентов уравнения регрессии. Таким образом, получилось уравнение: Y=89.47-0.35X1+0.39X2.

Регрессионное уравнение должно проходить через центр облака исходных точек.

19.65≤M(b)≤159.29

Столбец Стандартная ошибка содержит выборочные стандартные отклонения по каждому коэффициенту уравнения регрессии, стандартные ошибки коэффициентов. Если стандартная ошибка больше абсолютной величины коэффициента, это коэффициент незначимый.

В нашем случае стандартная ошибка превышает абсолютное значение коэффициента лишь для регрессора X2, поэтому его следует исключить из уравнения регрессии. Но это грубый анализ. Столбец t-статистика дает более точную оценку значимости коэффициентов.

Общая причина большой стандартной ошибки – большое значение остаточной суммы квадратов уклонений RSS, малое число исходных точек n и малое значение дисперсии по X. Для отдельных регрессоров это может быть компенсировано большой дисперсией по X (она в знаменателе стандартной ошибки). Регрессоры с малыми единицами измерения – первые кандидаты на удаление. Положение может поправить нормализация исходных данных.

Столбец t-статистика содержит значения t-критерия, рассчитанные по формуле:

t_р= (Коэффициент) / (Стандартная ошибка)

Этот критерий имеет закон распределения Стьюдента с числом степеней свободы n−(k+1): число исходных точек, минус число регрессоров, минус свободный член (если есть).

В нашем случае α=0.05; n-k-1=5-2-1=2; следовательно t_табл=4.303 .

Сравнивая t_табл с t_р можно сделать выводы, что в данном случае коэффициенты регрессоров X1 и X2 статистически незначимы.

Столбец p-значение представляет вероятность того, что критическое значение статистики используемого критерия (в данном случае t-статистики Стьюдента) превысит значение, вычисленное по выборке. Решение о принятии или отклонении нулевой гипотезы принимается в результате сравнения p-значения с выбранным уровнем значимости α (в нашем случае α=0.05).

В данном случае незначимыми можно считать коэффициенты регрессоров X1 и X2, так как P(X1)=0.15>0.05; P(X2)=0.18>0.05 .

Столбцы Нижние 95% и Верхние 95% содержат границы 95%-го доверительного интервала.

Для каждого коэффициента – свои границы: Коэффициент ± t_табл × Стандартная ошибка, где t_табл =4.303 общая для всех коэффициентов.

Доверительные интервалы строятся только для статистически значимых величин. Таким образом, для свободного члена доверительный интервал будет находится в диапазоне: т.е. с надежностью 95% истинное значение параметра лежит в указанном интервале.

Задание №3

Значения показателя Y в задании №1 являются уровнями временного ряда.

Проверить наличие тренда в этом ряду.
Выбрать и построить трендовую модель.
Провести оценку ее качества.

Таблица №6 – Исходные данные.

t	1	2	3	4	5	6	7	8	9
Y	41	38	34	29	25	26	24	21	18
U		0	0	0	0	0	0	0	0
V		1	1	1	1	0	1	1	1

Математические методы в экономике. 2 📙 Контрольная → 🆔 85939