Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный. 2

Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный. 2 (Решение → 47799)

Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости =0,05. Сделать выводы 2. Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок. 3. Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера. 4. Выполнить прогноз объёма продажy при прогнозном значении x, составляющем 120% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости =0,05. Сделать выводы.



Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный. 2 (Решение → 47799)

Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.1)
где , – выборочные дисперсии переменных x и y, – ковариация признаков. Соответствующие средние определяются по формулам:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.2) , MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.3)
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.4) . MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.5)
Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.1):
Таблица 1. SEQ Таблица \* ARABIC \s 1 1
x y xy
x2 y2 e2
1 5 72 360 25 5184 70,48902 1,510983 2,283069
2 8 76 608 64 5776 77,91098 -1,91098 3,651855
3 6 78 468 36 6084 72,96301 5,036994 25,37131
4 5 70 350 25 4900 70,48902 -0,48902 0,239138
5 3 67 201 9 4489 65,54104 1,45896 2,128563
6 9 80 720 81 6400 80,38497 -0,38497 0,148203
7 12 82 984 144 6724 87,80694 -5,80694 33,72051
8 4 65 260 16 4225 68,01503 -3,01503 9,090399
9 3 62 186 9 3844 65,54104 -3,54104 12,53897
10 10 90 900 100 8100 82,85896 7,14104 50,99446
Итого 65 742 5037 509 55726 742 0 140,1665
Среднее значение 6,5 74,2 503,7 50,9 5572,6 74,2
σ 2,941 8,183
σ2 8,65 66,96
По данным таблицы находим:
, ,
, ,
, ,
, ,
, . .
Таким образом, между объемом продаж (y) и расходами на рекламу (x) существует прямая, достаточно сильная корреляционная зависимость.
Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.6)
который имеет распределение Стьюдента с k=n–2 и уровнем значимости .
В нашем случае
и .
Поскольку , то коэффициент корреляции существенно отличается от нуля.
Для значимого коэффициента можно построить доверительный интервал, который с заданной вероятностью содержит неизвестный генеральный коэффициент корреляции. Для построения интервальной оценки (для малых выборок n<30), используют z-преобразование Фишера:
MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.7)
Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией



. Поэтому вначале строят доверительный интервал для M[z], а затем делают обратное z-преобразование.
Применяя z-преобразование для найденного коэффициента корреляции, получим
.
Доверительный интервал для M(z) будет иметь вид
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.8)
где t находится с помощью функции Лапласа (t)=/2. Для =0,95 имеем t=1,96. Тогда
,
или
.
Обратное z-преобразование осуществляется по формуле
MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.9)
В результате находим
.
В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции .
2. Таким образом, между переменными x и y имеет не существенная корреляционная зависимость. Будем считать, что эта зависимость является линейной. Модель парной линейной регрессии имеет вид
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.7)
где y – зависимая переменная (результативный признак), x – независимая (объясняющая) переменная,  – случайные отклонения, 0 и 1 – параметры регрессии. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.8)
где b0 и b1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.9)
где – отклонения yi от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных (1.12) является равенство нулю ее частных производных по неизвестным параметрам b0 и b1. В результате получаем систему нормальных уравнений:
MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.10)
Решая систему (1.13) , найдем
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.11)
. MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.12)
По данным таблицы (1.2) находим
;
.
Получено уравнение регрессии: