Метод корреляционно-регрессионного анализа в статистическом изучении рекламной деятельности
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ
ЗАОЧНЫЙ ФИНАНСОВО-
ФИЛИАЛ В Г. ВЛАДИМИРЕ
КАФЕДРА СТАТИСТИКИ
КУРСОВАЯ РАБОТА
по дисциплине «Статистика»
на тему:
«Метод корреляционно-регрессионного анализа в статистическом изучении рекламной деятельности»
Вариант №9
Исполнитель:
Владимир, 2012
СОДЕРЖАНИЕ
Введение…………………………………….....………
I. Теоретическая
часть…...………………………...…….…………..
1.1. Краткая характеристика рекламной деятельности………………….5
1.2. Статистическое моделирование
связи методом корреляционного и регрессионного
анализа…………………………………………………….……
II. Расчетная часть.........................
III. Аналитическая
часть.........................
Заключение....................
Список использованной литературы....................
Введение
Необходимым условием становления в России цивилизованных рыночных отношений является развитие и оптимизация инфраструктуры рынка. Рекламная деятельность — важнейшая составная часть рыночной инфраструктуры — обеспечивает ускорение реакции изменения спроса на изменение предложения и тем самым влияет в целом на повышение эффективности товарных рынков. В силу этого, особо актуальным является статистическое изучение данной сферы деятельности, так как именно статистика располагает аппаратом глубокого научного и достаточно оперативного исследования, что позволяет реально отразить закономерности ее развития. Использование статистической методологии в анализе рекламной деятельности дает ценный материал при принятии управленческих решений.
В данной курсовой работе будет подробно
рассмотрен метод корреляционно-регрессион
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
Целью курсовой работы является корреляционно-регрессионный анализ в статистическом изучении рекламной деятельности,
Исходя из цели, были обозначены следующие задачи:
- дать краткую характеристику рекламной деятельности;
- изучить основные методы изучения связи корреляционно-регрессионного анализа;
- рассмотреть статистические
Курсовая работа состоит из теоретической части, расчетной и аналитической.
В теоретической части курсовой работы подробно рассмотрено понятие рекламной деятельности, ее основные показатели и корреляционно-регрессионные методы исследования.
В расчетной части на конкретных примерах проведено статистическое исследование рекламной деятельности.
В аналитической части проведен корреляционно-регрессионный анализ рекламной деятельности на конкретном примере, используя данные предприятия.
Данная работа посвящена изучению
возможности обработки
- Теоретическая часть
1.1. Краткая характеристика рекламной деятельности
В научной литературе сложилось несколько взглядов на понятие рекламы. У.Уэллс, Д.Бернет, С. Мориарти в своей книге «Реклама: принципы и практика» отмечают, что стандартное определение рекламы включает в себя несколько элементов:
1) реклама - это оплаченная форма коммуникации;
2) сообщаемое в рекламе известие
не только оплачивается
3) в большинстве своем, реклама пытается склонить покупателя к чему-либо или повлиять на него;
4) рекламное сообщение может
передаваться несколькими
5) поскольку реклама является
одной из форм массовой
Закон РФ от 18.07.95 г. «О рекламе» дает следующее определение рекламы: « Реклама - распространяемая в любой форме, с помощью любых средств информация о физическом или юридическом лице, товарах, идеях и начинаниях (рекламная информация), которая предназначена для определенного круга лиц и призвана формировать или поддерживать интерес к этим физическому, юридическому лицу, товарам, идеям и начинаниям и способствовать реализации товаров, идей, начинаний.
Комплексное исследование рекламной деятельности заключается в:
1) изучении системы
распространения коммерческой
2) исследовании экономических аспектов производства, распространения и потребления различных видов рекламной информации;
3) анализе сети, кадров, фондов, деятельности различных фирм, организаций и их структурных подразделений, осуществляющих производство и распространение рекламной продукции (информации);
4) анализе экономической
эффективности рекламных
5) возможности
широкого использования
При реализации отмеченных этапов исследования следует учитывать, что эффективность рекламы напрямую зависит от потенциала самих продуктов или услуг, которые она «продвигает», откуда и следует сложность исследования. В связи с этим, чрезвычайно важной проблемой является использование статистических методов наблюдения и анализа, построение эконометрических моделей различных составляющих рекламной деятельности.
Именно статистика, которая располагает аппаратом глубокого научного и в то же время достаточно оперативного исследования имеет возможность отразить состояние рынка, а реклама — это один из факторов, помогающих моделировать ту или иную рыночную ситуацию. Использование статистической методологии в анализе рекламной деятельности дает ценный материал для стимулирования развития рынка.
Таким образом, справедливо утверждение: рекламная деятельность - это особый предмет статистического исследования, относящийся к более обширной зоне исследования — «статистика рынка товаров и услуг».
Статистическое моделирование связи методом корреляционного и регрессионного анализа
Изучение взаимосвязей между показателями рекламной деятельности заключается в определении формы и количественной характеристики связи, а также степени тесноты связи. Корреляционный анализ и решает эти две основные задачи.
Первая задача
заключается в определении
Предварительный этап при установлении формы связи заключается в теоретическом анализе показателей рекламной деятельности, а также в представлении искомой связи графически. График, построенный по исходным данным, позволяет приблизительно определить: есть ли какая-то связь между явлениями; ее направление (прямая или обратная); примерную тесноту связи (естественно, что при графическом анализе используются только две переменные).
Для выяснения тесноты связи между факторным и результативным признаком (при прямолинейной связи) рассчитывается показатель, называемый парным линейным коэффициентом корреляции , вычисляемый по формуле
.
Коэффициент корреляции принимает значение от -1 до +1, причем если , то корреляция прямая, если , то корреляция обратная, а если , то корреляция отсутствует полностью.
В зависимости от того, насколько приближается к единице, различают связь слабую, умеренную, заметную, высокую, тесную и весьма тесную.
Коэффициент корреляции может быть исчислен и по следующей формуле
,
где - среднее квадратическое отклонение результативного признака;
- среднее квадратическое отклонение факторного признака.
Зная линейный
коэффициент корреляции, можно определить
и параметры уравнения
.
Коэффициент корреляции применяется только в тех случаях, когда между явлениями существует прямолинейная связь. Если же связь криволинейная, то пользуются коэффициентом корреляции, вычисляемым по формуле
,
где y- исходные значения результативного показателя;
-теоретические значения;
-среднее значение y.
Имея среднее значение дисперсий, коэффициент корреляции можно вычислить как
,
где - факторная (межгрупповая) дисперсия или дисперсия воспроизводимости;
- случайная (средняя из внутригрупповых) дисперсия или остаточная дисперсия;
- общая дисперсия.
Коэффициент корреляции по своему абсолютному значению находится в пределах от 0 до 1.
Если коэффициент корреляции возвести в квадрат и выразить в процентах, получим показатель, называемый коэффициентом детерминации
D=R2∙100%.
Он показывает, на сколько процентов изменение результативного фактора зависит от изменения факторного признака. Коэффициент детерминации является наиболее конкретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного в основании группировки.
Определение формы и тесноты связи между тремя и более показателями рекламной деятельности называется множественной корреляцией. При множественной корреляции определение формы связи аналогично определению формы связи при парной корреляции, а само уравнение регрессии ищется в виде (как правило)
.
При определении тесноты связи есть свои особенности. Теснота связи измеряется множественным коэффициентом корреляции, вид которого аналогичен коэффициенту корреляции при парной связи
.
Если изучается взаимодействие только трех факторов y=f(x,z), то коэффициент множественной корреляции можно определить по формуле
,
где - парные коэффициенты корреляции.
Множественный коэффициент корреляции находится в пределах от 0 до 1.
Множественный коэффициент детерминации, равный квадрату R, выраженному в процентах, характеризует долю вариации результативного признака Y под воздействием всех изучаемых факторных признаков.
Поскольку факторные признаки действуют не изолировано, а по взаимосвязи, то может возникнуть задача определения тесноты связи между результативным признаком и одним из факторных при постоянных значениях прочих факторов. Она решается при помощи частных коэффициентов корреляции. Например, при линейной связи y=f(x,z) частный коэффициент корреляции между x и y при постоянном z вычисляется по следующей формуле
.
Частный коэффициент корреляции при изучении зависимости Y от Z при постоянном Х определяется по формуле
.
Парные коэффициенты корреляции, как правило, выше частных. Это объясняется тем, что факторы взаимно коррелируют между собой.
При значительном количестве факторов частный коэффициент корреляции можно получить по формуле
,
где - коэффициент множественной корреляции; - коэффициент множественной корреляции результативного фактора (y) со всеми за исключением исследуемого.
Таблица 1
Атрибутивные оценки тесноты выявленной зависимости переменных
Значение показателя корреляции |
Атрибутивная оценка тесноты связи |
До 0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9 и более |
Слабая Умеренная Заметная Тесная Весьма тесная |
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).
Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.
При построении моделей регрессии
должны соблюдаться следующие
1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.
2. Возможность описания
3. Все факторные признаки должны иметь количественное (числовое) выражение.
4. Наличие достаточно большого
объема исследуемой
5. Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.
6. Отсутствие количественных
7. Постоянство территориальной
и временной структуры
Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные социально-экономические явления и процессы.
Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным.
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.
Оценка параметров уравнений регрессии (а0, a1, и а2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0, a1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
где n — объем исследуемой совокупности (число единиц наблюдения).
В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1 показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:
Построение моделей
1. Выбор формы связи (уравнения регрессии);
2. Отбор факторных признаков;
3. Обеспечение достаточного объема совокупности.
Выбор типа уравнения затрудняется
тем, что для любой формы
- линейная модель
;
в частности, для двух факторных признаков линейная модель имеет вид:
;
- степенная модель
частным случаем которой является производственная функция Кобба - Дугласа
;
3) показательная модель
;
4) параболическая модель
;
5) гиперболическая модель
.
и другие виды моделей.
Важным этапом
построения уже выбранного уравнения
множественной регрессии
С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.
Проблема отбора
факторных признаков для
Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в реализации алгоритмов последовательного «включения», «исключения» или «включения-исключения» факторов в уравнение регрессии и последующей проверке их статистической значимости. Алгоритм «включения» заключается в том, что факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, на сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и алгоритм последовательного «исключения», сущность которого заключается в том, что исключаются факторы, ставшие незначимыми по статистическим критериям.
Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.
При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель ( ).
Наличие мультиколлинеарности между признаками вызывает:
- искажение величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков;
- изменение смысла экономической интерпретации коэффициентов регрессии.
В качестве причин возникновения
- изучаемые факторные признаки являются характеристикой одной и той же стороны изучаемого явления или процесса. Например: показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;
- факторные признаки являются составляющими элементами друг друга.
Например: показатели выработки продукции на одного работающего и численность работающих одновременно в модель включать нельзя, так как в основе расчета показателей лежит один и тот же показатель - численность работающих на предприятии.
- факторные признаки по экономическому смыслу дублируют друг друга.
Устранение
Вопрос о том, какой из факторов следует отбросить, решается на основании качественного, логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (у) с каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.
Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.
- Расчетная часть
Задание 1
Имеются следующие выборочные данные (выборка 5%-ная механическая) о среднедневных расходах на рекламу и числе покупателей в день по 30 однородным торговым предприятиям, тыс. руб.:
№ предприятия п/п |
Расходы на рекламу, тыс. руб. |
Число покупателей, чел. |
№ домохозяйства п/п |
Расходы на рекламу, тыс. руб. |
Число покупателей, чел. |
1 |
3,4 |
55 |
16 |
3,4 |
42 |
2 |
7,0 |
68 |
17 |
2,9 |
52 |
3 |
1,1 |
31 |
18 |
5,2 |
59 |
4 |
2,8 |
44 |
19 |
5,2 |
65 |
5 |
4,1 |
56 |
20 |
4,2 |
60 |
6 |
6,5 |
70 |
21 |
4,2 |
61 |
7 |
1,7 |
35 |
22 |
4,0 |
54 |
8 |
2,6 |
47 |
23 |
4,3 |
62 |
9 |
5,4 |
60 |
24 |
7,9 |
78 |
10 |
4,8 |
61 |
25 |
5,6 |
63 |
11 |
8,0 |
82 |
26 |
5,5 |
64 |
12 |
2,1 |
38 |
27 |
8,1 |
86 |
13 |
2,3 |
49 |
28 |
5,7 |
65 |
14 |
4,0 |
58 |
29 |
8,2 |
91 |
15 |
6,1 |
68 |
30 |
6,0 |
66 |

- Метод Крамера
- Метод Крамера
- Метод Крамера
- Метод Крылова
- Метод Лапласа для однократных интегралов
- Метод литературной герменевтики. Теория понимания Ф. Шлейермахера
- Метод магнетронного напыления покрытий с ионным ассистированием
- Метод капитализации доходов
- Метод капитализации доходов
- Метод картоидов в геграфии
- Метод касательных
- Метод касательных решения нелинейных уравнений
- Метод комбинирования телевизионных жанров
- Метод контент-анализа в исследовании политических процессов на примере российских партий