Использование корреляционно-регрессионного анализа для обработки экономических статистических данных

 

Введение 

    Обработка статистических данных уже давно  применяется в самых разнообразных видах человеческой деятельности. Вообще говоря, трудно назвать ту сферу, в которой она бы не использовалась. Но, пожалуй, ни в одной области знаний и практической деятельности обработка статистических данных не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах. Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимает корреляционный и регрессионный анализы обработки статистических данных.

    В экономических исследованиях часто  решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного  и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи  и не только выявить, но и дать им количественную оценку. Этот подход требует  вскрытия причинных зависимостей. Под  причинной зависимостью понимается такая связь между процессами, когда изменение одного из них  является следствием изменения другого.

    Основными задачами корреляционного анализа  являются оценка силы связи и проверка статистических гипотез о наличии  и силе корреляционной связи. Не все  факторы, влияющие на экономические  процессы, являются случайными величинами, поэтому при анализе экономических  явлений обычно рассматриваются  связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

    Использование возможностей современной вычислительной техники, оснащенной пакетами программ машинной обработки статистической информации на ЭВМ, делает практически  осуществимым оперативное решение  задач изучения взаимосвязи экономических показателей  методами корреляционно - регрессионного анализа.

    При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных  программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой  счетной операцией.

    Большие возможности обработки статистических данных методами корреляционного и регрессионного анализа дает пакета прикладных программ Microsoft Excel.[2,3,6] 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Роль  корреляцонно-регрессионного анализа в обработке  экономических данных 

    Корреляционный  анализ и регрессионный анализ являются смежными разделами математической статистики, и предназначаются для  изучения по выборочным данным статистической зависимости ряда величин; некоторые  из которых являются случайными. При  статистической зависимости величины не связаны функционально, но случайные величины заданы совместным распределением вероятностей. Исследование взаимосвязи случайных величин приводит к теории корреляции, как к разделу теории вероятностей и корреляционному анализу. Исследование зависимости случайных величин приводит к моделям регрессии и регрессионному анализу на базе выборочных данных. Теория вероятностей и математическая статистика представляют лишь инструмент для изучения статистической зависимости, но не ставят своей целью установление причинной связи. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление.

    Экономические данные почти всегда представлены в  виде таблиц. Числовые данные, содержащиеся в таблицах, обычно имеют между  собой явные (известные) или неявные (скрытые) связи.

    Явно  связаны показатели, которые получены методами прямого счета, т. е. вычислены  по заранее известным формулам. Например, проценты выполнения плана, уровни, удельные веса, отклонения в сумме, отклонения в процентах, темпы роста, темпы  прироста, индексы и т. д.

    Связи же второго типа (неявные) заранее  неизвестны. Однако необходимо уметь  объяснять и предсказывать (прогнозировать) сложные явления для того, чтобы  управлять ими. Поэтому специалисты  с помощью наблюдений стремятся  выявить скрытые зависимости  и выразить их в виде формул, т. е. математически смоделировать явления или процессы. Одну из таких возможностей предоставляет корреляционно-регрессионный анализ.

    Математические  модели строятся и используются для  трех обобщенных целей:

• для  объяснения;

• для  предсказания;

• для  управления.

    Представление экономических и других данных в  электронных таблицах в наши дни  стало простым и естественным. Оснащение же электронных таблиц средствами корреляционно-регрессионного анализа способствует тому, что из группы сложных, глубоко научных  и потому редко используемых, почти  экзотических методов, корреляционно-регрессионный  анализ превращается для специалиста  в повседневный, эффективный и  оперативный аналитический инструмент. Однако, в силу его сложности, освоение его требует значительно больших  знаний и усилий, чем освоение простых  электронных таблиц.

    Пользуясь методами корреляционно-регрессионного анализа, аналитики измеряют тесноту  связей показателей с помощью  коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и  др.) и различные по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти  их математическое выражение в виде регрессионной модели и оценить  статистическую значимость модели. В  экономике значимое уравнение используется, как правило, для прогнозирования  изучаемого явления или показателя.

    Регрессионный анализ называют основным методом современной  математической статистики для выявления  неявных и завуалированных связей между данными наблюдений. Электронные  таблицы делают такой анализ легко  доступным. Таким образом, регрессионные  вычисления и подбор хороших уравнений - это ценный, универсальный исследовательский  инструмент в самых разнообразных отраслях деловой и научной деятельности (маркетинг, торговля, медицина и т. д.). Усвоив технологию использования этого инструмента, можно применять его по мере необходимости, получая знание о скрытых связях, улучшая аналитическую поддержку принятия решений и повышая их обоснованность.

    Корреляционно-регрессионный  анализ считается одним из главных  методов в маркетинге, наряду с  оптимизационными расчетами, а также  математическим и графическим моделированием трендов (тенденций). Широко применяются  как однофакторные, так и множественные  регрессионные модели. [5,6] 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Корреляционно-регрессионный  анализ и его возможности 

    Корреляционный  анализ является одним из методов  статистического анализа взаимосвязи  нескольких признаков. Он определяется как метод, применяемый тогда, когда данные наблюдения можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону. Основная задача корреляционного анализа (являющаяся основной и в регрессионном анализе) состоит в оценке уравнения регрессии.

  Регрессия — зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин.

    Регрессионный анализ – это статистический метод  исследования зависимости случайной  величины Y от переменных Xj (j = 1, 2, ..., k), рассматриваемых в регрессионном  анализе как неслучайные величины независимо от истинного закона распределения Xj.

    Корреляция  – это статистическая зависимость  между случайными величинами, не имеющими строго функционального характера, при которой изменение одной  из случайных величин приводит к  изменению математического ожидания другой.

1. Парная  корреляция – связь между двумя  признаками (результативным и факторным  или двумя факторными).

2. Частная  корреляция – зависимость между  результативным и одним факторным  признаками при фиксированном  значении других факторных признаков.

3. Множественная  корреляция – зависимость результативного  и двух или более факторных  признаков, включенных в исследование.

    Корреляционный  анализ имеет своей задачей количественное определение тесноты связи между  двумя признаками (при парной связи) и между результативным признаком  и множеством факторных признаков (при многофакторной связи).

    Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя  количественную характеристику тесноты  связи между признаками, дают возможность  определить «полезность» факторных признаков при построении уравнений множественной регрессии. Величина коэффициентов корреляции служит также оценкой соответствия уравнению регрессии выявленным причинно-следственным связям.

    Первоначально исследования корреляции проводились  в биологии, а позднее распространились и на другие области, в том числе  на социально- экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия  тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. И  корреляция, и регрессия служат для  установления соотношений между  явлениями и для определения  наличия или отсутствия связи  между ними.[1,6] 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Предпосылки корреляционного  и регрессионного анализа 

    Перед рассмотрением предпосылок корреляционного  и регрессионного анализа, следует  сказать, что общим условием, позволяющим  получить более стабильные результаты при построении корреляционных и  регрессионных моделей, является требование однородности исходной информации. Эта  информация должна быть обработана на предмет аномальных, т.е. резко выделяющихся из массива данных, наблюдений. Эта  процедура выполняется за счет количественной оценки однородности совокупности по какому-либо одномерному или многомерному критерию (в зависимости от исходной информации) и имеет цель тех объектов наблюдения, у которых наилучшее (или наихудшее) условия функционирования по не зависящим или слабо зависящим  причинам.

    После обработки данных на предмет «аномальности» следует провести проверку, насколько  оставшаяся информация удовлетворяет  предпосылкам для использования  статического аппарата при построении моделей, так как даже незначительные отступления от этих предпосылок  часто сводят к нулю получаемый эффект. Следует иметь ввиду, что вероятностное  или статистическое решение любой  экономической задачи должно основываться на подробном осмыслении исходных математических понятий и предпосылок, корректности и объективности сбора исходной информации, в постоянном сочетании  с теснотой связи экономического и математико-статистического анализа.

    Для применения корреляционного анализа  необходимо, чтобы все рассматриваемые  переменные были случайными и имели  нормальный закон распределения. Причем выполнение этих условий необходимо только при вероятностной оценке выявленной тесноты связи.

    Рассмотрим  простейшие случай выявления тесноты  связи – двумерную модель корреляционного  анализа. 

    Для характеристики тесноты связи между  двумя переменными обычно пользуются парным коэффициентом корреляции.

    Парный (частный) коэффициент корреляции характеризует  тесноту линейной зависимости между  двумя переменными соответственно на фоне действия (при исключении влияния) всех остальных показателей, входящих в модель. Они изменяются в пределах от -1 до +1, причем чем, ближе коэффициент  корреляции к +1, тем сильнее зависимость  между переменными. Если коэффициент  корреляции больше 0, то связь положительная, а если меньше нуля – отрицательная.

    Если  каждая пара значений величин Х и  У чаще всего одновременно оказывается  выше (ниже) соответствующих средних  значений, то между величинами существует прямая корреляционная связь.

Если  же отклонение величины Х от среднего значения одинаково часто вызывают отклонения величины У вниз от среднего значения и при этом отклонения оказываются  все время различными, то можно  предполагать, что значение коэффициента корреляции стремится к нулю.

    Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения  и выбора начала отсчета. Это означает, что если переменные Х и У уменьшить (увеличить) в К раз либо на одно и то же число С, то коэффициент корреляции не изменится.[5,6] 
 
 
 
 
 
 
 
 
 

Пакет анализа Microsoft Excel

    В состав Microsoft Excel входит набор средств  анализа данных (так называемый пакет  анализа), предназначенный для решения  сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует  указать входные данные и выбрать  параметры; анализ будет проведен с  помощью подходящей статистической или инженерной макрофункции, а результат  будет помещен в выходной диапазон. Другие средства позволяют представить  результаты анализа в графическом  виде.

    Графические изображения используются прежде всего  для наглядного представления статистических данных, благодаря им существенно  облегчается их восприятие и понимание. Существенна их роль и тогда, когда  речь идет о контроле полноты и  достоверности исходного статистического  материала, используемого для обработки  и анализа.

    Статистические  данные приводятся в виде длинных  и сложных статистических таблиц, поэтому бывает весьма трудно обнаружить в них имеющиеся неточности и  ошибки.

    Графическое же представление статистических данных помогает легко и быстро выявить  ничем не оправданные пики и впадины, явно не соответствующие изображаемым статистическим данным, аномалии и  отклонения

    Графическое представление статистических данных является не только средством иллюстрации  статистических данных и контроля их правильности и достоверности. Благодаря  своим свойствам оно является важным средством толкования и анализа  статистических данных, а в некоторых  случаях - единственным и незаменимым  способом их обобщения и познания. В частности, оно незаменимо при  одновременном изучении нескольких взаимосвязанных экономических  явлений, так как позволяет с  первого взгляда установить существующие между ними соотношения и связи, различие и подобие, а также выявить  особенности их изменений во времени.

    Однако, чтобы эффективнее использовать графические изображения статистических данных, необходимо овладеть методикой  и техникой их построения. К этому  следует добавить, что построенное  графическое изображение статистических данных в наибольшей степени соответствует  характеру и содержанию изображаемых данных и поставленной задаче их анализа.

    Корреляция - один из инструментов пакета анализа Microsoft Excel.

Используется  для количественной оценки взаимосвязи  двух наборов данных, представленных в безразмерном виде. Коэффициент  корреляции выборки представляет собой  ковариацию двух наборов данных, деленную на произведение их стандартных отклонений.

    Корреляционный  анализ дает возможность установить ассоциированы ли наборы данных по величине, то есть: большие значения из одного набора данных связаны с  большими значениями другого набора (положительная корреляция); или, наоборот, малые значения одного набора связаны  с большими значениями другого (отрицательная  корреляция); или данные двух диапазонов никак не связаны (корреляция близка к нулю).

    Регрессия также является инструментом пакета анализа данных Microsoft Excel. Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов (один из методов теории ошибок для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки, применяется при обработке наблюдений). Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных. Например, на курс биржевых ставок влияют несколько факторов, включая такие, как время совершения сделки и ее цена. Регрессия пропорционально распределяет меру качества по этим двум факторам на основе данных функционирования курса биржевых ставок.

    Результаты  регрессии могут быть использованы для предсказания качеств новых, не совершенных еще биржевых сделок.[4,6]

    Заключение

    Наиболее  сложным этапом, завершающим регрессионный  анализ, является интерпретация полученных результатов, т.е. перевод их с языка  статистики и математики на язык экономики.

    Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к  которой относятся исследуемые  явления. Всякая интерпретация начинается со статистической оценки уравнения  регрессии в целом и оценки значимости входящих в модель факторных  признаков, т.е. с изучения, как они  влияют на величину результативного  признака. Чем больше величина коэффициента регрессии, тем значительнее влияние  данного признака на моделируемую обработку  экономических показателей. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак статистической обработки экономических показателей. Если факторный признак имеет плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается.

    Интерпретация этих знаков полностью определяется социально-экономическим содержанием  моделируемого признака. Если его  величина изменяется в сторону увеличения, то плюсовые знаки факторных признаков  имеют положительное влияние. При  изменении результативного признака в сторону снижения положительные  значения имеют минусовые знаки  факторных признаков. Если экономическая  теория подсказывает, что факторный  признак должен иметь положительное  значение, а он со знаком минус, то необходимо проверить расчеты параметров уравнения  регрессии.

    Корреляционный  и регрессионный анализ позволяет  определить зависимость между факторами, а так же проследить влияние задействованных  факторов. Эти показатели имеют широкое  применение в обработке статистических данных для достижения наилучших  экономических результатов.

    Список  литературы:

  1. Дубров А.М., Мхитарян В.С., Трошин Л.И. «Многомерные статистические методы и основы эконометрики» - М., Московский государственный университет экономики, статистики и информатики. 2001.
  2. Елисеева И.И., Юзбашев М.М. Общая теория статистики. – М.: Финансы и статистика, 2000.
  3. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2000.
  4. Горелова Г.В., Мацко И.А. Теория вероятностей и математическая статистика в примерах и задачах с применением Excel. – Ростов-на-Дону, 2002.
  5. А.А. Френкель, Е.В. Адамова «Корреляционно-регрессионный анализ в экономических приложениях»/ М., 1987.
  6. http://revolution.allbest.ru/economy/00006564_0.html
 
 
 
 
 
 

 

Использование корреляционно-регрессионного анализа для обработки экономических статистических данных