Корреляционно-регрессионный анализ взаимосвязи рыночных процессов (на примере рынка жилья). 2
Оглавление
Введение
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики, это и определяет актуальность темы курсовой работы.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Признаки Х и Y находятся в корреляционной зависимости, если каждому значению одного признака xi соответствует определенная условная средняя другого признака.
Парная корреляционная зависимость будет линейной, если она приближенно выражается линейной функцией. Вид зависимости можно определить графически. С этой целью строятся точки с координатами (xi , ). По расположению построенных точек подбирается линия. Если это будет прямая, то связь линейная.
Целью
корреляционного анализа
Целью курсовой работы является изучение корреляционно-регрессионного анализа взаимосвязи рыночных процессов (на примере рынка жилья).
Для достижения указанной цели ставятся следующие задачи:
- Изучить теоретические аспекты корреляционно-регрессионного анализа;
- Провести решение статистических задач;
- Проанализировать жилищное строительство в РФ.
1. Теоретическая часть. Корреляционно-регрессионный анализ
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.
Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от направленности) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая. Но для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.[2, c.131]
По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.
Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.
Указанные
выше классификационные признаки наиболее
часто встречаются в
По силе различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.
Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.[4, c.112]
Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.
Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.
Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.
Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров.
Например, измеряем рост и вес человека, каждое измерение представлено точкой в двумерном пространстве:
Несмотря на то, что величины носят случайный характер, в общем наблюдается некоторая зависимость - величины коррелируют.
В данном случае это положительная корреляция (при увеличении одного параметра второй тоже увеличивается). Возможны также такие случаи:
| Отрицательная
корреляция:
|
Отсутствие
корреляции:
|
Взаимосвязь между переменными необходимо охарактеризовать численно, чтобы, например, различать такие случаи:
Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом:
Есть массив из n точек {x1,i, x2,i}
Рассчитываются средние значения для каждого параметра:
И коэффициент корреляции:
r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.[5, c.119]
Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы:
1. Коэффициент корреляции значимо отличается от нуля (т.е. есть взаимосвязь между величинами):
Тестовая статистика вычисляется по формуле:
и сравнивается с табличным значением коэффициента Стьюдента t(p = 0.95, f = ) = 1.96
Если тестовая статистика больше табличного значения, то коэффициент значимо отличается от нуля. По формуле видно, что чем больше измерений n, тем лучше (больше тестовая статистика, вероятнее, что коэффициент значимо отличается от нуля)[3, c.89]
2. Отличие между двумя коэффициентами корреляции значимо:
Тестовая статистика:
Также сравнивается с табличным значением t(p, )
Методами корреляционного анализа решаются следующие задачи:
1)
Взаимосвязь. Есть ли
2)
Прогнозирование. Если
3) Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации.
Наличие
для каждого региона данных о
социально-демографической
Рассчитанные для каждой группы значения умножаются на их долю в населении каждого региона. В результате получаются численные оценки, которые можно сравнивать с реальными значениями преступности, неестественной смертности или голосования "против всех" в каждом регионе. Далее осуществляется такое уточнение показателей для каждой группы, при котором дисперсия (сумма квадратичных отклонений для всех регионов) между модельными и реальными значениями исследуемого показателя минимальна. Эти значения рассматриваются как статистически наиболее вероятные для каждого социально-демографического слоя в населении страны. Таким образом показатели, ранее измеренные только в разрезе отдельных регионов ("средняя температура по больнице") переводятся в показатели для отдельных социально-демографических групп. Этот метод позволяет снять покров социальной анонимности с результатов голосования, статистики смертности, преступности, миграционной подвижности и других проявлений деятельной активности или социального конформизма людей. Корреляционный анализ позволил дополнительно проконтролировать полученный результат. Если модель распределения по социальному профилю действия или события обнаруживает статистически значимую связь с результатами опроса, относящимися к тому же содержательному кругу явлений, то она скорее всего характеризует реальный социальный факт, если нет - то высока вероятность артефакта, статистической игры цифр. В ходе подобного анализа была установлена отчетливая закономерность повышения вероятности неестественных причин смерти в тех регионах, где в структуре жилого фонда преобладают многоквартирные дома, не оборудованные коммунальными удобствами. Этот тип жилья, который правильнее называть бараками, наиболее характерен для территорий недавнего промышленного освоения, куда стекались деятели со всей страны, пополняя контингент "покорителей Сибири", "освоителей подземных кладовых", "строителей БАМа" и т.п.
В погоне за высоким заработком и карьерой эти люди готовы были терпеть неудобства. Большая их часть оказалась занятой в сфере недропользования, строительства и лесозаготовок, а также в промысловом хозяйстве. Соответственно, при росте численности этих групп профессий в городах или селах закономерно повышался уровень смертности от травм, убийств, самоубийств. Очевидно, что повышенная смертность от неестественных причин является следствием не столько бытовых причин, сколько социальных - такой контингент и пьет больше, и конфликтует чаще, и к природе относится как к объекту покорения.
Напротив, жители индивидуальных домов как в сельской местности, так и в городах имеют более низкие показатели смертности от неестественных причин. Статистически это обнаруживается по снижению указанной причины в структуре смертности в регионах с высокой долей индивидуальных домов (сельские усадьбы и городские - скорее пригородные "посады") в структуре жилого фонда. Это слой людей другого типа, у которых, как у кота Матроскина - "хозяйство, .... корова, .... сена в два раза больше ..." и вообще другой подход к жизненным проблемам. Обитатели городских и сельских квартир с бытовыми удобствами занимают промежуточное положение между двумя названными типами.[1, c.117]
Очень показательной для формирования портрета деятельного населения является взаимосвязь миграционной подвижности и смертности от инфекционных заболеваний. В этой группе причин смерти основную массу составляет смертность от туберкулеза, которая в условиях России является основной болезнью тюрем и лагерей. В тех регионах, из которых в последние поколения шел интенсивный отток населения, отмечается устойчивое снижение показателей смертности от этих причин. Очевидно, что уроженцы, покидавшие регион, увозили с собой риск повышенной смертности от туберкулеза, т.е. уезжали в основном те, кто чаще оседлого населения в течение последующей жизни попадал в места заключения.
С
этих позиций очень интересный феномен
обнаружен для
Еще
одним свидетельством различий в
психологической структуре
Но если в городах жилье имеет низкий уровень коммунального обустройства (бараки или пригородный посад), то доля возрастной смертности оказывается выше у сельских мужчин. Для случаев преобладания в сельском жилом фонде коммунально необустроенного жилья картина совершенно обратная - доля возрастной смертности повышается у городских мужчин и снижается у сельских.
Четкая корреляция со структурой городского жилья и зависимость знака этой корреляции от его коммунального обустройства может быть следствием процесса избирательного оттока сельских стариков в городские поселения в тех случаях, когда там имеется коммунально обустроенная жилплощадь. Эта закономерность возникает при перевозе детьми тяжело больных родителей в город, чаще - для облегчения ухода за больным человеком при наличии водопровода, отопления и канализации.[2, c.114]
Исследованные нами данные показывают, что наиболее выражен этот процесс в регионах с преобладанием малых городов. Видимо, именно в этот тип населенных пунктов взрослые дети наиболее часто забирают из села тяжело больных стариков. Напомним, что малые города являются приемником выходцев из сельской местности, менее других подверженных риску "лагерного туберкулеза", т.е. это наиболее "основательная" часть населения, безусловно, лучше других сохраняющая связи со своими сельскими корнями. Население, составляющее основную массу миграционного обмена между селом и малыми городами внутри одного региона, является ярким примером социального ядра, гармонично сочетающего и достаточную активность, и запас консерватизма.
Поскольку новообразования, а в некоторой степени и сердечно-сосудистые патологии, являются возрастными причинами смерти, они более других могут считаться естественными. Высокая доля этих причин смерти в региональной или социальной группе отражает большую частоту случаев дожития членов группы до возраста естественной смертности, которая возможна в том числе за счет их лучшей социальной адаптации. К этим категориям относятся мигранты, давно живущие на новом месте. В этой группе значительную часть составляют предпенсионные мигранты в южные районы страны - отставные военные, северяне. По большей части они уже пережили зрелый возраст высокой активности, а с ней и возраст повышенного риска смерти от несчастных случаев или "лагерного туберкулеза". Аналогичные свидетельства меньшей рискованности образа жизни отмечены для занятых в непроизводственной сфере. Эта группа населения чаще доживает до возраста естественной смертности, по сравнению с занятыми в производственной сфере.
В Московской области доля предложений в монолитно-кирпичных новостройках – 77%, на панельное домостроение приходится 23% предложений. В Москве распределение предложений новых квартир несколько иное: 37% в панельных домах и 63% в монолитно-кирпичных. При этом доля панельного домостроения резко падает с расстоянием от Москвы.
Что касается цен на новостройки, то если в Москве новые «панельные» квартиры по цене значительно уступают монолитно-кирпичным, то в Подмосковье цены на «панель» и «монолит-кирпич» практически идентичны.
Почти 70% жилья в Подмосковье возводится в зоне до 10 км от МКАД
Даже
жилье в типовой новостройке на окраине
столицы стоит дороже, чем в нетиповой
в Ближнем Подмосковье.[4, c.101]
2. Практическая часть.
Решение статистических
задач
Имеются
следующие выборочные данные (выборка
20%-ная механическая) о ценах на первичном
рынке жилья (тыс.руб. за кв.м) и среднемесячной
прибыли (млн.руб.) по 30 строительным организациям-застройщикам
одного из регионов:
| №
предприятий |
Цена на первичном рынке жилья, тыс.руб./м2 | Прибыль, млн.руб. |
| 1 | 34,4 | 0,81 |
| 2 | 33,5 | 0,71 |
| 3 | 26,9 | 0,42 |
| 4 | 33,3 | 0,70 |
| 5 | 23,0 | 0,19 |
| 6 | 27,6 | 0,43 |
| 7 | 26,8 | 0,40 |
| 8 | 27,8 | 0,42 |
| 9 | 24,2 | 0,27 |
| 10 | 29,7 | 0,46 |
| 11 | 24,9 | 0,43 |
| 12 | 26,8 | 0,34 |
| 13 | 26,7 | 0,32 |
| 14 | 29,3 | 0,50 |
| 15 | 20,6 | 0,11 |
| 16 | 29,8 | 0,55 |
| 17 | 29,4 | 0,44 |
| 18 | 30,9 | 0,61 |
| 19 | 24,8 | 0,25 |
| 20 | 24,3 | 0,28 |
| 21 | 26,5 | 0,36 |
| 22 | 32,3 | 0,70 |
| 23 | 24,6 | 0,33 |
| 24 | 32,0 | 0,68 |
| 25 | 31,1 | 0,56 |
| 26 | 28,1 | 0,47 |
| 27 | 23,6 | 0,24 |
| 28 | 35,2 | 0,86 |
| 29 | 27,3 | 0,41 |
| 30 | 21,3 | 0,15 |
Задание 1
По
исходным данным:
1.
Построить статистический ряд
распределения организаций по
признаку выручка от продажи
продукции, образовав пять
| №
предприятий |
Цена на первичном рынке жилья, тыс.руб./м2 | Прибыль, млн.руб. |
| 15 | 20,6 | 0,11 |
| 30 | 21,3 | 0,15 |
| 5 | 23,0 | 0,19 |
| 27 | 23,6 | 0,24 |
| 9 | 24,2 | 0,27 |
| 20 | 24,3 | 0,28 |
| 23 | 24,6 | 0,33 |
| 19 | 24,8 | 0,25 |
| 11 | 24,9 | 0,43 |
| 21 | 26,5 | 0,36 |
| 13 | 26,7 | 0,32 |
| 7 | 26,8 | 0,40 |
| 12 | 26,8 | 0,34 |
| 3 | 26,9 | 0,42 |
| 29 | 27,3 | 0,41 |
| 6 | 27,6 | 0,43 |
| 8 | 27,8 | 0,42 |
| 26 | 28,1 | 0,47 |
| 14 | 29,3 | 0,50 |
| 17 | 29,4 | 0,44 |
| 10 | 29,7 | 0,46 |
| 16 | 29,8 | 0,55 |
| 18 | 30,9 | 0,61 |
| 25 | 31,1 | 0,56 |
| 24 | 32,0 | 0,68 |
| 22 | 32,3 | 0,70 |
| 4 | 33,3 | 0,70 |
| 2 | 33,5 | 0,71 |
| 1 | 34,4 | 0,81 |
| 28 | 35,2 | 0,86 |
| Границы интервалов | Количество организаций | % к общему значению | Середина интервала |
| 20,6¸23,52 | 3 | 10,0 | 22,06 |
| 23,52¸26,44 | 6 | 20,0 | 24,98 |
| 26,44¸29,36 | 10 | 33,3 | 27,90 |
| 29,36¸32,28 | 6 | 20,0 | 30,82 |
| 32,28¸35,2 | 5 | 16,7 | 33,74 |
| Всего: | 30 | 100 | - |
2.
Рассчитать характеристики
Мо=26,44+2,92*(10-6)/((10-6)+(
N=(30+1)/2=16=50,5%
Ме=26,44+2,92*((10-6)/
Xср=(3*22,06+6*24,98+10*
S(хi-x)2=(22,06-28,3)2*3+(
Совокупность однородна, т.к. V<30%.
Задание 2
Установите наличие и характер связи между признаками выручка от продажи продукции и чистая прибыль, образовав пять групп с равными интервалами по обоим признакам, методами:
Исходные данные

- Корреляционно-регрессионный анализ влияния факторов на изменение уровня жизни населения
- Корреляционно-регрессионный анализ влияния факторов на показатель рентабельности
- Корреляционно-регрессионный анализ в экономических исследованиях
- Корреляционно-регрессионный анализ развития экономического роста
- Корреляционно-регрессионный анализ рентабельности продажи зерна
- Корреляционно-регрессионный анализ рынка недвижимости в г.архангельске, сегмент - продажа жилых помещений
- Корреляционно-регрессионный анализ туристических потоков
- Корреляционно-регрессионные модели
- Корреляционно-регрессионный анализ
- Корреляционно-регрессионный анализ
- Корреляционно- регрессионный анализ взаимосвязей производственных показателей фирмы
- Корреляционно-регрессионный анализ взаимосвязи производственных показателей предприятия (организации)
- Корреляционно-регрессионный анализ взаимосвязи рыночных процессов (на примере рынка жилья)
- Корреляционно-регрессионный анализ взаимосвязи рыночных процессов (на примере рынка жилья)