Показатели вариации и их значение в статистическом анализе. 2
Содержание
Введение 3
1. Понятие вариации и задачи ее изучения 5
2. Абсолютные и относительные показатели вариации 11
3. Виды дисперсий и правило их сложения 16
4. Расчет коэффициентов детерминации и эмпирического корреляционного отклонения 18
Заключение 26
Список
использованных
источников 28
Введение
Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно, по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.
Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.
Вариация – это основа существования мира и источник его развития. Если бы люди не делились на мужчин и женщин, человечество прекратило бы свое существование; если бы не было различных мнений – истина была бы недостижимой, а жизнь без вариаций – невыносимо скучной.
Вариация – неотъемлемая, необходимая черта, свойство массовых явлений, имеющее громадное самостоятельное значение в развитии природы и общества. Вариация присуща всем без исключения явлениями природы и общества, кроме законодательно закрепленных нормативных значений отдельных социальных признаков: не варьирует признак «число председателей правления производственного кооператива» - все они имеют по одному председателю. Не варьирующие признаки не представляют интереса для статистики, - ведь ее предметом является вариация. Большинство методов статистики – это либо методы измерения вариации, либо методы абстрагирования от нее.
По статистической структуре различаются следующие виды статистических показателей:
абсолютные величины (измеряются в натуральных, условно- натуральных и стоимостных единицах);
средние
величины (измеряются в тех
же единицах, что и усредняемые
величины)
относительные величины
Актуальность темы курсовой работы состоит в том, что вариация имеет очень глубокий практический смысл, обусловленный развитием всех сфер нашей жизни.
Цель работы – изучение показателей вариации и их значения в статистическом анализе.
Для достижения поставленной цели в курсовой работе были решены следующие задачи:
раскрыто понятие вариации и перечислены задачи ее изучения;
рассмотрены абсолютные и относительные показатели вариации;
изучены виды дисперсий и правило их сложения;
проведен расчет коэффициентов детерминации и эмпирического корреляционного отношения на основе группировки социально-экономических явлений по факторному признаку.
Предмет исследования – социально-экономические отношения, возникающие в процессе исследования показателей вариации.
Объект исследования – коэффициент детерминации и эмпирическое корреляционное отношение.
Структура
работы: введение, четыре вопроса,
заключение, список использованных
источников.
- Понятие вариации и задачи ее изучения
Вариацию можно определить как количественное различие значений одного и того же признака у отдельных единиц совокупности. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Изучение вариации в статистической практике позволяет установить зависимость между изменением, которое происходит в исследуемом признаке, и теми факторами, которые вызывают данное изменение.
Вариация - это различие в значениях, какого - либо признака у разных единиц данной совокупности в один и тот же момент времени. Величины признаков изменяются под действием различных факторов. И, следовательно, чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация.
Наличию вариации обязана своим появлением статистика. Большинство статистических закономерностей проявляется через вариацию. Изучая вариацию значений признака в сочетании с его частотными характеристиками, мы обнаруживаем закономерности распределения (например: население по возрасту, студентов по уровню оценок).
Рассматривая вариацию одного признака параллельно с изменением другого, мы обнаруживаем взаимосвязи между этими признаками или их отсутствие (например: зависимость между торговой площадью и товарооборотом).
Вариации в статистике проявляются двояко, либо через изменения значений признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности.
Изучение вариации в статистике имеет как самостоятельную цель, так и является промежуточным этапом более сложных статистических исследований.
Одна из задач показателя вариации – выявление взаимосвязи между общественными явлениями и процессами, т.е. определение степени влияния отдельных факторов на изучаемую совокупность.
Это можно сделать с помощью группировки, т.е. подразделить изучаемую совокупность на группы, однородные по факторному признаку. При этом определяются различные виды дисперсий, которые различаются в зависимости от того, какие причины оказывают влияние на колеблемость. Виды дисперсий мы рассмотрим в третьей части работы.
Изучение причинно-следственных зависимостей между фактами – важнейшая задача анализа социально-экономических явлений. Это необходимо для принятия обоснованных управленческих решений. Изучение зависимостей – это сложнейшая задача, поскольку социально-экономические явления сами по себе сложны и многообразны. Кроме того, полученные выводы носят вероятностный характер, так как они делаются на основе данных, представляющих собой выборку во времени или пространстве.
Выборка – разновидность несплошного наблюдения, позволяющего определить показатели всей совокупности (генеральной совокупности) на основе изучения ее части. При этом отобранная часть формируется с учетом положений теории вероятности и математической статистики.
Существуют два вида связи: функциональная и корреляционная, которые обусловлены двумя типами закономерности: динамической и статистической.
При функциональной зависимости величине факторного признака строго соответствует одно или несколько значений другой величины (функции). В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции (при постоянной численности рабочих). Взаимосвязанные признаки подразделяются на факторные (под их воздействием изменяются другие, зависящие от них признаки) и результативные.
При
функциональной связи изменение
результативного признака
всецело зависит от изменения
факторного признака
(1):
, (1)
где х – факторный признак;
у – результативный прихнак.
Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака.
В различных процессах, характеризующихся статистическим закономерностями, нет строгой зависимости между причиной и результатом, и обычно не предоставляется возможным выявить строгую зависимость явлений от факторов, потому что закономерности складываются под влиянием множества причин и условий.
При
корреляционной связи изменение
результативного признака
не всецело зависит от
факторного признака
, а лишь частично, так
как возможно влияние прочих
факторов
(2):
(2)
где - фактор влияния прочих факторов.
Корреляционная связь является свободной, неполной и неточной связью. Например, себестоимость величины продукции зависит от уровня производительности труда: чем выше производительность труда, тем ниже себестоимость. Но себестоимость зависит также и от ряда других факторов: стоимости сырья и материалов, топлива, электроэнергии, их расхода на единицу продукции, цеховых и общезаводских расходов и т.д. Поэтому нельзя утверждать, что при повышении производительности труда, допустим, на 10% себестоимость снизится также на 10%. Может случиться, что, несмотря на рост производительности труда, себестоимость не только не снизится, но даже несколько повысится, если на нее окажут более сильное влияние действующие в обратном направлении другие факторы.
Аналогично, можно провести рассуждения при изучении связи между производительностью труда и заработной платой. Величина заработной платы работников зависит не только от производительности труда, но и от ряда других факторов: инфляционные процесс в стране; рентабельность предприятия в целом; направление деятельности предприятия. Например, при увеличении производительности труда заработная плата рабочих предприятия может не увеличиться вследствие роста цен на сырьё. Значит, между производительностью труда и заработной платой существует корреляционная зависимость.
Корреляционная зависимость проявляется только в средних величинах и выражает соотношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.
Статистические методы изучения зависимости построены с учетом особенностей изучаемых закономерностей. Статистика изучает преимущественно стохастические связи, когда одному значению признака-фактора соответствует группа значений результативного признака. Если с изменением значений признака-фактора изменяются среднегрупповые значения результативного признака, то такие связи называют корреляционными. Не всякая стохастическая зависимость является корреляционной. Если каждому значению факторного признака соответствует строго определенное значение результативного признака, то такая зависимость функциональная. Ее называют еще полной корреляцией. Неоднозначные корреляционные зависимости называют неполной корреляцией.
По механизму взаимодействия различают:
непосредственные связи – когда причина прямо влияет на следствие;
косвенные связи – когда между причиной и следствием существуют ряд промежуточных признаков (например, влияние возраста на заработок).
По направлениям различают:
прямые связи – когда значение факторного и результативного признаков изменяются в одном направлении;
обратные связи – когда значения факторного и результативного признаков изменяются в разных направлениях.
прямолинейные (линейные) связи – выражены прямой линией;
криволинейные связи – выражены параболой, гиперболой.
По числу взаимосвязанных признаков различают:
парные связи – когда анализируется взаимосвязь двух признаков (факторного и результативного);
множественные связи – характеризуют влияние нескольких признаков на один результативный.
По силе взаимодействия различают:
слабые (заметные) связи;
сильные (тесные) связи.
Кроме перечисленных, различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна.
Таким образом, можно сказать, что вариацией называется различие значений признака у отдельных единиц изучаемой совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, т. к. помогает изучить сущность явления. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (продолжительность жизни, доходы и расходы населения и т. д.) для принятия научно-обоснованных управленческих решений. Основная задача статистики - определить наличие, направление, форму и тесноту взаимосвязи.
- Абсолютные и относительные показатели вариации
Абсолютные измерители вариации – это размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Данные показатели ограниченно пригодны для сравнительного анализа вариаций различных совокупностей. Поэтому для этих целей используются относительные показатели вариации. К ним относятся коэффициент осцилляции, относительное линейное отклонение и коэффициент вариации:
Рассмотрим, как рассчитываются абсолютные показатели вариации:
1.
Размах вариации R. Размах
вариации измеряет разность
между максимальным и минимальным
значениями варьирующего признака,
это наиболее простой способ
измерения колеблемости. Это
самый доступный по простоте
расчета абсолютный показатель,
который определяется как разность
между самым большим и самым
малым значениями признака у
единиц данной совокупности
(3):
, (3)
где Хmax – максимальное значение признака;
Хmin – минимальное значение признака.
Размах вариации (размах колебаний) – это важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.
2. Среднее линейное отклонение d, которое вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности. Эта величина определяется как средняя арифметическая из абсолютных значений отклонений от средней. Так как сумма отклонений значений признака от средней величины равна нулю, то все отклонения берутся по модулю.
Формула среднего линейного отклонения (простая) (4):
, (4)
где n – количество признаков.
Формула
среднего линейного отклонения
(взвешенная) (5):
, (5)
где f – вес, учитывающий степень важности признака.
3. При использовании показателя среднего линейного отклонения возникают определенные неудобства, связанные с тем, что приходится иметь дело не только с положительными, но и с отрицательными величинами, что побудило искать другие способы оценки вариации, чтобы иметь дело только с положительными величинами. Таким способом стало возведение всех отклонений во вторую степень. Обобщающие показатели, найденные с использованием вторых степеней отклонений, получили очень широкое распространение. К таким показателям относятся среднее квадратическое отклонение и среднее квадратическое отклонение в квадрате , которое называют дисперсией. Среднее квадратическое отклонение - это корень квадратный из суммы квадратов отклонений индивидуальных значений признака от их средней, т.е. из дисперсии.
Средняя квадратическая простая (6):
(6)
Средняя квадратическая взвешенная (7):
(7)
4. Дисперсия есть не что иное, как средний квадрат отклонений индивидуальных значений признака от его средней величины.
Формулы
дисперсии взвешенной
и простой
(8):
(8)
Расчет дисперсии можно упростить. Для этого используется способ отсчета от условного нуля (способ моментов), если имеют место равные интервалы в вариационном ряду.
Абсолютные показатели вариации, за исключением дисперсии, имеют те же единицы измерение, что и исследуемый показатель вариационного ряда. Поэтому, если экономическая интерпретация, например, среднего линейного отклонения, проста и понятна физически, то в случае с дисперсией она затруднена. Однако дисперсия рассчитывается в статистическом анализе гораздо чаще, чем другие показатели вариации. Связано это с тем, что дисперсия широко используется в таких видах статистического анализа, как корреляционный, регрессионный, дисперсионный, при оценках результатов выборочного наблюдения. Кроме того, именно с помощью дисперсии можно оценить влияние случайных и систематических факторов на формирование значений случайной величины.
Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации (V), выраженные в относительных величинах, особенно для целей сравнения колеблемости различных признаков одной и той же совокупности или для сравнения колеблемости одного и того же признака в нескольких совокупностях. Как было сказано выше, к ним относятся коэффициент осцилляции, относительное линейное отклонение и коэффициент вариации. Они могут использоваться для сравнения вариации одного и того же показателя в разных совокупностях (например, заработной платы двух рекламных агентств) или вариации разных показателей в одной совокупности (например, вариации заработной платы и возраста в одном рекламном агентстве).
Данные показатели рассчитываются как отношение размаха вариации к средней величине признака (коэффициент осцилляции), отношение среднего линейного отклонения к средней величине признака (линейный коэффициент вариации), отношение среднего квадратического отклонения к средней величине признака (коэффициент вариации) и, как правило, выражаются в процентах.
Формулы расчета относительных показателей вариации (9):
(9)
где VR - коэффициент осцилляции;
- линейный коэффициент вариации;
- коэффициент вариации.
Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака.
В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Дисперсия и среднее квадратическое отклонение недостаточно полно характеризуют колеблемость признака, т.к. показывают абсолютный размер отклонений, что затрудняет сравнение изменчивости различных признаков. Для характеристики колеблемости явлений среднее квадратическое отклонение сопоставляют с его средней величиной и выражают в процентах. Коэффициент вариации является самым распространенным относительным показателем колеблемости. Он более точно характеризует различие колеблемости признаков. По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.
Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Если значение коэффициента вариации > 33%, то совокупность неоднородна, и для дальнейшего статистического анализа следует либо исключить крайние значения признака, либо разбить совокупность на однородные группы.
Таким
образом, абсолютные и относительные
показатели вариации помогают
в своей совокупности изучить
тот или иной процесс или
явление и служат для его
характеристики с разных сторон.
И абсолютные, и относительные
показатели вариации широко
используются в изучении социально-экономических
процессов, пронизывающих всю
нашу жизнь.
- Виды дисперсий и правило их сложения
В статистическом исследовании очень часто бывает необходимо не только изучить вариации признака по всей совокупности, но и проследить количественные изменения признака по однородным группам совокупности, а также и между группами. Следовательно, помимо общей средней для всей совокупности необходимо просчитывать и частные средние величины по отдельным группам.
Различают три вида дисперсий:
общая;
средняя внутригрупповая;
межгрупповая.
Общая дисперсия
(
) характеризует вариацию признака
всей совокупности под влиянием
всех тех факторов, которые
обусловили данную вариацию.
Эта величина определяется по
формуле (10):
(10)
где - общая средняя арифметическая всей исследуемой совокупности.
Средняя внутригрупповая
дисперсия (
) свидетельствует о случайной
вариации, которая может возникнуть
под влиянием каких-либо неучтенных
факторов и которая не зависит
от признака-фактора, положенного
в основу группировки. Данная
дисперсия рассчитывается следующим
образом: сначала рассчитываются
дисперсии по отдельным группам
(
), затем рассчитывается средняя
внутригрупповая дисперсия
(11):
(11)
где ni - число единиц в группе
Межгрупповая дисперсия
(дисперсия групповых средних)
характеризует систематическую
вариацию, т.е. различия в
величине исследуемого признака,
возникающие под влиянием признака-фактора,
который положен в основу
группировки. Эта дисперсия
рассчитывается по формуле (12):
(12)
где
-
средняя величина по отдельной
группе.
Все
три вида дисперсии связаны
между собой: общая дисперсия
равна сумме средней внутригрупповой
дисперсии и межгрупповой дисперсии
(13):
(13)
Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.