Понятие вариации признака и ее значение
Российская международная академия туризма
Факультет менеджмента
и экономики туристского
Кафедра экономики и финансов
КУРСОВОЙ ПРОЕКТ
по дисциплине «Статистика»
на тему: «Понятие вариации признака и ее значение»
Выполнил студент:
3 курса группы В-33
Очно-заочной формы обучения
Тихонов Роман Михайлович
Проверил: Шариков В.И.
Оценка
Подпись
Дата
Химки
2011
Содержание
Введение…………………………………………………………
Глава 1. Показатели вариации……………………………………………...5
1.1. Понятие «вариация» ………………………………………………………5
1.2. Показатели вариации ……………………………………………………...6
1.3. Правило сложения дисперсий…………
1.4. Показатели структуры распределения…………………………………...1
1.5. Показатели формы распределения……………………………………….1
Глава 2. Расчет статистических показателей в туризме (Вариант № 13)
2.1. Задание №1 ………………………………………………………………..25
2.2. Задание №2 ……………………………………………………………..…35
Заключение……………………………………………………
Список литературы
и источников………………………………………...
Приложения……………………………………………………
Введение
При изучении явлений и процессов общественной жизни статистика встречается с разнообразной вариацией (изменчивостью) признаков, характеризующих отдельные единицы совокупности. Поэтому для того чтобы судить о типичности средней, ее следует дополнить показателями, характеризующими вариацию величины изучаемого признака.
Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д. Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.
Термин вариация происходит от лат. слова variation – изменение, колеблемость, различие. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.
Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты усредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом – эти отличия велики, т.е. в одном случае вариация признака мала, а в другом – велика, это имеет весьма важное значение для характеристики надежности средней величины.
Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот, - чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и показатели, характеризующие отклонения отдельных значений от общей средней.
Цель проекта: Изучить показатели вариации, их сущность и порядок расчёта.
Задачи проекта:
- Разобрать понятие вариации;
- Рассмотреть абсолютные и относительные показатели вариации,
- Изучить правило сложений дисперсии;
- Рассмотреть показатели структуры распределения;
- Исследовать показатели формы распределения.
Глава 1. Показатели вариации
1.1 Понятие «вариация»
Статистическая совокупность содержит однокачественные и в то же время варьирующие единицы в пределах изучаемой закономерности. Поэтому для того чтобы судить о типичности средней, ее следует дополнить показателями, характеризирующими величины изучаемого признака.
В этой связи обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации. Термин вариация происходит от лат. слова variation – изменение, колеблемость, различие. Различают случайную и систематическую вариацию.
Средняя величина дает обобщающую характеристику всей совокупности единиц, типический уровень признака, которым обладают все единицы. При этом два ряда распределения, имеющие одинаковую среднюю арифметическую величину , могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака (рис. 1).
Таким образом, в ряде распределения, построенные по одному и тому же признаку, могут иметь разную степень вариации этого признака при одной и той же величине его среднего уровня. Средняя величина не показывает структуру совокупности.
Исследование вариации в статистике имеет большое значение, т.к. помогает изучить сущность явления. Измерение вариации, выяснение причин, выявление влияния отдельных факторов дают важную информацию для принятия управленческих решений.
1.2 Показатели вариации
Для измерения вариации признака используются абсолютные и относительные показатели вариации. Показатели вариации рассчитываются для статистических совокупностей, упорядоченных путем группировок, классификаций, построения рядов распределения.
Расчет показателей вариации позволяет:
- дать характеристику отклонения отдельных значений признака от общей средней;
- оценить однородность статистической совокупности.
Для характеристики размера вариации в статистике применяются абсолютные показатели вариации:
- размах вариации R;
- среднее линейное отклонение ;
- дисперсия ;
- средне квадратическое отклонение .
Размах вариации R (размах колебаний) - представляет собой разность между максимальным хmax и минимальным хmin значениями признака:
Размах вариации зависит от величины только крайних значений признака и не отражает его колеблемость внутри совокупности.
Для группировок с открытыми интервалами (первым и последним), когда неизвестны реальные минимальные и максимальные значения признака, расчет размаха вариации некорректен, поэтому область его применения ограничена достаточно однородными совокупностями. В частности, на практике он применяется для контроля за качеством продукции.
Более точно характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака. Среднее линейное отклонение и среднее квадратическое отклонение показывают, насколько в среднем отличаются индивидуальные значения признака от среднего значения. Эти показатели имеют те же единицы измерения, что и варианты признака, и его средняя величина. Порядок расчёта показателей различен для сгруппированных и несгруппированных данных.
Среднее линейное отклонение - это средняя арифметическая из абсолютных значений отклонений отдельных вариантов хi признака от средней арифметической .
Расчет этого показателя производят по следующим формулам:
- для несгруппированных данных (простое):
,
где хi – индивидуальные значения признака у единицы совокупности;
- средняя величина признака в совокупности;
n – число единиц совокупности;
- для сгруппированных данных (взвешенное):
.
Простое среднее линейное отклонение вычисляется в случае, когда каждый вариант повторяется один раз, а расчет взвешенного среднего линейного отклонения производится на основе вариационного ряда с неравными частотами.
В расчетах по указанным формулам отклонения представлены без учета знака. Это объясняется тем, что по свойству средней арифметической сумма отклонений индивидуальных значений признака от средней равна нулю. Поэтому сфера применения среднего линейного отклонения как меры вариации признака ограничена, за исключением тех случаев, когда суммирование показателей без учета знаков имеет экономический смысл. В связи с этим более широкое распространение в качестве показателей степени вариации получило среднее квадратическое отклонение .
Дисперсия - это средний квадрат отклонений значений признака от их средней величины. В зависимости от исходных данных дисперсию можно вычислять по средней арифметической простой или взвешенной по следующим формулам:
- для несгруппированных данных(простая):
;
- для сгруппированных данных (взвешеная):
.
Свойства дисперсии.
Дисперсия обладает рядом свойств, которые позволяют упростить ее вычисления:
1)дисперсия постоянной величины равна нулю;
2)дисперсия не изменится (это означает, что дисперсия не зависит от начала отсчета), если все варианты значений признака уменьшить на одно и тоже число С.
3)дисперсия уменьшится (увеличится) в к2 раз (это означает, что величина дисперсии зависит от масштаба измерения исследуемого признака), если все варианты значений признака уменьшить (увеличить) в к раз;
4)дисперсия
алгебраической суммы
;
5) минимальность дисперсии: , т.е. для любого постоянного числа, не равного средней арифметической, справедливо равенство
.
Дисперсия не дает представления об
однородности совокупности, по ней
трудно сделать экономическую интерпретацию,
так как она рассчитывается в
квадратных
единицах. Эту проблему можно решить, рассчитав
среднее квадратическое отклонение.
В процессе расчетов следует помнить, что размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются именованными величинами, т.е. имеют туже единицу измерения, что и изучаемый признак. Дисперсия единицы измерения не имеет.
Среднее квадратическое отклонение является абсолютной мерой вариации и представляет собой корень квадратный из дисперсии:
.
Смысловое содержание этого показателя такое же, как и среднего линейного отклонения: чем меньше его величина, тем однороднее совокупность и соответственно типичнее средняя величина.
Среднее квадратическое отклонение рассчитывают по следующим формулам:
- для несгруппированных данных(простая):
;
- для сгруппированных данных (взвешеная):
.
Величина часто используется в качестве единицы измерения отклонений от средней арифметической. Отклонение, выраженное называется нормированным (стандартизированным).
Величина среднего квадратического отклонения всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.
В симметричных распределениях среднее квадратическое отклонение составляет приблизительно 1,25 среднего линейного отклонения, т.е. , или .
Это соотношение зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы, единицами.
Дисперсия и среднее квадратическое отклонение являются наиболее широко применяемыми показателями вариации, т.к. они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Дисперсия также может быть разложена на составные элементы, позволяющие оценить влияние различных факторов на вариацию признака. Далее будет показано, как используются дисперсия для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д.
Для того чтобы избежать недостатков, связанных с использованием крайних значений, вместо размаха вариации применяется квартильное отклонение dk, равное
,
где Q3 и Q1 - соответственно третий и первый квартили распределения.
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.
В симметричных или умеренно асимметричных распределениях выполняется равенство . Так как на квартильное отклонение не влияют отклонения всех значений признака, то его следует применять, когда определение среднего квадратического отклонения затруднено или невозможно. Например, этот показатель может применяться для рядов распределения с открытыми интервалами, где в качестве характеристики центра распределения использовалась медиана.
Дисперсия и среднее квадратическое отклонение применяются в следующих случаях:
- расчетов, связанных с организацией выборочного наблюдения;
- оценки полученных на основе выборки статистических показате-
лей;
- построения показателей тесноты корреляционной связи.
В условиях нормального (симметричного) распределения имеется следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений (правило «трёх сигм»):
- в пределах располагается 0,683 количества наблюдений;
- в пределах располагается 0,954 количества наблюдений;
- в пределах располагается 0,997 количества наблюдений.
Отклонение можно считать максимально возможным.
Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака (или медиане). К ним относятся:
- коэффициент осцилляции:
;
- относительное линейное отклонение:
;
- относительный показатель квартильной вариации:
;
- коэффициент вариации:
.
Наиболее часто применяется коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности.
Чем больше величина коэффициента вариации , тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации приведена в следующей таблице:
Коэффициента вариации,
% |
Степень однородности совокупности |
До 30 |
Однородная |
30 - 60 |
Средняя |
60 и более |
Неоднородная |
Следует заметить, что приведенная шкала оценки однородности совокупности достаточно условна. Дело в том, что вопрос о степени интенсивности вариации каждого изучаемого признака должен решаться индивидуально, с учетом сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму. Совокупность считается однородной, если коэффициент вариации не превышает 33%.
1.3 Правило сложений дисперсий
Изучая дисперсию признака
в совокупности и проводя расчеты
с помощью общей средней, нельзя
оценить влияние отдельных
Это можно сделать с помощью метода группировок: единицы изучаемой совокупности подразделяются на однородные группы по признаку-фактору.
В случае разделения совокупности на группы по какому-либо признаку существует возможность оценки влияния этого признака-фактора на колеблемость индивидуальных значений.
Наряду с изучением вариации признака по совокупности в целом появляется возможность проследить количественные изменения признака:
1)по группам, на
которые разделяется
2)между группами.
При этом кроме общей средней для всей совокупности исчисляются:
- средние по отдельным группам (групповые или частные средние)
- три показателя дисперсии:
- общая дисперсия ;
- межгрупповая дисперсия ;
- средняя внутригрупповая дисперсия
Общая дисперсия характеризует вариацию признака во всей совокупности под влиянием всех факторов, ее вызывающих:
,
где - общая средняя арифметическая для всей совокупности.
Межгрупповая дисперсия (дисперсия групповых средних) характеризует вариацию индивидуальных значений признака под влиянием признака-фактора, лежащего в основе группировки. По сути, межгрупповая дисперсия – это мера колеблемости групповых средних вокруг общей средней :
,
где - групповая средняя (средняя по отдельной группе);
- число единиц в отдельной группе;
.
Средняя внутригрупповая дисперсия характеризует колеблемость признака в среднем внутри групп в результате влияния остальных неучтенных факторов:
,
где - внутригрупповая дисперсия отдельной группы, которая дает оценку колеблемости признака внутри каждой i-й группы.
Средняя внутригрупповая дисперсия дает обобщенную характеристку внутригрупповой колеблемости вокруг групповых средних.
Между указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий: величина общей дисперсии равна сумме межгрупповой и средней внутригрупповой дисперсии:
Это правило показывает, что общая вариация признака в совокупнсоти складывается из вариации признака внутри отдельных групп и вариации между ними.
1.4 Показатели структуры распределения
Форма распределения отражает характер последовательного изменения частот. Показатели центра распределения не вскрывают характера последовательного изменения частот fi . Поэтому для отражения особенностей структуры распределения признака в совокупности используют квантили распределения.
Квантили (градиенты) – это значения признака, занимающие определенное место (каждое четвертое, пятое, десятое и т.д.) в упорядоченном вариационном ряду. В результате квантили делят ряд распределения на равные по числу единиц части. Частыми случаями квантилей являются: квартили, децили, квинтили, перцентели.
Квартили (Q1 ,Q2 , Q3) – это значения признака, делящие ранжированный ряд на четыре равные части (рис. 2)
Следовательно, в ряду распределения выделяют три квартиля:
- первый квартиль Q1 (нижний) – отделяет ¼ часть совокупности с наименьшими значениями признака;
- второй квартиль Q2 – делит распределение пополам и совпадает с медианой Ме;
- третий квартиль Q3 (верхний) – отсекает ¼ часть совокупности с наибольшими значениями признака.
Вычисление квартилей аналогично вычислению медианы. В дискретном ряду сначала определяют положение или место квартиля:
; ; .
Затем по накопленным частотам определяют численное значение квартилей. В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют численное значение по формулам:
;
;
,
где и - нижние границы квартильных интервалов;
и - накопленные частоты предквартильных интервалов;
и - частоты квартильных интервалов.
Децили (D1, D2, …D9) – это варианты, которые делят ранжированный ряд на 10 равных частей. Вычисляются для интервального ряда в соответствии с указанными обозначениями по след схеме:
;
и т.д.
В ряду распределения выделяют девять децилей, т.к. медиана является одновременно пятым децилем. Децили находят широкое применение в анализе дифференциации различных социально-экономических явлений; вычисляются по той же схеме что и квартили.
Квинтили – это значение признака, делящие ряд на пять равных частей. Определяется по той же схеме, что и квартили и децили.
Перцентили (Р1, Р2,…, Р99) – это значения признака, делящие ряд на 100 равных частей. Схема вычисления перцентилей аналогична рассмотренной схеме для квинтелей. Очевидно что Р25 = Q1; Р50 = Q2 =Ме ; Р75 = Q3.
1.5 Показатели формы распределения
Выяснение общего характера распределения предполагает оценку степени его однородности, а также оценку формы распределения.
При этом для
обобщающей характеристики особенностей
формы распределения
распределения.
Таким образом,
теоретическое распределение
Теоретическое распределение может получиться при полном погашении случайных причин в результате увеличения числа наблюдений и уменьшения величины интервала. В статистике существует большое число теоретических распределений, но чаще всего используется симметричное (нормальное) распределение.
Если сравниваются теоретическое нормальное и эмпирическое распределение, то необходимо проверить соответствие формы распределения с помощью показателей асимметрии и эксцесса. Исследование закономерностей (формы) распределения предполагает решение 3-х задач:
- выяснение общего характера распределения;
- выравнивание эмпирического распределения – построение на основе эмпирического распределения кривой у = f(x) с заданной формой;
- проверка соответствий между полученными теоретическими и эмпирическими распределениями.
Для характеристики
формы распределения
- коэффициент асимметрии
- показатель эксцесса Еk, который отражает крутизну (островершинность) распределения.
Расчет значений этих показателей основан на применение моментов распределения.
Моменты распределения.
Для подробного описания особенностей распределения используются дополнительные характеристики – моменты распределения.
В математической статистике моментом к-го порядка называют среднюю арифметическую к-й степени отклонений отдельных вариантов xi от некоторой постоянной величины А:
,
где к – степень отклонения (порядок момента).
В зависимости от выбора постоянной величины А различают три вида моментов:
1) если А = 0, то моменты называются начальными (Мк);
2) если А = , то моменты называются центральными ( );
3) если А 0, а равно некоторой произвольной величине , то моменты называются условными (mк).
При анализе вариационных рядов практически ограничиваются расчетом моментов первых четырех порядков (приложение 1).
Однако вычисления по данным формулам достаточно громоздки. Поэтому для их упрощения используют закономерности взаимосвязи между начальными, центральными и условными моментами: