Структурные средние величины в статистическом изучении социально-экономических показателей
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ
БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ НЕФТЕГАЗОВЫЙ УНИВЕРСИТЕТ»
Институт Менеджмента и бизнеса
КУРСОВАЯ РАБОТА
по курсу: « Общая теория статистики»
на тему: «Структурные средние величины в статистическом изучении социально-экономических показателей»
Выполнил: ст. гр. ЭП-10-2
Ксеник В.Н.
Руководитель: Назмутдинова Е.В.
к.э.н., доцент
Тюмень, 2011
Содержание
Введение
1. Виды и область применения
различных видов средних
2. Структурные средние
в статистическом изучении
2.1. Понятие и расчет
структурных средних
2.2.Графическое определение
моды и медианы
2.3.Выбор показателя центра
распределения вариационного
3.Использование средних
структурных показателей для
выбранного объекта
Заключение
Список литературы
Введение
Средние показатели являются наиболее распространённой формой статистических показателей, используемых в социально-экономических исследованиях.
Средним называется обобщающий показатель статистической совокупности, характеризующий наиболее типичный уровень явления. Он выражает величину признака, отнесённую к единице совокупности.
Особенности средних показателей заключаются в том, что они, во-первых, отражают то общее, что присуще всем единицам совокупности; во-вторых, в них взаимопогашаются те отклонения значений признака, которые возникают под воздействием случайных факторов. Это означает, что средний показатель отражает типичный уровень признака, формирующийся под воздействием основных доминирующих неслучайных факторов.
Применение средних величин позволяет охарактеризовать определенный признак совокупности одним числом, несмотря на то, что у разных единиц совокупности значения признака отличны друг от друга.
В ходе работы рассмотрены средние величины, их виды, свойства и принципы применения, также уделяется внимание структурным средним.
3
1. Виды и область
применения различных видов
Средняя величина – это обобщающая величина изучаемого признака в исследуемой совокупности, которая отражает его типичный уровень в расчете на единицу совокупности в конкретных условиях места и времени.
Средние величины относятся к обобщающим статистическим показателям, которые дают сводную характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака.
Средняя величина отражает
то общее, что характерно для всех
единиц изучаемой совокупности. В
то же время она уравновешивает влияние
всех факторов, действующих на величину
признака отдельных единиц совокупности,
как бы взаимно погашая их. Уровень
любого общественного явления
Для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием
4
научно обоснованного
применения средних величин и
предполагает тесную связь метода средних
величин и метода группировок
в анализе социально-
Необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:
- качественная однородность совокупности, по которой вычислена средняя величина.
- исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов
- при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показатель, на который она должна быть ориентирована.
Средняя величина, рассчитанная в целом по совокупности, называется общей средней - отражает общие черты изучаемого явления; средние величины, рассчитанные для каждой группы групповыми средними - дают характеристику явления, складывающуюся в конкретных условиях данной группы.
1.1 Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины
Средние величины делятся на 2 больших вида:
степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая и др.). Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Если рассчитывать все виды степенных средних для одних и тех же данных, то их значения окажутся одинаковыми. Тогда действует правило мажорантности средних: с увеличением показателя степени средних увеличивается и сама
5
средняя величина ( ).
структурные средние (мода, медиана). Мода и медиана определяются лишь структурой распределения. Поэтому их именуют "структурными позиционными средними". Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.
Для наглядности наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в Таблице 1.
Таблица 1 Виды степенных средних
Вид степенной средней |
Показатель степени |
Формула расчета | |
Простая |
Взвешенная | ||
1. Гармоническая |
-1 |
|
, где |
2. Геометрическая |
0 |
|
|
3. Арифметическая |
1 |
|
|
Средняя арифметическая величина представляет собой такое среднее значение признака, при вычислении которого общий объем признака в
6
совокупности сохраняется неизменным. Для того чтобы исчислить среднюю арифметическую, необходимо сумму всех значений признаков разделить на их число. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц. Примером средней арифметической может служить общий фонд заработной платы.
Средняя арифметическая простая величина равна простой сумме отдельных значений осредняемого признака, деленной на общее число этих значений. Она применяется в тех случаях, когда имеются несгруппированные индивидуальные значения признака.
Средняя арифметическая взвешенная – это средняя их вариант, которые повторяются различное число раз или имеют различный вес.
Основные свойства средней арифметической:
- Если индивидуальные значения признака, т.е. варианты, уменьшить или увеличить в i раз, то среднее значение нового признака соответственно уменьшится или увеличится в i раз.
- Если все варианты осредняемого признака уменьшить или увеличить на число А, то средняя арифметическая соответственно уменьшится или увеличится на это же число.
- Если веса всех осредняемых вариантов уменьшить или увеличить в k раз, то средняя арифметическая не изменится.
- Сумма отклонений отдельных значений признака (вариант) от средней арифметической равна нулю.
Прежде чем выполнять расчет средней величины необходимо преобразовать интервальный ряд в дискретный. Для этого находят середину интервала в каждой группе. Ее определяют делением суммы верхней и нижней 7
границы пополам.
Формула средней гармонической взвешенной величины применяется когда информация не содержит частот по отдельным вариантам x совокупности, а представлена как произведение . Для того чтобы исчислить среднюю, необходимо обозначить , откуда . Теперь преобразуем формулу средней арифметической таким образом, чтобы по имеющимся данным x и m можно было исчислить среднюю. В формулу средней арифметической взвешенной вместо подставим m, а вместо f – отношение , и таким образом получим формулу средней гармонической взвешенной.
Средняя гармоническая простая величина применяется в тех случаях, когда вес каждого варианта равен единице, т.е. ,
Средняя геометрическая величина применяется в тех случаях, когда индивидуальные значения признака представляют собой относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики, т.е. характеризует средний коэффициент роста.
1.2 Структурные средние величины
Наиболее распространенной формой статистических показателей, используемой в экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Показатель в форме средней величины выражает типичные черты и дает обобщающую характеристику однотипных явлений по одному из варьирующих признаков. Он отражает уровень этого признака, отнесенный к единице 8
совокупности. Широкое применение средних объясняется тем, что они имеют ряд положительных свойств, делающих их незаменимым инструментом анализа явлений и процессов в экономике.
Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть как основные, так и случайные. Например, курс акций корпорации в основном определяется финансовыми результатами ее деятельности. В то же время, в отдельные дни и на отдельных биржах эти акции в силу сложившихся обстоятельств могут продаваться по более высокому или заниженному курсу. Сущность средней в том и заключается, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.
Типичность средней
9
однородным группам.
Как правило, средние величины рассчитываются для получения обобщенных
количественных характеристик уровня какого либо варьирующего признака по
совокупности однородных по основным свойствам единиц конкретного явления или
процесса. В статистике все средние величины обозначаются как `X. Существует
несколько видов средних величин.
Основной средней величиной является средняя степенная. Она имеет следующий вид:
(1)
где `Х - средняя величина;
X - меняющаяся величина признака варианты;
n - число признаков или вариант;
m - показатель степени средней.
В зависимости от величины показателя степени средней она принимает
следующие виды:
а). Средняя арифметическая невзвешенная, где m = 1. Она имеет вид:
(2)
б). Средняя арифметическая взвешенная. Она имеет вид:
(3)
где f - частоты или веса
10
2. Структурные
средние в статистическом
К наиболее часто используемым структурным средним относятся статистическая мода и статистическая медиана.
Статистическая мода
Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.
Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.
Статистическая медиана
Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.
Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).
2.1 Понятие и расчет структурных средних
Бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном ряду значений признака вполне определенное положение. Примерами таких
11
величин являются средние мода
(
) и медиана (
).
Мода – значение признака, которое имеет наибольшую частоту в статистическом ряду распределения.
Отыскание моды зависит от того, представлен ли варьирующий признак в виде дискретного или интервального ряда. Поиск моды в дискретном ряду происходит путем простого просматривания столбца частот. В этом столбце находится наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. Может оказаться, что два признака имеют одинаковую частоту. В этом случае ряд будет называться бимодальным.
В интервальном вариационном ряду модой приближенно считают центральный вариант интервала с наибольшей частотой. В таком ряде распределения мода вычисляется по формуле:
Где - нижняя граница модального интервала;
- модальный интервал;
- частота в модальном интервале;
- частота интервала перед
- частота интервала после
Мода широко используется в статистической практике при изучении, например, покупательского спроса, регистрации цен и т.д.
12
Медиана – это вариант, расположенный в центре ранжированного ряда.
Медиана делит ряд на две равные части – со значениями признака меньше медианы и со значениями признака больше медианы. Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда.
В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы по формуле:
,
где n – число членов ряда.
В случае четного объема ряда медиана равна средней из двух вариантов, находящихся в середине ряда.
В интервальных рядах распределения медианное значение оказывается в каком-то из интервалов признака x. Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Значение медианы вычисляется по формуле:
,где - нижняя граница медианного интервала;
- медианный интервал;
- половина от общего числа наблюдений;
- сумма наблюдений, накопленная
до начала медианного
13
- число наблюдений в медианном интервале.
Средний уровень ряда характеризует обобщенную величину абсолютных уровней. Он рассчитывается по средней хронологической, т.е. по средней исчисленной из значений, изменяющихся во времени.
Для моментных рядов динамики
с равностоящими уровнями средний
уровень определяется по формуле
средней хронологической
,
где - уровни периода, за который делается расчет;
-число уровней;
- длительность периода времени.
Для моментных рядов динамики с неравностоящими уровнями средний уровень определяется по формуле средней хронологической взвешенной моментного ряда:
14
,
где -уровни рядов динамики;
- интервал времени между
2.2.Графическое определение моды и медианы
Для определения медианы графическим методом используют накопленные частоты, по которым строится кумулятивная кривая. Вершины ординат,
14
соответствующих накопленным частотам, соединяют отрезками прямой.
Разделив пополам последнюю ординату, которая соответствует общей сумме частот и проведя к ней перпендикуляр пересечения с кумулятивной кривой, находят ординату искомого значения медианы.
Мода — значение
признака, имеющее наибольшую частоту
в статистическом ряду распределения.
Определение моды производится
разными способами, и это зависит от того,
представлен ли варьирующий признак в
виде дискретного или интервального ряда.
Нахождение моды и медианы в контрольных по статистике происходит путем обычного просматривания столбца частот. В этом столбце находят наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. В интервальном вариационном ряду модой приблизительно считают центральный вариант интервала с наибольшей частотой. В таком ряду распределения мода вычисляется по формуле:
где ХМо — нижняя граница модального
интервала;
imo — модальный интервал;
fм0, fм0-1,, fм0+1 - частоты в модальном, предыдущем
и следующем за модальным интервалах.
Модальный интервал определяется по наибольшей
частоте.
Мода широко используется в статистической
практике при анализе покупательного
спроса, регистрации цен и т. д.
15
2.3.Выбор показателя
центра распределения
К выборочным мерам центра распределения наблюдений случайной выборки принято относить выборочное среднее значение, выборочную медиану и выборочную моду.
Выборочное среднее значение – наиболее часто используемый показатель центра распределения наблюдений. Для наблюдений х(1), х(2),…., х(n) его обычно обозначают (или ) и определяют формулой
Если воспользоваться знаком Σ, то записывают в виде
Например, если в результате опроса девяти учеников на уроке литературы получены оценки 5, 3, 5, 4, 3, 4, 2, 4, 5, то среднее значение оценок
Для дискретного вариационного ряда (см. § 2) можно использовать такую формулу
По этой формуле для предыдущего примера имеем
16
Для выборок большого объема выборочное среднее значение находят лишь после построения интервального вариационного ряда по формуле
где n – общее число наблюдений, k – число интервалов, - середина i-го интервала, ni – частота в i-ом интервале.
Например, для интервального вариационного ряда из 1.3. получаем по этой формуле, что
Следует заметить, что формула для интервального вариационного ряда рекомендуется лишь для симметричного или умеренно симметричного распределения частот по интервалам.
Отметим некоторые свойства выборочных средних значений, применяемых на практике.
1) Если наблюдения выборки имеют вид cх1, cх2,…, cхn , где с – заданное число, то среднее значение имеет вид c , где - среднее значение для х1, х2,…., хn.
2) Если наблюдения выборки имеют вид х1+у1, х2+у2, … , хn+yn , то среднее значение имеет вид x‾+y‾ , где x‾+y‾ - среднее значение для наблюдений х1, х2,…., хn, а x‾+y‾- среднее значение для наблюдений y1, y2,…, yn.
17
3) Если наблюдения выборки объема n являются объединением наблюдений двух выборок объемов n1 и n2 , то выборочное среднее объединенной выборки выражается через выборочные средние x1‾;,x2‾ ее составных частей по формуле
4) Сумма отклонений результатов
наблюдений от среднего
5) Сумма квадратов отклонений
результатов наблюдений от
Выборочное среднее значение является наиболее важной характеристикой наблюдений выборки. Оно является центром рассеяния данных выборки. При сравнении двух выборок значений изучаемого признака, прежде всего, сравнивают между собой средние значения для этих выборок.
Если для наблюдений выборки х1, х2,….,
хnпостроен дискретный вариационный
ряд х(1), х(2),….,
х(n), где х(1), х(2),….,
х(n), то выборочной медианой хmed или хmed(n) назы
число, т.е. n=2k+1, то хmed=х(к+1). Если же объем n выборки четное число,
т.е. n=2k,
В этом случае хmed может не быть наблюдением выборки. Например, для выборки 1, 2, 3, 4, 5 имеем хmed =3, а для выборки 1, 2, 3, 4, 5, 6 имеем
Имеется также формула приближенного вычисления выборочной медианы хmed и для интервального вариационного ряда.
Выборочная медиана в ряде случаев имеет некоторые преимущества по сравнению с выборочным средним. Она может быть вычислена в случаях, когда вычисление выборочного среднего не возможно, например, вследствие неопределенности первого или последнего интервала группировки данных выборки в интервальном вариационном ряде.
Кроме того, выборочную медиану легко вычислять и она более устойчива по сравнению с выборочным средним при резких выбросах в наблюдениях выборки. Однако выборочная медиана имеет и свои недостатки по сравнению с выборочным средним. Например, для выборочной медианы невозможны аналоги свойств 1)-5) для выборочного среднего. Другие различия между и хmed будут ясны далее.
К выборочным характеристикам центра группирования, условно относят и выборочную моду хmоd. Выборочной модой хmоd называется наиболее часто встречающееся значение среди наблюдений выборки.
19
Например, для выборки 1, 2, 5, 5, 5, 4, 4 мода хmоd=5, а для выборки 1, 2, 5, 5, 5, 4, 4, 4 имеем две моды x(1)mod=5 ,x(2)mod=4. Таким образом, в отличие от и хmedвыборочная мода хmod может быть не единственной. В таких случаях говорят об одномодальном, двухмодульном и т.д. распределении наблюдений выборки.
Выбор , хmed и хmоd зависит, с одной стороны, от природы данных, а с другой – от того, как этот показатель будет использоваться. Для дальнейшего теоретик вероятностного и статистического анализа наиболее полезно.