7.Статистическое изучение вариации социально-экономических явлений

    1. Статистическое  изучение вариации социально-

экономических явлений

1.7.1    Понятие вариации

    Вариация – это многообразие, колеблемость, изменяемость величины признака у единиц статистической совокупности. Вариация порождается комплексом условий, действующих на совокупность и ее единицы. Например, вариация доходов, получаемых гражданами, порождается различными социальными и экономическими  причинами, однако если бы все граждане имели одинаковые доходы, то необходимость в статистическом исследовании отпала бы. Отсюда следует, что именно вариация и предопределяет необходимость статистики.

    Исследование  вариации в статистике и социально-экономических  исследованиях имеет большое  значение, делая  возможным  установление разброса или вариации значений отдельных единиц совокупности, например, какие факторы и в какой степени влияют на курс акций, объем ВВП, объемы спроса и предложения, процентные ставки, финансовое положение предприятий и т.д. Определение вариации необходимо при организации выборочного наблюдения, построении статистических моделей, разработке материалов экспертных опросов и во многих других случаях.

    По  степени вариации можно судить о  многих сторонах процесса развития изучаемых  явлений, в частности об однородности совокупности, устойчивости индивидуальных значений признака, типичности средней, о взаимосвязи между признаками одного и того же явления и признаками разных явлений.

    Вариация  существует во времени и в пространстве. Под вариацией во времени подразумевают изменение значений признака в различные моменты времени (срок службы товаров длительного пользования, средняя продолжительность жизни, мнения людей и т.д.).  Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям. 

    Наличие вариации в признаках изучаемых  явлений ставит перед статистикой задачи ее исследования: определение меры вариации, ее измерение, нахождение соответствующих измерителей, показателей, характеризующих ее размеры, выявление их сущности и методов вычисления факторов, ее определяющих.

    Статистические показатели, характеризующие вариацию, широко применяются в практической деятельности. На основе показателей вариации в статистике разрабатываются другие показатели и методы изучения явлений и процессов общественной жизни – показатели тесноты связи между явлениями и их признаками, показатели оценки точности выборочного наблюдения и т.д. 
 

1.7.2     Показатели вариации

    Показатели  вариации делятся на две группы: абсолютные и относительные. К  абсолютным показателям вариации относятся:

      • размах вариации;
      • среднее линейное отклонение;
      • дисперсия;
      • среднее квадратическое отклонение.

    Относительными показателями вариации являются:

      • относительное линейное отклонение;
      • коэффициент вариации и др.

    Для иллюстрации расчетов этих показателей  воспользуемся следующими данными:

    Таблица 1.7.1

Распределение работников отрасли по

уровню  заработной платы

Заработная  плата одного работника, тыс. руб. Количество  работников,

% к итогу

до 3 13,2
3 –  5 28,6
5 –  7,5 24,9
7,5 – 10 13,6
10 –  15 12,2
15 –  25 5,7
25 –  30 1,8
Итого: 100
 

    Самым простым показателем, уже использованным выше при группировке данных, является размах вариации. Он представляет собой разность максимального и минимального значений признака:

R =

=30 – 0 = 30 тыс. руб.   (1.7.1)

    Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ. Для анализа вариации необходим и показатель, который отражает все колебания варьирующего признака, дающий обобщенную ее характеристику. В качестве такой величины можно условно принять среднюю величину из всех значений признака, так как в ней более или менее погашаются случайные отклонения от закономерного хода развития явления, и средняя тем самым отражает типичный размер признака у данной однородной совокупности единиц.

    Такая средняя называется средним линейным отклонением ( ). Оно вычисляется как средняя арифметическая из абсолютных значений отклонений вариант х и (взвешенная или простая в зависимости от исходных условий) по следующим формулам:

    (1.7.2) – простая формула;

 

    (1.7.3) – взвешенная формула;

    По  данным нашего примера определим  среднее линейное отклонение, построив для удобства расчетов вспомогательную табл. 1.7.2.

1) находим  середины интервалов ( ) по исходным данным (гр. 1) и записываем их в таблицу (гр. 3);

2) определим  произведения значений середин  интервалов ( ) на соответствующие им веса (f ) (гр. 4). В итоге получаем 7248,3. Рассчитаем среднюю величину по формуле средней арифметической взвешенной:

    Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

   (1.7.4) – простая формула;

 

   (1.7.5) – взвешенная формула;

    Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак:

   (1.7.6) – простая формула;

 

   (1.7.7) – взвешенная формула;

    Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, относительное линейное отклонение и коэффициент вариации измеряет колеблемость в относительном выражении, относительно среднего уровня, что во многих случаях является предпочтительнее.

    Относительное линейное отклонение ( ):

  (1.7.8) 

    Определим значение этого показателя по нашим  данным: 

=3,87/ 7,25*100=53,4% 

    Коэффициент вариации ( ):

   (1.7.9)

    Определим значение коэффициента вариации по нашим данным: 

=5,3/ 7,25*100=73,1%

    Рассчитанная  величина свидетельствует о значительном относительном уровне колеблемости признака. Если превышает 33%, то совокупность по рассматриваемому признаку можно считать неоднородной. 
 
 
 

    Следует отметить, что дисперсию используют не только для оценки вариации, но и  при измерении взаимосвязей, для проверки статистических гипотез и т.п.

    Дисперсия может быть рассчитана и по упрощенной формуле: 

   (1.7.10) 

    Как и любая средняя, дисперсия имеет  определенные математические свойства:

    а) если все значения признака х уменьшить (увеличить) на определенную величину, дисперсия не изменится;

    б) если все значения признака изменить в k раз, то дисперсия изменится в k раз;

    в) в случае замены частот частостями дисперсия не изменится.

     

    Статистическое  изучение вариации многих социально-экономических  явлений проводится и при помощи дисперсии альтернативного признака, вариация которого имеет два взаимоисключающих  значения – «1» (наличие данного  признака) и «0» (отсутствие его), долю вариантов, обладающих данным признаком, р, и не обладающих им q. Так как ряд р + q = 1, то средняя , а дисперсия альтернативного признака , где , n – число наблюдений, m – число единиц совокупности, обладающее данным признаком, q = 1- р. Отсюда дисперсию доли альтернативного признака можно выразить следующим образом:

    (1.7.11)

Виды  дисперсий и методы их расчета

    Для совокупности, сгруппированной по определенному признаку можно рассчитать три вида дисперсий:

  • внутригрупповую дисперсию;
  • межгрупповую дисперсию;
  • общую дисперсию.

    Внутригрупповая дисперсия оценивает колеблемость значения индивидуального признака внутри группы. Эта вариация возникает под влиянием неучтенных факторов и не зависит от признака, положенного в основу группировки. Она исчисляется следующим образом:

,   (1.7.12)

               где  - средняя по изучаемой группе (групповая средняя).

    Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка.  Средняя из внутригрупповых дисперсий определяется по формуле арифметической взвешенной: 

   (1.7.13) 

    Межгрупповая  дисперсия отражает ту часть вариации результативного признака, которая  обусловлена воздействием признака факторного. Это воздействие проявляется  в отклонении групповых средних от общей средней: 

   (1.7.14) 

    Общая дисперсия оценивает вариацию изучаемого признака, возникающего под влиянием всех факторов.

    Между рассматриваемыми видами дисперсий  существует определенная взаимосвязь, которая называется правилом сложения дисперсий:

     (1.7.15) 

    Согласно  правилу сложения дисперсий общая  дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей  за счет группировочного признака.

    Зная  любые два вида дисперсий, можно  определить или проверить правильность расчета третьего вида.

    На  основании правила сложения дисперсий  можно измерить тесноту связи  между группировочным (факторным) и  результативным признаками. Для этого рассчитывается:

    1) коэффициент детерминации: 

    (1.7.16) 

    Коэффициент детерминации показывает, какая доля вариации результативного признака объясняется вариацией признака фактора, положенного в основу группировки.

    2) эмпирическое корреляционное отношение: 

  (1.7.17) 

    Величина  показателя изменяется в пределах от 0 до 1. Чем ближе к 1, тем сильнее взаимосвязь между рассматриваемыми признаками.

    Наряду  с вариацией индивидуальных значений признака вокруг средней может наблюдаться и вариация индивидуальных долей признака вокруг средней доли. Для анализа этой вариации вычисляются следующие виды дисперсий.

    Внутригрупповая дисперсия доли определяется по следующей формуле:

    (1.7.18) 

    Средняя из внутригрупповых  дисперсий: 

   (1.7.19) 

    Межгрупповая  дисперсия: 

,  (1.7.20) 

       где   - численность единиц в отдельных группах;

                - доля изучаемого признака во всей совокупности, которая определяется по следующей формуле: 

   (1.7.21) 

    Общая дисперсия имеет вид: 

   (1.7.22) 

    Три вида дисперсии связаны между  собой следующим образом: 

   (1.7.23) 

    Данная  взаимосвязь дисперсий называется теоремой сложения дисперсии доли признака. Эта теорема широко используется в изучении колеблемости качественных признаков.

Выборочное  наблюдение

1.8.1     Понятие о выборочном  наблюдении

    В настоящее время в условиях рыночных отношений в России находит все более широкое применение наиболее совершенный и научно обоснованный способ несплошного наблюдения – выборочное наблюдение, которое используется в работе органов государственной статистики, научно-исследовательских лабораторий и предприятий. Выборочное наблюдение позволяет лучше организовать наблюдение, обеспечивает быстроту проведения, экономию труда и средств на получение и обработку информации.

    Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

    Совокупность, из которой отбираются элементы для  обследования, называют генеральной, а совокупность, которую непосредственно обследуют, – выборочной (выборка). Статистические характеристики выборочной совокупности рассматриваются как оценки соответствующих характеристик генеральной совокупности. Поскольку выборочная совокупность неточно воспроизводит структуру генеральной, то выборочные оценки также не совпадают с характеристиками генеральной совокупности. Различия между ними называют ошибками выборки.

    Как и сама выборочная характеристика, ошибка выборки является случайной  величиной и зависит:

      1. от степени вариации изучаемого признака;
    1. от численности выборочной совокупности;
    2. от способа формирования выборочной совокупности;
    3. от принятого уровня достоверности результата исследования.

    Достоверность рассчитанных по выборочным данным характеристик  в значительной степени определяется репрезентативностью выборочной совокупности, которая, в свою очередь, зависит от способа отбора единиц из генеральной совокупности. В каждом конкретном случае в зависимости от целого ряда условий, а именно, сущности исследуемого явления, объема совокупности, вариации и распределения наблюдаемых признаков, материальных и трудовых ресурсов, выбирают наиболее предпочтительную систему организации отбора, которая определяется видом, методом и способом отбора. 

    По  виду различают индивидуальный, групповой  и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.

    Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора. Различают повторный и бесповторный способы отбора при формировании выборки.

    При повторном отборе численность генеральной совокупности на каждом этапе отбора не изменяется (попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в генеральную совокупность для участия в дальнейшей процедуре отбора) и вероятность отбора каждой единицы остается постоянной.

    При бесповторном отборе вероятность попадания каждой единицы в выборку увеличивается по мере процедуры отбора (попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор). 
 

1.8.2    Способы формирования  выборочной совокупности

    Способ  отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки:

  • собственно-случайная;
  • механическая;
  • типическая;
  • серийная;
  • многоступенчатая;
  • многофазная.

    Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или невключение в нее отдельных единиц не вызывало сомнений.

    Технически  собственно-случайный отбор проводят методом жеребьевки или по таблице  случайных чисел. Для жеребьевки необходимо подготовить достаточное  количество жребиев – фишек, шаров, карточек, соответствующее объему генеральной совокупности. Каждый жребий должен содержать информацию об отдельной единице совокупности – номер, фамилию лица или адрес, название или какой-либо другой отличительный признак. Необходимое в соответствии с установленным процентом отбора количество жребиев извлекается из общей их совокупности в случайном порядке.

    При отборе по таблицам случайных чисел  каждая единица генеральной совокупности должна иметь порядковый номер. Таблицы  случайных чисел получаются с  помощью датчика случайных чисел на ПК и представляют собой абсолютно произвольные столбцы цифр. В соответствии с объектом генеральной совокупности выбирается любой столбец с числами необходимой значимости. Например, если генеральная совокупность включает 5000 единиц, потребуются четырехзначные столбцы, при этом числа больше 5000 не будут приниматься во внимание. В выборочную совокупность отбираются единицы с порядковыми номерами, соответствующими числам выбранного столбца.

    Собственно-случайный  отбор может быть как повторным, так и бесповторным. Для проведения бесповторного отбора в процессе жеребьевки выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют. При использовании таблиц случайных чисел бесповторность отбора достигается пропуском чисел в случае их повторения в выбранном столбце или столбцах. После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки. Формулы расчета ошибок выборки и основные характеристики параметров генеральной и выборочной совокупности представлены в таблице 1.8.1.

    Как видно из формул (табл. 1.8.1), размер предельной ошибки зависит от вариации признака , объема выборки n и ее доли в генеральной совокупности , а также принятого уровня вероятности (р), которому соответствует коэффициент кратности t. Так, t=1 для вероятности 0,683; t=2 для вероятности 0,954; t=3 для вероятности 0,997.

    Расчет  средней и предельной ошибок выборки  позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для генеральной средней такие пределы устанавливаются на основе следующих соотношений:                                    (1.8.1)

 

,   (1.8.2)

где и - генеральная и выборочная средняя соответственно;

              - предельная ошибка генеральной средней. 

    Доверительные интервалы для генеральной доли: 

                     

    (1.8.3)

    

    (1.8.4) 

    Таблица 1.8.1

Формулы расчета  ошибок выборки и основные характеристики

  параметров генеральной  и выборочной совокупности

  Способ  отбора единиц Характеристики
повторный бесповторный объем сово-куп-ности доля

еди-

ниц

средний

размер

приз-

нака

Средняя

ошибка

(

):

для

средней 

для

доли 
 

Преде-льная

ошибка

(

):

для

средней 

для

доли

 
 
 

 
 
 
 

 

 
 
 

 
 
 
 

 

Генеральная совокупность
 
N
 
 
 
Выборочная совокупность
n
 
7.Статистическое изучение вариации социально-экономических явлений