Проведение выборочного наблюдения

    I.Проведение выборочного наблюдения        - Обосновать размер выборки( обеспечивающий необходимый уровень ошибки).                            - Провести выборку одним из способов бесповторным или повторным методом.         Теория выборочного наблюдения базируется на статистических закономерностях, которые формируются и обнаруживаются в массовых явлениях и процессах. Основная задача выборочного метода – определение ошибки выборки, ибо, если не известен размер ошибки, данные выборки не могут иметь практического значения.     1 Основные понятия выборочной совокупности   Под выборочным наблюдением (сокращенно выборка) понимается не сплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергается не всё, а отдельные единицы, отобранные с соблюдением определенных условий. Применение выборочного метода, взамен сплошного, используемого государственной статистики, дает возможность глубже организовать наблюдения, обеспечивает быстроту его проведения, приводит к экономии средств и труда на получение и обработку информации. Выборочный метод – это наиболее совершенная с научной точки зрения разновидность несплошного статистического наблюдения на основе статистической индукции, при котором характеристики всей статистической (генеральной) совокупностью (N) получаются в результате изучения некоторой ее части (n), отобранной с соблюдением определенных правил (на основе случайного отбора) и поэтому являющейся репрезентативной, т.е. репрезентативной  и достоверной.       Одно из них – генеральная совокупность (N) – совокупность едениц, из которой производится отбор некоторой их части для статистического исследования.       Следующее – выборочная совокупность (n) – совокупность единиц, которая отобрана из генеральной совокупности и подвергнута наблюдению (регистрации интересующих нас признаков).    В зависимости от способа отбора единиц различают:    -отбор по схеме возвращенного шара, обычно называемый повторной выборкой. При повторном отборе вероятность попадания каждой отдельной единицы в выборку остается постоянной, так как после отбора какой то единицы (шара) она (он) снова возвращается в совокупность (в урну) и снова может быть выбранной (выбран);

-отбор по схеме невозвращенного шара, называемой . В этом случае каждая повторная единица не возвращается обратно, и вероятность попадания отдельных единиц в выборку все время изменяется.  Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.    Расхождение между значениями изучаемого признака выборочной и генеральных совокупностей является ошибкой  репрезентативности (представительности).               Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным исследования жилищных условий семей с разными размерами площади.      Таблица1 Результаты выборочного исследования жилищных условий семей с разными площадями.                        1) Определим средне арифметическое взвешенное изучаемого признака.          Табл 2 Промежуточные расчеты                         Х=1050/115=9 м2          2) Рассчитаем дисперсию                   σ2=∑(хi-х)2*f/∑f=(4-9)2*10+(6-9)2*20+(8-9)2*40+(10-9)2*30+ (12-9)2*15= 5.52                                                                                                                   3) Рассчитаем среднеквадратическое отклонение     σ=√5.52=2.3              4) Определим среднюю ошибку выборки       μх=2.3/√115=0.21               5) Рассчитаем предельную ошибку выборки с вероятностью 0.954 (коэф доверия t=2)            ∆х=t*μx=2*0.21=0.44             6) Определяем границы изменения генеральной средней    х-∆х≤х≤х+∆х                8.56≤х≤9.44     Вывод: На основании проведенного выборочного исследования с вероятностью 0.954 можно утверждать что средний размер жилищных площадей приходящихся на одну семью в целом находится в пределах от 8.56 до 9.44.                                                                                                                       II. Осуществление группировки       Сводка статистической информации, как правило, не ограничивается получением общих итогов по изучаемой совокупности. Чаще всего исходная информация на этой стадии статистической работы систематизируется, образуется определяющая математической совокупности, т.е. осуществляется статистическая группировка.   Причем различающиеся между собой единицы статистической совокупности по значениям изучаемого признака, можно объединить в группы( по сходству или различию в существенном отношении).  Всю совокупность признаков можно разделить на 2 группы:   факторные и результативные.  Факторными, называются признаки, под воздействием которых изменяются другие признаки- объединяемые в группу результативных признаков.       Пример аналитической группировки показан в табл 3.    Данные табл3 характеризуют зависимость между суммой жилой площади и численностью семей.                         В практике проведения статистического исследования для определения количества групп наибольшее распространение получила формула Стерджесса           n=1+3.322*igN          n-число групп          N-число единиц совокупности       n=1+3.322*lg5=3                                 III. Построение интервального ряда.      Вариационные ряды в зависимости от характера вариации подразделяются на дискретные( прерывные) и интервальные( непрерывные) Для построения интервального ряда необходимо определить величину частых интервалов. Считая, что все частые интервалы имеют одну и ту же длину для каждого интервала.    Следует установить его верхнюю и нижнюю границы, а затем в соответствии  с полученной упорядоченной совокупностью частных интервалов сгруппировать результаты наблюдения.    Из табл 2 находим, наибольшим значением случайной величины   R=Хнаиб-Хнаим=40-10=30      Величина равного интервала определяется по формуле:    h=R/n            h=40/3=10          За начало первого интервала рекомендуется брать величину:    Хнач=Хнаим-0.5h         Хнач=10-0.5*10=5       Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала(h), В нашем случае h=10                   IV. Характеристика используемых статистических показателей (относительные, абсолютные и т.п).       Статистическое исследование независимо от его масштабов и целей всегда завершается расчетом и анализом различных по виду и форме выражения статистических показателей.      Социально-экономические процессы и явления находят свое отражение в статистических показателях либо по состоянию на определенный момент времени, как правило, на определенную дату, начало или конец месяца, года (численность населения, стоимость основных фондов, дебиторская задолженность), либо за определенный период – день, неделю, месяц, квартал, год (производство продукции, число заключенных браков, сумма страховых выплат). В первом случае показатели являются моментными, во втором – интервальными.    В зависимости от принадлежности к одному или двум объектам изучения различают однообъектные и межобъектные показатели. Если первые характеризуют только один объект, то вторые получают в результате сопоставления двух величин, относящихся к разным объектам.          Абсолютные статистические величины       Исходной, первичной формой выражения статистических показателей являются абсолютные величины. Абсолютные величины характеризуют размер явлений в мерах массы, площади, объема, протяженности, времени и т.д. Индивидуальные абсолютные показатели получаются, как правило, непосредственно в процессе наблюдения в результате замера, взвешивания, подсчета и оценки интересующего количественного признака.         Сводные объемные абсолютные показатели, характеризующие объем признака или объем совокупности в целом как по изучаемому объекту, так и по какой-либо его части, получают в результате сводки и группировки индивидуальных значений.        Абсолютные статистические показатели всегда являются именованными числами. В зависимости от социально-экономической сущности исследуемых явлений, их физических свойств, они выражаются в натуральных, стоимостных или трудовых единицах измерения.         2.Относительные статистические величины   Относительный показатель представляет собой результат деления одного абсолютного показателя на другой и выражает соотношение между количественными характеристиками социально-экономических процессов и явлений. Поэтому по отношению к абсолютным показателям относительные показатели или показатели в форме относительных величин являются производными (вторичными). Без относительных показателей невозможно измерить интенсивность развития изучаемого явления во времени, оценить уровень развития одного явления на фоне других взаимосвязанных с ним явлений, осуществить пространственно-территориальные сравнения, в том числе и на международном уровне.        При расчете относительного показателя абсолютный показатель, находящийся в числителе получаемого отношения, называется текущим, или сравниваемым. Показатель же, с которым производится сравнение и который находится в знаменателе, называется основанием, или базой сравнения. Таким образом, рассчитываемый относительный показатель указывает, во сколько раз, сравниваемый абсолютный показатель больше базисного, или какую долю, он составляет от базисного показателя, или сколько единиц приходится на 1,100,1000 и т.д. единиц второго. Относительные показатели могут выражаться в коэффициентах, процентах, промилле, продецимилле или быть именованными числами. Если база сравнения принимается за единицу, то относительный показатель выражается в коэффициентах, если база принимается за 100,1000 или 10 000, то относительный показатель соответственно выражается в процентах, промилле и продецимилле.     Относительный показатель, полученный в результате соотнесения равноименных абсолютных показателей, в большинстве случаев должен быть именованным. Его наименование представляет собой сочетание наименований сравниваемого и базисного показателей (например, производство какой-либо продукции в соответствующих единицах измерения в расчете на душу населения).       Все используемые на практике относительные статистические показатели можно подразделить на следующие виды:

  • показатели динамики
  • показатели плана
  • показатели реализации плана
  • показатели структуры
  • показатели координации
  • показатели интенсивности и уровня экономического развития
  • показатели сравнения

         Так как объемные показатели производства по своей природе являются интервальными, а показатель численности населения – моментным, в расчете используют среднюю за период численность населения.

  • При выборе относительных величин необходимо соблюдать следующие правила:

      1) относительные величины вычисляют после критической оценки всех сторон изучаемого явления и четкого определения понятий и категорий явлений;                    2) сопоставимые данные по качественно однородным группам, в частности относительные величины удельного веса получают на основе типологической и структурной группировки;                                                                                   3) рассчитывают относительные величины по достаточно большому числу единиц совокупности; для совокупности с малым числом единиц неуместно вычисление относительных величин;                                                     4) для более полного освещения явлений необходима система относительных величин, вычисленных по ряду существенных признаков 5) величина полученной относительной величины зависит от правильно выбранной базы сравнения;                                                                6) взятые для сравнения абсолютные величины должны быть сопоставимы:            а) в границах одного и того же места и периодов времени, с учетом сезонных колебаний;           б) по одному и тому же кругу единиц наблюдения; в) по условиям и способам сбора данных первичного учета и их статистической сводки; г) по методологии расчета;           7) сравнивают логически взаимосвязанные абсолютные величины в числителе и знаменателе отношения. Сопоставимость данных, полученных в результате единовременного и текущего наблюдений, достигается путем специального расчета средних величин и др.        8) в процессе экономико-статистического анализа следует рассматривать во взаимосвязи абсолютные и относительные величины.  Абсолютные величины могут быть измерены с различной степенью точности. С переходом к более высоким ступеням обобщения применяются и более укрупненные единицы измерения.       Относительные величины – один из важнейших способов обобщения и анализа статистической информации. Цели и направления исследования определяют выбор вида относительных величин. Вместе с тем для полной характеристики различных сторон изучаемых явлений необходима система относительных величин, рассчитанных по ряду существенных признаков.  В процессе экономико-статистического анализа абсолютные и относительные величины должны рассматриваться во взаимосвязи, т.е. пользоваться относительными величинами нужно не формально, а представлять, какая абсолютная величина скрывается за каждым относительным показателем. Особенно важно соблюдать это положение при расчете относительных величин динамики.       Одно из главных требований, которое предъявляется при исчислении относительных величин, заключается в необходимости обеспечения сопоставимости сравниваемой величины и величины, принятой за базу сравнения. Прежде всего должна быть обеспечена сопоставимость по методологии расчета сравниваемых показателей, по степени охвата объектов исследуемой совокупности и другим существенными обстоятельствам.                                                                                                                                                                                                                                                                                                          V. Расчет средних величин и показателей вариации     Расчет средней арифметической по исходной выборке и оценка ее по структурным данным, характеристика оценки по критериям.        Среднее арифметическое дает возможность:          - охарактеризовать исследуемую совокупность одним числом;          - сравнить отдельные величины со средним арифметическим;        - определить тенденцию развития какого-либо явления;       - сравнить разные совокупности;          - вычислить другие статистические показатели, т.к многие статистические вычисления опираются на среднее арифметическое.      Средняя арифметическая выборки(Х) характеризует средний уровень значений изучаемой случайной величины в наблюдавшихся случаях и вычисляется путем деления суммы отдельных величин исследуемого признака на общее число наблюдений:        Х=х123+…хn /n=∑хi/n, где          xi – значение конкретного показателя;       ∑- признак суммирования;         n- число показателей( случаев).        Х=10+20+40+30+15/3=38 чел         т.е среднее число 23 чел.         Средне арифметическая взвешенная        Х=10*3+20*5+40*7+30*9+15*11/115=7.3       т.е среднее обеспечение хилой площадью =7.3 м2 на человека.   При расчете средней арифметической по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам.        Тогда зависимость для расчета средней арифметической взвешенной имеет вид:              Х=∑Хi*f/∑f           Хi-середина i-го интервала.         Х=(10*4)+(20*6)+(40*8)+(30*12)+(15*12)/115=8.3м2     СТРУКТУРНЫЕ СРЕДНИЕ( ПО СГРУППИРОВАННЫМ ДАННЫМ).    К структурным средним величинам в статистике относят моду и медиану.             Модой в статистике (Мо) называют величину признака(варианты), которая чаще всего встречается в совокупности.      Медианой в статистике (Ме) называется варианта, которая находится в середине ряда.            Модальным интервалом называется интервал с наибольшей частотой. Медианным интервалом называется интервал, где кумулятивная частота ∑fi/2.             Кумулятивная частота текущего интервала получается суммированием кумулятивной частоты предшествующего интервала и частоты текущего интервала.             Для сгруппированных данных в виде дискретных рядов распределения определения моды и медианы рассмотрим на примере, исходные данные которого приведены в таблице 4.          Табл4 Распределение семей по жилой площади.                                   Наибольшую частоту имеют семьи с общей площадью 7-9м2, именно этот ряд является модальным.         Для определения медианного значения признака необходимо определить номер медианной единицы ряда по следующей зависимости:  Nме=n+1/2=115+1/2=58.         Полученное значение указывает на то что точная середина находится на порядковом номере 58. Необходимо определить к какой группе относятся семьи с этим порядковым номером. Это можно установить рассчитав накопленную частоту. Очевидно, что семьи с этим номером нет в 1-ой группе и во 2группе, т.к накопленная частота для 2 группы=(10+20)=30, для 3 группы=(30+40)=70. Медианным является 3 группа.      Алгоритм расчета моды .         Тадл5 Распределение семей по жилой площади.                             1) Определяем модальный интервал, это 7-9               2) Определяем нижнюю границу модального интервала хо , она равна 3    3) Определяем величину модального интервала i, она равна  2.     4) Рассчитываем Мо           Мо= 3+2((40-20)/(40-20)+(40-30)=4.3      Медиана рассчитывается по формуле:       Мео+i ½(∑fi-SMe)/fMe          Хо- нижняя граница медианного интервала       i- величина медианного интервала        SMe-накопленная частота интервала, предшествующего медианному  fMe-частота медианного интервала.        Алгоритм расчета медианы.           1) Определяем медианный интервал, для чего рассчитываем накопленную частоту каждого последующего интервала до тех пор пока она не превысит половину суммы накопленной частот. Для нашего примера это (115+1)/2 = 58 тогда медианный интервал 7-9.           2) Определим нижнюю границу медианного интервала Хо, она =20.     3) Определим величину медианного интервала i, она =2.       4) Рассчитаем Ме.             Ме=20+2*1/2(58-70)/30=19.6          Соотношение Мо и Ме  и средней арифметической позволяет оценить асимметрию распределения признака в совокупности.     В асимметричных распределениях все три характеристики совпадают. Чем больше расхождения между модой и медианой тем больше асимметричен ряд.           |Мо-Х|=3|Ме-Х|   |-4.7|=3|10.6|      Вывод: в нашем случае ряд является ассиметричным.   Абсолютные показатели вариации (по исходным данным).     R=Хмакмин  R=40-10=30        Средне линейное отклонение- показатель, отражающий типичный размер признака для не сгруппированных данных.      d=∑(хi-х)/n=(4-9)+(6-9)+(8-9)+(10-9)+(12-9)=2.2     Рассмотрим пример расчета средне линейного отклонения по исходным данным табл2.          Алгоритм расчета среднего взвешенного линейного отклонения:   1) Принимаем середины интервалов за варианты признака и определяем их значение хi.           2)Находим произведение середины интервалов на их вес хi*fi, и получаем 835              3) Рассчитываем среднее значение показателей по формуле средне арифметической взвешенной.         Х=∑Хi*fi/∑fi=835/100=8.35         4) Определяем значение величины |хi-х| =12.3      5) Рассчитаем произведение (хi-х)*fi, в результате получаем значение 132.21             6) Окончательно рассчитывается взвешенное среднее линейное отклонение             d=132.21/100=1.32           Средне линейное отклонение позволяет определить обобщенную характеристику колеблемости признака в совокупности, однако при его исчисления приходится иметь дело с модулями алгебраических выражений, что при упрощенных конечных выражениях может приводить к ошибкам и неточностям.            Относительные показатели вариации. Эти показатели используются для сравнения колеблемости различных признаков в одной и той же совокупности, либо при сравнении колеблемости одного и того же признака в разных совокупностях. Базой структуры этих показателей является средняя арифметическая. К относительным показателям вариации относится коэффициент осиляции           VR=R/X*100%=10/9=111%         линейный коэф вариации         Vd=d/x*100%=1.32/9*100%=14.7%        коэф вариации           Vσ=σ/x*100%=2.3/9=25.5%                        

Проведение выборочного наблюдения