Понятие выборочного наблюдения, отбор единиц в выборочную совокупность
Введение
Статистика имеет свой предмет. Она изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной или их содержанием, а также количественное выражение закономерностей общественного развития в конкретных условиях места и времени [3, с.9].
В современных условиях статистика должна обеспечивать органы государственного управления всех уровней, международные организации, коммерческие структуры и население объективной и полной информацией по вопросам социально-экономического развития Российской Федерации, ее регионов, отраслей и секторов экономики. Статистическая информация используется на макроуровне для разработки экономической политики в стране, формирования проектов бюджета Российской Федерации и ее субъектов, получения прогнозов социально-экономического развития, анализа реализации федеральных законов и международных обязательств России.
Многогранная характеристика различных сторон деятельности предприятий, отраслей и национальной экономики находит отражение в системах статистических показателей. Задача статистики состоит в том, чтобы разрабатывать методологию построения этих показателей, совершенствовать и развивать методы их анализа, объяснять, как правильно интерпретировать полученные данные и давать оценку того, насколько ценна для практического использования полученная информация.
Исследование массовых общественных явлений включает этапы сбора статистической информации и ее первичной обработки, сведения и группировки результатов наблюдения в определенные совокупности, обобщения и анализа полученных материалов [3, с.16]. Статистическое наблюдение – это первая стадия всякого статистического исследования, представляющая собой научно организованный по единой программе учет фактов, характеризующих явления и процессы общественной жизни, и сбор полученных на основе этого учета массовых данных.
Наблюдение, при котором характеристика всей совокупности дается по некоторой ее части, отобранной в случайном порядке, называется выборочным наблюдением. Случайность отбора единиц гарантируется независимостью результатов выборки от воли лиц, ее производящих. Таким образом, результат выборки освобождается от тенденциозных ошибок [3, с21]. При правильной организации выборочное наблюдение дает достаточно точные результаты, которые можно применить с определенной вероятностью на всю совокупность.
Применение выборочного метода взамен сплошного дает возможность лучше организовать наблюдение, обеспечивает быстроту проведения наблюдения, приводит к экономии средств и затрат труда на получение и обработку информации. Выборочный метод обследования применяется, прежде всего, в тех случаях, когда сплошное наблюдение вообще невозможно. Обследование может быть связано с уничтожением или порчей обследуемых единиц (например, дегустация пищевых продуктов).
Все эти положительные качества привели к широкому применению метода выборочного наблюдения. Данный метод как способ проверки качества продукции применяется большинством предприятий и организаций.
Выборочный
метод находит широкое
Целью данной работы является подробное изучение одного из основных понятий статистики – выборочного наблюдения, а также закрепление полученных теоретических знаний при решении практического задания.
Задачи исследования:
раскрыть понятия выборочного наблюдения,
а именно видов выборки, ошибок выборки,
оптимальной численности выборки, способов
распространения характеристик выборки
на генеральную совокупность, способы
отбора единиц их генеральной совокупности.
Теоретическая
часть
Понятие
выборочного наблюдения,
отбор единиц в
выборочную совокупность
Выборочный метод применяется в тех случаях, когда проведение сплошного наблюдения невозможно или экономически нецелесообразно. В частности, проверка качества отдельных видов продукции может быть связана с ее уничтожением (оценка крепости нити на разрыв, дегустация продуктов питания т.п.); другие совокупности настолько велики, что было бы физически невозможно собрать данные в отношении каждого из их членов (например, при изучении пассажиропотоков или цен на рынках, исследованиях бюджетов семей). Выборочное наблюдение используют также для проверки результатов сплошного наблюдения.
Часть
единиц, отобранных для наблюдения,
называют выборочной совокупностью, а
всю совокупность единиц, из которых
производится отбор, - генеральной. Качество
результатов выборочного
- Собственно случайный
- Механический
- Стратифицированный
- Серийный (гнездовой)
Собственно случайный отбор осуществляется с помощью жеребьевки либо по таблице случайных чисел. В первом случае всем элементам генеральной совокупности присваивается порядковый номер и на каждый элемент заводится жребий – пронумерованные шары или карточки-фишки, которые перемешиваются и помещаются в ящик, из которого затем отбираются наудачу. Во втором случае производится выбор случайных чисел (из специальных таблиц), которые образуют порядковые номера для отбора.
Механическое формирование выборочной совокупности не связано с процедурами получения случайных чисел. При этом способе отбирается каждый (n/N)-й элемент генеральной совокупности. Например, если имеется совокупность из 100 тыс. ед. и требуется выборка в 1000 ед., то в нее попадает каждый сотый элемент. Если единицы в совокупности не ранжированы относительно изучаемого признака, то первый элемент выбирается наугад, а если ранжированы, - то из середины первой сотни [2, с.42]. При достаточно большой совокупности этот способ отбора близок к собственно случайному, при условии, что применяемый список не составлен таким образом, чтобы какие-то единицы совокупности имели больше шансов попасть в выборку.
Отбор единиц из неоднородной совокупности осуществляется стратифицированным способом, дающим модифицированную форму выборки. В этом случае генеральную совокупность предварительно разбивают на однородные группы с помощью типологической группировки, после чего производят отбор единиц из каждой группы в выборочную совокупность случайным или механическим способом. Этот метод гарантирует, что единицы разных групп включаются в выборку пропорционально их численности в генеральной совокупности [3, с.26].
Особая
форма составления выборки
Особенности обследуемых объектов определяют два метода отбора единиц в выборочную совокупность – повторный (отбор по схеме возвращенного шара) и бесповторный (отбор по схеме невозвращенного шара). При повторном отборе каждая попавшая в выборку единица или серия возвращается в генеральную совокупность и имеет шанс вторично попасть в выборку. При этом вероятность попадания в выборочную совокупность всех единиц генеральной совокупности остается одинаковой. Бесповторный отбор означает, что каждая отобранная единица (или серия) не возвращается в генеральную совокупность и не может подвергнуться вторичной регистрации, а потому для остальных единиц вероятность попасть в выборку увеличивается.
Бесповторный
отбор дает более точные результаты
по сравнению с повторным, так
как при одном и том же объеме
выборки наблюдение охватывает больше
единиц генеральной совокупности. Поэтому
он находит более широкое
Определение
ошибок выборки
По мере отбора единиц в выборочную совокупность или по его завершении производится регистрация предусмотренных программой признаков. Итогом же является расчет обобщающих выборочных характеристик.
Часто кроме выборочной средней ( ) исчисляют также выборочную долю (W) единиц, обладающих каким-либо интересующим признаком, в общей их численности.
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Общая величина возможной ошибки выборочной характеристики слагается из ошибок двоякого рода: ошибки регистрации и ошибки репрезентативности[2, с.130].
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, несовершенство измерительных приборов, недостаточная квалификация наблюдателя, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров т.д. [1, с.72].
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам, сотням и т.д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Ошибки репрезентативности также могут быть систематическими и случайными. Систематические ошибки репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки – принцип случайности. Случайные ошибки репрезентативности означают, что, несмотря на принцип случайности отбора единиц, все же имеются расхождения между характеристиками выборочной и генеральной совокупности. Изучение и измерение случайных ошибок репрезентативности является основной задачей выборочного метода.
Определение возможной и фактически допущенной ошибки выборки имеет важное значение при применении выборочного метода. Величина ошибки характеризует степень надежности результатов выборки; знание этой величины необходимо при оценке параметров генеральной совокупности. Оценки возможной величины и состава ошибок репрезентативности ложатся в основу планирования проектируемого выборочного наблюдения [2, с133].
Величина случайной ошибки репрезентативности зависит:
от принятого способа формирования выборочной совокупности;
от объема выборки;
от степени колеблемости изучаемого признака в генеральной совокупности.
Можно увидеть, насколько отличаются выборочные и генеральные показатели, например, по данным об успеваемости студентов (две 10%-ные выборки):
| Оценка |
Число студентов, чел. | ||
| Генеральная совокупность | Первая выборка |
Вторая выборка | |
| 2 | 100 | 9 | 12 |
| 3 | 300 | 27 | 29 |
| 4 | 520 | 54 | 52 |
| 5 | 80 | 10 | 7 |
| Итого | 1000 | 100 | 100 |
Средний балл рассчитывается по средней арифметической взвешенной.
По генеральной совокупности
по первой выборке
по второй выборке
Доля студентов, получивших оценки «4» и «5»:
по первой выборке
W1 = 0,64 или 64%;
по второй выборке
W2 = 0,59 или 59%.
Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности.
Ошибки репрезентативности:
;
;
;
;
Из расчетов видно, что выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок ( ). Средняя ошибка выборки равна среднему квадратическому отклонению, деленному на квадратный корень из численности выборки:
для средней
для доли
В этих формулах и являются характеристиками генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность при достаточно большом объеме достаточно точно воспроизводит характеристики генеральной совокупности. Следовательно, средние ошибки выборки можно представить следующим образом:
;
.
При
бесповторном отборе подкоренное выражение
умножается на величину
, которая всегда меньше единицы, поэтому
величина средней ошибки при бесповторном
отборе оказывается меньше, чем при повторном.
В тех случаях, когда доля выборки незначительна
и множитель
близок к единице, поправкой можно
пренебречь. Для решения практических
задач кроме средней пользуются предельной
ошибкой выборки, которая связана с гарантирующим
ее уровнем вероятности. Уровень вероятности
определяет величина нормированного отклонения
t, и наоборот. Значения t даются в
таблицах нормального распределения вероятностей.
Предельные ошибки выборки
определяются по формулам:
| Метод отбора | Для средней | Для доли |
| Повторный |
||
| Бесповторный |
После
исчисления предельных ошибок выборки
находят доверительные
Определение
численности выборки
Одним из научных принципов в теории выборочного метода является обеспечение достаточного числа отобранных единиц.
Уменьшение стандартной ошибки выборки, а, следовательно, увеличение точности оценки всегда связано с увеличением объема выборки, поэтому уже на стадии организации выборочного наблюдения приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений [1, с.81]. Формулы для определения численности выборки (n) зависят от метода отбора. Они различны для расчета средней и доли и следуют из формул предельных ошибок выборки.
Численность выборки при собственно случайном и механическом отборе:
| Метод отбора | Для средней | Для доли |
| Повторный | ||
| Бесповторный |
Значения и t определяются как задачами, стоящими перед исследователем, так и природой изучаемого явления. Чем более достоверные результаты требуется получить, тем большую вероятность необходимо задать. С увеличением допустимой ошибки уменьшается необходимый объем выборки, и наоборот (т.е., например, увеличение ошибки выборки в 2 раза уменьшит n в 4 раза). Вариация признака существует объективно, независимо от исследователя, но к началу выборочного наблюдения она неизвестна. Приближенно определяют следующими способами:
-
берут из предыдущих
- по правилу «трех сигм» общий размах вариации укладывается в 6 сигм ( , отсюда ). Для большей точности Н делят на 5;
- если хотя бы приблизительно известна средняя величина изучаемого признака, то ;
- при изучении альтернативного признака, если нет даже приблизительных сведений о доле единиц, обладающих заданным значением этого признака, берется максимально возможная величина дисперсии, равная 0,25 [3, с.32].
При стратифицированном отборе, не пропорциональном объему групп, общее число отбираемых единиц делится на количество групп. Полученная величина даст объем выборки из каждой группы.
При отборе, пропорциональном числу единиц в группе, число наблюдений по каждой группе определяется формулой
где - объем выборки из i-ой группы; n – общий объем выборки; - объем i-й группы; N – объем генеральной совокупности.
При
серийном (гнездовом) отборе необходимую
численность отбираемых серий определяют
так же, как и при собственно
случайном, только вместо N,
n и
подставляют соответственно R,
r и
, где R – число серий в генеральной
совокупности; r – число отобранных
серий;
- межсерийная (межгрупповая) дисперсия.
Распространение
выборочных результатов
Распространение выборочных оценок на генеральную совокупность состоит в определении характеристик выборочной. Применяются два способа распространения выборочных даны:
- способ прямого пересчета;
- способ поправочных коэффициентов.
При первом способе средние величины и доли, полученные в результате исследования выборочной совокупности, переносятся на генеральную. Если известна численность единиц этой совокупности, то можно найти общий объем признака [3, с.33]. Например, если средняя выборочная урожайность зерновых равна 20 ц/га, а предельная ошибка выборки 1,5 ц/га, при известной посевной площади в 20 000 га, можно установить ожидаемые пределы валового сбора зерновых: от 37 тыс. т. ( ) до 43 тыс. т. ( ) с вероятностью, принятой при расчете предельной ошибки.
Второй
способ используется для уточнения данных
сплошного наблюдения. Так, если выборочное
наблюдение показало, что недоучет величины
исследуемого явления составил 0,5%, то
эту последнюю величину (поправочный коэффициент)
распространяют на результат, полученный
при сплошном наблюдении, путем увеличения
его на 0,5%.
Расчетная
часть
Задание 15.1
Имеются выборочные данные об уровне оплаты труда работников коммерческих банков:
| Группы работников по уровню оплаты труда, тыс. руб. | До 3 | 3 – 5 | 5 – 7 | 7 – 9 | Свыше 9 | Итого |
| Среднесписочная численность работников, чел. | 10 | 48 | 28 | 10 | 4 | 100 |
Определить:
- среднюю заработную плату работников;
- дисперсию;
- среднее квадратическое отклонение;
- коэффициент вариации.
Сделать выводы.
Решение:
1). Среднюю заработную плату работников определяем по формуле средней арифметической взвешенной, в качестве значений признака используем середины интервалов:
где - значение признака в каждой группе (середины интервалов); - частота повторяемости признака.
2).
Дисперсию определяем по
3). Среднее квадратическое отклонение определяем по формуле
4). Коэффициент вариации определяем по формуле
Средняя
заработная плата работников коммерческого
банка составляет 5 тыс.руб.; дисперсия
(
) и среднее квадратическое отклонение
(
тыс.руб.) являются абсолютными показателями
вариации и показывают степень отклонения
уровня оплаты труда отдельных групп работников
от средней; коэффициент вариации показывает,
что совокупность однородна, т.к. значение
V=13,4% ‹ 33%.
Задание 15.2
Имеются следующие данные о реализации мясных продуктов на городском рынке:
| Продукт | Сентябрь | Октябрь | ||
| цена за 1 кг., руб. | продано, ц. | цена за 1 кг., руб. | продано, ц. | |
| Говядина | 70 | 26,3 | 80 | 24,1 |
| Баранина | 60 | 8,8 | 60 | 9,2 |
| Свинина | 90 | 14,5 | 95 | 12,3 |
Рассчитайте сводные индексы цен, физического объема реализации и товарооборота, а также величину перерасхода покупателей от роста цен.
Решение:
1). Сводный индекс цен рассчитываем по формуле
где - цена единицы продукции в базисном периоде (сентябрь); - цена единицы продукции в сравниваемом периоде (октябрь); - количество проданной продукции в сравниваемом периоде.
2). Сводный индекс физического объема реализации рассчитываем по формуле
где - количество проданной продукции в базисном периоде; - цена единицы продукции в базисном периоде.