Контрольная работа по дисциплине "Статистика". 21
СТАТИСТИКА к/р
СОДЕРЖАНИЕ:
Вопрос 1
Выборочное наблюдение
стр.3
Вопрос 2
А). Изучение вариации
стр.9
Б). Показатели вариации
стр.11
Список используемой литературы
стр.14
Вопрос 1.
Выборочное наблюдение.
Под выборочным наблюдением (сокращенно выборка) понимается не сплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергается не всё, а отдельные единицы, отобранные с соблюдением определенных условий. Источниками первичной информации при организации и проведении выборочного наблюдения по научно – практическим вопросам контроля над преступностью могут служить: статистические отчеты, информационные бюллетени, обзоры, аналитические справки и документы, документы еденного учета (статистические карточки) преступлений, материалы уголовных и гражданских дел, письма, сообщения, материалы прессы, радио, телевидения и другие документы, содержащие сведения о преступлении и преступнике: лицо совершившее преступление; потерпевший; члены семьи преступника, другие родственники, друзья, окружение по месту жительства и месту работы и т.д.
Применение выборочного метода, взамен сплошного, используемого государственной статистики, дает возможность глубже организовать наблюдения, обеспечивает быстроту его проведения, приводит к экономии средств и труда на получение и обработку информации.
Выборочный метод – это наиболее совершенная с научной точки зрения разновидность несплошного статистического наблюдения на основе статистической индукции, при котором характеристики всей статистической (генеральной) совокупностью (N) получаются в результате изучения некоторой ее части (n), отобранной с соблюдением определенных правил.
Самый важный
признак выборочного наблюдения как вида сплошного
наблюдения – случайный характер
выборки, а главная его особенность заключается
в том, что при отборе единиц совокупности
для обследования обеспечивается равная
возможность в отобранную часть любой
из единиц.
Основные понятия
выборочной совокупности
Одно из них – генеральная совокупность (N) – совокупность единиц, из которой производится отбор некоторой их части для статистического исследования.
Следующее – выборочная совокупность (n) – совокупность единиц, которая отобрана из генеральной совокупности и подвергнута наблюдению (регистрации интересующих нас признаков).
Генеральная совокупность (а следом за ней и выборочная совокупность) может быть количественной или качественной, что зависит от того, являются ли признаки свойства единиц наблюдения количественным (возраст) или качественным (пол). Это различие предполагает, что статистическое описание совокупности принимает либо форму средних арифметических, либо форму удельного веса (доли). Совершенно естественно, что между этими показателями (средними или долями) генеральной и выборочной совокупностями имеется какое-то различие, иначе говоря, существует ошибка в определении показателей (средних или долей) выборочной совокупности именно потому, что последняя является частью генеральной совокупности. Эти так называемые ошибки репрезентативности представляют собой расхождение между показателями выборочной и генеральной совокупности, подчиняются определенным статистическим закономерностям, что и позволяет рассчитывать объем выборочной совокупности.
Они могут быть систематическими и случайными. Если первые возникают в связи с особенностями принятой системы отбора и обработки данных наблюдений или в связи с нарушением установленных правил отбора, то вторые – следствие недостаточно равномерного представления в выборке отдельных видов единиц генеральной совокупности.
Главной проблемой выборочного метода является то, насколько уверенно можно по свойствам отобранных объектов следить о действительных свойствах генеральной совокупности. По этому всякое суждение, сделанное на основе выборки, неизбежно имеет вероятностный характер, и задача сводится к тому, чтобы степень вероятности правильности суждения (точность статистических оценок) была возможно большей.
Виды выборки, методы отбора, выборочная совокупность.
По способу организации различают следующие виды выборок: собственно случайную (простую); типическую; механическую; серийную.
По степени охвата единиц исследуемой совокупности различают большие и малые выборки. В зависимости от способа отбора единиц различают:
- отбор по схеме возвращенного шара, обычно называемый повторной выборкой.
При повторном отборе вероятность
попадания каждой отдельной единицы в
выборку остается постоянной, так как
после отбора какой то единицы (шара) она
(он) снова возвращается в совокупность
(в урну) и снова может быть выбранной (выбран);
- отбор по схеме невозвращенного шара,
называемой бесповторной выборкой В
этом случае каждая повторная единица
не возвращается обратно, и вероятность
попадания отдельных единиц в выборку
все время изменяется.
Способы формирования выборочной совокупности:
Существует 2 вида отбора:
1.Индивидуальный: случайный, механический, стратифицированный
2.Серийный
Помимо этого различают:
1.Комбинированный;
2.Ступенчатый;
3.Многфазный.
Любой из этих видов отбора может быть повторный и бесповторный. По степени охвата единиц изучаемой совокупности выделяют малые и большие выборки. Случайный отбор осуществляется с помощью жеребьевки или по табл. случайных чисел. При механическом отборе выбираются n/N элемента, если единицы совокупности не ранжированы, то 1-й элемент выбирается наугад. Если ранжированный, то из середины 1-й 100-и. Принцип случайного отбора в механической выборке обеспечивается тем, что единицы ген. Совокупности располагаются в том порядке, который не оказывает влияния на поведение изучаемого признака.
К выборочному наблюдению прибегают по различным причинам.
Во-первых, использование выборочного обследования позволяет значительно сэкономить силы и средства, что в современных условиях имеет не маловажное значение.
Во-вторых, наряду с экономией ресурсов одной из причин превращения выборочного наблюдения в важнейший источник статистической информации в процессе изучения социально - правовых явлений обнаруживает возможность значительно ускорить получение необходимых данных. Ведь при обследовании, скажем 10 - 15% единиц совокупности будет затрачено гораздо меньше средств и времени, а результаты могут быть представлены быстрее и будут более актуальными.
В- третьих, самое
главное преимущество выборки, ее значение
возрастают в силу возможности (когда
это необходимо) расширения программы
наблюдения. Так как исследованию подвергается
сравнительно небольшая часть всей совокупности,
можно более широко и детально изучить
отдельные единицы и их группы по интересующим
исследователей признакам. И последний фактор
превращения выборочного наблюдения в важнейший источник
социально - правовой информации о правонарушениях
и мерах государственного контроля над
ними - возможность его использовать в
целях уточнения и для разработки данных
сплошного обследования. Выборочная разработка
данных сплошного наблюдения связанна
с потребностью представления оперативных
предварительных итогов обследования.
Кроме того, при обобщении данных сплошного
учёта (например, карточек единого учета
преступлений) невозможно вести сплошную
разработку по всем сочетаниям рассматриваемых
признаков. Она сложна и дорогостоящая.
В этих условиях выборочный метод позволяет
получить необходимые сведения приемлемой
точности, когда факторы времени и стоимости
делают сплошную разработку.
Виды отбора в выборочном наблюдении. Процесс образования выборки называется отбором, который осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности.
Основным условием проведения выборочного
наблюдения является предупреждение возникновения
систематических (тенденциозных) ошибок,
возникающих вследствие нарушения принципа
равных возможностей попадания в выборку
каждой единицы совокупности. Предупреждение
систематических ошибок достигается в
результате применения научно обоснованных
способов формирования выборочной совокупности.
Существуют различные способы отбора:
Собственно-случайный отбор состоит в отборе единиц (серий) из всей генеральной совокупности в целом посредством жеребьевки или на основании таблиц случайных чисел.
- Жеребьевка состоит в том, что на каждую единицу отбора составляется карточка, которой присуждается порядковый номер. После тщательного перемешивания по очереди извлекаются карточки, пока не будет отобрано требуемое число единиц.
- Случайными числами называются ряды чисел, являющихся реализациями последовательности взаимно независимых и одинаково распределенных случайных величин. Эти последовательности чисел получаются либо с помощью физических генераторов (подбрасывание кубиков с нанесенными на их сторонами цифрами; вытягиванием из урны карточек с написанными на них цифрами, преобразование случайных сигналов и др. физико-технические процессы), либо с помощью программных генераторов (аналитическим методом с помощью программ для ЭВМ).
Числа, являющиеся результатами соответствующей вычислительной процедуры, называются псевдослучайными числами. Последовательность псевдослучайных чисел носит детерминированный характер, но в определенных границах она удовлетворяет свойствам равномерного распределения и свойству случайности.
Случайные числа могут быть
выбраны по таблице случайных чисел (приложение
1), которая содержит 2000 случайных чисел,
объединенных для удобства пользования
таблицей в 500 блоков по 4 значения) Например,5489,
5583, 3156, 0835, 1988, 3912. Применение комбинаций этих
Если генеральная совокупность
состоит из 2000 единиц, то в выборочную совокупность должны войти единицы
с номерами:
2000 * 0,5489 = 1097,8 или 1099;
2000 * 0,5583 = 1116,6 или 1117;
2000 * 0,3156 = 631,2 или 631;
2000 * 0,0835 = 167,0 или 167;
2000 * 0,1988 = 397,6 или 398;
2000 * 0,3912 = 782,4 или 782.
Процесс формирования случайных
чисел и определения номера отбираемой
единицы продолжается до тех пор, пока
не будет получен заданный объем выборочной
совокупности.
Можно предложить другой способ
случайного отбора единиц в выборку. Допустим,
что выборка состоит из 75 единиц, а генеральная
совокупность - из 780. Из таблицы случайных
чисел выбираются, например, следующие
5489, 5583, 3156, 0835, 1988, 3912.
В выборку могут войти только
единицы, порядковые номера которых равны трехзначным
числам меньше 780. Поэтому, используя только
три последние цифры каждого числа, отбирается
необходимые 75 номеров: 489, 583, 156 и т.д. Можно
использовать и первые три цифры каждого
числа, тогда отобранные номера: 548, 558,
315, 83, 198, 391. Можно разбить случайные четырехзначные
случайные числа на ряд, состоящий из трехзначных
чисел:
548, 955, 833, 156, 083, 519, 883, 912
и отобрать из них номера, которые меньше 780, а именно: 548, 156, 83, 519.
Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%-м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за № 1, то следующими отбираются 11-я, 21-я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их “рангов”, т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.
При достаточно большой совокупности
этот способ отбора близок к собственно
случайному, при условии, что применяемый
список не составлен таким образом, чтобы
какие-то единицы совокупности имели больше
шансов попасть в выборку.
При типическом отборе генеральная совокупность разбивается на типические группы единиц по какому-либо признаку (формируются однородные совокупности), а затем из каждой из них производится механический или собственно-случайный отбор. Отбор единиц из типов производится тремя методами: пропорционально численности единиц типических групп, непропорционально численности единиц типических групп и пропорционально колеблемости признака в группах.
Ошибки выборочного отбора
Разность между показателями
выборочной и генеральной совокупности
называется ошибкой выборки. Ошибки выборки
подразделяются на ошибки регистрации
и ошибки репрезентативности. Ошибки
регистрации возникают из-за неправильных
или неточных сведений. Источниками таких
ошибок могут быть непонимание существа
вопроса, невнимательность регистратора,
пропуск или повторный счет некоторых
единиц совокупности, описки при заполнении
формуляров и т.д. Среди ошибок регистрации выделяются
систематические, обусловленные причинами,
действующими в каком-то одном направлении
и искажающими результаты работы (например,
округление цифр, тяготение к полным пятеркам,
десяткам и т.д.), и случайные, проявляющиеся
в различных направлениях, уравновешивающие
друг друга и лишь изредка дающие заметный
суммарный итог. Расхождение между значениями
изучаемого признака выборочной и генеральных
совокупностей является ошибкой репрезентативности
(представительности). Она может быть случайной
и систематической. Случайная возникает
в силу того, что выборочное статистическое
наблюдение является не сплошным наблюдением,
и выборка недостаточно точно воспроизводит
(репрезентирует) генеральную совокупность.
Систематические ошибка репрезентативности возникают из
за неправильного, тенденциозного отбора единиц,
при котором нарушается основной принцип
научно-организованной выборки – это
принцип случайности.
При определении
величины репрезентативной ошибки
предполагается, что ошибка регистрации равна нулю.
Определение ошибки производится по формулам
ошибки выборочной доли и ошибки выборочной
средней. Систематическая ошибка репрезентативности
возникает вследствие нарушения правил
отбора единиц генеральной совокупности,
в частности принципа беспристрастного,
непреднамеренного отбора. Систематическая
ошибка может привести к полной непригодности
результатов наблюдений.
Вопрос 2
А) Статистическое изучение вариации
Вариация признака - различие индивидуальных значений признака внутри совокупности.
Средняя величина не даёт представления о том, как отдельные значения признака группируются вокруг среднего.
Показатели вариации характеризуют колеблимость отдельных значений.
Вариация может быть случайной ил систематической.
Для характеристики колеблемости признака используется ряд показателей:
1) Размах вариации, - ;
2) Среднее линейное отклонение, - - для простых величин;
- для взвешенных единиц;
3) Дисперсия, - , - для простых величин;
, - для взвешенных величин;
4) Средне квадратичное отклонение, - ;
Чем меньше оно, тем лучше среднеарифметическое отражает собой представленную совокупность.
для обеспечения расчётов дисперсии и среднеквадратичного отклонения сформулируем свойство дисперсии:
a) A – const;
b) ;
c) , способ момента или способ отсчёта от условного нуля;
Средняя величина отражает тенденцию развития, то есть действие главная причина.
G – измеряет силу воздействия прочих факторов;
На основании вышеперечисленных показателей вариации рассчитывается показатели относительного рассеивания:
1) Коэффициент осцилляции – отражает относительную колеблимость крайних показателей признака вокруг среднего;
;
2) Относительное линейное отклонение – характеризует долю усредненного значения абсолютных отклонений от средних величин;
;
3) Коэффициент вариации
, если V превышает 40%, то середина рассчитана по неоднородной совокупности и не будет являться типичной для данной совокупности;
Помимо показателей относительного рассеивания для характеристики варьируемости признака применяют следующие виды дисперсии:
1) Общая дисперсия – характеризует вариацию признака, которая зависит от всех условий данной совокупности;
2) Межгрупповая дисперсия – характеризует колеблимость групповых средних вокруг общей средней;
3) Средняя из внутригрупповых дисперсий – характеризует случайную вариацию в отдельной группе;
Вышеперечисленные виды дисперсий находятся в функциональной сфере:
На основе данных дисперсий можно определить коэффициент детерминации:
Б) Показатели вариации
Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, варьируется рост людей, их заработная плата т.п.
Причиной вариации являются разные условия существования разных единиц совокупности. Например, огромное число причин влияет на рост человека, его заработную платы и т.д.
Для управления и изучения вариации статистикой разработаны специальные методы исследования вариации, система показателей, с помощью которой вариация измеряется, характеризуются ее свойства.
Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда) – упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.
Ряд распределения бывает дискретным и интервальным.
Дискретный ряд распределения – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака Xi и числа единиц совокупности с данным значением признака fi – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака. В следующей таблице приведен пример дискретного ряда распределения:
Вес студента, кг |
48 |
50 |
53 |
55 |
56 |
59 |
62 |
64 |
68 |
70 |
72 |
77 |
85 |
88 |
Итого |
Кол-во студентов, чел. |
1 |
3 |
2 |
1 |
1 |
2 |
3 |
2 |
2 |
3 |
5 |
2 |
2 |
1 |
30 |
Интервальный ряд распределения – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот - fi), или долей этого числа в общей численности совокупностей (частостей - di).
Трансформируем дискретный ряд, представленный в таблице выше, в интервальный ряд распределения. Для этого необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты (f) или частности (d) привести к единице интервала, полученное значение называется плотностью ?, то есть? = f/h.
Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и, в то же время, закономерность в распределении, а его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, то не проявится закономерность вариации, а если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения.
Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:
где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.
Из формулы Стерджесса видно, что число групп k – это функция объема данных (N).
Зная число групп, рассчитывают длину (размах) интервала по формуле:
где Xмax и Xmin — максимальное и минимальное значения в совокупности.
В нашем примере про вес студентов по формуле Стерждесса определим число групп: k = 1 + 3,322lg30 = 1+ 3,322*1,477 = 5,907. Так как число групп не может быть дробным, то необходимо округлить до ближайшего целого числа полученное значение 5,907. Таким образом получим k = 6.
Рассчитаем длину (размах) интервала: h = (88 – 48)/6 = 40/6 = 6,667 (кг).
Теперь построим интервальный ряд студентов по весу с 6 группами с интервалом 6,667 кг.
i |
1 |
2 |
3 |
4 |
5 |
6 |
Итого |
Вес, кг |
48 - 54,667 |
54,667 - 61,333 |
61,333 - 68 |
68 - 74,667 |
74,667 - 81,333 |
81,333 - 88 |
- |
Число студентов, чел. |
6 |
4 |
7 |
8 |
2 |
3 |
30 |
Примечание к таблице: единицы совокупности, имеющие значение признака, равное границе интервала (в нашем примере это вес 68 кг), включаются в тот интервал, где это точное значение впервые указывается (то есть в интервал от 61,333 до 68, а в следующий интервал от 68 до 74,667 - не включается).
При изучении вариации применяются такие характеристики ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана – величина варьирующего признака, делящая совокупность на две равные по численности части (со значением признака меньше медианы и со значением признака больше медианы).
При рассмотрении дискретного ряда медиана определяется суммированием частот ранжированного ряда до N/2, то есть в нашем примере про студентов - до 30/2 = 15. Значение X, отделающее первые 15 студентов от других 15, может приходиться на конкретное значение X, которое и будет медианой, или между двумя значениями X - тогда медианой будет их полусумма.
В вышеприведенном примере медианным интервалом является 3-ий (от 61,333 до 68), так как накопленная сумма частот f' до него 6+4=10, а вместе с ним - 6+4+7=17, что больше половины всех частот 30/2=15.
В интервальном ряду распределения для нахождения медианы применяется формула:
где X0 - нижняя граница интервала, в котором находится медиана;
h - размах медианного интервала (разность между его верхней и нижней границей);
- накопленная частота в интервале,
предшествующем медианному;
fMe – частота в медианном интервале.
Список литературы:
- Забрянский Г.И. Показатели вариации и их значение //Вестник МГУ. 2009.
- Иванов О.В. Теория статистической группировки. М., 2008.
- Карпец И.И. Преступность: иллюзии и реальность. М., 2009.
- Козлов Т. Заметки о статистических показателях и их системах //Вопросы статистики. 2008. № 12.
- Л.К. Правовая статистика Учебник // второе издание// ЮРИСТЪ.,М., 2010.

- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине " Статистика"
- Контрольная работа по дисциплине " Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"
- Контрольная работа по дисциплине "Статистика"