Классификация статистических методов

МИНОБРНАУКИ  РОССИИ

Федеральное государственно бюджетное образовательное учреждение высшего профессионального образования 

«Волгоградский  государственный социально-педагогический университет»

 

Факультет математики, информатики  и физики

Кафедра теории и методики обучения математики и информатике

 

Условная вероятность

Реферат

Выполнила:

Студент факультета ФЛ

Гр. РЛБ-13

Шагалин Андрей Андреевич

(фамилия, имя, отчество)

 

Научный руководитель:

Сабанова Людмила Витальевна

кандидат педагогически  наук,

доцент

 

Волгоград 2013

СОДЕРЖАНИЕ

 

  1. Введение……………………………………………………………………..стр.3
  2. Статистические методы анализа данных  как область научно-практической деятельности……………………………………………………………….стр. 5
  3. Статистическое исследование………………………………………….....стр. 7
  4. Этапы статистических операций …………………………………………стр. 9
  5. Классификация статистических методов………….………………..…..стр. 11
  6. Классификация наиболее важных статистических методов, которая может быть использована при выборе теста для решения конкретно задачи…стр. 13
  7. О перспективах развития статистических методов………………….….стр. 15
  8. Вывод………………………………………………………………...……..стр. 16
  9. Список литературы…………………………………………………………стр.17
  10. Приложения………………………………………………………..………стр. 18

 

 

 

 

 

 

 

 

 

-2-

ВВЕДЕНИЕ

Характерным для современного этапа развития естественных и технических  наук является весьма широкое и плодотворное применение статистических методов  во всех областях знания. Задача любой науки состоит в выявлении и исследовании закономерностей, которым подчиняются реальные процессы. Найденные закономерности имеют не только теоретическую ценность, они широко применяются на практике – в планировании, управлении и прогнозировании.

Математическая  статистика – раздел математики, изучающий математические методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей. Математическая статистика по наблюденным значениям (выборке) оценивает вероятности событий либо осуществляет проверку предположений (гипотез) относительно этих вероятностей. 
Изучение вероятностных моделей дает возможность понять различные свойства случайных явлений на абстрактном и обобщенном уровне, не прибегая к эксперименту. В математической статистике, наоборот, исследование связано с конкретными данными и идет от практики (наблюдения) к гипотезе и ее проверке. 
При большом числе наблюдений случайные воздействия в значительной мере погашаются (нейтрализуются) и получаемый результат оказывается практически неслучайным, предсказуемым. Это утверждение (принцип) и является базой для практического использования вероятностных и математико-статистических методов исследования. Цель указанных методов состоит в том, чтобы, минуя сложное (а зачастую и невозможное) исследование отдельного

-3-

случайного явления, изучить закономерности массовых случайных  явлений, прогнозировать их характеристики, влиять на ход этих явлений,

контролировать  их, ограничивать область действия случайности. 
Результаты эксперимента для инженера-исследователя были и остаются главным критерием при решении практических задач и при проверке теоретических гипотез. Однако при этом важно не только умело спланировать и поставить эксперимент, но и грамотно обработать его результаты. Этому вопросу часто не уделяется должного внимания, и нередки случаи, когда результаты дорогостоящих экспериментов не подвергают даже простейшей обработке; при этом, как следствие, теряется огромное количество полезной информации. 
Следует также подчеркнуть, что обработке экспериментальных данных с целью построения моделей «сложных систем» (эмпирических зависимостей) должна предшествовать предварительная обработка, содержание которой, в основном, состоит в отсеивании грубых погрешностей измерений и в проверке соответствия распределения результатов нормальному закону. Следует помнить, что только после выполнения предварительной обработки можно с наибольшей эффективностью, а главное корректно, использовать более сложные экспериментально-статистические методы, позволяющие получать математические модели даже таких процессов, строгое детерминированное описание которых вообще отсутствует.

 

 

 

 

-4-

СТАТИСТИЧЕСКИЕ  МЕТОДЫ АНАЛИЗА ДАННЫХ КАК ОБЛАСТЬ  НАУЧНО-ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ

 

СТАТИСТИЧЕСКИЕ  МЕТОДЫ — научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово “статистика” (от игал. stato —государство) имеет общий корень со словом “государство”. Первоначально оно относилось к науке управления и означало сбор данных о некоторых параметрах жизнедеятельности государства. Со временем статистика стала охватывать сбор, обработку и анализ данных о массовых явлениях вообще; ныне статистические методы охватывают собою практически все области знаний и жизнедеятельности общества.

Их используют всегда, когда  необходимо получить и обосновать какие-либо суждения о группе (объектов или  субъектов) с некоторой внутренней неоднородностью.

Целесообразно выделяют три  вида научной и прикладной деятельности в области статистических методов  анализа данных (по степени специфичности  методов, сопряженной с погруженностью в конкретные проблемы):

а) разработка и исследование методов общего назначения, без учета  специфики области применения;

б) разработка и исследование статистических моделей реальных явлений  и процессов в соответствии с  потребностями той или иной области  деятельности;

в) применение статистических методов и моделей для статистического анализа конкретных данных.

 

-5-

Кратко рассмотрим три  выделенных вида научной и прикладной деятельности:

По мере движения:

- от а) → в) - сужается широта области применения конкретного статистического метода, но при этом повышается его значение для анализа конкретной ситуации.

- работам вида а) соответствуют научные результаты, значимость которых оценивается по общенаучным критериям

- работам вида в) основное - успешное решение конкретных задач той или иной области применения (техники и технологии, экономики, социологии, медицины и др.).

- работы вида б) занимают промежуточное положение, поскольку, с одной стороны, теоретическое изучение свойств статистических методов и моделей, предназначенных для определенной области применения, может быть весьма сложным и математизированным с другой - результаты представляют не всеобщий интерес, а лишь для некоторой группы специалистов. Можно сказать, что работы вида б) нацелены на решение типовых задач конкретной области применения.

 

 

 

 

 

 

-6-

СТАТИТИЧЕСКОЕ ИССЛЕДОВАНИЕ

Статистическое  исследование — это научно организованный по единой программе сбор, сводка и анализ данных (фактов) о социально-экономических, демографических и других явлениях и процессах общественной жизни в государстве с регистрацией их наиболее существенных признаков в учетной документации.

Отличительными чертами (спецификой) статистического исследования являются: целенаправленность, организованность, массовость, системность (комплексность), сопоставимость, документированность, контролируемость, практичность.

В целом статистическое исследование должно:

- Иметь общественно-полезную цель и всеобщую (государственную) значимость;

- Относиться к предмету статистики в конкретных условиях его места и времени;

- Выражать статистический вид учета (а не бухгалтерский и не оперативный);

- Проводиться по заранее разработанной программе с ее научно обоснованным методологическим и другим обеспечением;

- Осуществлять сбор массовых данных (фактов), в которых отражается вся совокупность причинно-следственных и других факторов, разносторонне характеризующих явление;

- Регистрироваться в виде учетных документов установленного образца;

- Гарантировать отсутствие ошибок наблюдения или же сводить их к возможному минимуму;

-7-

-Предусматривать определенные критерии качества и способы контроля собранных данных, обеспечивая их достоверность, полноту и содержательность;

- Ориентироваться на экономически эффективную технологию сбора и обработки данных;

- Быть надежной информационной базой для всех последующих этапов статистического исследования и всех пользователей статистической информацией.

Исследования, не удовлетворяющие  этим требованиям, статистическими  не являются. Не являются статистическими  исследования, например, наблюдения и  исследования: матери за играющим ребенком (личный вопрос); зрителей за театральной  постановкой (нет учетной документации по зрелищу); научного работника за физико-химическими опытами с  их измерениями, расчетами и документальной регистрацией (не массово-общественные данные); врача за больными с ведением медицинских карточек (оперативный  учет); бухгалтера за движением денежных средств на банковском счете предприятия (бухгалтерский учет); журналистов  за общественной и личной жизнедеятельностью государственных лиц или иных знаменитостей (не предмет статистики).

 

 

 

 

 

 

Статистическая  совокупность - множество единиц, обладающих массовостью, типичностью, качественной однородностью и наличием вариации.

Статистическая совокупность состоит из материально существующих объектов (Работники, предприятия, страны, регионы), является объектом статистического  исследования.

Статистическое наблюдение является первой стадией статистического  исследования, представляющий собой  научно организованный сбор данных об изучаемых явлениях и процессах  общественной жизни.

 

 

 

 

 

 

 

 

 

 

 

 

-8-

ЭТАПЫ СТАТИСТИЧЕСКИХ ОПЕРАЦИЙ

Любое статистическое исследования состоит из шести этапов.

Этап 1. Статистическое исследование начинается с формирования первичной статистической информационной базы по выбранному комплексу показателей.

Проведение статистических наблюдений.

Использование официальных  государственных и корпоративных (фирменных) источников.

Использование научных статистических исследований в журналах, газетах, монографиях  и т.д.

Использование электронных  средств информации (Internet, CD, дискет, и др.).

Этап 2. Первичное обобщение и группировка статистических данных.

Сводки, группировки, гистограммы, полигоны, кумуляты (огивы), графики распределения частот (частостей).

Формирование рядов динамики и их первичный анализ. Графический прогноз (с концепцией "оптимист", "пессимист", "реалист").

Расчет моментов К-го порядка (средних, дисперсий, мер скошенности, измерения эксцесса) с целью определения  показателей центра расширения показателей вариации, показателей скошенности (асимметрии), показателей эксцесса (островершинности).

Формирование и первичные  расчеты сложных статистических показателей (относительных, сводных  многоуровневых).

Формирование и первичные  расчеты индексных показателей.

-9-

Этап 3. Следующий этап статистического исследования включает экономическую интерпретацию первичного обобщения.

Экономическая и финансовая оценка объекта анализа.

Формирование тревоги (удовлетворения) экономических и финансовых ситуаций.

Предупреждение о приближении  к пороговым статистическим значениям  в прикладных, как правило, макроэкономических задачах.

Диверсификация первичного статистического обобщения полученных прикладных результатов по иерархии власти, партнерства, бизнеса.

Этап 4. Компьютерный анализ первичных и обобщенных расширенных (объемных) статистических данных.

Анализ вариации расширенных  статистических данных.

Анализ динамики расширенных  статистических данных.

Анализ связей расширенных  статистических данных.

Многомерные сводки и группировки.

Этап 5. Компьютерное прогнозирование по выбранным наиболее важным направлениям.

Метод Наименьших Квадратов (МНК).

Скользящие средние.

Технический анализ.

Представления сводного анализа  и вариантов прогноза с рекомендациями о внесении коррективов в управление и инвестиции.

 

 

Этап 6. Обобщенный анализ полученных результатов и проверка их на достоверность по статистическим критериям.

Этап 7. Завершающим этапом статистического исследования является принятие управленческого решения.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-10-

КЛАССИФИКАЦИЯ СТАТИСТИЧЕСКИХ МЕТОДОВ

По количеству анализируемых признаков:

одномерные (анализ каждого признака в отдельности);

двухмерные (одновременный анализ двух признаков, например анализ связей изучаемых признаков — ассоциации или корреляции);

многофакторные (анализ трех признаков и более одновременно, например многофакторный дисперсионный анализ, многофакторный регрессионный анализ, дискриминантный анализ).

По статистическим принципам, лежащим в основе методов:

параметрические. Применяются главным образом для анализа нормально распределенных количественных признаков;

непараметрические. Применяются в остальных случаях:

а) для анализа количественных признаков независимо от вида их распределения;

б) для анализа качественных признаков.

В целом непараметрические  методы (в случае использования их на малых выборках) являются менее  мощными по сравнению с параметрическими, т.е. иногда не позволяют выявить  статистические закономерности, которые  могут быть выявлены с помощью  параметрических методов.

Непараметрические методы более надежны в случаях, когда есть сомнения в том, что анализируемый признак имеет нормальное распределение.

Для нормально распределенных признаков параметрические и  непараметрические методы дают близкие  результаты.

-11-

По возможности учета  имеющихся априори предположений:

односторонние тесты. Это  тесты, учитывающие исходное (априорное) предположение о том, что в  одной из групп распределение  признака смещено в определенную сторону  (в сторону увеличения либо уменьшения) по отношению к  другой.

Однако для того чтобы  воспользоваться таким тестом, необходимо обосновать свое предположение;

двусторонние тесты. Эти  тесты используются в отсутствие исходного (априорного) предположения  о том, что в одной из групп  распределение признака смещено  в определенную сторону (в сторону  уменьшения или увеличения) по отношению  к другой.

Вычисляемое при этом значение р обычно примерно в 2 раза больше, чем  для одностороннего теста. Двусторонние тесты рекомендуется использовать как можно шире.

По зависимости или  независимости сопоставляемых выборок:

тесты для независимых  выборок. Используются в случае, если при формировании выборок объекты  исследования набирались в группы независимо друг от друга (например, были рандомизированы  в две группы или лечились в  разных больницах);

тесты для зависимых выборок. Используются в двух случаях:

а) когда в динамике анализируются данные, полученные в одной группе больных (например, до и после лечения);

б) когда анализируются выборки, сформированные путем подбора пар по полу, возрасту, стадии заболевания и т.д.

-12-

КЛАССИФИКАЦИЯ НАИБОЛЕЕ ВАЖНЫХ СТАТИСТИЧЕСКИХ МЕТОДОВ, КОТОРАЯ  МОЖЕТ БЫТЬ ИСПОЛЬЗОВАНА ПРИ ВЫБОРЕ ТЕСТА ДЛЯ РЕШЕНИЯ КОНКРЕТНОЙ ЗАДАЧИ

 

Методы

задачи

параметрические (для количественных нормально распределенных признаков)

непараметрические (для количественных признаков независимо от вида распределения, а также для качественных —  порядковых или номинальных —  признаков)

Выполнение описательной

статистики

Вычисление средних значений, средних квадратических отклонений и т.д.

Вычисление медиан и интерквартильных интервалов, пропорций

Сравнение двух независимых  групп по одному признаку

Х-критерий Стьюдента для  независимых выборок

Критерии Манна— Уитни, Колмогорова-Смирнова, Вальда— Вольфовица, х2, точный критерий Фишера

 

 

Сравнение двух зависимых  групп по одному признаку

Х-критерий Стьюдента для  зависимых выборок

Критерий Вилкоксона, критерий знаков, критерий МакНемара

Сравнение трех независимых  групп и более по одному признаку

АNОVА 

АNОVА  по Краскелу— Уоллису, медианный критерий, критерий x2

Сравнение трех зависимых  групп и более по одному признаку

Критерий Кокрана 

АNОVА по Фридмену, критерий Кокрана 

Анализ взаимосвязи двух признаков 

Корреляционный анализ по Пирсону 

Критерий x2, корреляционный анализ по Спирмену, Кендаллу, гамма  и др.

Одновременный анализ трех признаков и более 

Регрессионный анализ Дискриминантный  анализ

Факторный анализ Кластерный анализ

Логистический регрессионный  анализ, логлинейный анализ, анализ древовидных диаграмм, анализ конъюнкций и др


Для двухмерного и одномерного анализа параметрические методы могут применяться лишь при условии, что все анализируемые одновременно признаки являются нормально распределенными.

В противном случае должны применяться непараметрические  методы.

 

 

 

-14-

О ПЕРСПЕКТИВАХ РАЗВИТИЯ СТАТИСТИЧЕСКИХ МЕТОДОВ

Теория статистических методов  нацелена на решение реальных задач. Поэтому в ней постоянно возникают  новые постановки математических задач  анализа статистических данных, развиваются  и обосновываются новые методы. Обоснование  часто проводится математическими  средствами, т.е. путем доказательства теорем. Большую роль играет методологическая составляющая - как именно ставить  задачи, какие предположения принять  с целью дальнейшего математического  изучения. Велика роль современных  информационных технологий, в частности, компьютерного эксперимента.

Отметим, что актуальной является задача анализа истории статистических методов с целью выявления  тенденций развития и применения их для прогнозирования.

Ситуация с внедрением современных  статистических методов на предприятиях и в организациях различных отраслей народного хозяйства внушает  оптимизм. На отечественных предприятиях продолжают развиваться структуры, нуждающиеся в статистических методах, - подразделения качества, надежности, управления персоналом, центральные  заводские лаборатории и другие. Толчок к развитию в последние  годы получили службы контроллинга, маркетинга и сбыта, логистики, сертификации, прогнозирования  и планирования, инноваций и инвестиций, управления рисками, которым также  полезны различные статистические методы, в частности, методы экспертных оценок. Включенные в учебник методы необходимы органам государственного и муниципального управления, организациям силовых ведомств, транспорта и связи, медицины, образования, агропромышленного  комплекса, научным и практическим работникам всех областей деятельности.

 

-15-

ВЫВОД

Таким образом, статистические методы позволяют оценить вероятность того, что выявленные в выборке взаимосвязи, различия, величины и т.д. характерны исключительно для выборки, но не для генеральной совокупности. Логика здесь следующая: если такая вероятность высока, то принимается решение, согласно которому параметры выборки не характерны для генеральной совокупности и наоборот – если такая вероятность низка, то соответствующие параметры выборки говорят о параметрах генеральной совокупности.

Важно помнить – достижение 100% гарантии того, что результаты, полученные в исследовании, характерны для генеральной  совокупности, возможно лишь в том  случае, когда проведено сплошное исследование, т.е. опрос всех представителей генеральной совокупности. Но это  уже не выборочное исследование и  оно не предполагает использование  статистических выводов. 
В самом общем виде статистические выводы можно разделить на две группы:

1) интервальное оценивание (построение интервала, в который  с заданной вероятностью должно  попасть среднее значение либо  пропорция генеральной совокупности);

2) проверка статистических  гипотез (вероятностный вывод  о том, что определенные параметры  выборочной совокупности отображают (или же нет) параметры генеральной  совокупности). 

 

 

 

-16-

СПИСОК ЛИТЕРАТУРЫ

-  Орлов А.И. Прикладная статистика. Учебник. – М.: Экзамен, 2006. – 671 с

- Орлов А.И. О перестройке статистической науки и её применений. - Журнал "Вестник статистики". 1990. No.1. С.65 - 71.

-  Гнеденко Б.В., Беляев Ю.К., Соловьев А.Д. Математические методы в теории надежности. - М.: Наука, 1965. - 524 с.

- Орлов А.И. Высокие статистические технологии. - Журнал «Заводская лаборатория». 2003. Т.69. No.11. С.55-60.

- Большев Л.Н., Смирнов  Н.В. Таблицы математической статистики. - М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).

- Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 3-е, стереотипное. – М.: Наука, 1969. – 512 с.

 

 

 

 

 

 

 

 

-17-

ПРИЛОЖЕНИЯ


               Гистограмма (метод графических  изображений)  
___________________________________________________________________

 

-18-

 


 

 

 

 

 

 

 

 

 

-19-


Классификация статистических методов