Мат.Методы в психологии
Міністерство науки та освіти України
Одеський національний університет імені І.І.Мечникова
Інститут інноваційної та післядипломної освіти
Кафедра
Клінічної психології
Контрольна робота
З курсу "Мат. Методи в психології"
"Критерії
Манна-Уітні та Вілкоксона."
Виконала: Семенюк В.В.
Курс 4
Спеціальність: Юридичний психолог
Форма навчання: заочна
Викладач:
________________________
Одеса 2011 р.
Содержание:
- Введение;
- Основная информация о критерии Манна — Уитни:
2.1 Ограничения применимости критерия,
2.2 Использование критерия;
- U критерий Манна-Уитни:
3.1 Пример расчета U-критерия Манна-Уитни "№1",
3.2 Пример расчета U-критерия Манна-Уитни "№2";
- Критерий Вилкоксона:
4.1 Описание критерия,
4.2 Алгоритм,
4.3. Пример "№1",
4.4. Пример "№2";
- Вывод;
- Список литературы.
- Введение
В данной работе мы рассмотрим критерии Манна-Уитни и Вилкоксона и приведем несколько примеров их вычисления.
Цель работы: рассмотрение критериев Манна-Уитни и Вилкоксона.
Предмет: критерии Манна-Уитни и Вилкоксона.
Задание: изучить критерии Манна-Уитни и Вилкоксона.
Источником информации данной работы стали работы:
Манна
Х., Уитни Д., Вилкоксона
Ф., Сидоренко Е. В., Гублера
Е. В., Генкина А. А. и других.
U-критерий
Мана-Уитни – непараметрический критерий,
предназначенный для сравнения независимых
выборок.
В отличие от t-критерия
Стьюдента, U-критерий не требует проверки
на нормальность распределения, с его
помощью можно сравнивать маленькие выборки
объёмом от 3-х наблюдений. Так же он подходит
для сравнения выборок, данные в которых
распределены ненормально.
При расчетах вручную
этот критерий не слишком удобен, т.к. для
его использования данные необходимо
ранжировать. Однако, при наличии Excell,
расчеты становятся не такими трудоёмкими,
т.к. для ранжирования используется функция
РАНГ и автоматическая сортировка.
Т-Критерий Вилкоксона - непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных измерений. Впервые предложен Фрэнком Вилкоксоном.
Критерий
предназначен для сопоставления
показателей, измеренных в двух разных
условиях на одной и той же выборке
испытуемых. Он позволяет установить
не только направленность изменений, но
и их выраженность, то есть, способен
определить, является ли сдвиг показателей
в одном направлении более интенсивным,
чем в другом.
2. Основная информация о критерии Манна — Уитни
U-критерий Манна — Уитни (англ. Mann — Whitney U-test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Другие названия: критерий Манна — Уитни — Уилкоксона (англ. Mann — Whitney — Wilcoxon, MWW), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test) или критерий Уилкоксона — Манна — Уитни (англ. Wilcoxon — Mann — Whitney test). Реже: критерий числа инверсий.
Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann) и Д. Р. Уитни (D. R. Whitney), по именам которых сегодня обычно и называется.
Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.
2.1 Ограничения применимости критерия
- В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
- В выборочных данных не должно быть совпадающих значений (все числа — разные) или таких совпадений должно быть очень мало.
2.2 Использование критерия
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
- Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным:
N = n1 + n2,
где n1 — количество единиц в первой выборке, а n2 — количество единиц во второй выборке.
- Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно — на долю элементов второй выборки. Определить большую из двух ранговых сумм (Tx), соответствующую выборке с nx единиц.
- Определить значение U-критерия Манна — Уитни по формуле:
- По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n1 и n2. Если полученное значение U меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U.
- При справедливости нулевой гипотезы критерий имеет математическое ожидание и дисперсию и при достаточно большом объёме выборочных данных распределён практически нормально.
3. U критерий Манна-Уитни
Критерий Манна-Уитни представляет непараметрическую альтернативу t-критерия для независимых выборок. STATISTICA предполагает, что данные расположены тем же образом, что в и t-критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.
Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t-критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.
Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p-значение.
Точные
вероятности для
малых выборок. Для выборок малого
объема STATISTICA вычислит точную вероятность,
связанную с соответствующей U статистикой.
Эта вероятность основана на подсчете
всех возможных значений U при заданном
количестве наблюдений в двух выборках
(см. Dinneen & Blakesley, 1973). Программа сообщит
(в последнем столбце таблицы результатов)
значение 2 * p, где p равно 1 минус кумулятивная
(односторонняя) вероятность соответствующей
U статистики. Заметим, что это обычно не
приводит к большой недооценке статистической
значимости соответствующих эффектов
(см. Siegel, 1956).
3.1 Пример расчета U-критерия Манна-Уитни "№1"
Пример №1. Проверим гипотезу о принадлежности сравниваемых независмых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни.
Сравним результаты, полученные в примере 1 для 2-го и 3-го столбцов таблицы по критерий Стьюдента, с результатами непараметрического сравнения. Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:
|
Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20). Это правило используют для проверки правильности ранжирования.
Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:
R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69
R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141
Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.
Статистика U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86.
Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19. Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми.
3.2 Пример расчета U-критерия Манна-Уитни "№2"
Сравнению подлежат результаты контрольной
работы выборки «А» из 4-х школьников,
посещавших специальные занятия, и выборки
«Б», состоящей из 7 школьников, никаких
занятий не посещавших. Последовательность
действий, для вычисления критерия Манна-Уитни
такова.
1. Проранжировать
число успешно решенных
заданий, объединив
обе выборки.
| Значение | 3 | 3 | 4 | 4 | 5 | 5 | 6 | 7 | 8 | 9 | 10 | |
| Ранг | 6 | 6 | 4 | 4 | 2 | 2 | 5 | 1 | 3 | 2 | 1 | |
| Выборка | Б | Б | Б | Б | Б | Б | А | Б | А | А | А | |
| R1 | 7 | 9 | 10 | 11 | ∑ = 37 | |||||||
| R2 | 1 | 2 |
3 |
4 |
5 |
6 |
8 |
∑ = 29 |
Кол-во случаев
в первой выборке: n1=4
Кол-во случаев во второй выборке: n2 = 7
Всего случаев: N = 4+7 = 11
Сумма рангов первой выборки: R1 = 37
Сумма рангов второй выборки: R2 = 29
Для проверки вычисляем: R1+R2= (N/2)*(1+N); 37+29
= 11/2 * (1+11);
66 = 66. Расчеты верны
2. Находим эмпирическое
значение U-критерия.
Для этого вычисляем два значения:
U1= n1 * n2 + (n1*(n1 + 1) / 2) – R1
U2= n1 * n2 + (n2*(n2 + 1) / 2) – R2
Эмпирическим считается наименьшее из
U1 и U2.
U1 = 4 * 7 + 4*(4+1)/2 – 37 = 27
U2 = 4 * 7 + 7*(7+1)/2 – 29 = 31
Эмпирическое значение U=27
3. Ищем критическое
значение по
таблице.
Число на пересечении размера наибольшей
выборки (size of the largest sample) и и наименьшей
выборки (size of the smallest sample) является критическим
значением коэффициента Манна-Уитни. В
нашем случае размер наибольшей выборки
7, наименьшей – 4.
Находим критическое значение при p≤0,05
Uкрит = 3.
4. Делаем вывод.
Полученное эмпирическое значение больше
критического (27>3), значит различия достоверны.
Различия достоверны (U=27; p≤0,05)
4. Критерий Уилкоксона
Т-Критерий Уилкоксона - непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных измерений. Впервые предложен Фрэнком Уилкоксоном.
Другие названия: W критерий Уилкоксона, критерий знаковых рангов Уилкоксона, критерий суммы рангов Уилкоксона, Критерий Уилкоксона для связных выборок .
Назначение критерия.
Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.
Критерий Вилкоксона - один из самых известных инструментов непараметрической статистики (наряду со статистиками типа Колмогорова-Смирнова и коэффициентами ранговой корреляции). Свойствам этого критерия и таблицам его критических значений уделяется место во многих монографиях по математической и прикладной статистике (см., например, [1-3]).
Однако в литературе имеются и неточные утверждения относительно возможностей критерия Вилкоксона. Так, одни полагают, что с его помощью можно обнаружить различие между функциями распределения F(x) и G(x). По мнению других, этот критерий нацелен на проверку равенства медиан распределений, соответствующих выборкам. И то, и другое, строго говоря, неверно. Настоящая статья написана, чтобы внести ясность в рассматриваемый вопрос.
Введем некоторые обозначения. Пусть F-1(t) - функция, обратная к функции распределения F(x). Она определена на отрезке [0;1]. Положим L(t) = G(F-1(t)). Поскольку F(x) непрерывна и строго возрастает, то F-1(t) и L(t) обладают теми же свойствами. Важную роль в дальнейшем изложении будет играть величина a = P(X < Y) . Как нетрудно показать,
a = P(X < Y) = .
Введем также
b2 = - (1 -a)2 , g2 = - a2 .
Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни согласно [1, с.160] выражаются через введенные величины:
E(U) = mna , E(S) = mn + m(m+1)/2 - E(U) = mn(1- a) + m(m+1)/2,
D(S) = D(U) = mn [ (n - 1) b2 + (m - 1) g2 + a(1 -a) ] . (1)
Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными с параметрами, задаваемыми формулами (1) .
Если
выборки полностью однородны, т.е.
их функции распределения
H0: F(x) = G(x) при всех x, (2)
то L(t) = t и a= 1/2. Подставляя в формулы (1), получаем, что
E(S) = m(m+n+1)/2, D(S) = mn(m+n+1)/ 12 (3) .
Следовательно, распределение нормированной и центрированной статистики Вилкоксона
T = ( S - m(m+n+1)/2) (mn(m+n+1)/ 12 ) - 1/2 (4)
при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1).
Правила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (2). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона?
Пусть объемы выборок достаточно велики, так что можно пользоваться асимптотической нормальностью статистики Вилкоксона. Тогда в соответствии с формулами (1) статистика T будет асимптотически нормальна с параметрами
E(T) = ( 12mn ) 1/2 (1/2 - a) (m+n+1) - 1/2 ,
D(T) = 12 [(n - 1) b2 + (m - 1) g2 + a(1 -a) ] (m+n+1) - 1 . (5)
Из формул (5) видно большое значение гипотезы
H01: a = P(X < Y) = 1/2 . (6)
Если эта гипотеза неверна, то, поскольку m # n, справедлива оценка
u E(T) u $ ( 12m n (2n+1) - 1) 1/2 u 1/2 - au ,
а потому u E(T) u безгранично растет при росте объемов выборок. В то же время, поскольку
b2 # # 1, g2 # # 1, a(1 -a)#1/4, то
D(T) # 12 [(n - 1) + (m - 1) + 1/4] (m+n+1) - 1 # 12. (7)
Следовательно, вероятность отклонения гипотезы H01 , когда она неверна, т.е. мощность критерия Вилкоксона как критерия проверки гипотезы (6), стремится к 1 при возрастании объемов выборок, т.е. критерий Вилкоксона является состоятельным для этой гипотезы при альтернативе
АH01: a = P(X < Y) ё 1/2 . (8) .
Если же гипотеза (6) верна, то статистика T асимптотически нормальна с математическим ожиданием 0 и дисперсией, определяемой формулой
D(T) = 12 [(n - 1) b2 + (m - 1) g2 + 1/4 ] (m+n+1) - 1 . (9)
Приведем пример двух функций распределения F(x) и G(x):
a = P(X < Y) = тF(x)dG(x) , 1 - a = P(Y < X) = тG(x)dF(x) (10) ,
a = 1/2 в
случае справедливости
т(F(x) - G(x)) dF(x) = 0,
а потому естественно в качестве F(x) рассмотреть функцию равномерного распределения на интервале (-1 ; 1). Тогда формула (11) переходит в условие
т(F(x) - G(x)) dF(x) = - 1/2 т(G(x) - (x + 1)/2 ) dx = 0 (11) .
Это условие выполняется, если функция (G(x) - (x + 1)/2 ) является нечетной.
4.1 Описание критерия.
Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10-15% от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно отличаются между собой, и принимают какие-то конечные значения, например. +1, -1 и 0, формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.
Суть метода состоит в том, что мы сопоставляем абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Этот критерий применим в тех случаях, когда признаки измерены по крайней мере по шкале порядка, и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применять Т - критерий Вилкоксона и в тех случаях, когда сдвиги принимают только три значения: -1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, скажем, от -30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.
Первоначально мы исходим из предположения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом - сдвиг в более редко встречающемся направлении.
Ограничения критерия.
Объем выборки – от 5 до 50 элементов.
Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)
Минимальное количество испытуемых, прошедших измерения в двух условиях - 5 человек. Максимальное количество испытуемых - 50 человек, что диктуется верхней границей имеющихся таблиц.
Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.
4.2 Алгоритм
- Составить список испытуемых в любом порядке, например, алфавитном.
- Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.
- Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.
- Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.
- Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.
Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.
Гипотезы Т – критерия Вилкоксона
H0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
4.3. Пример "№1"

- Матренин двор
- Матриархат: от ватикана и до мекки
- Матрица STEP анализа ОАО Курской фабрики технических тканей
- Матрица Ансоффа
- Матрица БКГ
- Матрица БКГ. Три стратегии М.Портера
- Матрица Бостонской консультационной группы
- Матеріалістичні концепціїї релігії
- Матеріально-інформаційна природа систем та їх функціонування
- Матеріально-технічне забезпечення на підприємстві
- Матеріально-технічне забезпечення підприємства
- Матерьялы инвентаризации, порядок их оформления
- Мативационный процесс
- Мативация