Количественные методы оценки

НЕКОТОРЫЕ ПРИЕМЫ КОЛИЧЕСТВЕННОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ  ПСИХОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ1

  1. НЕКОТОРЫЕ ВВОДНЫЕ ПОНЯТИЯ И ТЕРМИНЫ

    Как указывалось в главе I, всякая количественная оценка в психологии является по существу своему статистичной, т.е. обработка получаемых результатов должна производиться теми или иными методами математической статистики. Последняя является прикладной отраслью математики, основанной на теории вероятностей и предназначенной, в самом общем плане для систематизации и анализа эмпирических (опытных) данных, получаемых при изучении массовых явлений, т.е. явлений повторяющихся и непременно варьирующихся. Статистика - это прием наблюдения, и метод его, и сбор данных, и анализ этих данных. Математическая статистика выступает специфическим элементом методологии многих конкретных наук (физики, химии, психологии и т.д.), она устанавливает особые статистически закономерности. Применение математической статистики в современных исследованиях является чрезвычайно широким и многообразным. В целом она дает аппарат для описания и обобщения эмпирических результатов, объясняет причину “случайного”, дает ему определенное вероятностное толкование.

    Вероятность (математическая) Р - это определенная количественная (и соответственно формализованная) оценка (или мера) объективной возможности появления определенного события А в заданной совокупности условий, что обозначается обычно как Р (А).

    Каково  бы ни было определение математической вероятности (классическое, комбинаторное, статистическое  или субъективное), это понятие призвано отражать некоторые объективные свойства изучаемых явлений, и каждое определение отражает свою сторону общего объективного свойства. Само утверждение о наличии вероятности требует обоснования или проверки для каждого отдельного случая практики, и никогда предельное и теоретическое понятие математической вероятности не совпадает прямо с чисто житейским (обусловленным речевой практикой) пониманием ее как степени субъективной уверенности в чем-то. Математическая вероятность - это особая логическая категория, отвечающая объективным и независимым от познающего ума отношениям, но она и умозрительна, так как форма ее зависит от тех или иных теоретических представлений по типу представлений, например об экваторе или Гринвичском меридиане. Математики давно и четко определяют это, однако практике реальных измерений все же бывает свойственна стихийная подмена понятий вероятности и эмпирической частоты некоего события (см., например, методологическую критику Э.Г. Борингом системы математических доказательств в парапсихологии)2.

    Мера  вероятности - это мера случайности  события т.е. такого события, которое  может произойти, а может и  не произойти. Вообще случайное может  быть понятно как следствие совмещения или пересечения тех причинно-следственных целей. Которые вначале представляются как взаимонезависимые цепи.

    Событие - это один из возможных исходов  эксперимента. События могут быть и равновероятными, и разновероятными, но сумма вероятностей всех возможных  событий. Всех исходов эксперимента должна равняться единице (полная группа событий).

    Согласно  классическому определению, вероятность события А исчисляется как Р(А)=.m/n , где m - чисто благоприятных исходов для события А (число случаев наступления этого события), n- общее число всех возможных исходов. При этом сразу же постулируется равновероятность всех возможных событий (свойство симметрии) и их несовместимость, т.е. невозможность одновременного наступления двух событий. Согласно этому определению, вероятность любого события А заключена между нулем (невозможное событие) и единицей (достоверное событие), т.е. 0£P(A)£1.

    Статистическое (частотное) определение вероятности  основано также на признании некоторого естественного свойства симметрии, и здесь вероятность - это почти  постоянная, устойчивая частота появления  данного события при достаточно большом (стремящемся к бесконечности) числе независимых испытаний, т.е. таких, когда вероятность любого нового исхода не зависит от исходов предшествующих.

    Заметим, что аксиоматика теории вероятностей вводит соответствующую схематизацию и в то объективное явление которое исследуется (формализуется) вероятностными методами. Отсюда целая система ограничений и допущений в содержательном анализе изучаемого явления, от которых невозможно уйти, но которые всегда полезно четко осознавать специалисту-математику.

    В связи с этим интересны определение  и трактовка одного из основных принципов  математической статистики - закона больших чисел, тем более, что эта трактовка в философско-методологическом смысле достаточно дискуссионна. Исходная формулировка закона больших чисел сводится, в принципе, к следующему: если однородное событие наблюдается в очень большом числе испытаний и его исходы зависят от постоянных причин, имеющих определенное направление, но меняющихся в ту и другую стороны вне каких-либо закономерностей, то между результатами различных испытаний устанавливаются почти неизменные отношения. А.Н. Колмогоров считает закон больших чисел одним из выражений диалектической связи между случайностью и необходимостью, так как совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. Это происходит в особых  условиях (весьма общих, но не универсальных), когда имеются взаимопогашение разносторонних индивидуальных отклонений от средней, причем общая закономерность проявляется тем больше, чем больше число наблюдений.

    Итак, с одной стороны, данный закон  выдвигает принцип репрезентативности статистического наблюдения, т.е. произведения максимально возможного числа измерений, дабы ограничить, свести до минимума влияние факторов случайных. С другой, закон больших чисел предполагает непременное уравновешивание воздействий этих случайных факторов, специфика которых дана в формулировке закона: случайных воздействий много, их вероятности и воздействия равны и бесконечно малы. Отсюда многие авторы справедливо подчеркивают частный характер закона больших чисел, т.е. одинаково допускают наличие и таких статистических наблюдений, которые даже при неограниченном своем увеличении все-таки не дадут в результате симметрического статистического распределения. Советский статистик И.С. Пасхавер3 считает, что обобщенное проявление закона больших чисел состоит не во взаимопогашении различий индивидуальных значений, а во взаимопогашении различий между эмпирическими частотами каждого значения и их теоретическими вероятностями. Последнее применимо как к процессу симметричному, так и к асимметричному.

    Опрос трактовки закона больших чисел, затрагиваемый нами, отнюдь не является вопросом сугубо теоретическим, ибо  ответ на него (пусть и не вполне осознаваемый исследователем - нематиматиком) предопределяет собой трактовку вероятности и случайности, а значит, саму подготовку эксперимента, пути и критерии анализа результатов статистического эксперимента и объективность последующей качественной интерпретации выводов. Например, если мы признаем универсальность закона больших чисел и его всеобъясняющую силу, то, получая в эксперименте скошенное статистическое распределение, объясняем его просто качественной неоднородностью группы испытуемых(т.е. считаем это ошибкой нечистой методики), значит, по существу, мы игнорируем имеющийся факт асимметрии распределения, условно считая распределение симметричным (гауссовым), применяя для его дальнейшей обработки и соответствующий тому математический аппарат (среднее арифметическое значение, критерий Стьюдента и т.д.). Если же мы, напротив, не считаем полученную в эксперименте асимметрию артефактом, а анализируем ее истинные причины и применяем затем адекватный аппарат математики, мы можем вскрыть в измеренном явлении какие-то новые объективные свойства, которые заведомо выпадали из нашего анализа при первом (и по существу своему теоретико-вероятностном) подходе к полученным статистическим данным.

    Статистическая  совокупность (или выборка) - это вся система событий как исходов эксперимента, это ряд случайных значений измеренного признака х1, х2..., хi...., xn, варьирующих в силу тех или иных статистических закономерностей.

    Варианта (хi) - это единица выборки, каждое отдельное хi - значение статистической совокупности, результат отдельного измерения (по аналогии с событием терминах теории вероятностей).

    Объем совокупности (N) - общее число вариант в статистической совокупности (выборке), общее количество единичных измерений.

    Частота (fi) - число, показывающее, сколько раз встречается в выборке каждая варианта xi, так, что по определению сумма всех частот равна объему выборки, т.е. fi =N.

    Частость  (wi) - это доля каждой частоты fi в общем объеме выборки N, т.е.   wi=fi/N. Напомним, что предел такой частости есть статистическое определение вероятности (равенство Мизеса), но частость всегда определена опытом, тогда как вероятность объективна; они сближаются, но никогда не сливаются. При небольшом же числе испытаний классические формулы вероятности становятся иллюзорными.

Выборка должна обладать свойством качественной однородности, т.е. все ее варианты должны представлять собой некие индивидуальные величины одного и того же качества, или внутреннего свойства. Обеспечение  качественной однородности - это всегда ограничение некой естественной вариативности изучаемого свойства рамки конкретной исследовательской задачи. Например, при исследовании памяти десятилетнего ребенка качественно однородную выборку составят любые дети десятилетнего возраста независимо от пола, национальности, образования, состояния здоровья и т.п. Сужение исследовательской задачи соответственно ужесточит и отбор испытуемых в качественно однородную статистическую совокупность. Общий же подход к признанию качественной однородности (либо неоднородности) выборки продиктован, как указывалось, методологией, т.е. той или иной трактовкой закона больших чисел.

    Генеральная совокупность - это неограниченно большая или вся мыслимая совокупность измерений, индивидуумов или явлений, о свойствах которых мы собираемся судить в результате эксперимента, на основании данной статистической совокупности. Это понятие является теоретическим по существу своему, ведь именно в генеральной совокупности определена теоретическая вероятность. Научные выводы всегда обобщены, т.е. всегда распространены на ту или иную генеральную совокупность. Мы измеряем, например, пороги ощущений у тридцати студентов такого-то курса такого-то института, но получаемые результаты (стихийно или вполне осознанно) можем переносить на всех студентов данного курса или всего института или на всех студентов вообще и т.д. Математические правила такого переноса выводов вытекают также из закона больших чисел, практически реализуются с помощью математической теории планирования эксперимента.

    Итак, измерение любого психического проявления дает нам не единичное значение, а некоторую совокупность, где все варианты непременно должны быть объединены наличием (и проявлением) некоторой устойчивой статистической закономерности, которая обусловлена сущностью этой статистической совокупности, сущностью самого исследуемого процесса и условиями его протекания при измерении. Обозначим самые общие причины (или факторов), обусловливающие вариативность значения признака, измеряемого в психологическом эксперименте:

  1. Случайные (и в существе своем неустранимые) технические колебания (аппаратура, измерительная техника и т.п.).
  2. Изменения условий внешней среды, признание которых  постоянными может считаться лишь достаточно условным, ибо здесь возможны колебания случайные, к тому же в понятие внешней среды следует отнести многие из тех факторов, влияющих на психологический эксперимент, которые обозначены в разд. 2 гл. I данного пособия (экспериментатор, инструкция, рабочая обстановка, протокол).
  3. Случайные внутренние колебания, т.е. изменение тех условий, которые преломляют через себя известные внешние воздействия и наряду с последними предопределяют результат конечного измерения; сюда относятся условия как физиологические (состояние здоровья, уровень бодрствования, усталость, ощущение сытости или голода), так и условия сугубо психологические (адаптация, обучение, мотивация, эмоции, межличностные взаимодействия и прочее, обозначенное в разд. 2 гл. I ).
  4. Различия в возрасте испытуемых.
  5. Половые различия в группе испытуемых.
  6. Типологические различия испытуемых.
  7. Индивидуальные, в том числе личностные, различия испытуемых. Каждый индивид чем-то отличен от другого. Например, у двух студентов с одинаковыми типами высшей нервной деятельности будут разные характеры, внешность, физическая сила, уровень развития психических функций и т.п. А ведь науку интересует в конечном счете индивид сам по себе, а как представитель какой-то обобщенной группы людей (по типу высшей нервной деятельности, по характеру, по возрасту, национальности и т.п.).

2. ПЕРВОНАЧАЛЬНАЯ ОБРАБОТКА ИСХОДНОГО МАТЕРИАЛА

    Итак, полученная в измерении статистическая совокупность несет в себе максимум сведений об исследуемом процессе, которые должны быть далее проанализированы с целью получения характеристики  объекта исследования. В принципе, каждая варианта выборки имеет определенное право представлять собой изучаемый процесс. Поэтому весь исходный эмпирический материал, имеющийся в виде выборки, должен быть вначале упорядочен, т.е. сведен к некоторой удобной для обозрения и дальнейшего осмысливания форме.

    2.1. Упорядочивание - это некоторый исходный этап первоначальной обработки, состоящий в расположении вариант выборки в какой-либо последовательности, удобной для дальнейшего анализа и рассмотрения.

    Пример  №1. В эксперименте по заучиванию ряда десяти двузначных чисел (работа №10 в гл. II) результаты заучивания после первого предъявления составили для 35 испытуемых следующие величины: 5, 3, 5, 5, 4, 3, 3, 4, 1, 4, 5. 4, 4, 3. 4, 5, 3, 3, 4, 5, 4, 2, 3, 2, 4, 2 , 4, 3, 4, 3, 3, 4, 2, 4, 5.

    Упорядочив варианты по степени их возрастания, получаем следующий статистический ряд: 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5.

    2.2. Вслед за упорядочением вариант  часто производят их  группировку. Для случаев непрерывной переменной, т.е. такой единицы измерения, которая может иметь дробные значения (в отличие от дискретной переменной, подобной нашему примеру №1), группировка - это объединение вариант в интервалы, границы которых устанавливаются произвольно и непременно указываются. Такие интервалы могут быть и неравномерными. Срединное значение, или центр интервала, берется обычно числом целым.

    2.3. Следующим этапом, логически вытекающим  из двух предшествующих, является  табулирование, т.е. построение таблиц или собственно статистических распределений, в которых каждой варианте хi поставлена в соответствие ее частота fi в выборке или при необходимости - частость wi.

    Пример  № 2. В эксперименте по выработке  двигательного навыка (работа № 14 в  гл. II) результаты первой пробы для 30 испытуемых (после упорядочивания) имеют вид такого статистического ряда (в сек.): 5,3; 5,9; 6,2; 6,6; 6,8; 7,0; 7,3; 7,7; 7,8; 7,9; 8,1; 8,3; 8,4; 8,6; 8,6; 8,8; 8,9; 9,3; 9,5; 9,7; 10,3; 10,6; 11,0; 11,4; 11,6; 11,6; 11,9; 12,6; 13,1; 13,9.

    Произведя группировку и табулирование, получаем следующее статистическое распределение:

    Таблица 1

Интервал (границы      интервала) Центр интервала  xi Частота fi Частость wi
5,5>xi>4,5 5 1 0,03
6,5>xi>5,5 6 2 0,07
7,5>xi>6,5 7 4 0,13
8,5>xi>7,5 8 7 0,23
9,5>xi>8,5 9 5 0,17
10,5>xi>9,5 10 3 0,17
11,5>xi>10,5 11 3 0,10
12,5>xi>11,5 12 2 0,07
13,5>xi>12,5 13 2 0,07
14,5>xi>13,5 14 1 0,03

N - 30

    Конечно, такая классификация вариант  в искусственные интервалы искажает исходную выборку и требует введения особой поправки на непрерывность интервала при последующих вычислениях (см. литературу к гл. III).

    Для примера № 1 статистическое распределение  таково:

    Таблица 2

xi 1 2 3 4 5
fi 1 4 10 13 7
wi % 3 11 29 37 20

    N - 35

    2-4. Следующим этапом первоначальной обработки выступает графическое представление статистического распределения. В математической статистике принято два вида графических представлений:

    а) полигон (или многоугольник) частот - это ломаная линия, соединяющая  точки, соответствующие величинам частот, откладываемым по оси ординат; это единственный способ графического изображения дискретных статистических распределений;

    б) гистограмма - график, имеющий вид  прямоугольников, основание которых (по оси абсцисс) соответствует интервалу, а высота - частоте (частотному интервалу); площадь гистограммы (в единицах оси ординат) равна, таким образом, общему объему выборки N; графическое представление в этой форме предпочтительнее полигону частот в случае неравномерных интервалов и резких колебаний fi.

    На  рис. 15 дан полигон частот для  примера № 1 (по результатам табл. 2). На рис 16 построены гистограмма  и полигон частот для примера  №2 (по данным табл. 1).

    Помимо  указанных, могут оказаться полезными  графические представления в  виде различных диаграмм, например круговых.. 

3. ПОНЯТИЕ О КРИВОЙ  РАСПРЕДЕЛЕНИЯ.

ФОРМА РАСПРЕДЕЛЕНИЯ, ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ

(КЛАССИЧЕСКИЕ) РАСПРЕДЕЛЕНИЯ

    Кривая  распределения - это предел, к которому стремится полигон частот при неограниченном увеличении объема статистической совокупности и уменьшении интервалов (увеличение точности измерения, переход от дискретной величины к непрерывной). Она дает характеристику некоторой генеральной совокупности, т.е. получаемые в эксперименте выборки лишь в той или иной степени приближаются к своему теоретическому пределу. Кривая распределения позволяет наглядно представить форму распределения, т.е. определенную закономерность специфической концентрации вариант в цельной статистической совокупности.  Форма   распределения    является  некоторой обобщенной 

fi

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1 

      1         2        3       4        5        6       7        8       9       10       11      12        xi   

    Рис. 15. Полигон частот для примера  № 1

fi

10

9

8

7

6

5

4

3

2

1 

          1      2       3       4     5     6     7    8     9     10     11     12     13     14    15    16     xi

Рис. 16. Гистограмма и полигон частот (пунктиром) для примера № 2. 

характеристикой выборки: ведь исследуемая статистическая закономерность проявляется не только в обозначении среднего уровня измеренного процесса, но и в регуляции отклонений от этого уровня, т.е. в обозначении формы статистического распределения.

    Все бесконечное разнообразие эмпирических кривых распределения (вне связи  с теоретико-вероятностными построениями) принято делить на две большие группы: одновершинные и многовершинные  (см. рис. 17, а). Последние называются также составными распределениями, т.е. являются следствием совместного графического представления различных (качественно разнородных) статистических совокупностей, в образовании которых преобладают какие-то различные закономерности. 
 
 
 

               А 
 
 
 
 
 
 

    б                                                                   в 
 
 
 
 
 

    г                                                                   д 
 
 
 
 

    Рис. 17. Основные эмпирические типы форм распределения:

    а - многовершинные, б- симметричные, в - умеренно скошенные,       г - крайне асимметричные, д- U-образные. 

    Одновершинные распределения в свою очередь  делятся на следующие группы:

    а) симметричные (см. рис. 17, б), т.е. такие, в которых идет равновероятное уменьшение величины признака по обе стороны  от некоторого и максимально частого  значения; примером таких, сравнительно редко встречающихся в практике распределений является расположение людей по величине роста;

    б) умеренно асимметричные или скошенные (см. рис. 17, в), в которых убывание числовых значений переменной в одну из сторон выражено заметно сильнее; таковы, например, распределения подавляющего большинства измерений эффективности человеческой деятельности;

    в) распределения крайне асимметричные (см. рис. 17, г), характерные, например для  распределения населения капиталистических  стран по величине материальной обеспеченности;

    г) U-образные (см. рис. 17, д), в которых наибольшая частота свойственна обоим крайним значениям признака, например распределение облачности в районе  Гринвичского меридиана.

    Таким образом, мы убеждаемся в большой  показательности формы статистического  распределения и в необходимости  ее последующего рассмотрения при анализе полученных результатов.

    Закон распределения - математическое соотношение, устанавливающее связь между возможными значениями варианты и соответствующими им вероятностями. Дать закон распределения случайной величины - это значит свести эмпирическую совокупность к тому теоретико-вероятностному закону, которому она более всего подчиняется. Закон распределения может быть задан:

    а) таблицей или рядом распределения, в котором каждому значению xi поставлена в соответствие его вероятность  Pi;

    б) многоугольником распределения (полигон  частот);

    в) функцией распределения - аналитическим  выражением (формулой), по которому может  быть установлена вероятность каждого  текущего значения случайной величины.

    Теоретически (т.е. исходя из позиций чисто вероятностных) выделяют три важнейших типа распределений, которые называют часто классическими: биномиальное, нормальное (или распределение Гаусса) и распределение Пуассона.

    Биномиальное  распределение - это математическая модель  ситуации, подобной той, что описывает классические игры вероятностей, типа подсчета односторонних выпаданий монеты или граней игральной кости при их идеальном подбрасывании.

    Здесь все испытания независимы, вероятности  всех событий равны и в сумме  составляют единицу. Тогда вероятность Pn(m), т.е. вероятность осуществления m раз некоторого события A в серии испытаний n (общее число всех событий), описывается как последовательные члены разложения бинома n(q+p)m , где p - вероятность наступления одиночного события A (например, это 1/2 для выпадания орла при подбрасывании идеальной монеты), q - вероятность события, противоположного событию  A, или вероятность неосуществления события A(q=1-p).

    Так что итоговая формула биноминального закона распределения имеет вид:

    Pn(m) = Cmnpmqn-m,

 где Cmn - есть число сочетаний из n по m, т.е.

Cmn = n! / m! (n-m)!

    Биноминальное распределение полностью описывается (математически определено) двумя  параметрами (показателями):n и p, так как его среднее значение  M= np, а мера разброса значений (среднее квадратическое отклонение) Q =  npq.  

    Форма биноминального распределения существенно  зависит от величин n и p, приближаясь в общем случае к симметричному распределению (см. рис. 17, б).

Количественные методы оценки