Тестологии начала XX века

1. Введение

Любой современный человек, несомненно, мог бы привести пример психологического теста. Достаточно было припомнить тест, который предлагался в школе, колледже, на военной службе, в консультационном центре или в отделе кадров. Многим людям выпадает возможность поучаствовать в эксперименте, где использовались стандартизованные тесты. Но еще пятьдесят лет назад ничего подобного, разумеется, не было. Психологическое тестирование-относительно молодое направление в одной из самых молодых наук.

2. Современное использование тестов

Серьезным импульсом к развитию тестов стали проблемы типа тех, что возникают при обучении. В настоящее время школы - один из основных потребителей тестов. Распределение детей по способностям, в соответствии с которыми применяются разные типы школьного обучения, выявление интеллектуально отсталых, с одной стороны, и одаренных-с другой, оценка причин академической неуспеваемости, учебные и профессиональные консультации учащихся средних школ и колледжей, отбор в профессиональные и другие специальные школы - вот лишь некоторые примеры использования тестов в образовании.

3. Вклад Френсиса Гальтона.

Английский биолог сэр Френсис Гальтон был одним из тех, кто положил начало тестированию. Его многочисленные и разнообразные исследования объединяет интерес к наследственности у человека. По мере изучения наследственности Ф. Гальтон все более осознавал необходимость измерения характеристик людей, состоящих и не состоящих в родстве. Только таким путем он смог установить, например, точную степень сходства между родителями и их потомками, братьями и сестрами, родными и двоюродными, или близнецами. С этой целью Ф. Гальтон обследовал множество учреждений в системе образования, в которых вел систематические антропометрические измерения учащихся. Он также организовал на Всемирной выставке 1884 г. антропометрическую лабораторию, и, заплатив три пенса, ее посетители могли измерить некоторые из своих физических характеристик и пройти тесты на остроту зрения и слуха, мышечную силу, время реакции и другие элементарные сенсомоторные функции. После закрытия выставки лаборатория переехала в Лондон в Южно-Кенсингтонский музей и действовала там еще шесть лет. Такими методами постепенно накапливались первые систематические данные по индивидуальным различиям в протекании простых психологических функций.

4. Определение научного статуса тестов.

С момента первых публикаций Ф. Гальтона и Дж. Кэттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же противники. В числе сторонников были: в Германии Г, Мюнстерберг, С. Крепелин, В. Онри, во Франции - А. Вине, в США - Дж. Гилберт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремление к прикладным исследованиям в психологии прошлого расценивалось как отход от науки, Дж. Кэттелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуальных различий в 1885 году, но публиковаться не мог из-за противодействия В. Вундта J[Cattell D„ 1896).

Итак, научный статус тестов не был определен, возможность измерений в психологии подвергалась сомнению. Психология переживала трудный период: она уже не могла развиваться на старой основе, но и не научилась еще смотреть на мир по-новому. “Причина кризиса,— писал
Л. С. Выготский,—лежит в развитии прикладной психологии, приведшей к перестройке всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает ее к разрыву на две науки.” Общественная практика требовательно выдвигала одну проблему за другой и ни одну из них старая психология решить не могла у нее (не было подходящих методов.

Появление в этой ситуации прикладной психологии не было случайностью. Ей было дано название психотехника. Прикладное направление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном развитии ребенка, в тот период она была в основном прикладной педагогикой. Будучи непринятыми в традиционной науке — в психологии и в педагогике, тесты быстро нашли себе применение в прикладных направлениях. В общем, произошло так, как говорили в Древности: если какой-либо науке не находится место в храме, она начинает развиваться у его стен.

Начало 30-х годов характеризуется широким использованием тестов во многих странах. Во Франции они стали применяться для, дефектологических целей и для профориентации, в США тесты использовались при приеме на работу, в вузы, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В СССР тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора—профориентации.

5. Альфред Бине и интеллектуальные тесты.

А. Бине и его сотрудники много лет посвятили эффективным и оригинальным исследованиям способов измерения интеллекта. Были испробованы многие методы, даже измерение черепа, лица, формы рук и анализ почерка. Результаты, однако, все более убеждали, что непосредственное, хотя бы и грубое, измерение сложных интеллектуальных функций наиболее перспективно. И наконец, одна неожиданная ситуация привела А. Бине к желанной цели. В 1904 г. министр общественного образования назначил А. Бине в Комиссию по изучению методов обучения умственно отсталых детей. Именно в связи с целями, стоящими перед этой комиссией, А. Бине в сотрудничестве с Т. Симоном создал первую шкалу Бине-Симона (1905).

Эта шкала известна теперь как шкала 1905 г., она состояла из 30 заданий или тестов, расположенных по возрастающей трудности. Уровень трудности определялся эмпирически, предъявлением тестов 50 нормальным детям в возрасте от 3 до 11 лет, нескольким умственно отсталым детям и взрослым. Тесты были рассчитаны на широкий диапазон функций, особо выделялись способности к суждению, пониманию и рассуждению, оцениваемые А. Бине как основные компоненты интеллекта. Хотя сенсорные и перцептивные тесты также были включены, но в этой шкале по сравнению с большинством серий тестов того времени большую часть занимал вербальный материал. Шкала 1905 г. предлагалась как предварительный инструмент, но никакого точного объективного метода получения общего показателя не давалось.

Во второй шкале, 1908 г., общее число тестов было увеличено, некоторые неудачные тесты более ранней шкалы изъяты, и все тесты были сгруппированы по возрастным уровням на основе их выполнения примерно 300 нормальными детьми в возрасте между 3 и 13 годами. Так, к уровню 3 лет были отнесены все тесты, которые выполняли от 80 до 90% нормальных трехлетних детей; к уровню 4 лет подобным же образом отнесли все тесты, которые выполняли нормальные четырехлетние дети, и т.д. до 13 лет. Показатель ребенка по всем тестам мог бы в этом случае выражать умственный уровень, соответствующий возрасту нормальных детей, чье выполнение было таким же. В разных переводах и переработках шкал Бине термин «умственный уровень» обычно заменялся на «умственный возраст», поскольку умственный возраст-понятие простое и доступное, и его введение несомненно способствовало популяризации интеллектуального тестирования². Сам А. Бине избегал им пользоваться из-за нежелательных ассоциаций с развитием и предпочитал более нейтральный термин «умственный уровень».

Третий вариант шкалы Бине-Симона появился в 1911 г., отмеченном преждевременной смертью А. Бине. Шкала эта по сравнению с предыдущей содержала незначительные изменения: перестановку отдельных тестов, новые тесты для некоторых возрастных уровней, и была продлена до взрослого уровня.

Еще до пересмотра 1908 г. тесты Бине-Симона привлекли широкое внимание психологов всего мира. Их переводы и адаптации появились на многих языках. В Америке было опубликовано множество переработанных вариантов, самым удачным из/ которых был вариант, разработанный под руководством Л. М. Термена в Станфордском университете и известный как шкала Станфорд-Бине Именно 1 в этом варианте был впервые использован коэффициент интеллектуальности (10'), или отношение между умственным возрастом и фактическим возрастом. Позднейшая переработка этой шкалы, используемая в наше время достаточно широко, будет подробно рассмотрена в гл. 9. Особый интерес представляет также вариант Кюльманна-Бине, в котором возрастной диапазон был сдвинут вниз до уровня 3 мес. Эта шкала-одна из наиболее ранних попыток разработки тестов интеллекта для младенцев и дошкольников.

6. Групповое тестирование

Тесты А. Бине, как и их позднейшие переработки, являются индивидуальными шкалами в том смысле, что они могут быть применены одновременно только к одному человеку. В большинстве этих тестов предусматривается, что испытуемый или отвечает устно, или осуществляет какие-то действия с предметами, причем в некоторых из них требуется учитывать индивидуальное время ответа. По этим и другим причинам такие тесты не приспособлены для группового использования. Для тестов типа теста Бине характерно и то, что они нуждаются в высококвалифицированном экспериментаторе. Такие тесты по существу являются клиническими средствами, приспособленными к интенсивному изучению конкретных случаев.

Групповое тестирование, так же как и первая шкала Бине, было создано в ответ на настоятельную потребность практики. Когда Соединенные Штаты вступили в первую мировую войну в 1917 г., Американской психологической ассоциацией был назначен комитет для рассмотрения тех средств, которыми психология может помочь ведению войны. Этот комитет под руководством Р. М. Йеркса столкнулся с необходимостью быстро определить интеллектуальный уровень полутора миллионов новобранцев.

Ф.Л. Гудинаф отмечает, что в 1887 г., за 21 год до появления шкалы Бине-Симона 1908 г., С.Э. Шайе опубликовал в Ньюорлеанском медицинском журнале серии тестов для детей, распределив их в соответствии с возрастом, в котором эти тесты обычно приводятся. Частично вследствие малой доступности журнала, частично же из-за того, что ученый мир еще не был к этому готов, идея возрастной шкалы в это время осталась незамеченной. На создание подобной шкалы самим А. Бине повлияли работы таких его современников, как А. Блин и Г. Даме, подготовивших серию вопросов, на основании которых они получали единый суммарный показатель по каждому ребенку.

Такая информация требовалась для принятия решений о признании негодными к военной службе, распределении по разным родам войск, приеме в лагеря обучения офицеров и т.п. Военные психологи привлекли все имеющиеся материалы, в частности неопубликованный тест для группового тестирования интеллекта Артура С. Отиса. Основным достоинством теста Отиса, который он составил, будучи аспирантом Л. М. Термена, было введение различного типа объективных заданий, в том числе с множественным выбором ответов.

Тесты, которые в конце концов создали военные психологи, стали называться армейский альфа и армейский бета. Первый предназначался для общего обычного тестирования; второй, как шкала невербальная, был рассчитан на неграмотных и новобранцев иностранного происхождения, которые не могли ответить на задания теста на английском языке. Оба теста можно было использовать в больших группах людей.

Вскоре после окончания первой мировой войны военные тесты стали использоваться в гражданской службе. Армейские альфа и бета неоднократно перерабатывались (последние их варианты употребляются даже в наши дни) и стали образцом для большинства групповых тестов интеллекта. Тестирование получило сильнейший стимул для своего развития. Вскоре были разработаны групповые тесты интеллекта для всех возрастов и уровней образованности -от дошкольников до аспирантов. Еще совсем недавно невыполнимые, массовые программы тестирования затевались с завидным оптимизмом. Поскольку групповые тесты создавались как средства массового тестирования, то их инструкции и процедура проведения были достаточно просты, и экспериментатору требовался минимум обучения. Школьные учителя начали использовать тесты интеллекта в своих классах. Студенты колледжей перед зачислением проходили стандартную проверку. Предпринималось широкое обследование особых групп взрослого населения, таких, как заключенные. Вскоре 1() был признан общественностью.

Применение групповых тестов интеллекта значительно обогнало их методические возможности. В погоне за показателями и практическими результатами частенько забывалось, что тесты оставались достаточно грубым инструментом. Когда же тесты не оправдывали необоснованных ожиданий, то часто это приводило к скептицизму и враждебному отношению ко всякому тестированию. Таким образом, тестовый бум 20-х гг., приведший к неразборчивому применению тестов, не только задержал, но и способствовал прогрессу психологического тестирования.

7. Тестирование способностей

Хотя тесты интеллекта как оценивающие общий интеллектуальный уровень индивида первоначально рассчитывались на проверку самых различных функций, вскоре стало очевидным, что область применения таких тестов, поскольку в них были представлены не все существенные функции, весьма ограниченна. Фактически, большинство тестов интеллекта в основном измеряло вербальные способности и в какой-то мере способность оперировать числовыми, абстрактными и другими символическими отношениями.

Несомненно, тесты охватывали способности, имеющие в нашей культуре первостепенное значение. Однако психологи постепенно осознали, что необходимо более точно обозначить, что на самом деле измеряют эти тесты.

Например, большинство тестов, названных в 20-х гг. тестами интеллекта, позднее стали называть тестами способностей к учению. Такая смена терминологии была следствием осознания того факта, что многие тесты интеллекта измеряют комбинацию способностей, необходимых для учебной деятельности.

Еще до первой мировой войны психологи пришли к признанию необходимости дополнить общие тесты интеллекта тестами специальных способностей. Тесты специальных способностей разрабатывались частично для использования в профориентации, а также при отборе и распределении промышленного и военного персонала. Самыми распространенными среди них были тесты способностей к технике, канцелярской работе, музыкальных и художественных способностей.

Последовавшая вслед за необычным распространением и непрофессиональным использованием критическая оценка тестов интеллекта выявила еще один знаменательный факт: индивидуальное выполнение отдельных частей тестов весьма различно. Это особенно очевидно в групповых тестах, в которых отдельные задания обычно подразделяются на субтесты относительно однородного содержания. Так, человек может иметь относительно высокие показатели по вербальному и низкие по числовому субтесту и наоборот. В какой-то степени такая внутренняя неоднозначность наблюдается и в тестах типа Станфорд-Бине, в которых для данного индивида могут оказаться трудными, например, задания, содержащие слова, а выигрышными задания, использующие картинки или геометрические фигуры.

Люди, работающие с тестами, особенно клиницисты, часто, чтобы лучше уяснить индивидуальную психологическую структуру, сравнивали выполнение отдельных частей теста и при анализе конкретного случая рассматривали не только IQ или иной суммарный показатель, но и показатели субтестов. Но такая практика пригодна не всегда, поскольку тесты интеллекта не рассчитаны на дифференциальный анализ способностей. Часто сравниваемые субтесты содержат слишком мало заданий, чтобы дать стабильную и надежную оценку той или иной способности. В результате показатели отдельных субтестов при тестировании индивида различными вариантами одного и того же теста или в разное время могут значительно расходиться. Чтобы осуществлять такие внутрииндивидуальные сравнения, необходимы тесты, специально предназначенные для выявления различий в работе анализируемых функций.

Параллельно с этими исследованиями шло изучение структуры психики, давшее необходимый материал для построения тестов специальных способностей. Статистические работы по природе интеллекта, построенные на выявлении взаимосвязей показателей, полученных у различных испытуемых по широкому диапазону тестов, были начаты английским психологом Чарлзом Спирманом (1904; 1927) в первом десятилетии нашего века. Их методологическая разработка в трудах английских и таких американских психологов, как Т. Л. Келли и Л. Л. Терстоун (1935; 1947), стала называться факторным анализом. Данные, собранные с его помощью, показали наличие ряда относительно независимых факторов или черт. Некоторые из этих черт, особенностей, например вербальное понимание и оперирование числами, были в той или иной мере представлены в традиционных тестах интеллекта.

Другие, такие, как пространственные, перцептивные и технические способности, чаще выявлялись не тестами интеллекта, а тестами специальных способностей.

Одним из главных практических выходов факторного анализа была разработка комплексных батарей способностей, предназначенных для измерения степени выраженности у индивида той или иной особенности из некоторой их совокупности. Вместо общего показателя берутся показатели таких свойств, как вербальное понимание, пространственное воображение, арифметические способности и скорость восприятия. Такие батареи оказались подходящим средством для внутрииндивидуального анализа, или дифференциального диагноза, который много лет клиницисты ставили, основываясь на приблизительных и часто ошибочных результатах тестов интеллекта. Кроме того, эти батареи в полной программе тестирования несли значительную информацию, получаемую ранее через тесты специальных способностей, поскольку комплексные батареи способностей охватывают некоторые свойства, обычно не затрагиваемые тестами интеллекта.

Комплексные батареи способностей представляют в тестировании относительно позднее нововведение. В основном они разрабатывались уже после 1945 г., но их появление во многом определили работы военных психологов во время второй мировой войны. Большая часть тестовых исследований, проводившихся в военных организациях, исходила из факторного анализа и направлялась на создание комплексных батарей способностей. В воздушных войсках, например, такие батареи предназначались для пилотов, стрелков, радистов, штурманов и множества других военных специальностей.

8. Стандартизированные тесты достижений

По мере того как психологи разрабатывали тесты интеллекта и способностей, обычные школьные экзамены также технически усовершенствовались. Важный шаг в этом направлении был сделан бостонскими общественными школами, заменившими в 1845 г. устные экзамены учащихся письменными. Обоснование этого нововведения похоже на рассуждения более позднего времени, объяснявшие необходимость замены местоименных вопросов выбором ответа из списка возможных. Письменные экзамены ставят всех учеников в равное положение, позволяют охватить большее содержание, уменьшают элемент случайности в выборе задаваемого вопроса и сводят на нет возможную необъективность экзаменатора. На рубеже этого столетия появились первые стандартизованные тесты по измерению результатов школьного обучения. После работы Р. Л. Торндайка (1933) в этих тестах стали использоваться принципы измерения, разработанные в психологических лабораториях. В качестве примера таких тестов можно назвать шкалы оценки качества почерка и письменных сочинений, а также тесты на правописание, арифметический счет и рассуждения. Несколько позднее, после выхода в 1923 г. первого издания станфордского теста достижений, разработанного ведущими тестологами того времени Труманом Л. Келли, Джайлсом М. Рачом и Льюисом М. Терманом, появились батареи достижений. Предвосхищая многие особенности современного тестирования, эти батареи позволяли осуществлять сравнимые измерения выполнения заданий по разным школьным предметам, оцениваемого относительно единой системы нормативов.

К этому времени стали очевидными разногласия среди учителей в оценке результатов описательных тестов. К 1930 г. было признано, что описательные тесты по сравнению с объективными заданиями «нового типа» не только отнимают у экзаменаторов и экзаменующихся больше времени, но и дают менее надежные результаты. По мере того как объективные задания все шире применялись в стандартизованных тестах достижений, росло их значение в тестах на понимание и применение знаний и других общих целей обучения. 30-е гг. ознаменовались также появлением машин по подсчету тестовых показателей, которые легко было приспособить для новых объективных тестов.

Создание региональных и национальных программ тестирования также способствовало его развитию. Вероятно, наибольшей известностью пользуется программа Совета по вступительным экзаменам в колледжи. Принятая еще в конце прошлого века с целью уменьшить дублирование экзаменов для поступающих в колледжи, эта программа была основательно переработана, особенно используемые в ней методы тестирования; были расширены также типы колледжей, в которых она могла применяться. Происшедшие изменения отразили развитие не только тестирования, но и образования, поскольку в 1947 г. тестирование, осуществлявшееся Советом по вступительным экзаменам в колледжи, корпорацией Карнеги и американским Советом по образованию, было передано вновь созданной Службе тестирования в образовании, принявшей на себя ответственность за все программы тестирования для университетов, профессиональных училищ, правительственных учреждений и других организаций. Следует также упомянуть не включенную в программу Совета по вступительным экзаменам в колледжи американскую программу тестирования в колледжах 1959 г. для отбора поступающих в колледжи и несколько национальных программ тестирования для отбора на стипендии одаренных учащихся.

Тесты достижений используются не только в учебных целях, но и при отборе поступающих на работу в промышленность и государственные учреждения. Как уже сообщалось, систематические экзамены при приеме на гражданскую службу в китайской империи были введены еще в 1115г. до н.э. В европейских странах это случилось в конце XIX-начале XX в. Комиссия гражданской службы Соединенных Штатов утвердила конкурсные экзамены в 1883 г. Методы составления тестов, разработанные до и во время первой мировой войны, стали использоваться в экзаменационной Программе гражданской службы Соединенных Штатов после назначения Л.Дж. 0'Рурке директором созданного в 1922 г. исследовательского отдела комиссии.

Чем больше психологов-психометристов участвовало в создании стандартизованных тестов достижений, тем сильнее техника их построения напоминала технику построения тестов интеллекта и способностей. Процедуры составления и оценки всех этих тестов имеют много общего. Все усиливающееся стремление создать тесты достижений, которые могли бы оценить владение навыками, отвечающими широким образовательным целям, а не способность воспроизводить частные детали, тоже делало похожим содержание тестов достижений на тесты интеллекта. В настоящее время разница между этими типами тестов в основном сводится к степени специфичности содержания, определяемого тем курсом обучения, уровень освоения которого оценивается тестом.

9. Измерение личностных характеристик

Одним из первых тестов, положивших начало тестированию личности, был крепелиновский вариант теста свободных ассоциаций, примененный им для обследования больных с психическими отклонениями. В этом тесте индивиду предъявляются специально подобранные слова-стимулы, на которые он отвечает первым пришедшим ему в голову словом. Э. Крепелин (1892) использовал этот же прием для изучения психологических последствий утомления, голода и приема лекарственных препаратов и пришел к выводу, что эти факторы увеличивают относительную частоту поверхностных ассоциаций.

Примерно в эти же годы Р. Соммер (1894) предложил использовать тест свободных ассоциаций для определения форм психических расстройств. Впоследствии техника свободных ассоциаций стала использоваться для самых разных целей тестирования, она не теряет своего значения и в наши дни. Здесь следует упомянуть разработку Ф. Гальтоном, К. Пирсоном и Дж. Кэттеллом стандартизованных анкет и шкал ранжирования, предназначавшихся ими совсем не для тех целей, с которыми в итоге их стали использовать другие исследователи при составлении одних из самых распространенных в настоящее время личностных тестов.

В качестве исходного варианта анкеты личности или заполняемого испытуемым опросника можно назвать листок личностных данных
Р. С. Вудвортса, разработанный им в годы первой мировой войны. Этот листок предназначался для первичного выявления людей, страдающих неврозами и не пригодных к военной службе. Тест содержал ряд вопросов о наличии обычных признаков невроза, а тестируемый отмечал, имеются они у него или нет. Общий показатель получался подсчетом отмеченных симптомов. Во время войны листок личностных данных так и не был доведен до практического использования, но сразу же после ее окончания были подготовлены его формы для гражданского использования, в том числе специальная форма для опроса детей. Более того, листок личностных данных Вудвортса послужил образцом для более поздних опросников по эмоциональной регуляции. В одном из этих тестов эмоциональная регуляция подразделялась на более конкретные формы, такие, как регуляция семейных, школьных и профессиональных отношений, в других вопросы концентрировались в основном на ограниченной сфере поведения или более четко выявляли социальные реакции, такие, как преобладание в межличностных контактах реакции подчинения. Позднее были разработаны тесты для количественной оценки интересов и установок, но они, в сущности, тоже использовали технику опросников.

Другой подход к измерению личностных характеристик представлен в тестах действия, или ситуационных тестах. В этих тестах испытуемый получает задания, цель которых часто остается ему неизвестной. Большей частью они довольно точно воспроизводят обыденные ситуации. Впервые подобная методика была широко применена в тестах, разработанных Г. Хартсхорном, М.А. Меем и их сотрудниками в конце 20-х-начале 30-х гг. Серия, стандартизованная на школьниках, затрагивала такие особенности поведения, как обман, ложь, воровство, согласованность действий и настойчивость. Количественные показатели могли быть получены по каждому из многочисленных частных тестов. Позднее этот метод был применен в серии ситуационных тестов для взрослых, созданной в годы второй мировой войны в рамках аттестационной программы Управления стратегических служб. Эти тесты были рассчитаны на достаточно сложное и трудно различимое социальное и эмоциональное поведение и требовали довольно тонкой техники исполнения и обученного персонала, а интерпретация реакции испытуемого была в них относительно субъективной.

Третий подход в изучении личности представляют проективные методики, получившие, особенно у клиницистов, чрезвычайно широкое распространение. В тестах этого типа испытуемому дается неструктурированное задание, допускающее многие способы решений. Эти методики основаны на предположении, что в своем решении индивид проявит характерные для него способы реакции. Так же как и в тестах действия, или ситуационных тестах, методика проективных тестов в той или иной степени не позволяет испытуемому угадать их цель и тем самым уменьшает вероятность того, что испытуемый сможет намеренно создать желаемое впечатление. Уже упоминавшийся тест свободных ассоциаций - один из наиболее ранних типов проективных методик. К этому же типу можно отнести тест на завершение предложений. К заданиям иного типа, обычно применяемым в проективных тестах, относятся рисование, представляющая сценку расстановка игрушек, импровизация драматической сцены и интерпретация картинок или чернильных пятен.

Тестологии начала XX века 📙 Реферат → 🆔 278404