Контент-анализ — описание метода
Контент-анализ — описание метода
Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).
Не все документы
могут стать объектом контент-анализа.
Необходимо, чтобы исследуемое содержание
позволило задать однозначное правило
для надежного фиксирования нужных характеристик
(принцип формализации), а также, чтобы
интересующие исследователя элементы
содержания встречались с достаточной
частотой (принцип статистической значимости).
Чаще всего в качестве объектов исследования
контент-анализа выступают сообщения
печати, радио, телевидения, протоколы
собраний, письма, приказы, распоряжения
и т.д., а также данные свободных интервью
и открытые вопросы анкет. Основные направления
применения контент-анализа: выявление
того, что существовало до текста и что
тем или иным образом получило в нем отражение
(текст как индикатор определенных сторон
изучаемого объекта — окружающей действительности,
автора или адресата); определение того,
что существует только в тексте как таковом
(различные характеристики формы — язык,
структура, жанр сообщения, ритм и тон
речи); выявление того, что будет существовать
после текста, т.е. после его восприятия
адресатом (оценка различных эффектов
воздействия).
В разработке и практическом применении
контент-анализа выделяют несколько стадий.
После того, как сформулированы тема, задачи
и гипотезы исследования, определяются
категории анализа — наиболее общие, ключевые
понятия, соответствующие исследовательским
задачам. Система категорий играет роль
вопросов в анкете и указывает, какие ответы
должны быть найдены в тексте. В практике
отечественного контент-анализа сложилась
довольно устойчивая система категорий
— знак, цели, ценности, тема, герой, автор,
жанр и др. Все более широко распространяется
контент-анализ сообщений средств массовой
информации, основанный на парадигматическом
подходе, в соответствии с которым изучаемые
признаки текстов (содержание проблемы,
причины ее возникновения, проблемообразующий
субъект, степень напряженности проблемы,
пути ее решения и др.) рассматриваются
как определенным образом организованная
структура.
Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (междукодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.
После того, как
категории сформулированы, необходимо
выбрать соответствующую
Важен выбор необходимых источников, подвергаемых
контент-анализу. Проблема выборки содержит
в себе выбор источника, количества сообщений,
даты сообщения и исследуемого содержания.
Все эти параметры выборки определяются
задачами и масштабами исследования. Чаше
всего контент-анализ проводится на годичной
выборке: если это изучение протоколов
собраний, то достаточно 12 протоколов
(по числу месяцев), если изучение сообщений
средств массовой информации — 12—16 номеров
газеты или теле-, радиодней. Обычно выборка
сообщений средств массовой информации
составляет 200—600 текстов.
Необходимым условием является разработка таблицы контент-анализа — основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица — кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.
Важным условием контент-анализа является разработка инструкции кодировщику — системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,
где f — число положительных оценок; n — число отрицательных оценок; r — объем содержания текста, имеющего прямое отношение к изучаемой проблеме; t — общий объем анализируемого текста. В случае, когда число положительных оценок меньше, чем отрицательных,
Есть и более
простые способы измерения. Удельный
вес той или иной категории
можно вычислить с помощью
формулы К = число единиц анализа, фиксирующих
данную категорию/общее число единиц анализа.
Источники:
1. Социологическая
энциклопедия. Под общ. ред. А.Н. Данилова.
Минск, 2003.
2. Дридзе Т.М. Текстовая деятельность
в структуре социальной коммуникации.
М., 1984;
3. Методологические
и методические проблемы контент-анализа.
Вып. 1-2. М., 1973;
4. Методы анализа документов
в социологических исследованиях.
М , 1985;
5. Эффективность средств
массовой информации. М., 1986.
КОНТЕНТ-АНАЛИЗ, количественный анализа текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.
Основная идея контент-анализа проста и интуитивно наглядна. При восприятии текста и особенно больших текстовых потоков мы достаточно хорошо ощущаем, что разные формальные и содержательные компоненты представлены в них в разной степени, причем эта степень по крайней мере отчасти поддается измерению: ее мерой служит то место, которое они занимают в общем объеме, и/или частота их встречаемости. Через все выступления X-а красной нитью проходит тема Y; X постоянно обращался в своей речи к проблеме Y; Он не упускал ни одного случая, чтобы не лягнуть Z-а; Ну, задудел в свою дуду, – все эти выражения, число которых можно легко увеличить, свидетельствуют об осознании нами такого феномена, как наличие в изливающемся на нас информационном потоке некоторых настойчиво повторяющихся тем, образов, ссылок на проблемы, оценок, утверждений (Карфаген должен быть разрушен или Российская экономика задыхается без инвестиций), аргументов, формальных конструкций, конкретных имен и т.д. Более того, подобно тому как в мире механики мы ощущаем не скорость, а ускорение, так и при восприятии текста мы особенно хорошо осознаем именно динамику содержания – те случаи, когда, например, кого-то вдруг перестают или начинают бранить или когда в текстах вдруг появляется какая-то новая тема.
Замысел контент-анализа заключается в том, чтобы систематизировать эти интуитивные ощущения, сделать их наглядными и проверяемыми и разработать методику целенаправленного сбора тех текстовых свидетельств, на которых эти ощущения основываются. При этом предполагается, что вооруженный такой методикой исследователь сможет не просто упорядочить свои ощущения и сделать свои выводы более обоснованными, но даже узнать из текста больше, чем хотел сказать его автор, ибо, скажем, настойчивое повторение в тексте каких-то тем или употребление каких-то характерных формальных элементов или конструкций может не осознаваться автором, но обнаруживает и определенным образом интерпретируется исследователем – отсюда принадлежащее социологу А.Г.Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк».
Реально главной отличительной чертой контент-анализа является не его декларируемая во многих определениях «систематичность» и «объективность» (эти черты присущи и другим методам анализа текстов), а его квантитативный характер. Контент-анализ – это прежде всего количественный метод, предполагающий числовую оценку каких-то компонентов текста, могущую дополняться также различными качественными классификациями и выявлением тех или иных структурных закономерностей. Поэтому наиболее удачным определением контент-анализа можно считать то, которое зафиксировано в относительно недавней книге книге Мангейма и Рича: контент-анализ – это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника.
С точки зрения лингвистов и специалистов по информатике, контент-анализ является типичным примером прикладного информационного анализа текста, сводящегося к извлечению из всего разнообразия имеющейся в нем информации каких-то специально интересующих исследователя компонентов и представлению их в удобной для восприятия и последующего анализа форме. Многочисленные конкретные варианты контент-анализа различаются в зависимости от того, каковы эти компоненты и что именно понимается под текстом.
Конкретные прикладные цели контент-анализа также варьируют в широких пределах. Еще в 1952 американский исследователь Б.Берелсон сформулировал 17 целей, воспроизводимых с тех пор в пособиях по контент-анализу; в их числе – описание тенденций в изменении содержания коммуникативных процессов; описание различий в содержании коммуникативных процессов в различных странах; сравнение различных СМИ; выявление используемых пропагандистских приемов; определение намерений и иных характеристик участников коммуникации; определение психологического состояния индивидов и/или групп; выявление установок, интересов и ценностей (и, шире, систем убеждений и «моделей мира») различных групп населения и общественных институтов; выявление фокусов внимания индивидов, групп и социальных институтов и др.
Исторически контент-анализ – наиболее ранний систематический подход к изучению текста. Самый первый упоминаемый в литературе контент-аналитический опыт (прикладная цель которого выглядит очень узнаваемой) – это проведенный в Швеции в 18 в. анализ сборника из 90 церковных гимнов, прошедших государственную цензуру и приобретших большую популярность, но обвиненных в несоответствии религиозным догматам. Наличие или отсутствие такового соответствия и определялось путем подсчета в текстах этих гимнов религиозных символов и сравнения их с другими религиозными текстами, в частности запрещенных церковью текстами «моравских братьев». В конце 19 – начале 20 вв. в США появились первые контент-аналитические исследования текстов массовой информации. Их мотивация выглядит удивительно знакомой: авторы задавались целью продемонстрировать прискорбное «пожелтение» тогдашней нью-йоркской прессы. В 1930–1940-х годах были выполнены исследования, признаваемые ныне классикой контент-анализа, прежде всего работы Г.Лассуэлла, деятельность которого продолжалась и в послевоенные годы. Во время Второй мировой войны имел место самый, пожалуй, знаменитый эпизод в истории контент-анализа – это предсказание британскими аналитиками времени начала использования Германией крылатых ракет «Фау-1» и баллистических ракет «Фау-2» против Великобритании, сделанное на основе анализа (совместно с американцами) внутренних пропагандистских кампаний в Германии.
Начиная с 1950-х годов контент-анализ как исследовательский метод активно используется практически во всех науках, так или иначе практикующих анализ текстовых источников – в теории массовой коммуникации, в социологии, политологии, истории и источниковедении, в культурологии, литературоведении, прикладной лингвистике, психологии и психиатрии. Разнообразие конкретных проектов, реализованных за примерно 70-летнюю историю интенсивного использования контент-анализа, очень велико. Среди интересных проектов, выполненных за последние годы в России, можно назвать исследование образов и метафор, использовавшихся в 1996–1997 в ходе развернутой тогда в российской прессе дискуссии о национальной идее, а также выполненный в тот же период анализ текстов левонационалистической оппозиции. Локальные контент-аналитические проекты периодически реализуются в ходе различного рода социологических мониторингов – общенациональных и региональных.
Наиболее широкое
Тем не менее контент-анализ действительно занимает среди аналитических методов особое место в силу того, что является среди них самым технологичным и в силу этого в наибольшей степени подходящим для систематического мониторинга больших информационных потоков. Помимо этого, контент-анализ достаточно гибок для того, чтобы в его рамки мог быть успешно «вписан» весьма разнообразный круг конкретных типов исследований. Наконец, будучи в основе своей количественным методом (хотя и содержащим немалую качественную составляющую), контент-анализ в определенной степени поддается формализации и компьютеризации.
ТИПЫ ИНФОРМАЦИОННЫХ МАССИВОВ И ЕДИНИЦЫ КОНТЕНТ-АНАЛИЗА
Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц анализа.
Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано. Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова.
С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. – иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения.
Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива. В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп. Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».
Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.
Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)
А. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, скажем, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Идентификация и подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко; подсчет, скажем, листовок или книг чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки, т.е. реально используются единицы других, характеризуемых ниже типов единиц – обычно концептуальных, пропозициональных или тематических.
Б. Структурно-семиотические единицы. Под таковыми имеются в виду основные элементы семиотических систем (см. СЕМИОТИКА). В случае естественного языка это:
– лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и
– грамматические показатели (например, отрицательные частицы или показатели таких категорий, как, скажем, отглагольные имена).
Количественный подсчет
встречаемости слов в тексте –
это, пожалуй, самый простой вариант
контент-анализа, который, однако, зачастую
способен давать небезынтересные результаты.
Чаще всего, конечно, подсчитываются «интересные»,
или «ключевые» слова и/или словосочетания,
например названия ценностных категорий
типа свобода,стабильность, дов
Контент-анализ грамматических
категорий представляет собой достаточно
редкое исследовательское начинание,
стимулом к которому является гипотеза
(весьма правдоподобная) о том, что употребление
грамматических форм в меньшей степени,
чем употребление лексики, контролируется
автором текста и поэтому может послужить
источником таких сведений о нем, которые
он сам вовсе не собирался делать доступными
своим читателям. В политической психологии
существует специальная исследовательская
методика, так называемый анализ когнитивной
сложности, которая на основе фактически
контент-аналитической процедуры позволяет
делать выводы о том, насколько простым
(или, напротив, сложным) является видение
политической ситуации автором текста
и как оно меняется со временем. Единицами
контент-анализа, лежащего в основе оценки
когнитивной сложности, являются, например,
относимые обычно к служебной лексике
категорические квантификаторы типа всегда, никогда, всякий, которым противостоят квантификаторы
типа иногда, некоторый и т.п.; категорические (вроде
знаменитого однозначно)
оценки истинности в противоположность
осторожным возможно или не исключено, что;
языковые средства дифференцированного
рассмотрения ситуации наподобие с одной стороны...
с другой стороны; упоминания взаимодействия, бал
Известны и примеры контент-анализа чисто грамматических средств, например исследования соотношения глагольных форм, обозначающих, соответственно, процессы и результаты, исследование номинализованных (с отглагольными именами типа построение, усиление и т.п.) конструкций в языке партийных документов брежневского времени, отрицания в политическом тексте и др.
Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.
В. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и тем более не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами – иными словами, тем, что можно назвать понятийно-тематическими единицами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова преступность, но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и проч. Тот, кого занимает проблема свободы, должен в своем анализе реагировать на упоминания давления на прессу, чиновничьего произвола, контролируемости СМИ, доступа к Internet и т.д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений.
Г. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т.д.; это, так сказать, «энциклопедический» блок единиц анализа. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги и, что не менее существенно, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996–1997 может послужить работа А.В.Дуки. Способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович,Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна. Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» – коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации.
Д. Пропозициональные единицы и оценки. Их примеры приводились выше – Карфаген должен быть разрушен или Россия задыхается без инвестиций. Собственно говоря, это примеры высказываний, в основе которых лежат пропозиции – описания конкретных положений дел (ситуаций) безотносительно к их модальности (в первом примере – требование, во втором – констатация). Наряду с пропозициями для контент-анализа могут представлять (и очень часто представляют) большой интерес оценки (Это очень опасное решение). С логической точки зрения они обладают важными отличиями от пропозиций, однако для целей контент-анализа как собственно пропозиция, так и оценка могут рассматриваться как результат связывания некоторого объекта с некоторым атрибутом. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, – весьма распространенный тип контент-аналитического исследования.

- Контент-анализ — описание метода
- Контент - анализ рекламного образа женской фигуры и мужского тела в глянцевых журналах
- Контент - анализ рекламного образа женской фигуры и мужского тела в глянцевых журналах
- Контент-анализ речи политического деятеля В.В. Жириновского
- Контент-анализ: сущность, задачи, процедуры
- Конти, Арман де Бурбон
- Континентальная и англосаксонская формы определения собственности
- Контекстуальное значение в переводе
- Контент-анализ
- Контент-анализ
- Контент-анализ его роль в социальных исследованиях
- Контент – анализ как метод исследования
- Контент-анализ как метод исследования
- Контент-анализ метод семейного воспитания