Скачать

Методика анализа содержания текстов

Федотова Л.Н.

Программа исследования как жанр

Первоначально социологическое исследование существует как замысел исследователя. И если мы здесь проведем аналогию со словами Рене Клера, который в свое время воскликнул: «Фильм готов! Осталось только снять его!», то это не будет большой натяжкой. Именно на этапе замысла, который формально выливается у социолога в своеобразный документ, называемый программой исследования, автор представляет совершенно отчетливо все остальные этапы.

По В.А. Ядову, программа - это изложение основных задач, методологических предпосылок и гипотез исследования с указанием правил процедуры и логической последовательности операций по проверке гипотез (1).

Хотя на этих страницах исполнитель исследования чаще упоминается в единственном числе, делается это ради простоты изложения. На самом деле технология добычи социологического знания требует довольно разнообразных профессиональных умений большого числа исполнителей. Еще и поэтому исследование на этапе своего замысла должно иметь организационный план своего осуществления, представление о финансовых затратах, о профессиональных ресурсах, о сроках исследования, о форме демонстрации (выдачи) результатов заказчику и т.п.

Прежде всего в программе формулируется социальная проблема, к изучению которой приступает исследователь. Это может быть новое социальное явление, распространенность и характеристики которого неизвестны обществу и поэтому являются самодостаточной задачей для социолога; это может быть и уже известное явление, но оставшеся до поры до времени вне поля зрения социологов - ситуация, при общей неразвитости социологических исследований в нашем обществе, довольно частая; это может быть и уже изученное социологами явление, но нуждающееся в повторном исследовании в связи с явными изменениями обстановки в стране и т.п.

В свое время американские исследователи считали вполне заслуживающим внимание социолога-исследователя текстов такие задачи:

Какие изменения претерпели в СССР первомайские пропагандистские призывы за время существования советской власти?

Как отражается склад характера писателя на том, что он пишет?

Каковы важнейшие тенденции в использовании научной литературы химиками и физиками за последнее время?

Как человеческие ценности, отображенные в американских пьесах, отличаются от ценностей, фигурирующих в немецких пьесах того же периода? Как моральные принципы, содержащиеся в американской бойскаутской литературе, отличаются от тех понятий о морали, которые мы встречаем в литературе «гитлерюгенда» (или в повести Гайдара «Тимур и его команда» - добавим мы: Л.Ф.)?

Как можно проверить коммуникацию, заподозренную в том, что она преследует подрывные цели, как достоверно выяснить, имеет ли она пропагандистское содержание или нет?

Какое сравнение можно провести между газетами и радиостанциями в отношении освещения ими сенсационных убийств?

Что делает ту или иную статью или произведение писателя «читабельными»?

Каковы сходные и отличительные черты политических символов, которые предлагаются вниманию людей в отдельных государствах?

Что происходит с хорошей книгой, когда на ее основании делается кинокартина? (2)

Приведем примеры таких вопросов, «привязанных» к нашим сегодняшним реалиям: каково содержание рекламы продуктов отечественного производителя? Чем эта реклама отличается от импортной? К каким ценностям личности она апеллирует, не является ли она дисфункциональной, не следует ли изменить ее характер? Таким вопросам несть числа.

В любом случае исследователь так составляет программу, чтобы в результате ответить на поставленный вопрос. Прежде всего, он должен отразить степень изученности проблемы до него. Эта стадия является началом любого исследования. Таким образом, анализ предшествующей литературы, содержащей попытки коснуться аналогичной проблематики, становятся не просто данью профессиональной этике, - хотя и это важно, - но и демонстрирует фундаментальность подготовки исследователя. Помимо этого данный этап имеет сугубо прагматическую ценность. Исследователь получает возможность поставить перед собой ранее нерешенные задачи, получить возможность для сопоставления своих результатов с ранее полученными и т.п.. Только так, в результате преемственности научного знания, его углубления общество получает знание о самом себе, что составляет главную ценность социологии.

Но - любой заданный исследователем самому себе вопрос, это лишь поверхностный слой проблемы. Действительно, каково тематическое распределение материалов в газете - это еще не проблема, это лишь материал для решения проблемы, а каким ему быть? Это распределение должно быть для молодежной газеты одним, другим для издания, считающегося в общественном мнении качественным, третьим для городского радио и т.д.

Теоретик может написать книгу о том, каким должно быть это распределение для всех этих каналов, ссылаясь на то, что все они потребляются одной аудиторией, или наоборот, потому что они потребляются разной аудиторией, поскольку все они вместе образуют иерархию каналов и потому каждый должен «обслуживать» свой участок, что они должны при этом учитывать иерархию тематических интересов аудитории...

Но при всем этом нужно знать реальное распределение материалов по темам, чтобы это было информацией к действию: к изменению, к переструктурированию тем, к усекновению одних и появлению других. Сейчас даже не важно, кто будет осуществлять это изменение: сам ли коммуникатор, или ему укажет на необходимость этого издатель, или это останется «гласом вопиющего» исследователя. Только так замкнется, так сказать, технологический цикл социологического исследования.

Каково распределение в газете «Истинный американец» (см. раздел 2) суждений о Гитлере и проч. - это не проблема; это лишь материал для решения проблемы: а каким ему быть в газете, издаваемой в стране, находящейся в состоянии войны с Гитлером? Симптоматично, что это исследование было буквальной информацией к действию - для суда, который обвинил газету в профашистской ориентации. Исследование, скажем тут мы, было, как никакое другое, «действенным».

Каков набор «моделей поведения» для домохозяек в американских «мыльных операх» - это не проблема; вопрос в том, каким ему быть, если исходить из более гуманистических теорий и концепций личности, чем рожденных в лоне общества потребления?

Хотелось бы предостеречь от узкого понимания роли контент-аналитика, как умещающейся только в рамках поставщика этой самой «добротной» информации для принятия решения. Именно степень «добротности» этой информации зависит от понимания аналитиком всего цикла исследования.

Я бы даже высказала одну кажущуюся парадоксальной мысль - неважно, присутствует ли весь этот цикл, прописывается ли он автром в отчете - а чем иным являются, например, книги, по которым мы знакомимся с историей контента, как не отчетом авторов о проделанном исследовании? Важно, чтобы он - этот цикл - осознавался в начале исследования и особенно - если это исследование осуществляется начинающим исследователем. Тут нелишне напомнить, что социологическое исследование - это всегда «точка зрения»: в данном случае на выбор определенных характеристик текста (по степени важности?), на интерпретацию «что такое хорошо» и «что такое плохо», на выбор определенных выводов для практических рекомендаций (по степени настоятельности?). Вспомним здесь и фигуру заказчика исследования. Из истории архитектуры известно, что там многое зависит не только от гениальности мастера, но и от гениальности заказчика.

Золотое правило, действующее во всех исследованиях средств массовой коммуникации, говорящее, что необходимо ясно осознавать, в чем состоит проблема, прежде чем исследовать ее, справедливо и для метода анализа содержания. Этот метод подразумевает большую кропотливую работу для того, чтобы решить проблему, Но не менее большая работа нужна, чтобы нащупать эту проблему.

В практике исследований текстов методом анализа содержания некоторым аналогом проблемы в конкретном исследовании выступает категория анализа. Это емкое, но вместе с тем лаконичное выражение проблемы. Категория анализа не является рабочей, непосредственно данной нам в тексте; эта характеристика скорее принадлежит всей совокупности текстов. Так, в нашем иллюстративном материале мы разбирали понятие «расовой дискриминации». Мы показали на примерах, что реальность дает нам самые разнообразные проявления расовой дискриминации, причем на этих проявлениях не всегда есть этикетка с надписью «расовая дискриминация». Авторы этого конкретного исследования работали с категорией анализа «квалификация героев рассказов разной расовой принадлежности» и пришли к выводу, что в текстах имела место расовая дискриминация. То есть - наблюдая свокупность текстов под углом зрения «квалификация героев разной расовой принадлежности» автор выходит на проблему «расовой дискриминации».

Или возьмем случай, когда в качестве категории анализа выступает «оперативность». Для ряда источников информации, подытожив результаты, мы бы вышли на проблему недостаточной оперативности его материалов. Этот пример как нельзя лучше показывает, что, введя только понятие «категория анализа», мы остаемся на очень высоком уровне абстракции. В самом деле - оперативность бывает разная. Какая? Материалы могут быть с «сегодня» и с «не-егодня» случившимся поводом. Можно предложить другой вариант дробности: так, в анализе содержания местных газет, радио и телевидения как источников информации, осуществленных в рамках проекта «Общественное мнение» (3), использовались следующие градации оперативности:

Сообщение о событии дается в день совершения последнего

Сообщение о событии дается на следующий день после совершения последнего

Сообщение о событии дается через два дня после свершения

Сообщение о событии дается через три-семь дней

Сообщение касается события, произошедшего более семи дней назад или, как указывается в сообщении «недавно», «за последние дни» и т.д.

Сообщение касается события, дата свершения которого не указывается

Сообщение касается вневременных проблем

Видно, что анализировалась именно местная пресса тридцать лет назад - если бы мы исследовали сегодняшние информационные телевизионные выпуски, мы должны были бы предусмотреть репортажи с места события «минута в минуту» и т.д. А поскольку это были местные издания, где существовал такой способ донесения информации до читателя, как перепечатка из центральных газет, появление здесь градации с оперативностью трех-четырехдневной давности было вполне оправданным.

Когда же мы стали анализировать информационную телевизионную программу «Время» (4)- средство (и канал) заведомо более оперативное - мы пошли по пути дальнейшей дифференциации событийного повода материалов, идущих с грифом «сегодня». Это могли быть информационные сюжеты о событиях, которые можно было предсказать за много десятилетий до этого дня: так называемые календарные, юбилейные или знаменательные даты - «сегодня исполнилось 200 лет со дня рождения А.С. Пушкина». С другой стороны, это могут быть сюжеты типа «сегодня проснулся вулкан X » - событие, обладающее для аудитории максимумом неожиданности, непредвиденности, непредсказуемости. Потребовались и более «оперативные» градации для телевизионной программы общенационального масштаба.

Если проследить за нашей логикой описания оперативности, то она состояла в том, что мы описали ее с помощью разных типов, разных случаев оперативности. По сути дела, взамен однородного понятия оперативности мы создали группировку, классификацию разных типов оперативности. Как в жизни - для каких-то случаев достаточно сказать о спортсмене, что он хороший стрелок, а для каких-то - в спорте - надо уточнить, что он стрелок 3-го, 2-го, 1-го разряда, мастер спорта и т.п.

Обратимся с этой точки зрения к географии события, а значит, и материала о нем. Известно, что в нашей стране больше тысячи городов, десятки тысяч сел. Мы не можем в анализе состояния дел с «географической сбалансированностью», - если бы это было категорией анализа в нашем будущем исследовании, - отражаемой источником информации об объекте, говорить о представительности каждого населенного пункта: точек на карте слишком много. Сбалансированность такого рода может и должна подразумевать пропорциональную представительность достаточно крупных регионов. Каких? Существует множество типологий такого рода, исследователь вправе выбрать любую. Страна разделена на области, края, республики - можно говорить о представленности таких понятий; существует деление на экономико-географические районы: Урал, Западная Сибирь и т.д. - можно на этом построить анализ; существует типология поселений: село, малый город, средний город, крупный город - можно говорить о представленности таких типов поселений.

Мы, по сути дела, сделали следующий шаг в построении, создании программы исследования, который состоит в конструировании категориальной сетки, или, если выразиться на языке терминов, в классификации, группировке семантического пространства категории анализа. Если говорить образно, то речь идет о создании своеобразного сита, через которое будет просеяно реальное содержание исследуемого информационного источника, где роль ячеек будут выполнять типы, разные модификации категории анализа.

Обращаясь к конкретным текстам газет, радио и телевидения, исследователь оперирует рабочей единицей анализа. В нашем пример из исследования о расовой дискриминации таковой будет «персонаж» - фигура белого рабочего или темнокожего с определенной степенью квалификации.

Исследование оперативности материалов имеет в качестве единицы анализа отдельный материал, поскольку мы связываем оперативность с оперативным поводом целого материала.

Когда речь идет о географии информационного материала, единицей анализа может быть отдельный материал. Но вот большие газетные, теле- и радиоматериалы содержат (могут содержать) информацию о разных населенных пунктах, о разных областях и т.п. Значит, надо предусмотреть объем информации для анализа, который будет мельчайшей единицей текста, где может появиться упоминание искомого нами географического типа. Прежде всего это может быть слово, равное названию пункта (края, города, области, региона); это может быть абзац, посвященный нужной нам «географической точке»; это могут быть более пространные текстовые фрагменты, содержащие разговор о нужной нам точке.

Вот здесь пора вспомнить, что анализ содержания выясняет объем внимания к какой-либо проблеме в рамках отдельного материала, газетного номера, радио- или теледня, недели, месяца и любых других временных отрезков в деятельности анализируемого канала (5).

Оперируя словом как единицей анализа, мы подсчитываем, сколько слов приходится на тот или иной тип в избранной нами типологии, подразумевая, что чем больше слов посвящено какому-либо типу, тем больше внимания коммуникатор уделяет именно этому типу.

Оперируя абзацем как единицей анализа, мы подсчитываем, сколько абзацев посвящено тому или иному типу в избранной нами типологии, подразумевая, что чем больше абзацев, тем больше внимания уделяется тому или иному типу... При этом мы игнорируем разницу в размерах абзаца, рассматривая их равноправно, расцениваем, что несмотря на разницу в размерах, каждый из них прочитывается как бы на «едином дыхании», а с точки зрения автора текста - выражает законченную мысль.

Оперируя фрагментом текста как единицей анализа, мы должны измерить, какой фрагмент текста - крупный или небольшой - соответствует определенному типу поселения, Значит, появляется нужда в пространственных - если речь идет о газете, или временных - если речь идет о радио- или телепередачах, мерах. Можем измерять эти куски строками, площадью или минутами, секундами. То есть здесь мы выходим на новые, по сравнению со счетом по нарастающей, соответствующей количеству фиксируемых нами признаков, единицы измерения.

Таким образом, если сгруппировать все возможные методики оперирования с текстом, с учетом разных единиц анализа и разных единиц измерения, то грубо их можно разделить на две группы:

1. Единицей анализа выступает признак материала, который характеризует его в целом: это может быть оперативность - фиксация (или нефиксация) временной вехи события, которое выступает событийным поводом появления материала в потоке информации; это может быть функциональная принадлежность материала: так, радио- и телевизионные материалы традиционно делятся на информационные, развлекательные, учебные, утилитарные (реклама и справки).

Группировка может быть другой (6), но важно, чтобы каждый материал относился к той или иной группе по своей доминирующей функции.

В таких случаях признак должен описываться конечным числом случаев, или, иначе говоря, исследователь должен предусмотреть все возможные модификации признака, чтобы каждый материал был зачислен к той или иной модификации. Есть какие-то материалы, в которых бессмысленно искать оперативный повод, например художественные. Значит, исследователь предусматривает графу «материалы, не классифицируемые по этому признаку» и относит туда эти материалы (7). Есть материалы, для которых трудно вычленить главную функцию - значит, исследователь предусматривает графу «трудно классифицируемые случаи» и относит туда этот материал. В совокупности все анализируемые материалы распадаются на столько групп, сколько модификаций признака предусмотрел исследователь. Подсчет количества материалов в каждой группе, принадлежащей одной модификации, происходит двумя способами, которые мы тут подытоживаем:

а - подсчитывается само количество этих материалов, выражаемое натуральным рядом чисел (от одного до n ...);

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) материалов, приходящихся на каждую группу.

2. Единицей анализа выступает отдельный фрагмент текста: слово, персонаж, суждение, абзац, или нетвердо фиксируемый отрезок текста, совпадающий с определенной темой. Во всех случаях речь идет о довольно ограниченном наборе слов, персонажей, суждений, который интересует исследователя.

Их появление в тексте фиксируется уже значительно большим числом способов:

а - возможность подсчета количества упоминаемых в тексте слов, персонажей, суждений, тем и т.п. сводится к таким вариантам (разберем эти варианты для самого простого случая, когда единицей анализа является слово):

подсчитывается общее число упоминаний каждого слова;

подсчитывается количество предложений, абзацев, которые могут содержать искомые слова;

подсчитывается число материалов, в которых встретилось хотя бы одно искомое слово.

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) отрезков текста, содержащих нужное слово:

тут мельчайшей частицей выступают законченные, «оформленные» единицы площади (абзац, страница микрофонной папки с радио- и телематериалами) с нужным словом, сумма которых и подсчитывается;

суммируются площади материалов в целом, если они содержат хотя бы одно искомое слово.

Здесь следует ввести понятие единицы контекста. Обсудим его на примере подсчета слов, соответствующих категориальной сетке исследователя. Слово живет в рамках предложения; более сложной пространственной единицы, состоящей из нескольких предложений, если все они обеспечивают законченное суждение; абзаца и, наконец, материала в целом. Если объектом исследования служит небольшой текстовой материал, имеет смысл подсчитывать все количество упоминаний слова. Но иногда при больших объемах исследователи устанавливают единицы контекста, и тогда употребление хотя бы одного искомого слова в рамках абзаца считается равноценным его неоднократному употреблению в этом же абзаце. Более того, упоминание слова в рамках материала иногда фиксируется как равнозначное неоднократному его употреблению в рамках этого же материала.

Так, в исследовании языка политики школой Г. Лассвелла, когда кодировщики оперировали совокупностью анализируемых текстов в 20000 редакционных статей и 416 символами, отсутствие или присутствие которых они фиксировали в тексте, тактика кодировки состояла в том, что достаточно было встретить хотя бы одно упоминание - независимо от того, сколько на самом деле их было в тексте: ведь, как объяснялось в инструкции, вариации числа появления могли зависеть от индивидуального стиля автора (8).

Как правило, перед тем, как принять решение, какой стратегии подсчета придерживаться, проводится пробный подсчет вариантов - не искажает ли выводов выбор той или иной стратегии.

Чтобы проиллюстрировать механизм существования обозначенных нами категорий, единиц анализа, измерения и контекста, разберем с этой точки зрения некоторые исследования, которые мы ввели в пласт наших рассуждений о контент-анализе и которые, таким образом, уже знакомы читателю.

1 пример. В исследовании Г. Лассвелла « World Attention Survey », который мы подробно разбирали с точки зрения его фактуры, категорией анализа были символы политики, язык политики (поименованные политические деятели, названия идеологий, политических движений и партий, властных институтов); единицей анализа было слово ; единицей счета было упоминание отдельного слова, количество их измерялось натуральным рядом чисел в абсолютном выражении или процентами в относительном выражении; единицей контекста - отдельный абзац в газетном материале.

В исследовании телемостов СССР - США мы использовали в качестве единицы анализа местоимения «мы», чтобы выйти на категорию «степень объединительных тенденций у участников телемостов». Как представляется, таблица 3.1 чрезвычайно показательна для оценки таких тенденций.

Таблица 3.1

Употребление местоимений участниками диалога «Ленинград-Сиетл» (в % к общему числу употребления «мы» каждым субъектом высказывания)

Употребление местоимения «мы»Советская сторонаАмериканская сторона
ведущийаудиторияведущийАудитория
Американский и советский народ в совокупности8437
Участники телемоста в совокупности8559
Или только американский, или только советский народ29392633
Или только американские, или только советские участники телемоста165261