Достоинства и недостатки анализа документов
Анализ документов по сравнению с другими методами сбора информации имеет свои плюсы и минусы.
Достоинства анализа документов:
Наиболее экономичен с точки зрения трудозатрат и финансов.
Позволяет оперативно получить фактографические данные о предприятии в целом и его служащих и рабочих.
Полученная информация носит объективный характер.
Можно получать сведения о прошедших событиях, наблюдение за которыми уже невозможно.
Исследовательский процесс не оказывает существенного влияния на объект исследования. Обычная для других методов исследования проблема возмущающего влияния субъекта на объект при проведении данного вида социологического исследования фактически снимается. Для его проведения никто не подвергается эксперименту, анкетированию или интервьюированию.
Официальные материалы для контент-анализа легкодоступны, так как многие официальные общественные документы опубликованы в газетах, журналах, и т.п. и получить их в библиотеке не представляет особой трудности.
Проведение контент-аналитического исследования аудиовизуальных средств массовой информации облегчает современное записывающее видео- и аудиооборудование.
Используя анализ документов, исследователь может дать верную оценку событий и процессов, происходящих в социальных группах, которые он не может наблюдать лично, но информацию о которых он может получить из разного рода документов.
Документы в отличие от респондента не имеют никакой возможности "приспосабливаться" к исследователю, ведь основная масса документов, подвергающихся анализу, бывает создана ранее и не по воле исследователя, а значит, независимо от его интересов. В редких случаях при создании документа автор может заранее предполагать, что данный документ будет подвергнут специальному исследованию.
Недостатки анализа документов:
1. Часто количество сообщений, относящихся к изучаемой теме, очень ограничено.
2. Не всегда регулярно в доступных средствах массовой информации освещаются некоторые темы.
3. Часть информации, содержащейся в документах, устаревает.
4. Качество учетной и отчетной информации не всегда бывает достоверным, поэтому иногда требуется проводить контроль с помощью опросов и наблюдения.
5. В основной массе ведомственной документации не содержится информация о состоянии сознания работников.
6. Часто цели создания документов не совпадают с задачами, которые собирается решить социолог в своем исследовании, поэтому ему приходится содержащуюся в документах информацию перерабатывать и переосмысливать.
7. Для проведения контент-анализа от исследователя требуется гораздо больше воображения и изобретательности, чем для проведения других методов социологического исследования.
8. Проведение анализа документа достаточно только в том случае, если для решения задач достаточно фактографической документации.
9. Часть официальных документов носит конфиденциальный характер, вплоть до полной секретности, что затрудняет ознакомление с такими документами и их социологическую оценку. Проведение социологического исследования оказывается возможным только в том случае, если данные исследования полностью или частично будут засекречены в той же степени, что и используемые материалы.
10. К письменному документу нельзя ничего добавить, а так как автор при составлении документа может забыть или не видеть значимости того или другого факта, то исследователю приходится довольствоваться тем, что есть. В отличие от этого при проведении интервью по неясным для исследователя пунктам, он может задать новые вопросы и таким образом дополнить информацию.
11. Так как в документах фиксируются социальные явления, которые уже произошли, то полученные социальные данные должны быть отнесены лишь к тому периоду времени, когда они собирались.
12. Статистические документы в значительной степени абстрактны. Изложенные в них обстоятельства абстрагируются от многих событий, условий, явлений, которые сопутствовали зафиксированному процессу. Это, естественно, ведет к существенным потерям информации о совокупности обусловливающих связей и сопутствующего им фона. Обычно бывает возможно определить только те их них, которые автор описал, так как считал их существенными в связи с другими целями и задачами.
Особо следует отметить недостатки, присущие неофициальным, личным документам:
- малая объективность, отображение реальных данных всегда субъективно окрашено;
- на изложение фактов часто влияют ситуационно возникающие аффекты и эмоции;
- при описании мотивов и импульсов своего поведения часто свойственен самообман;
- оптимистическая оценка описываемых событий, которая увеличивается по мере увеличения промежутка времени между событием и его отображением;
- авторам бывают свойственны неправомерные обобщения;
- затруднения вызывает сбор личных документов, особенно неофициальных, так как в этом случае необходим личный контакт с автором, собственником или распорядителем личных документов, чтобы убедить его выдать интересующую исследователя документацию и получить разрешение на проведение научного анализа ее;
- при изучении личных документов (письма, биографии) невозможно составить репрезентативную выборку, так как людей, которые не могут выражать свои мысли в письменной форме, гораздо больше людей, стесняющихся отвечать устно;
- часто возникают трудности при анализе и кодификации письменных биографий. Эта проблема возникает и при открытых вопросах в анкетировании и интервью, но в данном случае она увеличивается благодаря тому, что отсутствуют четко поставленные вопросы. Поэтому каждый автор дает определенное количество информации, очень интересной, но трудно сопоставимой с другими данными. Исследователю очень сложно классифицировать, а тем более обобщать имеющуюся информацию.
Благодаря появлению звукозаписи и кинолентам представилась возможность не только сохранять, но и воспроизводить и наблюдать много раз определенную документацию. Возможность снова пересмотреть интересующий исследователя фильм или вновь прослушать какую-либо запись является очень ценной. Подобным образом сохраненная документация имеет ряд преимуществ:
- ею могут пользоваться разные исследователи;
- с помощью кино можно произвести глобальное наблюдение, что не под силу осуществить отдельным лицам. Например, в области политических наук, при исследовании демонстрации или митинга наблюдатель-одиночка чисто физически не в состоянии увидеть все.
Необходимо отметить и недостатки:
- получаемые с помощью данных инструментов материалы такие же сырые, как и сама жизнь;
- хотя людям на экране нельзя задавать вопросы, зато их можно наблюдать непосредственно в их действительной жизни.
Разработка инструментария
Необходимым условием контент-аналитического исследования является разработка соответствующего инструментария (таблицы, бланки кодировки). Таблицы контент-анализа - это основной рабочий документ, с помощью которого оно проводится. Тип таблицы зависит от этапа исследования. При разработке категориального аппарата исследователь составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Таблица такого типа внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), благодаря чему становится возможным количественное выражение качественных признаков, содержащихся в тексте.
Для регистрации единиц анализа исследователь составляет уже другого типа таблицу - кодировальную матрицу (см. табл. 3) (37, с. 77).
Для регистрации единиц счета, в зависимости от характера исследования, четкости его задач и гипотез, разрабатывается определенный рабочий документ, с помощью которого проводится контент-анализ. Это могут быть специально разработанные макеты таблиц (в клетках которых отмечается встречаемость определенных единиц), перфокарты, карточки или специальные кодировальные матрицы.
Тип рабочего документа определяется этапом исследования. Если исследование носит поисковый характер и приходится собирать избыточную первичную информацию, то чаще всего используются кодировальные матрицы (определенный тип таблицы, составленный для регистрации единиц анализа). Столбцы такой матрицы означают отдельные документы (сообщения), а строки - классификационные единицы соответствующих единиц анализа (перечень тем, персонажей и т.п.). В результате этого в каждом столбце оказывается закодированным по интересующим нас признакам отдельное сообщение (табл. 4).
Таблица 4
Признак
| Текст
|
|
|
|
| ...
| n
| Zn
| A
|
|
| +
|
|
|
| В
| +
| +
|
|
|
|
| С
| +
|
| +
|
|
|
| ...
|
|
|
|
|
|
| n
|
|
|
|
|
|
| Zn
|
|
|
|
|
|
|
Подобного рода таблица-анкета может быть достаточно объемной. Например, в проводимом в Белорусской ССР исследовании эффективности функционирования республиканских средств массовой информации каждый текст анализировался по 248 признакам (37, с.77).
Если выборка невелика (до 100 классификационных единиц), то кодировальная матрица может быть отдельным листом и можно проводить двумерный или даже многомерный анализ, а если объем выборки достаточно велик (свыше 100 сообщений и единиц), то кодировщик, как правило, работает с целой тетрадью таких матричных листов.
Таблица может быть использована и на этапе количественной обработки данных. Наиболее важными в контент-анализе являются способы расчета совместной встречаемости, т.е. связанности, зависимости различных элементов содержания в сообщениях. Начало разработки этих способов было положено американским психологом А. Болдуином в 1942 г., и продолжено его последователем, известным психологом и психолингвистом Чарльзом Осгудом в конце 50-х гг. По мнению Ч. Осгуда, неслучайные зависимости элементов содержания в сообщениях указывают на определенные ассоциации в мышлении коммуникатора, а наличие случайных зависимостей указывает на процессы диссоциации. Процедура методики Ч. Осгуда состоит в том, что в сообщениях (частях текста) регистрируется наличие или отсутствие интересующих исследователя единиц содержания, после чего осуществляется подсчет совместной встречаемости этих единиц и определяется случайность или неслучайность их совместного появления. Для этого анализируемые единицы фиксируются в специально созданной матрице, с помощью которой выявляются меры случайности совпадения каждой классификационной единицы со всеми остальными (см. табл. 5) (25, с. 56-57; 37, с. 78).
Таблица 5
Реальное
совпадение
| Ожидаемое совпадение
|
| А
| В
| С
| ...
| n
| Zn
| А
| -
| 0,10
|
|
|
|
| В
| 0,06
| -
| 0,02
|
|
|
| С
|
| 0,08
| -
|
|
|
| ...
|
|
|
| -
|
|
| n
|
|
|
|
| -
|
| Zn
|
|
|
|
|
|
| Например, единица А встречается в 20% анализируемых текстов (Pa=0,2), а единица В в 50% текстов (Pв=0,5), тогда, по теореме умножения вероятностей, ожидаемая частота совместного появления этих единиц будет равна 0,10 (Рав = Ра х Рв = 0,2 х 0,5 = 0,10). Полученное число записывается в соответствующую верхнюю от матричной диагонали клетку. После этого подсчитывается, сколько раз на самом деле единицы А и В совместно встречались в текстах. В действительности оказалось, что они совместно встречались только в 6% сообщений (fав=0,06). Это число записывается в соответствующую нижнюю от диагонали клетку.
Подобным образом продолжаем рассчитывать дальше вероятность и частоту совместного появления всех остальных единиц анализа. В конечном итоге, сравнивая полученные фактические и вероятностные величины, можно определить, какие фактические зависимости оказались неслучайными (например, из приведенной выше таблицы видно, что совместное появление единиц А и В - случайно, так как фактическая величина ниже вероятностной, т.е. реальное совпадение ниже ожидаемого; а единиц А и С - неслучайно, так как фактическая величина больше вероятностной). Можно также рассчитать уровень значимости неслучайных зависимостей, выделить группы взаимосвязанных единиц и т.д.
При количественном контент-анализе проведение подсчета в общем виде аналогично стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциаций. Применительно к контент-анализу существуют даже специальные процедуры подсчета, например формула коэффициента Яниса (с), для вычисления соотношения положительных и отрицательных (относительно избранной позиции) суждений, оценок, аргументов. Если число положительных суждений превышает число отрицательных, то коэффициент Яниса находится по формуле
,
где f - число положительных оценок; n - число отрицательных оценок; r - объем содержания текста, имеющего прямое отношение к изучаемой проблеме; t - общий объем анализируемого теста.
А если число положительных суждений меньше отрицательных, то коэффициент Яниса подсчитывается по формуле
.
Существуют и более простые способы измерения. Например, удельный вес той или иной категории можно определить с помощью следующей формулы (37, с.79)
.
На первом этапе необходимо также провести пробный (пилотажный) анализ документов, который обычно позволяет выявить имеющиеся недостатки методики. После необходимых доработок исследователю остается только проверить надежность разработанной методики, т.е. испытать ее на обоснованность (соответствие задачам и теоретическим понятиям исследования) и устойчивость (воспроизводимость результатов).
Обоснованность (validity - валидность) обычно проверяют при помощи экспертов (специалистов по проблематике проводимого исследования) или посредством получения аналогичных данных другими методами.
Устойчивость (consistency) ( иногда ее отождествляют с надежностью (relibility) и объективностью (objectivity) анализа документов) можно определить при помощи повторного кодирования одних и тех же документов по единой инструкции одним и тем же кодировщиком ("устойчивость во времени") или кодированием одних и тех же документов по единой инструкции разными кодировщиками ("устойчивость среди аналитиков"). Для этого можно взять наугад только часть документов из выборки (например, 30 или 50 единиц). Если данные разных кодировщиков будут в достаточной степени соответствовать друг другу (например, расхождение не выше 5% или коэффициент корреляции на уровне значимости 0,05), то можно вполне уверенно считать, что разработанная методика позволяет получать устойчивые результаты.
Если исследователю необходимо проанализировать очень много материалов и процесс кодирования растягивается на недели, следует проводить выборочную проверку устойчивости получаемых данных, для этого процесс кодирования целесообразно проводить параллельно несколькими кодировщиками.
|