Тема 18: Обобщение и отображение результатов КСИ Статистическая группировка. Наиболее простая форма обобщения первичной социологической информации — группировка.Она позволяет зачислить респондента в ту или иную группу в соответствии с выбранным признаком (или признаками) группировки.
Выбор признака группировкидиктуется задачей социологического исследования, сформулированными ранее гипотезами.
В зависимости от шкалы измерения, в соответствии с которой получены ответы на вопрос, группировка социологической информации может представлять собой:
-зачисление респондентов в номинальные группы (группировка опрошенных по полу, национальности и т. д.);
- упорядочение информации в ранжированном ряду;
- группировку по количественному признаку, в результате которой группы респондентов характеризуются числовой величиной и потому количественно сравнимы между собой.
Операции с номинальными и ранжированными группами осуществляются при помощи математических приемов, соответствующих номинальной и ранговой шкалам. Что касается групп, распределенных по количественному признаку, то они могут быть подвергнуты дальнейшему изучению при помощи любых приемов математической статистики, так как такая группировка осуществляется по интервальной шкале. Группировка, произведенная по одному признаку, называется простой, по двум и более признакам и служащая выявлению их взаимосвязи, называется аналитической.
Когда респондентов распределяют в группы по двум или более признакам, то говорят о комбинационной группировке. В зависимости от решаемых задач она может быть структурной, типологической и аналитической.
При структурной группировке респондентов классифицируют по некоторому свойственному всей совокупности объективному признаку.
Типологическаягруппировка – выделение типов на основании субъективного признака, измеренного по оценочной шкале, либо на базе нескольких признаков (многомерная группировка).
Ряд чисел, получаемый в результате группировки, называется рядом распределения. Ряды распределений, отражающие результат группировки респондентов по качественным признакам, называются атрибутивными, а по количественным — вариационными. В соответствии с характером количественных признаков вариационные ряды делятся на дискретные и непрерывные. Последние, как правило, носят интервальный характер. Это значит, что та или иная группа респондентов характеризуется по количественному признаку не одним числом, а числовым интервалом. Это важно учитыватьпри вычислении среднестатистического показателя. В соответствии с задачами группировки интервалы могут выбираться равные и неравные, с возрастающими и убывающими значениями. Числа, обозначающие интервалы, называются их границами.
Составление таблиц - это форма отображения рядов распределения.
Числовые данные в таблице объясняются заголовками, подлежащим и сказуемым. Заголовки в таблице бывают общие, выступающие в качестве названия таблицы и раскрывающие структуру группировки рассматриваемой совокупности респондентов либо связь между рядами распределения. Наряду с этим в названии таблицы целесообразно указывать место и время, к которым относятся приводимые сведения, а также общие для всех показателей единицы измерения (проценты, число человек, оценочный индекс, номинал денег и т. д.). Содержание строк и столбцов раскрывается внутренними заголовками: боковыми для строк и верхними для столбцов.
Подлежащим в таблице называется объект (совокупность респондентов), характеристики которого — сказуемое — выражены в таблице в числовом виде. Перечневая таблица – таблица, составленная на основании ряда распределения по одному признаку. Таблицы, отображающие ряды распределений по двум и более признакам называются комбинационными.
Графики и диаграммы - способ отображения социологических данных. Чаще всего он имеет вид полигона или гистограммы. Полигон используется для графического отображения непрерывных рядов, а гистограмма — дискретных.
Средняя арифметическая есть интегральная, обобщенная величина, позволяющая сравнить между собой не только группы одного ряда распределения, но и сами ряды распределения в том случае, если они строятся по идентичным признакам. Для того, чтобы измерить степень равномерности или неравномерности распределения той или иной характеристики респондентов используется величина степени разброса значений признака, называемого дисперсией.
Для выяснения взаимодействия признаков и тенденций их изменения используют коэффициенты корреляции.
Коэффициент ранговой корреляции:
6∑d2
ρ = 1 - --------,
n3-n
где d – разность рангов;
n – общее число рангов;
∑d2 – сумма квадратов разности рангов.
Коэффициент ранговой корреляции изменяет свою величину от -1до +1
Фактически коэффициент ранговой корреляции выявляет степень идентичности распределения установок, мнений, характеристик двух сравниваемых групп опрашиваемых при их ответах на один и тот же вопрос, либо близость распределения ответов одних и тех же групп респондентов на "смежные" вопросы, позиции которого (которых) являются показателями ранговой шкалы. При р = -1 порядок распределения ответов по двум сравниваемым группам прямо противоположен, а при р = +1он полностью совпадает.
Коэффициент парной корреляции призваны измерять взаимосвязь между двумя признаками исследуемого объекта.
Если при корреляции двух признаков между ними существует причинно-следственная связь, то признак, влияющий на характер вариации другого признака, принято называть факторным, а зависимый от него признак — результативным. Наиболее простой метод выявления взаимосвязи двух признаков — группировка и сравнение средних.
Коэффициент ассоциации измеряет тесноту связи между альтернативными признаками и рассчитывается по формуле:
ad-bc
Ка = -------
ad+bc
Линейный коэффициент корреляции измеряет взаимосвязь между двумя признаками, в том случае если связь между ними (x и y) выражается прямой линией.
x * y – x * y
r (x, y) = ---------------,
σxσy
где x y – средняя из произведений значений признаков x и y;
x – средняя признака x;
y – средняя признака y;
σx – среднее квадратичное отклонение признака x;
σy – среднее квадратичное отклонение признака y.
Линейный коэффициент корреляции изменяет свою величину от +1 (прямая связь), до -1 (обратная связь). При r (x, y) = 0 связь слабая либо отсутствует. Коэффициент рассчитывается только для признаков, измеренных при помощи интервальной шкалы.
Наряду с приведенными методами обобщения первичной информации и сведения в эмпирический показатель социолог может конструировать индексы.
|