Техника выполнения группировок В зависимости от вида группировочных признаков различают группировки по атрибутивным и количественным признакам. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей (например, группировки населения по полу, семейному положению, образованию; распределение населения на городское и сельское). Определение числа групп при группировке по варьирующему количественному признаку (например, распределение населения по уровню доходов, потреблению отдельных продуктов питания и др.) требует специальных расчетов.
Построение группировки начинается с определения состава группировочных признаков (признаков, положенных в основание группировки).
При группировке приходится решать задачу выбора числа групп.
Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, численности совокупности, степени вариации признака.
Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состояний у этого признака. Например, группировка предприятий по формам собственности.
При группировке по количественному признаку возможны разные варианты:
- если число вариант признака невелико, то каждая варианта представляет отдельную группу;
- если признак является непрерывной переменной или число вариант велико, то делают интервальную группировку.
Различают открытые или закрытые интервалы значений группировочного признака:
- открытые интервалы имеют только верхнюю или только нижнюю границу;
- закрытые интервалы имеют как нижнюю, так и верхнюю границу. При этом могут быть разные варианты построения интервалов:
- в группу входят единицы как с нижним, так и с верхним значением группировочного признака (например, возраст имеет интервалы: 14-17 лет, 18—24 лет и т.д.);
- в группу входят единицы с нижним значением интервала, а с верхним — не входят (50 лет и старше), или наоборот.
Закрытые интервалы при группировке бывают равные и неравные.
При выборе числа интервалов необходимо руководствоваться следующими правилами:
- число групп должно отражать реальную структуру изучаемой совокупности;
- чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;
- не допускается выделение пустых групп.
Необходимое число групп примерно можно оценить по формуле Стерджесса:
где n – число групп; N – число единиц совокупности.
Согласно формуле выбор числа групп зависит от объема совокупности.
Пример. N=35; lg 35 = 1,53; n = 1+3,2322 · 1,53 = 6,08, т.е. необходимо образовать 6 групп.
Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:
где и - максимальное и минимальное значения признака в совокупности;
n – число групп.
При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному в зависимости от того, непрерывный это признак или прерывный.
Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему работ (тыс. руб.): 1200 – 1400, 1400 – 1600, 1600 – 1800, 1800 – 2000), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Для того чтобы правильно отнести к той или иной группе такую единицу объекта, можно использовать открытые интервалы (до 1400, 1400 – 1600, 1600 – 1800, 1800 и более). Возможны два случая обозначения открытого последнего интервала:
1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб.
Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i-1) интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала будут иметь вид (чел.): 100-150, 151-200, 201-300.
От группировки следует отличать классификацию. Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.
Отличительной чертой классификации является то, что в основу ее кладется атрибутивный признак. Классификации стандартны, устойчивы, т.е. остаются неизменными в течение длительного периода времени, и, как правило, разрабатываются органами государственной и международной статистики.
|