Вычисление частот и построение гистограмм 2М гистограммы (2D Histograms), представляют распределение частот значений выбранной переменной. Диапазон значений переменной разбивается на интервалы. Каждому интервалу на гистограмме соответствует столбец, высота которого пропорциональна частоте попадания значения переменной в данный интервал.
Для построения линейчатой диаграммы необходимо использовать следующую последовательность команд:
Graphs (Графика) - 2D Graphs (2М Графика) – Histograms (Гистограммы)
В результате откроется диалоговое окно (рис.41), в котором необходимо указать переменную, для которой строится гистограмма, а также тип гистограммы: Regular (Обычный) и Multiple (Составной).
Рис.41. Диалоговое окно 2D Histograms
Для того, чтобы на гистограмме отображалась линия подгонки распределения, необходимо установить флажок Fit type. На вкладке Advanced (рис.42) есть возможность выбрать нужное распределение.
Рис.42. Диалоговое окно 2D Histograms, вкладка Advanced
После нажатия на кнопку ОК на экран будет выведена гистограмма.
На рис.43. приведен пример построения гистограммы распределения частот для переменной index_1 с отображением линии подгонки нормального распределения
Рис.43. Гистограмма распределения частот для переменной index_1.
В пакете STATISTICA широкие возможности по проведению группировки, построению рядов распределения и их графиков предоставляют Таблицы частот (Frequency tables).
Таблицы частот представляют собой простейший метод анализа, когда группировка данных и построение ряда распределения производится по одному группировочному признаку.
Для построения таблицы частот необходимо использовать следующую последовательность команд:
Statistics (Статистики) - Basic Statistics and Tables (Основные статистики и таблицы) - Frequency tables (Таблицы частот)
Открывшееся диалоговое окно (рис.44) содержит опции: Variables (Переменные), Summary: Frequency tables(Таблицы частот), Histograms (Гистограммы), Descriptive statistics (Описательные статистики).
Рис.44. Диалоговое окно меню Frequency tables.
Щелчок по кнопкеVariables (Переменные) открывает окно Select the variables for analysis (Выбрать переменные для анализа),где следует мышью указать на имя переменной и либо дважды щелкнуть по ней мышью, либо нажать на ОК.
Для группировки данных предназначен ряд опций (вкладка Advanced) под общим названием Categorization method for tables & graphs – Метод категоризации для таблиц и графиков
Рис.45. Диалоговое окно Frequency tables, вкладка Advanced
Опция All distinct values (Все различные значения) позволяет получить дискретный ряд распределения, где будут перечислены все встречающиеся значения вариант.
Пример применения этой опции для построения ряда распределения переменной index_1 приведен на рис.46.
Рис.46. Таблица частот для переменной index_1
Опция No. of exact intervals (Число равных интервалов) позволяет получить ряд распределения с заданным количеством равных интервалов.
Пример применения этой опции для построения ряда распределения переменной index_1 (число интервалов равное 12) приведен на рис.47.
Рис.47. Таблица частот для переменной index_1 с заданным количеством интервалов
Опция «Neat» intervals app.no. (Приближенное число интервалов)позволяет получить наглядную частотную таблицу, в которой границы интервалов имеют «круглые» значения. При этом, выполненные с помощью данной опции группировки не всегда имеют заданное пользователем число интервалов.
Опция Step size (Размер шага) позволяет провести группировку, изначально задав желаемую величину интервала и начало первого интервала, которое чаще всего является минимальным значением признака (отметить at minimum) или 0 – в окне starting at – начать суказать 0. Пользователь может назначить любую другую точку отсчета.
Опция Integer categories (Целые категории)строит таблицу частот только для целых значений наблюдений, все нецелые величины показателя будут проигнорированы.
Графически таблицы частот представляются в пакете STATISTICA в виде гистограмм. Все настройки, произведенные для таблицы частот, действуют и в отношении гистограмм. На график переменной также накладывается гипотетическая кривая нормального распределения (отображается красным цветом).
Пример построения гистограммы распределения частот для переменной index_1 с количеством интервалов равным 12 приведен на рис.48.
Рис.48. Гистограмма распределения частот для переменной index_1 с количеством интервалов равным 12
Описательные статистики
Программа STATISTICA вычисляет практически все используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс (и их стандартные ошибки), гармоническое и геометрическое среднее, а также многие специальные описательные статистики.
Для расчета описательных статистик необходимо использовать следующую последовательность команд:
Statistics (Статистики) - Basic Statistics and Tables (Основные статистики и таблицы) – Descriptive Statistics (Описательные статистики)
В результате откроется диалоговое окно (рис.49), в котором необходимо задать переменные, для которых будут вычислены описательные статистики.
Рис.49. Диалоговое окно Descriptive Statistics
Для того чтобы указать те статистики, которые должны быть рассчитаны, необходимо перейти во вкладку Advanced (рис.50) и отметить их флажком.
Рис.50. Диалоговое окно Descriptive Statistics , вкладка Advanced
После нажатия кнопки Summary на экран будет выведена таблица описательных статистик.
Пример расчета описательных статистик (Valid N, Mean, Median, Mode, Standard Deviation, Coefficient of variation, Minimum&Maximum) для переменных age, height, weight_1 приведен на рис.51.
Рис.51. Описательные статистики для переменных age, height, weight_1
Модуль описательных статистик позволяет производить дифференцированный анализ данных. Для этого необходимо в диалоговом окне Descriptive Statistics (рис.49.) кликнуть на кнопке By Group и, в открывшемся диалоговом окне (рис.52), определить группирующую переменную.
Рис.52. Диалоговое окно By Groups
После нажатия кнопки Summary будут рассчитаны описательные статистики переменных, сгруппированных по указанному признаку. Результаты выводятся на экран отдельными таблицами.
Пример вычисления описательных статистик для переменной index_1, дифференцировав выборку по переменой sex представлен на рис.53.
Рис.53. Пример дифференцированного исследования выборки
Кроме того, диалоговое окно описательных статистик (рис.49), нажатием соответствующей кнопки, позволяет вывести на экран гистограмму (Histograms) или коробчатую диаграмму (Box&Wisker plot for all variables), кнопка Summary: Graphs позволяет увидеть и гистограмму и коробчатую диаграмму.
Пример построения коробчатой диаграммы для переменных age, height, weight_1, сгруппированных по переменной sex представлен на рис.54.
Рис.54. Box&Wisker plot для переменных age, height, weight_1, сгруппированных по переменной sex
При нажатии кнопки Frequency tables будет построена таблица частот для каждой переменной в отдельности.
|