Пиши Дома Нужные Работы

Обратная связь

Вычисление частот и построение гистограмм

2М гистограммы (2D Histograms), представляют распределение частот значений выбранной переменной. Диапазон значений переменной разбивается на интервалы. Каждому интервалу на гистограмме соответствует столбец, высота которого пропорциональна частоте попадания значения переменной в данный интервал.

Для построения линейчатой диаграммы необходимо использовать следующую последовательность команд:

Graphs (Графика) - 2D Graphs (2М Графика) – Histograms (Гистограммы)

В результате откроется диалоговое окно (рис.41), в котором необходимо указать переменную, для которой строится гистограмма, а также тип гистограммы: Regular (Обычный) и Multiple (Составной).

Рис.41. Диалоговое окно 2D Histograms

 

Для того, чтобы на гистограмме отображалась линия подгонки распределения, необходимо установить флажок Fit type. На вкладке Advanced (рис.42) есть возможность выбрать нужное распределение.

Рис.42. Диалоговое окно 2D Histograms, вкладка Advanced

 

После нажатия на кнопку ОК на экран будет выведена гистограмма.

На рис.43. приведен пример построения гистограммы распределения частот для переменной index_1 с отображением линии подгонки нормального распределения

Рис.43. Гистограмма распределения частот для переменной index_1.

 

В пакете STATISTICA широкие возможности по проведению группировки, построению рядов распределения и их графиков предоставляют Таблицы частот (Frequency tables).

Таблицы частот представляют собой простейший метод анализа, когда группировка данных и построение ряда распределения производится по одному группировочному признаку.

Для построения таблицы частот необходимо использовать следующую последовательность команд:



Statistics (Статистики) - Basic Statistics and Tables (Основные статистики и таблицы) - Frequency tables (Таблицы частот)

Открывшееся диалоговое окно (рис.44) содержит опции: Variables (Переменные), Summary: Frequency tables(Таблицы частот), Histograms (Гистограммы), Descriptive statistics (Описательные статистики).

Рис.44. Диалоговое окно меню Frequency tables.

 

Щелчок по кнопкеVariables (Переменные) открывает окно Select the variables for analysis (Выбрать переменные для анализа),где следует мышью указать на имя переменной и либо дважды щелкнуть по ней мышью, либо нажать на ОК.

Для группировки данных предназначен ряд опций (вкладка Advanced) под общим названием Categorization method for tables & graphs – Метод категоризации для таблиц и графиков

Рис.45. Диалоговое окно Frequency tables, вкладка Advanced

Опция All distinct values (Все различные значения) позволяет получить дискретный ряд распределения, где будут перечислены все встречающиеся значения вариант.

Пример применения этой опции для построения ряда распределения переменной index_1 приведен на рис.46.

Рис.46. Таблица частот для переменной index_1

 

Опция No. of exact intervals (Число равных интервалов) позволяет получить ряд распределения с заданным количеством равных интервалов.

Пример применения этой опции для построения ряда распределения переменной index_1 (число интервалов равное 12) приведен на рис.47.

Рис.47. Таблица частот для переменной index_1 с заданным количеством интервалов

 

Опция «Neat» intervals app.no. (Приближенное число интервалов)позволяет получить наглядную частотную таблицу, в которой границы интервалов имеют «круглые» значения. При этом, выполненные с помощью данной опции группировки не всегда имеют заданное пользователем число интервалов.

Опция Step size (Размер шага) позволяет провести группировку, изначально задав желаемую величину интервала и начало первого интервала, которое чаще всего является минимальным значением признака (отметить at minimum) или 0 – в окне starting at – начать суказать 0. Пользователь может назначить любую другую точку отсчета.

Опция Integer categories (Целые категории)строит таблицу частот только для целых значений наблюдений, все нецелые величины показателя будут проигнорированы.

 

Графически таблицы частот представляются в пакете STATISTICA в виде гистограмм. Все настройки, произведенные для таблицы частот, действуют и в отношении гистограмм. На график переменной также накладывается гипотетическая кривая нормального распределения (отображается красным цветом).

Пример построения гистограммы распределения частот для переменной index_1 с количеством интервалов равным 12 приведен на рис.48.

Рис.48. Гистограмма распределения частот для переменной index_1 с количеством интервалов равным 12

 

Описательные статистики

Программа STATISTICA вычисляет практически все используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс (и их стандартные ошибки), гармоническое и геометрическое среднее, а также многие специальные описательные статистики.

Для расчета описательных статистик необходимо использовать следующую последовательность команд:

Statistics (Статистики) - Basic Statistics and Tables (Основные статистики и таблицы) – Descriptive Statistics (Описательные статистики)

В результате откроется диалоговое окно (рис.49), в котором необходимо задать переменные, для которых будут вычислены описательные статистики.

Рис.49. Диалоговое окно Descriptive Statistics

Для того чтобы указать те статистики, которые должны быть рассчитаны, необходимо перейти во вкладку Advanced (рис.50) и отметить их флажком.

 

Рис.50. Диалоговое окно Descriptive Statistics , вкладка Advanced

 

После нажатия кнопки Summary на экран будет выведена таблица описательных статистик.

Пример расчета описательных статистик (Valid N, Mean, Median, Mode, Standard Deviation, Coefficient of variation, Minimum&Maximum) для переменных age, height, weight_1 приведен на рис.51.

Рис.51. Описательные статистики для переменных age, height, weight_1

 

Модуль описательных статистик позволяет производить дифференцированный анализ данных. Для этого необходимо в диалоговом окне Descriptive Statistics (рис.49.) кликнуть на кнопке By Group и, в открывшемся диалоговом окне (рис.52), определить группирующую переменную.

Рис.52. Диалоговое окно By Groups

 

После нажатия кнопки Summary будут рассчитаны описательные статистики переменных, сгруппированных по указанному признаку. Результаты выводятся на экран отдельными таблицами.

Пример вычисления описательных статистик для переменной index_1, дифференцировав выборку по переменой sex представлен на рис.53.

 

Рис.53. Пример дифференцированного исследования выборки

 

Кроме того, диалоговое окно описательных статистик (рис.49), нажатием соответствующей кнопки, позволяет вывести на экран гистограмму (Histograms) или коробчатую диаграмму (Box&Wisker plot for all variables), кнопка Summary: Graphs позволяет увидеть и гистограмму и коробчатую диаграмму.

Пример построения коробчатой диаграммы для переменных age, height, weight_1, сгруппированных по переменной sex представлен на рис.54.

Рис.54. Box&Wisker plot для переменных age, height, weight_1, сгруппированных по переменной sex

 

При нажатии кнопки Frequency tables будет построена таблица частот для каждой переменной в отдельности.

 






ТОП 5 статей:
Экономическая сущность инвестиций - Экономическая сущность инвестиций – долгосрочные вложения экономических ресурсов сроком более 1 года для получения прибыли путем...
Тема: Федеральный закон от 26.07.2006 N 135-ФЗ - На основании изучения ФЗ № 135, дайте максимально короткое определение следующих понятий с указанием статей и пунктов закона...
Сущность, функции и виды управления в телекоммуникациях - Цели достигаются с помощью различных принципов, функций и методов социально-экономического менеджмента...
Схема построения базисных индексов - Индекс (лат. INDEX – указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления...
Тема 11. Международное космическое право - Правовой режим космического пространства и небесных тел. Принципы деятельности государств по исследованию...



©2015- 2024 pdnr.ru Все права принадлежат авторам размещенных материалов.