Пиши Дома Нужные Работы

Обратная связь

Доверительные интервалы для генеральной доли

Норильский индустриальный институт

Кафедра экономики и управления предприятием

 

Статистика

 

Методические указания к самостоятельной работе студентов

экономических специальностей (всех форм обучения)

 

Норильск, 2003 г.

Статистика. Методические указания к самостоятельной работе для студентов специальности 060800 ''Экономика и управление на предприятии (по отраслям)'', 061100 ''Менеджмент'', 060500 «Бухгалтерский учет, анализ и аудит», 060400 «Финансы и кредит».

 

 

Составители: Орел Ю. А., ст. преподаватель

Смирнова А. Т., ст. преподаватель

 

 

Методические указания предназначены студентам специальностей 060800, 061100, 060500, 060400, всех форм обучения. Указания разработаны в соответствии с учебным планом, содержат основные теоретические положения, примеры решения типовых задач, а также задачи для самостоятельной работы.

 

© Норильский индустриальный институт, 2003

 

ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ

Статистическая сводка и группировка

 

Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения.

Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.



Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения данных, основой для правильного исчисления статистических показателей. С помощью метода группировок решаются следующие задачи:

q разделение всей совокупности на качественно однородные групп - выделения социально-экономических типов. Эти группировки называются типологическими (например, группировка хозяйственных объектов по формам собственности, населения по общественным группам и др.).

q характеристика структуры явления и структурных сдвигов, происходящих в нем. Эти группировки называются структурными(например, изучение состава населения по полу, возрасту и другим признакам, характеристика предприятий по числу работающих и т.д.).

q изучение взаимосвязи между отдельными признаками изучаемого явления. Такие группировки называются аналитическими или факторными (например, группировка предприятий определенной отрасли экономики по уровню производительности труда для выявления ее влияния на себестоимость продукции. Группировка банков по величине активов и др.)

Метод группировки основывается на двух категориях — группировочном признаке и интервале.

Группировочный признак — это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков.

Группировка может производиться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка).

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают:

равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

открытые, когда имеется только либо верхняя, либо нижняя граница;

закрытые, когда имеются и нижняя, и верхняя границы.

При проведении группировки решаются следующие вопросы.

1. Выбор группировочного признака.

2. Определение числа групп и величины интервала. Для нахождения числа групп служит формула:

n = 1 + 3,322 lg N,

где N — количество элементов совокупности.

Для нахождения величины интервала существует формула:

,

где - соответственно минимальное и максимальное значение признака в совокупности.

Средние величины

 

Средняя величина — это обобщающий показатель, характеризующий типичный уровень варьирующего количественного признака на единицу совокупности в определенных условиях места и времени.

Объективность и типичность статистической средней обес­печивается лишь при определенных условиях.

Первое условие - средняя должна вычисляться для качественно однородной со­вокупности. Для получения однородной совокупности необхо­дима группировка данных, поэтому расчет средней должен со­четаться с методом группировок.

Второе условие - для исчисле­ния средних должны быть использованы массовые данные. В средней величине, исчисленной на основе данных о большом числе единиц (массовых данных), колебания в величине при­знака, вызванные случайными причинами, погашаются и прояв­ляется общее свойство (типичный размер признака) для всей со­вокупности.

Средняя величина всегда именованная, она имеет ту же раз­мерность, что и признак у отдельных единиц совокупности.

Средние величины делятся на два больших класса:

степенные средние,

структурные средние.

Кстепенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качествеструктурных средних рассматриваются мода и медиана.

Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по несгруппированным данным и имеет следующий общий вид:

где хi - варианта (значение) определенного признака,

m – показатель степени средней.

n – число вариант (значений).

Взвешенная средняя считается по сгруппированным данным и имеет вид:

где хi - варианта (значение) определенного признака или серединные значения интервала, в котором измеряется варианта,

m – показатель степени средней.

fi – частота, показывающая сколько раз встречается i-е значение осредняемого признака.

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:

средняя гармоническая, если m = -1;

средняя геометрическая, если m -> 0;

средняя арифметическая, если m = 1;

средняя квадратическая, если m = 2;

средняя кубическая, если m = 3.

Формулы степенных средних приведены в таблице 1.1.:

Значе-ние m Наименование средней Формула средней простая взвешенная
  -1   Гармоническая
Геометрическая
    Арифметическая
    Квадратическая

 

Структурные средние - мода и медиана - в отличие от сте­пенных средних, которые в значительной степени являются аб­страктной характеристикой совокупности, выступают как конк­ретные величины, совпадающие с вполне определенными вари­антами совокупности. Это делает их незаменимыми при реше­нии ряда практических задач.

Модой называется значение признака, которое наиболее час­то встречается в совокупности (в статистическом ряду).

Медианой называется значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.

Для определения медианы сначала определяют ее место в ряду, используя формулу

где n - число членов ряда.

Если ряд состоит из четного числа членов, то за медиану ус­ловно принимают среднюю арифметическую их двух срединных значений.

В отличие от дискретных вариационных рядов определение моды и медианы по интервальным рядам требует проведения определенных расчетов на основе следующих формул:

,

где - нижняя граница модального интервала;

- модальный интервал;

- частоты в модальном, предыдущем и следующем за модальным интервалах (соответственно).

Модальный интервал определяется по наибольшей частоте.

,

где - нижняя граница медианного интервала;

- медианный интервал;

- половина от общего числа наблюдений (полусумма накопленных частот);

- сумма наблюдений, накопленная до начала медианного интервала;

- число наблюдений в медианном интервале.

Показатели вариации

 

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Размахвариации (R) показывает, насколько велико различие между единица­ми совокупности, имеющими самое маленькое и самое большое значение признака.

Его рассчитывают как разность между наибольшим и наименьшим значениями варьирующего признака, т. е.

R=Xmax-Xmin

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – средне линейное отклонение. Оно вычисляется как средняя арифметическая из абсолютных значений отклонений вариант хi, и (взвешенная или простая в зависимости от исходных условий) по следующим формулам:

для несгруппированных данных ,

где n – число членов ряда;

для сгруппированных данных ,

где - сумма частот вариационного ряда.

Среднее линейное отклонение дает обобщен­ную характеристику степени колеблемости признака в совокуп­ности. К сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

простая дисперсия для несгруппированных данных ,

взвешенная дисперсия для сгруппированных данных .

 

Формула для расчета дисперсии может быть преобразована в , т.е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины.

Дисперсия есть средняя величина квадратов отклонений. Если извлечь корень из дисперсии получим среднее квадратическое отклонение:

для несгруппированных данных ,

для сгруппированных данных .

Среднее квадратическое отклонение - это обобщающая харак­теристика размеров вариации признака в совокупности. Оно выражается в тех же единицах измерения, что и признак (в мет­рах, тоннах, рублях, процентах и т. д.).

До сих пор говорилось о показателях вариации, выраженных в абсолютных величинах. Но для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в несколь­ких совокупностях представляют интерес показатели вариации, приведенныев относительных величинах. Базой для сравне­ния должна служить средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линей­ного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего они выража­ются в процентах и определяют не только сравнительную оцен­ку вариации, но и дают характеристику однородности совокуп­ности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показате­ли вариации (V):

Коэффициент осцилляции ( ):

Линейный коэффициент вариации ( ):

Коэффициент вариации ( ):

Выяснение общего характера распределения предполагает оценку его однородности, а также вычисление показателей асим­метрии и эксцесса. Для симметричных распределений частоты любых двух вариант, равноотстоящих в обе стороны от центра распределения, равны между собой. Рассчитанные для таких распределений средняя, мода и медиана также равны.

При сравнительном изучении асимметрии нескольких распре­делений с разными единицами измерения вычисляется относи­тельный показатель асимметрии ( ).

Его величина может быть положительной и отрицательной. В первом случае речь идет о правосторонней асимметрии, а во втором - о левосторонней.

Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной; если она меньше 0,25, то незначительной.

Для симметричных распределений может быть рассчитан показатель эксцесса (островершинности).

,

где - центральный момент четвертого порядка;

Эксцесс может быть положительным и отрицательным. У высоковершинных распределений показатель эксцесса имеет знак (+), а у низковершинных – знак (-). Предельным значением отрицательного эксцесса является величина Ех=-2; величина положительного эксцесса является величиной бесконечной. В нормальном распределении Ех=0.

 

Выборочное наблюдение

 

Выборочный метод применяется в тех случаях, когда проведение сплошного наблюдения невозможно или экономи­чески нецелесообразно. Выборочное наблюдение используют также для проверки результатов сплошного наблюдения.

Ту часть единиц, которые отобраны для наблюдения, принято называть выборочной совокупностью, а всю совокупность единиц, из которых производится отбор, — генеральной. Качество результатов выборочного наблюдения зависит от того, насколько состав выборки представляет генеральную совокупность, иначе говоря, от того, насколько выборка репрезентативна (представительна).

Для обеспечения репрезентативности выборки необходимо соблюдение принципа случайности отбора единиц. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой-либо иной фактор, кроме случая.

Однако вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответ­ствующими характеристиками для всей совокупности (генераль­ной совокупности). Величина этих отклонений называется ошибкой наблюдения.

Принятые условные обозначения:

N - объем генеральной совокупности (число входящих в нее единиц);

n - объем выборочной совокупности (число единиц, попав­ших в выборку);

- генеральная средняя (среднее значение признака в гене­ральной совокупности);

- выборочная средняя (среднее значение признака в выбо­рочной совокупности);

р - генеральная доля (доля единиц, обладающих данным при­знаком в генеральной совокупности);

w - выборочная доля (доля единиц, обладающих данным при­знаком в выборочной совокупности);

- генеральная дисперсия (дисперсия признака в генераль­ной совокупности);

S2 - выборочная дисперсия (дисперсия признака в выбороч­ной совокупности);

- среднее квадратическое отклонение признака в генераль­ной совокупности;

S - среднее квадратическое отклонение признака в выбороч­ной совокупности.

 

При расчете ошибок возникает существенное затруднение: величины и р по генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В табл. 1.2 приведены формулы расче­та ошибок простой случайной выборки.

Таблица 1.2.

Формулы ошибок простой случайной выборки

  Показатель Способ отбора единиц  
повторный   бесповторный  
Средняя ошибка : для средней    
  для доли      
Предельная ошибка для средней      
  для доли      

Формулы предельной ошибки позволяют решать задачи трех видов:

1. Определение пределов генеральных характеристиксзаданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки. Доверительные интервалы для генеральной средней:

Доверительные интервалы для генеральной доли

2. Определение доверительной вероятности того, что гене­ральная характеристика может отличаться от выборочной не бо­лее чем на определенную заданную величину.

Доверительная вероятность является функцией от t, опреде­ляемой по формуле

По величине t определяется доверительная вероятность (смотрится по соответствующим таблицам).

3. Определение необходимого объема выборки, который практической вероятностью обеспечивает заданную точность выборки.

Для расчета объема выборки необходимо иметь следующие данные:

а) размер доверительной вероятности (Р),

б) коэффициент t, зависящий от принятой вероятности;

в) величину ;

г) величину максимально допустимой ошибки ( );

д) объем генераль­ной совокупности.

Необходимый объем выборки определяется на основе допус­тимой величины ошибки: .

В табл. 1.3 приведены формулы для расчета численности простой случайной выборки.

Таблица 1.3.






ТОП 5 статей:
Экономическая сущность инвестиций - Экономическая сущность инвестиций – долгосрочные вложения экономических ресурсов сроком более 1 года для получения прибыли путем...
Тема: Федеральный закон от 26.07.2006 N 135-ФЗ - На основании изучения ФЗ № 135, дайте максимально короткое определение следующих понятий с указанием статей и пунктов закона...
Сущность, функции и виды управления в телекоммуникациях - Цели достигаются с помощью различных принципов, функций и методов социально-экономического менеджмента...
Схема построения базисных индексов - Индекс (лат. INDEX – указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления...
Тема 11. Международное космическое право - Правовой режим космического пространства и небесных тел. Принципы деятельности государств по исследованию...



©2015- 2024 pdnr.ru Все права принадлежат авторам размещенных материалов.