Обратная связь
|
Выравнивающие и теоретические частоты. Критерий согласия Пирсона. 1.Рассмотрим дискретную случайную величину X, закон распределения которой неизвестен и пусть произведено n испытаний, в которых величина X приняла раз значение , раза значение ,… , раза значение , .
Эмпирическими частотами называют фактически наблюдаемые частоты .
Пусть имеются основания предположить, что изучаемая величина распределена по некоторому определённому закону. Для того, чтобы проверить согласуется ли это предположение с данными наблюдений, вычисляют теоретические (выравнивающие) частоты наблюдаемых значений. То есть, находят теоретически, сколько раз величина X должна была принять каждое из наблюдаемых значений, если она распределена по предполагаемому закону.
Выравнивающие частоты обозначим , находим по формуле: где n – число испытаний, - вероятность наблюдаемого значения xi, вычисленная с учетом, что X имеет предполагаемое распределение.
2. В случае непрерывного распределения вероятности отдельных возможных значений равны нулю. Поэтому весь интервал возможных значений делят на m непересекающихся интервалов и вычисляют вероятности попадания X в частичный интервал. А затем находят как .
Ранее закон распределения генеральной совокупности предполагался известным, и мы выдвигали гипотезы о параметрах распределения, однако возможны случаи, когда закон распределения не известен, но есть основания предположить, что он имеет определённый вид, например A. Тогда выдвигают гипотезу: генеральная совокупность распределена по закону A.
Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения. В качестве случайной величины (критерия) используют критерий согласия. Одним из самых распространенных критериев согласия является критерий согласия .
Для проверки гипотезы о распределении генеральной совокупности применяется критерий согласия , где эмпирические частоты, выравнивающие частоты. Для имеющегося эмпирического распределения находят и , где k – число степеней свободы; s – число групп, вариант, интервалов; r – число оцениваемых параметров предполагаемого распределения
(см приложение 5).
Чтобы найти используют правостороннюю область, для которой должно выполняться . Если , то принимаем; если , то отвергаем.
Замечание. Объём выборки должен быть достаточно велик (не менее 50). Каждая группа должна содержать не менее 5-8 вариант. Малочисленные группы объединяют в одну, суммируя частоты.
Образец выполнения лабораторной работы №5
Задание 1
Из большой партии изделий берут на пробу n=4 изделия. Известно, что доля дефектных изделий во всей партии равна =0,23. Провели =300серий испытаний и получили эмпирическое распределение:
При уровне значимости проверить нулевую гипотезу о биномиальном распределении. На одной координатной плоскости построить полигоны частот для эмпирического и теоретического распределений. Сравнить.
Решение
Для проверки гипотезы о биномиальном распределении генеральной совокупности применяем критерий согласия Пирсона, для этого находим хи- квадрат наблюдаемое по формуле: , где -теоретические (выравнивающие) частоты признака X, они равны , где - число серий испытаний, - вероятности значений признака, которые находим по формуле Бернулли: , где n-количество изделий, - значения признака X–число дефектных изделий, p-вероятность одного дефектного изделия, - вероятность одного стандартного изделия, при этом . В задачи имеем:
Тогда
|
|
|
|
|
|
| 0,35153
|
| 0,609524
|
|
| 0,42001
|
| 1,142857
|
|
| 0,18819
|
| 4,017857
|
| 16
| 0,03747
| 13
| 0,692308
|
|
| 0,00280
|
|
|
|
|
| 6,462546
| Все данные и полученные результаты занесем в таблицу 3:
Таблица 3
Из таблицы выписываем 6,462546 и находим . Так как , то группируем , получаем , а тогда , , так как параметр p в задаче дан и поэтому не оценивается. Имеем, . Из того, что и по приложению 5 в [ ] находим 7
Так как , то гипотезу о биноминальном распределении генеральной совокупности принимаем.
На одной координатной плоскости построить полигоны частот для эмпирического и теоретического распределений.
Замечаем, что эмпирическое и теоретическое распределения достаточно близки. Поэтому можно сделать вывод, что рассматриваемое эмпирическое распределение является биномиальным.
Ответ: нулевую гипотезу принимаем.
Задание 2
Доля дефектных деталей составляет . Производится 75 испытаний и 320 таких серий. Получили эмпирическое распределение признака X-числа дефектных изделий
При уровне значимости проверить нулевую гипотезу о распределении Пуассона. На одной координатной плоскости построить полигоны частот для эмпирического и теоретического распределений. Сравнить.
Решение
Для проверки гипотезы о распределении Пуассона генеральной совокупности применяем критерий согласия Пирсона: , где – эмпирические частоты признака X; -теоретические (выравнивающие) частоты признака X, которые равны , где - число серий испытаний, - вероятности значений признака, которые находим по формуле Пуассона: , где - параметр; - значения признака X–числа дефектных изделий.
; ;
; ;
;
Все данные и полученные результаты занесем в таблицу 4:
Таблица 4
i
|
|
|
|
|
|
|
|
| 0,509
|
| 1,9877
|
|
|
| 0,344
|
| 0,9091
|
|
|
| 0,116
|
|
|
|
| 11
| 0,026
| 8
| 6,4
|
|
|
| 0,005
|
| Σ
| -
|
|
|
|
| Из таблицы выписываем 9,2968 и находим . Так как , то группируем , получаем , а тогда , , так как параметр p в задаче дан и поэтому не оценивается. Имеем, . Из того, что и по приложению 5 в [ ] находим 7
Так как , то гипотезу о распределении Пуассона генеральной совокупности отвергаем.
На одной координатной плоскости построить полигоны частот для эмпирического и теоретического распределений.
Замечаем, что эмпирическое и теоретическое распределения на участке [0;1,5] существенно отличаются. Поэтому можно сделать вывод, что рассматриваемое эмпирическое распределение не является распределением Пуассона.
Ответ: нулевую гипотезу отвергаем.
Задание 3
При уровне значимости проверить нулевую гипотезу о нормальном распределении генеральной совокупности, если известно эмпирическое распределение исследуемого признака: n=180
Решение
Так как предполагаем, что признак генеральной совокупности распределен нормально, то представим данное эмпирическое распределение в виде распределения частичных интервалов. Для этого шаг разбиения найдем по формуле: , где m - количество частичных интервалов. Для проверки гипотезы о нормальном распределении генеральной совокупности применяем критерий согласия Пирсона: , где – эмпирические частоты признака X; - теоретические (выравнивающие) частоты признака X, они равны , где - число серий испытаний, - вероятности значений признака X. Так как признак X нормально распределенная случайная величина, то для нахождения вероятностей используем формулу:
, где ,
Математическое ожидание и среднеквадратическое отклонение генеральной совокупности неизвестны, поэтому заменяем их оценками:
и .
Все данные и полученные результаты занесем в таблицу 5:
Таблица 5
Все данные и результаты занесем в таблицу 6:
|
|
|
|
|
|
|
|
|
|
|
|
| 0,875
|
| -
| -1,44
| -0,5
| -0,4251
| 0,0749
|
| 2,7692
|
| 0,875
| 1,75
|
| -1,44
| -0,94
| -0,4251
| -0,3264
| 0,0987
|
| 0,5
|
| 1,75
| 2,625
|
| -0,94
| -0,43
| -0,3264
| -0,1664
| 0,1600
|
| 2,2069
|
| 2,625
| 3,5
|
| -0,43
| 0,08
| -0,1664
| 0,0319
| 0,1983
|
| 2,7778
|
| 3,5
| 4,375
|
| 0,08
| 0,58
| 0,0319
| 0,2190
| 0,1871
|
| 0,7353
|
| 4,375
| 5,25
|
| 0,58
| 1,09
| 0,2190
| 0,3621
| 0,1431
|
| 0,9615
|
| 5,25
| 6,125
|
| 1,09
| 1,59
| 0,3621
| 0,4441
| 0,0820
|
| 0,0667
|
| 6,125
|
|
| 1,59
| +
| 0,4441
| 0,5
| 0,0559
|
|
|
|
|
|
|
|
|
|
|
|
|
| Таблица 6
.
Так как , то гипотезу о нормальном распределении принимаем.
Построим на одной координатной плоскости эмпирическое и теоретическое распределения и сравним между собой.
Замечаем, что эмпирическое и теоретическое распределения достаточно близки. Поэтому можно сделать вывод, что рассматриваемое эмпирическое распределение является нормальным.
Ответ: нулевую гипотезу принимаем.
Задание 4
Проектный контролируемый размер изделий, изготовляемых станком-автоматом, . Измерения 20 случайно отобранных изделий дали следующие результаты:
контролируемый размер
| 34,8
| 34,9
| 35,0
| 35,1
| 35,2
| частота (число изделий)
|
|
|
|
|
| Требуется при уровне значимости 0,05 проверить нулевую гипотезу при конкурирующей гипотезе .
Решение
Так как дисперсия генеральной совокупности неизвестна, то в качестве критерия используем случайную величину , распределенную по закону Стьюдента. Найдем и , используя таблицы Excel. В качестве ложного нуля возьмем С=35, при этом h=0,1.
Таблица 7
i
|
|
|
|
|
|
| 34,8
|
| -2
| -4
|
|
| 34,9
|
| -1
| -3
|
|
| 35,0
|
|
|
|
|
| 35,1
|
|
|
|
|
| 35,2
|
|
|
|
|
| -
|
| -
|
|
|
Так как , то
Так как , то
Вычислим наблюдаемое значение критерия
Так как конкурирующая гипотеза , то имеем двустороннюю критическую область и по приложению 6 находим =
Так как , действительно, 0,0009 2,09, то нулевую гипотезу принимаем.
Контрольные вопросы для защиты лабораторной работы №5
1.Эмпирические и выравнивающие (теоретические) частоты. Построение нормальной кривой по опытным данным.
2. Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы. Ошибки первого и второго рода. Статистический критерий.
3. Критическая область. Область принятия гипотезы. Критические точки. Виды критических областей. Отыскание критических областей. Мощность критерия.
4. Проверка гипотезы о распределении генеральной совокупности. Критерий согласия Пирсона. χ2 распределение.
ЛАБОРАТОРНАЯ РАБОТА № 6
Тема: Элементы теория корреляции. Задачи теории корреляции. Линейная регрессия, ее уравнение. Коэффициент корреляции, его свойства.
Цель: 1. Нахождение уравнения прямой линии регрессии.
2. Построение прямой линии регрессии и диаграммы рассеяния.
3. Выяснение значимости выборочного коэффициента корреляции.
4. Нахождение выборочного коэффициента корреляции.
Требования к работе
1. Работу провести с использованием таблиц Exсel.
2. Работу распечатать в формате А-4.
3. Ответить на контрольные вопросы и защитить.
|
|