Обратная связь
|
Интервальный вариационный ряд
Индекс интервала
i
| Число покупателей
(интервалы)
| Частота
| Относительная частота
|
| 148-151
|
| 1/200
|
| 151-154
|
|
|
| 154-157
|
| 5/200
|
| 157-160
|
| 7/200
|
| 160-163
|
| 21/200
|
| 163-166
|
| 38/200
|
| 166-169
|
| 39/200
|
| 169-172
|
| 38/200
|
| 172-175
|
| 21/200
|
| 175-178
|
| 15/200
| Окончание таблицы 5
| Индекс интервала
i
| Число покупателей
(интервалы)
| Частота
| Относительная частота
|
| 178-181
|
| 8/200
|
| 181-184
|
| 3/200
|
| 184-187
|
| 3/200
|
| 187-190
|
| 1/200
| =1
2) После составления вариационного ряда необходимо построить функцию распределения выборки или эмпирическую функцию F*(x)= , то есть функцию найденную опытным путём. Здесь – относительная частота события Х< х, n - общее число значений.
Эмпирическое распределение можно изобразить в виде полигона, гистограммы или ступенчатой кривой.
Построим выборочную функцию распределения. Очевидно, что для функция так как . На концах интервалов значения функции рассчитаем в виде «нарастающей относительной частоты» (Таблица 6).
Таблица 6
Расчёт эмпирической функции распределения
Индекс интервала
i
|
|
| 1/200
|
| 1/200
|
| 1/200+5/200=6/200
|
| 6/200+7/200=13/200
|
| 13/200+21/200=34/200
|
| 34/200+38/200=72/200
| Окончание таблицы 6
| Индекс интервала
i
|
|
| 72/200+39/200=111/200
|
| 111/200+38/200=149/200
|
| 149/200+21/200=170/200
|
| 170/200+15/200=185/200
|
| 185/200+8/200=193/200
|
| 193/200+3/200=196/200
|
| 196/200+3/200=199/200
|
| 199/200+1/200=200/200
|
Табличные значения не полностью определяют выборочную функцию распределения непрерывной случайной величины, поэтому при графическом изображении её доопределяют, соединив точки графика, соответствующие концам интервала, отрезками прямой (рис.1).
Полученные данные, представленные в виде вариационного ряда, изобразим графически в виде ломаной линии (полигона), связывающей на плоскости точки с координатами , где - среднее значение интервала , а - относительная частота.(таблица 7 и рис.2). На этом же рисунке отобразим пунктирной линией выравнивающие (теоретические) частоты.
Таблица 7
Дискретный вариационный ряд
Номер интервала
i
| Среднее значение интервала
| Относительная частота
| Выборочная
оценка плотности вероятности
|
| 149,5
| 0,005
| 0,002
|
| 152,5
|
|
|
| 155,5
| 0,025
| 0,008
| Окончание таблицы 7
|
| 158,5
| 0,035
| 0,012
|
| 161,5
| 0,105
| 0,035
|
| 164,5
| 0,19
| 0,063
|
| 167,5
| 0,195
| 0,065
|
| 170,5
| 0,19
| 0,063
|
| 173,5
| 0,105
| 0,035
|
| 176,5
| 0,075
| 0,025
|
| 179,5
| 0,04
| 0,013
|
| 182,5
| 0,015
| 0,005
|
| 185,5
| 0,015
| 0,005
|
| 188,5
| 0,005
| 0,002
|
Рис.1
Рис.2
На основании полученных выборочных данных необходимо сделать предположение, что изучаемая величина распределена по некоторому определённому закону. Для того чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты полученных в наблюдениях значений, т.е. находят теоретически сколько раз величина Х должна была принять каждое из наблюдавшихся значений, если она распределена по предполагаемому закону. Для этого находят выравнивающие (теоретические) частоты по формуле:
(7)
где n – число испытаний,
- вероятность наблюдаемого значения , вычисленная при допущении, что Х имеет предполагаемое распределение.
Эмпирические (полученные из таблицы) и выравнивающие частоты сравнивают, и при небольшом расхождении данных делают заключение о выбранном законе распределения.
Предположим, что случайная величина Х распределена нормально (см. комментарии к задаче № 4). В этом случае выравнивающие частоты находят по формуле:
(8)
где n-число испытаний,
h-длина частичного интервала,
-выборочное среднее квадратичное отклонение,
( - середина i – го частичного интервала)
– функция Лапласа (9)
Результаты вычислений отобразим в таблице №8.
Сравнение графиков (рис.2) наглядно показывает близость выравнивающих частот к наблюдавшимся и подтверждает правильность допущения о том, что обследуемый признак распределён нормально.
Таблица 8
Расчёт выравнивающих частот
|
|
|
|
|
|
| 149,5
152,5
155,5
158,5
161,5
164,5
167,5
170,5
173,5
176,5
179,5
182,5
185,5
188,5
| -19,5
-16,5
-13,5
-10,5
-7,05
-4,05
-1,05
1,95
4,95
7,95
10,95
13,95
16,95
19,95
| -3
-2,53
-2,06
-1,59
-1,11
-0,64
-0,17
0,31
0,78
1,25
1,73
2,2
2,67
3,15
| 0,004
0,02
0,048
0,11
0,22
0,33
0,396
0,38
0,3
0,18
0,09
0,04
0,011
0,003
| 0,42
1,55
4,54
10,68
20,37
31,0
37,48
36,0
28,0
17,34
8,44
3,37
1,06
0,26
|
| 0,05
0,01
0,025
0,055
0,1
0,155
0,185
0,18
0,14
0,085
0,04
0,015
0,005
|
Интервальный вариационный ряд графически изобразим в виде гистограммы (рис.3). На оси Х отложим интервалы длиной h=3, а на оси Y значения ,расчёт которых представлен в таблице №7. Площадь под гистограммой равна сумме всех относительных частот, т.е. единице.
Графическое изображение вариационных рядов в виде полигона и гистограммы позволяет получать первоначальное представление о закономерностях, имеющих место в совокупности наблюдений.
Рис.3
3) Найдём числовые характеристики вариационного ряда, используя таблицу №4.
Выборочная средняя ( ):
или , (10)
где - частоты,
а -объём выборки. Выборочная средняя является оценкой математического ожидания (среднего значения теоретического закона распределения).
В некоторых случаях удобнее рассчитать с помощью условных вариант. В нашем случае варианты - большие числа, поэтому используем разность:
(11)
где С – произвольно выбранное число (ложный нуль). В этом случае
. (12)
Для изменения значения варианты можно ввести также условные варианты путём использования масштабного множителя:
, (13)
где (b выбирается положительным или отрицательным числом).
. Здесь С – середина 8-го интервала.
Выборочная дисперсия ( ):
(14)
также может быть рассчитана с помощью условных вариант:
(15)
= (1*441+0*324+…+1*324)- 1,95²=40,21
Среднеквадратическое отклонение:
= (16)
= =6,34
Найдем несмещённую оценку дисперсии и среднеквадратического отклонения («исправленную» выборочную дисперсию и среднеквадратическое отклонение) по формулам:
и (17)
= =40,41 и S= 6,34=6,36
Доверительный интервал для оценки математического ожидания с надёжностью 0,95 определяют по формуле:
P( -t Ф(t)= (18)
Из соотношения Ф(z)= /2 вычисляют значение функции Лапласа: Ф(z)=0,475. По таблице значений функции Лапласа ( Приложение А) находят z=1,96. Таким образом,
168,55-1,96 ,
167,67<a<169,43.
Доверительный интервал для оценки среднего квадратичного отклонения случайной величины находят по формуле:
, (19)
где S – несмещённое значение выборочного среднего квадратичного отклонения;
q – параметр, который находится по таблице (Приложение В) на основе известного объёма выборки n и заданной надёжности оценки .
На основании данных значений =0,95 и n=200 по таблице (Приложение В) можно найти значение q=0,099. Таким образом,
,
5,79<
V= (20)
4) Проведём статистическую проверку гипотезы о нормальном распределении. Нормальный закон распределения имеет два параметра (r=2): математическое ожидание и среднее квадратическое отклонение. По выборочным данным (таблицы 5 и 7) полученные оценки параметров нормального распределения, вычисленные выше:
, , S=6,36.
Для расчёта теоретических частот используют табличные значения функции Лапласа Ф(z). Алгоритм вычисления состоит в следующем:
- по нормированным значениям случайной величины Z находят значения Ф(z), а затем :
, =0,5+Ф( ).
Например,
; ; Ф(-3,0)=-0,4987;
;
- далее вычисляют вероятности =P( ;
- находят числа , и если некоторое <5, то соответствующие группы объединяются с соседними.
Результаты вычисления , , и приведены в таблице 9.
По формуле
= (21)
можно сделать проверку расчетов.
По таблице (приложения Г) можно найти число по схеме: для уровня значимости α=0,05 и числа степеней свободы l=k-r-1=9-2-1=6 =12,6. Следовательно, критическая область - (12,6; ). Величина =15,61 входит в критическую область, поэтому гипотеза о том, что случайная величина Х подчинена нормальному закону распределения, отвергается.
При α=0,1 =10,6. Критическая область - (10,6; ). Величина =15,61 также входит в критическую область и гипотеза о нормальном законе распределения величины Х отвергается.
При α=0,01 =16,8, (16,8; ). В этом случае нет оснований отвергать гипотезу о нормальном законе распределения.
Таблица 9
Определение
i
|
|
| Ф( )
|
|
|
|
|
|
|
149,5
|
| -0,500
| 0,000
| 0,0013
| 0,0013
| 0,26
| -
|
| 149,5
152,5
|
| -0,449
| 0,0013
| 0,0059
| 0,0046
| 0,92
| -
|
| 152,5
155,5
|
| -0,494
| 0,0059
| 0,02
| 0,014
| 2,8
| -
|
| 155,5
158,5
|
| -0,48
| 0,02
| 0,057
| 0,037
| 7,4
| 2,54
|
| 158,5
161,5
|
| -0,44
| 0,057
| 0,134
| 0,077
| 15,4
| 4,58
|
| 161,5
164,5
|
| -0,37
| 0,134
| 0,26
| 0,126
| 25,2
| 0,7
|
| 164,5
167,5
|
| -0,24
| 0,26
| 0,433
| 0,1725
| 34,5
| 0,36
|
| 167,5
170,5
|
| -0,07
| 0,433
| 0,62
| 0,188
| 37,6
| 0,06
|
| 170,5
173,5
|
| 0,12
| 0,62
| 0,78
| 0,16
|
| 1,125
|
| 173,5
176,5
|
| 0,28
| 0,78
| 0,89
| 0,11
|
| 0,045
|
| 176,5
179,5
|
| 0,39
| 0,89
| 0,96
| 0,07
|
| 0,071
|
| 179,5
182,5
|
| 0,46
| 0,96
| 0,99
| 0,03
|
| 6,125
|
| 182,5
185,5
|
| 0,49
| 0,99
| 0,996
| 0,006
| 1,2
| -
|
| 185,5
188,5
|
| 0,496
| 0,996
| 0,999
| 0,003
| 0,6
| -
|
| 188,5
|
| 0,5
| 0,999
| 1,0
| 0,001
| 0,2
| -
| ,0000
2 часть
1) Данные таблицы 3 сгруппируем в корреляционную таблицу 10.
2) Строим в системе координат множество, состоящее из 200 экспериментальных точек (рисунок 4).
По расположению точек делаем заключение о том, что экономико-математическую модель можно искать в виде .
3) Найдём выборочные уравнения линейной регрессии.
Для упрощения расчётов разобьём случайные величины на интервалы и выберем средние значения. Для величины Х указанные действия были выполнены в 1 части задания.
Таблица 10
Корреляционная таблица
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y/X
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| Продолжение таблицы 10
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис.4
Для случайной величины Y, используя (1), получим h=2, число интервалов равно 13. Результаты внесём в таблицу со сгруппированными данными №11.
Находим средние значения , по формулам:
, (22)
, (23)
, (24)
. (25)
149,5*86+155,5(82+…+90)+…+188,5*104=2986101
Используя формулы:
, (26)
, (27)
получим
= , =
Таблица 11
Сгруппированные данные выборки
№
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| XY
| 149,5
| 152,5
| 155,5
| 158,5
| 161,5
| 164,5
| 167,5170,5173,5
| 170,5
| 173,5
| 176,5
| 179,5
| 182,5
| 185,5
| 188,5
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4) Вычисляем выборочный коэффициент корреляции по формуле:
. (28)
=
Принято считать, что если 0,1< <0,3 – связь слабая, если 0,3< <0,5 – связь умеренная, если 0,5< <0,7 – связь заметная, если 0,7< <0,9 – связь высокая, если 0,9< <0,99 – связь весьма высокая.
Для данного примера связь между X и Y умеренная.
Затем получают выборочное уравнение линейной регрессии Y на X в виде:
(29)
и выборочное уравнение линейной регрессии X на Y :
. (30)
и
или
Вычисления сумм рекомендуем проводить с помощью пакетов прикладных математических программ (сегодня их существует много).
КОНТРОЛЬНЫЕ ЗАДАНИЯ № 1-№ 4
Вариант 1.
1. Фирма имеет три источника поставки комплектующих – фирмы А, В и С. На долю фирмы А приходится 50% общего объема поставок, В – 30% и С – 20%. Из практики известно, что 10% поставляемых фирмой А деталей бракованные, фирмой В – 5% и фирмой С – 6%.
1) Какова вероятность, что взятая наугад деталь была получена от фирмы А?
2) Какова вероятность, что взятая наугад и оказавшаяся бракованной деталь получена от фирмы А?
2. Накануне выборов 40% населения поддерживают «Партию квадратов», 40% - «Партию Кругов» и 20% еще не определились во мнении. Какова вероятность того, что, по крайней мере, половина из шести наудачу выбранных избирателей оказывают доверие «Партии квадратов»?
3. Имеется 8 изделий, из которых 3 дефектных. Для контроля взято наудачу 3 изделия. Случайная величина Х – число дефектных изделий в выборке.
1) Составить таблицу распределения Х.
2) Найти математическое ожидание M(X) и дисперсию D(Х).
3) Построить график функции распределения y = F(x)
4) Найти вероятность P(0,5<X<3).
4. Фирма «Клубок ниток» производит вязальные спицы. Наиболее популярны размеры
| Диаметр (мм)
| Точность (мм)
| Номер 10
| 3.25
| ± 0.125
| Номер 11
| 3.00
| ± 0.125
| Номер 12
| 2.75
| ± 0.125
|
«Клубок» производит нарезку игл из проволоки и их дальнейшую обработку. В результате чего средний диаметр заготовок становится 3.10 мм, а его среднее квадратическое отклонение 0.10 мм. Допустим, значение диаметра подчиняется закону нормального распределения. Требуется определить долю заготовок, пригодных для производства спиц №11, учитывая, что дальнейшая обработка не изменяет диаметр заготовок.
Вариант 2.
1. В центральную бухгалтерию корпорации поступили пачки накладных для проверки и обработки. 90% пачек были признаны удовлетворительными: они содержали только 1% неправильно оформленных накладных. Остальные 10% пачек накладных были признаны неудовлетворительными, так как содержали 5% неправильно оформленных накладных. Взятая наугад из пачки накладная оказалась оформленной неправильно. Учитывая это, какова вероятность того, что вся пачка накладных будет признана не соответствующей стандартам?
|
|