МЕТОДА ГРУППИРОВОК И МЕТОДА СРЕДНИХ 10 глава
ЗАДАЧА 342
По десяти магазинам известны следующие данные:
Показатели
| Номер магазина
|
|
|
|
|
|
|
|
|
|
| Товарооборот, тыс. руб.
Издержки обращения, тыс. руб.
|
|
|
|
|
|
|
|
|
|
|
По приведенным в таблице данным:
1. НАЙДИТЕ уравнение линейной регрессии издержек обращения в зависимости от объема товарооборота;
2. ОПРЕДЕЛИТЕ коэффициент корреляции и проверьте его значимость при a=0,05;
3. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 343
Распределение 100 рабочих по месячной заработной плате и квалификации приведено в таблице:
Квалификационный разряд
| Заработная плата, тыс. руб.
| Итого
| 0,3-0,4
| 0,4-0,5
| 0,5-0,6
| 0,6-0,7
| 0,7-0,8
| 0,8-1,1
| 1-й
2-й
3-й
4-й
5-й
6-й
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
|
|
По данным распределения:
1. НАЙДИТЕ уравнение линейной регрессии;
2. ОПРЕДЕЛИТЕ коэффициент корреляции и проверьте его значимость при a=0,05;
3. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 344
Распределение 100 фирм по среднегодовой стоимости основных фондов и годовому объему валовой продукции приведено в таблице:
Стоимость основных фондов, тыс. руб.
| Объем валовой продукции, млн руб.
|
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
|
|
|
По данным распределения:
1. НАЙДИТЕ уравнение линейной регрессии;
2. ОПРЕДЕЛИТЕ коэффициент корреляции и проверьте его значимость при a=0,05;
3. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 345
Распределение 30 фирм по объему выпускаемой за один день продукции и себестоимости единицы продукции приведено в таблице:
Объем выпускаемой за день продукции, тыс. руб.
| Себестоимость единицы продукции, руб.
|
Итого
|
|
|
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
Полагая, что связь между объемом выпускаемой продукции и себестоимостью гиперболическая, ПОСТРОЙТЕ уравнение регрессии, теоретическую линию регрессии.
ЗАДАЧА 346
По итогам работы десяти ферм за отчетный период получены следующие данные:
Показатели
| Ф е р м ы
| 1-я
| 2-я
| 3-я
| 4-я
| 5-я
| 6-я
| 7-я
| 8-я
| 9-я
| 10-я
| Надой молока, ц
Себестоимость 1 ц молока, руб.
|
|
|
|
|
|
|
|
|
|
|
Полагая, что связь между объемом выпускаемой продукции и себестоимостью гиперболическая, ПОСТРОЙТЕ уравнение регрессии, теоретическую линию регрессии.
ЗАДАЧА 347
Распределение 100 торговых фирм по товарообороту и уровню издержек обращения за отчетный период представлено следующей таблицей:
Группы фирм по товарообороту, тыс. руб.
| Уровень издержек обращения, %
|
Итого
| 6 - 8
| 8 –10
| 10 -12
| 1000-2000
2000-3000
3000-4000
4000-5500
|
|
|
|
| Итого
|
|
|
|
|
По данным распределения:
1. НАЙДИТЕ уравнение гиперболической регрессии уровня издержек обращения от товарооборота;
2. ОПРЕДЕЛИТЕ эмпирическое и теоретическое корреляционное отношение;
3. ВЫЧИСЛИТЕ теоретические значения уровней издержек обращения для от
дельных групп предприятий.
ЗАДАЧА 348
Распределение 44 предприятий по объему выпускаемой продукции и средней себестоимости единицы продукции в каждой группе предприятий представлено следующей таблицей:
Выпуск продукции, тыс. ед.
|
|
|
|
|
|
|
|
|
|
| Средняя себестоимость единицы продукции, руб.
Число предприятий
|
16,5
|
13,7
|
13,3
|
12,5
|
13,5
|
12,7
|
12,3
|
12,8
|
12,2
|
12,3
|
По данным таблицы:
1. ПОСТРОЙТЕ корреляционное поле точек;
2. УСТАНОВИТЕ характер связи;
3. СоставьТЕ уравнение регрессии;
4. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 349
По пяти фермам известны следующие данные об урожайности хлопка и доле посевной площади, засеянной по зяби и в срок:
Номер фермы
|
Урожайность, ц/га
| Доля площади посева
| по зяби
| в срок
|
| 32,3
30,7
12,8
7,3
6,5
| 1,00
1,00
0,60
0,50
0,70
| 1,00
0,90
0,40
0,60
0,70
|
По данным таблицы НАЙДИТЕ:
1) уравнения парной линейной корреляционной зависимости урожайности от доли посевов по зяби, по доли площади посевов, засеянной в срок, и уравнение множественной линейной регрессии;
2) частные и общий коэффициенты корреляции и детерминации.
ЗАДАЧА 350
Коэффициенты частной детерминации результативного признака по трем факторам составили: 0,22; 0,29 и 0,32. ОПРЕДЕЛИТЕ: а) частные и общий коэффициенты корреляции; б) совокупный коэффициент детерминации. СФОРМУЛИРУЙТЕ выводы, характеризующие меру влияния вариации каждого из факторов на вариацию результативного признака.
ЗАДАЧА 351
По десяти фирмам известны следующие данные о стоимости основных фондов и фондоотдаче:
Показатели
| Номер фирмы
|
|
|
|
|
|
|
|
|
|
| Стоимость
основных фондов, млн руб.
Фондоотдача, коп.
|
10,0
|
13,0
|
15,2
|
9,3
|
22,6
|
26,0
|
7,0
|
30,0
|
34,0
|
5,6
|
ВЫЧИСЛИТЕ коэффициент корреляции фондоотдачи по стоимости основных фондов и ПРОВЕРЬТЕ его значимость на уровне a=0,05.
ЗАДАЧА 352
По десяти фирмам известны следующие данные о затратах на один рубль товарной продукции и фондоотдаче за отчетный период:
Показатели
| Номер фирмы
|
|
|
|
|
|
|
|
|
|
| Затраты на один рубль товарной продукции, коп
Фондоотдача, коп
|
|
|
|
|
|
|
|
|
|
|
По данным таблицы:
1. ПОСТРОЙТЕ корреляционное поле точек;
2. УСТАНОВИТЕ характер связи;
3. составьТЕ уравнение регрессии;
4. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 353
Связь между объемом выпускаемой продукции и ее себестоимостью на одной из фирм отражена следующей таблицей:
Объем выпускаемой продукции, т
|
|
|
|
|
| Себестоимость единицы продукции, руб.
|
|
|
|
|
|
По данным таблицы:
1. ПОСТРОЙТЕ корреляционное поле точек;
2. УСТАНОВИТЕ характер связи;
3. составьТЕ уравнение регрессии;
4. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 354
Распределение 70 фирм по среднегодовой стоимости основных фондов и годовому объему валовой продукции приведено в таблице:
Стоимость основных фондов, тыс. руб.
| Объем валовой продукции, тыс. руб.
|
|
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
|
|
|
|
По данным таблицы:
1. ПОСТРОЙТЕ корреляционное поле точек;
2. УСТАНОВИТЕ характер связи;
3. составьТЕ уравнение регрессии;
4. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 355
Распределение 65 торговых фирм по объему затрат на рекламу товара и суточной выручке от реализации приведено в таблице:
Объем затрат на рекламу, тыс. руб.
| Суточная выручка, тыс. руб.
| Итого
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| Итого
|
|
|
|
|
|
|
|
|
По данным таблицы:
1. ПОСТРОЙТЕ корреляционное поле точек;
2. УСТАНОВИТЕ характер связи;
3. составьТЕ уравнение регрессии;
4. ПОСТРОЙТЕ теоретическую линию регрессии.
ЗАДАЧА 356
По десяти фирмам известны следующие данные за отчетный период:
Показатели
| Номер фирмы
|
|
|
|
|
|
|
|
|
|
| Товарооборот,
тыс. руб.
Издержки обращения,
тыс. руб.
Фонд заработной
платы, тыс. руб.
|
|
|
|
|
|
|
|
|
|
|
По данным таблицы ВЫЧИСЛИТЕ:
1) оценки частных коэффициентов корреляции и проверьТЕ их значимость на уровне a=0,05;
2) оценку множественного коэффициента корреляции (детерминации) и
проверьТЕ его значимость на уровне a=0,05.
ЗАДАЧА 357
По десяти фирмам известны следующие данные за отчетный период:
Показатели
| Номер фирмы
|
|
|
|
|
|
|
|
|
|
| Фондовооружен-
ность, тыс. руб.
Выработка на од-
ного человека, т
Фонд заработной
платы, тыс. руб.
|
1,1
8,5
|
1,2
9,3
|
1,3
9,4
|
1,5
10,0
|
1,8
11,1
|
2,0
12,1
|
2,2
12,5
|
2,4
13,5
|
2,7
14,0
|
3,0
14,7
| По данным таблицы ВЫЧИСЛИТЕ:
1) оценки частных коэффициентов корреляции и проверьТЕ их значимость
на уровне a=0,05;
2) оценку множественного коэффициента корреляции (детерминации) и
проверьТЕ его значимость на уровне a=0,05.
Тема 13. Непараметрические методы проверки
Гипотез и тесноты связи
ЗАДАЧА 358
По предприятию имеются следующие данные:
Группы
рабочих
| Число рабочих в группе
| выполнивших и
перевыполнивших норму
выработки
| не выполнивших
норму выработки
| всего
| Прошедшие техническое
обучение
Не прошедшие
технического обучения
|
|
|
| Итого
|
|
|
|
1. Проверьте существенность связи между выполнением норм выработки и технической подготовкой рабочих, используя критерий «хи-квадрат» с уровнем значимости 0,01.
2. Установите степень тесноты этой связи, используя коэффициент: а) ассоциации; б) контингенции.
ЗАДАЧА 359
Имеются следующие данные выборочного обследования населения региона по двум признакам:
Тип поселения
| Образование
| высшее и среднее
| начальное и ниже
| итого
| Городское
| 10,76
| 45,34
| 56,10
| Сельское
| 5,10
| 109,40
| 114,50
| Итого
| 15,86
| 154,74
| 170,60
|
1. Проверьте существенность связи между типом поселения и уровнем образования населения, используя критерий «хи–квадрат» с уровнем значимости 0,05.
2. Установите степень тесноты связи, используя коэффициент: а) ассоциации; б) контингенции; в) Чупрова.
ЗАДАЧА 360
Получено выборочное распределение отношения респондентов к покупке товара «А» в зависимости от пола:
Отношение к покупке
| Мужчины
| Женщины
|
Купили
Не купили
|
|
|
Проверьте существенность связи пола респондентов и отношения к покупке товара « А » и определите степень тесноты этой связи.
ЗАДАЧА 361
По региону имеются данные о наличии в 100 колхозах подсобных предприятий и садовых насаждений:
Наличие подсобных
предприятий
| Садовые насаждения
| есть
| нет
| итого
| Нет
Есть
|
|
|
| Итого
|
|
|
|
Охарактеризуйте связь наличия подсобных предприятий и садовых насаждений в колхозах (предварительно проверьте соответствие расположения значений одного альтернативного признака значениям другого).
ЗАДАЧА 362
В результате обследования населения района получены данные:
Семейное
положение
| Число лиц
| имеющих сбережения
| не имеющих сбережений
| всего
| Одинокие
Семейные
|
|
|
| Итого
|
|
|
|
Охарактеризуйте связь между семейным положением и наличием сбережений.
ЗАДАЧА 363
Определите коэффициенты взаимной сопряженности (ассоциации, контингенции, Чупрова) между числом детей в семье и образованием отца по данным о числе семей:
Уровень образования отца
| Число детей в семье
| один ребенок
| два и более
| Среднее и незаконченное среднее
Высшее и незаконченное высшее
|
|
|
Исследуйте существенность связи.
ЗАДАЧА 364
Определите коэффициент взаимной сопряженности Чупрова между степенью удобренности и урожайности пшеницы по следующим данным:
Урожайность
| Степень удобренности
| низкая
| средняя
| высокая
| Итого
| Низкая
Средняя
Высокая
|
|
|
|
| Итого
|
|
|
|
|
Проверьте существенность связи, используя критерий « хи–квадрат» с уровнем значимости 0,05.
ЗАДАЧА 365
Рассчитайте коэффициенты взаимной сопряженности Чупрова и Крамера по данным об уровне образования и распределения населения по регионам (в порядке развития промышленности). Проверьте существенность связи с помощью критерия «хи-квадрат» при уровне значимости 0,10:
Регионы
| Уровень образования
| высшее
| среднее специальное
| среднее полное
| среднее неполное
| итого
| Первый
Второй
Третий
Четвертый
Пятый
|
|
|
|
|
| Итого
|
|
|
|
|
|
ЗАДАЧА 366
Вычислите коэффициенты корреляции рангов Спирмена, Кэндела между стоимостью основных производственных фондов и фондоотдачей на основе следующих данных (ден. ед.):
№ предприятия
|
|
|
|
|
|
|
|
|
|
| Стоимость ОПФ
| 10,0
| 13,0
| 15,2
| 19,3
| 22,6
| 26,6
| 27,0
| 30,0
| 34,0
| 36,6
| Фондоотдача
| 0,80
| 0,82
| 0,81
| 0,85
| 0,83
| 0,88
| 0,87
| 0,91
| 0,95
| 0,98
|
1. Проверьте их значимость с помощью одностороннего критерия с уровнем значимости 0,05.
2. Определите коэффициент корреляции Фехнера.
ЗАДАЧА 367
По десяти городам области известны следующие данные о численности жителей (тыс. чел.) и числе автомобилей на 1000 жителей:
1. Вычислите: а) коэффициент корреляции Спирмена; б) коэффициент корреляции Фехнера.
2. Проверьте значимость коэффициента Спирмена с помощью односторонне
го критерия с уровнем значимости 0,01.
ЗАДАЧА 368
Имеются следующие данные по 10 промтоварным магазинам (ден. ед.):
Товарооборот
|
|
|
|
|
|
|
|
|
|
| Издержки
обращения
|
|
|
|
|
|
|
|
|
|
|
Рассчитайте ранговые коэффициенты корреляции и проверьте их значимость с помощью двухстороннего t – критерия с уровнем значимости 0,05.
ЗАДАЧА 369
Определите с помощью коэффициента конкордации тесноту связи между выполнением норм выработки рабочими за месяц, их возрастом, стажем работы и удовлетворенностью работой по следующим выборочным данным:
Рабочие
| Выполнение норм выработки, %
| Возраст,
лет
| Стаж
работы, лет
| Удовлетворенность работой
|
|
|
|
| Удовлетворен
Скорее неудовлетворен
Удовлетворен
Удовлетворен
Скорее удовлетворен
Безразлично
| Рабочие
| Выполнение норм выработки, %
| Возраст,
лет
| Стаж
работы, лет
| Удовлетворенность работой
|
|
|
|
| Скорее неудовлетворен
Безразлично
Скорее удовлетворен
Неудовлетворен
Безразлично
|
Проверьте нулевую гипотезу об отсутствии связи между признаками по критерию «хи-квадрат» с уровнем значимости 0,05.
ЗАДАЧА 370
Получены мнения трех экспертов о важности пяти факторных признаков, характеризующих потенциальные возможности деятельности правоохранительных органов:
Факторные признаки
| Ранги, установленные экспертами
| первым
| вторым
| третьим
| Х 1 - финансовая обеспеченность
Х 2 - материальная база
Х 3 - специальная техническая оснащенность
Х 4 - компьютеризация
Х 5 - кадровая обеспеченность
|
|
|
|
Охарактеризуйте согласованность мнений экспертов, вычислив коэффициент конкордации и оценив его значимость по критерию «хи- квадрат» с уровнем значимости 0,01. Сделайте выводы.
ЗАДАЧА 371
Имеются данные ранжирования трех факторных признаков, характеризующих потенциальные возможности и результаты функционирования вузов двумя экспертами:
Факторные признаки
| Ранги, установленные экспертами
| первым
| вторым
| Материальная и финансовая
обеспеченность
Успеваемость студентов
Результативность НИР
|
2,5
2,5
|
|
Оцените согласованность мнений экспертов с помощью коэффициента конкордации и проверьте его существенность с уровнем значимости 0,05. Сделайте выводы.
Тема 14. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ИНФОРМАЦИИ
В СРЕДЕ WINDOWS
Система STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Система состоит из следующих основных компонент:
• многофункциональной системы для работы с данными;
• мощной графической системы для визуализации данных и результатов статистического анализа;
• набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;
• специального инструментария для подготовки отчетов;
• встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе.
STATISTICA работает с четырьмя различными типами документов, которые соответствуют основным структурным компонентам системы. Это:
• электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования;
• электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа;
• график — документ в специальном графическом формате для визуализации и графического представления численной информации;
• отчет — документ в формате RTF (Расширенный текстовой формат) для вывода текстовой и графической информации.
В соответствии со стандартами среды Windows каждый тип документа выводится в своем собственном окне в рабочей области системы STATISTICA. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа.
Статистический анализ данных может быть проведен пользователем в одном из следующих режимов.
• Интерактивный режим работы. В этом случае взаимодействие с системой осуществляется при помощи последовательного выбора различных команд из меню. Этот способ работы применяется обычно на этапе предварительного анализа данных.
• Использование макрокоманд. В STATISTICA имеется возможность записи последовательности команд в одну макрокоманду. При этом можно записывать как последовательности нажатий клавиш на клавиатуре, так и движения мыши. Это удобное средство позволяет автоматизировать выполнение часто повторяющихся шагов статистического анализа.
• При помощи встроенного командного языка системы STATISTICA (язык SCL — STATISTICA Command Language) пользователь имеет возможность выполнять статистическую обработку данных в пакетном режиме. Кроме того, имеется возможность установить соответствие между этой программой и ярлыком на рабочем пространстве Windows и запускать ее как обычное Windows приложение.
• При помощи встроенного языка STATISTICA BASIC пользователь может написать свои собственные процедуры обработки данных. Это мощный язык, ориентированный на структуру данных системы STATISTICA, содержит большое количество специальных математических и статистических функций (например, операции работы с матрицами — всевозможные разложения матриц, нахождения собственных векторов и собственных значений и др., вычисление всевозможных статистических распределений и т. д.).
|