Обратная связь
|
Пример 3 Дискриминантный анализ с использованием компьютерной программы SPSS
Исследователь провел опрос руководителей нескольких небольших фирм, чтобы выяснить, насколько они заинтересованы в экспорте своей продукции. Описание соответствующих переменных представлено в таблице 1.
Таблица 1
Описание переменных
Описание переменной
| Соответствующее наименование в выводных компьютерных данных
| Диапазон шкалы
| Желание экспортировать товар
| y1 Will
| от 1 (определенно не заинтересована) до 5 (определенно заинтересована)
| Уровень заинтересованности в госпомощи
| y2 Govt
| от 1 (определенно не заинтересована) до 5 (определенно заинтересована)
| Размер фирмы (численность)
| x1 Size
| Больше нуля
| Выручка фирмы
| x2 Rev
| $ млн.
| Период работы фирмы на отечественном рынке
| x3 Years
| Фактическое число лет
| Число продуктов, выпускаемых фирмой в настоящее время
| x4 Prod
| Фактическое число
| Обучение сотрудников
| x5 Train
| 0 (отсутствие формальной программы или 1 (наличие формальной программы)
| Опыт руководства в области работы на международном рынке
| x6 Exp
| 0 (опыт отсутствует) или 1 (опыт имеется)
| Всего анкету получили 200 малых фирм, 98 экземпляров было возвращено. Восемь из них использовать было нельзя из-за неполных ответов. Из 90 пригодных для использования экземпляров (45 % ответов) данные по 60 фирмам были использованы для формирования модели, а 30 – для ее проверки. Информация, полученная в результате, предоставлена в таблице 2.
Таблица 2
Набор данных по «экспортному» примеру
Фи-
рма
| Желание экспорти-ровать
y1
| Уровень заинтерес-ованности в господдержке
y2
| Размер фирмы
(числен-ность сотруд-ников)
x1
| Выручка фирмы
x2
| Период работы на отечес-твенном рынке
x3
| Число продуктов, выпускающих фирмой в настоящее/время
x4
| Обучение сотруд-ников
x5
| Опыт руково-дства на междуна-родном рынке
x6
|
|
|
|
| 4,0
| 6,5
|
|
|
|
|
|
|
| 2,0
| 6,0
|
|
|
|
|
|
|
| 2,0
| 5,8
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 3,0
| 6,5
|
|
|
|
|
|
|
| 0,9
| 5,0
|
|
|
|
|
|
|
| 0,9
| 5,0
|
|
|
|
|
|
|
| 3,6
| 6,5
|
|
|
|
|
|
|
| 0,9
| 6,0
|
|
|
|
|
|
|
| 0,9
| 6,0
|
|
|
|
|
|
|
| 3,6
| 7,0
|
|
|
|
|
|
|
| 4,0
| 7,0
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 2,0
| 7,5
|
|
|
|
|
|
|
| 1,0
| 6,0
|
|
|
|
|
|
|
| 2,0
| 6,5
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 2,0
| 9,5
|
|
|
|
|
|
|
| 2,0
| 8,5
|
|
|
|
|
|
|
| 2,0
| 7,0
|
|
|
|
|
|
|
| 0,9
| 6,0
|
|
|
|
|
|
|
| 1,0
| 5,5
|
|
|
|
|
|
|
| 0,3
| 6,5
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 1,0
| 6,5
|
|
|
|
|
|
|
| 1,8
| 6,0
|
|
|
|
|
|
|
| 1,8
| 5,0
|
|
|
|
|
|
|
| 0,9
| 4,5
|
|
|
|
|
|
|
| 0,9
| 5,5
|
|
|
|
|
|
|
| 0,9
| 7,0
|
|
|
|
|
|
|
| 0,9
| 6,5
|
|
|
|
|
|
|
| 2,7
| 6,5
|
|
|
|
|
|
|
| 1,8
| 5,0
|
|
|
| Окончание таблицы 2
|
|
|
|
| 0,9
| 4,5
|
|
|
|
|
|
|
| 0,9
| 5,5
|
|
|
|
|
|
|
| 2,7
| 5,5
|
|
|
|
|
|
|
| 1,8
| 6,0
|
|
|
|
|
|
|
| 0,9
| 6,5
|
|
|
|
|
|
|
| 0,9
| 7,0
|
|
|
|
|
|
|
| 0,9
| 5,5
|
|
|
|
|
|
|
| 0,9
| 5,5
|
|
|
|
|
|
|
| 1,8
| 7,0
|
|
|
|
|
|
|
| 1,8
| 6,0
|
|
|
|
|
|
|
| 0,9
| 4,5
|
|
|
|
|
|
|
| 0,9
| 6,5
|
|
|
|
|
|
|
| 1,8
| 7,0
|
|
|
|
|
|
|
| 1,0
| 5,5
|
|
|
|
|
|
|
| 1,0
| 6,5
|
|
|
|
|
|
|
| 1,0
| 6,1
|
|
|
|
|
|
|
| 0,9
| 6,0
|
|
|
|
|
|
|
| 3,0
| 6,0
|
|
|
|
|
|
|
| 2,0
| 6,5
|
|
|
|
|
|
|
| 1,0
| 5,5
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 2,0
| 5,5
|
|
|
|
|
|
|
| 1,0
| 7,0
|
|
|
|
|
|
|
| 2,0
| 7,5
|
|
|
|
Взяв набор данных (таблица 1 и 2) по желанию экспортировать, посредством преобразования шкалы переменной «желание экспортировать» (y1) можно создать новую неметрическую или некатегориальную переменную «интерес к экспорту» (EI). Другими словами, переменная EI будет принимать значение 2 для всех фирм, которые показали значения 4 и 5 переменной «желание экспортировать». Переменная EI будет принимать значение 1 для всех фирм, которые оценил свое «желание экспортировать на 3 и ниже. Таким образом будут сформированы две группы – одна с «высоким» «интересом к экспорту» ( группа 1), а другая – с «низким» (группа 2). Следовательно, можно проводить дискриминантный анализ. Независимыми переменными для дискриминантного анализа являются: численность персонала (x1), выручка фирмы (x2), срок работы на отечественном рынке в годах (x3), и число продуктов, выпускаемых фирмой в настоящее время (x4). Мы располагаем двумя (m = 2) уровнями зависимой переменной и четырьмя (p = 4) независимыми переменными. Число классифицирующих функций, которые можно получить, определяется как минимум из числа уровней зависимой переменной минус один и числа независимых переменных, т. е. (m – 1, р). В данном случае оно равно 1.
В данном примере включена каждая переменная независимо от ее классифицирующей силы. Этот метод используется в случае, когда у исследователя есть априорные причины использовать в дискриминантной функции все независимые переменные. Параметры дискриминантной функции определяются таким образом, чтобы максимизировать межгрупповую вариацию по сравнению с вариацией внутри групп. Другими словами, дискриминантные веса определяются таким образом, чтобы классифицирующая функция обеспечивала максимальную дифференциацию групп. Поскольку групп две, распечатывается лишь одна классифицирующая функция. В таблице 3 представлены результаты дискриминантного анализа данных по желанию экспортировать продукцию.
Таблица 3
SPSS. Результаты дискриминантного анализа с классификацией по двум группам по данным примера с экспортом
Канонический дискриминантный анализ
60 наблюдений
| 59 степеней свободы
| 4 переменных
| 58 степеней свободы внутри классов
| 2 класса
| 1 степень свободы между классами
|
Информация по классам
Интерес к экспорту
| Частота
| Вес
| Доля
| Высокий
|
|
| 0,366
| Низкий
|
|
| 0,633
|
Многомерные статистики и значение F-критериев
S = 1
| M = 1
| N = 26,5
| Показатель
| Значение
| F
| Число степеней свободы числителя
| Число степеней свободы знаменателя
| Вер > F
| λ Уилкса
| 0,766
| 4,192
|
|
| 0,004
|
Проверка Но: коэффициенты канонической корреляции равны нулю
| Отношение правдоподобия
| F
| Число степеней свободы числителя
| Число степеней свободы знаменателя
| Веp > F
|
| 0,76632980
| 4,192
|
|
| 0,004
|
Объединенные дискриминантные нагрузки
| DIS1
| Size (размер)
| 0,585
| Rev (выручка)
| 0,249
| Years (число лет)
| 0,541
| Prod (число продуктов)
| 0,358
|
Нормированные дискриминантные коэффициенты по всей выборки
| DIS1
| Size
| 0,825
| Rev
| 0,196
| Years
| 0,824
| Prod
| 0,156
|
Ненормированные канонические коэффициенты
Size
| 0,077
| Rev
| 0,300
| Years
| 0,895
| Prod
| 0,061
|
Средние классов по дискриминантным переменным
Интерес к экспорту
| CAN1
| Высокий
| 0,713
| Низкий
| -0,413
|
Итоговые сведения по классификации с использованием линейной дискриминантной функции : число наблюдений и их процент, классифициро-ванные по «интересу к экспорту» (EI).
Исходная категория EI
| Высокий
| Низкий
| Итого
| Высокий
|
72,73
|
27,27
|
100,00
| Низкий
|
23,68
|
76,32
|
100,00
| Итого
|
|
|
| Процент
| 41,67
| 58,33
| 100,00
| Процент попаданий (16+29) / 60 = 75 %
|
Определение значимости. Нулевая гипотеза, которая состоит в том, что средние совокупности дискриминантной функции по группам равны (Но : μа = μв) может быть проверена статистически. При проверке ее значимости на нашем примере можно заметить, что коэффициент Уилкса, который определяется как отношение межгрупповой дисперсии, для функции составил 0,766, что соответствует F-значению 4,1927 с числами степеней свободы 4 для числителя и 55 для знаменателя. Уровень значимости превывает 0,05. Коэффициент Уилкса принимает значение от 0 до 1. Более высокие значения λ означают, что средние группы не различаются и наоборот. Если нулевая гипотеза отвергается, показывая значимость дифференциации, можно приступить к интерпретации результата.
Интерпретация. На основании изучения нормированных коэффициентов можно сделать вывод о том, что численность персонала (0,83) и срок работы на отечественном рынке в годах (0,82) являются двумя наиболее важным классифицирующими переменными по отношению к уровню интереса к экспорту. Это говорит о том, что чем больше численность персонала фирмы и чем дольше она работает на отечественном рынке, тем больше вероятность того, что данная фирма будет проявлять интерес к экспорту.
Приведенные ненормированные коэффициенты могут быть использованы для целей классификации.
Средние по группам, или центроиды, на основании дискриминантной функции составили 0,713 для группы проявляющих высокий интерес к экспорту и –0,413 для группы проявляющих к нему низкий интерес. С учетом того, что размеры двух групп неодинаковы, критическое значение дискриминантной функции, которое может быть использовано для классификации фирм в одну из двух групп, составляет:
Если говорить об отнесении фирм в одну из двух групп, то фирма относится к группе с высоким интересом к экспорту, если ее Z-значение превышает 0,3 и к группе с низким интересом к экспорту, если ее Z-значение ниже 0,3.
|
|