Распознавание образов на основе критерия Байеса
Условием непосредственного использования критерия Байеса [2] для распознавания образов является условие полноты априорной информации. Если это условие не выполняется, то необходимо дополнительно использовать процедуры обучения или самообучения.
Считаются известными следующие величины:
· возможные классы;
· априорные вероятности появления объектов;
· условные плотности вероятности признака;
· C – платежная матрицаж
· признак, по которому осуществляется классификация.
Априорная информация используется для определения величины , которая является пороговым значением, относительно которого происходит классификация.
Правило принятия решений при классификации:
если , то ,
если , то .
Вероятностный характер распознавания допускает возможность возникновения ошибочной классификации, которую принято характеризовать вероятностями ошибок первого и второго рода. Иногда, эти ошибки называют ложной тревогой и пропуском цели соответственно.
Рис.24.1. Порог критерия Байеса
Ошибка первого рода соответствует ситуации, когда распознаваемый объект принадлежит первому множеству, но классификатор относит его ко второму классу. Вероятность ошибки первого рода определяется по формуле:
.
Ошибка второго рода: .
Условные вероятности правильных решений:
, .
Выбор значения проводят на основе учета потерь, сопряженных с правильными и ошибочными решениями. Величины потерь задаются в виде платежной матрицы:
.
Средний риск при многократном распознавании неизвестных объектов равен сумме потерь, связанных с неправильными и правильными решениями с учетом вероятностей их появления и априорными вероятностями появления объектов классов и:
. (24.1)
Пороговое значение признака для критерия Байеса выбирают так, чтобы средний риск был минимален, для чего необходимо решить уравнение: .
Вычисление производных слагаемых среднего риска приводит к следующему уравнению:
.
Окончательно, форма уравнения для определения порога имеет вид:
, (24.2)
где - функция отношения правдоподобия,
- критическое значение коэффициента правдоподобия.
Распознавание образов с применением минимаксного критерия
Минимаксный критерий используется для построения систем распознавания, когда априорные вероятности появления объектов соответствующих классов неизвестны. В этом случае невозможно минимизировать средний риск и байесовская стратегия непосредственно неприменима.
Минимаксный критерий рассматривает наихудший вариант величин априорных вероятностей по отношению к величине среднего риска . Рассматривая классификацию на два класса, можно считать, что справедливо равенство: . Это равенство позволяет записать формулу для среднего риска (30.1) в виде функции от априорной вероятности. Типичный вид такой функции приведен на рис.25.1. Точки графика вычисляются путем решения уравнения байесовской стратегии (24.2) для каждого значения априорной вероятности .
Рис.25.1. Зависимость среднего риска от априорной вероятности
Минимаксная стратегия соответствует точке С, выбор которой обеспечивает то, что при любом фактическом значении априорной вероятности средние потери не будут превышать . Значение порога минимаксного критерия определяется из уравнения:
.
Вычисление производных слагаемых среднего риска приводит к следующему уравнению:
.
Иногда используют упрощающие соотношения и обозначения: , , . В таком случае уравнение для порога критерия минимакса имеет вид:
.
Выбор иной стратегии, например стратегии, соответствующей точке А, приводит к тому, что на интервале средний риск меньше , но на интервале потери будут больше гарантированного значения .
Минимаксная стратегия есть байесовская стратегия для наихудших значений априорных вероятностей, дающая осторожное, но гарантированное значение среднего риска.
|