Распознавание образов на основе критерия Байеса
Условием непосредственного использования критерия Байеса [2] для распознавания образов является условие полноты априорной информации. Если это условие не выполняется, то необходимо дополнительно использовать процедуры обучения или самообучения.
Считаются известными следующие величины:
· возможные классы;
· априорные вероятности появления объектов;
· условные плотности вероятности признака;
· C – платежная матрицаж
· признак, по которому осуществляется классификация.
Априорная информация используется для определения величины , которая является пороговым значением, относительно которого происходит классификация.
Правило принятия решений при классификации:
если , то ,
если , то .
Вероятностный характер распознавания допускает возможность возникновения ошибочной классификации, которую принято характеризовать вероятностями ошибок первого и второго рода. Иногда, эти ошибки называют ложной тревогой и пропуском цели соответственно.
![](https://konspekta.net/pdnrru/baza1/13109117956.files/image626.jpg)
Рис.24.1. Порог критерия Байеса
Ошибка первого рода соответствует ситуации, когда распознаваемый объект принадлежит первому множеству, но классификатор относит его ко второму классу. Вероятность ошибки первого рода определяется по формуле:
.
Ошибка второго рода: .
Условные вероятности правильных решений:
, .
Выбор значения проводят на основе учета потерь, сопряженных с правильными и ошибочными решениями. Величины потерь задаются в виде платежной матрицы:
.
Средний риск при многократном распознавании неизвестных объектов равен сумме потерь, связанных с неправильными и правильными решениями с учетом вероятностей их появления и априорными вероятностями появления объектов классов и:
![](https://konspekta.net/pdnrru/baza1/13109117956.files/image640.gif)
. (24.1)
Пороговое значение признака для критерия Байеса выбирают так, чтобы средний риск был минимален, для чего необходимо решить уравнение: .
Вычисление производных слагаемых среднего риска приводит к следующему уравнению:
.
Окончательно, форма уравнения для определения порога имеет вид:
, (24.2)
где - функция отношения правдоподобия,
- критическое значение коэффициента правдоподобия.
Распознавание образов с применением минимаксного критерия
Минимаксный критерий используется для построения систем распознавания, когда априорные вероятности появления объектов соответствующих классов неизвестны. В этом случае невозможно минимизировать средний риск и байесовская стратегия непосредственно неприменима.
Минимаксный критерий рассматривает наихудший вариант величин априорных вероятностей по отношению к величине среднего риска . Рассматривая классификацию на два класса, можно считать, что справедливо равенство: . Это равенство позволяет записать формулу для среднего риска (30.1) в виде функции от априорной вероятности. Типичный вид такой функции приведен на рис.25.1. Точки графика вычисляются путем решения уравнения байесовской стратегии (24.2) для каждого значения априорной вероятности .
![](https://konspekta.net/pdnrru/baza1/13109117956.files/image664.jpg)
Рис.25.1. Зависимость среднего риска от априорной вероятности
Минимаксная стратегия соответствует точке С, выбор которой обеспечивает то, что при любом фактическом значении априорной вероятности средние потери не будут превышать . Значение порога минимаксного критерия определяется из уравнения:
.
Вычисление производных слагаемых среднего риска приводит к следующему уравнению:
.
Иногда используют упрощающие соотношения и обозначения: , , . В таком случае уравнение для порога критерия минимакса имеет вид:
.
Выбор иной стратегии, например стратегии, соответствующей точке А, приводит к тому, что на интервале средний риск меньше , но на интервале потери будут больше гарантированного значения .
Минимаксная стратегия есть байесовская стратегия для наихудших значений априорных вероятностей, дающая осторожное, но гарантированное значение среднего риска.
|