ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
98
грации степеней принадлежности, на практике оно стало мощным
инструментом для объединения любой сопоставимой информации в
целях построения мультиклассификаторов, уравнений регрессии
и пр. [16]. Поэтому нечеткое интегрирование целесообразно отнести
к группе скалярных методов мультиклассификации.
Скалярные методы и алгоритмы мультиклассификации.
К таким методам и алгоритмам относятся различные правила инте-
грации откликов базовых классификаторов (комитет старшинства,
комитет большинства (простое голосование), взвешенное голосова-
ние – для откликов в виде номеров классов, среднее, взвешенное
среднее, упорядоченное взвешенное среднее, различные правила
«
суммирования» теории нечетких множеств и т. п. – для откликов в
виде степеней поддержки каждого из классов) [4, 11].
Наиболее распространенным скалярным алгоритмом мультиклас-
сификации является алгоритм AdaBoost, который кроме формирова-
ния линейной алгоритмической композиции обеспечивает построе-
ние или отбор из числа существующих базовых классификаторов,
называемых в методе бустинга слабыми классификаторами. Метод
бустинга может рассматриваться как метод аппроксимации аддитив-
ной логистической модели, использующий в качестве критерия мак-
симум функции правдоподобия Бернулли [17]. Для двухклассовой
задачи аддитивная логистическая модель имеет вид
(
)
(
)
( )
( )
1
1
|
log
,
1
|
M
M
m
m
P y x
F x
f x
P y
x
=
=
=
=
= −
(1)
где
( )
( )
m
m m
f x
h x
=
α
отклик
m
-
го слабого классификатора с весовым
коэффициентом
m
α
;
( ) { }
1; 1
m
h x
∈ −
слабый классификатор;
m
α
ве-
совой коэффициент, характеризующий важность слабого классифи-
катора в итоговой линейной композиции с учетом его отклика;
M
число слабых классификаторов.
Модель (1) является линейной и представляет собой взвешенное
голосование откликов слабых классификаторов. Различные версии
алгоритма AdaBoost могут рассматриваться как процедуры последо-
вательного построения модели (1). Основное отличие версий друг от
друга заключается в вычислении весовых коэффициентов. В алго-
ритме Real AdaBoost отклик слабого классификатора
m
f
находится
как половина логарифма отношения взвешенных апостериорных ве-
роятностей двух классов; в алгоритме Gentle AdaBoost – как разность
взвешенных апостериорных вероятностей; в алгоритме Modest
AdaBoost – с использованием значений апостериорных вероятностей