Интервальные доверительные оценки для показателей качества…
3
Правило классификации задается в виде функции
0
( ) sign( ( , )
),
x
f x w w
где
x
— классифицируемый объект;
( , )
f x w
— дискриминантная
функция;
w
— вектор параметров, определяемый по обучающей вы-
борке;
0
w
— уровень отсечения,
0
0
1.
w
Для оценки качества классификаторов рассматривают следую-
щие абсолютные и относительные показатели [1].
Абсолютные показатели качества различения
(определяются
для заданного уровня отсечения
0
):
w
TP
(
True Positives
)— верно классифицированные положитель-
ные объекты (так называемые
истинно положительные случаи
);
TN
(
True Negatives
) — верно классифицированные отрицатель-
ные объекты (
истинно отрицательные случаи
);
FN
(
False Negatives
) — положительные объекты, классифициро-
ванные как отрицательные (ошибка I рода). Это «ложный пропуск» —
событие ошибочно не обнаруживается (
ложно отрицательные
случаи
);
FP
(
False Positives
) — отрицательные объекты, классифициро-
ванные как положительные (ошибка II рода). Это «ложное
обнаружение», так как при отсутствии события ошибочно выносится
решение о его присутствии (
ложно положительные случаи
).
В таблице приведено разбиение результатов классификации в за-
висимости от качества объекта (положительный или отрицательный
объект) и от принимаемого решения (положительная или отрица-
тельная классификация).
Таблица сопряженности (ошибок)
Модель
Фактически
Положительно
Отрицательно
Положительно
TP
FP
Отрицательно
FN
TN
Относительные показатели качества различения
(определя-
ются для заданного уровня отсечения
0
):
w
TPR
(
True Positives Rate
) — доля истинно положительных случаев,
;
TP
TPR
TP FN
FPR
(
False Positives Rate
) — доля ложно положительных случаев,