С.Ю. Гуськов, В.В. Лёвин
2
стик) позволяет повысить эффективность работы автоматизирован-
ных процедур при малых объемах выборок.
ROC-кривая (рис. 1) представляет собой графическую характери-
стику качества бинарного классификатора — зависимость доли верных
положительных классификаций от доли ложных положительных клас-
сификаций при варьировании уровня отсечения решающего правила.
Множество классов
{ 1, 1}.
Y
Классификацию «+1» полу-
чают объекты, которые по своим характеристикам могут быть отне-
сены к положительным, а классификацию «–1» — объекты с проти-
воположными характеристиками. В зависимости от содержательной
интерпретации задачи к
положительным
относят объекты, выявле-
ние которых необходимо обеспечить в первую очередь. При этом в
качестве ошибки I рода рассматривается неверная классификация
положительных объектов.
Положительные объекты в медицинской диагностике — это па-
циенты с симптомами заболевания, которых необходимо выявить на
ранней стадии болезни с использованием диагностического теста; в
машиностроении при приемочном контроле качества продукции —
это дефектные изделия, которые должны быть отсеяны с помощью
процедур приемки качества; в банковском деле — клиенты, у которых
высок риск невозврата долга и предоставление кредита которым не-
желательно.
Далее для определенности положительные объекты будем обозна-
чать как «плохие» (Bad), а отрицательные — как «хорошие» (Good).
Рис. 1.
Примеры различных ROC-кривых при наличии (кривая
1
) и отсутствии
(кривая
2
) различающей способности у классификатора