Методика выбора параметров и интерпретации результатов анализа …
5
анализа были взяты некоторые категориальные атрибуты данных
наборов, представленные в табл. 1.
Таблица 1
Данные анализа
Набор данных
Атрибут
Количество
уникальных значений
Adults
Education (Образование)
16
Adults
Marital-status (Семейный статус)
7
Adults
Occupation (Сфера деятельности)
15
Adults
Native-country (Родная страна)
32
Flags
Mainhue (Превалирующий цвет)
8
Для каждого атрибута из табл. 1 формировалась модель, прово-
дился расчет показателя
LOF
всех значений атрибута, строился гра-
фик изменения отношения
LOF
точек ядра к относительной площа-
ди фигуры ядра (рис. 2). Анализ проводился для разных значений па-
раметра
k
. На каждом графике определялась некоторая точка
X
, в
которой начинался рост функции. Определялся
LOF
ядра в точке
X
,
а также разброс
LOF
точек ядра. Точки, не вошедшие в ядро в точ-
ке
X
, считаются выбросами при данном
k
.
а
б
в
г
Рис. 2.
Анализ
rel
LOF S
атрибутов