Методика выбора параметров и интерпретации результатов анализа выбросов в данных систем поддержки принятия решений - page 9

Методика выбора параметров и интерпретации результатов анализа …
9
выше значение
k
, тем более «мягким» будет анализ, т. е. меньшее ко-
личество значений категориального атрибута будут идентифициро-
ваны как выбросы. Жесткость может быть выбрана на основе некото-
рых нечетких правил, использующих лингвистические переменные,
как, например, на рис. 3.
Шаг 6.
В графике, соответствующем выбранному значению пара-
метра
k
, определить точку
X
начала роста функции, как на рис. 2.
Шаг 7.
Выбросами считать точки, не вошедшие в ядро в точке
X
.
Заключение.
Проведенное исследование показало, что точки,
входящие в ядро, имеют разброс показателя
LOF
в пределах одной
десятой. При расширении границ ядра в него начинают попадать
точки, являющиеся выбросами. В этот момент отношение среднего
показателя
LOF
ядра к его относительной площади начинает расти,
что расценивается построенной моделью как сигнал о попадании в
ядро потенциального выброса. Замечено, что при увеличении пара-
метра
k
, определяющего количество ближайших соседей, анализиру-
емых при расчете показателя
LOF
, график зависимости среднего
LOF
ядра от его относительной площади становится более пологим, сиг-
нал о появлении выбросов появляется позже. Полученные выводы
позволяют интерпретировать значения показателя
LOF
, а также гиб-
ко выбирать параметр
k
на основе субъективных ожиданий эксперта
средствами нечеткой логики. На основе результатов моделирования
предложен вариант разбиения параметра
k
на интервалы
2
2
1,
,
,
,
,
1 ,
3 3 3
3
p p p
p p
  
 

  
 
  
 
где
p
— количество уникальных значений рассматриваемого катего-
риального атрибута.
Разработана методика выбора параметров и интерпретации ре-
зультатов анализа данных на предмет выбросов в категориальных
атрибутах. Методика обладает достаточной гибкостью за счет воз-
можности использования правил нечеткого вывода при выборе пара-
метров анализа на основе нечетко заданной «жесткости» анализа.
Дальнейшие исследования могут быть посвящены развитию ана-
лиза категориальных атрибутов данных на основе построенной моде-
ли, формированию системы правил нечеткого вывода с использова-
нием предложенного способа определения параметра
k
, а также
разработке нечеткого алгоритма автоматической интерпретации по-
казателя локальной аномальности.
1,2,3,4,5,6,7,8 10
Powered by FlippingBook