Методика выбора параметров и интерпретации результатов анализа выбросов в данных систем поддержки принятия решений - page 4

В.И. Кузовлев, А.О. Орлов
4
ядра. Снова рассчитывается средний показатель
LOF
по формуле (3)
и отношение площадей по формуле (4). Плотность ρ уменьшается до
тех пор, пока все объекты не попадут в ядро, т. е. станет справедливо
равенство
1
rel
S
.
На третьем этапе формируется график зависимости среднего по-
казателя локальной аномальности объектов ядра от отношения пло-
щадей фигуры ядра к общей площади объектов
 
rel
LOF S
. Вся про-
цедура повторяется для разных значений параметра
k
, характеризу-
ющего количество ближайших объектов при расчете показателя
LOF
.
Визуальное представление модели реализовано средствами биб-
лиотеки D3js [6] и показано на рис. 1.
Рис. 1.
Модель анализа значений категориальных атрибутов
Расчет площади фигуры, состоящей из пересечения набора
окружностей, является весьма нетривиальной задачей [7]. Поэтому
для расчета площади ядра использовался алгоритм Монте-Карло [8] с
числом точек, равным 100 000.
Результаты моделирования.
Для моделирования использова-
лись наборы данных Калифорнийского университета: набор данных о
флагах стран [9], содержащий 148 записей, а также часть набора дан-
ных о взрослом населении США [10], содержащая 1496 записей. Для
1,2,3 5,6,7,8,9,10
Powered by FlippingBook