Методика выбора параметров и интерпретации результатов анализа выбросов в данных систем поддержки принятия решений
Авторы: Кузовлев В.И., Орлов А.О.
Опубликовано в выпуске: #11(23)/2013
DOI: 10.18698/2308-6033-2013-11-1045
Раздел: Информационные технологии
Описана модель анализа категориальных атрибутов данных. Модель построена на вычислении показателя локальной аномальности LOF, расчете расстояний между значениями категориальных атрибутов с использованием формулы инверсной гравитации, понятиях плотности объектов и ядра. Обнаружена зависимость результатов работы модели от параметра к, характеризующего число ближайших объектов при расчете показателя LOF. Предложены интервалы значений параметра к, показан вариант применения этих интервалов при определении лингвистических переменных для использования в создании правил нечеткого вывода с целью обеспечения гибкости при выборе параметра к и возможности нечеткой интерпретации значений показателя LOF.
Литература
[1] Chandola V., Banerjee A., Kumar V. Anomaly Detection: A Survey. ACM Computing Surveys, 2009, vol. 41, no. 3, article 15, p. 58
[2] Кузовлев В.И., Орлов А.О. Метод выявления аномалий в исходных данных при построении прогнозной модели решающего дерева в системах поддержки принятия решений. Наука и образование, 2012, № 9. DOI: http://dx.doi.org/10.7463/0912.0483269
[3] Кузовлев В.И., Орлов А.О. Прогнозный анализ данных методом ID3O. Наука и образование, 2012, № 10. DOI: http://dx.doi.org/10.7463/1012.0483286
[4] Breunig M., Kriegel H.-P., T. Ng R., Sander J. LOF: Identifying Density-Based Local Outliers. Proceedings of the ACM SIGMOD International Conference on Management of Data, pp. 93-104
[5] Орлов А.О. Проблема поиска расстояний между значениями категориальных атрибутов при обнаружении выбросов в данных. В мире научных открытий, 2012, № 8.1, с. 142-155
[6] D3js - Data-Driven Documents JavaScript library. URL: http://d3js.org (дата обращения 15.03.2013)
[7] Librino F., Levorato M., Zorzi M. An algorithmic solution for computing circle intersection areas and its applications to wireless communications: In proceedings of Modeling and Optimization in Mobile, Ad Hoc, and Wireless Networks, 2009, pp. 1-10
[8] Метод Монте-Карло. Википедия. URL: http://ru.wikipedia.org/wiki/Метод_ Монте-Карло (дата обращения 15.03.2013)
[9] Flags Data Set. UCI Machine Learning Repository. URL: http://archive.ics.uci.edu/ml/datasets/Flags (дата обращения 11.03.2013)
[10] Adult Data Set. UCI Machine Learning Repository. URL: http://archive.ics.uci.edu/ml/datasets/Adult (дата обращения 11.03.2013)