ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012 151
В процессе повышения качества данных объекты из проблемных
классов должны переместиться в успешные классы. Таким образом,
все данные в результате анализа фильтра
f
i
попадут в один или не-
сколько успешных и только успешных классов. Тогда фильтр счита-
ется успешно обработанным, а система — корректно работающей в
рамках соответствующей бизнес-задачи.
Пусть
CF
(
r
j
) —
количество проблемных классов, в которые попал
объект
r
j
по результатам обработки всех фильтров;
CT
(
r
j
) —
количе-
ство успешных классов, содержащих объект
r
j
.
Следовательно, общее
количество классов по всем фильтрам
(
)
( )
( )
j
j
j
CF r CT r
CS
+
=
∑
.
Оче-
видно, что объект
r
j
содержится во всех классах
n
раз, где
n
—
общее
количество фильтров.
Степень искаженности объекта
r
j
( )
.
j
CF r
CS
Объект является корректным, если
( ) /
0
j
CF r CS
=
.
Если
i
f
k
S
–
k
-
й класс по
i
-
му фильтру, то объекты
r
j
внутри каждо-
го класса
i
f
k
S
можно сортировать по критерию степени искаженности
объекта
r
j
.
Оператор, упорядочивающий объекты
r
внутри отдельно-
го класса
S
:
( )
( ) 1
.
j
j
CF r
Tr r
CS
= −
В первую очередь, будут обрабатываться те объекты
r
класса
S
,
которые наименее искажены.
Мощность отношения
R
,
т. е. количество экземпляров в этом от-
ношении
,
i
i
f
f
F T
S S R
+ =
где
i
f
F
S
—
мощность множества проблемных классов по результа-
там обработки фильтра
f
i
;
i
f
T
S
—
мощность множества успешных
классов для фильтра
f
i
.
В результате профилирования будут выводиться те проблемные
классы, которые имеют минимальное количество объектов. Объекты
в свою очередь распределяются внутри класса так, что сначала идут
объекты, попавшие в наименьшее количество классов. После вырав-
нивания всех объектов в текущем проблемном классе
S
j
фильтра
f
i
возникает ситуация, когда по фильтру
f
i
не осталось проблемных
классов, т. е. фильтр обработан успешно.