142
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
зону и присваиванием этой зоне повышенного весового коэффициен-
та [4, 5]. Эти и подобные им правила могут применяться при машин-
ном обучении в рамках средневзвешенного агрегирования зонных
показателей [6].
Описанный выше способ во всех его разновидностях предусмат-
ривает неявное предположение о взаимной независимости величин
i
s
.
Однако на основе относительно простых рассуждений можно по-
казать, что величины
h
s
могут быть зависимы друг от друга. Напри-
мер, если термин запроса встретился в названии новостного доку-
мента, то этот же термин встретится и в первом предложении. В этом
случае имеют дело с положительной корреляцией степеней соответ-
ствия
i
s
и, вычисляя релевантность по формуле (1), заведомо полу-
чают некоторую избыточность результата. Это явление положитель-
ной корреляции агрегируемых величин и способа компенсации соот-
ветствующей избыточности результата подробно рассмотрено,
например, в работе [7]. Рассмотрим более сложную зависимость.
Пусть, по мнению эксперта, термин запроса встречается и в теле до-
кумента, и в аннотации. Тогда документ будет более релевантным
запросу, если этот же самый термин содержится в поле «название до-
кумента», а не в поле «вид документа». Такая зависимость степеней
соответствия
i
s
известна как предпочтительная зависимость крите-
риев, которая не может быть выражена ни одним из аддитивных опе-
раторов, в том числе и средневзвешенным [7]. Подобные рассужде-
ния эксперта невозможно формализовать в виде правил для получе-
ния весовых коэффициентов зон с помощью машинного обучения в
рамках средневзвешенных операторов агрегирования. Следователь-
но, при применении для вычисления релевантности документов
запросу средневзвешенного оператора в некоторой степени огрубля-
ется результат с учетом предположения о независимости величин
h
s
друг от друга.
Нечеткие меры и интеграл Шоке.
Альтернативой средневзве-
шенному оператору может стать интеграл Шоке по нечеткой мере.
Он является обобщением средневзвешенного оператора для случая,
когда величины
h
s
(
следуя устоявшейся терминологии, будем назы-
вать критериями агрегирования) могут зависеть друг от друга [7, 8].
Нечеткая (дискретная) мера — функция множества : 2 [0, 1]
J
ψ
→
(2
J
—
множество всех подмножеств множества индексов критериев
J
= {1, …,
H
}),
которая удовлетворяет следующим условиям:
1)
( ) 0, ( ) 1;
J
∅ =
=
ψ
ψ
2)
,
:
( )
( ).
D B J D B D B
ψ
ψ
∀ ⊆ ⊆ ⇒ ≤
Функция также выражает относительный вес или важность не
только каждого отдельного критерия, но и всякого подмножества
критериев [7]. Нечеткий интеграл Шоке [9], введенный в 1974 г.
М. Суджено на основе неаддитивных мер Шоке [10], используется в
качестве оператора агрегирования, позволяющего отражать знания