А.Л. Федотов, К.Л. Тассов
4
вычислению результирующей хеш-функции. Недостатками методов
являются сложность настройки нейронных сетей (необходимо сфор-
мировать обучающую выборку) и ограниченность применения.
Таким образом, был выбран метод визуально восприимчивого
хеширования, основывающийся на выделении особых точек.
Для выделения из изображения некоторой структурированной,
осмысленной информации необходимо привязаться к локальным
особенностям изображения. Можно выделить особые точки на изоб-
ражении. Особая точка
m
, или характеристическая точка (англ.
feature point, key point) изображения, — это точка, окрестность кото-
рой
o
(
m
) можно отличить от окрестности любой другой точки изоб-
ражения
o
(
n
) в некоторой другой окрестности
o
2
(
m
) [7]. Для выделе-
ния особых точек используется детектор, а для формирования инва-
риантной структуры — дескриптор.
Детектор — метод определения особых точек из изображения.
Детектор обеспечивает инвариантность нахождения одних и тех же
особенностей относительно преобразований изображений.
Дескриптор — описатель особой точки, выделяющий ее из осталь-
ного множества особых точек. В свою очередь, дескрипторы должны
обеспечивать инвариантность нахождения соответствия между осо-
быми точками относительно преобразований изображений [8].
Выбор алгоритма вычисления особых точек является важным,
поскольку от него зависит устойчивость поиска похожих изображе-
ний в базе данных.
Среди существующих алгоритмов особых точек наибольшую
устойчивость показывает алгоритм SIFT (англ. Scale Invariant Feature
Transform) [9 ― 11]. Особые точки представляются структурами в
виде капель (англ. blobs) — это круговые области, описываемые че-
тырьмя параметрами: координатами центра (
x
,
y
), масштабом (
) и
направлением (
, угол в радианах). Капли имеют непостоянную гра-
ницу, и их границы могут не совпасть на другом изображении.
Предлагаемый алгоритм.
Выделение особых точек.
Для обна-
ружения особых точек используется алгоритм преобразования мас-
штабно-инвариантных характеристик (SIFT) [12]. Он строит пирами-
ду изображений, применяя фильтр Гаусса, после чего берется раз-
ность пирамиды гауссианов (рис. 2). Разностью гауссианов (англ.
Difference of Gaussian, DoG) называют изображение, полученное пу-
тем последовательного вычитания пикселей одного гауссиана исход-
ного изображения из гауссиана с другим радиусом размытия:
, , σ
, , σ
, , σ ,
D x y
G x y k G x y I x y
,
(2)
где
D
— разность гауссианов;
G
— гауссово ядро (гауссова функ-
ция);
k
— коэффициент, на который отличаются радиусы размытия
.