ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
30
УДК 004.02
В . М . Ч е р н е н ь к и й , Ю . Е . Г а п а н ю к
МЕТОДИКА ИДЕНТИФИКАЦИИ ПАССАЖИРА
ПО УСТАНОВОЧНЫМ ДАННЫМ
Рассмотрена методика идентификации пассажира по установоч-
ным данным с учетом возможных опечаток в тексте. Для сравне-
ния строк текста с опечатками предложено использовать рассто-
яние Дамерау – Левенштейна, вычисленное с помощью алгоритма
Вагнера – Фишера с отсечениями Укконена.
E-mail:
Ключевые слова:
расстояние Дамерау – Левенштейна, алгоритм
Вагнера – Фишера, отсечения Укконена.
Введение.
Идентификация пассажира по установочным данным
представляет собой процесс поиска данных о пассажире в оператив-
ных списках. Если установочные данные пассажира содержатся в
оперативных списках, то пассажир должен быть задержан.
Установочные данные пассажира – это текстовая информация
(
фамилия, имя, отчество и пр.), не содержащая изображений и другой
мультимедийной информации.
При поиске данных о пассажире в оперативных списках после-
довательно сравниваются фамилия, имя и отчество пассажира с
каждой записью в оперативных списках. Если фамилия, имя и от-
чество совпадают, то пассажир считается найденным в оператив-
ных списках.
Одной из основных проблем, возникающих при идентификации
пассажира по установочным данным, является нечеткое сравнение
установочных данных пассажира с данными оперативных списков.
Использование нечеткого сравнения обусловлено двумя причинами:
при наборе оперативных списков оператор мог допустить
ошибку;
пассажир мог подделать паспорт, т. е. добавить, изменить, уда-
лить одну или несколько букв в установочных данных паспорта.
В данной статье рассмотрена методика, позволяющая реализо-
вать нечеткий поиск установочных данных пассажира в оперативных
списках.
Расстояние Дамерау – Левенштейна.
Большая часть современ-
ных алгоритмов поиска пассажира по установочным данным с опе-
чатками построена на вычислении расстояния Левенштейна [1] или
расстояния Дамерау – Левенштейна [2]. Определение расстояния Ле-