Следует отметить, что описанный механизм группировки инвари-
антен относительно разрешения отсканированного изображения (ко-
нечно, если оно не слишком мало).
Определение угла наклона
для сгруппированных структур текста
является тривиальной задачей, поэтому останавливаться на ней не
будем. Методы определения угла наклона изложены во многих ис-
точниках [7–9], и при необходимости читатель может ознакомиться с
ними.
Распознавание символов.
После сегментации и определения угла
наклона, когда вышеописанным алгоритмом определена структура до-
кумента, извлеченные сегменты передаются в модуль распознавания
для последовательной обработки. Следует отметить, что в данном раз-
деле будет описан алгоритм распознавания отдельных символов, хотя
в разработанном модуле эффективная работа достигается коррекцией
результатов на завершающих стадиях распознавания отдельных групп
символов. Предлагаемый алгоритм оптического распознавания симво-
лов основан на комплексировании результатов распознавания бинар-
ного и полутонового изображений символа.
Корреляционное сравнение с шаблонами.
Первым этапом распо-
знавания сегментированного символа является вычисление его коэф-
фициента корреляции
r
со специально разработанными шаблонами
(рис. 6):
r
=
X
m
X
n
(
A
mn
ˉ
A
)(
B
mn
ˉ
B
)
s X
m
X
n
(
A
mn
ˉ
A
)
2
X
m
X
n
(
B
mn
ˉ
B
)
2
.
Классические подходы шаблонного распознавания бинарных изо-
бражений подразумевают вычисление корреляции или меры близо-
сти между извлеченным бинарным сегментом и коллекцией бинарных
шаблонов. Новизна предлагаемого подхода заключается в корреляци-
онном сравнении поданного на вход бинарного символа с набором
четырех- или шестибитных шаблонов с допустимым смещением
±
1
пиксель по горизонтали и вертикали. Шаблоны отличаются от класси-
ческих наличием запретных областей — при попадании части распо-
знаваемого сегмента в такую область возвращается штраф, пропорци-
ональный удаленности от правильной формы символа.
В результате многочисленных экспериментов разработанный метод
подтвердил свою адекватность. Кроме того, он позволяет эффектив-
но различать такие затруднительные для обычных алгоритмов пары
символов, как К–Х, М–Н и т.п.
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
161
1,2,3,4,5,6,7,8 10,11,12,13,14,15