Рис. 7. Схема разбиения сегмента для построения дескриптора
зволило исключить возможные “выбросы” бинаризации и повысить
робастность алгоритма распознавания.
В результате экспериментов было получено наилучшее разбиение
символов на блоки (рис. 7), позволяющее учесть структурные особен-
ности символа.
Для каждого полученного сегмента с учетом нахлестов строится
гистограмма ориентированных градиентов [10], значения которой по-
следовательно записываются в вектор дескриптора распознаваемого
символа.
В качестве классификатора была выбрана машина опорных векто-
ров (SVM) [11], не раз доказавшая свою эффективность в задачах мно-
гоклассовой классификации, в том числе и в OCR. Рассматривались
модификации SVM с линейным, гауссовым и кубическим полиноми-
альным ядрами:
K
linear
(
~x, ~y
) =
~x
∙
~y
;
K
Gaussian
(
~x, ~y
) =
e
−
γ
k
~x
−
~y
k
2
;
K
cubic
(
~x, ~y
) = (
γ~x
∙
~y
−
1)
3
.
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
163