Таблица 2
Символы Предложенный метод OCR Предложенный метод OCR +
коррекция
Общее число
13 680
13 680
Распознанных (число)
13 541
13 629
Распознанных (%)
98,98
99,63
Все замены слов были выполнены корректно, что доказывает ра-
ботоспособность предложенного подхода.
Заключение.
Предложен эффективный комплекс алгоритмов опти-
ческого распознавания символов для решения задач распознавания
текстов и коррекции орфографии. Особенностью алгоритма является
использование для распознавания и бинарных, и полутоновых изобра-
жений текста, с последующей коррекцией результатов, что позволило
достигнуть конкурентоспособной вероятности достоверного распозна-
вания. Результаты компьютерных экспериментов подтвердили работо-
способность и перспективность идей, заложенных в основу подхода.
В заключение следует отметить, что предложенные методы распозна-
вания и коррекции можно применять не только к тестовым докумен-
там, но и в других областях использования компьютерного зрения.
СПИСОК ЛИТЕРАТУРЫ
1. S c h ¨o l k o p f B., B u r g e s C. J. C., and S m o l a A. J. Advances in kernel
methods: Support vector learning. – MIT Press, Cambridge, MA, 1999.
2. Л е в е н ш т е й н В. И. Двоичные коды с исправлением выпадений, вставок и
замещений символов // Докл. Акад. наук СССР.
3. D o n o h o D. L., J o h n s l o n c I. M. Adapting to unknown smoothness via
wavelet shrinkage // J. Am. Stat. Assoc. 90 (1995). – P. 1200–1224.
4. K a n g H. R. Digital color halftoning. – SPIE Press, Bellingham, 1999.
5. F l o y d R. W., S t e i n b e r g L. An adaptive algorithm for spatial grey scale //
Proc. of the Society of Information Display 17, 75–77 (1976).
6. L a u D. L., A r c e G. R., G a l l a g h e r N. C. Green-noise digital halftoning //
Proc. of the IEEE 86 (1998) 2424–2444.
7. Ф о р с а й т Д э в и д А., Ж а н П о н с. Компьютерное зрение. Современный
подход. – М.: Вильямс, 2004. – 928 с.
8. P a r k e r J. R. Algorithms for image processing and computer vision (second
edition). – Wiley, 2010.
9. C i p o l l a R., B a t t i a t o S., G i o v a n n i M. F a r i n e l l a. Computer vision:
detection, recognition and reconstruction (Studies in computational intelligence). –
Springer, 2010.
10. D a l a l N., T r i g g s B. Histograms of oriented gradients for human detection //
CVPR proc., 2005.
11. J o a c h i m s T. Learning to classify text using support vector machines: Methods,
theory, and algorithms. – Kluwer, 2002.
Статья поступила в редакцию 15.12.2011
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
167