Гибридный метод оптического распознавания текста с коррекцией результатов распознавания
Авторы: Сюзев В.В., Ханин А.
Опубликовано в выпуске: #11(11)/2012
DOI: 10.18698/2308-6033-2012-11-486
Раздел: Информационные технологии | Рубрика: Компьютерные системы и сети
Рассмотрена задача перевода информации с бумажных носителей в электронный вид. Предложен гибридный метод оптического распознавания символов на основе комплексирования результатов анализа полутоновых и бинарных изображений. Предложена метрика нечеткого поиска для орфографической и синтаксической коррекций распознанного текста с использованием словаря. Разработан программный комплекс для распознавания текстовых изображений и коррекции текста. Проведено сравнение результатов распознавания полутоновых изображений, полученных различными методами, показавшее высокую точность разработанного метода.
Литература
[1] Scholkopf B., Burges C.J.C., and Smola A.J. Advances in kernel methods: Support vector learning. – MIT Press, Cambridge, MA, 1999
[2] Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов // Докл. Акад. наук СССР
[3] Donoho D.L., Johnslonc I.M. Adapting to unknown smoothness via wavelet shrinkage // J. Am. Stat. Assoc. 90 (1995). – P. 1200–1224
[4] Kang H. R. Digital color halftoning. – SPIE Press, Bellingham, 1999
[5] Floyd R.W., Steinberg L. An adaptive algorithm for spatial greyscale// Proc. of the Society of Information Display 17, 75–77 (1976)
[6] Lau D.L.,Arce G.R., Gallagher N.C. Green-noise digital halftoning// Proc. of the IEEE 86 (1998) 2424–2444
[7] Форсайт Дэвид А., Жан Понс. Компьютерное зрение. Современный подход. – М.: Вильямс, 2004. – 928 с.
[8] Parker J.R. Algorithms for image processing and computer vision (second edition). – Wiley, 2010
[9] Cipolla R., Battiato S., Giovanni M. Farinella. Computervision: detection, recognition and reconstruction (Studies in computational intelligence). – Springer, 2010
[10] Dalal N., Triggs B. Histograms of oriented gradients for human detection // CVPR proc., 2005
[11] Joachims T. Learning to classify text using support vector machines: Methods, theory, and algorithms. – Kluwer, 2002