Предварительная обработка.
Отсканированные документы и
книги, как правило, для удобства восприятия человеком хранятся в
виде цветных изображений или изображений в оттенках серого, в
то время как подавляющее большинство OCR-систем для перевода
изображения в последовательность символов используют бинарные
изображения. Для разработанного OCR-метода данное утверждение
тоже справедливо, но только с важным замечанием – на этапе распо-
знавания используются и бинарное, и полутоновые изображения.
Рассмотрим шумоподавление и бинаризацию отсканированных пе-
чатных документов в качестве предварительного шага обработки для
распознавания текста.
Вейвлет-фильтрация.
Применительно к области шумоподавления
вейвлет-преобразование позволяет удалять шум с изображения, сла-
бо затрагивая границы и детали. Оно является доказуемо оптималь-
ным для аддитивного гауссового белого шума с известной дисперсией
[3], а также позволяет эффективно подавлять шумы со спектрами,
отличными от белого. Схематично одномерное дискретное вейвлет-
преобразование изображено на рис. 1.
Вейвлет-фильтр применяется к изображению в оттенках серого до
бинаризации. Автор полагает, что читатель знаком с теорией вейвле-
тов, поэтому далее приведена лишь общая схема фильтрации изобра-
жения (рис. 2).
Следует отметить, что присутствующие шум и артефакты в от-
сканированных документах не являются белым гауссовым шумом в
чистом виде. Тем не менее эксперименты показали, что в большин-
стве случаев этот подход позволяет улучшить качество изображения и
является полезным шагом предварительной обработки.
Бинаризация диффузией ошибок.
Следующим после фильтрации
изображения этапом является бинаризация методом диффузии оши-
Рис. 1. Схема одномерного вейвлет-преобразования
Рис. 2. Общая схема подавления шума на основе вейвлет-преобразования
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
155
1,2 4,5,6,7,8,9,10,11,12,13,...15