бок. Диффузия ошибок (MarginED) — метод бинаризации, который ча-
сто используется для растрирования изображений [4], т.е. преобразо-
вания изображений в оттенках серого в однобитные изображения (бит
соответствует точке, печатаемой плоттером). Как показывает прак-
тика, MarginED позволяет получить очень качественные растровые
изображения, сохраняя локальные особенности изображений, а шум,
добавляемый данным типом бинаризации, преимущественно высоко-
частотный. Кроме того, MarginED автоматически усиливает резкость
краев при бинаризации.
Выбор именно этого типа бинаризации для OCR обоснован тем,
что после округления значения пикселя, результирующая ошибка
(между округленным и оригинальным значениями пикселя изобра-
жения) передается дальше для корректировки результатов. Впослед-
ствии движение накопленной ошибки вперед позволяет компенсиро-
вать ошибки бинаризации прошлых пикселей. С учетом описанно-
го эффекта порог бинаризации выбирается совместно (причинным
образом) по группе соседних пикселей. Обычно диффузия ошибки
выполняется в процессе сканирования растрового изображения, по-
этому предпочтительно представление изображения в виде вектора
конкатенированных строк с индексацией слева направо. Выполняются
следующие операции сравнения с пороговым значением
l
(обычно
l
= 0
,
5
):
b
i
= 1
,
если
x
i
+
e
i
=
≥
l
;
b
i
= 0
,
если
x
i
+
e
i
=
< l.
Вектор
e
— вектор ошибок бинаризации. Это взвешенная кумуля-
тивная сумма значений ошибок на предыдущих итерациях:
e
i
=
H
X
h
=1
(
x
i
−
h
−
b
i
)
f
h
.
Фильтр ошибок
f
должен взвешивать и передавать ошибку между
оригинальным пикселем и его бинарной версией. Чаще всего в ка-
честве подобного фильтра используется фильтр Флойда–Штейнберга
[5], который применяет к передаваемой ошибке следующий простран-
ственный шаблон:
x
i
7
16
3
16
5
16
1
16
.
Следует отметить, что сумма значений фильтра равна единице —
это стандартное ограничение для фильтров диффузии ошибок, и оно
156
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012