Использование информации о динамике изменений человеческого лица для решения задач распознавания и классификации - page 10

С.В. Горин
,
А.С. Сулимов
10
количество соседних пикселей
P
= 8;
расстояние от центральных пикселей до соседних
R
= 1 пикс.
Для применения динамического ЛБШ также учитывается значе-
ние промежутка времени между последовательными кадрами
Δ
t
= 0,5 с.
Значения параметров были подобраны эмпирическим путем при
обработке одного случайным образом выбранного видеофрагмента из
тестовых баз данных.
Используемые средства.
В качестве среды для проведения экс-
периментов был выбран пакет прикладных программ MATLAB. Для
выделения особых характеристических точек при анализе человече-
ских лиц в видеопотоке использовалась свободно распространяемая
библиотека The Machine Perception Toolbox [14].
Для классификации используются средства библиотеки
LIBSVM [8].
Описание эксперимента.
В листинге (1) представлен код для
получения гистограммы LBP. В листинге (2) представлен код для
вычисления VLBP, основанного на информации целого фрагмента
видеопотока. Исходные видеофрагменты помещаются в отдельные
папки в зависимости от проводимого эксперимента. К каждому
фрагменту применяется вычисление гистограммы LBP/VLBP, гене-
рируются файлы для обучения классификатора.
После этого к исходным видеофрагментам применяется оператор
LBP, и полученная гистограмма подается на вход классификатору.
В зависимости от результата классификации исходный видеофраг-
мент помещается в соответствующую папку. Зная имена исходных
видеофрагментов, определяется количество корректно классифици-
рованных данных.
Распознавание человеческих лиц.
Исследовалась работа мето-
да с видеоизображениями, имеющими различные размеры кадров
130
×
150 пикселей, содержащихся в CRIM [18], 320
×
240 пикселей
из базы VidTIMIT [19]. Также производилось масштабирование ви-
деофрагментов до размера кадра 40
×
30 пикселей.
В табл. 2 представлены результаты распознавания, полученные
на описанной базе видеофрагментов. Из результатов видно, что ме-
тод, основанный на динамике изменений человеческого лица, значи-
тельно превосходит в частоте распознавания метод, использующий
исключительно статические кадры для составления модели.
Стоит отметить, что при более высоком разрешении точность
распознавания обоих методов выше. Однако при значительном раз-
мере кадра результаты изменяются незначительно.
Полученные результаты подтверждают выдвинутые в [11] прин-
ципы.
1,2,3,4,5,6,7,8,9 11,12,13,14,15
Powered by FlippingBook