Table of Contents Table of Contents
Previous Page  2 / 16 Next Page
Information
Show Menu
Previous Page 2 / 16 Next Page
Page Background

А.С. Бобе, Д.В. Конышев, С.А. Воротников

2

Инженерный журнал: наука и инновации

# 9·2016

два непарных сервопривода путем сведения или подъема точек

лица между бровями формируют эмоции «хмурость» и «жалость»;

десять парных сервоприводов подниманием век и бровей фор-

мируют эмоции «радость», «грусть», «скепсис»;

один сервопривод открывает рот, что используется при форми-

ровании нескольких эмоций.

При воспроизведении различных эмоциональных состояний ис-

пользуется несколько сервоприводов. Например, для создания эмо-

ции «страх» задействуются актуаторы, ответственные за открывание

рта, поднятие левой и правой брови.

Что касается разработок, связанных с

распознаванием эмоций

, то

сегодня существует ряд готовых коммерческих решений и большое

количество публикаций, посвящённых данной проблематике [3–8]. В

большинстве работ реализован подход, основанный на выделении

признаков изображения:

холистических

(рассчитываемых в целом по

всему изображению),

локальных

(вычисленных в окрестности задан-

ных контрольных точек),

темпоральных

(определяемых по движе-

нию частей лица во времени) и последующей классификации этих

признаков с помощью методов машинного обучения. Для выделения

признаков лица исследователи в основном используют так называе-

мые

двигательные единицы лица

(Action Units, AU), входящие в Си-

стему кодирования лицевых движений (Facial Action Coding System,

FACS), разработанную П. Экманом [3]. Базовые эмоции для класси-

фикации также выбираются согласно FACS: радость, злость, грусть,

отвращение, страх, удивление (иногда в список базовых включают

эмоцию презрения).

В работе [4] комбинируется несколько типов признаков (оптиче-

ский поток, SIFT, иерархические гауссовы) с последующей класси-

фикацией методом опорных векторов (Support Vector Machine, SVM).

Авторы публикации [5] значительных результатов достигли при ис-

пользовании в качестве признаков пространственно-временной мо-

дификации локальных бинарных шаблонов (LBP-TOP [6]). В матери-

алах [7, 8] продемонстрирован алгоритм расчета интенсивности AU и

сопоставление эффективности различных групп признаков и их объ-

единений. Интересный подход к классификации предложен в [9], где

степени выраженности

AU преобразуются в маркеры наличия эмо-

ций с помощью логических деревьев решений, специфичных для раз-

личных этнических групп.

Существенным препятствием при разработке систем распознава-

ния эмоций является ограниченность доступных баз данных, а также

высокая доля индивидуальных особенностей в проявлении той или

иной эмоции у разных людей. Это несколько ограничивает возмож-

ности применения машинного обучения для классификации, по-