ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
40
робот должен самостоятельно определить, выдерживаются ли эти
условия. Например, робот может искать выход из помещения, наибо-
лее короткий путь на электронной карте (если требовалось как можно
быстрее выйти из помещения), исследовать возможность прохода по
своим габаритным размерам, определять несущую способность грун-
та и т. п. Такого рода гностические операции должны содержаться в
базе знаний робота или же задаваться оператором в ходе диалога в
виде системы правил.
Речевой интерфейс оператора в диалоговом управлении.
Ре-
чевой интерфейс – основной способ задания управляющей информа-
ции для диалоговой системы управления роботом. Команды операто-
ра могут быть сформулированы на языке ситуационного управления
роботом, о котором говорилось выше. Речевой интерфейс включает
модуль распознавания и лингвистический модуль. Модуль распозна-
вания представляет собой устройство для преобразования речевых
сигналов и их интерпретации в качестве отдельных слов или фраз.
Лингвистический анализатор осуществляет синтаксический и семан-
тический разбор высказывания, в результате которого должны быть
заполнены слоты фрейма для описания действий.
Как было показано выше, высказывания, представленные на язы-
ке ситуационного управления, могут быть выражены на внутреннем
семиотическом языке, сведены к последовательности символов.
В свою очередь, команда оператора, поступающая от модуля распо-
знавания речи, также является последовательностью символов. Та-
ким образом, взаимодействие модуля распознавания и лингвистиче-
ского модуля сводится к преобразованию одной последовательности
символов в другую на базе грамматики, построенной экспертом. При
этом сам лингвистический анализатор обычно может быть представ-
лен в форме конечного автомата.
В настоящее время практически все способы распознавания речи
основаны на сравнении произносимых слов с эталоном. Учитывая,
что словарь языка ситуационного управления довольно ограничен,
необходимо составить предварительную базу используемых слов и
иметь возможность в реальных условиях дополнять (дообучать) ро-
бот новым словам, которые отсутствуют в базовом словаре. В насто-
ящее время на практике чаще всего применяются два способа распо-
знавания речи: способ динамического искажения времени (DTW –
Dynamic Time Warping), или способ сравнения с эталоном, и метод
оценки вероятности гипотез с использованием скрытых Марковских
моделей (HMM – Hidden Markov Models). Для распознавания слитной
речи можно конструировать возможные эталоны фраз с применением
синтаксиса проблемно ориентированного языка диалога оператора и
робота. При профессиональном управлении роботом речевая база
может быть составлена применительно к конкретным операторам,
что снимает проблему дикторозависимости.