ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
48
Для совместного использования биометрических характеристик
одной из различных модальностей были исследованы и разработаны
методы мультиалгоритмического и мультимодального смешивания
(
построения обобщенного решения по нескольким признакам одной
или нескольких модальностей).
Особенности биометрической идентификации личности по
голосу.
Уникальность голоса человека обусловлена множеством фи-
зиологических особенностей (строением голосовых связок, трахеи,
носовых полостей, манерой произношения звуков, расположением
зубов). Комбинация этих особенностей индивидуальна, как и отпе-
чатки пальцев. Однако на практике ни одна из унимодальных систем
биометрической идентификации, в том числе и голосовая, не может
гарантировать 100 %-ной идентификации личности.
Основными источниками ошибок при идентификации дикторов
являются эффекты:
‒
среды записи (уровень и тип шума, уровень реверберации);
‒
представления (длительность речи, психофизиологическое со-
стояние говорящего (болезнь, эмоциональное состояние и т. п.), язык
речевого сообщения, изменение голосового усилия);
‒
канала (помехи (импульсные, тональные и т. п.), искажения
(
амплитудно-частотные характеристики микрофона и канала переда-
чи, вид кодирования в канале и т. д.)).
Для снижения влияния перечисленных источников ошибок при
проектировании системы голосовой биометрии в ЦРТ были созданы
робастные автоматические методы и алгоритмы, реализующие ос-
новные этапы обработки речевого сигнала в такой системе:
‒
предварительная обработка речевого сигнала (выделение на ре-
чевом сигнале участков, содержащих речь дикторов, оценка качества
речевого материала);
‒
автоматическая сегментация дикторов в фонограмме;
‒
автоматическое выделение биометрических характеристик го-
лоса и речи;
‒
идентификация дикторов.
Успехи ЦРТ в области голосовой биометрии были достигнуты
благодаря тщательной научной и технической проработке каждого из
указанных выше этапов.
Предварительная обработка речевого сигнала
.
На рис. 1 приве-
дена схема предварительной обработки речевого сигнала, используе-
мая в биометрических решениях ЦРТ. В любой системе обработки
речи необходимо, прежде всего, выделить из входного сигнала рече-
вые фрагменты, отбросив паузы и участки, содержащие различные
виды помех. В контексте данной задачи помехами, которые необхо-
димо детектировать и исключить из дальнейшего анализа, могут
быть щелчки, гудки, DTMF-сигналы, музыкальные фрагменты, ха-