Стр. 3 - Ю.Н. Матвеев - Технологии биометрической идентификации личности по голосу и другим модальностям

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012

48

Для совместного использования биометрических характеристик

одной из различных модальностей были исследованы и разработаны

методы мультиалгоритмического и мультимодального смешивания

(

построения обобщенного решения по нескольким признакам одной

или нескольких модальностей).

Особенности биометрической идентификации личности по

голосу.

Уникальность голоса человека обусловлена множеством фи-

зиологических особенностей (строением голосовых связок, трахеи,

носовых полостей, манерой произношения звуков, расположением

зубов). Комбинация этих особенностей индивидуальна, как и отпе-

чатки пальцев. Однако на практике ни одна из унимодальных систем

биометрической идентификации, в том числе и голосовая, не может

гарантировать 100 %-ной идентификации личности.

Основными источниками ошибок при идентификации дикторов

являются эффекты:

‒

среды записи (уровень и тип шума, уровень реверберации);

‒

представления (длительность речи, психофизиологическое со-

стояние говорящего (болезнь, эмоциональное состояние и т. п.), язык

речевого сообщения, изменение голосового усилия);

‒

канала (помехи (импульсные, тональные и т. п.), искажения

(

амплитудно-частотные характеристики микрофона и канала переда-

чи, вид кодирования в канале и т. д.)).

Для снижения влияния перечисленных источников ошибок при

проектировании системы голосовой биометрии в ЦРТ были созданы

робастные автоматические методы и алгоритмы, реализующие ос-

новные этапы обработки речевого сигнала в такой системе:

‒

предварительная обработка речевого сигнала (выделение на ре-

чевом сигнале участков, содержащих речь дикторов, оценка качества

речевого материала);

‒

автоматическая сегментация дикторов в фонограмме;

‒

автоматическое выделение биометрических характеристик го-

лоса и речи;

‒

идентификация дикторов.

Успехи ЦРТ в области голосовой биометрии были достигнуты

благодаря тщательной научной и технической проработке каждого из

указанных выше этапов.

Предварительная обработка речевого сигнала

.

На рис. 1 приве-

дена схема предварительной обработки речевого сигнала, используе-

мая в биометрических решениях ЦРТ. В любой системе обработки

речи необходимо, прежде всего, выделить из входного сигнала рече-

вые фрагменты, отбросив паузы и участки, содержащие различные

виды помех. В контексте данной задачи помехами, которые необхо-

димо детектировать и исключить из дальнейшего анализа, могут

быть щелчки, гудки, DTMF-сигналы, музыкальные фрагменты, ха-