Рис. 2. Функциональная схема системы голосовой идентификации/верифи-
кации личности
UBM), которая описывает некоторые усредненные голосовые харак-
теристики всех людей, находящиеся в базе. В рабочем режиме на
основании этой модели проводится вычисление степени уникально-
сти голосового сигнала, которая позволяет судить о достоверности
идентификации/верификации и является частью аппарата принятия
конечного решения.
Наибольший интерес для исследований представляют языко- и
текстонезависимые методы идентификации личности. Метод является
языконезависимым, если он инвариантен к языку, на котором произно-
сится речь для целей идентификации. Аналогично, метод называется
текстонезависимым, если в процессе своей работы он не получает ин-
формации о том, какую именно фразу (или слово) будет произносить
человек.
В настоящее время наиболее результативным подходом к решению
задач языко- и текстонезависимой идентификации личности является
построение голосовых моделей на основе моделей гауссовых смесей
(Gaussian Mixture Model, GMM) [2, 3]. Сами модели, как уже было от-
мечено, строятся на основе некоторого набора голосовых признаков,
формирование которых собственно и представляет основную слож-
ность. Наиболее распространенным методом построения голосовых
признаков является формирование вектора мел-частотных кепстраль-
ных коэффициентов (Mel-Frequency Cepstral Coefficient, MFCC) из го-
лосовой записи [1, 2].
Однако, несмотря на достаточно хорошие результаты работы в ла-
бораторных условиях, методика GMM-MFCC не может быть исполь-
170
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
1,2 4,5,6,7,8,9,10,11,12