Стр. 7 - Г.П. Можаров, Р.С. Чеботарев - Текстонезависимый метод идентификации человека по его голосу

Упрощенная HTML-версия

компонентная GMM. Основная идея аппарата GMM состоит в пред-

ставлении плотности распределения вектора голосовых признаков

в виде взвешенной суммы гауссовых плотностей распределения:

(

) =

(

X, μ

, D

)

где

(

X, μ, D

)

— гауссова плотность распределения с математи-

ческим ожиданием

и ковариационной матрицей

, имеющей вид

(

X, μ, D

) =

√

det

exp(

−

)

−

(

−

))

Фактически представление плотности

(

)

в виде суммы

гаус-

сианов соответствует разбиению множества голосовых параметров

на

подклассов (как уже было отмечено, в предложенном методе

= 1024

Также примечательно, что для GMM не важен порядок следования

друг за другом определенных голосовых сигналов, поскольку данный

аппарат работает с накопленными статистиками параметров.

Задача верификации пользователя по голосу представляет собой

бинарную классификацию. Формально задача представляет собой про-

верку двух гипотез:

— фразу

произнес человек

;

— фразу

произнес НЕ человек

Оптимальной проверкой для выбора одной из двух гипотез являет-

ся отношение правдоподобия. При этом процедура принятия решения

выглядит следующим образом:

(

)

(

)

(

≥

→

принимаем

;

< θ

→

принимаем

где

(

)

— функция плотности вероятности для гипотезы

, оце-

ненная на речевом сегменте

, а

— порог принятия решения. Ма-

тематически гипотеза

может быть определена моделью

, которая

характеризует диктора

в пространстве признаков.

Для каждого человека на основании записей его речи строится

голосовая модель. Для гипотезы

строится универсальная фоновая

модель, характеризующая всех возможных говорящих людей во всех

возможных контекстах. Данная модель обучается на большом числе

голосовых данных, сбалансированных по гендерному типу, а также по

оборудованию и условиям регистрации голосового сигнала.

Таким образом, GMM должны быть независимо обучены для ка-

ждого человека, т.е. для каждого человека должен быть найден набор

параметров

{

, μ

, D

}

, i

= 1

. . . M

(рис. 4). Исходными данными

174

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012

Стр. 8

Стр. 6

1,2,3,4,5,6 8,9,10,11,12