Рис. 3. Этапы формирования вектора
признаков
линейного предсказания поведения
автокорреляционной функции кеп-
стра голосового сигнала. Постро-
ению кепстра предшествует филь-
трация голосового сигнала в диа-
пазоне высоты звука.
Формирование вектора голосо-
вых признаков осуществляется по
следующему алгоритму (рис. 3).
1. При необходимости исход-
ный голосовой сигнал ограничива-
ется по длительности (20 с) и при-
водится к частоте дискретизации
f
D
= 8 000
Гц.
2. Проводится быстрое пре-
образование Фурье исходного сиг-
нала, и вычисляются квадра-
ты спектральных коэффициентов
s
2
(
ω
)
.
3. Ч а с т о т н ы й д и а п а -
з о н
[0; 0
,
5
f
D
]
разбивается на
14 критических полос восприятия
звука, которые соответствуют рав-
номерному разбиению диапазона
высоты звука (
z
, барк), получаемой
из частотной шкалы (
ω
, Гц) по фор-
муле
z
= 6 log
ω
600
+
r
ω
600
2
+ 1
!
.
Затем определяются спектральные энергетические траектории
ln
s
2
(
z
)
во все критических полосах.
4. Выполняется фильтрация траекторий
ln
s
2
(
z
)
с целью отсечь
спектральные компоненты, скорость изменения которых отлична от
скорости изменения соответствующих компонентов речи, и растяже-
ния амплитуд спектральных коэффициентов, содержащих наиболее
выраженные голосовые признаки. Разработанный в процессе иссле-
дований фильтр имеет дискретную передаточную функцию вида
Φ (
z
) = 0
,
1
z
4
1 +
z
1
3
z
3
2
z
4
1
0
,
9
z
1
.
5. Энергетический спектр
ln
s
2
(
z
)
“склеивается” из 14 критических
полос и возвращается в линейный частотный масштаб
ln
s
2
(
ω
)
.
172
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
1,2,3,4 6,7,8,9,10,11,12