К вопросу о векторизации графических спектрограмм
Авторы: Бонч-Бруевич А.М., Козлачков С.Б.
Опубликовано в выпуске: #11(23)/2013
DOI: 10.18698/2308-6033-2013-11-1015
Раздел: Информационные технологии
Для повышения точности оценки параметров математических моделей речевого сигнала предлагается использовать методы контурного анализа изображений применительно к графическим спектрограммам. Использование векторизации обеспечивает возможность выделения индивидуальных признаков речи на основе статистического анализа характеристик контуров на спектрограмме. Каждый из выделенных контуров является незамкнутой линией, содержащей информацию об изменении мгновенной частоты и амплитуды компонента речевого сигнала (речевого вокализма). При этом учитываются следующие особенности речевого сигнала: средняя скорость изменения частоты основного тона, минимальное расстояние между отдельными гармониками, взаимная корреляция уровня сигнала для соседних следов фонообъектов. В настоящей работе рассмотрен подход к формированию массива данных, описывающего графическую спектрограмму речевого сигнала в векторном формате. Показано, что представление графической спектрограммы как массива отдельных контуров дает новые возможности в области анализа, синтеза, обработки и классификации речевых сигналов.
Литература
[1] Голубинский А.Н., Булгаков О.М. Система аутентификации личности по голосу на основе модуляционных математических моделей речевого сигнала. Информация и безопасность, 2011, вып. 1, с. 141-144
[2] Дворянкин С.В. Цифровая шумоочистка аудиоинформации. Москва, ИП РадиоСофт, 2011, с. 102
[3] Фурман Я.А., ред. Введение в контурный анализ; приложения к обработке изображений и сигналов. Москва, ФИЗМАТЛИТ, 2003, 592 с.
[4] Горелик А.Л. Скрипкин В.А. Методы распознавания. Москва, Высшая школа, 1977, 222 с.