ПРИМЕНЕНИЕ ЧАСТОТНОГО МАСКИРОВАНИЯ ПРИ MFCC-ПАРАМЕТРИЗАЦИИ РЕЧИ НА ФОНЕ ШУМОВ
Цель: при параметризации речевых сигналов широко применяются мел-частотные кепстральные коэффициенты (MFCC), однако эффективность их использования резко падает при появлении в сигнале шумовой составляющей. Ставится задача модификации традиционного алгоритма вычисления MFCC-коэффициентов, осуществляемой путем введения дополнительных преобразований сигнала, учитывающих механизмы речеобразования и речевосприятия.
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
ОБРАБОТКА ИНФОРМАЦИИ И УПРАВЛЕНИЕ
УДК 004.934.2
doi:10.15217/issn1684-8853.2016.3.8
ПРИМЕНЕНИЕ ЧАСТОТНОГО МАСКИРОВАНИЯ
ПРИ MFCC-ПАРАМЕТРИЗАЦИИ РЕЧИ НА ФОНЕ ШУМОВ <...> К. К. Томчука, 1, старший преподаватель
аСанкт-Петербургский государственный университет аэрокосмического приборостроения,
Санкт-Петербург, РФ
Цель: при параметризации речевых сигналов широко применяются мел-частотные кепстральные коэффициенты
(MFCC), однако эффективность их использования резко падает при появлении в сигнале шумовой составляющей. <...> Ставится
задача модификации традиционного алгоритма вычисления MFCC-коэффициентов, осуществляемой путем введения
дополнительных преобразований сигнала, учитывающих механизмы речеобразования и речевосприятия. <...> Результаты:
предложено использовать психоакустическую модель, позволяющую учитывать в расчете MFCC-коэффициентов эффект
частотного маскирования при восприятии звуков человеком. <...> Модифицированный алгоритм исследован на базе системы распознавания
одиночных слов, адаптированной под параметризацию речевого сигнала только MFCC-коэффициентами. <...> Ключевые слова — параметризация речевого сигнала, MFCC-коэффициенты, психоакустическая модель, речевая
Введение
Одним из распространенных способов параметризации
речевого сигнала (РС) является использование
вектора мел-частотных кепстральных коэффициентов
(MFCC-коэффициентов). <...> Процесс вычисления
данных коэффициентов учитывает ряд
особенностей слухового анализатора человека, что
позволяет получать хорошие результаты при их
применении в речевых приложениях. <...> Для вычисления оценки спектральной
плотности мощности в традиционном алгоритме
используется преобразование Фурье со взвешиванием
окном Хэмминга. <...> .
Наконец, в ряде работ рассмотрена возможность
внедрения механизма слуховой маскировки,
которая в явном виде в традиционном MFCCалгоритме
отсутствует. <...> Эффект слуховой маскировки
проявляется в изменении чувствительности
слуха на частотах и в моментах <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: