Аннотация:В данной работе был представлен метод решения задачи расширения частотного диапазона аудио сигнала для случая низкочастотного сигнала.
К разрабатываемому методу предъявлялись требования обработки аудио данных без использования дополнительной информации о генерируемом диапазоне частот, сохранения гармонической структуры сигнала после расширения диапазона при достаточно широком генерируемом диапазоне и соответствие параметризации частотных характеристик моделям восприятия звукового сигнала.
Метод состоит из выполнения двух последовательных шагов
1. Генерация высокочастотного сигнала
2. Сглаживание амплитудной огибающей высокочастотного сигнала.
Генерация высокочастотного сигнала проводилась на основе метода нелинейного искажения входного низкочастотного сигнала. Функция нелинейной системы подбиралась исходя из критерия инвариантности к мощности входного сигнала.
Были разработаны способы представления амплитудных огибающих кратковременного спектра сигнала на основе:
* Векторов линейной узкополосной энергии (LSE)
* Векторов мел-кепстральных коэффициентов (MFCC).
Также был разработан метод генерации высокочастотных огибающих на основе модели взвешенных кластеров, являющейся частным случаем нейронных сетей.
Сглаживание амплитудных огибающих высокочастотного спектра проводилось на основе метода кросс-синтеза.