Аннотация:Многие задачи, связанные с обработкой и распознаванием речи, требуют такого её понимания, которое учитывает паралингвистические особенности. Примером такой задачи является распознавание эмоций. В отличие от задачи распознавания речи, в этой области сравнительно мало размеченных данных, что
ограничивает возможности обучения моделей. В данной работе демонстрируется способ расширения обучающей выборки, применимый для задачи распознавания эмоций. Из нескольких аудиозапией составляется новая, с измененными целевыми метками, которая является комбинацией исходных. Возможность изменения интенсивности такого ¾смешивания¿ позволяет значительно увеличить
обучающую выборку для снижения переобучения моделей. Особенно исследованный подход полезен в задачах с небольшими наборами данных, его эффективность демонстрируется на экспериментах.