Языки

Многоканальная очистка речевого сигнала

Актуальность проблемы

На данный момент задача очистки речи от помех в акустическом и виброакустических каналах является актуальной задачей с одной стороны, для выделения интересующих речевых сигналов, а с другой – оценки качества аппаратуры зашумления каналов c целью защиты от несанкционированного получения информации.
Обзор методов повышения качества и разборчивости зашумленных речевых сигналов показывает, что существует много различных подходов к обработке зашумленной речи. Такое разнообразие методов обусловлено как важностью проблемы, так и отсутствием достаточно надежных методов ее решения. Сравнение методов очистки и выбор приемлемых полностью определяется спецификой решаемой задачи. При выборе в качестве главного критерия разборчивости речи и целенаправленном её повышении вероятно появление артефактов в тембре голоса и возникновении искажений (структурированный шум). Выбор в качестве критерия естественности голоса диктора и целенаправленное повышение субъективного качества речевого сигнала как правило приводит к ухудшению его разборчивости.


Полученные результаты

На кафедре БИТ ТРТУ разработана система шумоочистки речи, позволяющая разделять смесь речевых сигналов от разных дикторов выделяя в отдельные каналы речевые сигналы от каждого диктора. Необходимым условием работы системы является применение многоканального съема, причем, число микрофонов (сенсоров) должно быть не меньше числа источников сигнала.
Система выполнена на основе быстро-развивающегося так называемого «слепого» метода разделения сигнала (blind signal separation), названного так в связи с недоступностью априорной информации о канале передачи и формировании микшированного представления на этапе разделения. Входными сигналами могут быть как речевые сигналы, так и шумы, что соответствует задаче многоканального разделения. При этом происходит разложение исходного смешанного сигнала на компоненты.
Разработан также определитель наличия речевого сигнала в смеси речь - белый шум при отношении сигнал/шум не меньше 1 с достоверностью 0,8.
Для повышения гибкости и функциональных возможностей системы введется работа по дальнейшему развитию системы.