Цифровой звук. Реальный мир стр.161
Вокодер (vocoder) — сокращение от VOice enCODER — первоначально разрабатывался для передачи речевых сообщений по узкополосным НЧ-каналам (например, для засекречивания телефонных разговоров). “Магический секрет” вокодера заключался в использовании характерных особенностей человеческой речи, позволяющих отфильтровать сообщение (произнесенные слова), убрав из звука тембр голоса (характерные особенности звучания речи, формируемого голосовыми связками человека, произносившего фразу). Сегодня вокодеры используются в подключаемых модулях, в аппаратуре синтеза и обработки звука, например в популярных клавишных инструментах Korg MicroKorg и Alesis Ion/Micron.
Эта технология базируется на следующем принципе. Человеческая речь может быть представлена в виде двух основных компонентов: вибрации голосовых связок (по терминологии, используемой в технике кодирования речи, — несущей) и модулирующего эффекта человеческого рта, создающего гласные звуки типа “ооо” и “ааа”. Речь, которую мы слышим, получается в результате фильтрации вибраций голосовых связок ртом. В основу вокодера положен принцип разделения речи на два этих компонента и их последующего объединения путем модуляции несущей (сигнала, копирующего вибрации голосовых связок) сигналом, полученным путем формантного анализа речи.
Для использования вокодера необходимы два входных сигнала: один используется в качестве модулирующего (это эквивалент формант, формируемых ртом), а второй — в качестве несущей (он “переносит” в выходном сигнале информацию о модулирующем сигнале).
■ Модулирующий аудиосигнал (обозначаемый также терминами “analysis” и “formant”). Модулятор подает сигнал на вход набора полосовых фильтров, разделяющих сигнал на частотные компоненты. Затем копиры огибающей измеряют мгновенные амплитуды всех частотных составляющих, выдавая наборы синхронных управляющих сигналов, используемых для модуляции несущей (если вы используете речевой сигнал, то это сигнал речевого сообщения).
■ Аудиосигнал несущей (обозначаемый также термином “synthesis”). Несущая проходит через отдельный набор полосовых фильтров с соответствующими параметрами. Обычно в качестве несущей выбирают сигнал, богатый гармониками (например, пилообразный сигнал синтезатора). Управляющие сигналы, создаваемые копирами огибающей в модуляторе, поступают на регуляторы уровня выходных сигналов полосовых фильтров несущей, так называемые усилители, управляемые напряжением, — VCA (Voltage-Controlled Amplifier). Таким образом, уровень каждой составляющей в спектре несущей управляется уровнем определенной составляющей в спектре модулирующего сигнала.
В выходном сигнале вы услышите уже не модулирующий аудиосигнал, а сигнал несущей, промодулированный этим сигналом (на рис. 7.38 показана логическая схема реализации описанного способа обработки аудиосигнала). Поскольку для реализации технологии кодирования речи необходимы два входных аудиосигнала, в вокодере должен быть встроен синтезатор (создающий несущую) или предусмотрена возможность подключения внешнего синтезатора через боковую цепь (side-chain). (Так как в ряде базовых приложений не предусмотрена технология подключения через боковую цепь (side-chain), это может сделать реализацию эффекта вокодера трудновыполнимой задачей, поэтому внимательно ознакомьтесь с документацией к используемому базовому приложению и вокодеру.) Преимуществом использования в качестве несущей синтезатора является возможность изменения частоты несущей или, если синтезатор — источник несущей допускает это, даже “игра” на вокодере через MIDI-вход (на рис. 7.39 показан пример вокодера компании FL Studio).
Комментарии 0