Икм стерео что такое

Цифровые телефонные системы для чайников. Часть 1 — Кодирование голоса


Давным-давно, когда небо было голубым, а трава зеленой АТС были аналоговыми, работали они очень просто: нужно связать двух абонентов — нет проблем, взяли замкнули линию первого на линию второго, и все дела. Вариант, конечно, очень упрощенный, но в общих чертах так все и было. Примечательно в данном случае то, что между абонентами постоянно поддерживалась линия связи. Даже если они оба молчали, были заняты не только те линии, что ведут от абонентов к их АТС, но и линии между самими АТС.

Позднее, когда цифровые технологии стали развиваться все больше и больше, встал вопрос, а почему бы не использовать их для передачи телефонных разговоров? Внедрение цифровых АТС имело довольно много положительных моментов: аппаратура стала занимать меньше места, обслуживать цифровые АТС и проводить диагностику стало легче, значительно увеличилась гибкость настройки, масштабируемость, надежность. Но одни из главных новшеств — временное разделение каналов, а затем и пакетная передача данных. Преимуществом временного разделения каналов в том, что, грубо говоря, по одной линии между АТС в различные моменты времени (канальные интервалы) могут предаваться разговоры нескольких пар абонентов, таким образом, увеличивается количество соединении при неизменном количестве физических линий. При пакетной передаче для связи двух абонентов уже нет нужды в постоянном занятии линии между АТС, данные (разговор) передаются в пакетах и только тогда, когда они есть, в другое время канал можно использовать для передачи данных других абонентов. Также при использовании пакетной передачи облегчается возможность передачи и других данных по тем же сетям (например, интернет-трафика).

Читайте также:  Перемычки для акустики atlas

Что ж, попробую рассказать то, что знаю о цифровых системах максимально просто, описывая больше принцип работы, нежели какие-то технические подробности, так что, возможно, где-то будут неточности или несоответствия текущим стандартам. В любом случае, буду рад уточнениям, исправлениям и предложениям.

Итак, вопрос номер раз:

Как в цифровых системах передается разговор?

Тут на помощь пришла импульсно-кодовая модуляция (ИКМ, PCM, pulse-code modulation), известная, как утверждает Википедия, с начала XX века. Почитать о ней можно, например, все в той же Википедии.

Для того, чтобы преобразовать аналоговый сигнал в цифровой, необходимо последовательно выполнить над ним три операции: дискретизацию, квантование и кодирование.

Дискретизация — это получение мгновенных значений сигнала (отсчетов) через определенные промежутки времени (т.е. с определенной частотой — частотой дискретизации). На рисунке: (1) — сигнал, (2) — отсчеты.

Квантование — это «округление» полученных мгновенных значений до ближайших заранее заданных уровней. Например, если у нас есть 5 уровней с шагом 2: 0, 2, 4, 6, 8, а некоторые мгновенные значения равны 3.6, 7.1, 2, 0.5, 1.8, то они будут округлены до 4, 8, 2, 0, 2 соответственно.

Кодирование — это представление значений полученных уровней в виде какого-либо кода (например, двоичного).

Теперь рассмотрим, как вышеописанное происходит в цифровой телефонии.

Человеческая речь занимает полосу частот приблизительно 60-12000 Гц, однако для нормальной разборчивости достаточно полосы частот в 300-3400 Гц, т.е. верхняя граница составляет 3.4 кГц. Все, что выше 3.4 кГц «срезается» фильтром, для того чтобы избежать помех в будущем. Согласно теореме Котельникова, частота дискретизации для представления аналогового сигнала, ограниченного по спектру (помним о фильтре), в виде отсчетов должна превышать удвоенную верхнюю частоту сигнала. Для простоты расчетов, а также некоторого запаса, верхняя граница округляется до 4 кГц. Таким образом, частота дискретизации в нашем случае равна 8 кГц.

Квантование и кодирование практически всегда являются неотъемлемыми частями друг друга. Квантование в цифровой телефонии неравномерное, 256-уровневое. Неравномерность квантования выражается в том, что шаг квантования (расстояние между соседними уровнями в единицах измерения характеристики аналогового сигнала, которая квантуется; в данном случае — напряжение сигнала в вольтах) для малых амплитуд выбирается минимальным, для средних — бóльшим и для больших — самым большим. Это сделано для того, чтобы повысить точность передачи сигналов с низкой амплитудой. 256 уровней квантования можно «уместить» в одно 8-разрядное двоичное число, таким образом, один отсчет представляется в виде 8-разрядной кодовой комбинации. Все 256 уровней делятся на две группы: положительные и отрицательные. Для положительных сигналов первый бит в кодовой комбинации равен «1», для отрицательных — «0». Каждая группа делится на 8 сегментов. В пределах одного сегмента шаг квантования неизменный, в то время, как от сегмента к сегменту он меняется, увеличиваясь с возрастанием номера сегмента. Под номер сегмента отводятся следующие 3 бита. Последние 4 бита занимает номер уровня в сегменте, всего этих уровней 16. Итого имеем: 16 уровней × 8 сегментов × 2 группы = 256 уровней.

К примеру, число «10010101» представляет собой положительный сигнал (1), с уровнем 5 (0101) в 1-м сегменте (001).

Теперь можно посчитать скорость полученного цифрового сигнала:

B = 8000 отсчетов/сек × 8 бит/отсчет = 64000 бит/с = 64 кбит/с.

Данные сигналы являются простейшими сигналами в цифровой телефонии. Для их передачи используются основные цифровые каналы со скоростью 64 кбит/с. Также по данным каналам могут передаваться компандированные сигналы, которые имеют большее количество уровней квантования, но тем не менее, после компандирования все равно имеют 8 бит/отсчет.

Источник

Импульсно-кодовая модуляция — Pulse-code modulation

Импульсно-кодовая модуляция

Расширение имени файла
Типовой код «AIFF» для L16, нет
Магическое число Варьируется
Тип формата Несжатый звук
Содержится Аудио CD , AES3 , WAV , AIFF , AU , M2TS , VOB и многие другие

Импульсно-кодовая модуляция ( ИКМ ) — это метод, используемый для цифрового представления дискретизированных аналоговых сигналов . Это стандартная форма цифрового звука в компьютерах, компакт-дисках , цифровой телефонии и других приложениях цифрового звука. В PCM потока , то амплитуда аналогового сигнала дискретизации регулярно через равные промежутки времени, а каждый образец квантуется до ближайшего значения в пределах диапазона цифровых шагов.

Линейная импульсно-кодовая модуляция ( LPCM ) — это особый тип PCM, в котором уровни квантования линейно однородны. Это контрастирует с кодированием PCM, в котором уровни квантования меняются в зависимости от амплитуды (как с алгоритмом A-law или алгоритмом μ-law ). Хотя PCM — более общий термин, он часто используется для описания данных, закодированных как LPCM.

У потока PCM есть два основных свойства, которые определяют точность потока исходному аналоговому сигналу: частота дискретизации , то есть количество выборок в секунду; и битовая глубина , которая определяет количество возможных цифровых значений, которые могут использоваться для представления каждой выборки.

СОДЕРЖАНИЕ

История

Ранняя электрическая связь начала использовать образцы сигналов, чтобы мультиплексировать образцы из нескольких источников телеграфии и передавать их по одному телеграфному кабелю. Американский изобретатель Мозес Г. Фармер предложил мультиплексирование с временным разделением (TDM) телеграфа еще в 1853 году. Инженер-электрик В. М. Майнер в 1903 году использовал электромеханический коммутатор для мультиплексирования с временным разделением множества телеграфных сигналов; он также применил эту технологию в телефонии . Он получал разборчивую речь из каналов, дискретизированных с частотой выше 3500–4300 Гц; более низкие ставки оказались неудовлетворительными.

В 1920 году кабельная система передачи изображений Бартлейна использовала телеграфную сигнализацию символов, пробитых на бумажной ленте, для отправки образцов изображений, квантованных до 5 уровней. В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат, который передавал свой сигнал с использованием 5-битного ИКМ, кодированного оптико-механическим аналого-цифровым преобразователем . В производство машина не пошла.

Британский инженер Алек Ривз , не зная о предыдущей работе, задумал использовать PCM для голосовой связи в 1937 году, работая в компании International Telephone and Telegraph во Франции. Он описал теорию и ее преимущества, но практического применения не последовало. Ривз подал заявку на получение французского патента в 1938 году, а его патент в США был получен в 1943 году. К этому времени Ривз начал работать в Исследовательском центре телекоммуникаций .

Первая передача речи с помощью цифровых технологий, шифровальное оборудование SIGSALY , обеспечивала высокоуровневую связь союзников во время Второй мировой войны . В 1943 году исследователи Bell Labs , разработавшие систему SIGSALY, узнали об использовании двоичного кодирования PCM, как это уже было предложено Ривзом. В 1949 году для системы DATAR ВМС Канады компания Ferranti Canada построила работающую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния.

В PCM в конце 1940-х — начале 1950-х годов использовалась электронно-лучевая кодирующая трубка с пластинчатым электродом, имеющим кодирующие перфорации. Как и в осциллографе , луч качался по горизонтали с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, в результате чего луч проходил через верхние или нижние части перфорированной пластины. Пластина собирала или пропускала луч, создавая изменения тока в двоичном коде, по одному разряду за раз. Вместо естественного двоичного кода сетка более поздней трубки Гудолла была перфорирована для создания безошибочного кода Грея и генерировала все биты одновременно с использованием веерного луча вместо сканирующего луча.

В Соединенных Штатах Национальный зал славы изобретателей чествовал Бернарда М. Оливера и Клода Шеннона как изобретателей ИКМ, как описано в «Коммуникационной системе, использующей импульсно- кодовую модуляцию», патенте США 2801281, поданном в 1946 и 1952 годах, выданном в 1956 году. Другой патент с таким же названием был подан Джоном Р. Пирсом в 1945 году и выдан в 1948 году: патент США 2 437 707 . Трое из них опубликовали «Философию ПКМ» в 1948 году.

Система T-carrier , представленная в 1961 году, использует две линии передачи по витой паре для передачи 24 телефонных вызовов PCM с дискретизацией 8 кГц и 8-битным разрешением. Эта разработка улучшила пропускную способность и качество связи по сравнению с предыдущими схемами мультиплексирования с частотным разделением каналов .

Цифровые аудиозаписи

В 1967 году исследовательским центром NHK в Японии был разработан первый рекордер PCM . 12-битное устройство с частотой 30 кГц использовало компандер (аналогично DBX Noise Reduction ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне . В 1969 году NHK расширила возможности системы до 2-канального стерео и 13-битного разрешения 32 кГц. В январе 1971 года, используя систему записи PCM NHK, инженеры Denon записали первые коммерческие цифровые записи.

В 1972 году Denon представила первый 8-канальный цифровой рекордер DN-023R, в котором использовался 4-х головной видеомагнитофон с открытой катушкой для вещания для записи звука с частотой 47,25 кГц, 13-битным PCM. В 1977 году компания Denon разработала портативную записывающую систему PCM DN-034R. Как и DN-023R, он записывал 8 каналов с частотой 47,25 кГц, но использовал 14-битные «с акцентом , что эквивалентно 15.5 битам».

В 1979 году был записан первый цифровой поп-альбом Bop till You Drop . Он был записан с частотой 50 кГц, 16-битным линейным PCM с использованием цифрового магнитофона 3M.

Компакт — диск (CD) привел к потребительским PCM аудио приложений с его введением в 1982 году CD использует 44100 Гц с частотой дискретизации и разрешением 16 бит и хранит до 80 минут стерео аудио на диск.

Цифровая телефония

Быстрое развитие и широкое распространение цифровой телефонии с ИКМ стало возможным благодаря технологии схем с коммутируемыми конденсаторами (SC) металл-оксид-полупроводник (МОП) , разработанной в начале 1970-х годов. Это привело к разработке микросхем кодека-фильтра PCM в конце 1970-х годов. В кремниевом затворе КМОП (комплементарный МОП) PCM кодек-фильтр чип, разработанный David A. Hodges и WC Black в 1980 году, с тех пор промышленный стандарт для цифровой телефонии. К 1990-м годам телекоммуникационные сети, такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью фильтров-кодеков CMOS PCM с очень крупномасштабной интеграцией (VLSI), широко используемых в электронных коммутационных системах для телефонных станций , модемах на стороне пользователя. и широкий спектр приложений цифровой передачи, таких как цифровая сеть с интегрированными услугами (ISDN), беспроводные и сотовые телефоны .

Реализации

PCM — это метод кодирования, обычно используемый для несжатого цифрового звука.

  • 4ESS переключатель введено переключение с разделением по времени в телефонной системе США в 1976 г., на основе среднего масштаба технологии интегральных схем.
  • LPCM используется для кодирования аудиоданных без потерь в стандарте Red Book для компакт-дисков (неофициально также известном как Audio CD ), введенном в 1982 году.
  • AES3 (указанный в 1985 году, на котором основан S / PDIF ) — это особый формат, использующий LPCM.
  • На лазерных дисках с цифровым звуком есть дорожка LPCM на цифровом канале.
  • На ПК PCM и LPCM часто относятся к формату, используемому в WAV (определенном в 1991 г.) и форматах аудиоконтейнеров AIFF (определенном в 1988 г.). Данные LPCM также могут храниться в других форматах, таких как AU , необработанный аудиоформат (файл без заголовка) и различные форматы мультимедийных контейнеров .
  • LPCM был определен как часть стандартов DVD (с 1995 г.) и Blu-ray (с 2006 г.). Он также определен как часть различных форматов хранения цифрового видео и аудио (например, DV с 1995 г., AVCHD с 2006 г.).
  • LPCM используется HDMI (определенным в 2002 году), интерфейсом цифрового аудио / видео с одним кабелем для передачи несжатых цифровых данных.
  • Формат контейнера RF64 (определенный в 2007 г.) использует LPCM, а также позволяет хранить битовый поток без PCM: могут быть использованы различные форматы сжатия, содержащиеся в файле RF64 в виде пакетов данных (Dolby E, Dolby AC3, DTS, MPEG-1 / MPEG-2 Audio). «замаскированный» под линейный ПКМ.

Модуляция

На диаграмме синусоидальная волна (красная кривая) дискретизируется и квантуется для PCM. Синусоидальная волна дискретизируется через равные промежутки времени, показанные вертикальными линиями. Для каждой выборки выбирается одно из доступных значений (по оси Y). Процесс PCM обычно реализуется на одной интегральной схеме, называемой аналого-цифровым преобразователем (АЦП). Это дает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать как цифровые данные для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных , как правило, для передачи нескольких потоков по одному физическому каналу. Один из методов называется мультиплексированием с временным разделением (TDM) и широко используется, особенно в современной телефонной системе общего пользования.

Демодуляция

Электроника, участвующая в создании точного аналогового сигнала из дискретных данных, аналогична электронике, используемой для генерации цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они производят напряжение или ток (в зависимости от типа), которые представляют значение, представленное на их цифровых входах. Затем этот выходной сигнал обычно фильтруется и усиливается для использования.

Чтобы восстановить исходный сигнал из дискретизированных данных, демодулятор может применить процедуру модуляции в обратном направлении. После каждого периода выборки демодулятор считывает следующее значение и переводит выходной сигнал на новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов изображения. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через фильтр восстановления, который подавляет энергию за пределами ожидаемого частотного диапазона (выше частоты Найквиста ). ж s / 2 <\ displaystyle f_ / 2>

Стандартная точность и частота дискретизации

Обычная глубина выборки для LPCM составляет 8, 16, 20 или 24 бита на выборку .

LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и зависит от синхронизации нескольких потоков LPCM. Хотя два канала (стерео) являются наиболее распространенным форматом, системы могут поддерживать до 8 аудиоканалов (объемный звук 7.1) или более.

Общие частоты дискретизации составляют 48 кГц при использовании видео в формате DVD или 44,1 кГц при использовании компакт-дисков. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но их преимущества обсуждаются.

Ограничения

В Теорема Котельникова устройства показывает , PCM может работать без внесения искажений в пределах их разработанных полос частот , если они обеспечивают частоту дискретизации , по меньшей мере вдвое больше , чем самой высокой частоты , содержащейся во входном сигнале. Например, в телефонии используемый диапазон частот речи находится в диапазоне приблизительно от 300 Гц до 3400 Гц. Поэтому для эффективного восстановления речевого сигнала в телефонных приложениях обычно используется частота дискретизации 8000 Гц, что более чем в два раза превышает наивысшую используемую речевую частоту.

Тем не менее, в любой системе PCM есть потенциальные источники ухудшения качества:

  • Выбор дискретного значения, которое близко, но не точно к уровню аналогового сигнала для каждой выборки, приводит к ошибке квантования .
  • Между выборками измерение сигнала не производится; теорема дискретизации гарантирует однозначное представление и восстановление сигнала только в том случае, если он не имеет энергии на частоте f s / 2 или выше (половина частоты дискретизации, известная как частота Найквиста ); более высокие частоты не будут правильно представлены или восстановлены и добавят искажения сглаживания к сигналу ниже частоты Найквиста.
  • Поскольку выборки зависят от времени, для точного воспроизведения требуются точные часы. Если часы кодирования или декодирования нестабильны, эти недостатки напрямую повлияют на качество вывода устройства.

Обработка и кодирование

Некоторые формы PCM сочетают обработку сигналов с кодированием. В более старых версиях этих систем обработка в аналоговой области применялась как часть аналого-цифрового процесса; более новые реализации делают это в цифровой области. Эти простые методы в значительной степени устарели благодаря современным методам сжатия звука на основе преобразования , таким как кодирование с модифицированным дискретным косинусным преобразованием (MDCT).

  • Linear PCM (LPCM) — это PCM с линейным квантованием.
  • Дифференциальный PCM (DPCM) кодирует значения PCM как разницы между текущим и прогнозируемым значением. Алгоритм предсказывает следующую выборку на основе предыдущих выборок, а кодировщик сохраняет только разницу между этим предсказанием и фактическим значением. Если прогноз является разумным, для представления той же информации можно использовать меньшее количество битов. Для звука этот тип кодирования снижает количество битов, требуемых для каждого отсчета, примерно на 25% по сравнению с PCM.
  • Адаптивная дифференциальная импульсно-кодовая модуляция (ADPCM) — это вариант DPCM, который изменяет размер шага квантования, чтобы обеспечить дальнейшее сокращение требуемой полосы пропускания для данного отношения сигнал / шум .
  • Дельта-модуляция — это форма DPCM, которая использует один бит на выборку, чтобы указать, увеличивается или уменьшается сигнал по сравнению с предыдущей выборкой.

В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 отсчетов в секунду по 8 бит каждая, что дает цифровой сигнал со скоростью 64 кбит / с, известный как DS0 . Кодирование сжатия сигнала по умолчанию на DS0 — либо PCM по μ-закону (мю-закон) (Северная Америка и Япония), либо PCM по закону A (Европа и большая часть остального мира). Это системы логарифмического сжатия, в которых 12- или 13-битный номер линейной PCM-выборки отображается в 8-битное значение. Эта система описана международным стандартом G.711 .

Если стоимость каналов высока и потеря качества голоса допустима, иногда имеет смысл еще больше сжать голосовой сигнал. Алгоритм ADPCM используется для отображения серии 8-битных выборок PCM с µ-законом или A-законом в серию 4-битных отсчетов ADPCM. Таким образом, пропускная способность линии увеличивается вдвое. Этот метод подробно описан в стандарте G.726 .

Форматы аудиокодирования и аудиокодеки были разработаны для дальнейшего сжатия. Некоторые из этих методов стандартизированы и запатентованы. Расширенные методы сжатия, такие как MDCT и кодирование с линейным предсказанием (LPC), в настоящее время широко используются в мобильных телефонах , передаче голоса по IP (VoIP) и потоковой передаче мультимедиа .

Кодирование для последовательной передачи

PCM может быть с возвратом к нулю (RZ) или без возврата к нулю (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей одинаковых символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц .

Плотность единиц часто контролируется с помощью методов предварительного кодирования, таких как кодирование с ограничением длины прогона , когда код PCM расширяется до немного более длинного кода с гарантированным ограничением плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования , что гарантирует, по крайней мере, случайные переходы символов.

Другой метод, используемый для управления плотностью единиц, — это использование скремблера данных, который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным , но где данные могут быть точно восстановлены дополнительным дескремблером. В этом случае длинные серии нулей или единиц все еще возможны на выходе, но считаются достаточно маловероятными для обеспечения надежной синхронизации.

В других случаях важно долгосрочное значение постоянного тока модулированного сигнала, поскольку создание смещения постоянного тока будет иметь тенденцию перемещать цепи связи за пределы их рабочего диапазона. В этом случае принимаются специальные меры, чтобы вести подсчет кумулятивного смещения постоянного тока и при необходимости изменять коды, чтобы смещение постоянного тока всегда возвращалось к нулю.

Многие из этих кодов являются биполярными кодами , в которых импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде инверсии альтернативной метки ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для генерации специальных символов, используемых для кадрирования или других специальных целей.

Номенклатура

Слово « импульс» в термине « импульсно-кодовая модуляция» относится к импульсам, обнаруживаемым в линии передачи. Это, возможно, является естественным следствием того, что этот метод развился вместе с двумя аналоговыми методами, широтно-импульсной модуляцией и импульсной модуляцией положения , в которых информация, которая должна быть закодирована, представлена ​​дискретными импульсами сигнала различной ширины или положения, соответственно. В этом отношении ИКМ мало похож на эти другие формы кодирования сигналов, за исключением того, что все они могут использоваться при мультиплексировании с временным разделением, а номера кодов ИКМ представлены в виде электрических импульсов.

Источник

Оцените статью