Раздел: Документация
0 ... 13 14 15 16 17 18 19 ... 55 Обратное преобразование: f(x,y) = ] ] C(u) C(v) F(u, v) cos u7r cos + v7r u=Ov=o1616 позволяет восстановить исходные компоненты описания изображения (функцию f(x,y)) по значениям коэффициентов ДКП. В режиме внутрикадрового кодирования (intra) ДИКМ не используется, а каждый 8x8 блок кадра преобразуется в коэффициенты ДКП, которые далее подвергаются линейному квантованию (Q) и пересылаются в видеомультиплексор. Этот же кадр восстанавливается (преобразования Q"1 и Т"1) и сохраняется в кадровой памяти для использования при межкадровом кодировании. Заметим, что не каждый блок должен подвергаться ДКП; эта операция реализуется лишь для блоков, имеющих определенную степень отличия от предыдущего. Критерии разделения блоков на обрабатываемые/необрабатываемые и выбора режима INTRA/INTER не является предметом рекомендаций Н.261. Они могут изменяться динамически в соответствии со стратегией контроля процесса кодирования. В режиме межкадрового кодирования (INTER) реализуется схема метода ДИКМ. Предсказание (прогноз) содержания макроблока (МБ) текущего кадра основывается на оценке вектора перемещения. Эта оценка производится посредством сравнения МБ текущего кадра (только яркостных компонент) с макроблоками ближайшего окружения соответствующего МБ предыдущего кадра. Обе компоненты (вертикальная и горизонтальная) вектора перемещения представляются целыми числами из диапазона ±15. Этот вектор используется для всех четырех яркостных блоков, принадлежащих текущему МБ. Вектор перемещения для цве-торазностных компонент МБ формируется делением пополам (с усечением) соответствующих компонент вектора перемещения яркостных блоков. В кодере предусматривается механизм ограничения вектора перемещения так, чтобы все элементы предсказанного изображения находились в пределах поля кадра. Используя оценку вектора перемещения, вычисляется предсказание макроблока текущего кадра и посредством сравнения его с оригиналом оценивается степень приемлемости предсказания. Если она достаточно высока, то в канал передается только значение вектора перемещения. Если же качество предсказания признается неудовлетворительным, то кроме вектора перемещения формируется сигнал ошибки вектора предсказания, который после процедур ДКП и квантования поступает на видеомультиплексор. Петлевой фильтр, входящий в структуру кодека, позволяет несколько повысить качество изображения посредством фильтрации высокочастотных шумовых компонент. Квантование коэффициентов ДКП является важнейшим этапом в процессе сокращения объема информации, подлежащей передаче. Следует отметить отличия в «спектрах» сигналов, представляющих блоки в режимах «INTRA» и «INTER». Первые имеют больше отличных от нуля компонент в низкочастотной области. Ошибки квантования этих составляющих сигнала оказывают существенно большее негативное влияние на восстанавливаемое изображение, чем ошибки той же величины при квантовании высокочас-ютных компонент. Это обстоятельство приводит к необходимости использования квантователей двух типов, отличающихся своими характеристиками в области малых входных сигналов. Квантователь для НЧ-компонент (рис. 3.4.6) имеет существенно меньшую зону «нечувствительности» вблизи нуля, в сравнении с квантователем для ВЧ-компонент (рис. 3.4.а). 5 -- -4 -2 а) Выход — -3 5 2 4 вход 5 3 -- Выход 6) Рис. 3.4. Характеристи квантователей Еще одной особенностью квантователя является необходимость регулирования шага квантования. Такое регулирование необходимо для более качественной передачи блоков, связанных с перемещающимися объектами изображения, и для регулирования скорости выходного битового потока. В соответствии с рекомендациями Н.261 кодер должен содержать линейку из 32 квантователей. Один из них обеспечивает квантование коэффициента F(0,0) в режиме «INTRA» (наиболее значимая ком- понента в спектре ДКП), а остальные могут использоваться для кодирования любых других коэффициентов. Квантование всех коэффициентов производится по линейному закону. Шаг квантования для коэффициента F(0,0) устанавливается равным 8, а для всех остальных коэффициентов он может изменяться в диапазоне от 2 до 62 (более мелкий шаг не позволит перекрыть весь динамический диапазон величин коэффициентов ДКП). Результатом процедуры квантования является матрица: F = IntegerRound F(u,v) Q(u,v) где Q(u,v) - элемент матрицы квантования, являющийся величиной шага квантования соответствующего коэффициента. Дальнейшее сокращение интенсивности битового потока достигается использованием в видеомультиплексоре, находящемся сразу за кодером источника, кодирования с переменной длиной слова. Эффективность этого алгоритма основывается на том, что разные уровни на выходе квантователя появляются с разной частотой, что и позволяет, представляя их кодовыми словами разной длины, сократить общий битовый поток. Процедура кодирования в мультиплексоре содержит три этапа: зигзаг-сканирование матрицы Fq, групповое кодирование и кодирование с переменной длиной слова по Хаффману. Зигзаг-сканирование матрицы Fq (u,v) (рис. 3.5) преобразует матрицу в одномерный массив. Такая траектория сканирования обеспечивает расположение в начальных элементах одномерного массива низкочастотных (наиболее значимых) компонент массива коэффициентов ДКП. Групповое кодирование преобразует одномерный массив в массив пар символов {символ!, символ2}, где символ! означает количество нулевых коэффициентов, предшествующих очередному ненулевому; символ2 - величину очередного ненулевого коэффициента ДКП. Массив полученных таким образом пар значений сжимается по Хаффману с одной из возможных пяти фиксированных таблиц.
Рис. 3.5. Схема зигзаг-сканирования матрицы коэффициентов ДКП Сигнал с выхода видеомультиплексора направляется в буфер передатчика, откуда с постоянной скоростью считывается в канал связи. Переполнение буфера предотвращается обратной связью с квантователем, регулирующей величину шага квантования. 3.3.3. Структура видеопотока Одним из важнейших аспектов всякого стандарта видеокодирования является однозначное определение структуры видеопотока, без чего была бы невозможной работа декодера приемника. Упрощенная иерархическая структура видеоданных, определеннаярекомендациями Н.261, представлена на рис. 3.6. Каждый кадр содержит заголовок и следующие за ним данные групп блоков. Заголовок кадра включает в себя 20-битный старт- Поле фиксированной [ длины Поле I , еменной длины
МАКРОБЛОК БЛОК РиСо 3.6. Упрощенная структура мультиплексирования видеоданных код, информацию о формате кадра (OF, QCIF), временные метки (номер кадра) и ряд других сведений. Заголовки пропущенных кадров не передаются. Данные групп блоков состоят из заголовка каждой группы блоков (12 для CIF и 3 для QCIF) и данных макроблоков. Заголовок группы блоков передается даже в том случае, когда ни один из передавав - мых макроблоков в данную группу не входит. Заголовок группы блоков содержит 16-битный старт-код, номер группы и номер квантователя, который будет считаться используемым для всех макроблоков этой группы до тех пор, пока информация о квантователе, содержащаяся в заголовке макроблока, не переопределит его. Уровень макроблока содержит заголовок и данные. Заголовок макроблока включает кодовое слово переменной длины, которое определяет позицию макроблока внутри группы блоков, а также набор данных, характеризующих тип макроблока, а именно: является макроблок внутрикадровым или межкадровым, передается с вектором перемещения или нет, использовался ли петлевой фильтр или нет. Заголовок содержит также информацию, позволяющую вычислить номера блоков, для которых в разделе данных передаются значения коэффициентов ДКП. Уровень блока содержит коэффициенты ДКП и завершающий указатель окончания блока (ЕОВ). 3.3.4.Передатчик Синхронизация передатчика осуществляется от внешнего источника, например, от интерфейса 1.420. Видеоданные направляются в канал передачи каждый цикл кадрами по 511 бит. Из них 493 бита заполняется данными, поступающими от видеомультиплексора, а 18 бит отводятся для кода коррекции ошибок. Терминал, проводящий декодирование, выделяет контрольные биты и либо не производит никаких действий, либо запускает алгоритм, способный исправить в кадре любую ошибку до 6 бит, или 2 единичные ошибки. Использование механизма коррекции ошибок декодером является факультативной функцией. 3.3.5.Использование усовершенствованных алгоритмов обработки видеоинформации в Н.320-системах Рекомендации Н.320, принятые в 1990 году, непрерывно совершенствуются, учитывая достижения в технике и алгоритмах кодирования. Последний пересмотр, состоявшийся в 1997 году, расширил, в частности, набор возможных видеокодеков. Так, наряду с Н.261-кодеком, рекомендации Н.320 определили возможность использования кодеков стандартов Н.262 и Н.263. В числе достоинств Н.262-кодека можно отметить его способность обрабатывать поток кадров с чересстрочным чередованием и возможность непосредственного кодирования изображения в форматах 625/50 и 525/60. Кодер стандарта Н.263 дает повышенную, в сравнении с Н.261, эффективность кодирования и располагает расширенным набором форматов изображения. Применение рекомендаций Н.262. Рекомендации Н.262 [39] определяют набор алгоритмов сжатия видеопоследовательностей, посредством которых могут быть удовлетворены требования весьма широкого круга приложений. Систематизация этих возможностей достигается введением концепции профилей и уровней. Профиль представляет собой определенную подсистему в структуре выходного битового поюка, а уровень определяется набором ограничений, налагаемых на параметры битового потока. Наиболее подходящим для Н.320-систем видеоконференцсвязи является простой профиль основного уровня (Simple Profile at Main Level - SPML). Простой профиль запрещает использование так называемых В-кадров (bidirectionally predicted) в процедуре кодирования видеопотока, поскольку это ведет к заметному увеличению времени обработки видеопотока В свою очередь, основной уровень простого профиля (он был лишь и определен для этого профиля) определяет, что максимальное число пикселов в строке изображения равно 7Q0, максимальное число строк в кадре - 576 и максимальная скорость видеопос-ледовательности - 30 кадр/с. В некоторых случаях, когда можно мириться с относительно большой задержкой видеопотока, рекомендации Н.320 допускают использование основного профиля основного уровня (Main Profile Main Level - MPML). Все остальные уровни и профили, допускаемые Н.262-системах, использовать в Н.320-системах запрещается. Профили SPML и MPML располагают способностью поддерживать большое число форматов изображения Из соображений совместимости Н.320-систем число допустимых форматов ограничено следующими: CIF: 325х288х(25 кадр/с) 352х240х(29,97 кадр/с) 352х288х(29,97 кадр/с) 2CIF: 352х576х(25 кадр/с) 352х480х(29,97 кадр/с) 4CIF: 704х576х(25 кадр/с) 704х480х(29,97 кадр/с). Если для Н.261-кодека использование механизма коррекции ошибок является необязательной функцией, то применение Н.262-кодека в Н.320-системе требует обязательной реализации процедуры коррекции ошибок как в кодере, так и в декодере. Применение рекомендаций Н.263. Рекомендации Н.263 [40, 59] предлагают несколько новых возможностей, обеспечивающих более высокую производительность кодека. В своем базисном ре- 0 ... 13 14 15 16 17 18 19 ... 55
|