Системы безопасности

8(495)909-90-01

8(964)644-46-00

pro@sio.su

Главная

Раздел: Документация

0 ... 11 12 13 14 15 16 17 ... 122

На качество восприятия видео также влияет то особое внимание, которое зритель оказывает различным частям и точкам изображения по сравнению с общим взглядом на экран. Это так называемый эффект новизны (наше мнение о визуальном ряде сильно зависит от того, наблюдаем ли мы уже виденные сцены или совершенно новые) [2, 3]. Все эти факторы делают чрезвычайно сложным аккуратное количественное измерение визуального качества.

2.6.1.2. ITU-R 500

Несколько тестовых процедур субъективного оценивания качества объединено в рекомендацию ITU-R ВТ.500-11 [4]. Наиболее часто используемой процедурой из этого стандарта является метод непрерывной шкалы качества двойного раздражения DSCQS (Double Stimulus Continuous Quality Scale), в котором эксперту демонстрируются пары изображений коротких видеопоследовательностей А и В, одна за другой, и ему предлагается дать фрагментам А и В «оценку качества», сделав отметку на полосе с пятью областями с надписями от «Отлично» до «Плохо». В типичной серии тестов эксперту показывают пары последовательностей и просят оценить каждую пару. В каждой паре последовательностей одна является нетронутой «эталонной» видеопоследовательностью, другая та же последовательность, но преобразованная тестируемой видеосистемой. На рис. 2.14 изображена схема эксперимента для проверки видеокодека, в которой исходная последовательность сравнивается с; такой же последовательностью после ее; кодирования и декодирования. Выбор последовательности А или В делается случайным образом.

Порядок двух последовательностей, исходной и «испорченной», во время серии тестов совершенно случаен, и зритель-эксперт не знает, где исходное видео, а где преобразованное изучаемой системой. Это позволяет предотвратить предвзятое суждение о преобразованном изображении по сравнению с исходным. В конце серии тестов выставленные отметки приводятся к нормализованному виду и конечный результат служит оценкой (чем-то вроде «средней оценкой впечатления»), которая указывает на относительное качество преобразованной и оригинальной последовательностей.

Тесты вроде DSCQS принято считать достаточно реалистическими субъективными мерами визуального качества. Однако эти тесты весьма уязвимы при практическом применении. Их результаты сильно отличаются у разных экспертов и в зависимости от

видеопоследовательностей, используемых в этих тестах. Эти различия компенсируются многими повторами и многократной сменой зрителей-экспертов. Отметим, что искушенный зритель (т.е. тот, кто знаком с природой видеоискажений или артефактов, вносимых видеосжатием) может дать пристрастную оценку. Поэтому часто используют неискушенных зрителей-экспертов. Все это означает необходимость привлечения многочисленной группы экспертов, поскольку в результате серии тестов изначально неискушенные зрители быстро научаются распознавать характерные артефакты в видеопоследовательностях (становятся «искушенными»). Все это сильно усложняет тестирование DSCQS, делает его достаточно дорогим и долгим.

2.6.2. Объективное измерение качества

Сложность и дороговизна субъективных методов оценивания качества делают привлекательным автоматическое измерение качества с помощью определенных алгоритмов. Многие разработчики систем видеосжатия и видеообработки часто опираются на так называемые объективные (алгоритмические) меры качества. Наиболее популярной мерой служит пиковое соотношение сигнал/шум PSNR (Peak Signal to Noise Ratio), однако ограниченность этого метода привела к многочисленным попыткам разработать более изощренные меры, которые лучше походят на суждения «живых» зрителей.

2.6.2.1. PSNR

Пиковое соотношение сигнал/шум PSNR (Peak Signal to Noise Ratio) (см. уравнение (2.7)) измеряется с помощью логарифмической шкалы и вычисляется по среднеквадратичному отклонению MSE (mean squared error) исходного изображения от преобразованного видеокадра относительно числа (2" — I)2 (квадрата наибольшего возможного значения пиксела, где п число бит на сэмпл кадра):

Величину PSNR можно легко и быстро вычислить, поэтому оно так популярно при оценивании качества изображения. Его постоянно используют при сравнивании сжатых и несжатых видеопоследовательностей. На рис. 2.15 показаны крупные планы трех изображений: первое изображение (а) является исходным (несжатым), а изображения (б) и (в) являются «подпорченными» (размытыми) вариантами исходного. Изображение (б) имеет PSNR, равное 30.6 дБ,

rSNRju = 101og10

(2" - l)2 MSE

(2.7)

Глава 2. Форматы eudeo и eto качество a PSNR для изображения (в) равно 28,3 дБ (отражающее гнижение

Рис. 2.15. Примеры PSNR: (а) оригинал, (б) 30.6 дБ, (в) 28.3 дБ.

Рис. 2.16. Изображение г размытым < н (PSNR = 27.7 дБ).

Мера PSNR имеет целый ряд недостатков. Для вычисления величины PSNR необходимо иметь и исходную, и преобразованную последовательность, однако первая бывает не всегда доступна. Кроме, того, не всегда легко проверить, что исходное видео само имело совершенное качество. Величина PSNR плохо коррелирует с субъективными мерами качества, например с ITU-R 500. Для некоторого изображения или последовательности изображений большое PSNR обычно указывает на высокое, а мллое PSNR на низкое качество преобразованных изображений по сравнению <• исходными. Однако конкретные величины PSNR необязательно гарантируют «абсолютно» субъективное качество. Например, на рис. 2.17 дано искаженное изображение рис. 2.15 (а), на котором был размыт лишь задний фон с облаками. Это изображение имеет PSNR. равное 27.7 дБ по отношению к исходному. Большинство зрителей скажут, что это изображение гораздо лучше изображения на рис. 2.15 (в), так как лицо девочки очень четкое. Это противоречит оценке каче-

0 ... 11 12 13 14 15 16 17 ... 122