Раздел: Документация
0 ... 11 12 13 14 15 16 17 ... 122 На качество восприятия видео также влияет то особое внимание, которое зритель оказывает различным частям и точкам изображения по сравнению с общим взглядом на экран. Это так называемый эффект новизны (наше мнение о визуальном ряде сильно зависит от того, наблюдаем ли мы уже виденные сцены или совершенно новые) [2, 3]. Все эти факторы делают чрезвычайно сложным аккуратное количественное измерение визуального качества. 2.6.1.2. ITU-R 500 Несколько тестовых процедур субъективного оценивания качества объединено в рекомендацию ITU-R ВТ.500-11 [4]. Наиболее часто используемой процедурой из этого стандарта является метод непрерывной шкалы качества двойного раздражения DSCQS (Double Stimulus Continuous Quality Scale), в котором эксперту демонстрируются пары изображений коротких видеопоследовательностей А и В, одна за другой, и ему предлагается дать фрагментам А и В «оценку качества», сделав отметку на полосе с пятью областями с надписями от «Отлично» до «Плохо». В типичной серии тестов эксперту показывают пары последовательностей и просят оценить каждую пару. В каждой паре последовательностей одна является нетронутой «эталонной» видеопоследовательностью, другая та же последовательность, но преобразованная тестируемой видеосистемой. На рис. 2.14 изображена схема эксперимента для проверки видеокодека, в которой исходная последовательность сравнивается с; такой же последовательностью после ее; кодирования и декодирования. Выбор последовательности А или В делается случайным образом. Порядок двух последовательностей, исходной и «испорченной», во время серии тестов совершенно случаен, и зритель-эксперт не знает, где исходное видео, а где преобразованное изучаемой системой. Это позволяет предотвратить предвзятое суждение о преобразованном изображении по сравнению с исходным. В конце серии тестов выставленные отметки приводятся к нормализованному виду и конечный результат служит оценкой (чем-то вроде «средней оценкой впечатления»), которая указывает на относительное качество преобразованной и оригинальной последовательностей. Тесты вроде DSCQS принято считать достаточно реалистическими субъективными мерами визуального качества. Однако эти тесты весьма уязвимы при практическом применении. Их результаты сильно отличаются у разных экспертов и в зависимости от видеопоследовательностей, используемых в этих тестах. Эти различия компенсируются многими повторами и многократной сменой зрителей-экспертов. Отметим, что искушенный зритель (т.е. тот, кто знаком с природой видеоискажений или артефактов, вносимых видеосжатием) может дать пристрастную оценку. Поэтому часто используют неискушенных зрителей-экспертов. Все это означает необходимость привлечения многочисленной группы экспертов, поскольку в результате серии тестов изначально неискушенные зрители быстро научаются распознавать характерные артефакты в видеопоследовательностях (становятся «искушенными»). Все это сильно усложняет тестирование DSCQS, делает его достаточно дорогим и долгим. 2.6.2. Объективное измерение качества Сложность и дороговизна субъективных методов оценивания качества делают привлекательным автоматическое измерение качества с помощью определенных алгоритмов. Многие разработчики систем видеосжатия и видеообработки часто опираются на так называемые объективные (алгоритмические) меры качества. Наиболее популярной мерой служит пиковое соотношение сигнал/шум PSNR (Peak Signal to Noise Ratio), однако ограниченность этого метода привела к многочисленным попыткам разработать более изощренные меры, которые лучше походят на суждения «живых» зрителей. 2.6.2.1. PSNR Пиковое соотношение сигнал/шум PSNR (Peak Signal to Noise Ratio) (см. уравнение (2.7)) измеряется с помощью логарифмической шкалы и вычисляется по среднеквадратичному отклонению MSE (mean squared error) исходного изображения от преобразованного видеокадра относительно числа (2" — I)2 (квадрата наибольшего возможного значения пиксела, где п число бит на сэмпл кадра): Величину PSNR можно легко и быстро вычислить, поэтому оно так популярно при оценивании качества изображения. Его постоянно используют при сравнивании сжатых и несжатых видеопоследовательностей. На рис. 2.15 показаны крупные планы трех изображений: первое изображение (а) является исходным (несжатым), а изображения (б) и (в) являются «подпорченными» (размытыми) вариантами исходного. Изображение (б) имеет PSNR, равное 30.6 дБ, rSNRju = 101og10 (2" - l)2 MSE (2.7) Глава 2. Форматы eudeo и eto качество a PSNR для изображения (в) равно 28,3 дБ (отражающее гнижение Рис. 2.15. Примеры PSNR: (а) оригинал, (б) 30.6 дБ, (в) 28.3 дБ. Рис. 2.16. Изображение г размытым < н (PSNR = 27.7 дБ). Мера PSNR имеет целый ряд недостатков. Для вычисления величины PSNR необходимо иметь и исходную, и преобразованную последовательность, однако первая бывает не всегда доступна. Кроме, того, не всегда легко проверить, что исходное видео само имело совершенное качество. Величина PSNR плохо коррелирует с субъективными мерами качества, например с ITU-R 500. Для некоторого изображения или последовательности изображений большое PSNR обычно указывает на высокое, а мллое PSNR на низкое качество преобразованных изображений по сравнению <• исходными. Однако конкретные величины PSNR необязательно гарантируют «абсолютно» субъективное качество. Например, на рис. 2.17 дано искаженное изображение рис. 2.15 (а), на котором был размыт лишь задний фон с облаками. Это изображение имеет PSNR. равное 27.7 дБ по отношению к исходному. Большинство зрителей скажут, что это изображение гораздо лучше изображения на рис. 2.15 (в), так как лицо девочки очень четкое. Это противоречит оценке каче- 0 ... 11 12 13 14 15 16 17 ... 122
|