Дурная наследственность-ii

Статья печатается в авторской редакции

В предыдущем номере журнала Системы безопасности была опубликована статья М.В. Руцкова Дурная наследственность. В своей статье, публикуемой ниже, он продолжает тему, затронутую ранее.

А теперь рассмотрим еще одно мультимедийное чудо природы – компрессию. Суть в том, что объемы видеоданных оцифрованного телесигнала настолько велики, что не лезут никуда – ни в каналы связи, ни на какие-либо сменные цифровые носители. Ну сами посудите, при формате 720х576 пиксел (в цвете) и скорости 25 кадр/с, получается поток порядка 20 Мбайт/с! Сначала был MPEG-1 – этакое баловство, уступающее по качеству легендарным VHS-кассетам. А потом родили формат MPEG-2, который практически стал стандартом записи на DVD-диск. Хоть там и есть некоторые рекомендации – суть самого кодека особо не меняется. Это дискретно-косинусное преобразование, которое выполняется над блоками 16х16 пиксел, используя межкадровую разность. Естественно формат MPEG-2 начали успешно использовать и в нашей области, хотя насчет качества можно еще и поспорить. Все-таки одна из основных функций охранного видеонаблюдения – просмотр стоп-кадров из архива.

Однако аппетит приходит во время еды! Захотелось закатывать голливудское добро и на обыкновенные CD-болванки, а еще гонять эти произведения кинематографа через Интернет (не безвозмездно, естественно). Сказано – сделано! Появился MPEG-4.

Так что ж это такое – стандарт или формат? На бытовом уровне – второе, а вот если использовать научный подход – первое. Само название MPEG происходит от Motion Picture Experts Group. Вот тут-то – в четвертой версии, в отличие от MPEG-1 и MPEG-2, товарищи ученые развернулись по полной программе.

Они решили написать рекомендации лет этак на 50 вперед – каким образом собирать в одну кучу разнородную мультимедийную информацию: видео, аудио, текст, графику и т.д. Причем начали фантазировать на темы того, чего еще и в помине нет. Ну например – выделение на статическом фоне неких объектов типа: человек, автомобиль, лошадь, грабли и т.д. Фактически прозвучало – мол, когда изобретете эти технологии, то вот вам наши рекомендации: как все это в единый мультимедийный поток запихивать! Отсюда самое глубокое заблуждение по поводу фантастических возможностей MPEG- Народ, прочитав эти рекомендации, причем не напрямую из самого документа, а из популярных статей некоторых горе-писателей - делает вывод, что в MPEG-4 уже реализованы не просто интеллектуальные видеодетекторы, а еще и распознавание объектов, в придачу!!!

Если б это было так, то мы – видеодетекторщики уж давно бы отдыхали, а юго-восточные системы гордо маршировали во все стороны!

На самом деле речь идет не о MPEG-4, а о видеокодеках, которые в рамках этого стандарта применяются. Кстати все MPEG-и -1,2,4 используют общие принципы кодирования. Например, метод компенсации движения и другие, но об этом чуть позже. Так вот, в первых двух используется дискретно-косинусное преобразование – выполняется апроксимация внутри блока волновыми функциями: 8х8 для MPEG-1 и 16х16 для MPEG- Отличия обусловлены разным уровнем вычислительной мощности для своего времени. А вот кодеков в рамках MPEG-4 уже столько, что пальцев на руках и ногах не хватит сосчитать. Не буду вдаваться в тонкости (у всех свои секреты), а попробую выделить несколько общих штрихов.

Итак – компенсация движения! В чем смысл?

Обыкновенная межкадровая разность уж не позволяет жать шибко сильно – поэтому и придумали сие творение! Сначала можно подумать – как круто: выделяется объект и трассируется вдоль траектории. Да нет же конечно – просто берется область (квадратно-гнездовая), а далее начинается поиск методом елозинея – ей подобной, по минимуму иль максимуму некой компарирующей функции. Думаю, даже корреляция не используется, в силу ее ресурсоемкости. Определив новую позицию такого квадратика, можно теперь лишь задать вектор смещения и разность. Самое интересное – учитываются только лишь линейные сдвиги! Ежели объект вращается иль надвигается, а может быть меняет форму, да и яркость колыхнулась, то алгоритм уходит в глубокие раздумья и эффективность его резко падает. Однако в мультимедийных фильмах такое происходит редко – там мы следим за крупными объектами. Даже если они и поворачиваются, то квадратики, их разбивающие, смещаются практически линейно. А теперь возьмем мелочевку – человечек целиком вписывается в квадратик, да еще машет там руками и ногами! В результате все ломается и пропускается, особенно для кодеков с постоянным потоком. Но никто этого не замечает – сюжетом увлечены, да и мозг человеческий в движении мелких деталей не видит! А вот в архиве можно лишь более-менее рассмотреть – опорные кадры. Причем некоторые умельцы сочиняют самодельные алгоритмы, в которых опорники расставлены в километре друг от друга. Тогда совсем – караул! Вот теперь и почувствуйте разницу, что такое – тупо тащить технологии из одной области в другую! Небо и земля!!!

Следующий феномен – сегментация. Идея заманчивая – зачем передавать по каналам связи пикселы. Давайте выделять на изображении области с примерно одинаковыми свойствами внутри – текстурами, и отсылать лишь их описание. Таким образом, степень компрессии возрастет еще больше! Естественно, получается – усредненная температура больных в больнице.

Если более образно – текстура – это, например, что-то типа: кирпичной кладки или травы, хотя до таких высот в кодеках еще не дошли.

После сего кодирования и соответствующего декодирования кладка замурует маленькую бойницу, из которого дуло торчало, а в траве потеряется кузнечик, сидевший там. И сожрала его не лягушка-прожорливое брюшко, а текстурная сегментация (зелененький он был, как и трава)!

Но и на этом мультимедийная индустрия останавливаться не желает. Наверное, все видели шпионские фильмы, в которых резидент и центр общаются друг с другом шифровками.

Причем у обеих сторон одинаковые книжки – передаются не слова, а их координаты (на какой странице, строке и внутри нее). Теперь вообразите, что у вас не книжка, а альбом с картинками – слабо!!! Живое видео подменяется мультиком в режиме реального времени! Даже трудно себе представить, к каким последствиям приведет перетаскивание такой чудо-технологии в охранное видеонаблюдение. Думаете – не додумаются. Ошибаетесь – еще как! Обязательно найдутся умельцы, которым лень подумать, а может быть и нечем. Главное - чтобы костюмчик сидел! Вспоминаю времена перестройки – порошок стиральный куда-то пропал. И отлично на эту тему Веселые ребята из одноименной телепередачи прикололись – рекламный клип выдали. На нем вместо порошка выплывала коробка с геркулесом. А что, все правильно – внешне не отличить!

Ну и, наконец, поговорим о модном ныне явлении – предугадывающих алгоритмах. В первую очередь их собираются использовать в интеллектуальном деинтерлейсинге для борьбы с гребенкой. Задача сама по себе абсурдная – из двух полей, между которыми 20 мс, сделать единый стоп-кадр. А в перспективе – дорисовывать фрагменты на слабоконтрастных изображениях. Может быть для целей мультимедиа это и хорошо. Ведь все MPEG-и и были задуманы для кинозрителей. Любая компрессия с потерями вносит искажения. Но и они бывают разными – в пределах удовольствия зрительного восприятия человеком и – раздражающими его! Обычно это раздражение возникает от шибко сильной компрессии, когда появляются, например – JPEG-лапти или та самая гребенка. Ну и другие, скажем, диагональные усы от WaveLet-а. Поэтому цель видеокодеков – успокоить глаз человеческий, даже путем микрообмана, фильтруя все вдоль и поперек! Однако у нас – в царской охранке – совсем другая задача – правда и только правда!!! Объясняю – в отличие от Голливуда имеем мелкие и слабоконтрастные детали, которые в первую очередь страдают от компрессоров! И никакие алгоритмические гадалки не способны выдать истину!

Немного нейрофизиологии и психологии зрения. Мозг (не глаз), причем не только у человека, построен на ассоциативном восприятии.

Когда не хватает реальной информации, он сам ее достраивает, исходя из своего жизненного опыта. Сами знаете, что может померещиться в потемках или какие замысловатые белогривые лошадки возникают в облаках. Это не случайно – это помогает выживать! Лучше десять раз в час зайцу шарахнуться в сторону, чем единственный и последний раз в жизни быть съеденным совой, например. Это хорошо было бы для видеодетекторов, да и то в меру! Однако такие алгоритмы требуют по сути создания искусственного интеллектуального зрения с огромной базой личного опыта! Причем все очень индивидуально – милиционерам мерещится одно, военным – другое, матерям – третье и т.д. Поэтому, при фиксации видеособытий в охраннойобласти, такие вероятностные дорисовывания – абсолютно недопустимы!!! Можно и собаку Тузика нарисовать, и дуло макарыча, или выдать кадр, в котором один человек тюкает другого не ножом, а бутылкой Клинского!

Поэтому сейчас можно лишь констатировать – никакие интеллектуальные алгоритмы пока не могут сравниться с интеллектом мозга. Дистанция огромна! Никогда не забуду своего общения с врачами-рентгенологами. Они смотрели на свои пленки, как на творения импрессионистов. И приходилось лишь диву даваться – как они умудрялись из этой каши пикселов выделять те или иные патологии!

Итак, сухой остаток:

MPEG-4 изначально предназначен для мультимедийных приложений.

В мультимедиа все крупно и контрастно! В охранном видеонаблюдении все – мелко и тускло!

В мультимедиа зритель смотрит кино, в охранном видеонаблюдении – стоп-кадры!

В мультимедиа главная задача – не раздражать глаз зрителя, пусть даже путем художественного шаманства, в охранном видеонаблюдении – правда и только правда, эксперты смотреть будут!

Р—РІРѕРЅРёС‚Рµ, Р±СѓРґРµРј СЂР°РґС‹ РїРѕРјРѕС‡СЊ!
РћС‚РґРµР» РїРѕ СЂР°Р±РѕС‚Рµ СЃ РєР»РёРµРЅС‚Р°РјРё: 8 (495) 909-90-01
РўРµС…РЅРёС‡РµСЃРєРёР№ РѕС‚РґРµР»: 8 (964) 644-46-00
Р¤Р°РєСЃ: 8 (495) 911-69-65

Читайте далее:

Ксзи панцирь-к для ос windows 2000/xp/2003 –оптимальное решение для защиты конфиденциальной информац

Как обеспечить эффективную антивирусную защиту?

Шедевры 121-130

Эффективность средств защиты информации

Шз–революция

Кадровая безопасность ,часть 2,

Слово о радиочастотных системах защиты от краж

В школьном округе харт планируется установка систем видеонаблюдения

В великобритании собираются использовать видеонаблюдение для выявления мусорящих курильщиков

Безопасный спуск

Что такое «АРО»

6. предпочтения участников рынка безопасности 2007 года

Аналитики пытаются остановить похитителей велосипедов при помощи видеонаблюдения

Шедевры 141-150

Причины, по которым французам лучше, чем американцам, удается бороться с терроризмом