Раздел: Документация
0 ... 47 48 49 50 51 52 53 ... 78 ПРИМЕНЕНИЕ ПАРАЛЛЕЛЬНЫХ СИСТЕМ НА СБИС ПРИ ДВУМЕРНОЙ ОБРАБОТКЕ СИГНАЛОВДВУМЫНОИ Г. Надд, Дж. Наш1 17.1. ВВЕДЕНИЕ Появление МОП-технологий, обеспечивающих высокую плотность упаковки элементов, и СБИС создает предпосылки для значительного увеличения возможностей обработки сигналов во многих областях. Многие методы обработки, которые до сих пор считались слишком дорогостоящими или медленно выполняемыми, вскоре будут осуществляться бортовыми процессорами в реальном масштабе времени. Это в особенности справедливо для двумерной обработки сигналов в таких областях применения, как радиолокационное картографирование, формирование луча и анализ радиолокационных изображений. В этих областях объемы данных, подлежащих обработке, как правило, возрастают обратно пропорционально квадрату разрешения по дальности. Для нестационарных систем с относительно высоким разрешением скорость входных потоков достигает 108 отс./с, а требования по производительности превышают 109 оп./с. Можно ожидать, что уменьшение времени задержки приборов, обеспечиваемое технологией СБИС, даже при использовании обычной фон-неймановской архитектуры уменьшит время машинного цикла приблизительно на порядок. Все же для большинства двумерных задач эти достижения в производительности будут еще далеки от требуемых, и поэтому необходимо эффективно использовать параллелизм и совмещение операций. Это именно та область, в которой СБИС могут в наибольшей мере проявить себя. Если, к примеру, удастся получить на процессорной пластине или кристалле 10, 100 или даже 1 ООО элементарных процессоров, работающих одновременно, то это приведет к значительному росту производительности. Однако для достижения такого параллелизма следует учесть сразу несколько обстоятельств. Например, необходимо пересмотреть основные вычислительные операции, требующиеся для каждой из прикладных задач, а также предусмотреть меры по повышению эффективности алгоритмов, не сводящиеся только к минимизации числа операций или команд. Повышенное внимание должно быть уделено обеспечению оптимального параллелизма и поддержанию высокого процента активности всех элементов процессорных матриц. Далее, важным обстоятельством становится регулярность потока данных и потребность не только в локальной, но и в глобальной памяти. В настоящее время эти проблемы получили признание, а разработка алгоритмов для СБИС поставлена на научную основу. Эффективному использованию параллелизма должны предшествовать исследования технологических вопросов, таких как проектирование СБИС и 1 Фирма Hughes Research Laboratory, Малибу-Бич, Калифорния. i топологии связей в процессоре, а также вопросов ввода и вывода информа-\ ции. По этой причине наши усилия в настоящее время были сконцентрированы на разработке систем с параллельной архитектурой, содержащих в основном одинаковые обрабатывающие элементы с минимумом глобальных связей. Имеются в виду два класса архитектурных решений. В первом из них для достижения параллелизма предусматривается возможность использования большого числа одинаковых, но относительно небольших просмотровых таблиц, а во втором - разработка оптимального локального элементарного процессора, требующего связи лишь с ближайшим соседом. Второй подход важен в том смысле, что мы уже начали рассмотрение и построение ориентированной на умножение СБИС процессора (ОУП), который при включении в двумерную или одномерную матрицу может обеспечить очень широкий круг функций обработки. Этот процессор в настоящее время использует КМОП технологию ИС со стандартным разрешением 5 мкм и может быть запрограммирован на уровне как локального процессора, так и матрицы для реализации множества алгоритмов, используемых в анализе изображений и распознавании образов (АИРО) . Подробные сведения о данном кристалле приведены в разд. 173. 17.2. ТРЕБОВАНИЯ К ПРОИЗВОДИТЕЛЪНОСТИ ПРИ АНАЛИЗЕ ИЗОБРАЖЕНИЙ За последние несколько лет достигнуты большие успехи как в области алгоритмов, так и в области программного обеспечения анализа изображений, в результате чего произошел переход от эры предварительной обработки и кодирования к более сложным методам, в основном базирующимся на символическом и необразном представлениях [1, 2]. Эти методы направлены больше на использование последовательных уровней абстракции в представлении данных, чем на конкретную топологию образа. Вследствие этого применявшиеся ранее методы обычной двумерной фильтрации теряют свое значение и упор делается на такие операции, как выделение признаков изображений и классификация [3, 4]. 17.2.1. Операции обработки Основные стадии обработки информации в типичной современной системе анализа изображений иллюстрируются рис. 17.1. Первая стадия, заключающаяся в формировании изображения, для визуальных образов может быть тривиальной, но для баз данных таких устройств, как радиолокатор с синтезированной антенной решеткой (САР) , эта стадия может потребовать значительной производительности вычислительной системы. Основные операции включают формирование в реальном масштабе времени последовательных элементов разрешения в продольном и поперечном направлениях1. Например, изображение с разрешением d по обеим осям (для элементов разрешения в поперечном направлении) требует производительности 1 по отношению к направлению полета носителя РЛС. - Прим. ред. 305 Формирование изображения Восстановление и коррекция Рис. 17.1. Структурная схема процесса анализа изображения по признакам Выделение признаков I Классификация F А Наблю-•*Т даемый I объект Опорный объект 2AR, а для элементов разрешения в продольном направлении 4vAR где Т - длительность передаваемого импульса; AR - диапазон дальности; PRF - частота повторения импульсов; R - дальность; v - скорость летательного аппарата; X - длина волны передаваемого сигнала. Для относительно высокого разрешения, равного 1 м, эти расчеты дают производительность примерно 108 оп./с. После формирования двумерного образа, как правило, могут быть применены некоторые методы коррекции или восстановления при индикации в реальном масштабе времени. Типичным видом обработки, которая может быть использована на этой стадии, является двумерная фильтрация вида 7(х,у) =Н(х,у) *1(х,у) +шум,(17.1) где / (х, у) - откорректированное изображение в точке х, у; I (х, у) - исходное изображение; Н(х, у) - импульсная характеристика фильтра; символ * обозначает свертку. Для многих задач характеристики фильтра вычисляются в реальном масштабе времени по статическим характеристикам принимаемого изображения, например, таким, как спектр. Поэтому типичной операцией наряду с двумерной фильтрацией (17.1) является обращение матрицы размера и X л, где п может изменяться в пределах от 3 до 15 пиксел1. На следующей стадии могут применяться более сложные операции, направленные, например, на получение изображения с более высоким разрешением 1 pixel - минимальный элемент изображения, цвет и яркость которого можно залатъ независимо от остального изображения. - Прим. перев.РЖН Задать по методу максимума энтропии. Простейшим примером может служить ситуация, когда разрешение не одинаково по двум ортогональным направлениям и оценка по методу энтропии используется для увеличения числа отсчетов по одной из осей. Как правило, это может привести к операции обращения теплицевой матрицы, описанной в разд. 17.4. 17.2.2. Выделение признаков и классификация изображений Дальнейшая обработка связана с выделением признаков и классификацией объекта. На этой стадии каждый элемент изображения рассматривается с учетом его ближайшего окружения и формируется скользящее окно. Обычно размер окна может меняться от 3 X 3 до 64 X 64 пиксел, что приводит к частотам обращений от 6 * 107 до 3•!О10 пиксел в секунду для обычных телевизионных изображений. Необходимость измерения характеристик, таких как плотность контура, дисперсия, гистограмма, а также некоторых расчетов в реальном масштабе времени приводит к большому объему вычислений. Обычно используемые операции и необходимые для их выполнения производительности даны в табл. 17.1. Типичные требования к производительности находятся в пределах 108 ... 1013 оп./с, а число рассчитываемых характеристик может достигать 20. Эти данные лежат в основе классификации объекта, которая в простейшем виде может состоять в сравнении характеристик опорного объекта и полученных данных. Иллюстрация такого процесса дана на рис. 17.1, где в трехмерном пространстве показано представление трех характеристик. Длина вектора R может использоваться как мера вероятности того, что рассматриваемый объект принадлежит к тому же классу, что и опорный. В сказанном заключается суть классификации изображений по признакам. Как правило, основной подход развивается в нескольких направлениях, включающих элементы обратной связи и символьную обработку на более высоком уровне абстракции. Расчет требований к производительности для Таблица 17.1. Типичные операции обработки, используемые при анализе изображений по признакам Операция обработки Линейные операции, 0{N): пространственная фильтрация конволюция выделение контура Операции второго порядка, О (N2 ) : операции сортировки срединная фильтрация классификация по окружению Операции высших порядков: матричные пространственная обработка адаптивные операции j Необходимая производительность , оп./с 108 - 1011 109 - 1013 ю10 - ю14 таких процессов при качестве изображения, эквивалентном телевизионному, т. е. с пространственным разрешением 500 X 500 элементов и кадровой частотой 30 кадр./с, дает скорость поступления данных в 107 отс./с. Это озна-чает, что на стадии выделения признаков для окна размером 3X3 требуется частота обращения к памяти около 108 1/с. Для окна большего размера, ска-жем 64 X 64 элемента, частота обращений может быть порядка 10й 1/с. Таким образом, даже для линейных операций, таких как пространственная фильтрация, свертка и выделение контура, требуемая производительность будет составлять 108 - 10й оп./с, как видно из табл. 17.1. 17.3. АРХИТЕКТУРА ДЛЯ АНАЛИЗА ИЗОБРАЖЕНИЙ Представляется полезным сопоставить производительность различных вычислительных систем со временем их появления, как показано на рис. 17.2. Большинство серийно выпускаемых машин работающих в настоящее время аэрокосмических систем являются, в сущности, системами последовательной архитектуры, хотя и имеют по два-три уровня конвейеризации [6, 7]. Обыч-но рост производительности в таких системах является результатом совершенствования технологии изготовления полупроводниковых приборов, сокращения длины линий связи и т. д. За последние несколько лет такое разви-тие обеспечило рост производительности с нескольких миллионов до более чем 108 оп./с. Однако, как 10 10 w - Системы с параллельной архитектурой to Дбумерные конбейерные СБИС -матрицы Процессор РЛС можно заметить, значительного роста производительности в предстоягцие десятилетия не ожидается. В результате эффективность систем окажется далеко не достаточной по сравнению с требуемой для решения сложных проблем анализа изображений. Даже при совершенствовании технологии в результате реализации программы по разработке ссис1 производительность в 108 -109 оп./с может оказаться пределом для систем с данной архитектурой. В то же время совершенно очевидно, что решение проблем обработки изображений и распознавания образов требует производительности на --несколько порядков выше. Программа ССИС (VHSIC) - сверхскоростные интегральные схемы - стратегическая программа Министерства обороны США. - Прим. перев. Системы с последователь-ной архитектурой 1 1960 то W60 Год 1990 Рис. 17.2. Производительность параллельных и последовательных процессоров Главный контроллер Потенциальное увеличение производительности до NyW Рис. 17.3. Структура ОКМД-матрицы размера А/ХЛдля анализа изображения В тех машинах, которые успешно развивались и достигли производительности, необходимой для анализа изображений, обычно использовалась высокая степень параллелизма обработки. Например, процессоры CLIP (Cellular Logic Image Processor) [8] Университетского колледжа в Лондоне, DAP (Distributed Array Processor) [9] фирмы ICL и MPP (Massive Parallel Processor) [10] фирмы Goodyear и Национального управления по аэронавтике и исследованию космического пространства содержат матрицы из одинаковых элементарных процессоров, работающих, как правило, в режиме "Один поток команд - множественные потоки данных" (ОКМД), как показано на рис. 17.3. Размер этих матриц находится в пределах от 64 X 64 элементарных процессоров для процессора DAP и до 128 X 128 элементарных процессоров для процессора МРР. Поскольку большинство таких матриц являются раз-рядно-последовательными, возможно дальнейшее увеличение скорости примерно в N2/W раз, где W - длина слова при одновременной обработке всех разрядов слова. Это очень важный фактор. Например, процессор МРР образца 1983 г. обеспечивает производительность, эквивалентную 6-Ю9 операций сложения с фиксированной запятой в секунду. В режиме с плавающей запятой эти показатели снизятся до величины около нескольких сотен миллионов операций сложения с плавающей запятой в секунду. Такое увеличение производительности будет наблюдаться только при работе каждого элементарного процессора с максимальной загрузкой и идентичной обработке всех элементов изображения в кадре. Например, такие операции предварительной обработки, как двумерная фильтрация, выделение контура и т. д., могут быть легко запрограммированы с использованием такой формы параллелизма, но для операций высокого уровня, таких как классификация и совмещение изображений, это сделать значительно сложнее. Подобные затруднения возникают и при символическом анализе, использующем в настоящее время списковые структуры, для которых этот тип параллельных ОКМД-архитек-тур считается неподходящим. Ввиду этого важно развивать другие структуры СБИС, которые свободны от некоторых недостатков ОКМД-машин и могут быть пригодны как для низко-, так и для высокоуровневого анализа изображений. 0 ... 47 48 49 50 51 52 53 ... 78
|