8(495)909-90-01
8(964)644-46-00
pro@sio.su
Главная
Системы видеонаблюдения
Охранная сигнализация
Пожарная сигнализация
Система пожаротушения
Система контроля удаленного доступа
Оповещение и эвакуация
Контроль периметра
Система домофонии
Парковочные системы
Проектирование слаботочных сетей
Аварийный
контроль
Раздел: Документация

0 ... 71 72 73 74 75 76 77 78

пучению динамического истинно трехмерного рентгеновского изображения изучаемой структуры, что открывает большие возможности как для биомедицинских исследований, так и для клинической диагностики [22, 23].

Для достижения максимальных удобств клинической диагностики длительность всего процесса, включающего и демонстрацию объемного изображения, должна быть сокращена до нескольких минут при фактическом времени накопления данных в несколько минут. Для нахождения оптимального решения этой сложной вычислительной задачи было проведено множество алгоритмических и имитационных исследований [7, 22, 24]. Предельная производительность мощного мини-компьютера, связанного с доступным в настоящее время программируемым матричным процессором, составляет одно поперечное сечение за 2-10 с. Вместе с тем было определено, что в ближайшем будущем для достижения требуемой производительности эквивалентной скорости вычислений не менее 4 • 109 оп./с необходимо будет увеличить быстродействие (процессора) на несколько, порядков; использование проекций наглядно свидетельствует о необходимости достижения в конечном счете к концу 80-х годов быстродействия в 90 • 109 оп./с. Поскольку такая высокая производительность не будет обеспечиваться даже следующим поколением программируемых матричных процессоров, было принято решение о разработке специализированного высокопроизводительного процессора, ориентированного на узкий класс алгоритмов.

Был выбран наиболее эффективный алгоритм и вложен в несколько возможных вариантов процессоров разной архитектуры, оказалось, что, несмотря на различия в способе реализации, общим для этих процессоров является то, что все они принадлежат к двум различным типам ОКМД-сис-тем. Далее будет приведено краткое описание алгоритма воссоздания изображения и характерной архитектуры таких процессоров.

Алгоритм построения изображения, используемый в AT, включает несколько этапов. После аналого-цифрового преобразования каждая полученная вектор-строка входных данных умножается на заранее вычисленный весовой вектор такой же размерности для коррекции искажений, вызванных изменением интенсивности рентгеновского излучения на краях лучей. Каждый из этих "векторов данных", используемых для построения изображения, затем фильтруется непосредственным вычислением свертки или с помощью преобразования Фурье для корректировки апертурных искажений, вызванных конечной шириной рентгеновского луча. Отфильтрованные векторы данных затем "собираются" в пространство изображений для получения величины, характеризующей яркость данного элемента растра. Для получения значения яркости элемента путем обратной проекции из памяти Учитывается один элемент из каждого отфильтрованного вектора данных и взвешивается с последующим суммированием всех взвешенных значений. Эта процедура повторяется для получения каждого из (всех) 16 000- 250000 элементов растра, составляющих изображение одного поперечного сечения [3, 14 - 16].

На рис. 26.2 приведена функциональная схема специализированного аппаратурно-параллельного процессора, разработанного для реализации не-

Сглажи-вающий фильтр

(pi)

Предварительное " взвешивание проекций

Умножимте ль

Отсчеты проекции

Их

aJtt)

ЗУ

ядро свертки:

Умножитель j

I

н

Умножимте ль к

Ум ножи-тельм

• +

Параллельный сумматор 2L* М

I

i и

Интерполятор

7;

Информационные входы f. к N блокам ЗУ проекций

ЗУ проекций (Н бпоков по 4 к слов каждый)

Разряд Слово

12-разрядный

адрес Информационный выход

Информационный вход (ИВ12)

12- разрядные адреса ЗУ проекции

А123 AN

0$Ж Разряд(12Н-1)

0 1

2

16127 16128

ЗУ адресов проекций, 16 ксловх х 16 разрядов

Формирователь адресов элементов изображений

Помять изображений, 16 к словх < 16 разрядов

К ЗУ большой емкости и устройствам отображения

А рифметическое устройство

управляющее ЗУ 1

Формирователь микрокоманд 1

I

Почтовый ящик

Формирователь микрокоманд 2

I

Управляющее ЗУ 2

со со

микрокод от ЭВМ

Микрокод от ЭВМ

Си

са.

Си

С; со

а

Упродляющее устройство

Рис. 26.2. Функциональная схема специализированного параллельного процессора, разработанного для реализации нескольких тесно связанных алгоритмов построения биомедицинских изображений (алгоритмов автоматизированной томографии), в частности алгоритма свертки и восстановления изображения для расходящегося пучка. Верхний процессор выполняет операции предварительного взвешивания и фильтрации. Нижний ОКМД-процессор выполняет параллельные операции восстановления изображения. Адреса проекций и весовых коэффициентов формируются табличным методом. В таблице хранятся 8 весовых коэффициентов обратного преобразования. Управление осуществляется с помощью микроконтроллеров

скольких однотипных алгоритмов восстановления изображения [22, 24]. Арифметическое устройство, изображенное в верхней части рисунка, реализует операцию линейной фильтрации векторов данных отдельных проекций, каждый из которых содержит до 512 элементов. Полученные промежуточные результаты передаются на параллельно работающие подпроцессоры, расположенные в нижней части рисунка, которые реализуют "собирающую" часть алгоритма.


Несмотря на многолетнюю интенсивную работу, основные проблемы, связанные с данной архитектурой, остаются нерешенными. После тщательного изучения основного алгоритма построения АТ-изображений и применения этого алгоритма в конкретных проектах становится очевидным, что разделение процесса вычислений более чем на 30 отдельных подпроцессов, которые могут выполняться на отдельных параллельных процессорах, невозможно. В предельном случае система в целом объединяет, около 225 000 логических вентилей (не считая памяти). Каждый из процессоров, в свою очередь, может быть реализован в виде СБИС, тем более что 28 из них могут быть идентичны. В предположении, что эти СБИС будут работать на максимально возможной тактовой частоте (20 МГц для современных СБИС), была получена верхняя оценка производительности процессора, равная 2 109 оп./с. В то же время требуемая по нашим оценкам производительность составляет (4 - 90)-109 оп./с, что соответствует рабочим частотам 30-675 МГц. Такая же дилемма возникает при решении некоторых вычислительных задач биомедицины и при решении многих задач военного характера. Данная проблема лишь частично может быть решена с помощью архитектурных решений, алгоритмических трюков, параллелизма и конвейер-ности.

Этот пример, по-видимому, является характерным для целого подкласса задач обработки сигналов и изображений, которому присущи исключительно жесткие временные и экономические ограничения. В таких задачах на вход процессора поступает поток данных со столь большой скоростью, что по крайней мере предварительная обработка (а в некоторых случаях и послепроцессорная) должна выполняться с тактовыми частотами 0,1 - 2 ГГц. Основная операционная часть такого процессора может функционировать с меньшей частотой, но, как правило, все же превышающей допустимую тактовую частоту современных СБИС и СБИС ближайшего будущего. Отметим также, что частота внутренних микротактов процессора часто должна в несколько раз превышать частоту поступления данных; например, некоторые алгоритмы предварительной обработки радиолокационных эхо-сигналов требуют выполнения от 10 до 20 (микро) операций за период поступления входных отсчетов. Если в этом случае скорость поступления данных составляет 108 отсч./с, то для некоторых блоков процессора потребуется тактовая частота от 1 до 2 ГГц. Причем по крайней мере для нескольких подобных задач процессор в целом реализуется наиболее просто, если все его блоки работают на максимальной рабочей частоте [25].

Существует еще одно и, возможно, наиболее существенное препятствие на пути решения задач, требующих столь высокой производительности. Оно связано с часто возникающей необходимостью использовать специализированные компоненты, оптимизированные на решение конкретной задачи. Однако, как следует из рассмотренного примера, для многих систем обработки сигналов потребность в специализированных ИС столь мала, что изготовление заказных ИС, особенно заказных СБИС, недопустимо. Стоимость полной разработки СБИС до сих пор очень высока даже с учетом

последних достижений в области автоматизированного проектирования [26]. Обычно выпуск даже 50- 100 процессоров с заказными компонентами совершенно недостаточен, чтобы окупить затраты, связанные с разработкой специализированных СБИС.

Из сказанного следует, что усилия, направленные на увеличение пропускной способности процессоров, предназначенных для классической обработки исключительно широкополосных сигналов в реальном масштабе времени, не могут полностью основываться только на оптимальных архитектурных решениях даже при их реализации на СБИС. В ряде разработок подобных систем, включая проведенные в нашей лаборатории, в таких случаях увеличение быстродействия было достигнуто благодаря использованию логических схем, реализованных на более "быстрых" транзисторах.

26.5. МЕТОДЫ УВЕЛИЧЕНИЯ СКОРОСТИ ОБРАБОТКИ, ОСНОВАННЫЕ НА ИСПОЛЬЗОВАНИИ БОЛЕЕ СОВЕРШЕННЫХ ТЕХНОЛОГИЙ

Высокая скорость переключения транзисторов - параметр, который трудно использовать на уровне СБИС, поскольку достижение задержек распространения сигнала длительностью в единицы и доли наносекунды на вентиль требует рассеивания больших мощностей в кремниевых ИС (см. рис. 26.1). Рассеиваемая мощность при этом увеличивается, поскольку требуются большие мгновенные токи при данном перепаде логических уровней напряжения для перезаряда паразитных емкостей линий связи между смежными логическими схемами на кристалле или (и) между интегральными схемами. Если каждый вентиль рассеивает в среднем 1 мВт, то СБИС, содержащая 10 000 вентилей, будет рассеивать 10 Вт. Организовать необходимое охлаждение таких ИС обычными способами очень трудно. Кремниевые СБИС со сложностью около 10000 вентилей должны рассеивать не более 100 - 400 мкВт на вентиль; при таком низком уровне рассеиваемой мощности переключающие токи столь малы, что трудно достичь средней задержки, намного меньшей 1 - 2 не (см. рис. 26.1).

Хотя уменьшение размеров транзисторов и вентилей теоретически могло бы привести к уменьшению средней задержки распространения на вентиль при том же уровне рассеиваемой мощности, эта тенденция не всегда будет приводить к более высокой скорости работы компонентов СБИС. Причина состоит в том, что разработчики будут использовать возможность создания транзисторов меньших размеров для изготовления ИС с еще большей степенью интеграции. Например, в ИС, содержащей 100000 вентилей, мощность, рассеиваемая одним вентилем, должна быть ограничена величиной 10-40 мкВт для сохранения мощности рассеивания всего кристалла на уровне 1-4 Вт. Из рис. 26.1 видно, что только одна технология изготовления -КМОП, КНС - позволяет достичь такого низкого уровня. Таким образом, в обозримом будущем высокие тактовые частоты и высокие уровни сложности будут являться несовместимыми требованиями для кремниевых СБИС.


26.6. ИСПОЛЬЗОВАНИЕ A PC EI 1 ИД-ГА Л Л И EBO Й ТЕХНОЛОГИИ ИЗГОТОВЛЕНИЯ БИС ДЛЯ УВЕЛИЧЕНИЯ СКОРОСТИ ОБРАБОТКИ

Каким же может быть решение задачи обработки сигналов, ограниченное, с одной стороны, очень широкой полосой частот входных сигналов и высокой тактовой частотой, а с другой стороны, требующее разработки специализированной элементной базы для производства* в небольших количествах в сжатые сроки? Один из способов, интенсивно изучаемый сейчас в нескольких исследовательских лабораториях, включает комплексное использование как новых технологий, позволяющих поднять рабочую частоту выше 250 МГц, так и методов быстрого проектирования и изготовления отдельных компонентов элементной базы и системы в целом. Такие возможности открываются благодаря физическим свойствам арсенида галлия при его использовании для формирования подложки ИС вместо обычных инерционных подложек из кремния или кремния на сапфире. Потенциальное преимущество использования GaAs при изготовлении цифровых ИС было известно давно. Однако развитие этой технологии сдерживалось тем, что некоторые физические свойства GaAs не позволяли использовать для него технологическое оборудование, разработанное для кремниевых устройств. Физические свойства кристаллической структуры такой подложки намного сложнее, чем кремниевой, и в настоящее время интенсивно исследуются; соответствующие уровни технологии и производственное оборудование, развиваемое в течение 25 лет для кремния, в настоящее время претерпевают изменения и тем не менее еще недостаточно отрегулированы для арсенида галлия. Однако в противовес этим очевидным недостаткам существует ряд факторов, говорящих в пользу арсенид-галлиевой технологии. Во-первых, подвижность электронов в GaAs при заданном градиенте напряжения в шесть-восемь раз больше, чем в кремнии. Это в конечном счете приводит к большей скорости прохождения электронов через каналы -канальных полевых, транзисторов, сформированных на подложке из GaAs, и позволяет более чем в три раза уменьшить задержку распространения на вентиль по сравнению с такими же структурами на кремнии или уменьшить мощность рассеивания на вентиль при той же скорости, или соответственно улучшить обе эти характеристики (см. рис. 26.1). Эффект высокой подвижности электронов этого материала уже демонстрировался в функциональных ИС на уровне СИС и БИС [27, 28].

Арсенид-галлиевые МИС и СИС опытной серии (т.е. не единичные, созданные в лабораторных условиях экземпляры ИС) были помещены в корпуса и установлены на испытательный стенд, где работали с задержками и рабочими частотами, недостижимыми для иромышленно выпускаемых кремниевых ЭСЛ ИС с задержкой менее 1 не. На рис. 26.3 показаны характеристики функционирования опытных ИС малой степени интеграции (небольших контрольных структур на БИС), работающих в диапазоне частот 1-2,5 ГГц. Эти данные, по-видимому, являются первой демонстрацией функционирования несколько связанных цифровых GaAs ИС. Измерения показали, что внутрикристальная задержка на вентиль составляет 80 -

120 пс, а вне кристалла возрастает до 250-350 пс при малых уровнях шума даже несмотря на то, что оптимальные способы корпусирования и межкомпонентных соединений не применялись на этих ранних стадиях исследования. Были разработаны ИС на полевых транзисторах с наиболее важным технологическим параметром - размером вентиля, равным 1 мкм, вполне достижимым на GaAs (но не в кремнии) вследствие простой структуры полевых транзисторов на GaAs и небольшого числа технологических операций. Кроме того, есть все основания надеяться, что положительные эффекты, полученные за счет уменьшения геометрических размеров в кремниевых ИС, проявятся так же, а возможно, и в большей степени, в арсенид-галлиевых ИС, включая эффект баллистического пролета электронов через транзисторы [29]. Размер вентилей на полевых транзисторах, который, собственно, и определяет скорость работы транзисторов и мощность рассеивания при заданных характеристиках подложки, по-видимому, можно уменьшить по крайней мере до 0,7 мкм. Это уменьшит время внутрикрис-таллической задержки на вентиль до уровня 50-80 пс и даст дополнительный выигрыш в быстродействии [29].

Кроме того, характеристики энергетических зон арсенида галлия и арсенида алюмогаллия позволяют создавать определенные типы структур, которые в принципе невозможны в кремнии. Например, могут быть созданы различные типы биполярных транзисторов с неоднородными переходами (гетеропереходами), включающие несколько слоев арсенида алюмогаллия и арсенида галлия [28]. К середине 80-х годов значение /т одной из та-

Лоложение испыта- В: GaAs тельного зонда

GaAs

?П0мВ\

---во/.

1ЛГйГ

С: GaAS

ЗСЛ

2008 I 2U:nc

------80%

,- -у--20Ус

Вход

BIAS

GaAs т4

GaAs

зел-регисгр

эсл-бентиль

GaAs

т4

зсл-

регистр

В

ЗСЛ-

вентиль

Л

?. к Щ /i ДА Л ft л i

: ;t> »; \ i * I \ \ \ м ; и . :

Положение испы- А:Входные синхроимпульсыВ: GaAs--GaAs тательно- #; GaAs GaAsС• GaAs -ЭСЛ zo зонда

В: GaAsGaAs D: ЭСЛ-Выход

Рис. 26.3. Функционирование нескольких арсенид-галлиевых и кремниевых ЭСЛ-эле-ментов, соединенных, как представлено на схеме. Межкристальная задержка существенно меньше 300 пс. Рабочая частота 2,07 ГГц



0 ... 71 72 73 74 75 76 77 78