8(495)909-90-01
8(964)644-46-00
pro@sio.su
Главная
Системы видеонаблюдения
Охранная сигнализация
Пожарная сигнализация
Система пожаротушения
Система контроля удаленного доступа
Оповещение и эвакуация
Контроль периметра
Система домофонии
Парковочные системы
Проектирование слаботочных сетей
Аварийный
контроль
Раздел: Документация

0 ... 70 71 72 73 74 75 76 ... 78

Рассеидаемая мощность, мВт/Вентиль

Рис. 26.1. Эксплуатационные характеристики некоторых семейств кремниевых и арсе-нид-галлиевых цифровых ИС:

МИС - малая степень интеграции, УМОП - МОП-технология с V-образной канавкой; МЕП - металл-полупроводниковые полевые транзисторы

тур как можно меньших размеров в серийно выпускаемых ИС. Это стремление к массовому выпуску и высокой плотности упаковки вызвало повышенный интерес к структурам типа пМОП, КМОП на кремниевой подложке и КМОП на сапфире (КМОП, КНС), технические характеристики которых допускают задержку распространения на вентиль около 2-20 не (рис. 26.1). Наиболее перспективные из этих структур допускают работу на тактовых частотах 30-50 МГц. Однако некоторые классы задач (например, задачи радиопротиводействия, обработки радиолокационных сигналов, широкополосных военных линий связи, а также некоторые сложные вычислительные задачи биомедицины) могут требовать очень высокой пропускной способности - от 0,1 до 2-109 бит/с [1], что соответствует тактовой частоте

устройств до 2 • 10у Гц. Обеспечивающая высокую степень интеграции, но невысокую тактовую частоту, СБИС-технология в настоящее время не способна решить эти задачи, и поэтому следует искать новые пути решения. В следующем разделе будет рассмотрено несколько примеров сложных вычислительных задач в области биомедицины.

26.2. ПРИМЕРЫ ЗАДАЧ С БОЛЬШИМ ОБЪЕМОМ ВЫЧИСЛЕНИЙ, ВОЗНИКШИЕ В БИОМЕДИЦИНЕ

Использование компьютеров в биомедицине, наверное, лучше всего показать на примере рентгеновской автоматизированной томографии (AT). Рентгеновская установка автоматизированной томографии включает рентгеновский излучатель и приемник, который накапливает данные рентгеновского проникающего облучения, но в формате, не позволяющем непосредственно построить изображение. Входящий в состав установки компьютер реорганизует информационное содержание этих данных для построения изображения тела с ракурсом, не достигаемым с помощью обычной радиографии [2, 3],

Возможности дальнейшего развития этих систем были очевидны с момента их открытия в 1973 г. Возросший интерес к автоматизированной томографии обусловил стремление к постоянному увеличению пространственной и яркоетной разрешающих способностей, к возможности отображения все более тонких слоев и к сокращению длительности всей процедуры от облучения пациента до получения результатов анализа. Эти повышенные требования были достигнуты, однако, ценой усложнения датчиков и методов вычислений. Алгоритмы формирования изображений, используемые в современных сканирующих АТ-системах, характеризуются исключительно высоким объемом вычислений; для построения одного яркостного элемента растра автоматизированной томографии требуется от 1000 до 10 000 арифметических операций. В 1973 г., используя ЭВМ с производительностью 2 • 105 оп./с, изображение размером 80X80 элементов можно было получить за 5-6 минут. К концу 70-х гг. для обеспечения возросших требований к разрешающей способности (512X512 элементов растра) и скорости построения томограмм потребовались вычислительные средства с производительностью не менее 107 оп./с (что обычно обеспечивалось мощной мини-ЭВМ и промышленно выпускаемым матричным процессором). В настоящее время для получения типовой рентгеновской томограммы требуется выполнить несколько сотен миллионов отдельных операций. Тем не менее при исследованиях, требующих просмотра большого числа поперечных сечений (слоев), врачи бывают вынуждены ожидать результатов обработки от одного до двух часов после завершения сканирования.

Другой способ получения изображений для медицинской диагностики, широко используемый в последнее время, основывается на применении в качестве зондирующих ультразвуковых сигналов. Ультразвуковой приемопередатчик может работать в так называемом режиме эхо-сигнала; подобно локатору подводной лодки, в таком режиме изображение строится на основе акустических сигналов, отраженных от объектов внутри изучаемого участка ткани (пространства). Следует, однако, заметить, что полезность этих изображений из-за их качественного характера в значительной мере зависит от особенностей каждого конкретного устройства и квалификации оператора.

Ограниченные возможности ультразвукового эхо-сканирования стимулировали исследования по созданию более совершенных методов ультразвукового отображения, основанных на распространении методов рентгеновской автоматизированной томографии, В рентгеновской AT взаимодействие между излучаемой энергией и тканью, через которую она проходит, определяется явлением поглощения, которое изменяется вместе с излучаемой энергией. Ультразвуковые сигналы взаимодействуют с тканью более сложным образом, описываемым так называемыми волновыми уравнениями, которые предсказывают взаимодействие ткани с ультразвуковыми волнами. Ткань считается (предполагается) неоднородной средой, характеризуемой определенными упругостью, плотностью, поглощением, эффективной поверхностью рассеяния и т.д., которые изменяются в зависимости от местоположения и направления, а также от центральной частоты и спектрального состава излучаемых сигналов.


Обобщенные волновые уравнения для таких сложных (т.е. реальных) тканей не решаются в явном виде, что не позволяет произвести вычисление параметров каждого рассматриваемого участка ткани для формирования ультразвуковой томограммы. Поэтому при разработке методов получения изображений с помощью ультразвуковой автоматизированной томографии (УЗAT) были сделаны различные допущения и упрощения волновых уравнений [4,5]. Уступая рентгеновской AT по пространственной разрешающей способности, УЗАТ, тем не менее, обеспечивает достаточно высокое качество изображения, которое зависит от оборудования или оператора. Различные особенности взаимодействия ультразвука с тканью могут быть использованы для построения отдельных типов изображений (томограмм), основанных на конкретных свойствах ткани, таких как поглощение, скорость распространения звуковых волн, которые дают независимые, но дополняющие друг друга результаты [б] .

Изображения, получаемые с помощью УЗАТ, в настоящее время еще уступают рентгеновским томограммам как по пространственной и яркостной разрешающей способности, так и по достоверности результатов полученного изображения. Дефекты и погрешности в изображении в значительной мере вызваны погрешностями метода получения томограмм, обусловленными упомянутыми упрощениями волновых уравнений, которые позволяют уменьшить объем их вычислений при численном решении на ЭВМ и, следовательно, удешевить процесс решения. В принципе, более строгая формулировка волновых уравнений, с большей точностью учитывающая неоднородность свойств ткани, будет обеспечивать большую четкость изображения. Волновые уравнения общего вида существенно нелинейны, но тем не менее могут быть решены различными численными методами [?]. В настоящее время решение этих проблем сдерживается высокой стоимостью реализации подобных точных численных методов на больших ЭВМ. Приведенный сравнительный анализ показал, что для получения точного трехмерного ультразвукового изображения с помощью решения волновых уравнений требуется вычислительная мощность, на несколько - порядков большая, чем в различных случаях рентгеновской томографии, описанных ранее (т.е. около 109 -1011 оп./с).

Возможности мощных ЭВМ и цветных графических дисплеев начинают также изменять средства и методологию биохимических исследований. С помощью специализированных аппаратных и программных средств становится возможным детально изучать структуры сложных макромолекул и их химически активные связывающие участки и исследовать как пространственное взаимодействие рецепторов с химически активными участками потенциально полезных лекарств, так и динамику этих молекулярных взаимодействий.

Большинство методов, используемых ранее для изучения этих свойств структуры и функций макромолекул, позволяло лишь косвенно исследовать молекулы. Только рентгеновская кристаллография могла прорисовать атомарную структуру биологичес-ких молекул, таких как протеины. Основываясь на данных рентгеновской кристаллографии, исследователь был вынужден выполнять трудоемкую работу по созданию трехмерной физической модели молекулы из подручных средств (из палочек и проволоки) .

Теперь стало возможным ввести кристаллографические данные любой макромолекулы в ЭВМ, затем изобразить молекулу в цвете и, поворачивая изображение, постепенно строить трехмерный образ структур или любых их частей под любым желаемым углом зрения [8]. Соответствующее программное обеспечение позволяет "очистить" внешнюю оболочку сложных молекул для выявления их внутреннего строения, которое может характеризоваться пустотами или включениями, и даже создавать образ молекулы изнутри.

Было показано, что поскольку структура макромолекул может искажаться при их близком взаимном расположении, то полагаться только на результаты кристалло-444

графии для определения возможных химически активных участков недостаточно -это может привести к ошибкам. Поэтому были разработаны программы, способные распознавать одиночные ковалентные связи с окрестности потенциально активного участка, поворачивать, вытягивать и изгибать эти связи при анализе полученных трехмерных образов активных участков [9]. Подобные исследования с поворотами и изгибами могут быть совмещены с подсчетом общей энергии связей в структуре, включающей активный участок, для определения наиболее вероятных очертаний (модели) активных областей [10].

Кроме того, специальные программы могут заменить одни фрагменты структуры на другие в исследуемых препаратах. Используя цветной графический дисплей, управляемый ЭВМ, исследователь может выделять небольшую часть цельной сложной молекулы, оперативно (работая в интерактивном режиме) заменять, например, существующую структурную составляющую на другой фрагмент какого-либо иного трехмерного изображения и повторять анализ препарата на химическую активность. Такой, основанный на использовании ЭВМ, подход не только позволяет очень быстро и досконально анализировать существующие структуры, но и в прямом смысле осуществлять истинно автоматизированное проектирование препаратов.

Доступные на сегодняшний день системы синтезирования лекарств, базирующиеся на мощной мини-ЭВМ и связанном с ней матричном процессоре, из-за недостаточной вычислительной мощности ограничивают возможность автоматизированного поиска потенциальных связей лекарства с рецепторами ткани, позволяя исследовать на вращение и изгиб не более четырех межатомных связей. В то же время, как было указано в [10], для существенного расширения сегодняшних возможностей требуется проверка 8-10, а иногда и большего числа связей. Анализ четырех связей, реализуемый в виде единого длинного группового задания, требует производительности около (10-12) X Х106 оп./с, в то время как анализ 10 связей может потребовать (40-50) -106 оп./с.

При обработке в реальном масштабе времени или близком к нему, как того хотят биохимики, эти вычисления будут требовать быстродействия от 5 до 50 • 106 оп./с.

Наконец, не снижается интерес к использованию ЭВМ для анализа математических моделей биологических процессов, включая прохождение газов и питательных веществ сквозь биологические мембраны, изучение свойств электрической проводимости нервных и мышечных волокон как функции локальной концентрации ионов в прилегающей среде [11]. Анализ механизма протекания крови через сосудистую систему, сердечную камеру и искусственные клапаны сердца посредством двумерного решения упрощенной

версии уравнений Навье-Сгокса для неньютоновских жидкостей (т.е. крови) был осуществлен за последнее десятилетие несколькими исследователями [12, 13]. Картины напряжений и деформаций на стенках сердечных камер также были исследованы с использованием метода конечных элементов, первоначально разработанных для оценки этих сил в сложных искусственно созданных системах, например крыльях самолета [14]. Вычислительная сложность многих из этих прикладных задач, особенно задач моделирования молекул и потока крови, столь велика, что они смогут загрузить самые мощные вычислительные ресурсы, доступные в настоящее время и ожидаемые в ближайшем будущем.

Резюмируя, можно сказать, что в настоящее время осуществляется несколько интересных и многообещающих биомедицинских исследований и проектов клинической диагностики, которые не только используют вычислительную технику, но и влияют на ход ее развития, стимулируя достижение таких уровней пропускной способности, при которых требуются нестандартные подходы к вычислениям и прогрессивные архитектурные решения. Лучшие подходы к достижению столь высоких характеристик производительности являются предметом обсуждения оставшейся части главы.


26.3. АРХИТЕКТУРНЫЕ РЕШЕНИЯ, НАПРАВЛЕННЫЕ НА УВЕЛИЧЕНИЕ ПРОПУСКНОЙ СПОСОБНОСТИ ПРОЦЕССОРА

Архитектурные методы повышения производительности вычислительных систем, предложенные за последние 15 лет, как правило, предполагают, что очень большое число отдельных логических элементов может быть объединено для получения очень высокой производительности процесса благодаря параллельному выполнению операций [15]. Значительные усилия были затрачены на нахождение общих методов распараллеливания алгоритмов обработки данных и сигналов, которые, в свою очередь, могли бы быть выполнены в различных параллельных системах или сетях взаимодействующих процессоров, а также в специализированных устройствах, сочетающих особенности этих классических структур. Как будет показано далее, эти попытки распараллелить архитектуру процессоров осуществлялись на практике при решении большинства задач обработки сигналов, особенно при реализации на СБИС. Однако их не всегда можно применить для этого подкласса прикладных задач обработки сигналов, который характеризуется очень широкой полосой частот входных данных в сочетании с требованием обработки в реальном масштабе времени.

По определению, вычислительные структуры типа ОКМД (с одним потоком команд и множеством потоков данных) объединяют множество идентичных процессоров, одновременно обрабатывающих параллельные потоки данных, выполняя одинаковую для всех процессоров команду в каждый такт. Команды могут быть переданы всем процессорам одновременно из единой памяти программ или могут быть заранее размещены в локальной памяти каждого процессора [16]. Эти структуры сравнительно легко проек-. тировать и создавать, поскольку все процессоры идентичны. Система в целом довольно проста для программирования и для тестирования. Однако в системах этой архитектуры предполагается существование параллельного потока данных; если процессорные элементы будут реал изо вываться в виде СБИС, то отдельные потоки данных должны характеризоваться весьма умеренной шириной полосы. Если ширина полосы входных данных высокая, становится необходимым разрабатывать подсистему предварительной обработки, достаточно быстродействующую для разделения единого высокоскоростного потока данных на множество более медленных подпотоков перед выдачей каждого из них на процессор с ОКМД-архитектурой. Естественно, удвоение, утроение и т.д. пропускной способности процессора ОКМД требует по крайней мере удвоения, утроения и т.д. общего числа логических элементов системы, что в крупных системах может стать ограничением даже при использовании СБИС. Кроме того, структуры ОКМД неприменимы для тех вычислительных задач, в которых возможна неодинаковая обработка всех потоков данных.

К вычислительным системам типа МКМД относятся системы, в которых несколько взаимодействующих между собой практически независимых процессоров оперируют с различными потоками команд и данных, которые могут существенно отличаться друг от друга [17, 18]. Индивидуальные подпрограммы для каждого независимого процессора обычно хранятся в его

локальной памяти. Как показывает опыт, разработка эффективных аппаратных и программных средств систем МКМД вызывает значительные трудности. Возможно, более важным, но не всегда учитываемым фактором является сложность организации эффективного управления вычислительным процессом в системе независимых взаимодействующих процессоров. При этом либо отдельные процессоры должны быть автономными, но с возможностью установления связи друг с другом, что требует больших затрат как аппаратуры, так и программного обеспечения [18], либо должно существовать некоторое центральное управляющее устройство, координирующее их работу. В последнем случае, как показала практика, весьма трудоемкой задачей является разработка глобального программного обеспечения. Известно несколько МКМД-структур, в которых эти трудности были преодолены, как говорится, "в лоб" или обойдены благодаря специализации системы на решение лишь узкого класса задач [19]; однако МКМД-системы далеко не всегда одинаково эффективны. Как подтверждают завершенные подобные проекты, их удовлетворительное решение в значительной степени обусловлено изобретательностью [20].

За исключением нескольких заслуживающих внимания проектов, системы взаимодействующих процессоров редко дают увеличение производительности в универсальных системах обработки данных или сигналов, равное произведению производительности одного процессора на число задействованных в данной задаче процессоров. В результате при разработке нескольких основных проектов отказались от использования большого числа параллельных процессоров как в ОКМД-, так и в МКМД-системах и использовали альтернативные подходы.

26.4. ПОЧЕМУ РЕШЕНИЕ ЗАДАЧ БОЛЬШОЙ ВЫЧИСЛИТЕЛЬНОЙ СЛОЖНОСТИ НЕ ВСЕГДА МОЖЕТ БЫТЬ ДОСТИГНУТО АРХИТЕКТУРНЫМ РЕШЕНИЕМ: АНАЛИЗ ОПЫТА

Задачи обработки биомедицинских изображений (сигналов), требующие быстродействия около нескольких миллиардов арифметических операций в секунду, изучались в нашей лаборатории с начала 1970-х годов. Для получения достоверных трехмерных рентгеновских (вычислительных) томограмм, принадлежащих к качественно новому поколению, нам понадобился динамический пространственный построитель (ДПП) - высокопроизводительный процессор изображения. В отличие от серийно выпускаемого оборудования рентгеновский AT, которое для создания изображения одного слоя накапливает необходимое число проекций в течение 5-20 с, ДПП за 11 мс накапливает данные для построения до 240 смежных слоев, окружающих цилиндрический участок ткани (например, грудной или брюшной полости) длиной 22 и диаметром 24 см [22, 23]. Поскольку процедура накопления входных данных может повторяться 60 раз в секунду, то с помощью сканирования, длящегося 10 с, производится достаточное число проекций для построения 150000 поперечных сечений, при этом интенсивность входного потока данных составит от 100 до 200 Мбайт/с. Преобразование и наглядное трехмерное отображение этих поперечных сечений приводит к по-

447



0 ... 70 71 72 73 74 75 76 ... 78