Preview

Вопросы радиоэлектроники

Расширенный поиск
№ 2 (2018)
Скачать выпуск PDF

ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ НА БАЗЕ МНОГОЯДЕРНЫХ МИКРОПРОЦЕССОРОВ

6-13 17
Аннотация
Обсуждаются вопросы построения суперкомпьютеров экзафлопсной производительности на аппаратно-программной платформе «Эльбрус». Рассматриваются аспекты выбора микропроцессоров для получения высокого показателя соотношения производительности и потребляемой мощности. Оценивается эффективность использования микропроцессоров с различными архитектурами для получения высокой производительности на реальных задачах. Эти вопросы сегодня являются актуальными в контексте задачи достижения лидерства в высокотехнологичном производстве, на которое опирается цифровая экономика. Рассматриваются аспекты выбора архитектуры микропроцессоров для получения высокого показателя соотношения производительности и потребляемой мощности. Отмечено, что графические и векторные процессоры, обеспечивающие получение высоких значений пиковой производительности на синтетических тестах, проигрывают универсальным микропроцессорам на тесте HPCG, который более разносторонним образом тестирует производительность аппаратуры. Оценивается эффективность использования микропроцессоров с архитектурой «Эльбрус» для получения высокой производительности на реальных задачах. Показано, что микропроцессоры «Эльбрус» имеют большой потенциал для увеличения производительности.
14-22 49
Аннотация
Проведена проверка поддержки аппаратного и программного обеспечения в вычислительных комплексах платформы «Эльбрус». Основное внимание уделено ранее не исследованному использованию данных комплексов в широком круге применений с расчетом на возможность замещения вычислительных машин общего назначения, таких как серверы, рабочие станции и домашние компьютеры, что актуально для создания широкой системы поддержки и распространения отечественной вычислительной техники. С целью этого рассмотрен набор программного и аппаратного обеспечения, характерного для данных систем, разбитый на несколько подсистем: вычислительную, графическую, сетевую, дисковую и т.п. Выявлен ряд проблем, предложены пути решения некоторых из них, а также дальнейшие действия по развитию вычислительных систем платформы «Эльбрус» и улучшению их совместимости с программным и аппаратным обеспечением.
23-31 16
Аннотация
Пока закон Мура позволяет регулярно наращивать количество ядер, многоядерные микропроцессоры целесообразно делать с распределенным общим кэшем. Их разработка в основном сводится к проектированию подсистемы памяти. С увеличением количества ядер поддержание производительности подсистемы памяти (пропускной способности, времени доступа, качества обслуживания) таких процессоров на необходимом уровне сопряжено с рядом проблем. В статье рассмотрены основные из них, такие как оптимизация времени доступа в распределенный общий кэш, его ассоциативность и разбиение, поддержка когерентности (кодирование и обновление справочника) и архитектура сети соединений на кристалле. Для всех рассмотренных проблем приведены некоторые существующие методы их решения. Анализ и эксперименты позволяют оценить предел эффективной масштабируемости таких процессоров при решении данных проблем рассмотренными методами порядком тысячи ядер.

АРХИТЕКТУРА И МИКРОАРХИТЕКТУРА МИКРОПРОЦЕССОРОВ

32-39 23
Аннотация
Кэш-память играет важную роль в универсальных микропроцессорах, позволяя уменьшить время доступа к данным и число обращений в оперативную память. Ее объем в современных микропроцессорах достигает сотен мегабайт, основными ограничивающими факторами являются площадь и рассеиваемая мощность. Аппаратное сжатие (компрессия) данных в кэш-памяти может увеличить ее эффективный объем при неизменных физических параметрах, но оно до сих пор не имеет широкого применения в серийных микропроцессорах. Данная работа является первым исследованием в области аппаратного сжатия данных в кэш-памяти микропроцессоров с архитектурой «Эльбрус». Для аппаратной реализации были выбраны алгоритмы ZCA, Base+Delta и Base-Delta-Immediate, которые обладают малой по сравнению с другими алгоритмами задержкой декомпрессии и достаточно высокой степенью сжатия. Схемы компрессии были протестированы в кэш-памяти третьего уровня модифицированного прототипа микропроцессора «Эльбрус-8С2». В статье приведены результаты измерений доли сжатых кэш-строк и степени сжатия на задачах из пакета SPEC CPU2000. Алгоритм Base-Delta-Immediate обеспечил наибольшую степень сжатия среди тестируемых алгоритмов (примерно 1,43 для целочисленных задач и 1,30 для задач с плавающей точкой). Полученные результаты позволяют сделать вывод о практической применимости алгоритма компрессии Base-Delta-Immediate для повышения эффективного объема кэш-памяти.
40-44 20
Аннотация
В современных многоядерных микропроцессорах реализуется архитектурная поддержка виртуализации аппаратных ресурсов, с целью уменьшения накладных расходов. В отличие от процессорного ядра успешные реализации аппаратной поддержки виртуализации компонентов ввода-вывода появились относительно недавно. Одним из механизмов, для которых аппаратная поддержка виртуализации целесообразна, является доставка гостевого прерывания целевому виртуальному ядру без привлечения гипервизора. В статье представлен обзор архитектуры распределенного контроллера прерываний микропроцессора «Эльбрус», а также приведены основные принципы реализации аппаратной поддержки системы прерываний. Предложено ввести гостевой набор управляющих регистров контроллера прерываний, приведен алгоритм доставки гостевых прерываний с использованием аппаратной таблицы соответствия виртуальных и физических ядер. Описаны механизмы, обеспечивающие корректность работы рассматриваемого подхода к реализации аппаратной поддержки виртуализации системы прерываний в рамках четырехпроцессорной системы.

СИСТЕМЫ ПРОГРАММИРОВАНИЯ

45-50 19
Аннотация
Механизм исключений является важной частью крупных приложений, написанных на языках высокого уровня, таких как C++, поэтому имеется острая необходимость в их эффективной реализации. В данной работе рассматривается подход к обработке исключений, называемый zero cost exceptions handling, позволяющий минимизировать накладные расходы на обработку исключений в пользовательском приложении. Это достигается благодаря локализации вспомогательного кода, требуемого для обработки исключений, в специальные участки, называемые landing pad. Дано подробное описание реализации данного механизма, показывающее, за счет чего происходит минимизация накладных расходов. Дается краткий обзор альтернативного подхода к обработке исключений (механизм setjmp/longjmp), используемого в предыдущей версии компилятора и основанного на использовании функций из стандартной библиотеки языка C - setjmp, longjmp. Описаны нововведения и доработки со стороны компилятора и оптимизирующих фаз, необходимые для реализации рассматриваемого механизма. Приведены результаты сравнения производительности, подтверждающие преимущество механизма zero cost exceptions handling по сравнению с механизмом setjmp/longjmp.
51-54 29
Аннотация
Производительность современных научных приложений во многом определяется эффективностью исполнения вычислительных циклов. Поэтому оптимизация таких циклов является одной из наиболее острых задач оптимизирующей компиляции. Особенно это характерно для архитектур со статическим планированием кода, в частности для архитектуры «Эльбрус». В данной работе рассмотрена оптимизация, называемая Array Access, которая позволяет снизить количество операций, необходимых для вычисления адреса при регулярном обращении к элементам массивов, и за счет этого добиться более эффективного планирования цикла с точки зрения аппаратных ресурсов. Подробно описаны алгоритм работы оптимизации и аппаратные средства архитектуры «Эльбрус», на которых она основана. Также приведены результаты экспериментальных замеров производительности на задачах пакета SPEC CPU2006, подтверждающие эффективность оптимизации.
55-58 11
Аннотация
Описывается понятие дистрибутива и кросс-сборки программного обеспечения для формирования целевой системы под аппаратную платформу, отличающуюся от той, где производится компиляция. Рассматриваются основные проблемы сборки и портирования пакетов дистрибутива семейства Debian на аппаратную платформу «Эльбрус». Ставится проблема портирования ограниченным количеством разработчиков дистрибутива, развиваемого для остальных архитектур крупными группами и множеством энтузиастов. Предложены методы и средства устранения типичных ошибок и особенности реализации системы кросс-компиляции. Подробно изложены пути автоматизированного разрешения простых, сложных, а также кольцевых зависимостей. Описывается процесс автоматизации сборки, повышающий эффективность пополнения дистрибутива новыми пакетами. Реализация для системы кросс-сборки может быть использована разработчиками для пополнения пакетной базы и формирования полноценного дистрибутива на аппаратную платформу «Эльбрус».
59-64 27
Аннотация
Двоичная трансляция - исполнение кода, скомпилированного под одну архитектуру, на процессорах другой архитектуры. В целях расширения области применения процессоров «Эльбрус» применяется двоичная трансляция с архитектуры x86, так как она является наиболее распространенной и под нее написано огромное количество ПО. Вещественная арифметика является отдельным подмножеством системы команд x86 и имеет некоторые особенности, затрудняющие ее эффективную двоичную трансляцию на процессорах «Эльбрус». В статье рассматриваются эти особенности и проблемы, к которым они приводят в контексте двоичной трансляции. Приводятся основные особенности архитектуры «Эльбрус», описывается многоуровневая схема двоичного транслятора. Рассматриваются последовательные этапы развития аппаратной поддержки двоичной трансляции вещественной арифметики и то, как они повлияли на эффективность генерируемого кода третьего уровня двоичного транслятора. В результате была разработана схема, которая позволила избавиться от большей части проблем и сделала эффективность трансляции вещественной арифметики сопоставимой с таковой для целочисленной.

ОПЕРАЦИОННЫЕ СИСТЕМЫ

65-68 22
Аннотация
Для защиты сегментов сети или отдельных узлов от несанкционированного доступа применяются средства межсетевого экранирования. Межсетевой экран - комплекс программных и/или аппаратных средств, осуществляющих фильтрацию сетевых пакетов на основе заданных правил. В операционной системе «Эльбрус» всем сетевым пакетам назначаются мандатные атрибуты (метки) безопасности, обеспечивающие разграничение доступа локальных процессов к ресурсам операционной системы. Для повышения степени защищенности при межсетевом взаимодействии необходимо обеспечить поддержку мандатных атрибутов при создании правил фильтрации. В статье подробно рассмотрено устройство межсетевого экрана Netfilter, применяемого в операционной системе «Эльбрус». Описана реализованная схема фильтрации входящих, исходящих и транзитных сетевых пакетов на основе их мандатных атрибутов безопасности. Приведен пример построения правил фильтрации.

ВЕРИФИКАЦИЯ И ТЕСТИРОВАНИЕ

69-75 20
Аннотация
В процессе разработки вычислительных систем и сопутствующего им программного обеспечения возникают потребности в программных моделях процессоров разной степени детализации и быстродействия. Быстроту моделирования обеспечивают функциональные модели, высокую детализацию - потактовые. Одновременная разработка функционального и потактового симуляторов является трудоемкой задачей. В данной работе рассматривается задача снижения сложности разработки и поддержки программных моделей разного уровня точности для микропроцессоров архитектур широкого командного слова. В качестве решения предлагается построение одной программной модели, способной работать в качестве как функционального, так и потактового симулятора. На примере архитектуры «Эльбрус» описывается способ построения такой модели, основанный на постепенном расширении и уточнении функционального симулятора до возможности потактового моделирования и на полуавтоматическом упрощении получившейся потактовой модели до функциональной. Производительность получившейся функциональной модели не уступает оригинальной, замедление потактовой модели относительно функциональной оценивается в пределах 10-15 раз.
76-80 13
Аннотация
Существует практическая необходимость интеграции отдельных решений для системной логической верификации микропроцессоров. В статье представлен подход, позволяющий формировать системные тесты из отдельных подтестов путем распараллеливания их исполнения на разных вычислительных ядрах верифицируемого многоядерного микропроцессора. При этом распределение доступных системных ресурсов осуществляется статически на основе заранее сформированных ресурсных требований подтестов. Полученные значения ресурсных параметров передаются в подтесты на стадии компоновки системного теста. Программная среда исполнения при запуске моделирования осуществляет инициализацию системных ресурсов и передает управление подтестам. В статье описаны структура программного комплекса, реализующего представленный подход, алгоритм формирования системного теста и используемый для этого инструментарий. Приведены основные сценарии применения на примере маршрута логической верификации микропроцессора «Эльбрус-8C2».
81-86 23
Аннотация
Рассмотрены вопросы автономной верификации контроллеров сопряжения интерфейсов, участвующих в передаче и преобразовании потока данных в современных микропроцессорных системах. Для корректного функционирования системы такие преобразования должны проходить быстро и без потерь. Точность функционирования контроллера подтверждается при проведении верификации. Приведена классификация методов верификации модулей микропроцессорных систем. Описан подход к построению автономного тестового окружения для контроллеров сопряжения интерфейсов при помощи методологии UVM. Обоснован выбор проверяющего модуля тестового окружения. Рассмотрены основные особенности автономной верификации аппаратных контроллеров сопряжения с использованием функциональных эталонных моделей, позволяющих проводить комплексную проверку этих устройств. Описаны сложности, возникшие в процессе разработки тестовой системы на основе методологии UVM, и способы их разрешения. Приведены результаты применения таких решений при верификации контроллеров микропроцессоров и дальнейший план наращивания тестовой системы.
87-92 15
Аннотация
В современных вычислительных средствах семейства «Эльбрус» используются высокоскоростные каналы передачи данных - каналы памяти DDR3, каналы межпроцессорного взаимодействия и ввода-вывода, построенные на базе PCI Express. Их физические уровни имеют большое число настроек, таких как номинал терминирующего резистора, preemphasis и equalization, амплитуда выходного сигнала и т.д. Все они влияют на работоспособность канала и целостность сигналов. Для повышения отказоустойчивости вычислительного комплекса требуется найти наиболее оптимальный вариант настройки для физического уровня высокоскоростных каналов. Ввиду большого количества возможных настроек необходимо иметь возможность произвести оценку за наименьшее время и с минимальным количеством дополнительного оборудования. Авторы данной статьи разработали методику определения качества настроек, использующую внутренние механизмы физического уровня каналов.

ПРОТОТИПИРОВАНИЕ

93-98 15
Аннотация
Специализированное прототипирование является комплексной многоуровневой задачей с критически малым, как правило, временем на ее решение. Применение стандартных конструктивных решений для реализации прототипов многоядерных микропроцессоров не позволяет создавать эффективное оборудование. В статье рассматриваются рассчитанные на стандартизацию принципы и детали конструктивного исполнения основных функциональных компонентов, входящих в состав масштабируемых систем эмуляции (прототипов) нового поколения микропроцессоров семейства «Эльбрус». Заложенные в ней возможности должны обеспечить повторное использование ранее созданной аппаратуры и автоматизацию процессов подготовки прототипов к эксплуатации. Это может существенно увеличить время, непосредственно затрачиваемое на верификацию. По мнению автора, ряд решений этого проекта может быть взят в качестве стандарта при построении матричных масштабируемых систем эмуляции.

РОБОТОТЕХНИКА

99-105 19
Аннотация

При разработке современных автономных наземных робототехнических комплексов одной из главных задач является создание интеллектуальной системы управления. Существенным, но не решенным вопросом является оснащение таких систем управления вычислительной техникой, созданной на базе отечественных микропроцессоров, и программным обеспечением отечественной разработки. Цель работы – исследовать применимость вычислительных средств на базе многоядерных микропроцессоров «Эльбрус» для решения задач компьютерного зрения в таких интеллектуальных системах. Авторами были исследованы алгоритмы распознавания и работы системы стереозрения и разработаны программные средства, моделирующие данные алгоритмы с учетом особенностей микропроцессоров «Эльбрус». Получены временные характеристики для алгоритмов стереореконструкции и калибровки. Показано, что вычислительные комплексы на базе микропроцессоров «Эльбрус» могут удовлетворять требованиям, выдвигаемым к системам управления современными робототехническими комплексами.

РАДИОЭЛЕКТРОНИКА – МЕДИЦИНЕ

106-111 14
Аннотация
Предложена методика определения точностных характеристик видеоокулографов, и реализована экспериментальная установка на основе имитатора глаза человека. Обоснована целесообразность применения предлагаемой методики при оценке прецизионности и порога чувствительности (разрешения видеоокулографов), а также определены границы ее применимости. Показано, что основным преимуществом использования имитатора глаза для оценки точностных характеристик видеоокулографов является тот факт, что фиксированные угловые положения можно задавать многократно с большой точностью. При помощи разработанной установки произведено исследование характеристик прототипа носимого видеоокулографа, и определены его прецизионность и порог чувствительности. Результаты настоящего исследования демонстрируют, что разработанная экспериментальная установка может быть полезной для оценки характеристик видеоокулографов в промышленных и исследовательских приложениях.
112-119 30
Аннотация
Приведен подход к реализации системы, позволяющей получать поток преобразованных видеоизображений с помощью локальных методов цифровой обработки, с минимальными затратами на построение такой системы. Даны анализ возможных для реализации алгоритмов и структура решения. В результате получен аппаратный модуль обработки видеоизображений, реализованный на одной программируемой логической интегральной схеме, позволяющий изменять свою внутреннюю конфигурацию в режиме реального времени. Выходное изображение с блока имеет задержку, обусловленную хранением четырех строк исходного изображения. Полученный аппаратный модуль имеет низкое энергопотребление, что позволяет использовать его в носимых устройствах. Благодаря гибкой функциональной структуре блока возможно его применение для построения более сложной цепочки анализа изображений. Приведены результаты обработки видеопотока на различных этапах алгоритма детектирования границ.
120-127 14
Аннотация
Представлен спектральный анализ электрокардиографических (ЭКГ) сигналов, связанных с нарушениями сердечного ритма и возникновением в работе сердца некоторых аритмий. Спектрограммы проанализированы для десятисекундных и минутных временных записей. Все расчеты выполнены в среде Maple 5v4. В зависимости от степени развития патологии различные ЭКГ сравниваются с так называемыми «стандартными», полученными от здоровых пациентов. На качественном уровне отмечаются отличия в выраженности степени «упорядоченности» или «разупорядоченности» отдельных спектральных частот. То же самое отмечается и для спектра в целом. В итоге разупорядоченность в спектре может свидетельствовать о возникновении патологии в работе сердца.
128-135 13
Аннотация
Одним из важнейших параметров имитатора электрической активности головного мозга человека является нижняя граница его динамического диапазона. Так, для имитации вызванных потенциалов амплитуда сигнала должна быть в диапазоне 1-5 мкВ. Минимальная амплитуда сигнала, которую может выдать генератор сверхмалых напряжений, ограничена уровнем его шума. В данной работе проведена оценка уровня шума электронной схемы подобного генератора. Внутренний шум схемы в области малых частот (0,1-30 Гц) имеет величину около 3,5 мкВ «пик-пик», что подтверждается экспериментально. Основным источником шумов генератора сверхмалого напряжения является 1/f шум ЦАП, который зависит от качества изготовления кристалла. Достигнутый уровень шума позволяет осуществлять имитацию электрической активности головного мозга человека сигналом амплитудой 11 мкВ при соотношении сигнал/шум 10 дБ.

СИСТЕМЫ УПРАВЛЕНИЯ

136-143 18
Аннотация
Рассматриваются перспективные разработки ПАО «ИНЭУМ им. И. С. Брука» на отечественной элементной базе для промышленных применений. Характеристики современных процессоров серии «Эльбрус» удовлетворяют требованиям построения на их базе электроники для применения в автоматизированных системах управления технологическими процессами (АСУТП). Представлены основные разработки, выполняемые на текущий момент, такие как промышленные компьютеры, программируемые логические контроллеры, средства программирования на языках стандарта МЭК 61131-3. Впервые выпускается линейка безвентиляторных промышленных компьютеров на базе отечественного микропроцессора «Эльбрус-1С+». Разрабатываются защищенные промышленные компьютеры, предназначенные для тяжелых условий эксплуатации. Важным фактором является ориентация оборудования на гражданский рынок, что становится возможным с учетом снижения стоимости микропроцессора. Описывается разработка программируемого логического контроллера (ПЛК), построенного на базе микропроцессора «Эльбрус-1С+». Разрабатываемый ПЛК сочетает в себе наиболее востребованные на данный момент функции, такие как резервирование, горячая замена компонентов, задел для безударной корректировки прикладного ПО. Вместе с процессорным модулем ПЛК разрабатывается также линейка модулей ввода-вывода, предназначенных для подключения датчиков и исполнительных механизмов. Модули строятся на базе отечественного микроконтроллера «Миландр». Впервые ПЛК создаются на отечественной электроннокомпонентной базе без применения зарубежной интеллектуальной электроники. Эти разработки позволяют сделать серьезный шаг в направлении импортозамещения в области электроники для АСУТП.
144-150 10
Аннотация
Применение вычислительных систем с большим количеством процессорных ядер ставит ряд задач по рациональному распределению задач на соответствующие вычислители. В работе приводится метод вероятностного анализа загрузки вычислительных систем при заданном потоке данных. Представлены результаты исследования характеристик потоков данных, обслуживаемых вычислительными системами, на основе применения технологий виртуализации. Особенность метода в том, что данные описываются как нестационарные и неоднородные случайные потоки. Осуществлен анализ сетевого трафика. Дана оценка влияния варианта распределения аппаратных ресурсов вычислительной системы между гостевыми виртуальными машинами, а также режимов обработки требований, поступающих в систему, на ее производительность. Приведены результаты экспериментов по оценке характеристик конфигураций виртуальных машин. Дан анализ условий и факторов, оказывающих непосредственное влияние на результативность процесса функционирования вычислительной системы.
151-158 12
Аннотация
Предлагается метод организации сетевой коммуникации устройств, присутствующих в повседневной жизни человека. Для связи устройств используется протокол CoAP, предназначенный для обмена сообщениями между устройствами с ограниченными ресурсами в целях экономии потребляемой электроэнергии. Подобная сеть призвана эффективно и экономично способствовать повышению качества жизни людей. Механизм работы предлагаемого метода рассматривается на примере носимого дисплея дополненной реальности, который устанавливает соединение с компьютером по выводимому на монитор изображению идентификационного QR-кода. В результате дисплей получает возможность передать управление курсором мыши на мониторе компьютера пользователя встроенному айтрекеру. Организуемая сеть демонстрирует высокую производительность, адаптивность к изменениям и модификациям, а также поддерживает автоматическое обновление программного обеспечения для всех элементов системы.


ISSN 2218-5453 (Print)
ISSN 2686-7680 (Online)