Малогабаритный высокопроизводительный вычислительный модуль на базе многопроцессорной системы-на-кристалле

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении масштабируемости и снижении энергопотребления вычислительной системы. Малогабаритный высокопроизводительный вычислительный модуль содержит микросхему высокопроизводительной гетерогенной многопроцессорной Системы-на-Кристалле (СнК), включающую шестнадцать высокопроизводительных процессорных ядер, содержащих управляющий RISC-процессор и по меньшей мере два сопроцессора, которые выполняют цифровую обработку данных, предварительно загруженных в память устройства, пять многоядерных процессоров, микросхему оперативного запоминающего устройства динамического типа, контроллеры внешней памяти, интерфейс с хост-процессором на базе PCIe и четыре высокоскоростных коммуникационных порта для связи с внешними процессорными системами, обеспечивающих распараллеливание вычислений, причем микросхема высокопроизводительной гетерогенной многопроцессорной СнК соединена двусторонней связью с микросхемой оперативного запоминающего устройства динамического типа, контроллерами внешней памяти, интерфейсом с хост-процессором на базе PCIe и четырьмя высокоскоростными коммуникационными портами. 1 ил.

 

Изобретение относится к области вычислительной техники и может найти применение в системах цифровой обработки сигналов и изображений, серверах обработки больших массивов данных, системах видеонаблюдения и машинного зрения, рабочих местах медицинского персонала, в которых применяются глубокие нейронные сети (ГНС).

В последнее время глубокие нейронные сети находят применение во многих отраслях промышленности. Для реализации математических алгоритмов, заложенных в ГНС, требуется высокопроизводительный вычислитель.

В основе такого вычислителя лежит многопроцессорная Система-на-Кристалле (СнК) с тензорными процессорными ядрами. Также необходимым аппаратным ресурсом для реализации ГНС является большой объём оперативной памяти, а также высокая пропускная способность шины обмена данными СнК – оперативная память.

Немаловажным параметром вычислительных модулей такого класса является такой показатель, как вычислительная способность по отношению к потребляемой мощности.

Ближайшим аналогом является вычислительный модуль TESLA V100 PCIe GPU ACCELERATOR фирмы nVidia (см., например, https://images.nvidia.com/content/tesla/pdf/Tesla-V100-PCIe-Product-Brief.pdf). Известный модуль выполнен в форм-факторе PCIe, содержит 32 процессора, контроллеры внешней памяти, разъём PCIe К недостаткам данного модуля можно отнести его избыточну вычислительную мощность и, как следствие, избыточное энергопотребление, отсутствие возможности использования нескольких модулей для решения совместных задач и, как следствие, отсутствие возможности масштабирования вычислительной мощности под конкретные задачи.

Технический результат предлагаемого изобретения заключается в обеспечении масштабируемости вычислительной системы и снижении энергопотребления.

Для достижения технического результата малогабаритный высокопроизводительный вычислительный модуль содержит микросхему высокопроизводительной гетерогенной многопроцессорной Системы-на-Кристалле (СнК), включающую шестнадцать высокопроизводительных процессорных ядер, содержащих управляющий RISC-процессор и, по меньшей мере, два сопроцессора, которые выполняют цифровую обработку данных, предварительно загруженных в память устройства, пять многоядерных процессоров, микросхему оперативного запоминающего устройства динамического типа, контроллеры внешней памяти, интерфейс с хост-процессором на базе PCIe и четыре высокоскоростных коммуникационных порта для связи с внешними процессорными системами, обеспечивающих распараллеливание вычислений.

За счет наличия высокоскоростных коммуникационных портов для связи с внешними процессорными системами, обеспечивающих распараллеливание вычислений, обеспечивается масштабируемость вычислительной системы под конкретные задачи и снижение энергопотребления.

На фиг. 1 представлена упрощенная функциональная схема модуля.

Модуль предназначен для использования в качестве универсальной аппаратно-программной платформы для приёма, обработки, хранения и передачи больших потоков данных сигнальной информации в режиме реального времени в составе встраиваемой вычислительной техники и специализированных высокопроизводительных систем, а также для построения широкого класса систем цифровой обработки сигналов и машинного зрения.

Модуль может быть применён в таких областях как:

нейронные сети и искусственный интеллект;

телекоммуникационные и связные системы;

робототехнические системы;

суперкомпьютеры и серверы;

радиотехнические системы различного назначения;

системы автоматизации процессов в социальной и производственных сферах деятельности в различных областях народного хозяйства.

Малогабаритный высокопроизводительный вычислительный модуль на базе многопроцессорной микросхемы интегральной класса «Система-на-Кристалле» (СнК) представляет собой гетерогенную многопроцессорную систему на кристалле, в состав которой входят 16 процессорных ядер NeuroMatrix Core 4 и пять ядер ARM Cortex-A5, пять контроллеров внешней памяти типа DDR3, интерфейс с хост-процессором на базе PCIe Rev. 2.0 и четыре высокоскоростных коммуникационных порта для связи с внешними процессорными системами. Модуль выполнен в форм-факторе PCIe, имеет разъём PCIe х4 и занимает один слот расширения на материнской плате персонального компьютера или сервера.

Модуль представляет собой высокопроизводительное вычислительное устройство, выполненное в форм-факторе PCIe.

Модуль содержит:

интерфейс PCIe x4 Rev. 2.0;

интерфейс внешних полнодуплексных высокоскоростных коммуникационных портов для межмодульного обмена;

интерфейс Ethernet со скоростью передачи данных 100 Мбит/с с поддержкой протокола EDCL;

5 ГБ памяти DDR3L;

последовательный интерфейс SPI;

40 выводов GPIO.

Предлагаемое устройство обеспечивает:

номинальные напряжения питания: 12 В и 3,3 В;

типовую потребляемую мощность от 10 до 12 Вт;

максимальную потребляемую мощность не выше 25 Вт;

защиту от кратковременного перенапряжения;

защиту от короткого замыкания.

Конструктивно Модуль выполнен из следующих основных составных частей:

печатная плата с установленными элементами поверхностного и сквозного монтажа;

радиатор;

панель;

вентилятор.

Основными функциональными элементами Модуля являются:

микросхема высокопроизводительной гетерогенной многопроцессорной СнК;

микросхемы оперативного запоминающего устройства динамического типа (DDR3L SDRAM).

СнК отвечает за первоначальную загрузку модуля, цифровую обработку сигналов и интерфейс с внешними периферийными устройствами.

Энергозависимые микросхемы оперативного запоминающего устройства динамического типа DDR3L SDRAM отвечают за хранение данных обрабатываемых СнК во время работы Модуля.

Для обеспечения информационного взаимодействия с внешними устройствами в Модуле предусмотрены соединители.

СнК имеет пять универсальных блоков интерфейсов общего назначения (GPIO), доступные для взаимодействия с внешними устройствами, выведены на соединитель X5. Пользовательские выводы общего назначения GPIO.

Контроллер интерфейса SPI обеспечивает обмен информацией между СнК и устройствами, подключенными к последовательному интерфейсу SPI. Контроллер SPI обеспечивает подключение до четырёх устройств в режиме разделения времени. Последовательный интерфейс SPI обеспечивает максимальную скорость передачи данных не более 50 Мб/с.

Цепь EXT_RESET предназначена для использования в качестве сигнала внешнего сброса.

При работе в составе системного блока ПК внешний тактовый сигнал 100 МГц поступает с материнской платы на входной буфер, обеспечивающий тактовыми опорными сигналами блок PCIe и блоки коммуникационных портов СнК.

В СнК реализована аппаратная функция EDCL (Ethernet Debug Communications Link), встроенная в контроллер Ethernet, которая позволяет писать и читать физическую память, отправляя правильно сформированные Ethernet пакеты.

Соединитель X5, содержащий интерфейсы внешних высокоскоростных коммуникационных портов, обеспечивает дуплексную передачу типа точка-точка. Все физические интерфейсы синхронизированы от единого тактового сигнала 100 МГц, идущего с материнской платы ПК.

В составе одного ПК могут быть установлены от 2 до 5 Модулей. Для безопасной и надежной работы в этом случае необходимо обеспечить дополнительное охлаждение Модулей путем использования вспомогательной активной или пассивной систем охлаждения.

Масштабируемый интерфейс внешних высокоскоростных коммуникационных портов обеспечивает одновременное использование мощности двух и более Модулей для решения общей задачи. Для этого могут применятся различные схемы межмодульного обмена:

- топология кольцо (ring)

- топология звезда (star)

- топология шлейфового подключения (daisy chain).

Таким образом обеспечивается масштабируемое использование необходимого числа Модулей в каждом конкретном случае, исходя из предпологаемой вычислительной сложности, ограничений потребляемой электроэнергии, возможности использования удаленных Модулей одного или нескольких серверов.

Малогабаритный высокопроизводительный вычислительный модуль, содержащий микросхему высокопроизводительной гетерогенной многопроцессорной Системы-на-Кристалле (СнК), включающую шестнадцать высокопроизводительных процессорных ядер, содержащих управляющий RISC-процессор и по меньшей мере два сопроцессора, которые выполняют цифровую обработку данных, предварительно загруженных в память устройства, пять многоядерных процессоров, микросхему оперативного запоминающего устройства динамического типа, контроллеры внешней памяти, интерфейс с хост-процессором на базе PCIe и четыре высокоскоростных коммуникационных порта для связи с внешними процессорными системами, обеспечивающих распараллеливание вычислений, причем микросхема высокопроизводительной гетерогенной многопроцессорной СнК соединена двусторонней связью с микросхемой оперативного запоминающего устройства динамического типа, контроллерами внешней памяти, интерфейсом с хост-процессором на базе PCIe и четырьмя высокоскоростными коммуникационными портами.



 

Похожие патенты:

Изобретение относится к области вычислительной техники. Технический результат заключается в снижении вычислительной нагрузки с одновременным повышением производительности вычислительного устройства.

Изобретение относится к области вычислительной техники, в частности к системам управления тестированием. Технический результат заключается в повышении качества тестирования программного обеспечения.

Изобретение относится к области вычислительной техники для обновления программного обеспечения холодильника в производственной линии. Технический результат заключается в обеспечении возможности удаленного автоматического обновления встроенного программного обеспечения собранного холодильника.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении активной основной физической среды и телефонной линии параллельно с другой активной виртуальной средой и телефонной линией.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении активной основной физической среды и телефонной линии параллельно с другой активной виртуальной средой и телефонной линией.

Изобретение относится к области электроники, а именно к средствам дистанционного управления бытовыми электронными аппаратами. Технический результат заключается в расширении функциональных возможностей пульта дистанционного управления, заключающихся в обеспечении автоматического отключения повторяющегося звука на управляемом электронном аппарате.

Изобретение относится к технологии Интернет вещей ("IoT"), которая является применимой при инициализации IoT-устройств автоматическим способом без ручных действий. Технический результат заключается в обеспечении возможности автоматического обновления микропрограммного обеспечения, принятого из IoT-концентратора, без необходимости привязки к пользователю.

Настоящее техническое решение относится к области вычислительной техники. Технический результат заключается в ускорении процесса по подготовке к проведению исследований, а также внесении корректировок в систему управления без отрыва от процесса проведения исследований и испытаний.

Изобретение относится к области вычислительной техники и телекоммуникационным системам. Технический результат заключается в повышении степени адекватности модели процесса функционирования телекоммуникационной сети на основе технической реализации дополнительных информационных каналов.

Изобретение относится к области компьютерной безопасности, в частности к способу запуска гипервизора в компьютерной системе, защищаемой от несанкционированного доступа к информации, на ранней стадии загрузки компьютера. Технический результат заключается в повышении безопасности компьютера.

Изобретение относится к автоматике и вычислительной технике и может быть использовано в системах автоматизированного контроля и управления технологическим процессом атомных электростанций и других промышленных объектов. Техническим результатом изобретения является повышение надежности комплекса автоматизации.
Наверх