Устройство для умножения матриц

Авторы патента:

G06F17/16 - матричные или векторные вычисления

Изобретение относится к области вычислительной техники и может быть использовано в специализированных вычислительных машинах и устройствах обработки сигналов для перемножения (n n)-матриц. Цель изобретения - сокращение аппаратурных затрат. Поставленная цель достигается тем, что устройство содержит m вычислительных моделей первого типа, и вычислительный модуль второго типа, причем каждый вычислительный модуль первого типа содержит умножитель, сумматор, две группы регистров, два триггера, две группы элементов И, группу элементов ИЛИ, элемент НЕ и элемент И, а вычислительный модуль второго типа содержит сумматор, группу регистров, группу элементов И и триггер. В основу работы устройства положена параллельно-поточная организация вычислений. Перемножение (n n) - матриц осуществляется с помощью фиксированного числа m вычислительных модулей (m < n). 4 ил., 1 табл.

Изобретение относится к области вычислительной техники и может быть использовано в специализированных вычислительных машинах и устройствах обработки сигналов для перемножения двух (nxn) матриц. Цель изобретения сокращение аппаратурных затрат. На фиг.1 представлена структурная схема устройства для перемножения двух (nxn) матриц; на фиг.2 структурная схема устройства для n 3; на фиг.3 схема вычислительного модуля первого типа; на фиг.4 схема вычислительного модуля второго типа. Устройство для перемножения двух (nxn) матриц (фиг.1) содержит первый 1, второй 2 и третий 3 информационные входы, первый 4, второй 5 и третий 6 настроечные входы, синхровходов 7, вычислительные модули первого типа 8i (i 1, m), вычислительный модуль второго типа 9 и выход 10. Вычислительный модуль 8 первого типа (фиг.3), содержит первый 11, второй 12 и третий 13 информационные входы, первый 14 и второй 15 настроечные входы, синхровход 16, умножитель 17, сумматор 18, регистры 19i (i 1, n-1), 20i (i 1,n), 21, 22, 23 и 24, триггеры 25 и 26, группы элементов И 27 и 28, группу элементов ИЛИ 29, элемент И 30, элемент НЕ 31, первый 32, второй 33 и третий 34 информационные выходы, первый 35 и второй 36 настроечные выходы. Вычислительный модуль 9 второго типа (фиг.4) содержит информационный вход 37, настроечный вход 38, синхровход 39, сумматор 40, регистры 41i (i 1, n²+1), триггер 42, группу элементов И 43 и выход 44. В основу работы устройства положен следующий алгоритм. Пусть требуется перемножить две матрицы Aaik} и Bbkj} результатом перемножения которых является матрица С А, Вcij} i, j, k . Обозначим P n/m, где n/m ближайшее целое сверху, m некоторое выбранное число, K n/m. Будем считать, что в матрицах А и В соответственно К столбцов и К строк (1 k K). Если K n, то следует добавить соответствующее число нулевых строк и столбцов, чтобы выполнилось равенство К n. Элементы матрицы С вычисляются по следующим выражениям: C_ij=S_ijq; =b_kj, 1 i,j n, 1 q P, которые определяются рекуррентными соотношениями: 1 i,j n 1 q P; S^((q-1)m)ijq 0; (q-1)m+1 k q m; S^(k)ijq S^(k-1)ijq+aik bkj. Sijq S(q m)ijq; C⁽¹⁾ⁱj Sij1; 2 q P; C^(q)ij C^(q-1)ij+Sijq. Cij Cij(P). Рассмотрим работу вычислительных модулей. Вычислительный модуль 8 первого типа (фиг.3) работает в четырех режимах. Режим работы задается управляющими сигналами и подаваемыми соответственно на настроечные входы 14 и 15. Во всех четырех режимах вычислительный модуль 8 наполняет общие следующие операции. Элемент а, подаваемый на вход 13, задерживается регистрами 19 на n-1 тактов и выдается на выход 34. Элемент b, подаваемый на вход 11, задерживается регистрами 21 и 33 на два такта и выдается на выход 32. На выходе сумматора 18 формируется значение c' c+a b, где c' и a b значения, подаваемые на входы сумматора 18, соответственно с выходов регистра 24 и умножителя 17. В первом режиме подаются управляющие сигналы (1.1). При этом группа элементов И 27 открыта, группа элементов И 28 закрыта, элемент И 30 открыт и в регистры 20₁ и 21 записываются соответственно элементы a и b. Во втором режиме подаются управляющие сигналы ( ) (1.0). Группа элементов И 27 открыта и в регистр 20₁ записывается элемент а. В регистре 23 хранится ранее записанный элемент b. В третьем режиме подаются управляющие сигналы ( ) (0.1). Элемент И 30 открыт и B регистр 23 записывается элемент b. В регистрах 20_i(i=) информация переписывается из 20i-го регистра в 20i+1-й регистр. В четвертом режиме подаются управляющие сигналы ( ) (0.0). В этом режиме в регистре 23 хранится ранее записанный элемент 8 и в регистрах 20_i(i= ) информация переписывается из 20_i-го регистра в 20_i+1-й регистр. Вычислительный модуль 9 второго типа (фиг.4) работает следующим образом. На вход 37 последовательно подаются значения C_i (i 1,2.), которые записываются в регистр 41₁. При нахождении триггера 42 в нулевом состоянии, группа элементов И 43 закрыта, на первый вход сумматора 40 подается элемент С_i, а на второй вход нулевое значение, на выходе сумматора 40 формируется значение элемент C_i, которое записывается в регистр 412. Таким образом, при нахождении триггера 42 в нулевом состоянии происходит последовательная запись элементов C_i в соответствующие регистры 41. При установлении триггера 42 в единичное состояние, группа элементов И 43 открыта, через которую на первый вход сумматора 40 подается содержимое c регистра 41 n²+1-го, на второй вход сумматора 40 подается содержимое ci регистра 41₁ и на выходе которого формируется значение c_i+c'i, которое записывается в регистр 41₂ и подается на выход 44. Рассмотрим работу устройства для случая n 3 и m 2 (фиг.2). При этом P n/m и K m, P 4. На вход 3 элементы ai, p+(q-1)m подаются в моменты времени
t_a i-1+(P-1+(q-1)m)n+(n-m)(q-1)n, где P и q . На вход 1 элементы bp+(q-1)mj подаются в моменты времени
t_b (m-1)(n-1)+(q-1)n²-(m-1)+(j-1)n+(m-p). Управляющие сигналы ij ( , ) ij представляются в виде матрицы
которые подаются на входы 4 и 5 в моменты времени
t (m-1)(n-1)+i-1+(j+1)n+(q-1)n². При перемножении двух матриц А и В на вход 2 постоянно подается нулевое значение. Если требуется перемножить матрицы А и В и сложить их с матрицей С, то на вход 2 подаются элементы матрицы S_ijo^(o)c_ij^(o)в моменты времени
tC^(o) (m-1)(n-1)+i-1+(j-1)n. На вход 6 подается последовательность управляющих сигналов
0^(m-1)(n-1)+m 0^{(m-1)(n-1)+m+n2-1} 1^{(m-1)(n-1)+m+n2}
1^{(m+n)(n-1)+(K/m-1)n2+m+1}. На выходе 10 формируются элементы C_ij результирующей матрицы в моменты
t_c (m-1)(n-1)+i+(j-1)n+(K/m-1)²_n+m.
В соответствии с приведенными выражениями организация входного и выходного потоков данных для n 3 и m 2 приведена на фиг.2. В таблице приведены состояния триггеров, регистров и значения на выходах вычислительных модулей устройства. Рассмотрим работу устройства при формировании элемента С₁₁ 9. В вычислительном модуле 8₁ на втором такте формируется элемент S₁₁₁⁽¹⁾ S₁₁₁⁽⁰⁾ + a₁₁b₁₁, на одиннадцатом такте элемент S₁₁₂⁽³⁾S₁₁₂⁽²⁾ + a₁₃ x b₃₁. В вычислительном модуле 8₂ на третьем такте формируется элемент c⁽¹⁾₁₁ S⁽²⁾₁₁₁ S⁽¹⁾₁₁₁ + a₁₂b₂₁, на двенадцатом такте элемент с⁽²⁾₁₁ S⁽⁴⁾₁₁₂ S⁽³⁾₁₁₂. В вычислительном модуле 9 на тринадцатом такте формируется значение с₁₁ с⁽¹⁾₁₁ + +с⁽²⁾₁₁, которое выдается на выход 10 устройства. Аналогичным образом формируются остальные элементы cij. Последний элемент c_nnформируется на ((m-1)n+P n²+1)-м такте.

Формула изобретения

УСТРОЙСТВО ДЛЯ УМНОЖЕНИЯ МАТРИЦ, содержащее m вычислительных модулей первого типа (m фиксированное число, m

n, n размерность перемножаемых матриц), причем первый и второй информационные входы и первый настроечный вход устройства соединены соответственно с первым и вторым информационными входами и первым настроечным входом первого вычислительного модуля первого типа, первый и второй информационные входы и первый настроечный выход i-го вычислительного модуля первого типа (i 1, m 1) соединены соответственно с первым и вторым информационными входами и первым настроечным входом (i + 1)-го вычислительного модуля первого типа, синхровходы m вычислительных модулей первого типа соединены с синхровходом устройства, отличающееся тем, что, с целью сокращения аппаратурных затрат, в него введен вычислительный модуль второго типа, третий информационный вход которого соединен с третьим информационным входом m-го вычислительного модуля первого типа, третий информационный вход i-го вычислительного модуля первого типа соединен с третьим информационным выходом (i + 1)-го вычислительного модуля первого типа, второй настроечный вход устройства соединен с вторым настроечным входом первого вычислительного модуля первого типа, второй настроечный выход i-го вычислительного модуля первого типа соединен с вторым настроечным входом (i + 1)-го вычислительного модуля первого типа, третий настроечный вход устройства соединен с настроечным входом вычислительного модуля второго типа, информационный вход которого соединен с вторым информационным выходом m-го вычислительного модуля первого типа, а синхровход с синхровходом устройства, причем каждый вычислительный модуль первого типа реализует следующие функции:

где

^j,

^j значения управляющих сигналов a и b соответственно на первом и втором настроечных входах вычислительного модуля на j-м такте,
U^j⁺¹ и V^j⁺¹ значения управляющих сигналов U и V соответственно на первом и втором настроечных выходах вычислительного модуля на (j + 1)-м тактах,
A^j+n-1= a^j ,
B^j⁺² bⁱ,
C^j⁺¹ c^j + d

e,
где d = a^j

^jVa^j-n

^j,
где
e = b^j

^jVb^j-p

^j ,

a^j, b^j и c^j значения соответственно на третьем, первом и втором информационных входах вычислительного модуля на j-м такте,
A^j, B^j и C^j значения соответственно на третьем, первом и втором информационных входах вычислительного модуля на j-м такте,
а вычислительный модуль второго типа реализует следующие функции:

где c^j значение на информационном входе вычислительного модуля на j-м такте,
t значение на настроечном входе вычислительного модуля на j-м такте.

РИСУНКИ

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6

Изобретение относится к автоматике и вычислительной технике и может быть использовано при постр(}ении специализированных вычислительных машин, ориентированных на решение задач матричной алгебры

Устройство для сжатия двоичных векторов // 1702385

Изобретение относится к вычислительной технике и может быть использовано при построении специализированных ЭВМ

Матричное вычислительное устройство // 1695319

Изобретение относится к вычислительной технике и может быть использовано в электронных вычислительных машинах как программируемый специализированный периферийный процессор реального времени с параллельно-последовательной реализацией вычислений

Устройство для разложения теплицевых симметричных матриц // 1689970

Изобретение относится к вычислительной технике и может быть использовано для разложения квадратной теплицевой симметричной матрицы на две треугольные ч диагональную матрицы и при построении специализированных устройств, предназначенных для решения систем линейных уравнений

Вычислительное устройство // 1689947

Изобретение относится к вычислительной технике и может быть использовано в специализированных вычислителях

Устройство для умножения // 1688238

Изобретение относится к цифровой вычислительной технике и предназначено для использования в универсальных и специализированных цифровых вычислительных устройствах

Устройство для вычисления скалярного произведения векторов // 1683033

Изобретение относится к вычислительной технике и может быть использовано при построении высокопроизводительных конвейерных систем с последовательной поразрядной обработкой операндов

Устройство для вычисления свертки // 1679502

Изобретение относится к вычислительной технике и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройствах обработки сигналов для вычисления свертки (фильтрации с бесконечной импульсной характеристикой)

Устройство для умножения матриц // 1677709

Изобретение относится к вычислительной технике и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройствах обработки сигналов для перемножения плотной (пхп)-матрицы на ленточную матрицу

Матричный вычислитель // 1672470

Изобретение относится к вычислительной технике и может быть использовано в качестве звеньев спецпроцессора, вычисляющего значения функций методом непрерывных дробей Эйлера, или для определения значения выражения α = Z<SP POS="POST">2</SP>/(A + XY)

Устройство для вычисления свертки // 2112274

Изобретение относится к области вычислительной техники и может быть использовано в специализированных вычислительных системах для вычисления сверстки

Способ идентификации типов растительности // 2115887

Способ оценки загрязнения атмосферы // 2117286

Устройство для вычисления двумерной свертки // 2117986

Изобретение относится к вычислительной технике и может быть использовано в специализированных вычислительных системах для вычисления двумерной свертки

Устройство для вычисления собственных значений (n o n) матрицы // 2117987

Изобретение относится к области вычислительной техники и может быть использовано в специализированных вычислительных системах для вычисления собственных значений матрицы (n n)

Нейропроцессор, устройство для вычисления функций насыщения, вычислительное устройство и сумматор // 2131145

Устройство для вычисления собственных значений матриц // 2168760

Изобретение относится к вычислительной технике и может быть использовано в специализированных вычислителях для решения задач, содержащих цифровую обработку сигналов и изображений

Способ спектрального анализа квазипериодических сигналов // 2187838

Изобретение относится к области спектрального анализа и может быть использовано при классификации квазипериодических сигналов

Способ визуального отображения и анализа аномалий многомерного объекта или процесса // 2200345

Изобретение относится к вычислительной технике и может быть использовано в системах интеллектуального анализа данных, в том числе при обработке и анализе геолого-геофизической информации и других данных, полученных при исследовании природных или социально-экономических объектов или явлений

Устройство для сортировки двумерного массива данных (варианты) // 2252447

Изобретение относится к вычислительной технике, а именно к устройствам обработки числовых массивов информации, предназначенным для перестановки строк и столбцов двумерного массива данных, представленного в виде матрицы