Способ заполнения кэш-памяти команд и выдачи команд на выполнение и устройство заполнения кэш-памяти команд и выдачи команд на выполнение

Авторы патента:

G06F9/38 - совмещение выполнения одновременных команд, например строчная печать, просмотр

G06F12/0875 - Выборка, адресация или распределение данных в системах или архитектурах памяти (хранение информации как таковое G11)

Владельцы патента RU 2592465:

Федеральное государственное учреждение "Федеральный научный центр Научно-исследовательский институт системных исследований Российской академии наук" (ФГУ ФНЦ НИИСИ РАН) (RU)

Изобретение относится к вычислительной технике. Технический результат заключается в повышении производительности кэш-памяти путем увеличения скорости выдачи инструкций без увеличения разрядности запоминающих устройств. Способ заполнения кэш-памяти команд и выдачи команд на выполнение включает заполнение кэш-памяти команд и выдачу команд на выполнение, разделение массива кэш-памяти на секции, перемещение каждой строки из основной памяти в кэш-память и размещение в определенной строке секции, которую определяют посредством блока выбора секций, причем заполнение кэш-памяти производят размещением строки в секцию, следующую за секцией, в которую была размещена предыдущая строка, при этом последующие строки размещают в циклической последовательности с установлением флага, а выдачу команд на выполнение осуществляют из двух секций одновременно при наличии указанного флага. 2 н.п. ф-лы, 3 ил.

Изобретение относится к области вычислительной техники, а именно к подсистеме памяти современных микропроцессоров.

Известен способ заполнения кэш-памяти команд и выдачи команд на выполнение и устройство для его осуществления, включающее массив памяти и блок выбора секции для записи, поступившей из основной памяти строки. Выбор осуществляют вне зависимости от аналогичного выбора секции для записи предыдущих строк (патент US 005774685, кл. G06F 9/30, опубл. 2009).

Известен способ заполнения кэш-памяти команд и выдачи команд на выполнение и устройство для его осуществления, включающее в себя центральный процессор, буфер команд, блок управления памятью, двухуровневую кэш-память, содержащую кэш-память команд первого уровня, кэш-память данных первого уровня и объединенную кэш-память второго уровня, системный контроллер и внешнюю память. Способ включает разделение массива кэш-памяти на N секций, каждую строку перемещают из основной памяти в кэш-память и помещают в определенную строку любой из секций, которую определяют посредством блока выбора секций (БВС). Разрядность запоминающих устройств не превышает половины длины строки кэш-памяти (патент RU №2359315, кл. G06F 9/30, опубл. 2008).

Значительная часть исполняемого программного кода организована по линейному принципу, то есть при выполнении команды по адресу A велика вероятность, что следующей будет выполнена команда по адресу A+1. Большинство современных буферов команд осуществляют так называемую упреждающую выборку: запрашивают команды по адресам, следующим за исполняемым адресом, не дожидаясь инкрементации программного счетчика. Таким образом, большинство запросов, поступающих в кэш-память команд, имеют линейно возрастающие адреса. Недостатком описанных устройств является то, что следующие друг за другом строки регулярно помещаются в одну и ту же секцию кэш-памяти, что исключает их одновременное считывание и ограничивает таким образом производительность кэш-памяти (скорость выдачи инструкций буферу команд).

Технический результат от использования изобретения состоит в повышении производительности путем увеличения скорости выдачи инструкций без увеличения разрядности запоминающих устройств

Увеличение скорости может достигать двукратного (при выполнении линейных участков кода) по сравнению с известными способами и подсистемами памяти, что особенно важно для многопотоковых процессоров.

Описываемые способ и устройство заполнения кэш-памяти команд и выдачи команд на выполнение позволяет осуществлять параллельное считывание строк по линейно возрастающим адресам, что позволит повысить производительность кэш-памяти.

Указанный технический результат достигается тем, что в способе заполнения кэш-памяти команд и выдачи команд на выполнение, включающем заполнение кэш-памяти команд и выдачу команд на выполнение, разделение массива кэш-памяти на N секций, перемещение каждой строки из основной памяти в кэш-память и размещение в определенной строке секции, которую определяют посредством блока выбора секций, согласно изобретению заполнение кэш-памяти производят размещением строки в секцию, следующую за секцией, в которую была размещена предыдущая строка, при этом последующие строки размещают в циклической последовательности, а выдачу команд на выполнение осуществляют из двух соседних секций одновременно.

Описанный способ осуществляется устройством, включающим центральный процессор, буфер команд, блок управления памятью, двухуровневую кэш-память, содержащую кэш-память команд первого уровня, кэш-память данных первого уровня, содержащую секции запоминающих устройств, входной регистр, входной демультиплексор, блок выбора секций, блок анализа промаха/попадания, выходной мультиплексор и выходной регистр, объединенную кэш-память второго уровня, системный контроллер и внешнюю память, согласно изобретению кэш-память команд первого уровня содержит дополнительный выходной мультиплексор, связанный с буфером команд и выходным регистром, и блок выбора секций, состоящий из связанных между собой запоминающего устройства кодов секций, преобразователя кода, представляющего собой алгоритм замещения элемента с наиболее длительным интервалом отсутствия обращения к нему, регистра хранения предыдущего кода выбора секции, сдвигового регистра и мультиплексора, при этом блок выбора секций связан с входным демультиплексором и секциями запоминающих устройств.

Изобретение поясняется чертежами, где на фиг. 1 изображена схема устройства заполнения кэш-памяти и выдачи инструкций буферу команд на выполнение, на фиг. 2 - схема блока выбора секций, на фиг. 3 - схема размещения строк с линейно возрастающими адресами в секциях кэш-памяти команд.

Устройство состоит из запоминающих устройств кэш-памяти команд (S секций) 1, 2 и 3, входного регистра 4, входного демультиплексора 5, основного 6 и дополнительного 7 выходных мультиплексоров, выходного регистра 8, блока выбора секций (БВС) 9 и блока анализа промаха/попадания в кэш-память 10. Вход 11 БВС 9 связан с выводом 12, на который от буфера команд поступает сигнал ADINC. Вход входного регистра 13 связан с выводом 14, на который от системного контроллера или кэш-памяти второго уровня поступают входные данные. Выход 15 входного регистра 4 связан с информационным входом 16 входного демультиплексора 5. Выход 17 БВС 9 связан с управляющим входом 18 входного демультиплексора 5, с управляющими входами (разрешение записи) 19, 20 и 21 секций запоминающих устройств 1, 2 и 3 соответственно. Информационные выходы 22, 23 и 24 входного демультиплексора 5 связаны с информационными входами 25, 26 и 27 секций запоминающих устройств 1, 2 и 3 соответственно. Информационный выход 28 секции запоминающих устройств 1 связан с информационными входами 29 и 30 основного выходного мультиплексора 6 и дополнительного выходного мультиплексора 7 соответственно. Информационный выход 31 секции запоминающих устройств 2 связан с информационными входами 32 и 33 основного выходного мультиплексора 6 и дополнительного выходного мультиплексора 7 соответственно. Информационный выход 34 секции запоминающих устройств 3 связан с информационными входами 35 и 36 основного выходного мультиплексора 6 и дополнительного выходного мультиплексора 7 соответственно. Вывод 12 связан с управляющими входами 37 и 38 основного выходного мультиплексора 6 и дополнительного выходного мультиплексора 7 соответственно. Выход 39 блока анализа промаха/попадания в кэш-память 10 связан с управляющими входами 40 и 41 основного выходного мультиплексора 6 и дополнительного выходного мультиплексора 7 соответственно. Выходы 42 и 43 основного выходного мультиплексора 6 и дополнительного выходного мультиплексора 7 связаны с входами 44 и 45 выходного регистра 8 соответственно. Выход 46 выходного регистра 8 связан с выводом 47, данные с которого поступают на буфер команд. Особенность предлагаемого устройства заключается в применении модернизированного БВС, состоящего из запоминающего устройства кодов выбора секций 48, известного преобразователя кода выбора секций по алгоритму замещения элемента с наиболее длительным интервалом отсутствия обращения к нему алгоритма замещения элемента с наиболее длительным интервалом отсутствия обращения к нему (НДИОО) 49, регистра хранения предыдущего значения кода выбора секций 50, сдвигового регистра 51 и мультиплексора 52. Выход 53 запоминающего устройства кодов выбора секций 48 связан с входом 54 преобразователя кода по алгоритму НДИОО 49. Выход 53 запоминающего устройства кодов выбора секций 48 связан с входом 55 регистра хранения предыдущего значения кода выбора секций 50. Выход 56 регистра хранения предыдущего значения кода выбора секции 50 связан с входом 57 сдвигового регистра 51. Выход 58 сдвигового регистра 51 связан с информационным входом 59 мультиплексора 52. Выход 60 преобразователя кода выбора секций 49 связан с информационным входом 61 мультиплексора 52. Выход 62 мультиплексора 52 связан с входом 63 запоминающего устройства кодов выбора секций 48 и выходом 17 блока выбора секций. Вход 11 блока выбора секций связан с управляющим входом 64 мультиплексора 52.

Особенностью устройства так же является включение в состав БВС регистра хранения предыдущего значения кода выбора секции и сдвигового регистра. Способ заполнения кэш-памяти команд и выдачи команд на выполнение состоит в использовании следующей схемы размещения строк с линейно возрастающими адресами в кэш-памяти. В тот период времени, когда происходит выполнение линейного участка кода, буфер команд выставляет кэш-памяти сигнал AD_INC. Строки, помещаемые в кэш-память команд при отсутствии сигнала AD_INC, помещаются в секции, выбираемые в соответствии с известным алгоритмом замещения элемента с наиболее длительным интервалом отсутствия обращения к нему (алгоритм НДИОО). Обозначим адрес строки 65, помещенной в кэш-память команд последней перед выставлением сигнала AD_INC, как А. Пусть она помещена в строку к (к однозначно определяется адресом А) секции N (66) кэш-памяти с числом секций S, при этом N определена алгоритмом замещения элемента с наиболее длительным интервалом отсутствия обращения к нему (НДИОО). В способе при следующем запросе БВС описанной конструкции обеспечит запись строки 67 по адресу A+1 в строку k+1 секции М (68), где М=N+1 при N<S и М=1 при N=S. При этом в строке секции устанавливается специальный флаг: бит AI. Обеспечить вышеописанную последовательность позволяют включенные в состав блока выбора секций регистр хранения предыдущего значения кода выбора секции и сдвиговый регистр.

Описанный способ осуществляется следующим образом

При заполнении кэш-памяти от внешнего источника инструкции, поступающие на вход 14 кэш-памяти, записываются во входной регистр 4. Выходные данные регистра 4 передаются на вход одной из секций запоминающих устройств через демультиплексор 5. Выбор нужной секции и управление демультиплексором осуществляются с выхода 17 блока выбора секций 9. Коды выбора секций хранятся в запоминающем устройстве 48. При выставлении адреса запроса на выход запоминающего устройства выдается текущий код. Он записывается в регистр 50. Преобразователем кода 49 осуществляется стандартное преобразование считанного кода по алгоритму замещения элемента с наиболее длительным интервалом отсутствия обращения к нему (НДИОО). Преобразованный код передается на выход 17 устройства выбора секций через мультиплексор 52 при условии пассивного уровня сигнала AD_INC на входе 11 устройства выбора секций. Отличительной особенностью предлагаемого метода является то, что в случае выставления сигнала AD_INC на входе 11 на активный уровень на выход 17 устройства выбора секций поступает преобразованное стандартным сдвиговым регистром 51 предыдущее значение кода выбора секций, хранимое в регистре 50 от предыдущего запроса. В соответствующей строке выбранной секции при этом устанавливается бит AI.

При выдаче инструкций из кэш-памяти буферу команд при поступлении запроса на выдачу строки по адресу A осуществляется считывание данных из всех секций запоминающих устройств 1, 2, 3. При условии попадания в секцию N, данные из секции N пересылаются обычным образом через основной выходной мультиплексор 6, управляемый выходным сигналом 39 блока анализа промаха/попадания 10, в младшую часть выходного регистра 8. Отличительной особенностью предлагаемого метода является то, что при условии активного уровня сигнала AD_INC на входе 12 устройства осуществляется одновременная пересылка через дополнительный выходной мультиплексор 7 данных строки k+1 из секции М в старшую часть выходного регистра 8 в том случае, если в строке k+1 секции М установлен бит AI. Таким образом, достигается увеличение скорости выдачи инструкций буферу команд без увеличения разрядности запоминающих устройств кэш-памяти команд первого уровня.

1. Способ заполнения кэш-памяти команд и выдачи команд на выполнение, включающий заполнение кэш-памяти команд и выдачу команд на выполнение, разделение массива кэш-памяти на секции, перемещение каждой строки из основной памяти в кэш-память и размещение в определенной строке секции, которую определяют посредством блока выбора секций, отличающийся тем, что заполнение кэш-памяти производят размещением строки в секцию, следующую за секцией, в которую была размещена предыдущая строка, при этом последующие строки размещают в циклической последовательности с установлением флага, а выдачу команд на выполнение осуществляют из двух секций одновременно при наличии указанного флага.

2. Устройство заполнения кэш-памяти команд и выдачи команд на выполнение, включающее центральный процессор, буфер команд, блок управления памятью, двухуровневую кэш-память, содержащую кэш-память команд первого уровня, кэш-память данных первого уровня, содержащую секции запоминающих устройств, входной регистр, входной демультиплексор, блок выбора секций, блок анализа промаха/попадания, выходной мультиплексор и выходной регистр, объединенную кэш-память второго уровня, системный контроллер и внешнюю память, отличающееся тем, что кэш-память команд первого уровня содержит дополнительный выходной мультиплексор, связанный с буфером команд и выходным регистром, и блок выбора секций, состоящий из связанных между собой запоминающего устройства кодов выбора секций, преобразователя кода выбора секций по алгоритму замещения элемента с наиболее длительным интервалом отсутствия обращения к нему, регистра хранения предыдущего кода выбора секции, сдвигового регистра и мультиплексора, при этом блок выбора секций связан с входным демультиплексором и секциями запоминающих устройств.

Изобретение относится к вычислительной технике. Технический результат заключается в оптимизации операций в памяти.

Технология для совместного использования информации между прикладными программами // 2468421

Изобретение относится к средствам совместного использования информации между прикладными программами. .

Представление переходов цикла в регистре предыстории переходов с помощью множества бит // 2447486

Изобретение относится к процессорам и, в частности, к способу представления переходов цикла в регистре предыстории переходов с помощью множества бит. .

Мультимедиа-процессор, многопоточный по требованию // 2425412

Изобретение относится к электронике, а конкретно к процессорам. .

Способы и устройства для проактивного управления кэшем адресов ветвлений // 2421783

Изобретение относится к области процессоров, более конкретно к способу улучшения прогнозирования ветвлений посредством проактивного управления содержимым КЭШа адресов ветвлений.

Способ и устройство для выполнения инструкций процессора на основе динамически изменяемой задержки // 2419836

Изобретение относится к вычислительной технике. .

Способы и устройства для сокращения поисков в кэше целевых адресов ветвлений // 2419835

Изобретение относится к способам прогнозирования ветвлений в кэше целевых адресов ветвлений. .

Способ, система и устройство, обеспечивающие предварительный просмотр документа // 2398263

Изобретение относится к вычислительной технике. .

Способ и устройство для обработки операндов в процессоре // 2360280

Блокирование исходных регистров в устройстве обработки данных // 2282235

Изобретение относится к блокированию исходных регистров в устройстве обработки данных. .

Компьютерная система // 2579949

Изобретение относится к вычислительной технике. Технический результат заключается в оптимизации выполнения программы инициализации из внешнего последовательного ПЗУ путем отображения адресов данных, располагающихся во внешнем последовательном ПЗУ, в адресное пространство микропроцессора.

Устройство прямого отображения адресов данных, располагающихся во внешнем последовательном пзу, в адресное пространство микропроцессорного ядра, компьютерная система и способ передачи данных // 2579942

Изобретение относится к вычислительной технике. Технический результат заключается в снижении требований к объему ОЗУ при возможности отказа от встроенных в микросхему начального микроПЗУ и внутреннего загрузочного ОЗУ.

Расширяемая файловая система // 2574824

Изобретение относится к вычислительной технике, а именно к носителям информации. Технический результат - обеспечение формата расширяемой файловой системы для портативных носителей информации.

Устройство доступа к данным на борту летательного аппарата // 2566939

Настоящее изобретение касается доступа к базам данных на борту летательного аппарата. Объектом изобретения является устройство (100) доступа клиентов (101) к данным на борту летательного аппарата, при этом каждый из клиентов (101) связан с одним бортовым электронным приложением (102).

Корректность без зависимости от упорядоченности // 2560786

Изобретение относится к способу, системе и компьютерному носителю данных для поддержания корректности в системе хранения. Технический результат заключается в повышении надежности хранения данных.

Информационно-аналитическая система обработки запросов граждан // 2554553

Изобретение относится к вычислительной технике, в частности к информационным системам взаимодействия общества с органами власти по проблемным социально-значимым вопросам, обработки обращений граждан и получения гражданами официального ответа.

Способ и устройство поиска составного образца в последовательности // 2549525

Изобретение относится к вычислительной технике. Технический результат заключается в расширении функциональных возможностей за счет модернизации связей ячеек характеристической матрицы и ввода дополнительных элементов в характеристическую матрицу.

Система и способ для процессирования мультимедийных сообщений // 2533452

Настоящее изобретение относится к области телекоммуникаций, в частности к системе и способу процессирования мультимедийных сообщений (MMS). Технический результат заключается в повышении общей производительности MMS- системы в моменты пиковых нагрузок импульсного характера.

Способ кодирования и исполнения контекстно-зависимой программы мультиклеточным процессором, мультиклеточный процессор, клетка и коммутационное устройство мультиклеточного процессора для осуществления способа // 2530690

Заявляемая группа изобретений относится к вычислительной технике и может быть использована при построении высокопроизводительных и энергоэффективных параллельных вычислительных систем.

Носитель записи, устройство воспроизведения и интегральная схема // 2523178

Изобретение относится к области техники, соответствующей технологии воспроизведения 3D видеоизображения и 2D видеоизображения. Техническим результатом является уменьшение объема буфера, который требуется предоставлять во время стереоскопического воспроизведения.

Способ адресации кольцевого буфера в памяти микропроцессора // 2598323

Изобретение относится к адресации или местонахождению данных в памяти. Технический результат заключается в повышении эффективности обработки пакетов данных переменной длины с использованием кольцевого буфера. В способе устанавливают длину кольцевого буфера, устанавливают начальный и конечный адреса для кольцевого буфера, устанавливают начальное местоположение текущего указателя в памяти микропроцессора, устанавливают шаг по индексу в памяти микропроцессора, устанавливают указатель в кольцевом буфере, в микропроцессоре определяют местоположение текущего указателя в памяти микропроцессора, определяют местоположение указателя в кольцевом буфере, и в случае, когда местоположение не превосходит конечного адреса кольцевого буфера, устанавливают его равным местоположению текущего указателя в памяти микропроцессора, и в случае, когда местоположение текущего указателя в памяти микропроцессора больше, чем конечный адрес кольцевого буфера, то устанавливают местоположение путем вычитания длины кольцевого буфера из местоположения текущего указателя в памяти микропроцессора. 2 ил.