Способ синхронизации доступа к разделяемым ресурсам вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов

Изобретение относится к способу обнаружения и устранения повисших блокировок с использованием блокировочных файлов. Технический результат заключается в повышении надежности обнаружения и устранения повисших блокировок. Ассоциируют разделяемый ресурс с блокировочным файлом. Вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе. Помещают во временный файл информацию о текущем процессе, который пытается обратиться к разделяемому ресурсу. Осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл. Если системный вызов создания жесткой ссылки выполнен успешно, то удаляют жесткую ссылку на временный файл и обеспечивают выполнение текущим процессом операций с разделяемым ресурсом. Если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия: удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса; заносят в существующий блокировочный файл данные текущего процесса. Снимают файловую блокировку записи с существующего блокировочного файла. Обеспечивают выполнение текущим процессом операций с разделяемым ресурсом. Удаляют существующий блокировочный файл.

 

Область техники, к которой относится изобретение

Предлагаемое изобретение относится к вычислительной технике и, в частности, к обеспечению синхронизации доступа к разделяемым ресурсам вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов.

Уровень техники

В настоящее время известны способы синхронизации доступа параллельно выполняемых процессов (приложений) к разделяемым ресурсам вычислительной системы (в том числе файлам, участкам оперативной памяти и др.). При обеспечении синхронизации исключительный доступ предоставляется только одному процессу, а сам ресурс блокируется для записи и/или чтения для других процессов. Блокировка может осуществляться разными методами, однако возможны ситуации, когда ресурс оказывается заблокирован одновременно несколькими процессами и ни один из них не может ни снять блокировку, ни выполнить необходимые операции с разделяемым ресурсом.

Такое состояние обычно называют повисшей блокировкой (deadlock), а определяют его наличие и затем устраняют с использованием разных механизмов.

Так, известен способ предотвращения повисших блокировок [1] при выполнении обновлений хранилища данных в многопроцессорном устройстве, имеющем локальную кэш-память для каждого процессора, причем каждый процессор имеет возможность работы в быстром, медленном или расширенном медленном режиме, способ, заключающийся в том, что

- получают инструкцию, которая включает обращение к хранилищу данных;

- устанавливают процессор в быстрый режим, при котором множество инструкций выполняются параллельно, а целевая запись кэш-памяти, связанная с хранилищем данных, берется из локальной кэш-памяти с состоянием исключительного владения перед выполнением инструкции;

- инициализируют выполнение инструкции в быстром режиме;

- в ответ на обнаружение возможной повисшей блокировки во время выполнения инструкции в быстром режиме:

- прерывают выполнения инструкции в быстром режиме;

- устанавливают процессор в медленный режим, при котором выполняется единственная инструкция в текущий момент времени, а целевая запись кэш-памяти берется из локальной кэш-памяти с состоянием исключительного владения перед выполнением инструкции;

- инициализируют выполнение инструкции в медленном режиме;

- в ответ на обнаружение возможной повисшей блокировки во время выполнения инструкции в медленном режиме:

- прерывают выполнение инструкции в медленном режиме;

- устанавливают процессор в расширенный медленный режим, при котором выполняется единственная инструкция в текущий момент времени, а целевая запись кэш-памяти берется из локальной кэш-памяти с состоянием только чтения перед выполнением инструкции и с состоянием исключительного владения после завершения выполнения инструкции; и

- инициализируют выполнение инструкции в расширенном медленном режиме.

После того как выполнение инструкции завершено в расширенном медленном режиме, процессор может быть переведен обратно в быстрый режим.

Возможная повисшая блокировка считается обнаруженной, когда превышается предварительно задаваемое пороговое число исключительных отклонений без признаков окончания выполнения инструкции.

Этот способ имеет недостатки, среди которых можно отметить, в частности, необходимость перевода процессора в медленный и в расширенный медленный режим работы, что снижает производительность вычислительной системы. Кроме того, обнаружение повисшей блокировки носит вероятностный характер и зависит от предварительно задаваемого порогового числа исключительных отклонений.

Известен также способ синхронизации доступа к разделяемым ресурсам между параллельно выполняемыми процессами [2] с использованием механизма блокировочных файлов, заключающийся в том, что

- ассоциируют разделяемый ресурс с блокировочным файлом;

- создают в ходе попытки доступа процесса (приложения) к разделяемому ресурсу блокировочный файл;

- если такой блокировочный файл уже существует, эта операция будет завершена с ошибкой;

- если такой блокировочный файл не существует, то создается блокировочный файл;

- записывают в только что созданный и открытый блокировочный файл данные процесса, который его создал (идентификатор процесса (process ID, РID) и др.);

- обеспечивают выполнение процессом операций с разделяемым ресурсом;

- снимают блокировку с разделяемого ресурса (файла) путем удаления блокировочного файла.

Описанный способ принят за прототип.

Однако этот известный способ также имеет недостаток. Так, если процесс, владеющий блокировкой, завершился некорректно и не удалил блокировочный файл, то больше ни один процесс не сможет получить доступ к разделяемому ресурсу и возникает повисшая блокировка. Соответственно, надежность известного способа является невысокой.

Раскрытие изобретения

С целью исключения возможности появления повисших блокировок следует проверять наличие в системе процесса, данные которого указаны в существующем блокировочном файле.

Для этого предлагается способ, заключающийся в том, что

- ассоциируют разделяемый ресурс с блокировочным файлом;

- вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе, в которой предполагается создание блокировочного файла, со стороны текущего процесса, пытающегося получить доступ к разделяемому ресурсу;

- помещают во временный файл информацию о текущем процессе (PID и/или др. сведения, по которым можно определить наличие данного процесса в системе), который пытается обратиться к разделяемому ресурсу;

- осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл;

- если системный вызов создания жесткой ссылки выполнен успешно, то:

- удаляют жесткую ссылку на временный файл;

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

- удаляют блокировочный файл;

- если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка не связана с тем, что файл с именем блокировочного файла уже существует, то удаляют временный файл;

- если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка связана с тем, что файл с именем блокировочного файла уже существует, то

- удаляют временный файл;

- осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:

- устанавливают файловую блокировку записи на существующий блокировочный файл;

- проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле;

- если текущий процесс в системе существует, то снимают файловую блокировку записи на существующий блокировочный файл;

- если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия:

- удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса;

- заносят в существующий блокировочный файл данные текущего процесса;

- снимают файловую блокировку записи с существующего блокировочного файла;

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

- удаляют существующий блокировочный файл.

Таким образом, если после проверки выясняется, что процесс, данные которого указаны в блокировочном файле, в данный момент в вычислительной системе не существует (например, произошел внутренний программный сбой и приложение операционной системой (ОС) было принудительно выгружено из оперативной памяти), то это не помешает обеспечить доступ к разделяемому ресурсу другим процессам и гарантировать отсутствие повисшей блокировки.

Техническим результатом является повышение надежности обнаружения и устранения повисших блокировок.

Осуществление изобретения

Реализация предложенного способа может быть осуществлена в вычислительной системе, работающей под управлением POSIX-совместимой ОС, в частности ОС GNU/Linux, где механизм блокировочных файлов для синхронизации доступа к разделяемому ресурсу получил широкое распространение.

Необходимым условием реализации предложенного способа является наличие в составе ОС вычислительной системы следующих средств, описанных в стандарте ISO/IEC/IEEE 9945-1:2008 [3]:

- системных вызовов для работы с файлами;

- операций атомарного эксклюзивного создания и открытия временного файла с уникальным именем (например, выполняемых с помощью системного вызова mkstemp);

- поддержка жестких ссылок ОС и файловой системой, в которой предполагается создание блокировочного файла;

- поддержка файловых блокировок и наличие системных вызовов для работы с ними.

Все указанные средства присутствуют в ОС GNU/Linux, в частности в доступном для любого пользователя дистрибутиве ОС Debian 6.

Жесткие ссылки поддерживаются большинством файловых систем, такой, в частности, как Ext3 (Extended File System версии 3), поддерживаемая в ОС Debian.

Для реализации способа в создаваемой или модернизируемой программе или программном модуле, предназначенном для работы с разделяемыми ресурсами, предусматривают осуществление следующих действий.

Ассоциируют разделяемый ресурс (например, последовательный порт) с блокировочным файлом. Это можно сделать, к примеру, сформировав константу, содержащую путь к блокировочному файлу.

В каждом процессе перед обращением к разделяемому ресурсу вызывают системный вызов mkstemp путем вызова одноименной системной функции, указав в качестве шаблона пути для создания временного файла путь в той же файловой системе, в которой предполагается создание блокировочного файла.

С помощью системного вызова write, помещают во временный файл информацию о текущем процессе, по которой можно определить наличие данного процесса в системе (в самом простом случае это может быть PID процесса), который пытается обратиться к разделяемому ресурсу.

Вызывают системный вызов link с помощью одноименной функции, передавая в качестве первого параметра путь к временному файлу, а в качестве второго параметра - путь к блокировочному файлу, с которым ассоциирован разделяемый ресурс.

Если функция link возвращает 0, то

- удаляют жесткую ссылку на временный файл, вызывая системный вызов unlink;

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

- удаляют блокировочный файл, используя системный вызов unlink. Если функция link возвращает - 1 и в errno (error return value) содержится код ошибки, отличный от EEXISTS, то удаляют временный файл.

Если функция link возвращает - 1 и в errno содержится код ошибки EEXISTS, то

- удаляют временный файл, для чего вызывают системный вызов unlink, передавая в качестве параметра путь к временному файлу;

- осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:

- открывают существующий блокировочный файл для записи, для чего выполняют системный вызов open, передавая в качестве первого параметра путь к блокировочному файлу, с которым ассоциирован разделяемый ресурс, а в качестве второго параметра - режим чтения/записи, и запоминают возвращаемый номер файлового дескриптора открытого блокировочного файла;

- устанавливают файловую блокировку записи, для чего вызывают системный вызов fcntl, передавая в качестве первого параметра номер файлового дескриптора открытого блокировочного файла, в качестве второго значения - F_SETLKW, в качестве третьего значения - заполненную структуру flock, для установки блокировки всего содержимого файла;

- читают содержимое файла с помощью системного вызова файла read;

- проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле (для случая, когда в качестве данных о процессе выбран PID процесса, проверка может быть осуществлена путем выполнения системного вызова kill, передав в качестве первого параметра PID прочитанный из существующего блокировочного файла, а в качестве второго параметра - 0);

- если текущий процесс в системе существует (для случая, когда в качестве данных о процессе выбран PID процесса, системный вызов kill вернул 0), то снимают файловую блокировку записи на существующий блокировочный файл;

- если текущий процесс в системе не существует (для случая, когда в качестве данных о процессе выбран PID процесса,, системный вызов kill вернул -1 и errno содержит код ошибки ENOEXIST), то выполняют устранение повисшей блокировки, осуществляя следующие действия:

- удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса, выполняя системный вызов trunc, передав в качестве параметра значения номер файлового дескриптора открытого блокировочного файла;

- определяют информацию о текущем процессе (для случая, когда используется PID - выполняют системный вызов getpid и сохраняют возвращаемое значение);

- заносят в существующий блокировочный файл данные текущего процесса, выполняя системный вызов write;

- снимают файловую блокировку записи с существующего блокировочного файла, для чего вызывают системный вызов fcntl, передавая в качестве первого параметра номер файлового дескриптора открытого блокировочного файла, в качестве второго значения - F_SETLKW, в качестве третьего значения - заполненную структуру flock, для снятия блокировки всего содержимого файла;

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

- удаляют существующий блокировочный файл, для чего вызывают системный вызов unlink, передавая в качестве параметра путь к блокировочному файлу.

Реализовать действия предложенного способа в составе программы или функции может специалист в области программирования (программист).

Источники информации

1. Патент США №7953932, приоритет от 13.02.2008 г.

2. Джонсон М.К., Троан Э.В. Разработка приложений в среде Linux, 2-е изд., Москва, 2007, стр.231-232.

3. Стандарт ISO/IEC/IEEE 9945-1:2008 Information technology - Portable Operating System Interface (POSIX®) Base Specifications.

Способ синхронизации доступа к разделяемому ресурсу вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов, заключающийся в том, что
ассоциируют разделяемый ресурс с блокировочным файлом;
вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе, в которой предполагается создание блокировочного файла, со стороны текущего процесса, пытающегося получить доступ к разделяемому ресурсу;
помещают во временный файл информацию о текущем процессе, который пытается обратиться к разделяемому ресурсу;
осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл;
если системный вызов создания жесткой ссылки выполнен успешно, то:
удаляют жесткую ссылку на временный файл;
обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
удаляют блокировочный файл;
если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка не связана с тем, что файл с именем блокировочного файла уже существует, то удаляют временный файл;
если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка связана с тем, что файл с именем блокировочного файла уже существует, то:
удаляют временный файл;
осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:
устанавливают файловую блокировку записи на существующий блокировочный файл;
проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле;
если текущий процесс в системе существует, то снимают файловую блокировку записи на существующий блокировочный файл;
если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия:
удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса;
заносят в существующий блокировочный файл данные текущего процесса;
снимают файловую блокировку записи с существующего блокировочного файла;
обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
удаляют существующий блокировочный файл.



 

Похожие патенты:

Изобретение относится к автоматике и вычислительной технике и может найти применение при построении распределенных систем программного управления технологическими процессами, роботами и робототехническими комплексами, а также подсистем логического управления многоуровневых иерархических АСУ и мультипроцессорных систем широкого класса.

Изобретение относится к области вычислительной техники, в частности к системам прерывания ЭВМ. .

Изобретение относится к автоматике и вычислительной технике и может найти применение при построении распределенных систем программного управления технологическими процессами, роботами и робототехническими комплексами, а также подсистем логического управления многоуровневых иерархических АСУ и мультипроцессорных систем широкого класса.

Изобретение относится к автоматике и вычислительной технике и может быть использовано для построения высокопроизводительных систем, систем управления, АСУТП и других систем, удовлетворяющих высоким требованиям к безотказной работе.

Изобретение относится к автоматике и вычислительной технике и может быть использовано при построении управляющих и вычислительных систем высокой производительности, АСУТП, а также других систем, к которым предъявляются жесткие требования по надежности.

Изобретение относится к вычислительной технике и может быть использовано при создании программируемых контроллеров, в автоматизированных системах управления технологическими процессами, а также в системах автоматизации научных экспериментов.

Изобретение относится к вычислительной технике и может быть использовано для построения высокопроизводительных вычислительных систем для реализации алгоритмов, допускающих распараллеливание на уровне команд.

Изобретение относится к автоматике и вычислительной технике. .

Изобретение относится к автоматике и вычислительной технике и может быть использовано при построении распределенных систем программного управления технологическими процессами.

Изобретение относится к автоматике и вычислительной технике и может быть использовано при построении управляющих и вычислительных систем высокой производительности, АСУТП, а также других систем, к которым предъявляются жесткие требования по надежности.

Изобретение относится к области взаимных соединений и, в частности, к обеспечению потоков на основе идентификатора через шину PCI Express. Технический результат - упорядочивание потоков запросов для минимизации очередей.

Изобретение относится к области описания приложений для обеспечения управляемости и масштабируемой установки. Техническим результатом является обеспечение эффективно управляемой, надежной и масштабируемой установки служб.

Изобретение относится к сетям беспроводной связи. Технический результат заключается в обеспечении комбинирования различных функций на внешней многофункциональной интегральной схеме и использовании USB-интерфейса для соединения цифровой специализированной интегральной схемы (DASIC) мобильного устройства и многофункциональной интегральной схемы.

Изобретение относится к средствам автоматической настройки серверов. .

Изобретение относится к области вычислительной техники и может быть использовано в компьютерных системах, использующих флэш-память. .

Изобретение относится к вычислительной технике и автоматике, может быть использовано в аппаратуре, имеющей повышенные требования к надежности и не имеющей доступа для ремонта, например для космических аппаратов.

Изобретение относится к области вычислительной техники, а именно к устройствам управления соединением источников и приемников данных. .

Изобретение относится к серверу сообщений для обработки исходящих и входящих электронных сообщений. .

Изобретение относится к сетевой системе для разрешения удаленного контроля и удаленного управления устройствами, соединенными с сетью, от клиентского терминального устройства через сервер.

Изобретение относится к упорядоченным массивам информации, логически организованным в базы данных, хранимых на физических носителях, например магнитных дисках, и к способам управления базами данных, реализуемым в виде программных средств, обрабатывающих информацию с помощью компьютеров.

Изобретение относится к области компьютерных сетей, а именно к клиент-серверным компьютерным сетям. Технический результат заключается в увеличении производительности сети и снижении задержки в доставке электронных документов, запрошенных пользователями. Технический результат достигается за счет использования предварительной обработки на сервере для развертывания статических представлений электронных документов в компьютерной сети. Электронный документ может быть опубликован из клиентского компьютера на первом серверном компьютере в компьютерной сети. Во время публикации первый серверный компьютер может создавать статическое представление электронного документа и приложение просмотра для просмотра статического представления электронного документа на клиентском компьютере. Первый серверный компьютер может сохранять статическое представление электронного документа и приложение просмотра на втором серверном компьютере для доставки на клиентский компьютер. 2 н. и 5 з.п. ф-лы, 5 ил.
Наверх