Способ улучшения качества аннотации липидных признаков, относящихся к отдельным липидным классам, с использованием информации о времени задержки в масс-спектрометре

Изобретение относится к области медицины. Предложен способ анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией, включающий получение данных жидкостной хроматографии с масс-спектрометрией анализируемого образца, обработку спектров для получения таблиц с интенсивностями липидных признаков и их значениями масс-на-заряд и времени удерживания, определение модели решетки, поиск оптимальной решетки путем подбора оптимального набора параметров, формирование аннотации с использованием оптимальной решетки, где все признаки, попавшие в предсказанное время в пределах заранее заданной погрешности, считаются аннотированными, вывод результата аннотирования в виде таблицы, где липидным признакам сопоставлено название липида. Изобретение обеспечивает повышение качества аннотации липидных признаков по значениям массы-на-заряд и времени задержки. 1 ил.

 

ОБЛАСТЬ ТЕХНИКИ

Настоящее техническое решение относится к области медицины, в частности, к способу анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией.

УРОВЕНЬ ТЕХНИКИ

На данный момент существует два комплементарных подхода к задаче идентификации липидных признаков в области масс-спектрометрии. Первый состоит в проведение дополнительных экспериментов, во время которых химические соединения фрагментируются и измеряются соответствующие массы фрагментов, что зачастую позволяет идентифицировать химическое соединение с приемлемой точностью [Sebastian . Searching molecular structure databases using tandem MS data: are we there yet? Current Opinion in Chemical Biology, Volume 36, February 2017, Pages 1-6]. В таком случае регистрируются только фрагменты соединений с самой высокой концентрацией.

Второй подход основывается на использовании лишь значения массы-на-заряд для аннотации липидного признака, что может приводить к ошибочным или неоднозначным идентификациям.

Предлагаемое решение должно производить аннотацию липидных признаков, относящихся к отдельным липидным классам, используя одновременно информацию о массе-на-заряд, времени задержки, и, возможно, внутренних стандартов соответствующих липидных классов.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Технической проблемой, на решение которой направлено заявленное техническое решение, является создание способа анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией, который охарактеризован в независимом пункте формулы.

Технический результат заключается в повышении качества аннотации липидных признаков по значениям массы-на-заряд и времени задержки.

Заявленный результат достигается за счет осуществления способа анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией, включающий следующие этапы:

получают данные жидкостной хроматографии с масс-спектрометрией анализируемого образца;

осуществляют обработку спектров для получения таблиц с интенсивностями липидных признаков и их значениями масс-на-заряд и времени удерживания;

определяют липидный класс и соответствующий ему аддукт из входных данных, которые выбираются из списка возможных вариантов;

находят предварительную аннотацию по значениям массы-на-заряд, посредством сравнения теоретических значений массы-на-заряд для выбранного класса со значениями массы-на-заряд из полученной таблицы;

определяют модели решетки по набору следующих параметров:

- сдвиг по времени задержки при увеличении количества атомов углерода в хвостах жирных кислот на одну единицу,

- сдвиг по времени задержки при увеличении количества двойных связей в хвостах жирных кислот на одну единицу,

- допустимая погрешность по времени задержки и начало отсчета решетки;

осуществляют поиск оптимальной решетки путем подбора оптимального набора параметров, для этого

используют полный перебор параметров с оптимизацией целевой функцией, при этом использованная целевая функция считается как количество точек, попадающих в решетку с данной погрешностью времени задержки,

а результат оптимизации определяет оптимизирующий набор значений параметров, который дает наибольшее количество аннотированных липидных признаков;

формируют аннотацию с использованием оптимальной решетки, где все признаки, попавшие в предсказанное время в пределах заранее заданной погрешности, считаются аннотированными;

выводят результат аннотирования в виде таблицы, где липидным признакам сопоставлено название липида.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:

Фиг. 1 иллюстрирует пример общей схемы вычислительного устройства.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.

Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.

На первом этапе, на вычислительном устройстве (100), получают данные жидкостной хроматографии с масс-спектрометрией анализируемого образца. В качестве образцов могут быть любые липидосодержащие образцы. Пробоподготовка должна заключаться в экстракции липидов для их последующего анализа методом жидкостной хроматографии с масс спектрометрией. В итоге для каждого образца получается спектр - массив данных, который отражает содержание липидных соединений в данном образце.

Осуществляют обработку спектров, полученных для каждого образца, для получения таблиц с интенсивностями липидных признаков и их значениями масс-на-заряд и времени удерживания.

Эти спектры, полученные для каждого образца, анализируются в специализированной программе, чтобы в итоге получить то, с чем работает данный алгоритм - матрицу с интенсивностями липидных признаков (которая отражает количественное содержание липидных соединений в каждом образце), и матрицу с временами задержки и массами-на-заряд выявленных липидных признаков (с помощью этой матрицы можно аннотировать липидные признаки).

Определяют липидный класс и соответствующий ему аддукт из входных данных, которые выбираются из списка возможных вариантов. Липидный класс определяется по общепринятой классификации, здесь имеется в виду набор липидов, которые отличаются между собой только жирно-кислотным составом. Входные данные содержат набор липидных классов, их теоретические массы, рассматриваемый аддукт для каждого класса. Из базы данных, включенной во входные данные, извлекаются массы, соответствующие этому липидному классу и аддукту.

Находят предварительную аннотацию по значениям массы-на-заряд, посредством сравнения теоретических значений массы-на-заряд для выбранного класса со значениями массы-на-заряд из полученной таблицы и осуществляют построение модели решетки.

Определяют модели решетки для построения по набору следующих параметров:

- сдвиг по времени задержки при увеличении количества атомов углерода в хвостах жирных кислот на одну единицу,

- сдвиг по времени задержки при увеличении количества двойных связей в хвостах жирных кислот на одну единицу,

- допустимая погрешность по времени задержки и начало отсчета решетки.

Дополнительно, для построения модели решетки в качестве начальной точки можно использовать вводимый пользователем параметр.

В случае наличия внутреннего стандарта его время задержки используется как начальная точка для построения решетки. Под внутренним стандартном понимается искусственно добавляемое соединение, которое позволяет отслеживать различные технические аспекты в эксперименте.

Осуществляют поиск оптимальной решетки путем подбора оптимального набора параметров. Для поиска оптимального набора параметров используют полный перебор параметров с оптимизацией целевой функцией, при этом использованная целевая функция считается как количество точек, попадающих в решетку с данной погрешностью времени задержки, а результат оптимизации определяет оптимизирующий набор значений параметров, который дает наибольшее количество аннотированных липидных признаков.

Формируют аннотацию с использованием оптимальной решетки, где все признаки, попавшие в предсказанное время в пределах заранее заданной погрешности, считаются аннотированными.

Выводят результат аннотирования в виде таблицы, где липидным признакам сопоставлено название липида и их однозначная аннотация. Под аннотацией понимается приписывание признаку из таблицы к какому-то химическому соединению. Можно приписывать одному признаку несколько соединений если есть неопределенность, тогда аннотация неоднозначная.

На Фиг. 1 далее будет представлена общая схема вычислительного устройства (100), обеспечивающего обработку данных, необходимую для реализации заявленного решения.

В общем случае устройство (100) содержит такие компоненты, как: один или более процессоров (101), по меньшей мере одну память (102), средство хранения данных (103), интерфейсы ввода/вывода (104), средство В/В (105), средства сетевого взаимодействия (106).

Процессор (101) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (100) или функциональности одного или более его компонентов. Процессор (101) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (102).

Память (102), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.

Средство хранения данных (103) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (103) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.

Интерфейсы (104) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.

Выбор интерфейсов (104) зависит от конкретного исполнения устройства (N00), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.

В качестве средств В/В данных (105) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.

Средства сетевого взаимодействия (106) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (105) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.

Компоненты устройства (100) сопряжены посредством общей шины передачи данных (110).

В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

Способ анализа данных о содержании в образце интересующих классов липидов на основе масс-спектрометрического анализа с жидкостной хроматографией, включающий следующие этапы:

получают данные жидкостной хроматографии с масс-спектрометрией анализируемого образца;

осуществляют обработку спектров для получения таблиц с интенсивностями липидных признаков и их значениями масс-на-заряд и времени удерживания;

определяют липидный класс и соответствующий ему аддукт из входных данных, которые выбираются из списка возможных вариантов;

находят предварительную аннотацию по значениям массы-на-заряд, посредством сравнения теоретических значений массы-на-заряд для выбранного класса со значениями массы-на-заряд из полученной таблицы;

определяют модели решетки по набору следующих параметров:

- сдвиг по времени задержки при увеличении количества атомов углерода в хвостах жирных кислот на одну единицу,

- сдвиг по времени задержки при увеличении количества двойных связей в хвостах жирных кислот на одну единицу,

- допустимая погрешность по времени задержки и начало отсчета решетки;

осуществляют поиск оптимальной решетки путем подбора оптимального набора параметров, для этого

используют полный перебор параметров с оптимизацией целевой функцией, при этом использованная целевая функция считается как количество точек, попадающих в решетку с данной погрешностью времени задержки,

а результат оптимизации определяет оптимизирующий набор значений параметров, который дает наибольшее количество аннотированных липидных признаков;

формируют аннотацию с использованием оптимальной решетки, где все признаки, попавшие в предсказанное время в пределах заранее заданной погрешности, считаются аннотированными;

выводят результат аннотирования в виде таблицы, где липидным признакам сопоставлено название липида.



 

Похожие патенты:

Изобретение относится к области медицины, в частности к офтальмологии. Предложен способ получения слезной жидкости для химико-аналитического исследования.

Изобретение относится к способу анализа сложных углеводородных флюидов и может применяться для анализа нефти и газоконденсата. Изобретение касается способа определения состава углеводородного флюида, включающего определение плотности углеводородного флюида, определение состава углеводородного флюида методом газовой хроматографии, совмещенной с время-пролетным масс-анализатором в случае значений плотности углеводородного флюида 0,85 г/мл или менее, совмещенной с пламенно-ионизационным детектором либо с квадрупольным масс-анализатором в случае значений плотности углеводородного флюида свыше 0,85 г/мл, но не более 0,96 г/мл.

Изобретение относится к исследованию паров веществ путем измерения их физических свойств с использованием метода масс-спектрометрии в сочетании с методом хроматографии.

Изобретение относится к исследованию паров веществ путем измерения их физических свойств с использованием метода масс-спектрометрии в сочетании с методом хроматографии.

Изобретение относится к медицине, а именно к гинекологии, и может быть использовано для дифференциации очагов эндометриоза различной локализации по липидному составу ткани.

Изобретение относится к медицине, а именно к гинекологии, и может быть использовано для дифференциации неоплазий шейки матки по липидному составу ткани. Для этого методом масс-спектрометрии определяют липидный профиль ткани с помощью метода OPLS-DA и с использованием OPLS модели, построенной на основании уровней следующих липидов: фосфатидилхолины (PC 32:0, PC 34:1, PC 36:4, PC 34:0, PC 38:4), этаноламины (РЕ O-46:0, LPE 46:0, РЕ O-48:0, LPE 48:0, РЕ O-46:1) и сфингомиелины (SM 34:0, SM 42:2), рассчитывают оценочный параметр (ОП) по предложенной формуле.

Изобретение относится к области масс-спектрометрии. Устройство транспортировки ионов в источниках с ионизацией при атмосферном давлении содержит эмитирующую ионы поверхность и выходную диафрагму (сопло), электрически соединенные с независимыми источниками питания.

Изобретение относится к области аналитической химии и может быть использовано при экологическом контроле почв различного типа и донных отложений на содержание полиароматических углеводородов (ПАУ).

Изобретение относится к пищевой промышленности, а именно к количественному определению содержания в моллюсках йессотоксинов, максимально допустимый уровень содержания йессотоксинов в моллюсках - не более 3,75 мг/кг.

Изобретение относится к биохимическим методам исследования микроорганизмов и может использоваться при проведении анализов в медицине, экологии, биотехнологии или ветеринарии.

Изобретение относится к области аналитической химии. Раскрыт способ определения концентрации N-метилпирролидона в продуктах производства масел методом газовой хроматографии, включающий подготовку хроматографической колонки, заполненной сорбентом и помещенной в термостат с заданной температурой, градуировку хроматографа, экстрагирование N-метилпирролидона из образца продукта производства масел растворителем и водой, подачу пробы в токе несущего газа в испаритель, в котором поддерживают температуру 230°С и высокую температуру детектора.
Наверх