Устройство предсказания взаимодействия, способ предсказания взаимодействия и компьютерный программный продукт

Группа изобретений относится к области предсказания биомолекулярного связывания. Предложен способ и устройство предсказания взаимодействия между соединением и протеином, и энергонезависимый материальный считываемый компьютером носитель данных. Устройство содержит блок хранения данных и блок управления. Блок хранения содержит блок хранения данных структуры соединений и блок хранения данных структуры протеинов. Блок управления содержит блок получения данных структуры соединения, блок получения данных структуры протеина, блок определения предсказанного протеина и блок определения силы взаимодействия. Способ включает этап получения данных структуры соединения, этап получения данных структуры протеина, этап определения предсказанного протеина и этап определения силы взаимодействия. Носитель данных содержит запрограммированные команды, выполненные с возможностью вызывать при их исполнении устройством предсказания взаимодействия. Изобретения обеспечивают возможность эффективно идентифицировать биомолекулу, такую как протеин, в которой возможный компаунд взаимодействует в живом теле. 3 н. и 5 з.п. ф-лы, 16 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству предсказания взаимодействия, способу предсказания взаимодействия и к компьютерному программному продукту.

Уровень техники

Традиционно раскрываются технологии предсказания биомолекулярного связывания.

Система стыковки лигандов, раскрытая в непатентной литературе 1 и 2, заставляет все жесткие фрагменты производных лигандов стыковаться в местах расположения рецепторов. Таким образом, система стыковки лигандов применяет гибкий алгоритм стыковки, содержащий частое взятие проб положения атомов жестких фрагментов и последующую точную регулировку двугранного угла вращающейся связи в конструкции лекарственного средства. Перечень литературы

Непатентная литература

Непатентная литература 1: Zsoldos Z, Reid D, Simon A, Sadjad BS, Johnson AP. eHiTS: an innovative approach to the docking and scoring function problems. Curr Protein Pept Sci. 2006 Oct; 7(5): 421-35.

Непатентная литература 2: Zsoldos Z, Reid D, Simon A, Sadjad BS, Johnson AP. eHiTS: a new fast, exhaustive flexible ligand docking system. J Mol Graph Model. 2007 Oct; 26(1): 198-212. Epub 2006 Jun 17.

Раскрытие изобретения

Проблемы, решаемые изобретением

Традиционная система стыковки лигандов, описанная в непатентной литературе 1 и 2, идентифицирует целевую молекулу, с которой, главным образом, взаимодействует возможный компаунд для разработки нового лекарственного средства. Во многих случаях, однако, традиционная система стыковки лигандов распознает только одну или несколько из множества биомолекул, с которыми возможный компаунд взаимодействует как с целевой молекулой. В результате, в традиционной системе стыковки лигандов процесс разработки лекарственного средства проходит при предположении, что возможный компаунд взаимодействует только с целевой молекулой, определенной, в некотором смысле, произвольно. Таким образом, эффекты действия возможного компаунда, ожидаемые пользователем, таким, как исследователь компании по разработке лекарств, могут, вероятно, отличаться от фактических эффектов. Поэтому возможный компаунд обычно взаимодействует не с одиночной биомолекулой, а с множеством биомолекул с различной силой и полученные всесторонние эффекты служат в качестве реальных эффектов действия возможного компаунда.

С точки зрения описанных выше недостатков, настоящее изобретение направлено на обеспечение устройства предсказания взаимодействия, способа предсказания взаимодействия и компьютерного программного продукта, которые могут предсказывать, с каким интравитальным протеином взаимодействует химическое вещество, такое как компаунд, и как взаимодействие влияет на живое тело.

Решение проблем

Средство решения проблемы

Чтобы решить эту задачу, устройством предсказания взаимодействия, соответствующим одному из вариантов настоящего изобретения, является устройство предсказания взаимодействия, содержащее блок запоминающего устройства и блок управления, в котором блок запоминающего устройства содержит блок запоминающего устройства данных структуры компаундов, который хранит данные структуры компаундов для структуры конкретного компаунда, и блок запоминающего устройства данных структуры протеинов, который хранит данные структуры конкретного протеина, и блок управления содержит блок сбора данных структуры компаундов, который собирает данные структуры компаундов для конкретного компаунда из блока запоминающего устройства данных структуры компаундов или предсказывает и собирает данные структуры компаундов, не хранящиеся в блоке запоминающего устройства, используя способ предсказания структуры, блок сбора данных структуры протеинов, который собирает возможные данные структуры возможных протеинов, соответствующие данным структуры протеинов для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с компаундом, из блока запоминающего устройства данных структуры протеинов или предсказывает и собирает данные структуры возможного протеина, не хранящиеся в блоке запоминающего устройства данных структуры протеинов, используя способ предсказания структуры, блок определения предсказанного протеина, который вычисляет множество сил связывания между возможным протеином и компаундом, используя множество способов моделирования стыковки, основываясь на данных структуры компаунда, собранных блоком сбора данных структуры компаундов, и данных структуры возможного протеина, собранных блоком сбора данных структуры протеинов, определяет любую из предсказанных сил связывания или комбинацию сил связывания в качестве предсказанной силы связывания, соответствующей, в конечном счете, предсказанной силе связывания, посредством создания всесторонней оценки сил связывания, используя для этого любой из двух или оба таких способа, как способ обучения и способ метаоценки, и определяет предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом, и блок определения силы взаимодействия, который вычисляет силы взаимодействия, используя множество способов моделирования силы связывания, основываясь на данных структуры компаундов, собранных блоком сбора данных структуры компаундов, и на данных структуры протеина для предсказанного протеина, определенного блоком определения предсказанного протеина, и определяет предсказанную силу взаимодействия, указывающую, насколько сильно компаунд, основываясь на данных структуры компаунда, взаимодействует с предсказанным протеином с другим конкурентно действующим предоставленным компаундом, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством создания всесторонней оценки сил взаимодействия, используя любой из двух или оба способа, таких как способ обучения и способ метаоценки.

Устройство предсказания взаимодействия, соответствующее другому варианту осуществления настоящего изобретения, является устройством предсказания взаимодействия, в котором блок запоминающего устройства данных структуры протеинов хранит данные структуры протеинов для структуры протеинов, связанными с сетевыми данными для внутриклеточной или интравивальной сети, содержащей данные местоположения для положения протеина в сети, и блок управления дополнительно содержит блок предсказания влияния, предсказывающий влияние компаунда на предсказанный протеин, основываясь на предсказанной силе взаимодействия, определенной блоком определения силы взаимодействия, и сетевых данных, хранящихся в блоке запоминающего устройства данных структуры протеинов.

Устройство предсказания взаимодействия, соответствующее другому варианту настоящего изобретения, является устройством предсказания взаимодействия, в котором блок запоминающего устройства дополнительно содержит блок запоминающего устройства данных межмолекулярного взаимодействия, который хранит данные межмолекулярного взаимодействия для внутриклеточного или интравитального межмолекулярного взаимодействия, и любой из блоков или оба блока, блок определения предсказанного протеина и блок определения силы взаимодействия, создают всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в блоке запоминающего устройства данных межмолекулярного взаимодействия.

Устройство предсказания взаимодействия, соответствующее еще одному варианту настоящего изобретения, является устройством предсказания взаимодействия, в котором блок запоминающего устройства дополнительно содержит блок запоминающего устройства данных подобия структуры протеинов для подобия структуры протеинов, и любой из блоков или оба блока, блок определения предсказанного протеина и блок определения силы взаимодействия, создают всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в блоке запоминающего устройства данных подобия структуры протеинов.

Устройство предсказания взаимодействия, соответствующее еще одному варианту настоящего изобретения, является устройством предсказания взаимодействия, в котором блок сбора данных структуры протеинов предсказывает и собирает данные структуры возможного протеина, предсказывая множество фрагментов данных структуры протеинов путем использования способа предсказания структуры, и создает всестороннюю оценку фрагментов данных структуры протеинов, используя любой из двух или оба таких способа, как способ обучения или способ метаоценки.

Устройство предсказания взаимодействия, соответствующее еще одному варианту настоящего изобретения, является устройством предсказания взаимодействия, в котором блок запоминающего устройства дополнительно содержит блок запоминающего устройства генетических данных, который хранит генетические данные для гена индивидуума, и блок сбора данных структуры протеинов предсказывает и собирает данные структуры возможного протеина, используя способ предсказания структуры, основанный на генетических данных, хранящихся в блоке запоминающего устройства генетических данных.

Способ предсказания взаимодействия, соответствующий еще одному варианту настоящего изобретения, является способом предсказания взаимодействия, исполняемым устройством предсказания взаимодействия, содержащим блок запоминающего устройства и блок управления, в котором блок запоминающего устройства содержит блок запоминающего устройства структуры компаундов, который хранит данные структуры компаундов для структуры конкретного компаунда, и блок запоминающего устройства данных структуры протеинов, который хранит данные структуры протеинов для структуры конкретного протеина, причем способ, исполняемый блоком управления, содержит этап сбора данных структуры компаундов, на котором собирают данные структуры компаундов для компаунда из блока запоминающего устройства данных структуры компаундов, или предсказывают и собирают данные структуры компаундов, не хранящихся в блоке запоминающего устройства структуры компаундов, используя способ предсказания структуры, этап сбора данных структуры протеина, на котором собирают данные структуры возможного протеина, соответствующие данным структуры протеина для протеина, служащего в качестве возможного протеина для взаимодействия с компаундом, из блока запоминающего устройства данных структуры протеинов или предсказывают и собирают данные структуры возможного протеина, не хранящиеся в блоке запоминающего устройства данных структуры протеинов, используя способ предсказания структуры, этап определения предсказанного протеина, на котором вычисляют множество сил связывания между возможным протеином и компаундом, используя множество способов моделирования стыковки, основыванный на данных структуры компаунда, собранных на этапе сбора данных структуры компаундов, и данных структуры возможного протеина, собранных на этапе сбора данных структуры протеинов, определяют любую из сил связывания или комбинацию сил связывания в качестве предсказанной силы связывания, соответствующей, в конечном счете, предсказанной силе связывания посредством создания всесторонней оценки сил связывания, используя любой из двух или оба таких способа, как способ обучения или способ метаоценки, и определяют предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом, и этап определения силы взаимодействия, на котором вычисляют силы взаимодействия, используя множество способов моделирования силы связывания, основываясь на данных структуры компаундов, собранных на этапе сбора данных структуры компаундов, и данных структуры протеинов для предсказанного протеина, определенного на этапе определения предсказанного протеина, и определяют предсказанную силу взаимодействия, соответствующую силе взаимодействия, указывающей, насколько сильно компаунд на основе данных структуры компаунда взаимодействует с предсказанным протеином с другим конкурентно действующим предоставленным компаундом, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством создания всесторонней оценки сил взаимодействия, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки.

Компьютерный программный продукт, соответствующий еще одному варианту настоящего изобретения, является компьютарным программным продуктом, имеющим энергонезависимый материальный считываемый компьютером носитель, содержащийзапрограммированные команды, заставляющие, когда они исполняются устройством предсказания взаимодействия, содержащим блок запоминающего устройства, содержащий блок запоминающего устройства данных структуры компаундов, который хранит данные структуры компаундов для структуры конкретного компаунда, и блок запоминающего устройства структуры протеинов, который хранит данные структуры протеинов для структуры конкретного протеина, и блок управления, причем блок управления должен выполнять способ, содержащий этап сбора данных структуры компаундов, на котором собирают данные структуры компаундов для компаунда из блока запоминающего устройства данных структуры компаундов или предсказывают и собирают данные структуры компаунда, не хранящиеся в блоке запоминающего устройства данных структуры компаундов, используя способ предсказания структуры, этап сбора данных структуры протеинов, на котором собирают данные структуры возможного протеина, соответствующие данным структуры протеинов для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с компаундом, из блока запоминающего устройства хранения данных структуры протеинов или предсказывают и собирают данные структуры возможного протеина, не хранящиеся в блоке запоминающего устройства данных структуры протеинов, используя способ предсказания структуры, этап определения предсказанного протеина, на котором вычисляют множество сил связывания между возможным протеином и компаундом, используя множество способов моделирования стыковки, основанный на данных структуры компаунда, собранных на этапе сбора данных структуры компаундов, и данных структуры возможного протеина, собранных на этапе сбора данных структуры протеинов, определяют любую из сил связывания или комбинацию сил связывания в качестве предсказанной силы связывания, соответствующей, в конечном счете, силе связывания, предсказанной посредством создания всесторонней оценки сил связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки, и определяют предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом, и этап определения силы взаимодействия, на котором вычисляют силы связывания, используя множество способов моделирования силы взаимодействия, основываясь на данных структуры компаундов, собранных на этапе сбора данных структуры компаундов, и данных структуры протеинов для предсказанного протеина, определенного на этапе определения предсказанного протеина, и определяют предсказанную силу взаимодействия, соответствующую силе взаимодействия, указывающей, насколько сильно компаунд на основе данных структуры компаунда взаимодействует с предсказанным протеином с другим конкурентно действующим предоставленным компаундом, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством создания всесторонней оценки сил связывания, используя любой из двух или оба способа, такие как способ обучения и способ метаоценки.

Преимущество изобретения

Настоящее изобретение собирает данные структуры компаундов для компаунда или предсказывает и собирает данные структуры компаунда, которые не хранятся, используя способ предсказания структуры. Настоящее изобретение собирает данные структуры возможного протеина, соответствующие данным структуры протеина для возможного протеина, служащего в качестве протеина возможного для взаимодействия с компаундом, или предсказывает и собирает данные структуры возможного протеина, которые не хранятся, используя способ предсказания структуры. Настоящее изобретение вычисляет множество сил связывания между возможным протеином и компаундом, используя множество способов моделирования стыковки, основываясь на собранных данных структуры компаунда и собранных данных структуры возможного протеина. Настоящее изобретение затем определяет любую из сил связывания или комбинацию сил связывания в качестве предсказанной силы связывания, соответствующей силе связывания, в конечном счете, предсказанной посредством создания всесторонней оценки сил связывания, используя любой из двух или оба такие способа, как способ обучения и способ метаоценки, и определяет предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом. Настоящее изобретение вычисляет силы связывания, используя множество способов моделирования силы связывания, основываясь на собранных данных структуры компаунда и данных структуры протеина для определенного предсказанного протеина. Настоящее изобретение далее определяет предсказанную силу взаимодействия, соответствующую силе взаимодействия, указывающей, как сильно компаунд, основанный на данных структуры компаунда, взаимодействует с предсказанным протеином с другим конкурентно действующим предоставленным компаундом, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством создания всесторонней оценки сил связывания, используя любой из двух или оба способа, таких как способ обучения и способ метаоценки. Таким образом, настоящее изобретение может эффективно идентифицировать биомолекулу, такую как протеин, с которой возможный компаунд взаимодействует в живом теле при разработке нового лекарственного средства и т.п.

Настоящее изобретение предсказывает влияние компаунда на предсказанный протеин, основываясь на определенной предсказанной силе взаимодействия и хранящихся сетевых данных. Таким образом, настоящее изобретение может значительно повысить точность предсказания действия и побочного влияния компаунда.

Настоящее изобретение создает всестороннюю оценку, дополнительно используя хранящиеся данные межмолекулярного взаимодействия. Таким образом, настоящее изобретение может создавать всестороннюю оценку более точно, используя известные данные в качестве индекса.

Настоящее изобретение создает всестороннюю оценку, дополнительно используя хранящиеся данные подобия структуры протеинов. Таким образом, настоящее изобретение может создавать всестороннюю оценку более точно, используя данные известного протеина, схожего с возможным протеином, в качестве индекса.

Настоящее изобретение предсказывает и собирает данные структуры возможного протеина, предсказывая множество фрагментов данных структуры протеина, используя способ предсказания структуры и создавая всестороннюю оценку фрагментов данных структуры протеина, используя любой из двух или оба способа, таких как способ обучения и способ метаоценки. Таким образом, настоящее изобретение может дополнительно оценивать изменчивость по целевой молекуле.

Настоящее изобретение предсказывает данные структуры возможного протеина, используя способ предсказания структуры, используя способ предсказания структуры, основанный на хранящихся генетических данных. Таким образом, настоящее изобретение может предсказывать различия в структуре протеинов, основываясь на различии в генной последовательности среди индивидуумов, оценивая, таким образом, индивидуальные различия влияния возможного компаунда.

Краткое описание чертежей

Фиг. 1 - блок-схема последовательности выполнения операций основного принципа, соответствующего настоящему изобретению.

Фиг. 2 - блок-схема примера конфигурации устройства предсказания взаимодействия, соответствующего настоящему варианту осуществления.

Фиг. 3 - блок-схема последовательности выполнения операций примера процесса, выполняемого устройством предсказания взаимодействия, соответствующим настоящему изобретению.

Фиг. 4 - пример процесса определения предсказанной силы взаимодействия в соответствии с настоящим вариантом осуществления.

Фиг. 5 - пример процесса определения предсказанной силы связывания, соответствующего настоящему варианту осуществления.

Фиг. 6 - пример процесса определения предсказанной силы взаимодействия, соответствующего настоящему варианту осуществления.

Фиг. 7 - пример процесса определения предсказанной силы взаимодействия, соответствующего настоящему варианту осуществления.

Фиг. 8 - пример процесса предсказания силы взаимодействия, соответствующего настоящему варианту осуществления.

Фиг. 9 - пример процесса предсказания влияния, соответствующего настоящему варианту осуществления.

Фиг. 10 - графический результат, полученный посредством вычисления и предсказания силы связывания между компаундами и биомолекулами в соответствии с настоящим вариантом осуществления.

Фиг. 11 - графический результат, полученный посредством вычисления и предсказания силы связывания между компаундами и биомолекулами в соответствии с настоящим вариантом осуществления.

Фиг. 12 - графический результат, полученный посредством вычисления и предсказания силы связывания между компаундами и биомолекулами в соответствии с настоящим вариантом осуществления.

Фиг. 13 - график результата анализа компаундов на основе клинического испытания в качестве ингибитора MEK в соответствии с настоящим вариантом осуществления.

Фиг. 14-1 - диаграмма, полученная посредством цветового кодирования сети взаимодействия биомолекул, основанной на силе взаимодействия, полученной из результата анализа, показанного на фиг. 13.

Фиг. 14-2 - диаграмма, полученная посредством цветового кодирования сети взаимодействия биомолекул, основанной на силе взаимодействия, полученной из результата анализа, показанного на фиг. 13.

Фиг. 15 - пример вычисления предсказания в соответствии с настоящим вариантом осуществления.

Способ(ы) осуществления изобретения

Варианты осуществления устройства предсказания взаимодействия, способа предсказания взаимодействия и компьютерного программного продукта, соответствующие настоящему изобретению, объясняются ниже более подробно со ссылкой на сопроводительные чертежи. Варианты осуществления не предназначены для ограничения настоящего изобретения.

Общие принципы варианта осуществления настоящего изобретения

Ниже объясняются общие принципы варианта осуществления настоящего изобретения со ссылкой на фиг. 1 и затем конфигурация, процесс обработки и т.п. настоящего варианта осуществления объясняются более подробно. На фиг. 1 показана блок-схема последовательности осуществления операций основного принципа настоящего изобретения. Настоящий вариант осуществления имеет, главным образом, следующие основные характеристики.

Как показано на фиг. 1, блок управления устройства предсказания взаимодействия, соответствующего настоящему варианту осуществления, собирает данные структуры компаунда для конкретного компаунда, требующегося пользователю, от блока запоминающего устройства. Альтернативно, блок управления предсказывает и собирает данные структуры компаунда, не хранящиеся в блоке запоминающего устройства, используя способ предсказания структуры (этап SA-1).

Блок управления устройства предсказания взаимодействия получает из блока запоминающего устройства данные структуры возможного протеина, которые являются данными структуры протеина для протеина, возможного для взаимодействия с компаундом. Альтернативно, блок управления предсказывает и собирает данные структуры компаунда, не хранящиеся в блоке запоминающего устройства, используя способ предсказания структуры (этап SA-2). Блок управления может предсказывать и собирать данные структуры возможного протеина, предсказывая множество фрагментов данных структуры протеина, используя способ предсказания структуры, и создавать всестороннюю оценку фрагментов данных структуры протеина, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Блок управления может предсказывать и собирать данные структуры возможного протеина, используя способ предсказания структуры, основанный на генетических данных и генах пользователя, хранящихся в блоке запоминающего устройства.

Основываясь на данных структуры компаунда, собранных на этапе SA-1, и данных структуры возможного протеина, собранных на этапе SA-2, блок управления устройства предсказания взаимодействия вычисляет силу связывания между возможным протеином и компаундом, используя способ моделирования стыковки. Блок управления затем определяет предсказанную силу связывания, соответствующую силе связывания, в конечном счете, предсказанной посредством создания всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Таким образом, блок управления определяет предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом (этап SA-3). Блок управления может создавать всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в блоке запоминающего устройства. Блок управления может создавать всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в блоке запоминающего устройства.

Основываясь на данных структуры компаунда, собранных на этапе SA-1, и данных структуры протеина для предсказанного протеина, определенных на этапе SA-3, блок управления устройства предсказания взаимодействия вычисляет силу связывания, используя способ моделирования силы связывания. Блок управления затем определяет предсказанную силу взаимодействия, соответствующую силе взаимодействия, в конечном счете, предсказанной посредством создания всесторонней оценки силы связывания, используя один или второй или оба таких способа, как способ обучения и способ метаоценки (этап SA-4), и завершает процесс. Блок управления может создавать всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в блоке запоминающего устройства. Блок управления может создавать всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в блоке запоминающего устройства.

На этом объяснение общих принципов настоящего варианта осуществления заканчивается.

Конфигурация устройства 100 предсказания взаимодействия

Ниже конфигурация устройства 100 взаимодействия, соответствующего настоящему варианту осуществления, объясняется более подробно со ссылкой на фиг. 2. На фиг. 2 представлена блок-схема примера конфигурации устройства 100 предсказания взаимодействия, соответствующего настоящему варианту осуществления, и схематично показана только часть конфигурации, относящаяся к настоящему изобретению. Хотя устройство 100 предсказания взаимодействия содержит все компоненты в едином корпусе и выполняет процесс автономно (устройство автономного типа), вариант осуществления этим не ограничивается. Устройство 100 предсказания взаимодействия может иметь компоненты в отдельных корпусах и служить в качестве концептуального устройства с соединением компонентов через сеть 300 и т.п. (например, вычисление через облако).

На фиг. 2 внешняя система 200 соединяется с устройством 100 предсказания взаимодействия через сеть 300. Внешняя система 200 может иметь функцию обеспечения одной или обеих внешних баз данных для одних, нескольких или всех данных структуры протеинов, генетических данных, данных межмолекулярного взаимодействия и данных схожести структуры протеинов, и веб-сайт, выполняющий, например, функцию интерфейса пользователя.

Внешняя система 200 может служить в качестве веб-сервера, сервера ASP и т.п. Конфигурация аппаратурного обеспечения может содержать коммерчески доступный информационный процессор, такой как рабочая станция и персональный компьютер, и его вспомогательное оборудование. Функции внешней системы 200 могут выполняться центральным процессором (CPU), дисководом, памятью, устройством ввода устройством вывода, устройством управления связью и т.п. в конфигурации аппаратурного обеспечения внешней системы 200 и компьютерной программой и т.п. для управления этими устройствами.

Сеть 300 имеет функцию соединения устройства 100 предсказания взаимодействия с внешней системой 200 и представляет собой, например, Интернет.

Устройство 100 предсказания взаимодействия содержит, главным образом, блок 102 управления, интерфейс 104 управления связью, интерфейс 108 управления вводом-выводом и блок 106 запоминающего устройства. Блок 102 управления является центральным процессором (CPU) и т.п., который совместно управляет всем устройством 100 предсказания взаимодействия. Интерфейс 104 управления связью соединяется с устройством связи (не показано), таким как маршрутизатор, соединенным с линией связи и т.п. Интерфейс 108 ввода-вывода соединяется с блоком 112 отображения и устройством 114 ввода. Блок 106 запоминающего устройства является устройством, которое хранит различные типы баз данных, таблиц и т.п. Эти блоки устройства 100 предсказания взаимодействия соединяются средствами связи через необходимый путь прохождения связи. Устройство 100 предсказания взаимодействия средствами связи соединяется с сетью 300 через устройство связи, такое как маршрутизатор, и проводную или беспроводную линию связи, такую как выделенная линия.

Различные типы баз данных и таблиц, хранящихся в блоке 106 запоминающего устройства (база 106a данных структуры компаундов, база 106b данных структуры протеинов, база 106c генетических данных, база 106d данных межмолекулярного взаимодействия и база 106e данных подобия структуры протеинов) соответствуют блоку запоминающего устройства, такому как дисковод жесткого диска. Блок 106 запоминающего устройства хранит различные типы компьютерных программ, таблицы, файлы, базы данных и веб-страницы, используемые, например, для различных типов обработки.

База 106a данных структуры компаундов хранит среди компонент, хранящихся в блоке 106 запоминающего устройства, данные структуры компаундов для структуры конкретного компаунда. Данные структуры компаундов могут быть сохранены в базе 106a данных структуры компаундов заранее. Блок 102 управления устройства 100 предсказания взаимодействия может выгружать наиболее свежие данные из внешней системы 200 и т.п. через сеть 300 в любое время, как регулярно, так и в ответ на процесс, выполняемый блоком 102 управления. Блок 102 управления затем обновляет данные структуры компаундов, хранящиеся в базе 106a данных структуры компаундов самыми последними данными.

База 106b данных структуры протеинов хранит данные структуры протеинов для структуры протеинов. База 106b данных структуры протеинов может хранить данные структуры протеинов для структуры протеина, связанной с сетевыми данными. Сетевые данные являются данными внутриклеточной или интравитальной сети (например, сети внутримолекулярного взаимодействия, сети передачи сигналов, сети метаболизма и сети генетического управления) и содержат позиционные данные о местоположении протеина в сети. Данные структуры протеинов могут быть сохранены в базе 106b данных структуры протеинов заранее. Блок 102 управления устройства 100 предсказания взаимодействия может выгружать самые свежие данные из внешней системы 200 и т.п. через сеть 300 в любое время, как регулярно, так и в ответ на процесс, выполняемый блоком 102 управления (например, в то время, когда блок 102 управления запрашивает данные). Блок 102 управления затем обновляет данные структуры протеинов, хранящиеся в базе 106b структуры протеинов, самыми последними данными.

В базе 106c генетических данных хранятся генетические данные генов пользователя. Генетические данные могут содержать данные по любой, некоторым или всем базовым последовательностям, генетическому типу, генотипу, фенотипу и аннотацию. Генетические данные могут сохраняться в базе 106c генетических данных заранее.. Блок 102 управления устройства 100 предсказания взаимодействия может выгружать наиболее свежие данные из внешней системы 200 и т.п. через сеть 300 в любое время, как регулярно, так и в ответ на процесс, выполняемый блоком 102 управления. Блок 102 управления затем обновляет генетические данные, хранящиеся в базе 106c генетических данных, самыми последними данными.

В базе 106d данных межмолекулярного взаимодействия хранятся данные межмолекулярного взаимодействия по внутриклеточному или интравитальному межмолекулярному взаимодействию. Данные межмолекулярного взаимодействия могут сохраняться в базе 106d данных межмолекупралярного взаимодействия заранее. Блок 102 управления устройства 100 предсказания взаимодействия может выгружать самые последние данные из внешней системы 200 и т.п. через сеть 300 в любой момент времени, как регулярно, так и в ответ на обработку, выполняемую блоком 102 управления. Блок 102 управления затем обновляет данные межмолекулярного взаимодействия, хранящиеся в базе 106d данных межмолекулярного взаимодействия самыми последними данными.

В базе 106e данных подобия структуры протеинов хранятся данные подобия структуры протеинов для подобия структуры протеинов. Данные подобия структуры протеинов могут содержать данные по сети подобия структуры протеинов (PSIN). Данные подобия структуры протеинов могут сохраняться в базе 106e данных подобия структуры протеинов заранее. Блок 102 управления устройства 100 предсказания взаимодействия может выгружать самые последние данные из внешней системы 200 и т.п. в любой момент времени, как регулярно, так и в ответ на процесс, выполняемый блоком 102 управления. Блок 102 управления затем обновляет данные подобия структуры протеинов, хранящиеся в базе 106e данных подобия структуры протеинов, самыми последними данными.

На фиг. 2 интерфейс 104 управления связью управляет связями между устройством 100 предсказания взаимодействия и сетью 300 (или устройством связи, таким как маршрутизатор). Другими словами, интерфейс 104 управления связью имеет функцию передачи и приема данных внешней системы 200 с другими терминалами и т.п. через линию связи.

На фиг. 2 интерфейс 108 ввода-вывода управляет блоком 112 отображения и устройством 114 ввода.

Блок 112 отображения может быть блоком отображения (например, дисплеем, монитором и сенсорной панелью, содержащей жидкие кристаллы или органические EL), отображающим экран отображения, такой как экран прикладной программы. Устройство 114 ввода может быть, например, клавиатурным устройством ввода, сенсорной панелью, вспомогательной управляющей клавиатурой (например, сенсорной вспомогательной клавиатурой и игровой клавиатурой), мышью, клавиатурой или микрофоном.

На фиг. 2 блок 102 управления содержит внутреннюю память, которая хранит управляющую программу, такую как операционная система (OS), компьютерная программа, указывающая различные типы процедур обработки, и требуемые данные. Блок 102 выполняет обработку информации для выполнения различных типов обработки, основываясь на этих компьютерных программах. Блок 102 управления функционально и концептуально содержит блок 102a сбора данных структуры компаунда, блок 102b сбора данных структуры протеинов, блок 102c определения предсказанного протеина, блок 102d определения силы взаимодействия и блок 102e предсказания влияния.

Блок 100a сбора данных структуры компаунда собирает данные структуры компаундов для компаунда из базы 106a данных структуры компаундов. Альтернативно, блок 102a сбора данных структуры компаундов предсказывает и собирает данные структуры компаундов, не хранящиеся в базе 102a данных структуры компаундов, используя способ предсказания структуры.

Блок 102b сбора данных структуры протеинов собирает данные структуры возможных протеинов, соответствующие данным структуры протеинов для возможного протеина, служащего в качестве протеина возможного для взаимодействия с компаундом, из базы 106b данных структуры протеинов. Альтернативно, блок 102b сбора данных структуры протеинов предсказывает и собирает данные структуры возможных протеинов, не хранящиеся в базе 106b данных структуры протеинов, используя способ предсказания структуры. Блок 102b сбора данных структуры протеинов может предсказывать и собирать данные структуры возможных протеинов, предсказывая множество фрагментов данных структуры протеинов, используя способ предсказания структуры, и создавать всестороннюю оценку фрагментов данных структуры протеинов, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Блок 102b сбора данных структуры протеинов может предсказывать и собирать данные структуры возможных протеинов, используя способ предсказания структуры, основанный на генетических данных, хранящихся в базе 106c генетических данных.

Основываясь на данных структуры компаундов, полученных блоком 102a сбора данных структуры компаундов, и данных структуры возможных протеинов, собранных блоком 102b сбора данных структуры протеинов, блок 102c определения предсказанного протеина вычисляет силу связывания между возможным протеином и компаундом, используя способ моделирования стыковки. Блок 102c определения предсказанного протеина затем определяет предсказанную силу связывания, соответствующую силе связывания, в конечном счете, предсказанной при создании всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Таким образом, блок 102c определения предсказанного протеина определяет предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом. Блок 102c определения предсказанного протеина может создавать всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в блоке запоминающего устройства. Блок 102c определения предсказанного протеина может создавать всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в базе данных 106e данных подобия структуры протеинов.

Основываясь на данных структуры компаунда, собранных блоком 102a сбора данных структуры компаундов, и данных структуры протеинов для предсказанного протеина, определенного блоком 102c определения предсказанного протеина, блок 102d определения силы взаимодействия вычисляет силу связывания, используя способ моделирования силы связывания. Блок 102d определения силы взаимодействия затем определяет предсказанную силу взаимодействия, соответствующую силе взаимодействия, в конечном счете, предсказанной при создании всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Блок 102d определения силы взаимодействия может создавать всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в базе 106d данных межмолекулярного взаимодействия. Блок 102d определения силы взаимодействия может создавать всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в базе 106e данных подобия структуры протеинов.

Основываясь на предсказанной силе взаимодействия, определенной блоком 102d определения силы взаимодействия, и сетевых данных, хранящихся в базе 106b данных структуры протеинов, блок 102e предсказания влияния предсказывает влияние компаунда на предсказанный протеин. Влияние может быть действием (например, активирующим действием и запрещающим действием). Влияние компаунда на протеин может быть, например, активацией или деактивацией протеина, вызванной компаундом.

На этом объяснение примера конфигурации устройства 100 предсказания взаимодействия, соответствующего настоящему изобретению, заканчивается.

Процесс работы устройства 100 предсказания взаимодействия

Ниже процесс, выполняемый устройством 100 предсказания взаимодействия, имеющим конфигурацию, соответствующую настоящему варианту осуществления, объясняется более подробно со ссылкой на фиг. 3-9. На фиг. 3 представлена блок-схема последовательности выполнения операций примера процесса, выполняемого устройством 100 предсказания взаимодействия, соответствующего настоящему изобретению.

Как показано на фиг. 3, когда пользователь разрабатывает новое лекарственное средство и т.п., блок 102a сбора данных структуры компаундов собирает данные структуры компаундов (данные молекулярной структуры) для структуры возможных компаундов, служащих в качестве компаунда, возможного для нового лекарственного средства, из базы 106a данных структуры компаундов. Альтернативно, блок 102a сбора данных структуры компаундов предсказывает и собирает данные структуры компаундов, не хранящиеся в базе 102a данных структуры компаундов, используя способ предсказания структуры (этап SB-1). Данные структуры компаундов могут вводиться через устройство 114 ввода и храниться в базе 106a данных структуры компаундов заранее или когда выполняется процесс.

Способ предсказания протеина может быть одним или другим или двумя такими способами, такими как способ, основанный на шаблоне (моделирование на основе шаблона), для оценки структуры протеина с неизвестной структурой, исходя из структуры протеина с известной структурой, и способ без шаблона (моделирование без шаблона) для оценки структуры протеина с неизвестной структурой, исходя из последовательности аминокислот, широко используемых для предсказания структуры. Могут использоваться различные типы способов, основанные на шаблоне, в том числе, гомологическое моделирование и способ на основе распознавания перегиба. Способ предсказания структуры может быть способом сборки фрагментов. Способ сборки фрагментов является способом предсказания структуры протеина с неизвестной структурой посредством поиска подобия между частью последовательности аминокислот протеина с неизвестной структурой и последовательностью аминокислот протеина с известной структурой, предсказания структуры части протеина с неизвестной структурой на основе результата поиска и объединения множества предсказаний. Способ предсказания структуры может быть способом создания предсказания структуры протеина как игры и сбора структуры протеина с неизвестной структурой (например, сбор структуры через сеть 300), предсказанной внешней системой 200 (например, предсказанной многочисленными третьими сторонами (внешними пользователями) с помощью внешней системы 200). Способ предсказания структуры может выполняться, одновременно используя эти способы параллельно внутри возможного и обоснованного диапазона. Основываясь на результатах оценки этих способов, создается всесторонняя оценка, предсказывая, таким образом, структуру протеина с неизвестной структурой.

Блок 102b сбора данных структуры протеина собирает из базы 106b данных структуры протеинов данные структуры возможного протеина, соответствующие данным структуры протеинов для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с компаундом. Альтернативно, блок 102b сбора данных структуры протеина предсказывает и собирает данные структуры возможного протеина, не хранящиеся в базе 106b данных структуры протеинов, используя способ предсказания структуры (этап SB-2). Блок 102b сбора данных структуры протеина может предсказывать и собирать данные структуры возможного протеина, предсказывая множество фрагментов данных структуры протеина, используя способ предсказания структуры, и создавать всестороннюю оценку фрагментов данных структуры протеина, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Блок 102b сбора данных структуры протеина может предсказывать и собирать данные структуры возможного протеинов, используя способ предсказания структуры, основанный на генетических данных (данных персонального генома) для генов пользователя, хранящихся в базе 106c генетических данных. Этот механизм может предсказывать данные структуры возможного протеина, учитывая, что различие в последовательности генов между индивидуумами может, вероятно, влиять на структуру протеина и изменять взаимодействие с возможным компаундом, изменяя, тем самым, влияние возможного компаунда. Генетические данные могут вводиться пользователем через устройство 114 ввода и сохраняться в базе 106c генетических данных заранее или когда выполняется процесс.

Блок 102b сбора данных структуры протеинов может указывать одну или множество сетей по желанию пользователя (например, сети, относящиеся к биологическому эффекту, который желает знать пользователь) и указывать возможный протеин из числа части или всех протеинов в сетях. Блок 102b сбора данных структуры протеинов может, например, указывать структуру каждого протеина во внутриклеточной или интравитальной сети (например, сети внутримолекулярного взаимодействия, сети передачи сигналов, сети метаболизма и сети генетического управления) и собирать из базы 106b данных структуры протеинов данные структуры возможного протеина. Чтобы предсказать, какой протеин взаимодействует с определенным компаундом, возможный протеин может указываться, используя список из множества протеинов. Указывая сети, как описано выше, можно предотвратить большие затраты времени на вычисления для протеина, не имеющего связи с специализированным биологическим влиянием, и предотвратить отсутствие требуемого протеина в списке. Данные из сетей могут вводиться пользователем через устройство 114 ввода и сохраняться в базе 106b данных структуры протеина заранее или когда выполняется процесс. Если в базе 106b данных структуры протеинов никакие данные структуры протеина не хранятся, блок 102b поиска данных структуры протеинов может предсказывать данные структуры возможного протеина посредством различных типов вычислительных способов, то есть, способов предсказания структуры, основанных на молекулярной динамике, и т.п. или способов, использующих сеть подобия протеинов. Блок 102b сбора данных структуры протеинов может вводить в действие систему метаоценки, создающую конечную оценку, основываясь на множестве различных типов оценок. Система метаоценки может использовать первичную последовательность и структуру протеина с известной структурой и результаты оценки соответствующими способами оценки. Таким образом, система метаоценки может предсказывать структуру протеина с неизвестной структурой, получаемую как оценка оптимума, используя способ обучения, такой как нейронная сеть и векторная машина поддержки. Поскольку для способа обучения важно точно предсказывать структуру протеина, особенно, более точно предсказывать структуру места, связанного с взаимодействием с компаундом, позиция при обучении может взвешиваться. Если доступны генетические данные пользователя, блок 102b сбора данных структуры протеина может анализировать область кодирования каждого протеина, основываясь на генетических данных, и определять, изменяется ли структура и т.п. протеина, основываясь на известных данных. Если такие данные неизвестны, блок 102b сбора данных структуры протеина может предсказывать структуру данных возможного протеина посредством оценки влияния (например, изменяется ли структура протеина), используя различные типы способов вычислений и учитывая влияние.

При всесторонней оценке, соответствующей настоящему варианту осуществления, структура протеина может оцениваться, выполняя заранее множество способов оценки структуры протеина (способов оценки), содержащихся в настоящей системе, для множества протеинов с известной структурой. При всесторонней оценке способ обучения, такой как нейронная сеть и векторная машина поддержки, может использоваться для изучения информации, указывающей, какой способ оценки имеет более высокую точность оценки для структуры протеина, имеющего определенные характеристики, и для частичной структуры определенного протеина. При всесторонней оценке эти результаты обучения могут использоваться для оценки структуры протеина с неизвестной структурой. Выполняя взвешивание с определенным коэффициентом результатов оценки, полученных способами предсказания структуры, данные структуры возможного протеина могут быть предсказаны и собраны. Другими словами, при всесторонней оценке, соответствующей настоящему варианту осуществления, каждый способ предсказания структуры использует свои характеристики, которые в этом случае или для части способа могут создавать, например, оценку с высокой точностью. Если просто используется решение большинства и т.п., то результат варьируется в зависимости от выбора используемого способа оценки. При всесторонней оценке, соответствующей настоящему варианту осуществления, заданный способ обучения используется для результатов оценки, полученных способами предсказания структуры, предотвращая, таким образом, предвзятость.

Основываясь на данных структуры компаундов, собранных блоком 102a сбора данных структуры компаунда, и данных структуры возможного протеина, собранных блоком 102b сбора данных структуры протеинов, блок 102c определения предсказанного протеина вычисляет силу связывания между возможным протеином и компаундом, используя способ моделирования стыковки. Блок 102c определения предсказанного протеина затем определяет предсказанную силу связывания, соответствующую силе связывания, в конечном счете, предсказанной при создании всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Таким образом, блок 102c определения предсказанного протеина отображает данные результата для возможного протеина и предсказанную силу связывания на блоке 112 отображения способом, выбираемым пользователем через устройство 114 ввода (этап SB-3). Блок 102c отображения предсказанного протеина может создавать всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в базе 106d данных межмолекулярного взаимодействия. Данные межмолекулярного взаимодействия могут вводиться пользователем через устройство 114 ввода и сохраняться в базе 106d данных межмолекулярного взаимодействия заранее или когда выполняется процесс. Блок 102c определения предсказанного протеина может создавать всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в базе 106e данных подобия структуры протеинов. Данные подобия структуры протеинов могут вводиться пользователем через устройство 114 ввода и храниться в базе 106a данных подобия структуры протеинов заранее или когда выполняется процесс.

Другими словами, блок 102c определения предсказанного протеина может провести моделирование стыковки каждого возможного протеина с рядом возможным компаундов, чтобы вычислить силу связывания. Блок 102c определения предсказанного протеина может проводить моделирование стыковки, используя множество фрагментов программного обеспечения моделирования стыковки, чтобы определить окончательную предсказанную силу связывания, оценивая результаты, но не индивидуально, а всесторонне. Различие в методологиях, используемых в различных фрагментах программного обеспечения моделирования стыковки ведет к отклонению в точности предсказания. Для решения этой проблемы блок 102c определения предсказанного протеина может оценивать выходные тенденции (отклонения) соответствующих фрагментов программного обеспечения, используя, таким образом, комбинацию оптимальных результатов предсказания. В этом случае, блок 102c определения предсказанного протеина может использовать различные типы способов обучения, такие как нейронная сеть и векторная машина поддержки. Другими словами, блок 102c определения предсказанного протеина может использовать способ обучения с подготовкой множества комбинаций, в которых известны экспериментально корректируемые значения, проводить моделирование каждым способом и сравнивать результат и фактическое экспериментальное значение. В этом случае, блок 102c определения предсказанного протеина может принимать данные для структур компаунда и протеина, результаты оценки соответствующих фрагментов программного обеспечения моделирования и т.п. и использовать значение, полученное в реальном эксперименте в качестве контрольных данных (контрольного сигнала).

Блок 102c определения предсказанного протеина может использовать результаты, полученные при обучении в системе метаоценки, создавая, таким образом, оценку связывания между компаундом и протеином, не имеющего измеренного значения. С точки зрения обучения, чтобы предсказать данные для протеина и компаунда или взаимодействия между протеинами, выполняется группировка, основанная на данных для множества связанных с этим протеинов, и затем обучение выполняется в каждой группе. Становится возможным повысить точность предсказания, обеспечиваемую системой метаоценки, используя эти результаты. Если для некоторых биомолекул (протеинов), имеющих схожую структуру, известно взаимодействие с возможным компаундом, блок 102c определения предсказанного протеина может использовать такие данные для создания оценки. PSIN и т.п. могут использоваться для поиска биомолекул, имеющих схожую структуру. Блок 102c определения предсказанного протеина может отображать все результаты соответствующих модулей предсказания и результаты системы метаоценки на блоке 112 отображения, позволяя, таким образом, пользователю какие результаты использовать.

Ниже объясняется пример процесса определения предсказанной силы связывания, соответствующего настоящему варианту осуществления со ссылкой на фиг. 4 и 5. На фиг. 4 и 5 схематично представлен пример процесса определения предсказанной силы связывания, соответствующего настоящему варианту осуществления.

Как показано на фиг. 4, блок 102c определения предсказанного протеина выводит результат 1 оценки, результат 2 оценки и результат 3 оценки силы связывания между возможным протеином и возможным компаундом, используя способы моделирования стыковки для моделирования 1 стыковки, моделирования 2 стыковки и моделирования 3 стыковки, соответственно, основываясь на данных структуры компаунда и данных структуры протеина (данных структуры возможного протеина). Блок 102c определения предсказанного протеина затем определяет предсказанное значение (предсказанную силу связывания), соответствующее силе связывания, в конечном счете, предсказанной посредством создания всесторонней оценки результата 1 оценки, результата 2 оценки и результата 3 оценки, используя способ обучения, выполняемый системой обучения, использующей измеренное значение силы связывания в качестве контрольных данных.

Как показано на фиг. 5, блок 102c определения предсказанного протеина выводит результат 1 оценки, результат 2 оценки и результат 3 оценки силы связывания между возможным протеином и возможным компаундом, используя способы моделирования стыковки для моделирования 1 стыковки, моделирования 2 стыковки и моделирования 3 стыковки, соответственно, основываясь на данных структуры компаунда и данных структуры протеина (данных структуры возможного протеина). Блок 102c определения предсказанного протеина затем определяет предсказанное значение (предсказанную силу связывания), соответствующее силе связывания, в конечном счете, предсказанной посредством создания всесторонней оценки результата 1 оценки, результата 2 оценки и результата 3 оценки, используя способ обучения, выполняемый системой обучения, использующей измеренное значение силы связывания в качестве контрольных данных.

Возвращаясь к фиг. 3, если пользователь выбирает данные результата через устройство 114 ввода, блок 102c определения возможного протеина определяет возможный протеин, предсказанный для взаимодействия с возможным компаундом, в качестве предсказанного протеина, основываясь на данных результата, выбранных пользователем (этап SB-4).

Основываясь на данных структуры компаунда, собранных блоком 102a сбора данных структуры компаундов, и данных структуры протеина для предсказанного протеина, определенного блоком 102c определения предсказанного протеина, блок 102d определения силы взаимодействия вычисляет силу связывания, используя способ моделирования силы связывания. Блок 102d определения силы взаимодействия затем определяет предсказанную силу взаимодействия, соответствующую силе взаимодействия, в конечном счете, предсказанной при создании всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки (этап SB-5). Блок 102d определения силы взаимодействия может создавать всестороннюю оценку, дополнительно используя данные межмолекулярного взаимодействия, хранящиеся в базе 106d данных межмолекулярного взаимодействия. Блок 102d определения силы взаимодействия может создавать всестороннюю оценку, дополнительно используя данные подобия структуры протеинов, хранящиеся в базе 106e данных подобия структуры протеинов. Другими словами, блок 102d определения структуры взаимодействия может создавать предсказание силы взаимодействия для комбинаций компаундов и протеинов, предсказанных для взаимодействия друг с другом. Блок 102d определения силы взаимодействия может использовать способ обучения, основываясь на результатах множества способов оценки и измеренном значении.

Способ моделирования силы связывания (способ оценки силы связывания), соответствующий настоящему варианту осуществления, может быть способом оценки, использующим функцию количественной оценки. Функция количественной оценки (например, X-CSCORE) может быть уравнением, имеющим одно, несколько или все взаимодействия ван дер Ваальса между компаундом и протеином, водородную связь, эффект разрушения структуры и гидрофобный эффект в качестве переменных и решаемым для оценки силы связывания. Доступно большое количество таких функций количественной оценки и комбинация, достигающая оценки с высокой точностью, варьируется в зависимости от функций количественной оценки. Если просто используется решение большинства и т.п., то результат варьируется в зависимости от выбора используемой функции количественной оценки. При способе моделирования силы связывания, соответствующем настоящему варианту осуществления, заданный способ обучения может использоваться для сил связывания, оцененных с помощью множества функций количественной оценки, предотвращая, таким образом, предвзятость.

Ниже объясняется пример процесса определения предсказанной силы взаимодействия, соответствующего настоящему варианту осуществления со ссылкой на фиг. 6 и 7. На фиг. 6 и 7 схематично представлен пример процесса определения предсказанной силы взаимодействия, соответствующего настоящему варианту осуществления.

Как показано на фиг. 6, блок 102d определения силы взаимодействия выводит результат 1 оценки, результат 2 оценки и результат 3 оценки силы связывания, используя способы силы связывания для моделирования 1 силы связывания, моделирования 2 силы связывания и моделирования 3 силы связывания, соответственно, основываясь на данных структуры компаунда и данных структуры протеина. Блок 102d определения силы взаимодействия затем определяет оценочное значение (предсказанную силу взаимодействия), соответствующее силе взаимодействия, в конечном счете, предсказанной посредством создания всесторонней оценки результата 1 оценки, результата 2 оценки и результата 3 оценки, используя способ обучения, выполняемый системой обучения, использующей измеренное значение силы взаимодействия в качестве контрольных данных.

Как показано на фиг. 7, блок 102d определения силы взаимодействия выводит результат 1 оценки, результат 2 оценки и результат 3 оценки силы связывания, используя способы моделирования силы связывания для моделирования 1 силы связывания, моделирования 2 силы связывания и моделирования 3 силы связывания, соответственно, основываясь на данных структуры компаунда и данных структуры протеина. Блок 102d определения силы взаимодействия затем определяет оценочное значение (предсказанную силу взаимодействия), соответствующее силе взаимодействия, в конечном счете, предсказанной посредством создания всесторонней оценки результата 1 оценки, результата 2 оценки и результата 3 оценки, используя способ метаоценки, выполняемый системой метаоценки.

Ниже объясняется пример процесса предсказания силы взаимодействия, соответствующего настоящему варианту осуществления, со ссылкой на фиг. 8. На фиг. 8 схематично представлен пример процесса предсказания силы взаимодействия, соответствующего настоящему варианту осуществления.

Как показано на фиг. 8, если пользователь вводит через устройство 114 ввода список возможных компаундов для возможных компаундов, служащих в качестве компаунда, возможного для нового лекарственного средства, модуль презентации структуры компаунда (блок 102a сбора данных структуры компаунда) собирает данные молекулярной структуры компаунда (данные структуры компаунда) для структуры возможного компаунда из базы данных (DB) компаундов (базы 106a данных структуры компаундов). Альтернативно, модуль презентации структуры компаунда предсказывает и собирает данные молекулярной структуры компаундов, не хранящиеся в DB компаундов, используя способ оценки структуры компаундов (способ предсказания структуры). Модуль презентации структуры компаундов затем сохраняет данные молекулярной структуры компаундов в запоминающем устройстве молекулярной структуры компаундов (например, в памяти, такой как RAM).

Модуль презентации биомолекулярной структуры (блок 102b сбора данных структуры протеинов) собирает биомолекулярный список, принадлежащий к сети биомолекулярного взаимодействия, относящейся к биологическому эффекту, который желательно знать для пользователя. Модуль презентации биомолекулярной структуры собирает данные биомолекулярной структуры (данные структуры возможного протеина), соответствующие данным структуры протеинов для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с возможным компаундом, и содержащегося в биомолекулярном списке из DB молекулярных структур (базы 106b данных структуры протеинов). Альтернативно, если доступны индивидуальные генетические данные пользователя, модуль презентации биомолекулярной структуры собирает список генетических типов из индивидуальных генетических данных. Модуль презентации биомолекулярной структуры предсказывает и собирает данные биомолекулярной структуры, не хранящиеся в базе 106b данных структуры протеинов, используя оценку молекулярной структуры и способ вычислений (способ предсказания структуры), в то же время учитывая влияние структуры генов, содержащихся в списке генетических типов, например, изменяющих структуру протеина. Модуль презентации биомолекулярной структуры затем сохраняет данные биомолекулярной структуры в запоминающем устройстве биомолекулярной структуры компаунда (например, в памяти, такой как RAM).

Основываясь на данных молекулярной структуры компаундов, хранящихся в запоминающем устройстве молекулярной структуры компаундов, и данных биомолекулярной структуры, хранящихся в запоминающем устройстве биомолекулярной структуры, модуль предсказания силы взаимодействия (блок 102c определения предсказанного протеина) вычисляет силу связывания между возможным протеином и компаундом, используя способ моделирования стыковки. Модуль предсказания силы взаимодействия затем определяет предсказанную силу связывания, соответствующую силе связывания, в конечном счете, предсказанной посредством создания всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки. Таким образом, модуль предсказания силы взаимодействия определяет предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с компаундом.

Основываясь на данных молекулярной структуры компаундов, хранящихся в запоминающем устройстве молекулярной структуры компаундов, и данных структуры протеинов для предсказанного протеина, определенного модулем предсказания силы взаимодействия, модуль предсказания силы взаимодействия (блок 102d определения силы взаимодействия) вычисляет силу связывания, используя способ моделирования силы связывания. Модуль предсказания силы взаимодействия, в конечном счете, предсказывает силу взаимодействия (предсказанную силу взаимодействия), создавая всестороннюю оценку силы связывания, используя следующие способы. Способами являются способ метаоценки, оценка на основе подобной структуры, основанная на данных подобия структуры протеинов, хранящихся в базе 106e данных подобия структуры протеинов, и способ обучения, использующий данные межмолекулярного взаимодействия, хранящиеся в DB взаимодействия (база 106d данных межмолекулярного взаимодействия) в качестве данных обучения.

Возвращаясь к фиг. 3, основываясь на предсказанной силе взаимодействия, определенной блоком 102d определения силы взаимодействия, и сетевых данных, хранящихся в базе 106b данных структуры протеинов, блок 102e предсказания влияния предсказывает эффект активации или эффект запрета возможного компаунда для предсказанного протеина (этап SB-6) и заканчивает процесс.

Ниже объясняется пример процесса предсказания влияния, соответствующего настоящему варианту осуществления, со ссылкой на фиг. 9. На фиг. 9 схематично представлен пример процесса предсказания влияния, соответствующего настоящему варианту осуществления.

Как показано на фиг. 9, модуль предсказания активации/деактивации (блок 102e предсказания влияния) предсказывает активацию или деактивацию, вызванную возможным компаундом для предсказанного протеина, основываясь на предсказанной силе взаимодействия, определенной блоком 102d определения силы взаимодействия, и сетевых данных для интравитальной сети, содержащей позиционные данные для положения биомолекулы (протеина) в сети, хранящейся в базе 106b данных структуры протеинов. Модуль предсказания активации/деактивации создает предсказание, используя способ моделирования стыковки, оценку по подобной структуре, основываясь на данных подобия структуры протеинов, хранящихся в базе 106e данных подобия структуры протеинов, и способ обучения, использующий данные межмолекулярного взаимодействия, хранящиеся в DB взаимодействия (база 106d данных межмолекулярного взаимодействия) в качестве данных обучения. Модуль предсказания активации/деактивации может указывать, какой протеин относительно изменяется в направлении активации или в направлении запрета по отношению к опорному стандарту посредством качественного распространения направления изменения для модели сети, и может ли результат изменяться посредством количественного анализа.

Другими словами, модуль предсказания активации/деактивации устанавливает маркер "-" для запрещающего свойства и "+" для активного свойства, исходя из части, относящейся к взаимодействию для возможного компаунда, и распространяет маркеры по модели сети. Если эффект запрещения распространяется, в то время, как запрещающее свойство в месте назначения поддерживается, например, модуль предсказания активации/деактивации удерживает "-" и помещает отметку "-" на каждый протеин в модели сети. Если распространяющееся запрещающее свойство изменяется на активное свойство, модуль предсказания активации/деактивации заменяет отметку на "+" и наносит отметку "+" на каждый последующий протеин. После распространения модуль предсказания активации/деактивации проверяет, какая отметка назначена узлу в модели сети, представляющей каждый протеин. Модуль предсказания активации/деактивации может предсказать, что только протеин с назначенной отметкой "-" запрещается и только протеин с назначенной отметкой "+" активируется. Как показано на фиг. 9, модуль предсказания активации/деактивации может дополнительно предоставлять пользователю сетевые данные биомолекулярного взаимодействия (например, диаграмму сети биомолекулярного взаимодействия), визуально представляя силу взаимодействия между биомолекулой и компаундом (данные могут отображаться, например, на блоке 112 отображения). Как показано на фиг. 9, модуль предсказания активации/деактивации может дополнительно предоставлять пользователю сетевые данные биомолекулярного взаимодействия (например, диаграмму сети биомолекулярного взаимодействия), визуально представляя силу взаимодействия между биомолекулой и компаундом и активацию/деактивацию (данные могут отображаться, например, на блоке 112 отображения).

Если предсказания активации и деактивации предсказанного протеина смешиваются, модуль оценки параметров модели (блок 102e предсказания влияния) нуждается в количественном анализе, независимо от того, активирован или не активирован протеин. Модуль оценки параметров модели использует группу модели вычислений, отражающую предсказанный эффект (активация или деактивакция) возможного компаунда для предсказанного протеина, таким образом, динамически анализируя интравитальную сеть. Модуль оценки параметров модели может предсказывать, какого рода влияние возможный компаунд оказывает на живое тело с помощью способа моделирования и анализа, используя любой из двух или оба из числа другого модуля и известных экспериментальных данных и собирает предсказание как результат оценки влияния возможного компаунда. Модуль оценки параметров модели сравнивает модель, предполагающую протеин в качестве стандарта при вычислении, причем модель предполагает протеин, содержащий изменение, вызванное генетическим типом, основанным на индивидуальных генетических данных, и модель отражает различие в протеинах, вызванное множеством фрагментов индивидуальных генетических данных. Таким образом, модуль оценки параметров модели может предсказывать различие между индивидуумами с точки зрения влияния возможного компаунда на предсказанный протеин и собирать предсказание как результат оценки влияния персонального генома. Способ, соответствующий настоящему варианту осуществления также может использоваться для предсказания токсичности возможного компаунда, указывая целевую сеть и протеины, содержащиеся в ней. Способ, соответствующий настоящему варианту осуществления, может также использоваться для проверки воздействия возможного компаунда на болезни, отличные от первоначально предполагаемой болезни, вводя сети, отличные от сети, связанной с болезнью, первоначально предполагавшейся для возможного компаунда как объекта вычисления.

Настоящий способ может применяться к предсказанию взаимодействия между протеинами. Настоящий способ может также применяться к использованию химического вещества для завода, нацеленного на получение отдачи от аренды, повышенной производительности или, например, повышенной переносимости стрессов.

На этом объяснение примера процесса, выполняемого устройством 100 предсказания взаимодействия, соответствующего настоящему изобретению, заканчивается.

Примеры

Ниже объясняются примеры, в которых способ предсказания взаимодействия, соответствующий настоящему варианту осуществления, применяется к ряду возможных компаундов, предсказывая, таким образом, силы связывания между рядом возможных компаундов и рядом биомолекул (протеинов) со ссылкой на фиг. 1-15.

На фиг. 10-12 представлены графики результатов, полученных посредством вычисления и предсказания силы связывания между пятью типами компаундов (AMP, ATP, Lapatinib, Sunitinib и Tiliroside) и тремя типами биомолекул (mTOR, PDK1 и PTEN), используя способ моделирования стыковки в соответствии с настоящим вариантом осуществления. Как показано на фиг. 10-12, количественная оценка, представленная крайним левым столбцом каждой биомолекулы, указывает значение связывания (силу связывания) между биомолекулой и собственным лигандом. Другие количественные оценки для каждой биомолекулы указывают силу связывания между биомолекулой и AMP, ATP, Lapatinib, Sunitinib и Tiliroside по порядку слева. Другими словами, на фиг. 10-12 показан выходной результат, когда пользователь выбирает пять типов компаундов, определяет для анализа систему трансдукции сигналов mTOR и решает не анализировать все протеины в системе трансдукции, а отображать, например, предсказание только для mTOR, PDK1 и PTEN из числа протеинов. Относительное значение относительно собственного лиганда может использоваться в качестве опорного значения силы связывания между каждой биомолекулой и каждым компаундом. Альтернативно, разница относительно собственного лиганда может использоваться в качестве относительной силы связывания, основываясь на отдельно определенной функции.

Конкретно, на фиг. 10 показан результат оценки моделирования стыковки eHITS, когда только eHITS используется в настоящем варианте осуществления, то есть, результат предсказания вычисления сил связывания между пятью типами компаундов и тремя типами биомолекул. На фиг. 11 показан результат оценки моделирования стыковки GOLD, когда только GOLD используется в настоящем варианте осуществления. На фиг. 12 показан результат оценки моделирования стыковки MOE, когда только MOE используется в настоящем варианте осуществления. Как описано выше, настоящий вариант осуществления может иметь функцию обеспечения пользователя не только результатом всесторонней оценки множества результатов и исчерпывающего анализа по всей сети, но также результатом, полученным конкретным способом, выбранным пользователем при сосредоточении на конкретной молекуле. Как показано на фиг. 10-12, один способ (моделирования стыковки) однако, часто недостаточен. Другими словами, результат оценки может, возможно, значительно варьироваться в зависимости от способов, как показано на фиг. 10-12. Конкретно, в результате оценки, полученной посредством eHITS, показанным на фиг. 10, сила связывания между mTOR и Lapatinib явно выше, чем между mTOR и Sunitinib. В результате оценки, полученном посредством MOE, показанным на фиг. 10, сила связывания между mTOR и Lapatinib несколько выше, чем между mTOR и Lapatinib. В результате оценки, полученном посредством GOLD, показанном на фиг. 10, сила связывания между mTOR и Lapatinib и между mTOR и Sunitinib не оценивалась. Как описано выше, оценка с помощью одного способа может, вероятно, столкнуться, с расхождением между каждым способом оценки и его технологическими ограничениями. Чтобы решить эту проблему, настоящий вариант осуществления может определить предсказанную силу связывания с помощью всесторонней оценки силы связывания, используя любой из двух или оба таких способа, как способ обучения и способ метаоценки.

На фиг. 13 показан график результата анализа компаундов AZD6244, CI-1040, PD0325901 и TAK-733 на основе клинического испытания в качестве ингибитора MEK в соответствии с настоящим вариантом осуществления. Как показано на фиг. 13, все компаунды в сильной степени взаимодействуют с MEK 2. Способ предсказания взаимодействия, соответствующий настоящему варианту осуществления, предсказывает, что компаунды сильнее взаимодействуют с BRAF, IGF1R, Wee1 и т.п.

На фиг. 14 показана диаграмма, полученная посредством цветового кодирования сети взаимодействия биомолекул, основываясь на силе взаимодействия, полученной из результата анализа, показанного на фиг. 13. Как видно на фиг. 14, окраска выполняется для протеинов, предсказанных для взаимодействия с компаундами (AZD6244, CI-1040, PD0325901 и TAK-733), подвергнутыми клиническому испытанию определения MEK в качестве цели, основываясь на результате анализа, показанном на фиг. 13. Эти компаунды взаимодействуют с различными типами протеинов, значительно превосходя ожидания пользователя (например, фармацевтической компании). Взаимодействие распространяется на систему трансдукции сигналов, относящуюся к той же самой физиологической функции. Сомнительно, может ли результат, полученный от культурных клеток при клиническом испытании, быть свойственен запрещению протеина MEK. Как показано на фиг. 14, использование способа предсказания взаимодействия, соответствующего настоящему варианту осуществления, делает более разумным предположить, что компаунды оказывают влияние на всесторонний результат взаимодействия с BRAF, IGF1R, Wee1, APC, EGFR, IGF-1 и AKT1, помимо запрещения протеина MEK.

Если каждый возможный компаунд взаимодействует с каждой биомолекулой заданным образом, для настоящего варианта осуществления необходимо определить, увеличивает или уменьшает возможный компаунд активность биомолекулы, служащей в качестве другой стороны взаимодействия. Кроме того, на этом этапе настоящий вариант осуществления использует методологию проведения выбора из множества способов или всестороннее определение. Настоящий вариант осуществления может использовать систему метаоценки, используя результаты, полученные множеством способов, уже используемые для предсказания силы связывания. Если комбинация целевой биомолекулы и возможного компаунда сохраняется в базе данных по взаимодействию между многими биомолекулами и компаундами, информация об активации и деактивации может быть собрана из базы данных. Если известный лиганд или компаунд взаимодействует с целевым протеином, настоящее изобретение, например, определяет, что лиганд или компаунд активирует протеин. Если целевой лиганд или компаунд взаимодействует с протеином в одной и той же форме связывания, также предполагается, что компаунд активирует протеин.

Если молекула, которая активирует протеин действует конкурентно с целевым лигандом или компаундом, предполагается, что лиганд или компаунд запрещается. Предположим, что лекарственное средство (компаунд) A связывается с конкретной областью связывания протеина X и что, например, молекула Y, одновременно связывающаяся с областью X связывания, активирует протеин X. В этом случае, компаунд A и молекула Y конкурентно взаимодействуют с одним и тем же доменом связывания (карманом связывания) для X. Лекарственное средство A может, вероятно, запретить взаимодействие между молекулой Y и протеином X и функционировать в манере запрещения. В этом случае, если лекарственное средство A и молекула Y просто взаимодействует с одним и тем же доменом протеина X, лекарственное средство A функционирует как ингибитор взаимодействия между молекулой Y и протеином X, делая его неопределенным независимо от того, стимулируется ли активирование дополнительно. Чтобы решить эту проблему, если база данных молекул, взаимодействующих с одним и тем же доменом протеина X и направлением действия, доступна, настоящий вариант осуществления может обращаться к базе данных.

С точки зрения основных протеинов, часто экспериментально известно, какой участок другого протеина каждого из основных протеинов взаимодействует и к какому виду эффекта взаимодействия приводит в результате. Если неизвестны никакие экспериментальные данные о том, какой участок другого протеина каждого из основных протеинов взаимодействует и какого рода эффект взаимодействия происходит в результате, но существует комбинация биомолекулы, имеющей подобную структуру, и возможный компаунд, настоящий вариант осуществления, используя информацию, может определить активацию или деактивацию. Каждый раз, когда разрабатывается более точный способ, настоящий вариант осуществления может обновляться и заново вводить новый способ. Подобие структуры может быть подобием всей молекулы или части (фрагмента) молекулы. Настоящий вариант осуществления может также вводить способ определения активации или деактивации, основываясь на подробном положении, в котором биомолекула взаимодействует с возможным компаундом, пока способ достаточно точен. Предсказания, сделанные этими способами, ведут к конечному результату, получаемому способом, содержащим характеристики способа. При этом процессе настоящий вариант осуществления может вводить способ создания конечного предсказания, используя такой способ, как нейронная сеть и способ статистического обучения. Таким образом, настоящий вариант осуществления может определять всестороннее влияние каждого возможного компаунда.

Допустим, что доступна модель вычислений, в которой параметры, требующиеся для выполнения динамического моделирования различными видами способа, уже определены для сети биомолекулярного взаимодействия, относящейся к целевому жизненно важному явлению. Эти параметры могут определяться, проводя вычисление, так чтобы поведение модели совпадало с экспериментальными данными, с помощью любого одного, нескольких или всех генетических алгоритмов, стохастической нормализации и градиента, спадающего, используя последовательные во времени данные фосфорилированного протеина, полученного, например, применением известного стимула к обычной клетке.

Настоящий вариант осуществления может проводить вычисление моделирования, основываясь на том, какого рода изменение происходит, когда каждый возможный компаунд применяется к биомолекуле (протеину), по сравнению с состоянием, когда никакой возможный компаунд не применяется к биомолекуле. При одном способе настоящий вариант осуществления может определять поведение в состоянии, в котором никакой возможный компаунд и т.п. не применяется, предполагая, таким образом, состояние, когда применяется один возможный компаунд. Настоящий вариант осуществления может устанавливать уравнение со значениями KD, Kd, Ka и т.п., варьирующимися в зависимости от объема и т.п. возможного компаунда, применяемого к каждой биомолекуле, предсказанной для взаимодействия с возможным компаундом. Настоящий вариант осуществления может выполнять схожий процесс для ряда возможных компаундов. На этом этапе модель вычисления может вычислять, насколько большая возникает разница в межмолекулярной реакции, когда определенный объем возможного компаунда применяется к биомолекуле (протеину) по сравнению с состоянием, в котором никакой возможный компаунд не применяется.

Если ряд дифференциальных уравнений устанавливается в качестве модели системы трансдукции сигнала клетки, то в дифференциальное уравнение, например, добавляется влияние возможного компаунда. Решая дифференциальное уравнение, вычисляется и предсказывается реактивность клетки с применяемым возможным компаундом. Делая вычисление для ряда возможных компаундов, можно предсказать какого рода воздействие каждый из возможных компаундов оказывает на целевую биологическую систему. На фиг. 15 показан график примера предсказания вычисления (предсказание изменения посредством вычисления моделирования) в соответствии с настоящим вариантом осуществления. На фиг. 15 представлен график, показывающий вычисленное предсказание хронологического изменения при активности биомолекулы (рецептор эстрогена), когда в системе трансдукции сигнала клетки млекопитающего происходит мутация. Сплошная линия указывает тип мутанта, тогда как пунктирная линия указывает нормальный тип.

Другие варианты осуществления

Хотя был описан вариант осуществления, соответствующий настоящему изобретению, настоящее изобретение может быть реализовано в различных вариантах осуществления в пределах диапазона технических идей, описанных в приложенной формуле изобретения помимо варианта осуществления, описанного выше.

Был объяснен пример, в котором устройство 100 предсказания взаимодействия выполняет процесс автономным способом. Устройство 100 предсказания взаимодействия может выполнять процесс в ответ на запрос от терминала клиента (помещения, отделенного от устройства 100 предсказания взаимодействия) и передавать результат процесса на терминал клиента.

Весь или часть объясненного процесса, который должен выполняться автоматически и который был объяснен в варианте осуществления, может выполняться вручную. Альтернативно, весь или часть объясненного процесса, который должен выполняться вручную, может выполняться автоматически известным способом.

Дополнительно, процедуры обработки, процедуры управления, конкретные названия, информация, содержащая регистрационные данные для каждого процесса и параметры, такие как критерии поиска, примеры экрана и конфигурации баз данных, указанные в документе и чертежах, могут по желанию изменяться, если не предусмотрено иное.

Компоненты устройства 100 предсказания взаимодействия, показанные на чертежах, являются функционально концептуальными и не требуют физической конфигурации, как показано на чертежах.

Все или желаемая часть функций процесса каждого устройства в устройстве 100 предсказания взаимодействия, особенно, функции процессов, выполняемые блоком 102 управления, могут обеспечиваться центральным процессорным блоком (CPU) и компьютерной программой, интерпретируемой и исполняемой CPU и компьютерной программой, интерпретируемой и исполняемой CPU или как проводное логическое аппаратурное обеспечение. Компьютерная программа хранится на энергонезависимом считываемом компьютером носителе записи данных, содержащем запрограммированные команды, заставляющие компьютер выполнять способ в соответствии с настоящим изобретением, которое будет описано позже. Компьютерная программа механически считывается устройством 100 предсказания взаимодействия по мере необходимости. Другими словами, блок 106 запоминающего устройства, такой как ROM и дисковод жесткого диска (HDD), хранит компьютерную программу для выдачи команд на CPU и выполнения различных типов обработки вместе с операционной системой (OS). Компьютерная программа загружается и исполняется на RAM и служит в качестве блока управления вместе с CPU.

Компьютерная программа может храниться на сервере прикладных программ, соединенном с устройством 100 предсказания взаимодействия через желаемую сеть 300. Вся или часть компьютерной программы могут выгружаться по мере необходимости.

Компьютерная программа, соответствующая настоящему изобретению, может храниться на считываемом компьютером носителе записи данных или может предоставляться в качестве компьютерного программного продукта. Примерами "носителя записи данных" могут быть, по желанию, "переносной физический носитель данных", такой как карта памяти, USB-память, SD-карта, дискета, магнито-оптический диск, ROM, EPROM, EEPROM, CD-ROM, МО, DVD и диск Blu-ray.

"Компьютерная программа" является способом обработки данных, описанным на желаемом языке, и способом описания и описывается в любом формате, таком как исходный код и двоичный код. "Компьютерная программа" не обязательно является независимо конфигурированной. "Компьютерная программа" может конфигурироваться дисперсивно как множество модулей и библиотек или может выполнять свою функциювместе с другой компьютерной программой, представленной OS. В каждом устройстве, соответствующем варианту осуществления, известные конфигурации и процедуры могут использоваться для конкретной конфигурации, чтобы считывать носитель записи данных, считывать процедуры, устанавливать процедуру после считывания и т.п.

Различные типы баз данных и т.п., хранящиеся в блоке 106 запоминающего устройства (база 106a данных структуры компаундов, база 106b данных структуры протеинов, база 106c генетических данных, база 106d данных межмолекулярного взаимодействия и база 106e данных подобия структуры протеинов) соответствуют блоку запоминающего устройства, такому как память, содержащая RAM и ROM, дисковод жесткого диска, содержащий жесткий диск, дискета и оптический диск. Базы данных хранят различные типы компьютерных программ, таблицы, базы данных, файлы веб-страниц и т.п., используемые для различных типов обработки и предоставления веб-сайтов.

Устройство 100 предсказания взаимодействия может обеспечиваться как информационный процессор, такой как настольный персональный компьютер или ноутбук, мобильный телефон, смартфон, система сотовой связи PHS, портативное оконечное устройство, содержащее PDA, и рабочая станция или как информационный процессор с желаемым вспомогательным оборудованием. Устройство 100 предсказания взаимодействия может быть снабжено реализуемым программным обеспечением (в том числе, компьютерной программой, данными и т.п.) для выполнения способа, соответствующего настоящему изобретению в информационном процессоре.

Конкретные аспекты распределения и интеграции устройства не ограничиваются тем, что показано на чертежах. Все или часть компонент могут распределяться или интегрироваться функционально или физически в желаемых блоках, в зависимости от различных типов добавлений и возможных или функциональных нагрузок. Другими словами, представленные выше варианты осуществления могут, как вариант, предоставляться объединенными или раздельно.

Промышленная применяемость

Как подробно описано выше, настоящее изобретение может обеспечивать устройство предсказания взаимодействия, способ предсказания взаимодействия и компьютерный программный продукт, которые могут предсказывать, какой интравитальный протеин химического вещества, такого как компаунд, взаимодействует и как взаимодействие влияет на живое тело. Настоящее изобретение исключительно полезно в различных областях, таких как здравоохранение, разработка лекарственных средств, открытие лекарственных средств и биологическое исследование.

Перечень используемых обозначений

100 Устройство предсказания взаимодействия
102 Блок управления
102a Блок сбора данных структуры компаундов
102b Блок сбора данных структуры протеинов
102c Блок определения предсказанного протеина
102d Блок определения силы взаимодействия
102e Блок предсказания влияния
104 Интерфейс управления связью
106 Блок запоминающего устройства
106a База данных структуры компаундов
106b База данных структуры протеинов
106c База генетических данных
106d База данных межмолекулярного взаимодействия
106e База данных подобия структуры протеинов
108 Интерфейс управления вводом-выводом
112 Блок отображения
114 Устройство ввода
200 Внешняя система
300 Сеть.

1. Устройство предсказания взаимодействия между соединением и протеином, содержащее:

блок хранения данных и блок управления, причем

блок хранения данных содержит:

блок хранения данных структуры соединений, хранящий данные структуры соединений для структуры соединения; и

блок хранения данных структуры протеинов, хранящий данные структуры протеинов для структуры протеина; а

блок управления содержит:

блок получения данных структуры соединения, выполненный с возможностью получения данных структуры соединения для указанного соединения из блока хранения данных структуры соединений или предсказания и получения данных структуры соединения, не хранящихся в блоке хранения данных структуры соединений, с использованием способа предсказания структуры;

блок получения данных структуры протеина, выполненный с возможностью получения данных структуры возможного протеина, соответствующие данным структуры протеина для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с указанным соединением, из блока хранения данных структуры протеинов или предсказания и получения данных структуры возможного протеина, не хранящихся в блоке хранения данных структуры протеинов, с использованием способа предсказания структуры;

блок определения предсказанного протеина, выполненный с возможностью вычисления множества сил связывания между указанным возможным протеином и указанным соединением с использованием множества способов моделирования стыковки на основе данных структуры соединения, получаемых блоком получения данных структуры соединения, и данных структуры возможного протеина, получаемых блоком получения данных структуры протеина, определения какой-либо из сил связывания или комбинации сил связывания в качестве предсказанной силы связывания, соответствующей окончательно предсказанной силе связывания, посредством всесторонней оценки сил связывания с использованием способа обучения и/или способа метаоценки и определения предсказанного протеина, соответствующего возможному протеину, предсказанному для взаимодействия с соединением; и

блок определения силы взаимодействия, выполненный с возможностью вычисления сил связывания с использованием множества способов моделирования силы связывания на основе данных структуры соединения, получаемых блоком получения данных структуры соединения, и данных структуры протеина для предсказанного протеина, определяемого блоком определения предсказанного протеина, и с возможностью определения предсказанной силы взаимодействия, соответствующей силе взаимодействия, указывающей, насколько сильно соединение, основанное на данных структуры соединения, взаимодействует с предсказанным протеином при наличии другого соединения, конкурентно взаимодействующего с указанным протеином, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством всесторонней оценки сил связывания с использованием способа обучения и/или способа метаоценки.

2. Устройство предсказания взаимодействия по п. 1, в котором

блок хранения данных структуры протеинов хранит данные структуры протеина для упомянутого протеина в связи с сетевыми данными о сети внутримолекулярного взаимодействия, сети передачи сигналов, сети метаболизма или сети генетического управления, содержащей позиционные данные о положении протеина в сети, а

блок управления дополнительно содержит:

блок предсказания влияния, выполненный с возможностью предсказания влияния упомянутого соединения на предсказанный протеин на основе предсказанной силы взаимодействия, определяемой блоком определения силы взаимодействия, и сетевых данных, хранящихся в блоке хранения данных структуры протеинов.

3. Устройство предсказания взаимодействия по п. 1 или 2, в котором

блок хранения данных дополнительно содержит:

блок хранения данных межмолекулярного взаимодействия, хранящий данные межмолекулярного взаимодействия о внутриклеточном или интравитальном межмолекулярном взаимодействии,

при этом блок определения предсказанного протеина и/или блок определения силы взаимодействия выполнены с возможностью всесторонней оценки сил связывания с дополнительным использованием данных межмолекулярного взаимодействия, хранящихся в блоке хранения данных межмолекулярного взаимодействия.

4. Устройство предсказания взаимодействия по п. 1 или 2, в котором

блок хранения данных дополнительно содержит:

блок хранения данных подобия структуры протеинов, хранящий данные подобия структуры протеинов о подобии в структуре упомянутого протеина;

при этом блок определения предсказанного протеина и/или блок определения силы взаимодействия выполнены с возможностью всесторонней оценки сил связывания с дополнительным использованием данных подобия структуры протеинов, хранящихся в блоке хранения данных подобия структуры протеинов.

5. Устройство предсказания взаимодействия по п. 1 или 2, в котором блок получения данных структуры протеина выполнен с возможностью предсказания и получения данных структуры возможного протеина посредством предсказания множества фрагментов данных структуры протеина с использованием способа предсказания структуры и всесторонней оценки фрагментов данных структуры протеина с использованием способа обучения и/или способа метаоценки.

6. Устройство предсказания взаимодействия по п. 1 или 2, в котором

блок хранения данных дополнительно содержит:

блок хранения генетических данных, хранящий генетические данные о гене индивидуума,

при этом блок получения данных структуры протеина выполнен с возможностью предсказания и получения данных структуры возможного протеина с использованием способа предсказания структуры на основе генетических данных, хранящихся в блоке хранения генетических данных.

7. Способ предсказания взаимодействия между соединением и протеином, выполняемый устройством предсказания взаимодействия, содержащим:

блок хранения данных и блок управления, причем

блок хранения данных содержит:

блок хранения данных структуры соединений, хранящий данные структуры соединений для структуры соединения; и

блок хранения данных структуры протеинов, хранящий данные структуры протеинов для структуры протеина;

при этом способ, исполняемый блоком управления, содержит:

этап получения данных структуры соединения, на котором получают данные структуры соединения для указанного соединения из блока хранения данных структуры соединений или предсказывают и получают данные структуры соединения, не хранящиеся в блоке хранения данных структуры соединений, с использованием способа предсказания структуры;

этап получения данных структуры протеина, на котором получают данные структуры возможного протеина, соответствующие данным структуры протеина для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с указанным соединением, из блока хранения данных структуры протеинов или предсказывают и получают данные структуры возможного протеина, не хранящиеся в блоке хранения данных структуры протеинов, с использованием способа предсказания структуры;

этап определения предсказанного протеина, на котором вычисляют множество сил связывания между указанным возможным протеином и указанным соединением с использованием множества способов моделирования стыковки на основе данных структуры соединения, полученных на этапе получения данных структуры соединения, и данных структуры возможного протеина, полученных на этапе получения данных структуры протеина, определяют какую-либо из сил связывания или комбинацию сил связывания в качестве предсказанной силы связывания, соответствующей окончательно предсказанной силе связывания, посредством всесторонней оценки сил связывания с использованием способа обучения и/или способа метаоценки, и определяют предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с соединением; и

этап определения силы взаимодействия, на котором вычисляют силы связывания с использованием множества способов моделирования силы связывания на основе данных структуры соединения, полученных на этапе получения данных структуры соединения, и данных структуры протеина для предсказанного протеина, определенного на этапе определения предсказанного протеина, и определяют предсказанную силу взаимодействия, соответствующую силе взаимодействия, указывающей, насколько сильно соединение, основанное на данных структуры соединения, взаимодействует с предсказанным протеином при наличии другого соединения, конкурентно взаимодействующего с указанным протеином, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством всесторонней оценки сил связывания с использованием способа обучения и/или способа метаоценки.

8. Энергонезависимый материальный считываемый компьютером носитель данных, содержащий запрограммированные команды, выполненные с возможностью вызывать при их исполнении устройством предсказания взаимодействия, содержащим блок хранения данных, содержащий блок хранения данных структуры соединений, хранящий данные структуры соединений для структуры соединения, и блок хранения данных структуры протеинов, хранящий данные структуры протеинов для структуры протеина, и блок управления,

выполнение блоком управления:

этапа получения данных структуры соединения, на котором получают данные структуры соединения для указанного соединения из блока хранения данных структуры соединений или предсказывают и получают данные структуры соединения, не хранящиеся в блоке хранения данных структуры соединений, с использованием способа предсказания структуры;

этапа получения данных структуры протеина, на котором получают данные структуры возможного протеина, соответствующие данным структуры протеина для возможного протеина, служащего в качестве протеина, возможного для взаимодействия с указанным соединением, из блока хранения данных структуры протеинов или предсказывают и получают данные структуры возможного протеина, не хранящиеся в блоке хранения данных структуры протеинов, с использованием способа предсказания структуры;

этапа определения предсказанного протеина, на котором вычисляют множество сил связывания между возможным протеином и соединением с использованием множества способов моделирования стыковки на основе данных структуры соединения, полученных на этапе получения данных структуры соединения, и данных структуры возможного протеина, полученных блоком получения данных структуры протеина, определяют какую-либо из сил связывания или комбинацию сил связывания в качестве предсказанной силы связывания, соответствующей окончательно предсказанной силе связывания, посредством создания всесторонней оценки сил связывания с использованием способа обучения и/или способа метаоценки, и определяют предсказанный протеин, соответствующий возможному протеину, предсказанному для взаимодействия с соединением; и

этапа определения силы взаимодействия, на котором вычисляют силы связывания с использованием множества способов моделирования силы связывания на основе данных структуры соединения, полученных на этапе получения данных структуры соединения, и данных структуры протеина для предсказанного протеина, определенного на этапе определения предсказанного протеина, и определяют предсказанную силу взаимодействия, соответствующую силе взаимодействия, указывающей, насколько сильно соединение, основанное на данных структуры соединения, взаимодействует с предсказанным протеином при наличии другого соединения, конкурентно взаимодействующего с указанным протеином, причем предсказанная сила взаимодействия, в конечном счете, предсказывается посредством всесторонней оценки сил связывания с использованием способа обучения и/или способа метаоценки.



 

Похожие патенты:

Настоящее изобретение относится к области генетики. Предложен способ оценки риска возникновения у индивида тромбоэмболического эпизода или диагностики возникновения или наличия такой болезни или эпизода на основании присутствия серпина А10 (ингибитор протеина Z) Arg67Stop (rs2232698), серпина С1 (антитромбин) Ala384Ser (Cambridge II), фактора XII С46Т (rs1801020), фактора XIII Val34Leu (rs5985), фактора II (протромбин) G20210A (rs1799963), фактора V Leiden Arg506Gln (rs6025), фактора V Cambridge Arg306Thr, фактора V Hong Kong Arg306Gly, группы крови ABO rs8176719, группы крови ABO rs7853989, rs8176743 и rs8176750.

Изобретение относится к проверке содержания медицинских документов. Техническим результатом является улучшение обнаружения нарушений в медицинской карте пациента.

Группа изобретений относится к медицинской технике. Устройство для пополнения имплантируемого насоса, содержащего емкость для лекарства, содержит множество независимых каналов для текучих сред, включающих в себя первый, второй и третий независимые каналы для текучих сред.

Изобретение относится к способу и устройству для беспроводного управления медицинским устройством с использованием пульта дистанционного управления. Согласно способу через первый блок ввода, предоставленный посредством сенсорного экрана (24) пульта (10, 60, 70, 80) дистанционного управления, вводят управляющую информацию для активирования и/или деактивирования функции управления для управления устройством (30).

Изобретение относится к автоматизации процессов, связанных с информационной поддержкой, а также повседневным и боевым управлением целевой военной техникой и средствами, обеспечивающими функционирование корабля (судна) по целевому признаку авианесущей и транспортной платформы.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложены система, способ и носитель данных, используемые для анализа микросейсмических данных, собранных при гидравлическом разрыве пласта в подземной зоне.

Группа изобретений относится к медицине, а именно к системам для наблюдения за состоянием здоровья множества пациентов, и может быть использована для прогнозирования в режиме реального времени внезапных происшествий.

Изобретение относится к системе и способу управления двигателем при одновременном воздействии водителя на педаль тормоза и педаль акселератора. Предложен двигатель с тормозной системой с вакуумным усилителем привода и быстрым восстановлением.

Изобретение относится к системе и способу прогнозирования риска в реальном времени во время буровых работ. Техническим результатом является повышение точности прогнозирования риска в реальном времени во время буровых работ.

Изобретение относится к системе и способу создания сетки мощности пласта для определения оценки запасов пласта. Техническим результатом является повышение точности определения объема пласта.

Изобретение относится к разделу общей и медицинской вирусологии и касается вируса гриппа А. Получены новые адаптированные варианты пандемического вируса гриппа A(H1N1)pdm09 к организмам различных лабораторных животных, представленные три адаптированных варианта пандемического вируса гриппа получены из штамма дикого типа A/Tomsk/273/2010(HlNlpdm09) путем многократного пассирования через легкие экспериментальных мышей.

Изобретение относится к биохимии. Описан липополисахарид, антагонист эндотоксинов, продуцируемый штаммом Rhodobacter capsulatus PG, депонированным в ВКМ ИБФМ РАН под номером В-2381 Д, в качестве средства для дифференцировки моноцитоподобных клеток.

Изобретение относится к медицинской микробиологии и может быть использовано в гастроэнтерологии. Предложен способ определения чувствительности Helicobacter pylori к антибактериальным препаратам.

Изобретение относится к области биотехнологии, вирусологии и медицине. Диагностический штамм вируса гриппа RN9/13-human A(H6N9) получен путем скрещивания апатогенного вируса гриппа птиц А/серебристая чайка/Сарма/51 с/06(H6N1) с холодоадаптированным вакцинным штаммом А/17/Ануи/2013/61(H7N9) на основе донора аттенуации А/Ленинград/134/17/57(H2N2).

Группа изобретений относится к области биохимии. Предложены диагностический инструмент для анализа образца и способ подготовки и анализа образца.

Изобретение относится к области биотехнологии и генной инженерии. Описана мышь, имеющая неполный N-концевой домен в гене IL-33.

Изобретение относится к области биотехнологии и микробиологии. Описан способ и набор для выявления и быстрой и специфической диагностики инфекций Mycoplasma pneumoniae и/или Mycoplasma genitalium.

Изобретение относится к области медицины и представляет собой способ диагностики и мониторинга онкологических заболеваний, включающий сбор крови, разделение крови на плазму и клеточную фракции, определение концентрации опухолевых маркеров в составе экзосом плазмы крови, отличающийся тем, что дополнительно осуществляют выделение экзосом из клеточной фракции крови, далее плазму и полученный супернатант из клеточной фракции объединяют и выделяют суммарный пул экзосом крови, а затем в составе экзосом крови выявляют не менее 2-х известных опухолеспецифических белков или выделяют РНК либо микроРНК и, после проведения обратной транскрипции определяют концентрацию не менее 2-х опухолеспецифических маркеров, ассоциированных с определенным онкологическим заболеванием, и при концентрации последних, превышающих концентрацию данных маркеров в контрольном образце, диагностируют наличие онкологического заболевания.

Изобретение относится к области биотехнологии и генной инженерии. Описана генетически модифицированная мышь, где мышь не способна к перегруппировке и экспрессии эндогенной последовательности вариабельной области легкой цепи иммуноглобулина мыши.

Изобретение касается способа дифференциальной диагностики новообразований щитовидной железы (ЩЖ) человека. Способ включает выделение из образца опухолевой ткани ЩЖ человека и образца прилежащей неизмененной ткани железы (в качестве контроля) суммарного пула РНК (в том числе содержащий и микроРНК) любым из известных способов.

Изобретение относится к области микробиологии. Способ обнаружения кластера микроорганизмов на поверхности предусматривает этапы, на которых: а) определяют топографическое представление упомянутой поверхности; b) обнаруживают на топографическом представлении, по меньшей мере, один контур, ограничивающий область, которая может соответствовать скоплению биологических частиц.
Наверх