Способ и устройство для перевода текста на уровне дискурса

Изобретение относится к способу, устройству и машиночитаемому носителю для перевода текста на уровне дискурса. Технический результат заключается в повышении точности перевода текста. В способе выполняют получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу, получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст, причем предшествующий исходный текст представляет собой по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, последующий исходный текст представляет собой по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а предшествующий целевой текст представляет собой текст перевода упомянутого предшествующего исходного текста, и перевод текста, подлежащего переводу, в соответствии с релевантным текстом, при этом перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает: получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу; получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста; получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования и перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования. 3 н. и 9 з.п. ф-лы, 8 ил.

 

[1] По настоящей заявке испрашивается приоритет согласно заявке на выдачу патента КНР №201810463138.3, озаглавленной «Способ и устройство для перевода текста на уровне дискурса» и поданной в патентное ведомство КНР 15 мая 2018 года, причем содержание упомянутой заявки полностью включено в настоящее описание посредством ссылки.

Область техники

[2] Настоящее изобретение относится к технической области перевода текстов и, в частности, к способу и устройству для перевода текста на уровне дискурса.

Предпосылки создания изобретения

[3] Текст на уровне дискурса состоит из последовательности предложений. Например, текст на уровне дискурса может представлять собой текст устного доклада, журнальную статью, литературное произведение и т.п. Поскольку основным свойством текстов на уровне дискурса являются связность и согласованность предложений, такой текст представляет собой не просто набор последовательных предложений, а имеет семантическое единство с завершенными структурами и ясными функциями.

[4] Для перевода таких текстов должны применяться способы перевода текстов на уровне дискурса. Среди известных способов перевода текстов на уровне дискурса, текст на уровне дискурса, подлежащий переводу, как правило, переводят непосредственно как единое целое, рассматривая его как отдельный объект перевода. Однако полученный в результате перевод не идеален в том смысле, что точность перевода невысока, что отрицательно сказывается на пользовательском восприятии.

Сущность изобретения

[5] Целью настоящего изобретения является предоставление способа и устройства для перевода текста на уровне дискурса, которые позволят повысить точность результата перевода текста на уровне дискурса.

[6] В соответствии с вариантами осуществления настоящего изобретения предлагается способ перевода текста на уровне дискурса. Способ включает:

[7] получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;

[8] получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст,

[9] при этом под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и

[10] перевод текста, подлежащего переводу, в соответствии с релевантным текстом.

[11] Опционально, перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает:

[12] перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.

[13] Опционально, перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает:

[14] получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;

[15] получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;

[16] получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и

[17] перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования.

[18] Опционально, получение начального результата кодирования путем кодирования текста, подлежащего переводу, включает:

[19] получение начального результата кодирования путем кодирования слов текста, подлежащего переводу.

[20] Соответственно, получение релевантного результата кодирования путем кодирования релевантного текста включает:

[21] кодирование слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определение упомянутых результатов кодирования в качестве релевантного результата кодирования.

[22] Опционально, после кодирования слов текста, подлежащего переводу, способ также включает:

[23] получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу.

[24] Соответственно, после кодирования слов каждой единицы текста в релевантном тексте способ также включает:

[25] в случае, когда релевантный текст включает предшествующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста;

[26] в случае, когда релевантный текст включает последующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста, и,

[27] в случае, когда релевантный текст включает предшествующий целевой текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте для получения суммарного результата, соответствующего каждой единице текста.

[28] Опционально, обработка начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования включает:

[29] определение, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;

[30] определение, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования и

[31] обработку начального результата кодирования в соответствии с определенным результатом кодирования.

[32] Опционально, обработка начального результата кодирования в соответствии с определенным результатом кодирования включает:

[33] определение, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста.

[34] определение, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста и

[35] обработку начального результата кодирования в соответствии с определенным результатом кодирования и определенными степенями корреляции.

[36] Опционально, перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования включает:

[37] декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.

[38] Опционально, декодирование целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования включает:

[39] определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом и

[40] декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.

[41] Опционально, определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом включает:

[42] определение степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.

[43] В соответствии с вариантами осуществления настоящего изобретения предлагается устройство для перевода текста на уровне дискурса. Устройство содержит:

[44] блок получения текста, подлежащего переводу, который сконфигурирован для получения текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;

[45] блок получения релевантного текста, сконфигурированный для получения релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст, причем под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и

[46] блок перевода текста, подлежащего переводу, который сконфигурирован для перевода текста, подлежащего переводу, в соответствии с релевантным текстом.

[47] Опционально, блок перевода текста, подлежащего переводу, сконфигурирован для перевода текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.

[48] Опционально, блок перевода текста, подлежащего переводу, содержит:

[49] первый подблок кодирования, сконфигурированный для получения начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;

[50] второй подблок кодирования, сконфигурированный для получения релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;

[51] подблок обработки результата, сконфигурированный для получения целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и

[52] подблок выполнения декодирования, сконфигурированный для перевода текста, подлежащего переводу, путем декодирования целевого результата кодирования.

[53] Опционально, подблок выполнения декодирования сконфигурирован для декодирования, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.

[54] В соответствии с вариантами осуществления настоящего изобретения предлагается устройство для перевода текста на уровне дискурса. Устройство содержит процессор, память и системную шину,

[55] при этом процессор и память связаны друг с другом посредством системной шины, и

[56] память сконфигурирована для хранения одной или более программ, содержащих инструкции, которые при их исполнении процессором обеспечивают выполнение, этим процессором, любых из описанных выше способов перевода текста на уровне дискурса.

[57] В соответствии с вариантами осуществления настоящего изобретения предлагается машиночитаемый носитель данных. Машиночитаемый носитель данных содержит инструкции, которые при их исполнении на компьютере обеспечивают выполнение, этим компьютером, любых из описанных выше способов перевода текста на уровне дискурса.

[58] В соответствии с вариантами осуществления настоящего изобретения предлагается компьютерный программный продукт, который при его исполнении на терминальном устройстве обеспечивает выполнение, этим терминальным устройством, любых из описанных выше способов перевода текста на уровне дискурса.

[59] При использовании способа и устройства для перевода текста на уровне дискурса, соответствующих вариантам осуществления настоящего изобретения, каждую единицу текста в тексте на уровне дискурса, подлежащем переводу, берут в качестве текста, подлежащего переводу, затем из текста на уровне дискурса получают релевантный текст для текста, подлежащего переводу, и переводят текст, подлежащий переводу, на основе упомянутого релевантного текста. Можно видеть, что при переводе текста, подлежащего переводу, учитывается не только текущий контекст текста, подлежащего переводу, но и содержание релевантного текста для текста, подлежащего переводу, что позволяет повысить точность результата перевода текста, подлежащего переводу, и соответственно улучшить пользовательское восприятие.

Краткое описание чертежей

[60] Ниже будут кратко описаны чертежи, используемые при описании вариантов осуществления настоящего изобретения или известных технологий, для пояснения технических решений в соответствии с вариантами осуществления настоящего изобретения или в соответствии с известным уровнем техники. Очевидно, что на приложенных чертежах в последующем описании проиллюстрированы лишь некоторые из вариантов осуществления настоящего изобретения. Специалисты в данной области техники, не прилагая творческих усилий, могут создать на их основе другие чертежи.

[61] На фиг. 1 показана блок-схема способа перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.

[62] На фиг. 2 показана схема текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.

[63] На фиг. 3 показана топологическая структурная схема модели кодирования-декодирования в соответствии с одним из вариантов осуществления настоящего изобретения.

[64] На фиг. 4 показана блок-схема выполнения перевода с использованием заранее построенной модели кодирования-декодирования в соответствии с одним из вариантов осуществления настоящего изобретения.

[65] На фиг. 5 показана блок-схема выполнения обработки начального результата кодирования в соответствии с одним из вариантов осуществления настоящего изобретения.

[66] На фиг. 6 показана сетевая структурная логическая схема шлюзовой сети (Gate Network) в соответствии с одним из вариантов осуществления настоящего изобретения.

[67] На фиг. 7 показана структурная схема устройства для перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.

[68] На фиг. 8 показана структурная аппаратная схема устройства для перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.

Подробное описание вариантов осуществления изобретения

[69] В некоторых способах перевода текста на уровне дискурса в качестве объекта перевода, непосредственно переводимого с помощью модели перевода, может рассматриваться весь подлежащий переводу текст на уровне дискурса. Однако, если каждое предложение текста на уровне дискурса переводить с использованием таких способов, контекстная информация для переводимого предложения учитываться не будет, что негативно скажется на точности результата перевода и на пользовательском восприятии. Кроме того, при переводе предложения, в информации, которую принимает модель перевода, может содержаться избыточная информация. Более конкретно, если предложения, предшествующие и последующие переводимому предложению, не связаны с ним по смыслу, то в случае, когда в качестве объекта перевода для этого предложения взят текст на уровне дискурса целиком, нерелевантные предшествующее и последующее предложения будут избыточной информацией.

[70] Для решения описанных выше проблем предлагается способ перевода текста на уровне дискурса в соответствии с вариантами осуществления настоящего изобретения. Для каждого фрагмента текста, подлежащего переводу, причем текст представляет собой, например, предложение, в тексте на уровне дискурса, при переводе текста, подлежащего переводу, учитывают не только его текущий контекст, но и контекстную информацию текста, подлежащего переводу, что позволяет повысить точность результата перевода текста, подлежащего переводу, и соответственно улучшить пользовательское восприятие. Кроме того, в вариантах осуществления настоящего изобретения, при переводе текста, подлежащего переводу, контекстную информацию выбирают динамически согласно релевантности текста, подлежащего переводу, контекстной информации, что не только позволяет уменьшить избыточную информацию в информации, принимаемой в модели перевода, но также повысить точность результата перевода текста, подлежащего переводу. Кроме того, в вариантах осуществления настоящего изобретения, при переводе текста, подлежащего переводу, учитывают также результат перевода текста, предшествующего тексту, подлежащему переводу, что позволяет связать результат перевода текста, подлежащего переводу, с результатом перевода предшествующего теста. Таким образом, не только повышается точность перевода текста, подлежащего переводу, но также и плавность текста перевода в целом. Другими словами, гарантируются связность и согласованность предложений переведенного текста на уровне дискурса.

[71] Технические решения, предлагаемые в вариантах осуществления настоящего изобретения, будут описаны ясно и полностью далее со ссылками на приложенные чертежи, для пояснения целей, технических решений и преимуществ вариантов осуществления настоящего изобретения. Очевидно, что рассмотренные варианты осуществления настоящего изобретения представляют собой лишь некоторые, но не все возможные варианты его осуществления. Другие варианты осуществления настоящего изобретения, которые могут быть получены специалистами в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, находятся в пределах сущности настоящего изобретения.

[72] Первый вариант осуществления изобретения

[73] На фиг. 1 показана блок-схема способа перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает шаги S101-S103, описанные ниже.

[74] На шаге S101 получают текст, подлежащий переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу.

[75] Текст на уровне дискурса, подлежащий переводу, то есть текст на уровне дискурса до перевода, далее будет для простоты называться просто текстом на уровне дискурса. Данный вариант осуществления настоящего изобретения не накладывает ограничений на тип текста на уровне дискурса. Например, текст на уровне дискурса может представлять собой текст устного доклада, журнальную статью, литературное произведение и т.п.

[76] Текст на уровне дискурса представляет собой набор последовательных предложений. При переводе текста на уровне дискурса единицей перевода может быть предложение или последовательный текст любой другой длины в варианте осуществления настоящего изобретения. Если допустить, что перевод выполняют по предложениям, то каждое предложение может быть получено в соответствии с последовательностью предложений в тексте на уровне дискурса. Предложение, полученное в текущий момент, определяют в качестве текста, подлежащего переводу, и переводят в соответствии с описанными ниже шагами.

[77] Следует отметить, что данный вариант осуществления настоящего изобретения не накладывает ограничения на язык текста на уровне дискурса как до, так и после перевода. К примеру, языком оригинала может быть китайский, а языком перевода - английский.

[78] На шаге S102 получают релевантный текст для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст.

[79] В данном варианте осуществления настоящего изобретения под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста.

[80] Более конкретно, если перевод выполняют по предложениям, одно или более предложений, предшествующих тексту, подлежащему переводу, могут быть получены из текста на уровне дискурса в качестве предшествующего исходного текста. Одно или более предложений, следующих за текстом, подлежащим переводу, могут быть получены из текста на уровне дискурса в качестве последующего исходного текста. Кроме того, поскольку каждое предложение в тексте на уровне дискурса переводят последовательно, то на момент перевода текста, подлежащего переводу, предшествующий ему исходный текст уже переведен. Таким образом, может быть непосредственно получен текст перевода предшествующего исходного текста, то есть предшествующий целевой текст.

[81] Следует отметить, что количество предложений в предшествующем исходном тексте и последующем исходном тексте может быть одинаковым или различным. Если в качестве предшествующего исходного текста определены к предложений, предшествующие тексту, подлежащему переводу, в качестве последующего исходного текста могут быть определены к или l предложений, следующих за текстом, подлежащим переводу, где k и l - целые числа, причем k≠l, k≥1, l≥1.

[82] Например, в тексте на уровне дискурса, показанном на фиг. 2, текст, подлежащий переводу, обозначен X, предложение X-1, предшествующее X, может быть определено в качестве предшествующего исходного текста, или несколько предложений, предшествующих X, например предложение Х-1 и предложение Х-2, могут быть определены в качестве предшествующего исходного текста. Аналогично, предложение Х1, следующее за X, может быть определено в качестве последующего исходного текста, или несколько предложений, следующих за X, например предложение Х1, предложение Х2 и предложение Х3, могут быть определены в качестве последующего исходного текста.

[83] На шаге 103 выполняют перевод текста, подлежащего переводу, в соответствии с релевантным текстом.

[84] В данном варианте осуществления настоящего изобретения при переводе текста, подлежащего переводу, может также учитываться релевантный ему текст. Другими словами, для перевода текста, подлежащего переводу, учитывают семантическую информацию по меньше мере одного из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст для текста, подлежащего переводу, чтобы получить результат перевода текста, подлежащего переводу. Также может учитываться степень корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом, степень корреляции между текстом, подлежащим переводу, и последующим исходным текстом, и степень корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. Очевидно, за счет учета семантического содержания текста, подлежащего переводу, и релевантного текста, а также степени корреляции между текстом, подлежащим переводу, и релевантным текстом может быть получен более точный результат перевода текста, подлежащего переводу.

[85] Следует отметить, что когда релевантный текст включает предшествующий целевой текст (результат перевода предшествующего исходного текста), то есть когда предшествующий целевой текст используют как вспомогательный при переводе текста, подлежащего переводу, не только повышается точность результата перевода текста, подлежащего переводу, но и обеспечивается возможность связать результат перевода текста, подлежащего переводу, с результатом перевода предшествующего исходного текста. Другими словами, результат перевода текста, подлежащего переводу, может быть в большей степени связан по смыслу с результатом перевода предшествующего исходного текста, что гарантирует связность и согласованность предложений переведенного текста на уровне дискурса.

[86] Отметим, что за описанием конкретной реализации шага S103 можно обратиться ко второму варианту осуществления настоящего изобретения.

[87] Таким образом, в соответствии с данным вариантом осуществления настоящего изобретения предлагается способ перевода текста на уровне дискурса, в котором каждую единицу текста в тексте на уровне дискурса, подлежащем переводу, берут в качестве текста, подлежащего переводу, затем из текста на уровне дискурса получают релевантный текст для текста, подлежащего переводу, и переводят текст, подлежащий переводу, на основе упомянутого релевантного текста. Можно видеть, что при переводе текста, подлежащего переводу, учитывается не только текущий контекст текста, подлежащего переводу, но и содержание релевантного текста для текста, подлежащего переводу, что позволяет повысить точность результата перевода текста, подлежащего переводу, и соответственно улучшить пользовательское восприятие.

[88] Второй вариант осуществления изобретения

[89] Данный вариант осуществления настоящего изобретения включает конкретную реализацию шага S103, упомянутого в первом варианте осуществления настоящего изобретения.

[90] В данном варианте осуществления настоящего изобретения может быть заранее построена модель кодирования-декодирования как модель перевода текстов на уровне дискурса, то есть модель кодирования-декодирования осуществляет перевод текста на уровне дискурса посредством кодирования и последующего декодирования. Соответственно, упомянутый выше шаг S103 может включать, в частности, перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.

[91] Следует отметить, что применение модели кодирования-декодирования для перевода текста, подлежащего переводу, рассмотрено ниже со ссылкой на фиг.3, где показана топологическая структурная схема модели кодирования-декодирования.

[92] Для обеспечения введения для фиг.3, рассмотрим пример, в котором перевод выполняют по предложениям, при этом в качестве предшествующего исходного текста берут к предложений перед текстом, подлежащим переводу, а в качестве последующего исходного текста берут к предложений после текста, подлежащего переводу. Сначала определим следующее.

[93] 1. Текст на уровне дискурса до перевода представлен как {Х-k, …, Х-1, X, Х1, … Хk}, где X представляет текст, подлежащий переводу, X-1…Х-k последовательно представляют первое предложение перед X, …, k-е предложение перед X; X1 … Хk последовательно представляют первое предложение после X, …, k-е предложение после X. Здесь Х-1 … Х-k совместно определены в качестве предшествующего исходного текста, a X1 … Хk совместно определены в качестве последующего исходного текста.

[94] Для простоты допустим, что каждое предложение содержит n слов (на практике будет использоваться фактическое количество слов). Как показано на фиг. 3, все слова текста X, подлежащего переводу, представлены как {х1, х2, …,хn}, где х1, х2, …, хn последовательно представляют первое слово, второе слово, …, n-е слово текста X подлежащего переводу. Аналогично, все слова предложения Х-k в предшествующем исходном тексте представлены как где последовательно представляют первое слово, второе слово, …, n-е слово предложения Х-k; остальные предложения предшествующего исходного текста представлены аналогичным образом. Все слова предложения Хk в последующем исходном тексте представлены как где последовательно представляют первое слово, второе слово, …, n-е слово предложения Хk; остальные предложения последующего исходного текста представлены аналогичным образом.

[95] 2. Текст на уровне дискурса после перевода представлен как {Y-k, …, Y-1, Y, Y1, … Yk}, где Y представляет текст перевода текста X, подлежащего переводу, Y-1…Y-k последовательно представляют текст перевода Х-1…Х-k в предшествующем исходном тексте, a Y1…Yk последовательно представляют текст перевода Х1…Хk в последующем исходном тексте. Здесь Y-1…Y-k совместно определены в качестве предшествующего целевого текста.

[96] Все слова текста перевода Y для текста X, подлежащего переводу, представлены как {у1, у2, …, yn}, где y1, y2, …, yn последовательно представляют первое слово, второе слово, …, n-е слово текста Y как показано на фиг.3, все слова предложения Y-k в предшествующем целевом тексте представлены как , где последовательно представляют первое слово, второе слово, …, n-е слово предложения Y-k. Все слова предложения Y-1 в предшествующем целевом тексте представлены как , где последовательно представляют первое слово, второе слово, …, n-е слово предложения Y-1. Остальные предложения последующего целевого текста представлены аналогичным образом.

[97] Ниже, со ссылкой на фиг. 3, будет описано применение модели кодирования-декодирования для перевода текста, подлежащего переводу.

[98] Фиг. 4 представляет собой блок-схему выполнения перевода с использованием заранее построенной модели кодирования-декодирования, которая в одной из реализаций данного варианта осуществления изобретения включает, в частности, описанные ниже шаги S401-S404.

[99] На шаге S401 получают начальный результат кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу.

[100] В одной из реализаций шаг S401 может включать, в частности, получение начального результата кодирования путем кодирования текста, подлежащего переводу, с использованием двунаправленной рекуррентной нейронной сети (Recurrent Neural Network, RNN).

[101] На шаге S401 или в конкретных реализациях шага S401 при кодировании текста, подлежащего переводу, начальный результат кодирования может быть получен, в частности, путем кодирования всех слов текста, подлежащего переводу.

[102] Более конкретно, как показано на фиг. 3, слова текста X, подлежащего переводу, то есть {х12,…,хn}, вводят в двунаправленную RNN-сеть в виде вектора слов.

Для векторизации слов в данном варианте осуществления настоящего изобретения могут применяться любые из известных или предложенных в будущем методов.

[103] Формула для вычисления каждого из скрытых состояний двунаправленной RNN-сети имеет следующий вид:

[104]

[105] где i=1, 2, …, n, f - нелинейная функция, например, сигмоидная функция или сеть с долговременной и кратковременной памятью (Long Short-Term Memory, LSTM), W и U - параметры обучения двунаправленной RNN-сети, представляет вектор слов, составленный из слов хi, hi-1 представляет (i-1)-e скрытое состояние, используемое для представления семантической информации слова х, а hi. представляет i-e скрытое состояние, используемое для представления семантической информации слова

[106] Двунаправленная RNN-сеть включает прямую RNN-сеть и обратную RNN-сеть. Прямая RNN-сеть формирует прямую скрытую последовательность после чтения по порядку вектора слов, составленного из слов текста X, подлежащего переводу, где представляет информацию текста X, подлежащего переводу, в прямом порядке; обратная RNN-сеть формирует обратную скрытую последовательность после чтения в обратном порядке вектора слов, составленного из слов текста X, подлежащего переводу, где представляет информацию текста, подлежащего переводу, в обратном порядке.

[107] Блоки скрытых состояний, позиции которых в прямой скрытой последовательности и обратной скрытой последовательности соответствуют друг другу, соединяют вместе и получают последовательность состояний, соответствующую слову в этой позиции. Другими словами, последовательности состояний, соответствующие словам в {х12,…,хn}, имеют следующий вид: последовательностью состояний, соответствующей х1, является последовательностью состояний, соответствующей х2, является а последовательностью состояний, соответствующей хn, является Соответственно, семантическая информация текста X, подлежащего переводу, может быть представлена как Н={h1, h2, …, hn}, где Н - начальный результат кодирования, полученный кодированием текста, подлежащего переводу.

[108] Кроме того, в одной из реализаций, после кодирования слов текста, подлежащего переводу, способ может также включать получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу. В такой реализации после получения результата Н кодирования суммарный результат , полученный путем сложения вместе последовательностей состояний в Н, может быть определен в качестве нового начального результата кодирования, для представления семантической информации текста X, подлежащего переводу,

[109] где

[110] На шаге S402 получают релевантный результат кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста.

[111] В одной из реализаций шаг S402 может включать, в частности, получение релевантного результата кодирования путем кодирования релевантного текста с помощью двунаправленной RNN-сети.

[112] На шаге S402 или в конкретных реализациях шага S402 при кодировании релевантного текста, в частности, могут кодироваться слова каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, причем упомянутые результаты кодирования определяют в качестве релевантного результата кодирования.

[113] Более конкретно, как показано на фиг. 3, когда релевантный текст включает предшествующий исходный текст, то есть релевантный текст содержит K предложений Х-1…Х-k перед текстом X, подлежащим переводу, Х-1…Х-k могут кодироваться аналогично кодированию текста X, подлежащего переводу, на шаге S401, где нужно только заменить текст X, подлежащий переводу, на Х-1…Х-k по отдельности, так что семантическая информация предложения Х-1 представлена как …, семантическая информация предложения Х-k представлена как а H-1, …, Н-k представляет собой результат кодирования, полученный кодированием предшествующего исходного текста, где в …, а в …,

[114] Когда релевантный текст включает последующий исходный текст, то есть релевантный текст содержит K предложений Х1…Хk после текста X, подлежащего переводу, Х1…Хk могут кодироваться аналогично кодированию текста X, подлежащего переводу, на шаге S401, где нужно только заменить текст X, подлежащий переводу, на Х1…Хk по отдельности, так что семантическая информация предложения Х1 представлена как семантическая информация предложения Хk представлена как а Н1, …, Нk представляет собой результат кодирования, полученный кодированием последующего исходного текста, где в …, …,

[115] Когда релевантный текст включает предшествующий целевой текст, то есть релевантный текст содержит текст перевода Y1…Y-k для K предложений Х-1…Х-k перед текстом X, подлежащим переводу, Y1…Y-k могут кодироваться аналогично кодированию текста X, подлежащего переводу, на шаге S401, где нужно только заменить текст X, подлежащий переводу, на Y-1…Y-k по отдельности, так что семантическая информация предложения Y-1 представлена как семантическая информация предложения Y-k представлена как а представляет собой результат кодирования, полученный кодированием предшествующего целевого текста, где в …, а в …,

[116] Кроме того, в одной из реализаций, после кодирования слов каждой единицы текста в релевантном тексте способ может также включать шаги А1-С1.

[117] На шаге А1, в случае, когда релевантный текст включает предшествующий исходный текст, складывают вместе результаты кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста.

[118] После получения результатов H-1, …, Н-k кодирования для предшествующего исходного текста, суммарный результат для всех последовательностей состояний в Н-1 может использоваться для представления семантической информации предложения Х-1, суммарный результат для всех последовательностей состояний в Н-k может использоваться для представления семантической информации предложения Х-k, а …, совместно определяют в качестве результата кодирования предшествующего исходного текста,

[119] где

[120] …;

[121]

[122] На шаге В1, в случае, когда релевантный текст включает последующий исходный текст, складывают вместе результаты кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста.

[123] После получения результатов Н1, …, Нk кодирования последующего исходного текста, суммарный результат для всех последовательностей состояний в Н1 может использоваться для представления семантической информации предложения Х1, суммарный результат для всех последовательностей состояний в Нk может использоваться для представления семантической информации предложения Хk, а , …, совместно определяют в качестве результата кодирования последующего исходного текста,

[124] где

[125] …;

[126]

[127] На шаге С1, в случае, когда релевантный текст включает предшествующий целевой текст, результаты кодирования слов каждой единицы текста в предшествующем целевом тексте складывают вместе для получения суммарного результата, соответствующего каждой единице текста.

[128] После получения результатов кодирования предшествующего исходного текста, суммарный результат для всех последовательностей состояний в может использоваться для представления семантической информации предложения Y-1, суммарный результат для всех последовательностей состояний в может использоваться для представления семантической информации предложения а ,…, совместно определяют в качестве результата кодирования предшествующего целевого текста,

[129] где

[130] …;

[131]

[132] Следует отметить, что в данном варианте осуществления настоящего изобретения порядок выполнения описанных выше шагов S401 и S402 не ограничен. Шаги S401 и S402 могут выполняться одновременно, шаг S401 может выполняться перед выполнением шага S402, или шаг S402 может выполняться перед выполнением шага S401.

[133] На шаге S403 получают целевой результат кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть.

[134] В данном варианте осуществления настоящего изобретения один или более из следующих результатов кодирования: результат Н-1, …, Н-k кодирования предшествующего исходного текста, результат Н1, …, Нk кодирования последующего исходного текста и результат кодирования предшествующего целевого текста, могут использоваться для обработки начального результата Н кодирования текста, подлежащего переводу, при этом обработанный результат кодирования определяют в качестве целевого результата кодирования.

[135] Альтернативно, один или более из следующих результатов кодирования: результат кодирования предшествующего исходного текста, результат кодирования последующего исходного текста и результат кодирования предшествующего целевого текста, могут использоваться для обработки начального результата Н кодирования текста, подлежащего переводу, причем обработанный результат кодирования определяют в качестве целевого результата Нс кодирования.

[136] Следует отметить, что при обработке начального результата кодирования семантическая информация единиц текста в релевантном тексте может выбираться по различным значениям степени, соответствующим степени корреляции между текстом, подлежащим переводу, и релевантным текстом, так что целевой результат кодирования может переносить информацию с различными степенями и представлять семантическую информацию Нс текста, подлежащего переводу.

[137] Отметим, что за описанием конкретной реализации шага S403 можно обратиться к третьему варианту осуществления настоящего изобретения.

[138] На шаге S404 текст, подлежащий переводу, переводят путем декодирования целевого результата кодирования.

[139] При декодировании целевого результата Нс кодирования, для получения результата перевода текста, подлежащего переводу, могут применяться известные методы декодирования, например, с помощью модели внимания (см. фиг. 3) или предложенные в будущем методы декодирования.

[140] Отметим также, что за описанием конкретной реализации шага S404 можно обратиться к четвертому варианту осуществления настоящего изобретения.

[141] Таким образом, в данном варианте осуществления настоящего изобретения применяют модель кодирования-декодирования для кодирования и декодирования текста, подлежащего переводу, а также релевантного текста. Когда текст, подлежащий переводу, переводят с помощью способа кодирования и декодирования, учитывается не только текущий контекст текста, подлежащего переводу, но также и релевантный текст для текста, подлежащего переводу. Таким образом, может быть повышена точность результата перевода текста, подлежащего переводу, и соответственно улучшено пользовательское восприятие.

[142] Третий вариант осуществления изобретения

[143] Данный вариант осуществления настоящего изобретения включает конкретную реализацию шага S403, упомянутого во втором варианте осуществления настоящего изобретения.

[144] На фиг. 5 показана блок-схема выполнения обработки начального результата кодирования. «Обработка начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования» на упомянутом выше шаге S403 также включает шаги S501-S503, описанные ниже.

[145] На шаге S501, в случае, когда релевантный текст включает предшествующий исходный текст, результат кодирования предшествующего исходного текста определяют из релевантного результата кодирования.

[146] В данном варианте осуществления настоящего изобретения результатом

кодирования предшествующего исходного текста может быть Н-1, …, Н-k или в соответствии со вторым вариантом осуществления изобретения.

[147] На шаге S502, в случае, когда релевантный текст включает последующий исходный текст, результат кодирования последующего исходного текста определяют из релевантного результата кодирования.

[148] В данном варианте осуществления настоящего изобретения, если результатом кодирования предшествующего исходного текста является Н-1, …, Н-k, результатом кодирования последующего исходного текста может являться Н1, …, Нk в соответствии со вторым вариантом осуществления изобретения; аналогично, если результатом кодирования предшествующего исходного текста является результатом кодирования последующего исходного текста может являться в соответствии со вторым вариантом осуществления изобретения.

[149] На шаге S503 выполняют обработку начального результата кодирования в соответствии с определенным результатом кодирования.

[150] В одной из реализаций шаг S503 может включать, в частности, шаги А2-С2, описанные ниже.

[151] На шаге А2, в случае, когда релевантный текст включает предшествующий исходный текст, определяют степень корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста.

[152] Степень релевантности между текстом, подлежащим переводу, и каждым предложением в предшествующем исходном тексте (далее называемым предшествующим предложением) является неопределенной, и, если текст, подлежащий переводу, совсем не связан с предшествующим предложением, предшествующее предложение будет избыточной информацией. Если текст, подлежащий переводу, переводят со ссылкой на предшествующее предложение, то это негативно скажется на точности результата перевода текста, подлежащего переводу, то есть точность результата перевода будет низкой. Поэтому для более рационального использования результата кодирования предшествующего исходного текста, в данном варианте осуществления настоящего изобретения определяют степень корреляции между текстом, подлежащим переводу, и каждым из предшествующих предложений по отдельности, так что семантическая информация, соответствующая предшествующему предложению, может применяться динамически с использованием результата определения степени корреляции, чтобы избежать избыточности информации, вызванной предшествующим предложением.

[153] На этом шаге начальным результатом кодирования текста, подлежащего переводу, может быть а результатами кодирования предшествующих предложений предшествующего исходного текста могут быть, соответственно, Может использоваться шлюзовая сеть (Gate Network) со структурой нейронной сети для формирования коэффициента корреляции, соответствующего каждому предшествующему предложению, причем коэффициент корреляции представляет степень корреляции между текстом, подлежащим переводу, и соответствующим предшествующим предложением.

[154] На фиг. 6 показана сетевая структурная схема шлюзовой сети. В конкретных реализациях начальный результат кодирования текста, подлежащего переводу, и результаты кодирования, отвечающие соответствующим предшествующим предложениям, используют в качестве входных данных для шлюзовой сети. Затем шлюзовая сеть вычисляет коэффициент корреляции, соответствующий каждому из предшествующих предложений, согласно следующей формуле:

[155]

[156] где i=1, 2 … k;- начальный результат кодирования текста, подлежащего переводу; - результат кодирования i-го предложения, предшествующего тексту, подлежащему переводу; λ-i - коэффициент корреляции i-го предложения, предшествующего тексту, подлежащему переводу, который представляет степень корреляции между текстом, подлежащим переводу, и i-м предложением, предшествующим тексту, подлежащему переводу; U и V - параметры обучения шлюзовой сети, которые получают путем обучения на большом объеме заранее собранных данных, при этом каждый из них имеет размер d×1.

[157] Следует отметить, что и представляют собой матрицы размера 1×d, где d - количество скрытых узлов в процедуре кодирования посредством двунаправленной RNN-сети, которое заранее сконфигурировано. Таким образом, скалярная величина размерностью 1 может быть получена умножением матриц, указанных в формуле (2), а затем преобразована с помощью нелинейной функции, то есть сигмоидной функции, с получением скалярного значения λ-i, лежащего в диапазоне от 0 до 1. Чем больше значение λ-1, тем выше степень корреляции между текстом, подлежащим переводу, и i-м предложением, предшествующим тексту, подлежащему переводу, и наоборот.

[158] Как можно видеть, коэффициенты {Х-k-k-1,…,Х-1) корреляции, отвечающие соответствующим предшествующим предложениям в предшествующем исходном тексте, могут быть вычислены с помощью формулы (2).

[159] На шаге В2, в случае, когда релевантный текст включает последующий исходный текст, определяют степень корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста.

[160] Релевантность между текстом, подлежащим переводу, и каждым предложением в последующем исходном тексте (далее называемым последующим предложением) является неопределенной, и, если текст, подлежащий переводу, совсем не связан с последующим предложением, последующее предложение будет избыточно в отношении текста, подлежащего переводу. Если текст, подлежащий переводу, переводят со ссылкой на последующее предложение, то это негативно скажется на точности результата перевода, то есть точность результата перевода будет низкой. Поэтому для более рационального использования результата кодирования последующего исходного текста, в данном варианте осуществления настоящего изобретения определяют степень корреляции между текстом, подлежащим переводу, и каждым последующим предложением по отдельности, так что семантическая информация, соответствующая последующему предложению, может применяться динамически с использованием результата определения степени корреляции, чтобы избежать избыточности информации, вызванной последующим предложением.

[161] На этом шаге начальным результатом кодирования текста, подлежащего переводу, может быть , а результатами кодирования предшествующего предложения предшествующего исходного текста могут быть, соответственно, Может использоваться шлюзовая сеть (Gate Network) со структурой нейронной сети для формирования коэффициента корреляции, соответствующего каждому предшествующему предложению, причем коэффициент корреляции представляет степень корреляции между текстом, подлежащим переводу, и соответствующим предшествующим предложением.

[162] На фиг. 6 показана сетевая структурная схема шлюзовой сети. В конкретных реализациях начальный результат кодирования текста, подлежащего переводу, и результаты кодирования, отвечающие соответствующим последующим предложениям, используют в качестве входных данных для шлюзовой сети. Затем шлюзовая сеть вычисляет коэффициент корреляции, соответствующий каждому из последующих предложений, согласно следующей формуле:

[163]

[164] где i=1,2…k; - начальный результат кодирования текста, подлежащего переводу; - результат кодирования i-го предложения, следующего за текстом, подлежащим переводу; λi - коэффициент корреляции i-го предложения, следующего за текстом, подлежащим переводу, который представляет степень корреляции между текстом, подлежащим переводу и i-м предложением, следующим за текстом, подлежащим переводу; U и V - параметры обучения шлюзовой сети, которые получены путем обучения на большом объеме заранее собранных данных, при этом каждый из них имеет размер d×1.

[165] Следует отметить, что и представляют собой матрицы размера 1×d, где d - количество скрытых узлов в процедуре кодирования посредством двунаправленной RNN-сети, которое сконфигурировано заранее. Таким образом, скалярная величина размерностью 1 может быть получена умножением матриц, указанных в формуле (3), а затем преобразована с помощью нелинейной функции, то есть сигмоидной функции, для получения скалярного значения λi, лежащего в диапазоне от 0 до 1. Чем больше значение λi, тем выше степень корреляции между текстом, подлежащим переводу, и i-м предложением, следующим за текстом, подлежащим переводу, и наоборот.

[166] Как можно видеть, коэффициенты {Х12,…,Хk} корреляции для соответствующих последующих предложений в последующем исходном тексте могут быть вычислены с помощью формулы (3).

[167] На шаге С2 выполняют обработку начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции.

[168] После вычисления коэффициентов {Х-k-k-1,…,Х-1} корреляции, отвечающих соответствующим предшествующим предложениям предшествующего исходного текста, предшествующие предложения могут выбираться динамически в соответствии с их коэффициентами корреляции; аналогично, после вычисления коэффициентов {Х12,…,Хk} корреляции, отвечающих соответствующим последующим предложениям последующего исходного текста, последующие предложения могут выбираться динамически на основе этих коэффициентов корреляции. Эта процедура описана более подробно ниже.

[169] На основе начального результата кодирования Н={h1,h2,…,hn} текста, подлежащего переводу, который получают на шаге S401 во втором варианте осуществления настоящего изобретения, для соответствующего hi(i=1,2…n) каждого слова в тексте, подлежащем переводу, может быть введена контекстная информация в соответствии со следующей формулой:

[170]

[171] где {Х-k-k-1,…,Х-1} - коэффициенты корреляции, отвечающие соответствующим предшествующим предложениям и полученные с помощью шлюзовой сети, {Х12,…,Хk} - коэффициенты корреляции, отвечающие соответствующим последующим предложениям и полученные с помощью шлюзовой сети, - результаты кодирования соответствующих предшествующих предложений, и - результаты кодирования соответствующих последующих предложений.

[172] Очевидно, что при помощи формулы (3) контекстная информация может вводиться по отдельности для каждого слова в тексте, подлежащем переводу.

Посредством описанного выше процесса кодирования семантическую информацию текста, подлежащего переводу, преобразуют в то есть в выходные данные Нс подсистемы декодирования, как показано на фиг. 3.

[173] Следует отметить, что Нс не только включает семантическую информацию

текста, подлежащего переводу, но также учитывает {λ-k, λ-k-1, …, λ-1} и {λ1, λ2, …, λk} для динамического выбора используемой контекстной информации, что позволяет устранить избыточность информации, вызванную наложением информации, и повысить точность результата перевода.

[174] Таким образом, способ кодирования, предлагаемый в данном варианте осуществления настоящего изобретения, позволяет ввести семантическую информацию в релевантный текст или ее часть, на кодирующем конце, а также ввести информацию о степенях корреляции между текстом, подлежащим переводу, и введенным релевантным текстом. Таким образом, обеспечивается динамический выбор контекстной информации для текста, подлежащего переводу, что не только уменьшает избыточную информацию в информации, принимаемой моделью кодирования-декодирования, но также позволяет повысить точность результата перевода текста, подлежащего переводу.

[175] Четвертый вариант осуществления изобретения

[176] Данный вариант осуществления настоящего изобретения включает конкретную реализацию шага S404, упомянутого во втором варианте осуществления настоящего изобретения.

[177] В данном варианте осуществления изобретения «перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования» на описанном выше шаге S404 включает, в частности, декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования. Результат кодирования предшествующего целевого текста на шаге S402 во втором варианте осуществления настоящего изобретения может представлять собой или Эти результаты кодирования могут использоваться как вспомогательные при декодировании целевого результата Нс кодирования с получением перевода текста, подлежащего переводу.

[178] В одной из реализаций данного варианта осуществления изобретения декодирование целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования может включать описанные ниже шаги A3 и В3.

[179] На шаге A3 определяют степень корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.

[180] Предшествующий целевой текст включает результат перевода каждого предшествующего предложения в предшествующем исходном тексте (далее их будем называть переведенными предложениями). Степень корреляции между каждым переведенным предложением и текстом, подлежащим переводу, может определяться по отдельности.

[181] В одной из реализаций шаг A3 может включать, в частности, определение степеней корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степеней корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. В такой реализации степени корреляции между текстом, подлежащим переводу, и соответствующими переведенными предложениями предшествующего целевого текста могут быть представлены соответственно коэффициентами {λ-k, λ-k-1, …, λ-1} корреляции, отвечающими соответствующим предшествующим предложениям предшествующего исходного текста и вычисленными на шаге А2 третьего варианта осуществления настоящего изобретения. Например, λ-k представляет корреляцию между текстом, подлежащим переводу, и k-м предложением перед текстом, подлежащим переводу.

[182] На шаге В3 выполняют декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.

[183] На этом шаге вычисление с использованием коэффициентов {λ-k, λ-k-1, …, λ-1} корреляции и результатов кодирования (со ссылкой на шаг С1 второго варианта осуществления изобретения) для предшествующего целевого текста выполняют согласно следующей формуле:

[184]

[185] Как показано на фиг. 3, представляет результат кодирования предшествующего целевого текста, который используют при декодировании. Когда декодируют целевой результат Нс кодирования, выполняют последовательное декодирование посредством RNN-сети. В данной реализации в любой момент в процессе декодирования может добавляться согласно следующей формуле:

[186]

[187] где g - нелинейная функция, например сигмоидная функция или LSTM-сеть; W, U и V могут быть известными параметрами обучения декодирующей сети, а Р - новый введенный параметр обучения декодирующей сети в данном варианте осуществления настоящего изобретения; sj представляет скрытое состояние в текущий момент j времени; sj-1 представляет скрытое состояние в последний момент j-1 времени; уj-1 - вектор слов результата кодирования в последний момент времени, а сj - выходная информация модели внимания, которая может представлять собой сетевую структуру в общей структуре кодирования-декодирования с использованием тех же способов кодирования и вычисления, что и в известном уровне техники.

[188] После получения, путем декодирования, скрытого состояния sj в текущий момент j времени оценивают распределение вероятностей для результатов перевода слова, переводимого в текущий момент j времени, при помощи функции soft max в общей структуре кодирования-декодирования. Результат перевода переводимого слова получают в соответствии с распределением вероятностей.

[189] Таким образом, способ декодирования в соответствии с данным вариантом осуществления настоящего изобретения подразумевает введение результата перевода предшествующего исходного текста, то есть предшествующего целевого текста, на декодирующем конце, а также введение информации о степенях корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. Таким образом, результат перевода текста, подлежащего переводу, может быть связан с результатом перевода предшествующего текста, что не только позволяет повысить точность перевода текста, подлежащего переводу, но также улучшает плавность всего текста перевода в целом, то есть гарантируются связность и согласованность предложений переведенного текста на уровне дискурса.

[190] Пятый вариант осуществления изобретения

[191] В данном варианте осуществления настоящего изобретения предлагается устройство для перевода текста на уровне дискурса, при этом за соответствующим описанием следует обращаться к рассмотренным выше вариантам осуществления способа.

[192] На фиг. 7 показана структурная схема устройства для перевода текста на уровне дискурса в соответствии с данным вариантом осуществления настоящего изобретения. Устройство 700 содержит:

[193] блок 701 получения текста, подлежащего переводу, который сконфигурирован для получения текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;

[194] блок 702 получения релевантного текста, который сконфигурирован для получения релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст, причем под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и

[195] блок 703 перевода текста, подлежащего переводу, который сконфигурирован для перевода текста, подлежащего переводу, в соответствии с релевантным текстом.

[196] В одной из реализаций данного варианта осуществления настоящего изобретения, блок 703 перевода текста, подлежащего переводу, может быть сконфигурирован, в частности, для перевода текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.

[197] В одной из реализаций данного варианта осуществления настоящего изобретения блок 703 перевода текста, подлежащего переводу, может содержать:

[198] первый подблок кодирования, сконфигурированный для получения начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;

[199] второй подблок кодирования, сконфигурированный для получения релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;

[200] подблок обработки результата, сконфигурированный для получения целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и

[201] подблок выполнения декодирования, сконфигурированный для перевода текста, подлежащего переводу, путем декодирования целевого результата кодирования.

[202] В одной из реализаций данного варианта осуществления настоящего изобретения первый подблок кодирования может быть сконфигурирован, в частности, для получения начального результата кодирования путем кодирования каждого слова текста, подлежащего переводу.

[203] Соответственно, второй подблок кодирования может быть сконфигурирован, в частности, для кодирования слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определения упомянутых результатов кодирования в качестве релевантного результата кодирования.

[204] В одной из реализаций данного варианта осуществления настоящего изобретения блок 703 перевода текста, подлежащего переводу, может также содержать:

[205] первый подблок сложения, сконфигурированный для сложения вместе, после кодирования слов текста, подлежащего переводу, результатов кодирования слов текста, подлежащего переводу, с получением суммарного результата, соответствующего тексту, подлежащему переводу, и

[206] второй блок сложения, сконфигурированный для сложения вместе, после кодирования слов каждой единицы текста в релевантном тексте, результатов кодирования слов каждой единицы текста в предшествующем исходном тексте в случае, когда релевантный текст включает предшествующий исходный текст, с получением суммарного результата, соответствующего каждой единице текста, сложения вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте в случае, когда релевантный текст включает последующий исходный текст, с получением суммарного результата, соответствующего каждой единице текста, и сложения вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте в случае, когда релевантный текст включает предшествующий целевой текст, с получением суммарного результата, соответствующего каждой единице текста.

[207] В одной из реализаций данного варианта осуществления настоящего изобретения подблок обработки результата содержит:

[208] первый подблок определения, сконфигурированный для определения, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;

[209] второй подблок определения, сконфигурированный для определения, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования, и

[210] подблок получения результата, сконфигурированный для обработки начального результата кодирования в соответствии с определенным результатом кодирования, с получением целевого результата кодирования.

[211] В одной из реализаций данного варианта осуществления настоящего изобретения подблок получения результата содержит:

[212] первый подблок определения степени корреляции, сконфигурированный для определения, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста,

[213] второй подблок определения степени корреляции, сконфигурированный для определения, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста, и

[214] подблок получения целевого результата, сконфигурированный для обработки начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции, с получением целевого результата кодирования.

[215] В одной из реализаций данного варианта осуществления настоящего изобретения подблок выполнения декодирования сконфигурирован, в частности, для декодирования, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.

[216] В одной из реализаций данного варианта осуществления настоящего изобретения подблок выполнения декодирования содержит:

[217] третий подблок определения степени корреляции, сконфигурированный для определения степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом, и

[218] подблок обработки результата кодирования, сконфигурированный для декодирования целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.

[219] В одной из реализаций данного варианта осуществления настоящего изобретения третий подблок определения степени корреляции сконфигурирован, в частности, для определения степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.

[220] Шестой вариант осуществления изобретения

[221] В данном варианте осуществления настоящего изобретения предлагается еще одно устройство для перевода текста на уровне дискурса, при этом за соответствующим описанием следует обращаться к рассмотренным выше вариантам осуществления способа.

[222] На фиг. 8 показана аппаратная структурная схема устройства для перевода текста на уровне дискурса в соответствии с данным вариантом осуществления настоящего изобретения. Устройство 800 голосового взаимодействия включает память 801, приемник 802 и процессор 803, связанный с памятью 801 и приемником 802, при этом память 801 сконфигурирована для хранения набора программный инструкций, а процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[223] получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;

[224] получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст,

[225] при этом под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и

[226] перевод текста, подлежащего переводу, в соответствии с релевантным текстом.

[227] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующей операции:

[228] перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.

[229] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[230] получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;

[231] получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;

[232] получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и

[233] перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования.

[234] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[235] получение начального результата кодирования путем кодирования слов текста, подлежащего переводу, и

[236] кодирование слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определение упомянутых результатов кодирования в качестве релевантного результата кодирования.

[237] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[238] получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу;

[239] в случае, когда релевантный текст включает предшествующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста;

[240] в случае, когда релевантный текст включает последующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста, и,

[241] в случае, когда релевантный текст включает предшествующий целевой текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте, для получения суммарного результата, соответствующего каждой единице текста.

[242] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[243] определение, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;

[244] определение, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования и

[245] обработку начального результата кодирования в соответствии с определенным результатом кодирования.

[246] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[247] определение, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста;

[248] определение, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста и

[249] обработка начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции.

[250] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующей операции:

[251] декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.

[252] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:

[253] определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом и

[254] декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.

[255] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующей операции:

[256] определение степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.

[257] В некоторых из вариантов осуществления настоящего изобретения процессор 803 может быть центральным процессорным блоком (Central Processing Unit, CPU), память 801 может быть внутренним хранилищем в виде памяти с произвольным доступом (Random Access Memory, RAM), а приемник 802 может включать стандартный физический интерфейс, который может быть интерфейсом Ethernet или интерфейсом с асинхронным режимом передачи (Asynchronous Transfer Mode, ATM). Процессор 803, приемник 802 и память 801 могут быть интегрированы в одну или более независимых схем или аппаратных блоков, например в заказные интегральные схемы (Application Specific Integrated Circuit, ASIC).

[258] В соответствии с данным вариантом осуществления настоящего изобретения предлагается машиночитаемый носитель данных. Машиночитаемый носитель данных содержит инструкции, которые при их исполнении на компьютере обеспечивают выполнение, этим компьютером, любых из описанных выше способов перевода текста на уровне дискурса

[259] В соответствии с данным вариантом осуществления настоящего изобретения предлагается также компьютерный программный продукт, который при его исполнении на терминальном устройство обеспечивает выполнение, этим терминальным устройством, любых из описанных выше способов перевода текста на уровне дискурса.

[260] Из приведенного выше описания вариантов осуществления настоящего изобретения специалистам в данной области техники очевидно, что все шаги или часть шагов в рассмотренных вариантах осуществления способов могут быть реализованы с помощью программного обеспечения на соответствующей стандартной аппаратной платформе. Следовательно, сущность или та часть предлагаемых технических решений, которая вносит вклад в известный уровень техники, может быть реализована в виде программного продукта. Компьютерный программный продукт может храниться на носителе данных, например, в памяти ROM/RAM, на магнитном или оптическом диске, или аналогичном носителе, содержащем набор инструкций, обеспечивающих выполнение, компьютерным устройством (которое может быть персональным компьютером, сервером или сетевым устройством связи, таким как медиа-шлюз и т.п.), способов согласно различным вариантам осуществления настоящего изобретения или их частям.

[261] Следует отметить, что различные варианты осуществления настоящего изобретения, рассмотренные в данной заявке, приведены последовательно, при этом подчеркнуты отличия каждого из вариантов осуществления изобретения от остальных; поэтому за описанием идентичных или аналогичных частей в различных вариантах осуществления настоящего изобретения можно обращаться к другим вариантам. Устройство, соответствующее вариантам осуществления настоящего изобретения, описано кратко, поскольку оно соответствует способу согласно вариантам осуществления настоящего изобретения, и за описанием соответствующих частей можно обращаться к описанию способа.

[262] Следует также понимать, что термины, указывающие на отношения, такие как «первый» или «второй», применяются в данном документе исключительно для различения одного объекта или операции от другого объекта или другой операции, и не обязательно подразумевают или требуют наличия фактического порядка или отношения между этими объектами или операциями. Кроме того, термины «включает», «содержит» и любые их варианты подразумевают не исключающее включение, так что процесс, способ, объект или устройство, включающее набор элементов, может включать не только эти элементы, но и любые другие, не перечисленные явно, или элементы, присущие процессу, способу, объекту или устройству. Без дополнительного ограничения, выражение «включает», указанное перед элементом, не исключает наличие других таких же элементов в процессе, способе, объекте или устройстве, включающих упомянутый элемент.

[263] Приведенное выше описание вариантов осуществления изобретения дает возможность специалистам в данной области техники реализовать настоящее изобретение или применить его на практике. Специалистам в данной области техники могут быть очевидны различные модификации вариантов осуществления настоящего изобретения, при этом раскрытый здесь общий принцип изобретения может быть реализован и в других вариантах его осуществления, в пределах сущности настоящего изобретения. Соответственно, настоящее изобретение не ограничено описанными здесь вариантами его осуществления, и его сущность определяется в наиболее широком объеме в соответствии с принципом и новыми признаками изобретения.

1. Компьютерно-реализуемый способ перевода текста на уровне дискурса, включающий:

получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу,

получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст,

причем предшествующий исходный текст представляет собой по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, последующий исходный текст представляет собой по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а предшествующий целевой текст представляет собой текст перевода упомянутого предшествующего исходного текста, и

перевод текста, подлежащего переводу, в соответствии с релевантным текстом,

при этом перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает:

получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;

получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;

получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования; и

перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования.

2. Способ по п. 1, в котором перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает: перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.

3. Способ по п. 2, в котором целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть.

4. Способ по п. 3, в котором получение начального результата кодирования путем кодирования текста, подлежащего переводу, включает:

получение начального результата кодирования путем кодирования слов текста, подлежащего переводу, при этом соответственно получение релевантного результата кодирования путем кодирования релевантного текста включает:

кодирование слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определение упомянутых результатов кодирования в качестве релевантного результата кодирования.

5. Способ по п. 4, также включающий, после кодирования слов текста, подлежащего переводу:

получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу, при этом соответственно после кодирования слов каждой единицы текста в релевантном тексте способ также включает:

в случае, когда релевантный текст включает предшествующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста;

в случае, когда релевантный текст включает последующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста, и

в случае, когда релевантный текст включает предшествующий целевой текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте для получения суммарного результата, соответствующего каждой единице текста.

6. Способ по п. 3, в котором обработка начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования включает:

определение, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;

определение, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования и

обработку начального результата кодирования в соответствии с определенным результатом кодирования.

7. Способ по п. 6, в котором обработка начального результата кодирования в соответствии с определенным результатом кодирования включает:

Определение, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста;

определение, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста и

обработку начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции.

8. Способ по любому из пп. 3−7, в котором перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования включает:

декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.

9. Способ по п. 8, в котором декодирование целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования включает:

определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом и

декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.

10. Способ по п. 9, в котором определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом включает:

определение степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.

11. Устройство для перевода текста на уровне дискурса, содержащее:

процессор, память и системную шину,

при этом процессор и память связаны друг с другом посредством системной шины и память сконфигурирована для хранения одной или более компьютерных программ, содержащих инструкции, которые при их исполнении процессором обеспечивают выполнение, этим процессором, способа по любому из пп. 1−10.

12. Машиночитаемый носитель данных, содержащий инструкции, которые при их исполнении на компьютере обеспечивают выполнение этим компьютером способа по любому из пп. 1−10.



 

Похожие патенты:

Изобретение относится к области компьютерной техники, в частности к методам формирования идентификаторов устройств для их применения в области защиты информации. Техническим результатом является повышение точности идентификации мобильных устройств.

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении точности определения порога идентификации для биометрических образцов в системе контроля доступа.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении автоматической кластеризации исполняемых файлов.

Изобретение относится к области информационной безопасности. Техническим результатом является предупреждение компрометации защищаемой инфраструктуры злоумышленниками или вредоносными программами, а также своевременное информирование службы кибербезопасности об обнаружении попыток компрометации.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении уровня безопасности вычислительной системы.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении точности кластеризации фишинговых веб-ресурсов.

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении точности ранжирования веб-ресурса.

Изобретение относится к области алгоритмов машинного обучения. Техническим результатом является обеспечение формирования обучающих наборов для обучения алгоритмов машинного обучения, реализуемых в системе поиска информации.

Изобретение относится к области вычислительной техники. Техническим результатом является обеспечение реализации обучения алгоритма машинного обучения (MLA) формированию прогнозируемого совместного векторного представления для цифрового элемента, представляющего собой потенциальный рекомендуемый элемент в системе рекомендации контента, способной рекомендовать элементы пользователям системы рекомендации контента и размещенной на сервере.

Изобретение относится к области защиты информации. Техническим результатом является повышение достоверности обработки информации при ее защите от утечки по каналам ПЭМИН.
Наверх