Сегмент данных о переводе

Изобретение относится к способу и устройству для использования сегмента данных о переводе. Его применение позволяет получить технический результат в виде обеспечения прозрачного перевода информации в сетевой среде. Информация содержит считываемый сегмент данных о переводе, который включает в себя глобальные параметры перевода для получения перевода упомянутой информации с первого языка на целевой язык. Данные о переводе анализируют с целью получения параметров перевода, которые будут использоваться при переводе информации. Данные о переводе предпочтительно включают в себя по меньшей мере одно из перечисленного: указатель на перевод информации, или указатель на средство перевода для перевода информации, или указатель на человека-переводчика, являющегося специалистом в области перевода упомянутой информации. 2 н. и 16 з.п. ф-лы. 3 ил.

 

Настоящее изобретение относится в общем к области перевода, а более конкретно к сегменту данных о переводе, который облегчает прозрачный (выполняемый автоматически, фактически без вмешательства пользователя и незаметно для него) перевод информации.

Изобретение также относится к способу и устройству для использования сегмента данных о переводе с целью обеспечения прозрачного перевода информации в сетевой среде.

Предшествующий уровень техники

Машинный перевод сообщения с одного языка на другой устраняет коммуникационный барьер между людьми и способствует интеграции бизнеса. На протяжении последних двадцати лет непрерывно проводились работы по улучшению качества машинного перевода. Были разработаны различные методики перевода, позволяющие осуществлять уже не пословный перевод, а перевод по фразам. В других методиках используются словари или системы переводческой памяти (класс автоматизированных систем машинного перевода) для перевода целых предложений. В результате улучшается грамматика переведенной информации и, следовательно, удобочитаемость. Некоторые из лучших программ перевода для наиболее часто используемых языков и для специфических целей приближаются по качеству к переводам, выполненным человеком.

Хотя технические возможности программного обеспечения для машинного перевода значительно расширились, его практичность остается на низком уровне. Для того чтобы перевести документ, сообщение электронной почты или другую информацию, в общем случае, необходимо получить доступ к сетевому ресурсу перевода и запустить программу перевода. Параметры для этой программы, такие как исходный и целевой язык, предпочтительный словарь, специальные слова и так далее, должен вводить пользователь.

В нашей одновременно рассматриваемой заявке на патент США №09/676690 описана система перевода по принципу "однократного щелчка мышью" ("one-click"), которая позволяет избежать многочисленного пользовательского ввода, необходимого для получения перевода информации. Система перевода по однократному щелчку мыши содержит компонент перевода по однократному щелчку мыши и средство управления переводом, которые объединены для обеспечения почти прозрачного перевода сразу после того, как пользователь щелчком мыши активирует компонент перевода по однократному щелчку мыши. Тем не менее, качество перевода не является основным направлением системы перевода по однократному щелчку мыши.

Хотя система перевода по однократному щелчку мыши является существенным прогрессом относительно предшествующего уровня техники, она все же требует некоторого действия от получателя информации. Для того чтобы машинный перевод информации был взят на вооружение повсеместно, он должны быть полностью прозрачным. Требуется система, которая автоматически доставляла бы информацию на предпочтительном для получателя языке. Система также должна обеспечивать доставку перевода с более высоким качеством по сравнению с имеющимися в настоящее время. Некоторые недавно разработанные технологии приближаются к этому идеалу решения, но не достигают его. Например, в патенте США №6161082, переуступленном корпорации AT&T, описана основанная на сети система перевода с одного языка на другой язык, которая предназначена для улучшения машинного перевода за счет использования для выполнения перевода вычислительной мощности сети, а не одного локального средства. Однако в этом патенте не объясняется, как выполняется обнаружение используемых языков. В нем только упоминается о том, что исходный и целевой язык можно обнаружить из информации, передаваемой между двумя сторонами, без указания того, как это достигнуть. Подход AT&T не обеспечивает какого-либо существенного повышения качества перевода, а усовершенствование достигается только за счет увеличения вычислительной мощности, доступной в сетевой среде.

Целью патента США №5548508, переуступленного фирме Fujitsu Limited, является повышение качества машинного перевода посредством введения тэгов (неотображаемых элементов разметки документа в гипертекстовом формате) в документ, которые включают в себя контекстную информацию. Например, тэг <TITLE>... </TITLE> показывает, что слова представляют собой зоголовок и должны отображаться соответствующим образом, тэг <MODIFY>... </MODIFY> может использоваться для определения правильного порядка переведенных слов. Тэги действуют на малые части документа, а не глобально. Для эффективности изобретения требуется программа перевода, которая поддерживает расширенный набор тэгов Fujitsu. Изобретение Fujitsu достигает цели выполнения машинного перевода с более высокой точностью, но делает это путем значительной предварительной и последующей обработки, которая замедляет перевод. При использовании подхода Fujitsu невозможно выполнять машинные переводы прозрачным способом.

В недавно выданном патенте США №6073143, переуступленном корпорации Sanyo Electric Co. Ltd, описан процесс улучшения качества перевода документов на языке гипертекстовой разметки (HTML) за счет добавления команд перевода к каждой гиперссылке в документе. В изобретении сделана попытка решить проблему потерянных гиперссылок, которая имеет место во время перевода. Однако оно не нацелено на улучшение перевода реального документа.

В патенте США №5848386, переуступленном компании Ricoh Company, описана система автоматического перевода, использующая различные ресурсы перевода, такие как словари и базы данных правил для перевода различных частей документа. Тэги встраиваются в документ для определения структуры документа, подлежащего переводу, для того, чтобы выбрать словари и/или правила, которые должны использоваться в процессе перевода. Однако система требует "определения типа документа", которое должно создаваться, для каждого документа, подлежащего переводу. Перевод только выполним для документов, которые имеют заданную структуру, но не доступен для таких документов, как Web-страницы сети Интернет.

Сущность изобретения

В одном виде, хотя он необязательно будет единственным или самым широким, изобретение заключается в сегменте данных о переводе, связанном с информацией, представленной в электронном виде, при этом:

сегмент данных о переводе включает в себя глобальные параметры для осуществления перевода упомянутой информации, представленной в электронном виде, или ее части или частей с исходного языка на один или более целевых языков, и

сегмент данных о переводе идентифицируют и обрабатывают посредством приложения, считывающего информацию, представленную в электронном виде, для извлечения параметров перевода для того, чтобы получить перевод информации, представленной в электронном виде, с исходного языка на один или более целевой язык.

Сегмент данных о переводе может быть вложен в информацию, представленную в электронном виде, или быть присоединен к информации, представленной в электронном виде. В качестве альтернативы, сегмент данных о переводе может храниться в доступной базе данных и указатель или указатели либо вставлены в переводимую информацию, представленную в электронном виде, либо присоединены к ней.

Глобальные параметры можно выбрать из параметров, включающих в себя, но не ограниченных перечисленным: исходный язык, кодировку, грамматическое время, имеющийся перевод, средство перевода, словарь, глоссарий, контекст, услуги по переводу, индивидуальный переводчик, правила для обработки тэгов, таких как HTML-тэги, правила для обработки компонентов из состава информации, представленной в электронном виде, таких как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы, правила для выполнения перевода, местонахождение существующих переводов, местонахождение существующих локализованных компонентов упомянутой информации, представленной в электронном виде, таких как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы и переводческая память.

Приложение, обрабатывающее информацию о переводе, предпочтительно включает в себя браузер (программу просмотра) для Web-страниц, или программу электронной почты для сообщений электронной почты, или текстовый процессор для текстовых документов. В качестве альтернативы, приложение, предназначенное для специфических целей, может обнаружить и обработать сегмент данных о переводе.

Возможно наличие двух или более сегментов данных о переводе, связанных с информацией, представленной в электронном виде. Каждый сегмент данных о переводе включает в себя параметры перевода части информации, представленной в электронном виде, связанной с этим сегментом данных о переводе.

В другом виде изобретение заключается в сегменте данных о переводе, связанном с информацией, представленной в электронном виде, причем этот сегмент данных о переводе идентифицируют и обрабатывают посредством приложения, считывающего информацию, представленную в электронном виде, и этот сегмент содержит по меньшей мере одно из нижеперечисленного: указатель на перевод информации, представленной в электронном виде; указатель на местоположение существующих переводов; указатель на местоположение существующих локализованных компонентов информации, представленной в электронном виде, таких как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы; указатель на правила выполнения перевода; указатель на правила для обработки компонентов в составе информации, представленной в электронном виде, таких как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы; указатель на средство перевода для перевода информации, представленной в электронном виде; указатель на словари, глоссарии или базы данных по терминологии; или указатель на человека-переводчика, являющегося специалистом в переводе данной информации, представленной в электронном виде.

Указатель на перевод информации, представленной в электронном виде, представляет собой соответствующий унифицированный указатель ресурсов, и список указателей предпочтительно указывает на различные переводы с одного языка на другой.

Сегмент данных о переводе, предпочтительно, также включает в себя список параметров перевода или указатель на файл, содержащий список параметров перевода. Параметры перевода надлежащим образом читаемы для средства перевода или человека-переводчика с целью улучшения качества перевода.

В еще одном виде изобретение заключается в способе предоставления переведенной информации получателю информации на иностранном языке, включающий в себя этапы, в соответствии с которыми:

связывают сегмент данных о переводе с информацией на иностранном языке,

передают информацию на иностранном языке и сегмент данных о переводе получателю,

проводят синтаксический анализ информации на иностранном языке для идентификации и анализа сегмента данных о переводе, и

получают перевод информации на иностранном языке согласно параметрам в сегменте данных о переводе.

При запросе на перевод из браузера сегмент данных о переводе можно извлечь из упомянутой информации и переслать средству управления переводом наряду с запросом на перевод.

В качестве альтернативы, когда браузер принимает сообщение для отображения, перед отображением он может сначала проверить сегмент данных о переводе для гарантии того, что язык является правильным, и если нет, то он может запросить перевод у средства управления переводом.

Другая альтернатива состоит в том, что для Web-сервера имеется возможность получения данных о предпочтительном языке пользователя и сравнения его с сегментом данных о переводе, и если совпадения нет, то Web-сервер может запросить перевод информации и предоставить соответствующие детали из сегмента данных о переводе средству управления переводом.

Еще одна альтернатива состоит в том, что средство машинного перевода непосредственно просматривает сегмент данных о переводе и использует эту информацию для выполнения более качественного перевода.

В общем, не имеет значения, используется ли информация о сегменте данных о переводе на стороне клиента или сервера. Ключом является информация, которая находится внутри сегмента данных о переводе и используется для оказания помощи средству управления переводом в получении более качественного перевода.

В некоторых случаях можно обойтись и без средства управления переводом. Например, если браузер просматривает сегмент данных о переводе при запросе на перевод и видит унифицированный указатель ресурсов (УУР, URL), где имеется необходимый перевод, браузер может просто запросить этот перевод из этого УУР.

Перечень фигур чертежей

Для лучшего понимания изобретения предпочтительные варианты осуществления будут описаны со ссылкой на следующие фигуры, на которых:

фиг.1 изображает алгоритм процесса прозрачного перевода;

фиг.2 изображает алгоритм процесса непрозрачного перевода; и

фиг.3 изображает общий вид системы процесса перевода, использующего сегмент данных о переводе.

Подробное описание чертежей

На фиг.1 показан алгоритм прозрачного способа перевода информации с исходного языка на целевой язык. В целях упрощения описание способа приводится для одного перевода Web-страницы с исходного языка на целевой язык, при этом подразумевается, что процесс можно тривиальным образом расширить до перевода множества блоков информации на множество языков. Кроме того, согласно способу можно перевести любую информацию, представленную в электронном виде и включающую в себя текстовые документы, сообщения электронной почты, сообщения службы коротких сообщений (SMS) и аудиофайлы, видео и так далее.

Ключевым элементом способа является включение в информацию сегмента данных о переводе (СДП, TIS). СДП предоставляет собой данные, которые позволяют сделать перевод прозрачным для отправителя и получателя информации. В самом простом виде СДП предоставляет одну порцию данных для оказания содействия в получении более качественного перевода информации. Одна порция данных может представлять собой любой из параметров, описанных в этой заявке, такой как УУР, по которому уже имеется профессионально переведенная версия имеющейся информации, или переводческая память, в которой уже имеются многочисленные переведенные фразы и предложения.

СДП не предполагает получение только лишь более качественного машинного перевода, а пытается получить наилучший перевод. Это подразумевает использование существующего перевода, выполненного человеком, там, где это возможно, поэтому если в наличии имеется версия, профессионально переведенная человеком, то ее можно получить. С другой стороны, если фрагменты, переведенные человеком, имеются в переводческой памяти, то их можно получить.

В более сложном виде (подробно описанном ниже) СДП включает в себя более полный список всех параметров для получения более качественного перевода информации на целевой язык, включающий в себя такие параметры, как стиль, сущность, предпочтительный словарь, предпочтительный глоссарий, предпочтительное средство перевода, слова для исключения, данные, которые необходимо игнорировать, услуги по переводу, местонахождения существующих переводов, местонахождения существующих локализованных компонентов, таких как изображения, графика, звук, анимация, видео, программное обеспечение, правила для обработки тэгов (например, HTML-тэгов), правила для обработки компонентов информации, таких как графика, руководящие принципы, программируемые подпрограммы и способ оплаты (для коммерческих переводов). Следует понимать, что некоторые из этих параметров будут полезны для людей-переводчиков, а также средств машинного перевода, например словарь или глоссарий. Преимущества СДП не ограничиваются машинным переводом.

В качестве альтернативы, СДП может состоять из указателя или указателей на файл, которые содержат некоторые или все параметры, перечисленные выше. Этот вариант осуществления по существу эквивалентен вложению данных в упомянутую информацию, но может быть более эффективным в сетевой среде, где средство управления переводом поддерживает базу данных параметров перевода, которые извлекаются в соответствии с идентификатором СДП во время перевода.

Система прозрачного перевода может быть также обеспечена для информации, которая не включает в себя СДП, но этот процесс описан в нашей одновременно рассматриваемой заявке "Система прозрачного перевода".

Возможно наличие различных СДП, связанных с различными частями информации. Например, информация может включать в себя фрагмент текста, взятый в кавычки, который имеет стиль, отличающийся от остальной части этой информации. Для того чтобы получить качественно переведенную информацию, СДП для большей части документа должен иметь набор параметров, отличный от СДП, связанного с фрагментом текста, взятым в кавычки. В целях упрощения приводится описание одного СДП, который связан с одним блоком информации, но изобретение может быть расширено до множества СДП в каждом блоке информации.

На фиг.1 выполнение способа начинается, когда пользователь запрашивает Web-страницу. Браузер пользователя проводит анализ этой Web-страницы на предмет СДП. Например, в общем случае СДП может иметь следующую структуру:

<?xml version="1.0" encoding="UTF-8"?>

<TIS>

<Version>1.0</Version>

<SourceLang>en</SourceLang>

<MIME-Type>text/rtf</MIME-Type>

<Encoding>ISO8859-1</Encoding>

<Tense>

<Item1>formal</Item1>

<Item2>business</Item2>

</Tense>

<AvailableTranslation>

<de_DE>http://www.source.com/reference</de_DE>

<fr_CA>file://lanhost//d:/path/docname</fr_CA>

</AvailableTranslation>

<TranslationMemory>

<Item1>TM-1 reference</Item1>

<Item2>TM-2 reference</Item2></TranslationMemory>

<Service>

<Engine>special engine xyz</Engine>

<PreferredAgency>Worldlingo</PreferredAgency>

<PreferredTranslator>

<Item1>

<Language>de</Language>

<Name>Hans Schmidt</Name>

</Item1>

<Item2>

<Language>it</Language>

<Name>Bruno Zagani</Name>

</Item2>

</PreferredTranslator>

</Service>

<Dictionary>

<Item1>Dictionary 1 reference</Item1>

<Item2>Dictionary 2 reference</Item2>

</Dictionary>

<Glossary>

<Item1>Glossary 1 reference</Item1>

</Glossary>

<DNT>

<Item1>Microsoft</Item1>

<Item2>Worldlingo</Item2>

<DNT>

<DNT-List><Item1>http://www.source.com/dnt-list-doc</Item1>

</DNT-List>

<Use>

<Item1>marketing</Item1>

</Use>

<Industry>

<Item1>engineering</Item1>

</Industry>

<Rulesets>

<Tagged>

<Tagged1>

<Type>html</Type>

<Item1>

<Name>rules</Name>

<Item1>

<Expr>if (stillTranslate) then translateContent()</Expr>

</Item1>

</Item1>

<Item2>

<Name>base</Name>

<Item1>

<Expr>if (hasAttribute("href")) then parse(attribute("href"))</Expr>

</Item1>

</Item2>

</Tagged1>

</Tagged>

</Rulesets>

</TIS>

Фактические маркеры (элементы разметки) будут изменяться в любой заданной ситуации и могут включать в себя поднабор маркеров, показанных в примере, или дополнительные маркеры, которые не показаны.

Маркеры, показанные в обычном СДП языка XLM (расширяемой спецификации языка разметки документов) имеют следующие функции:

<TIS>... <TIS>

указывает начало и конец СДП;

<Version>... </Version>

показывает версию структуры СДП;

<SourceLang>... </SourceLang>

указывает язык информации;

<MIME-Type>... </MIME-Type>

показывает тип многоцелевого расширения электронной почты в сети Интернет (MIME);

<Encoding>... </Encoding>

показывает кодировку;

<Tense>...</Tense>

показывает грамматическое время, которое считывается с помощью средства машинного перевода, в качестве параметра, который позволяет улучшить качество перевода;

<Item#>... </Item#>

разграничивает многочисленные тематики для указания приоритета. Item1 применяется перед Item2;<AvailableTransiation>... </AvailabIeTranslation>

составляет список имеющихся в наличии/предпочтительных переводов. Например, Web-страница может уже иметь эквивалент на иностранном языке, который может быть доставлен вместо страницы, к которой осуществлен доступ;

<TranslationMemory>... </TranslalionMemory>

указывает на переводческую память для извлечения переводов из буфера во избежание повторного перевода уже переведенных документов или частей документов;

<Service>... </Service>

показывает предпочтения для перевода, такие как конкретное средство перевода или конкретные люди-переводчики;

<Engine>... </Engine>

предпочтительное средство;

<PreferredAgency>... </PreferredAgency>

предпочтительное агентство для выполнения требуемых переводов;

<PreferredTranslator>... </PreferredTranslalor>

предпочтительный человек-переводчик, по возможности для каждого языка;

<Dictionary>... </Dictionary>

подлежащий использованию словарь или словари для перевода;

<Glossary>... </Glossary>

подлежащий использованию глоссарий или глоссарии для перевода;

<DNT>... </DNT>

список слов или фраз, которые не нужно переводить;<DNT-List>... </DNT-List>

указатель на файл, содержащий список слов или фраз, которые не нужно переводить;

<Use>... </Use>

контекстный маркер, используемый средством перевода для улучшения качества перевода;

<Industry>... </Industry>

другой контекстный маркер для улучшения качества перевода;

<Rulesets>... </Rulesets>

список правил или руководящих принципов, которые можно применять в процессе перевода.

Сразу после идентификации СДП браузер извлекает параметры перевода и выполняет соответствующие действия. Первым действием является проверка тэга исходного языка на предмет предпочтительного языка пользователя. Данные о предпочтительном языке пользователя могут быть получены на основе настроек операционной системы, cookie (небольшого файла данных о предыстории обращений пользователя к конкретному Web-серверу, автоматически создаваемого сервером на машине пользователя), файла предпочтений, находящегося на компьютере получателя или в другом доступном месте, или на основе анализа, выполненного с помощью соответствующего программного обеспечения. Если предпочтительный язык совпадает с исходным языком, то необходимость в переводе отсутствует и страница отображается. Если совпадения нет, то получают перевод.

СДП не ограничивается содействием прозрачному переводу информации. СДП также улучшает качество перевода в непрозрачной системе, такой как система перевода по однократному щелчку мыши, описанная в нашей одновременно рассматриваемой заявке, упомянутой ранее. Система непрозрачного перевода, использующая СДП, показана на фиг.2.

Выполнение процесса, изображенного на фиг.2 начинается тогда, когда пользователь принимает, например, сообщение электронной почты, и программа электронной почты отображает это сообщение электронной почты. Если сообщение электронной почты поступает не на предпочтительном языке получателя, то производят действие, такое как щелчок по кнопке мыши с целью активации упомянутого компонента перевода по однократному щелчку мыши для запроса на перевод. Средство управления переводом производит синтаксический анализ сообщения электронной почты на предмет СДП. Содержание СДП анализируют, и получают перевод согласно информации, которая содержится в СДП. Для электронной почты это обычно означает пересылку параметров перевода в средство перевода.

Преимущество СДП состоит в том, что он может содержать перенаправление на иностранный эквивалент запрашиваемой информации. В ряде направлений бизнеса осуществляется поддержка зеркальных сайтов на многих языках. СДП может содержать указатели на эти сайты, как это показано в предыдущем общем примере.

В одном примере это реализовано с использованием правила, состоящего в надлежащем задании местоположения зеркальной страницы, позволяющем избежать необходимости задания названия локализованной Web-страницы для каждого УУР. Например, СДП может содержать указатель на директорию на сервере, где хранятся все локализованные файлы с расширением.html (Web-страницы), относящиеся к рассматриваемой информации. СДП может также содержать указатель на правило или набор правил относительно того, как файлы с расширением.html необходимо обрабатывать при обработке части информации.

Например, согласно правилу можно производить замену X или X_* (где * - групповой символ, заменяющий один или несколько символов и представляющий любое расширение) на X_japanese (X_Японский), когда информацию переводят на японский язык.

Для того чтобы обрабатывался фрагмент информации и Web-страница, называемая homepage.html (домашняя страница.html), СДП указывает на правило, которое заменяет homepage.html на homepage_japanese.html, если homepage_japanese.html находится в указанном месте. Аналогично, СДП может обеспечить указатель на местоположение, где хранится локализованная графика с тем, чтобы tree_homepage_japanese.gif можно было получить, если это имеется в наличии, из заданного местоположения и вставить в перевод вместо tree_homepage.gif.

Как упомянуто выше, использование СДП не ограничено Web-страницами. СДП можно добавить к сообщению электронной почты способом, подобным известному использованию виртуальных визитных карточек по стандарту VCARD. Следующий пример показывает присоединение СДП к сообщению электронной почты, используя специальный тип MIME (также названный Content-Type (тип содержимого)), такой как "text/x-tis".

Content-Type: text/x-tis; name="settings.tis"Content-Transfer-Encoding: quoted-printable

Content-Disposition: attachment; filename="settings.tis"

<TIS>

...

</TIS>

СДП, такой как показан в приведенном выше примере, вставляется в отдельную часть сообщения электронной почты. Эти отдельные части внутри сообщения электронной почты являются обычной практикой и представляют собой присоединения к содержимому данного сообщения электронной почты.

Преимуществом СДП в качестве присоединения является то, что на него не влияет передача по сети Интернет и он не зависит от системы обработки электронной почты отдельных серверов электронной почты.

Альтернативным вариантом осуществления СДП в электронной почте является добавление специализированного заголовка следующего вида:

Received: from Laptop (isp.net [192.168.41.217]) by wlm.worldlingo.com with SMTP (Microsoft Exchange Internet Mail Service Version #) id 1BV3QHTA; Fri, 9 Feb 2001 09:29:49 +1000 From: "###" <#@worldlingo.com>

To: "###" <#@worldlingo.com>

Subject: Patent

Date: Thu, ## ### ##

Message-ID: <######.#@worldlingo.com>

MIME-Version: 1.0

Content-Type: text/plain;charset="iso-8859-1"

Content-Transfer-Encoding: 7bit

X-Priority: 1 (Highest)

X-MSMail-Priority: High

X-Mailer: Microsoft Outlook IMO, Build 9.0.2416 (9.0.2911.0)

X-MimeOLE: Produced By Microsoft MimeOLE V5.50.4133.2400

X-TIS-Version: 1.0

X-TIS-SourceLang: en

X-TIS-Service: Engine=engine1

X-TIS-Tense: formal, business

Importance: High

Этот пример показывает только несколько полей из возможных полей СДП, отмеченных ранее в примере общей структуры для XML. Только необходимые поля должны быть включены в СДП для любого конкретного приложения. Поля, которые не нужны, можно заменить широко известными и обоснованными значениями по умолчанию или просто пропустить.

Вариант осуществления заголовка СДП можно также применить к документам в текстовом формате, формате RTF или в патентованных форматах. Большинство документов содержит информацию в заголовке, которая предписывает внешний вид документа. СДП можно добавить к этой информации в заголовке с тем, чтобы документ был прозрачно переведен перед просмотром получателем. СДП можно также добавить в диалоговое окно свойств документа, созданного с использованием MSWord® или других составляющих собственность текстовых процессоров.

СДП можно также включить в виде части документов HTML, как показано в следующем примере блока комментария HTML.

<html xmlns:t="urn:schemas-worldlingo-com:tis:tis"

xmlns="http://www.w3.org/TR/REC-html40">

<head>

<meta name="X-TIS-Version" content="1.0">

<title>Reference Document</title>

<!--><xml>

<t:TIS>

<t:SourceLang>en</t:SourceLang>

<t:Version>1.0</t:Version>

<t:MIME-Type>text/rtf</t:MIME-Type>

<t:Encoding>ISО8859-1</t:Encoding>

<t:Tense>

<t:Item1>formal</t:Item1>

<t:Item2>business</t:Item2>

</t:Tense>

<t:Industry>

<t:Item1>engineering</t:Item1>

</t:Industry>

</t:TIS>

</xml><!-->

Альтернативное решение для использования СДП с документами HTML показано в следующем примере HTML-тэга МЕТА.

<HTML>

<HEAD>

<META name="X-TIS-Version" content="1.0">

<META name="X-TIS-SourceLang" content="en"><META name="X-TIS-Service" content="Engine|engine1">

<META name="X-TIS-Tense" content="formal,business">

<TITLE>Search Results</TITLE>

</HEAD>

<BODY>

...

</BODY>

Использование СДП не ограничено текстовыми приложениями. Рудиментарные средства перевода доступны для перевода речи в текст, текста в речь и речи в речь. СДП позволяет значительно улучшить полезность этих рудиментарных средств перевода путем определения параметров, таких как стиль, акцент, содержание и область.

Схематическое изображение практической реализации СДП в сетевой среде показано на фиг.3. Пользователь 1 запрашивает или принимает информацию, такую как Web-страница 2, с использованием браузера на персональном компьютере 3. Браузер запрашивает страницу 2 из Web-сервера 4 через Интернет 5, и она отображается на персональном компьютере 3.

Если языком информации является язык, иностранный для пользователя, то пользователь 1 может запросить перевод. Как обсуждено выше, этот этап может происходить автоматически в соответствии с процессом, описанным в нашей одновременно рассматриваемой заявке. Браузер на персональном компьютере производит синтаксический анализ сообщения на предмет СДП и запрашивает перевод через Интернет 5 с использованием параметров, полученных из СДП.

Если Web-сервер 4 имеет подходящий перевод 2a информации 2, то этот перевод подается непосредственно пользователю 1. Если подходящий перевод недоступен, то запрос на перевод поступает на средство 6 управления переводом с параметрами, извлеченными из СДП. Средство 6 управления переводом получает перевод 2b от средства 7 перевода.

Для простоты объяснения средство 6 управления переводом и средство 7 перевода показаны отдельно. Эти функции можно воплотить в одном приложении или отдельных приложениях, выполняемых на одном компьютере. Функции перевода могут быть даже выполнены локально на персональном компьютере 3, если установлено соответствующее программное обеспечение.

СДП можно считывать с помощью приложения, принимающего информацию, но это не ограничено приведенной реализацией. Если средство перевода постоянно находится на компьютере получателя или в сети, к которой получатель подсоединен, средство перевода может непосредственно интерпретировать СДП. Более конкретно, сервер в сети может быть сконфигурирован как средство управления переводом, которое обнаруживает СДП и управляет переводом информации перед доставкой этой информации получателю. Средство управления переводом может постоянно находиться на компьютере получателя.

Далее, в целях облегчения понимания изобретения, поясняется применение СДП в специфических случаях.

Большая часть существующих коммерческих систем, работающих в оперативном (online) режиме, была создана на Западе, и соответствующие этим системам Web-страницы и документы были разработаны на английском языке. Однако стремительно растущий доступ к сети Интернет осуществляется в местах, где английский язык не является основным языком, и, возможно, на нем даже не разговаривают многие люди, которые могут быть потенциальными клиентами. Для того чтобы осуществлять коммерческую деятельность с этими потенциальными клиентами, Web-страницы и документы должны быть представлены на родном языке потенциальных клиентов. Большинство людей не обременяет себя переводом страницы и, конечно, не будет оплачивать перевод. Для того чтобы осуществлять коммерческую деятельность с этими людьми, перевод должен происходить прозрачно.

Перевод можно выполнить различными способами, каждому из которых использование СДП оказывает содействие. Во-первых, получатель может иметь программное обеспечение для машинного перевода, установленное на своем компьютере. В этом случае СДП обеспечивает все соответствующие параметры, которые прозрачным образом приводят в результате к отображению перевода высокого качества. Во-вторых, если получатель подсоединен к сети Интернет, то СДП может направлять Web-страницу средству управления переводом, которое сделает необходимый перевод и прозрачным образом отобразит его получателю. В-третьих, отправитель может иметь уже созданный зеркальный сайт на соответствующем языке, и в этом случае СДП прозрачным образом направляет браузер получателя на зеркальный сайт.

Для того чтобы достигнуть максимальной эффективности, параметры, которые содержатся в СДП, должны быть соответствующими и понятными для используемого средства перевода. Так как есть широкий диапазон средств перевода, это требование может представлять трудность. Однако изобретатель подразумевает, что СДП содержит расширяемый общий набор параметров. Это относительно простая задача для средства машинного перевода, которая состоит в интерпретации СДП и преобразовании общих параметров в специальные команды. Изобретатель подразумевает, что возможным предоставляется также разработка программ преобразования для интерпретации общих параметров СДП для существующих средств перевода.

Важным преимуществом настоящего изобретения является гибкость, которая позволяет пользователю выбирать способ выполнения перевода для конкретного фрагмента информации. Вместо общего, широкого подхода, СДП предоставляет указатели на специфическую информацию, правила, руководящие принципы и ресурсы, которые позволяют пользователю получать более качественный перевод.

Эта гибкость выбора, хотя и не только она, особенно важна в Интернете, где документы и фрагменты информации необязательно считывают сверху вниз, но и можно осуществлять переход между ними посредством навигации. Кроме того, способ, посредством которого эту навигацию осуществляют, может быть спроектирован/определен каждым отдельным разработчиком Web-сайтов, например, с помощью специального языка сценариев JavaScript. Поэтому общий подход не может охватывать все случаи. Следовательно, гибкость выбора является существенной для правильного выполнения перевода, так как пользователь осуществляет навигацию при просмотре документа или фрагмента информации.

В другом варианте осуществления два или более параметров СДП могут использовать друг друга для выполнения более качественного перевода. Например, СДП может содержать указатель на директорию на сервере, где хранится вся локализованная графика, соответствующая рассматриваемому фрагменту информации. СДП может также содержать другой указатель на правило или набор правил относительно того, как необходимо обрабатывать графику при обработке фрагмента информации.

Ссылаясь на пример, описанный ранее, правило может устанавливать, что необходимо заменять X или X_* (где * - групповой символ, заменяющий один или несколько символов и представляющий любое расширение) на X_japanese, когда информация переводится на японский язык. Следовательно, так как обрабатывается фрагмент информации и графика, которая имеет название tree.gif., СДП указывает на правило, которое предписывает заменить tree.gif на tree_japanese.gif, и СДП обеспечивает указатель на то, где хранится локализованная графика с тем, чтобы можно было получить tree_japanese.gif и включить его в перевод, если tree_japanese.gif находится в этом местоположении хранения данных.

Преимуществом СДП настоящего изобретения является способность для одного параметра СДП использовать другой, что упрощает реализацию, управление и обслуживание системы перевода и ресурсов, которые используются ею для выполнения переводов. Это позволяет пользователю определять соглашение по именованию локализованных компонентов типа графики. Например, добавление "_Language" к имени графики для каждого целевого языка, где в вышеупомянутом примере "_Language" ("_Язык") является "_Japanese" ("_Японский"). Как описано выше, можно записать одно обобщенное правило вместо записи специфического правила для каждой отдельной графики.

Использование одного параметра СДП другим можно применить к широкому диапазону компонентов в пределах документа и/или файлов различного типа.

Интернет определил то, что должно быть переведено из той информации, которой обладают организации. Если пользователь захочет иметь перевод, то он может легко получить его через множество дешевых или бесплатных переводческих сайтов, работающих в оперативном режиме. Вызов для организаций состоит в том, чтобы удостовериться, что перевод, полученный из этих переводческих сайтов, работающих в оперативном режиме, характеризует организацию и/или ее продукцию и услуги в благоприятном свете. СДП обеспечивает организации средство для демонстрации ценных качеств ее перевода и ресурсы с целью предоставления возможности пользователю получить более точный перевод, который, наиболее вероятно, охарактеризует сообщение, испрашиваемое организацией.

На всем протяжении описания цель состояла в том, чтобы описать варианты осуществления изобретения без ограничения изобретения какой-либо специфической комбинацией различных признаков.

1. Способ предоставления переведенной информации получателю информации на иностранном языке, включающий в себя этапы, на которых

связывают сегмент данных о переводе с информацией на иностранном языке,

передают получателю информацию на иностранном языке и сегмент данных о переводе,

проводят синтаксический анализ информации на иностранном языке для идентификации и анализа сегмента данных о переводе и

получают перевод информации на иностранном языке в соответствии с параметрами в сегменте данных о переводе.

2. Способ по п.1, в котором перевод запрашивают из браузера и информацию о сегменте данных о переводе извлекают из упомянутой информации на иностранном языке и пересылают средству управления переводом наряду с запросом на перевод.

3. Способ по п.1, в котором,

когда браузер принимает информацию для отображения, перед отображением он сначала проверяет сегмент данных о переводе для обеспечения гарантии того, что язык является правильным, и

если язык не является правильным, то браузер запрашивает перевод у средства управления переводом.

4. Способ по п.1, в котором

Web-сервер получает данные о предпочтительном для пользователя языке и сравнивает их с сегментом данных о переводе, и если совпадения нет, то

Web-сервер запрашивает перевод упомянутой информации и предоставляет средству управления переводом соответствующие детали из сегмента данных о переводе.

5. Способ по п.1, в котором сегмент данных о переводе включает в себя глобальные параметры для осуществления перевода информации на иностранном языке или ее части или частей с исходного языка на один или более целевых языков.

6. Способ по п.5, в котором глобальные параметры выбираются из параметров включающих в себя исходный язык, кодировку, грамматическое время, имеющийся в наличии перевод, средство перевода, словарь, глоссарий, контекст, услуги по переводу, правила обработки тэгов, правила обработки компонентов, находящихся в составе информации на иностранном языке, таких, как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы, правила выполнения перевода, местонахождение существующих переводов, местонахождение существующих локализованных компонентов информации на иностранном языке, таких, как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы, индивидуальный переводчик и переводческая память.

7. Способ по п.1, в котором сегмент данных о переводе идентифицируют и обрабатывают посредством приложения, считывающего информацию на иностранном языке, для извлечения параметров перевода с целью получения перевода этой информации на иностранном языке с исходного языка на один или более целевых языков.

8. Способ по п.7, в котором приложение, обрабатывающее сегмент данных о переводе, включает в себя Web-браузер для Web-страниц, или программу электронной почты для сообщений электронной почты, или текстовый процессор для текстовых документов.

9. Способ по п.7, в котором приложение, обрабатывающее сегмент данных о переводе, является приложением, предназначенным для специфических целей, которое обнаруживает и обрабатывает сегмент данных о переводе.

10. Способ по п.1, в котором сегмент данных о переводе вложен в информацию на иностранном языке или присоединен к информации на иностранном языке и способ дополнительно содержит этап, на котором извлекают сегмент данных о переводе.

11. Способ по п.1, в котором сегмент данных о переводе хранится в доступной базе данных и указатель или указатели либо вложены в переводимую информацию на иностранном языке либо прилагаются к ней.

12. Способ по п.1, дополнительно содержащий этап, на котором два или более параметров сегмента данных о переводе действуют совместно для перевода части или частей информации на иностранном языке.

13. Способ по п.1, в котором имеются два или более сегмента данных о переводе, связанных с информацией на иностранном языке.

14. Способ по п.13, в котором каждый сегмент данных о переводе включает в себя параметры для перевода части информации на иностранном языке, связанной с этим сегментом данных о переводе.

15. Способ по п.1, в котором сегмент данных о переводе идентифицируют и обрабатывают посредством приложения, считывающего эту информацию на иностранном языке, при этом способ дополнительно содержит этап, на котором идентифицируют указатель на перевод информации на иностранном языке; или указатель на местоположение существующих переводов; или указатель на местоположение существующих локализованных компонентов информации на иностранном языке, таких, как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы; или указатель на правила выполнения переводов; или указатель на правила обработки компонентов в составе информации на иностранном языке, таких, как изображения, графика, звук, анимация, видео, программное обеспечение, программируемые подпрограммы; или указатель на средство перевода для перевода информации на иностранном языке; или указатель на словари, глоссарии или базы данных по терминологии; или указатель на человека-переводчика, являющегося специалистом в области перевода информации на иностранном языке.

16. Способ по п.15, в котором указатель на перевод информации на иностранном языке представляет собой унифицированный указатель информационного ресурса и список указателей указывает на переводы на различные языки.

17. Способ по п.15, в котором сегмент данных о переводе включает в себя список параметров перевода или указатель на файл, содержащий список параметров перевода.

18. Универсальное устройство-переводчик для обеспечения прозрачного общения между отправителем и получателем, использующими разные языки, содержащее

средство для приема информации от отправителя на языке отправителя,

средство для обнаружения сегмента данных о переводе, связанного с этой информацией,

средство для анализа сегмента данных о переводе и извлечения параметров для выполнения эффективного перевода,

средство для перевода упомянутой информации на язык получателя и средство для доставки упомянутой информации получателю на языке получателя.



 

Похожие патенты:

Изобретение относится к системам перевода по видеотелефону. .

Изобретение относится к области перевода и, в частности, к способу и устройству обеспечения прозрачного (выполняемого автоматически, без вмешательства пользователя и незаметно для него) перевода информации в сетевой среде на один или несколько целевых языков.
Изобретение относится к способу организации многоязычных сообщений в интеллектуальной сети для определения режима широковещательной рассылки речевого сообщения.

Изобретение относится к области вычислительной техники и предназначено для обработки информации, составленной по правилам контекстно-зависимой грамматики. .

Изобретение относится к средствам для стандартизации и унификации информации в целях последующего сравнения и автоматизированного анализа на основе преобразования текстового входного потока в объектную форму и может быть использовано в системах, основанных на знаниях, хранилищах информации, банках данных, системах обработки и анализа неструктурированных текстовых файлов.
Изобретение относится к области электроники и предназначено, например, для использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения.
Изобретение относится к сфере информационной коммуникации, а именно к приспособлениям для перевода информации с одного языка на другой, и может быть применимо в различных отраслях народного хозяйства, в частности при производстве изделий полиграфической промышленности - словарей.

Изобретение относится к системе для перевода фраз с первого языка на второй язык, в частности, но не исключительно, к такой системе, которая вырабатывает речевой выход на втором языке из речевого входа на первом языке.

Изобретение относится к области цифровой вычислительной техники и может быть использовано при создании систем, реализующих алгоритмы управления , контроля и диагностики объектов , не имеюш;их точной математической модели.

Изобретение относится к поддержке множества языков на Web-сервере для встроенных систем, содержащем исходные файлы, приспособленные для просмотра удаленными броузерами, находящимися на одном или более терминалах, имеющих прямое или опосредованное соединение с Web-сервером

Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач автоматизированного сравнения и анализа на основе преобразования неструктурированного потока входных данных в объектную форму

Изобретение относится к переводу текстовой информации, такой как почтовые сообщения, но не ограничено этой формой обмена данными

Изобретение относится к области перевода с одного языка на другой

Изобретение относится к машинному переводу

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй

Изобретение относится к системам локализации информационного наполнения и/или программного обеспечения

Изобретение относится к компьютерным системам, включающим в себя интерфейсы пользователей для отображения данных на различных языках

Изобретение относится к средствам проверки сочетаний слов

Изобретение относится к распознаванию речи на азиатском языке
Наверх