Система прозрачного перевода

Изобретение относится к области перевода и, в частности, к способу и устройству обеспечения прозрачного (выполняемого автоматически, без вмешательства пользователя и незаметно для него) перевода информации в сетевой среде на один или несколько целевых языков. Технический результат заключается в автоматическом предоставлении пользователю информации на предпочтительном языке. Определяют исходный язык с использованием средства идентификатора языка или посредством анализа информации, представленной в электронном виде. Определяют целевой язык посредством считывания профиля пользователя. Сравнивают целевой язык и исходный язык и, если они не совпадают, автоматически получают требуемый перевод, после чего отображают пользователю переведенную информацию, представленную в электронном виде. 4 н. и 5 з.п. ф-лы, 5 ил.

 

Настоящее изобретение относится, в основном, к области перевода и, в частности, к способу и устройству обеспечения прозрачного (выполняемого автоматически, фактически без вмешательства пользователя и незаметно для него) перевода информации в сетевой среде.

Предшествующий уровень техники

Машинный перевод информации с одного языка на другой разрушает коммуникационный барьер между людьми и способствует интеграции бизнеса. В течение последних двадцати лет наблюдалось постоянное повышение качества машинного перевода. Были разработаны различные методики, которые переводят по фразам, а не пословно. Другие методики используют словари или системы переводческой памяти (класс автоматизированных систем машинного перевода) для перевода целых предложений. В результате улучшилась грамматика переведенной информации и, следовательно, читаемость. Некоторые из лучших программ перевода приближаются по качеству к переводу, выполненному человеком, для обычных языков и конкретных целей.

Хотя значительно улучшилась техническая возможность программного обеспечения по машинному переводу, практичность повысилась очень незначительно. Для того чтобы перевести документ, электронную почту или другую информацию, обычно необходимо получить доступ к сетевому ресурсу перевода и запустить программу перевода. Пользователем должны быть введены параметры для этой программы, такие как исходный и целевой язык, предпочтительный словарь, специальные слова и т.д.

В нашей одновременно рассматриваемой заявке на патент США № 09/676690 мы описываем систему для перевода посредством одного щелчка мыши или нажатия клавиши ("one-click"), которая позволяет избегать ввода пользователем большей части параметров, которые были необходимы для получения перевода информации. Система перевода "one-click" содержит компонент перевода "one-click" и средство управления переводом, которые объединяются для обеспечения почти прозрачного перевода, когда пользователь щелкает мышью для активации компонента "one-click".

Хотя система "one-click" является значительным прогрессом относительно известного уровня техники, она все же требует некоторого действия со стороны получателя информации. Для того, чтобы машинный перевод информации был взят на вооружение повсеместно, он должен быть совершенно прозрачным. Требуется система, которая автоматически предоставляет получателю информацию на предпочтительном языке.

Некоторые недавно разработанные технологии приближаются, но не достигают этого идеала. Например, в патенте США № 6161082, переуступленном компании AT & T Corp, описывается основанная на сети система перевода с языка на язык, целью которой является улучшение машинного перевода посредством использования для выполнения перевода вычислительной мощности сети, а не локальной машины. Однако в этом патенте не объясняется, как выполняется обнаружение рассматриваемых языков. В нем только упоминается, что исходный и целевой язык могут быть обнаружены из информации, передаваемой между двумя сторонами, без указания на то, как это достигается.

Целью патента США № 5548508, переуступленного компании Fujitsu Limited, является повышение качества машинного перевода посредством введения тегов (неотображаемых элементов разметки документа в гипертекстовом формате) в документ, которые включают в себя контекстную информацию. Например, тег <TITLE>...</TITLE> указывает, что слова являются заголовком и должны быть отображены соответствующим образом, тег <MODIFY>...</MODIFY> может использоваться для определения правильного порядка переведенных слов. Изобретение компании Fujitsu достигает цели обеспечения машинного перевода с высокой точностью, но делает это за счет значительной предварительной и последующей обработки, которая замедляет перевод. При использовании подхода компании Fujitsu нельзя получить прозрачные машинные переводы.

В недавно выданном патенте США №6073143, переуступленном компании Sanyo Electric Co. Ltd, описывается процесс повышения качества перевода документов на языке гипертекстовой разметки (HTML) посредством добавления команды на перевод к каждой гиперссылке в документе. Изобретение пытается решить проблему потерянных гиперссылок, которая имеет место во время перевода. Оно не касается улучшения перевода фактических документов и не обеспечивает решение проблемы получения прозрачного перевода.

Сущность изобретения

В одном виде, хотя он не должен быть единственным или, конечно, самым широким видом, изобретение заключается в способе автоматического перевода информации, представленной в электронном виде, с исходного языка на по меньшей мере один целевой язык, включающем в себя этапы, на которых: определяют исходный язык информации, представленной в электронном виде, посредством считывания идентификатора языка или анализа упомянутой информации средством идентификации языка; определяют целевой язык для информации посредством считывания профиля пользователя для пользователя, принимающего информацию; сравнивают целевой язык и исходный язык для определения того, какой перевод необходим; получают перевод и отображают переведенную информацию пользователю.

Идентификатором языка может быть тег HTML в HTML-документе или им может быть сегмент данных о переводе (СДП, TIS), как описано в нашей совместно рассматриваемой заявке, озаглавленной «Translation Information Segment», содержание которой включено здесь в качестве ссылки.

Если нет идентификатора языка, то программное обеспечения идентификации языка проводит анализ информации, представленной в электронном виде, для определения исходного языка этой информации. В качестве альтернативы, средство идентификации языка может потребовать вмешательства человека для идентификации исходного языка.

Этап определения целевого языка может включать в себя этап, при котором считывают cookie (небольшой файл данных о предыстории обращений конкретного пользователя к конкретному Web-серверу, автоматически создаваемый этим сервером на компьютере пользователя) или файл на принимающем компьютере, или получают данные о предпочтении от системы аутентификации, такой как Microsoft Passport® или другой системы хранения данных.

В другом виде изобретение заключается в системе прозрачного перевода, содержащей:

передающий компьютер, посылающий информацию;

принимающий компьютер, принимающий переведенную информацию;

сеть, соединяющую передающий компьютер с принимающим компьютером; и

устройство управления переводом, выполняющее этапы:

определения языка информации;

определения предпочтительного языка пользователя принимающего компьютера;

получения перевода с языка информации на язык пользователя

и

пересылки переведенной информации пользователю.

В другом аспекте изобретения обеспечивается система прозрачного перевода, содержащая:

передающий компьютер, посылающий информацию в электронном виде;

принимающий компьютер, принимающий переведенную информацию в электронном виде;

сеть, соединяющую передающий компьютер с принимающим компьютером;

средство для определения языка информации, посылаемой в электронном виде;

средство для определения предпочтительного языка пользователя принимающего компьютера;

средство для получения перевода с языка информации на язык пользователя и

средство для пересылки переведенной информации в электронном виде пользователю.

В другом аспекте изобретения обеспечивается система прозрачного перевода, содержащая:

информацию в электронном виде, передаваемую от источника на исходном языке и содержащую идентификатор языка;

профиль пользователя и

средство управления переводом, включающее в себя средство для определения исходного языка и целевого языка упомянутой информации в электронном виде;

в которой средство управления переводом выполняет требуемый перевод с упомянутого исходного языка на упомянутый целевой язык, используя идентификатор языка и профиль пользователя.

Перечень фигур

Для облегчения понимания изобретения предпочтительные варианты выполнения описываются со ссылкой на следующие чертежи, на которых:

на фиг.1 показана блок-схема алгоритма процесса прозрачного перевода;

на фиг.2 показана блок-схема алгоритма процесса определения исходного языка в процессе прозрачного перевода;

на фиг.3 показана блок-схема алгоритма процесса определения целевого языка в процессе прозрачного перевода;

на фиг.4 показана блок-схема алгоритма процесса получения перевода в процессе прозрачного перевода и

на фиг.5 показано схематическое изображение системы прозрачного перевода.

Подробное описание чертежей

На фиг.1 показана блок-схема алгоритма способа перевода информации с первого языка на второй язык. Для упрощения описания способ описывается в отношении одного перевода информации, такой как Web-страница, с исходного языка на целевой язык. Следует оценить тот факт, что является тривиальным расширение процесса для перевода множества типов информации на многочисленные языки или перевода с различных языков в одном типе информации. Кроме того, в соответствии со способом может быть переведена любая информация, включая текстовые документы, электронную почту, сообщения службы передачи коротких сообщений (SMS), звуковые файлы, видео и т.д.

На фиг.1 выполнение способа начинается тогда, когда пользователь запрашивает информацию, однако процесс аналогичен, если пользователю посылают информацию, такую как электронная почта или присоединенный файл. Пользователь также может запросить информацию, используя другие протоколы, такие как протокол передачи файлов (FTP). В примере на фиг.1 пользователь запрашивает Web-страницу.

Исходный язык информации определяется согласно процессу, показанному на фиг.2. Если исходный язык определен, то целевой язык определяется согласно процессу, описанному на фиг.3. Если исходный и целевой языки совпадают, то больше не требуется обработка, и информация отображается пользователю. Если же языки не совпадают, то выполняется перевод согласно процессу по фиг.4. Переведенная информация отображается пользователю прозрачным образом. Вся обработка выполняется автоматически без необходимости какого-либо вмешательства со стороны получателя информации или отправителя информации. Понятно, что система прозрачного перевода облегчает устранение коммуникационных барьеров, обусловленных различными языками.

На фиг.2 подробно показан процесс определения исходного языка. В случае Web-страницы браузер (программа просмотра Web-страниц) пользователя проводит анализ Web-страницы с целью идентификации сегмента данных о переводе, как описано в нашей совместно рассматриваемой заявке, названной «Translation Information Segment», в этом случае сразу же становятся доступными все соответствующие данные для выполнения перевода. Для электронной почты этот этап может быть выполнен приложением электронной почты. Другие виды информации могут потребовать специальное конкретное приложение или встраиваемый программный модуль (plug-in).

Если не определен сегмент данных о переводе, исходный язык может быть идентифицирован из маркера языка HTML. Если не присутствует никакой из этих локальных источников, язык информации может быть извлечен из системы хранения данных, такой как база данных или файл. Если недоступно непосредственное указание на язык информации, то информация синтаксически обрабатывается системой идентификации языка, такой как описанная в патенте США № 5062143, переуступленном компании Harris Corporation.

Если не является успешным никакой из автоматических вариантов идентификации языка, то информация может быть направлена человеку-переводчику для ручной идентификации. В качестве альтернативы, процесс прозрачного перевода заканчивается, и непереведенная информация отображается пользователю.

Этапы определения целевого языка, которым является предпочтительный язык получателя, приведены на фиг.3. Компьютер получателя опрашивается в отношении данных о предпочтительности языка. Если пользователь получил доступ к информации, используя систему аутентификации, такую как Microsoft Passport®, которая хранит данные о предпочтительном языке пользователя (см. www.pasport.com), то легко становятся доступными данные о языке пользователя. Если это не так, выполняется поиск cookie или другого файла, который содержит требуемые данные. Эти данные могли быть запомнены во время предыдущей сессии, требовавшей прозрачного перевода. Одним легко доступным источником данных о предпочтительном языке является файл системного реестра (registry) операционной системы Windows®.

Если целевой язык не может быть определен из любого из этих источников, то может быть использована программа идентификации языка для проведения анализа использования получателем Всемирной паутины (Web) или другого программного обеспечения, или файлов, или документов, используемых пользователем или получателем на его компьютере, чтобы сделать вывод о его предпочтительном языке.

Если все эти дополнительные этапы не определяют предпочтительный целевой язык, то процесс прозрачного перевода завершается и информация отображается на исходном языке. В этом случае информация может быть отображена с объектом перевода так, как описано в нашей совместно рассматриваемой заявке US № 09/394968, озаглавленной «Communication Progressing System».

Если были определены исходный и целевой языки, то выполняется перевод согласно процессу, показанному на фиг.4. Если на этапе идентификации исходного языка был обнаружен сегмент данных о переводе, он анализируется в отношении любого перенаправления на ресурсы, где имеется доступная переведенная информация. Например, многие Web-сайты доступны на зеркальных сайтах на других языках. СДП может включать в себя ряд перенаправлений на эти зеркальные сайты. Соответствующий зеркальный сайт определяется посредством исходного и целевого языков, определенных на предыдущих этапах. Для других видов информации перенаправление может быть выполнено на файл или документ, хранящийся на сервере, доступном из Интернета. Эта ситуация возможна тогда, когда перевод был сделан ранее и был сохранен в буфере.

Если в СДП нет перенаправления, то СДП анализируется с целью извлечения параметров перевода, таких как стиль, словари, грамматика и другие параметры, описанные в вышеупомянутой совместно рассматриваемой заявке. Эти параметры затем передаются машинному переводчику для выполнения перевода с параметрами, полученными из СДП.

Если недоступен соответствующий машинный переводчик, то для выполнения перевода используется человек-переводчик. Человек-переводчик также используется, если СДП направляет перевод, сделанный человеком, а не машинный перевод. Наконец, переведенная информация отображается получателю.

Описанная выше система не учитывает оплату за перевод. Существуют расходы, связанные с выполнением перевода или человеком, или компьютером. Доступные способы оплаты включают в себя оплату получателем подписки на всю подлежащую прозрачному переводу информацию, которую он получает. В качестве альтернативны, отправитель информации может оплатить плату за подписку, так что выполняется прозрачный перевод всей его информации до представления ее потенциальному заказчику. Эта бизнес-модель привлекательна для основанной на Web деловой деятельности, так как ее потенциальные заказчики никогда не должны держать в голове то, что сайт, который они посещают, не на их родном языке.

Схематическое изображение практической реализации системы прозрачного перевода в сетевой среде показано на фиг.5. Пользователь 1 запрашивает или принимает информацию, такую как Web-страница 2, используя браузер на персональном компьютере 3. Браузер запрашивает страницу 2 с Web-сервера 4 через Интернет 5.

В примере программный модуль для браузера на персональном компьютере реализует систему прозрачного перевода. Встраиваемый программный модуль проводит анализ информации с целью идентификации исходного языка и считывает целевой язык из файла системного реестра операционной системы Windows®. Для этого примера предполагается, что встраиваемый программный модуль находит сегмент данных о переводе и поэтому имеет все необходимые параметры для выполнения качественного перевода. Встраиваемый программный модуль запрашивает перевод через Интернет 5, используя параметры, полученные из сегмента данных о переводе.

Если Web-сервер 4 имеет подходящий перевод 2а информации 2, то этот перевод непосредственно передается пользователю 1. Если подходящий перевод недоступен, то запрос на перевод передается средству 6 управления переводом с параметрами, полученными из СДП. Средство 6 управления переводом получает перевод 2b от подсистемы 7 перевода.

Для простоты объяснения средство 6 управления переводом и подсистема 7 перевода показаны раздельными. Эти функции могут быть осуществлены в виде одного приложения или отдельных приложений, выполняющихся на одном компьютере. Функции перевода даже могут выполняться локально на персональном компьютере 3, если установлено соответствующее программное обеспечение.

Во всем описании изобретения целью было описать варианты осуществления изобретения без ограничения изобретения какой-либо конкретной комбинацией различных признаков.

1. Способ автоматического перевода информации, представленной в электронном виде, с исходного языка на один или несколько целевых языков, включающий в себя этапы, на которых определяют исходный язык информации, представленной в электронном виде, посредством идентификации идентификатора языка или посредством анализа упомянутой информации, представленной в электронном виде, при помощи средства идентификации языка; определяют целевой язык для информации, представленной в электронном виде, посредством считывания профиля пользователя для пользователя, принимающего информации в электронном виде; сравнивают целевой язык и исходный язык с целью определения требуемого перевода; автоматически получают требуемый перевод; и отображают пользователю переведенную информацию, представленную в электронном виде.

2. Способ автоматического перевода информации, представленной в электронном виде, по п.1, в котором идентификатором языка является тег HTML в HTML-документе.

3. Способ автоматического перевода информации, представленной в электронном виде, по п.1, в котором идентификатором языка является сегмент данных о переводе.

4. Способ автоматического перевода информации, представленной в электронном виде, по п.1, в котором анализ информации, представленной в электронном виде, выполняют в случае отсутствия идентификатора языка, причем анализ информации выполняют при помощи средства программного обеспечения идентификации языка.

5. Способ автоматического перевода информации, представленной в электронном виде, по п.1, в котором этап определения целевого языка дополнительно включает в себя этап, на котором считывают cookie или файл на принимающем компьютере для получения профиля пользователя или получения данных о предпочтительном языке от системы аутентификации, такой как Microsoft Passport® или другой системы хранения данных.

6. Система прозрачного перевода, содержащая передающий компьютер, посылающий информацию в электронном виде; принимающий компьютер, принимающий информацию в электронном виде; сеть, соединяющую передающий компьютер с принимающим компьютером; и средство управления переводом, выполняющее этапы определения языка информации, представленной в электронном виде, посредством идентификации идентификатора языка или анализа информации, представленной в электронном виде; определения предпочтительного языка пользователя принимающего компьютера посредством считывания профиля пользователя, автоматического получения перевода с языка информации на язык пользователя; и посылки переведенной информации пользователю.

7. Система прозрачного перевода представленной в электронном виде информации, содержащей идентификатор языка, включающая в себя средство управления переводом, включающее в себя средство для определения исходного языка на основе идентификатора языка и целевого языка на основе профиля пользователя для пользователя, принимающего информацию в электронном виде; при этом средство управления переводом выполняет требуемый перевод упомянутой представленной в электронном виде информации с упомянутого исходного языка на упомянутый целевой язык.

8. Система прозрачного перевода, содержащая передающий компьютер, посылающий информацию в электронном виде; принимающий компьютер, принимающий информацию в электронном виде; сеть, соединяющую передающий компьютер с принимающим компьютером; средство для определения языка информации, представленной в электронном виде, посредством идентификации идентификатора языка или анализа информации, представленной в электронном виде; средство для определения предпочтительного языка пользователя принимающего компьютера посредством считывания профиля пользователя; средство для автоматического получения перевода с языка информации на язык пользователя; и средство для пересылки переведенной информации в электронном виде пользователю.

9. Система прозрачного перевода по п.8, дополнительно содержащая средство управления переводом, причем упомянутое средство управления переводом включает в себя упомянутое средство для определения языка информации, представленной в электронном виде; упомянутое средство для определения предпочтительного языка пользователя принимающего компьютера; упомянутое средство для автоматического получения перевода с языка информации на язык пользователя; и упомянутое средство для посылки переведенной информации в электронном виде пользователю.



 

Похожие патенты:
Изобретение относится к способу организации многоязычных сообщений в интеллектуальной сети для определения режима широковещательной рассылки речевого сообщения.

Изобретение относится к области вычислительной техники и предназначено для обработки информации, составленной по правилам контекстно-зависимой грамматики. .

Изобретение относится к средствам для стандартизации и унификации информации в целях последующего сравнения и автоматизированного анализа на основе преобразования текстового входного потока в объектную форму и может быть использовано в системах, основанных на знаниях, хранилищах информации, банках данных, системах обработки и анализа неструктурированных текстовых файлов.
Изобретение относится к области электроники и предназначено, например, для использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения.
Изобретение относится к сфере информационной коммуникации, а именно к приспособлениям для перевода информации с одного языка на другой, и может быть применимо в различных отраслях народного хозяйства, в частности при производстве изделий полиграфической промышленности - словарей.

Изобретение относится к системе для перевода фраз с первого языка на второй язык, в частности, но не исключительно, к такой системе, которая вырабатывает речевой выход на втором языке из речевого входа на первом языке.

Изобретение относится к области цифровой вычислительной техники и может быть использовано при создании систем, реализующих алгоритмы управления , контроля и диагностики объектов , не имеюш;их точной математической модели.

Изобретение относится к системам перевода по видеотелефону

Изобретение относится к способу и устройству для использования сегмента данных о переводе

Изобретение относится к поддержке множества языков на Web-сервере для встроенных систем, содержащем исходные файлы, приспособленные для просмотра удаленными броузерами, находящимися на одном или более терминалах, имеющих прямое или опосредованное соединение с Web-сервером

Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач автоматизированного сравнения и анализа на основе преобразования неструктурированного потока входных данных в объектную форму

Изобретение относится к переводу текстовой информации, такой как почтовые сообщения, но не ограничено этой формой обмена данными

Изобретение относится к области перевода с одного языка на другой

Изобретение относится к машинному переводу

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй

Изобретение относится к системам локализации информационного наполнения и/или программного обеспечения

Изобретение относится к компьютерным системам, включающим в себя интерфейсы пользователей для отображения данных на различных языках
Наверх