翻译方法、装置、设备和存储介质

文档序号:342909 发布日期:2021-12-03 浏览:27次 >En<

阅读说明:本技术 翻译方法、装置、设备和存储介质 (Translation method, device, equipment and storage medium ) 是由 周凤鸣 赵宇 于 2020-05-28 设计创作,主要内容包括:本发明实施例提供一种翻译方法、装置、设备和存储介质,该方法包括:获取待翻译语句以及此语句的属性信息。然后,根据此属性信息,在翻译记忆库中确定与待翻译语句对应的目标语句,其中,目标语句与待翻译语句的属性信息匹配。进一步,再从翻译记忆库中确定与目标语句对应的译文,此译文也即是待翻译语句的译文,从而完成翻译。可见,上述提供的翻译方法是通过对待翻译语句以及翻译记忆库中的语句进行属性信息的设置,再根据设置的属性信息自动匹配出译文的过程,也即是实现自动翻译,大大提高翻译效率。(The embodiment of the invention provides a translation method, a translation device, translation equipment and a storage medium, wherein the method comprises the following steps: and acquiring the statement to be translated and the attribute information of the statement. And then, according to the attribute information, determining a target sentence corresponding to the sentence to be translated in the translation memory base, wherein the target sentence is matched with the attribute information of the sentence to be translated. Further, a translation corresponding to the target sentence is determined from the translation memory library, and the translation is also the translation of the sentence to be translated, so that the translation is completed. Therefore, the translation method provided by the invention is a process of setting the attribute information of the sentence to be translated and the sentence in the translation memory base and automatically matching the translated sentence according to the set attribute information, namely, the automatic translation is realized, so that the translation efficiency is greatly improved.)

翻译方法、装置、设备和存储介质

技术领域

本发明涉及计算机技术领域,尤其涉及一种翻译方法、装置、设备和存储介质。

背景技术

随着互联网的发展,不同语言的用户之间的各方面交流也越来越紧密。比如用户可以获取到来自世界各地的资讯,又比如某产品可以被销售到世界各地。对于资讯的传播或者产品的销售,翻译都是一个必不可少的环节。

以产品销售为例,在产品销售的同时,还需要将此产品关联的所有内容,比如产品说明书、产品操作界面中显示的文字等等都翻译成相应的语言,从而使其语种的用户正常使用此产品。而对于上述提及的需要进行翻译的内容,通常是采用传统的人工翻译,从而导致翻译效率低下。

发明内容

有鉴于此,本发明实施例提供一种翻译方法、装置、设备和存储介质,用以提高翻译的效率。

第一方面,本发明实施例提供一种翻译方法,包括:

获取待翻译语句以及所述待翻译语句的属性信息;

根据所述属性信息,在翻译记忆库中确定与所述待翻译语句对应的目标语句,所述目标语句的属性信息与所述待翻译语句的属性信息匹配;

确定所述翻译记忆库中与所述目标语句对应的译文为所述待翻译语句对应的译文。

第二方面,本发明实施例提供一种翻译装置,包括:

获取模块,用于获取待翻译语句以及所述待翻译语句的属性信息;

第一确定模块,用于根据所述属性信息,在翻译记忆库中确定与所述待翻译语句对应的目标语句,所述目标语句的属性信息与所述待翻译语句的属性信息匹配;

第二确定模块,用于确定所述翻译记忆库中与所述目标语句对应的译文为所述待翻译语句对应的译文。

第三方面,本发明实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的翻译方法。该电子设备还可以包括通信接口,用于与其他设备或通信网络通信。

第四方面,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第一方面所述的翻译方法。

本发明实施例提供的翻译方法,获取待翻译语句以及此语句的属性信息。然后根据此属性信息,在翻译记忆库中确定与待翻译语句对应的目标语句,其中,目标语句的属性信息与待翻译语句的属性信息匹配。由于翻译记忆库中保存的是由原文与译文构成的语句对,因此,还可以进一步从翻译记忆库中确定与目标语句对应的译文,此译文也即是待翻译语句的译文,从而完成翻译。

根据上述描述可知,本发明实施例提供的翻译方法是通过对待翻译语句以及翻译记忆库中的语句进行属性信息的设置,再根据设置的属性信息自动匹配出目标语句,再得到译文的过程,也即是实现自动翻译,大大提高翻译效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种翻译方法的流程图;

图2a为本发明实施例提供的一种待翻译语句及属性信息获取方式的流程图;

图2b为本发明实施例提供的另一种待翻译语句及属性信息获取方式的流程图;

图3a为本发明实施例提供的一种目标语句确定方式的流程图;

图3b为本发明实施例提供的另一种目标语句确定方式的流程图;

图4为本发明实施例提供的另一种翻译方法的流程图;

图5为本发明实施例提供的一种翻译界面的示意图;

图6为本发明实施例提供的另一种翻译界面的示意图;

图7为本发明实施例提供的翻译装置的结构示意图;

图8为与图7所示实施例提供的翻译装置对应的电子设备的结构示意图;

图9为本发明实施例提供的翻译方法在电商平台场景下的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于识别”。类似地,取决于语境,短语“如果确定”或“如果识别(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当识别(陈述的条件或事件)时”或“响应于识别(陈述的条件或事件)”。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

下面在对本发明实施例提供的翻译方法进行说明之前,可以先对该语句翻译的现实意义进行示例性说明:

承接背景技术中提及的一种与产品有关的场景,比如一款产品的使用地区由地区A转换为地区B,并且地区A使用第一语种、地区B使用第二语种。此时,容易理解的,就存在将与此产品有关的文字内容,比如产品说明文件(说明书)、产品使用过程中出现的文字内容由第一语种翻译成第二语种的需求,以保障地区B的用户也能够正常使用此产品。

其中,上述产品可以是一个实物,比如电子产品等等,也可以是一个非实物,比如网站等等,网站可以是门户网站也可以是电商平台,尤其是跨境电商。以跨境电商平台为例,为了使不同语种对应的用户都能够了解电商平台上的商品信息和交易流程,并进一步实现跨境交易,就需要对电商平台界面上包含的文字内容进行翻译。实际应用中,界面上显示的文字内容可以包括图9所示的内容。

另一种人机交互场景,交互设备的默认语言可以是第一语种,当用户对电子产品发出第二语种的语音指令后,交互设备中的翻译系统也需要将第一语种的语音指令翻译成第二语种,并进一步输出与语音指令对应的响应结果。

在上述提及的各场景下都存在翻译需求,此时便可以使用本发明实施例提供的翻译方法。当然,本发明并不对使用场景进行限定,只要是存在翻译需求的场景都可以使用本发明实施例提供的翻译方法。

基于上述描述,下面结合附图对本发明提供的一些实施方式作详细说明。并且在各实施例之间不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。

图1为本发明实施例提供的一种翻译方法的流程图,本发明实施例提供的该翻译方法可以由数据处理设备中的翻译系统来执行。可以理解的是,该数据处理设备可以实现为软件、或者软件和硬件的组合。如图1所示,该方法包括如下步骤:

S101,获取待翻译语句以及待翻译语句的属性信息。

翻译系统可以获取用户输入的待翻译语句,同时获取此待翻译语句的属性信息。但由于翻译场景的不用,待翻译语句以及属性信息具体内容和获取方式也都不尽相同。下面举例说明:

在与产品有关的翻译场景中,产品的说明书、产品其他的文字内容又或者是说明电商平台交易流程的文件,均可以认为是待翻译文件,其中,电商平台对应的文件中可以包含平台界面上显示的文字内容。可选地,用户可以人工编写待翻译文件,并将其输入至翻译系统中。接着,翻译系统中的文件解析模块和分句模块对待翻译文件进行分句处理。处理后得到的待翻译文件中的每个语句均可以认为是待翻译语句,也即是翻译系统得到了待翻译语句。

同时,在编写待翻译文件的过程中,用户可以为待翻译文件设置属性信息,待翻译文件整体的属性信息也即是是待翻译文件中每个待翻译语句的属性信息。此时,翻译系统也即是得到了待翻译语句的属性信息。

在上述场景下,待翻译语句的属性信息可以包括待翻译文件的版本信息、待翻译文件的适用领域,待翻译文件适用产品的产品信息中的至少一项。其中,适用领域比如可以为电子设备领域、机械设备领域、计算机领域等等;产品信息比如可以为产品的品牌、型号等等。

在人机交互场景中,待翻译语句可以是用户向交互设备的翻译系统输入的语音指令。在日常家居交互场景下,用户输入的语音指令通常般为日常聊天的内容,因此,一种可选地方式,交互设备可以直接将自身默认的属性信息确定为语音指令的属性信息。此时,默认的属性信息可以包括语音指令的适用领域也即是日常聊天领域。

在实际应用中,用户输入的语音指令也可以包含一些比较专业的内容,则另一种可选的方式,用户在输入语音指令之前,可以预先在交互设备提供的操作界面动设置语音指令的属性信息。此时,用户设置的属性信息同样可以包括语音指令的适用领域,适用领域可以是计算机、金融、医学等等。

S102,根据属性信息,在翻译记忆库中确定与待翻译语句对应的目标语句,目标语句的属性信息与待翻译语句的属性信息匹配。

翻译系统在得到待翻译语句后,可以在翻译记忆库中确定属性信息与待翻译语句的属性信息匹配的目标语句。其中,翻译记忆库中保存的是原文与译文之间的关联关系。具体来说,翻译记忆库中保存有多个语句对,每个语句对都由一句原文以及与原文对应的一句译文构成,且每个语句对中的原文和译文都具有相同属性信息。

对于待翻译语句与目标语句之间属性信息的匹配可以进行以下理解:根据上述描述可知,属性信息可以包括适用领域和/或产品信息。若两语句各自对应的适用领域相同,或者两语句各自适用产品的产品信息相同,又或者适用领域和适用产品均相同,则都可以认为两语句的属性信息匹配。

S103,确定翻译记忆库中与目标语句对应的译文为待翻译语句对应的译文。

在得到目标语句后,翻译系统可以根据翻译记忆库中保存的原文与译文之间的关联关系,进一步确定目标语句对应的译文。最终,目标语句的译文也即是待翻译语句对应的译文,从而完成了整个翻译过程。

本实施例中,获取待翻译语句以及此语句的属性信息。然后根据此属性信息,在翻译记忆库中确定与待翻译语句对应的目标语句。进一步,再从翻译记忆库中确定与目标语句对应的译文,从而完成翻译。可见,本发明实施例提供的翻译方法实际上是:先对待翻译语句以及翻译记忆库中的语句设置属性信息,再以设置好的属性信息为依据自动匹配出目标语句,并进一步得到译文的过程。相比于人工翻译,这种通过设置的属性信息自动匹配的译文方式显然可以大大提高翻译效率。

需要说明的有,除了人工翻译之外,往往还可以使用计算机辅助翻译(Computer-Aided Translation,简称CAT)工具来实现辅助翻译,从而在一定程度上提高翻译效率。

由于在实际应用中,为了保证翻译记忆库的管理,对于不同适用领域、不同产品类型,其往往具有独立的翻译记忆库,因此,在使用CAT工具辅助翻译时,就用户需要根据待翻译语句的内容手动选择适用于此待翻译语句的翻译记忆库,以利用选中的翻译记忆库确定待翻译语句的译文。

但在使用上述方式的过程中,一方面,对于每一个待翻译语句或者每一篇待翻译语句所属的待翻译文件,用户都要手动选择相应的翻译记忆库,这种选择操作依旧会导致翻译效率低下。另一方面,用户对翻译记忆库选择的精准度会直接影响翻译的准确度。为了保证翻译的准确,用户很有可能需要对翻译记忆库进行多次选择才能找到准确的记忆库,这样同样会导致翻译效率低下。

而使用本发明各实施例提供的翻译方法,由于翻译记忆库中的每个语句都设置有属性信息,因此,可以不按照适用领域或者产品类型进行记忆库划分,翻译系统根据属性信息也能够找到与待翻译语句的属性信息匹配的目标语句,从而也就避免了人工选择翻译记忆库的过程,从而避免了上述的缺陷。

正如上述实施例中提及的,待翻译语句可以是与产品有关的待翻译文件中的一条语句,则在这种场景下,如图2a所示,一种可选地待翻译语句及属性信息的获取方式,也即是图1所示实施例中步骤101一种具体地实现方式:

S1011,响应于用户在翻译系统中触发的上传操作,获取待翻译理文件。

S1012,响应于用户在翻译系统中触发的输入操作,获取待翻译文件的属性信息。

S1013,根据待翻译文件的属性信息确定待翻译语句的属性信息。

具体来说,用户可以先利用数据数理设备中的文件编辑系统编写待翻译文件。在待翻译文件编写完成后,用户可以再打开数据处理设备中的翻译系统。翻译系统响应于用户在翻译系统中触发的上传操作,获取待翻译文件。同时,用户还可以在翻译系统中,根据待翻译文件的内容设置待翻译文件的属性信息。则翻译系统响应于用户触发的输入操作,也可以获取待翻译文件的属性信息。接着,翻译系统可以进一步对得到的待翻译文件进行分句处理,以得到待翻译语句,其中,待翻译语句的属性信息也即是整个待翻译文件的属性信息。

可选地,为了保证文件管理的便捷性,在编辑文件系统编写好待翻译文件时,用户同样也需要在文件编辑系统中对文件的属性信息进行设置。

在上述方式中,文件编辑系统和翻译系统是数据处理设备中两个独立的系统,二者之间不能实现数据共享,因此,需要用户用动将包含待翻译语句的待翻译文件上传至翻译系统,再使翻译系统进行翻译。

而为了进一步简便用户的操作,还可以利用应用程序接口(ApplicationProgramming Interface,简称API)实现文件编辑系统和翻译系统打通,使二者实现信息同步。则如图2b所示,另一种可选地待翻译语句的获取方式,也即是图1所示实施例中步骤101一种具体地实现方式:

S1014,响应于用户在文档编辑系统中触发的发送操作,接收文档编辑系统发送的待翻译文件。

S1015,响应于用户在文档编辑系统中触发的输入操作,接收文档编辑系统发送的待翻译文件的属性信息。

S1016,根据待翻译文件的属性信息确定待翻译语句的属性信息。

用户可以在文件编辑系统中编写待翻译文件,由于翻译系统和文件编辑系统可以实现信息同步,因此,用户在文件编辑完成后可以在文件编辑系统中触发发送操作,以使翻译系统对此发送操作进行响应,从而得到待翻译文件。

同时,用户还可以在文件编辑系统中触发输入操作,以实现对待翻译文件的属性信息进行设置。此时,能翻译系统也可以同步得到待翻译文件的属性信息。翻译系统可以对待翻译文件进行分句处理,以得到待翻译语句,并进一步将待翻译文件的属性信息确定为每个待翻译语句的属性信息。

本实施例中,将文件编辑系统和翻译系统打通后,用户只需在文档编辑系统编辑文件并设置属性信息后,这些内容便会同步至翻译系统中。相比于图2a所示实施例中用户需要分别在两个系统中都设置属性信息并且需要手动将文件上传至翻译系统的过程相比,能够大大便捷用户的操作。

根据上述描述可知,会在翻译记忆库中确定与待翻译语句属性信息相匹配的语句为目标语句,但容易理解的,翻译记忆库中很容易存在至少一个属性信息与待翻译语句的属性信息匹配的语句。此时,一种可选地确定目标语句的方式,如图3a所示,也即是图1所示实施例中步骤102一种具体地实现方式:

S1021,在翻译记忆库中确定与待翻译语句的属性信息匹配的至少一个备选语句。

S1022,确定待翻译语句与至少一个备选语句之间的语义相似度。

S1023,将语义相似度符合要求的备选语句确定为目标语句。

具体地,可以在翻译记忆库中确定属性信息与待翻译语句的属性信息匹配的至少一个备选语句。当备选语句为一个时,即将此备选语句确定为目标语句。当备选语句为多个时,由于属性信息的匹配只能表明待翻译语句和备选语句的适用领域和/或产品信息相同,而并不能反映出语句的语义层面是否相同。因此,翻译系统还会进一步分别计算待翻译语句与多个备选语句之间的语义相似度,可选地,语义相似度可以表示为汉明距离等等。最终,将语义相似度符合要求的备选语句确定为目标语句。可选地,可以将最高语义相似度对应的备选语句确定为目标语句。

上述方式中并没有对翻译记忆库的数量进行说明。而在实际应用中,如果将所有领域、所有产品都适用于一个翻译记忆库,则会造成翻译记忆库中的内容庞大,反而不容易快速地确定出目标语句。因此,对于不同的适用领域或者不同的产品类型,也都可以设置有独立的翻译记忆库。当然,翻译记忆库的划分粒度还可以更小,比如同一产品类型不同品牌都各自具有独立的翻译记忆库等等。此时,另一种可选地确定目标语句的方式,如图3b所示,也即是图1所示实施例中步骤102另一种具体地实现方式:

S1024,根据多个翻译记忆库各自的属性信息,从多个翻译记忆库中确定与待翻译语句的属性信息匹配的至少两个备选记忆库,翻译记忆库关联的属性信息为翻译记忆库中语句的属性信息。

S1025,在至少两个备选记忆库中,确定与待翻译语句的语义相似度符合要求的至少两个备选语句。

S1026,根据至少两个备选语句各自归属的备选记忆库的权重值,确定对应于最高权重值的备选语句为目标语句。

具体地,翻译系统根据获取到的待翻译语句的内容,将待翻译语句输入至多个相关的翻译记忆库中,其中,这些相关的翻译记忆库的属性信息也即是此翻译记忆库中保存语句的属性信息。然后,在多个翻译记忆库中,确定出属性信息与待翻译语句的属性信息匹配的备选记忆库。

若备选记忆库只有一个,则在此备选记忆库中通过计算待翻译语句与此唯一的备选记忆库中各语句之间的语义相似度来确定目标语句。

若备选记忆库为至少两个,则分别计算待翻译语句与至少两个备选记忆库中各语句之间的语义相似度,以在这至少两个备选记忆库中确定出语义相似度符合要求的备选语句。若在至少两个备选记忆库中只确定出一个备选语句,则此备选语句即为目标语句。若在至少两个备选记忆库中分别确定出语义相似度符合要求的备选语句,也即是备选语句存在至少两个,则根据这至少两个备选语句各自所归属的备选记忆库的权重值,确定对应于最高权重值的备选语句为目标语句。

举例来说,比如待翻译语句是家电领域中品牌M型号N3的电视机说明文件中的一语句,则将其输入对应于品牌M的电视机的多个翻译记忆库中,翻译系统可以得到多个备选记忆库,其中,备选记忆库1的属性信息是品牌M型号N1,备选记忆库2的属性信息是品牌M型号N2。

由于对于品牌M的电视机来说,型号N2相较于型号N1是较新的,因此,备选记忆库2的权重值高于备选记忆库1。基于此种权重值,若翻译系统通过计算语义相似度确定出备选记忆库1、2中均有语义相似度符合要求的语句也即是上述的至少两个备选语句。此时,则可以将高权重值的备选记忆库1中的备选语句确定为目标语句。

综上所述,上述提供了不同的确定目标语句的方式。无论使用哪种方式,只要待翻译语句的译文保存于翻译记忆库中,通过上述自动匹配的方式是一定能够匹配到待翻译语句对应的目标语句以及译文的,也使得翻译记忆库中语句对的重复使用效率大大提高,不会出现现有技术中由于人工选择的翻译记忆库不恰当从而导致无法得到对应的目标语句以及译文的情况。当然上述方式在实际应用中,可以根据实际需求择一使用。

上述各实施例中都是能够在翻译记忆库中找到目标语句的情况,容易理解的,也有可能出现无法确定出目标语句的情况,此时,图4为本发明实施例提供的又一种翻译方法的流程图,如图4所示,该方法可以包括如下步骤:

S201,获取待翻译语句以及待翻译语句的属性信息。

S202,根据属性信息,在翻译记忆库中确定是否存在与待翻译语句对应的目标语句,目标语句的属性信息与待翻译语句的属性信息匹配,若存在目标语句,则执行步骤203,否则执行步骤204~步骤205。

S203,确定翻译记忆库中与目标语句对应的译文为待翻译语句对应的译文。

上述步骤201~203的执行过程与前述实施例的相应步骤相似,可以参见如图1所示实施例中的相关描述,在此不再赘述。

S204,输出待翻译语句,以供人工翻译处理。

S205,获取用户输入的与待翻译语句对应的译文。

若在翻译记忆库中没有找到与待翻译语句对应的目标语句,表明此语句是一个全新的语句,没有收录到翻译记忆库中,则翻译系统会原样输出待翻译语句,以由人工来翻译此语句。

可选地,在人工翻译后,用户还可以在翻译系统中触发更新操作,以使翻译记忆库更新此待翻译语句和用户输入的译文之间的关联关系。若不对翻译记忆库进行更新的话,如果后续再一次出现此待翻译语句,则还是无法找到对应的目标语句。

另外,在实际应用中,容易理解的,即使确定出与待翻译语句对应的目标语句,此目标语句的译文也不一定精准或者不满足用户的需求。此时,可选地,在步骤203之后,该翻译方法还可以包括:

S207,响应于用户对译文触发的修改操作,获取修改后译文。

S208,保存待翻译语句和修改后译文之间的关联关系至翻译记忆库。

在确定出待翻译语句的译文后,翻译系统可以将其展示给用户。若用户不满意此译文,则还可以在翻译系统提供的操作界面上触发修改操作,以对译文进行人为修改。进一步地,翻译系统可以获取修改后的译文,并将待翻译语句以及修改后的译文之间的关联关系保存至翻译记忆库。其中,修改有的译文也会被翻译系统自动设置与待翻译语句相同的属性信息。且由待翻译语句以及修改后的译文便可以构成一个新的语句对,翻译系统在进行保存的同时还可以为此新的语句对设置新的版本信息。

举例来说,翻译系统获取到待翻译语句后,可以先在翻译记忆库中查询到包含目标语句的语句对,此语句对中还包含目标语句对应的译文1,并且目标语句和译文1各自的属性信息中出来包括适用领域、产品信息外,还包括版本信息,二者的版本信息可以表示为V1。此时,翻译系统会将译文1展示给用户。若用户对译文1不满意,可以对其进行修改,以得到译文2,翻译系统会将待翻译语句与译文2之间的关联关系进行保存。即由待翻译语句与译文2构成一个新的语句对会更新至翻译记忆库中,并且二者属性信息中的版本信息都是V2。其中,如图5为翻译系统展示翻译结果的界面示意图,如图5所示,若在翻译记忆库中未找到序号为3的待翻译语句对应的目标语句,则“译文”一处为空。

需要说明的有,基于上述描述,随着翻译记忆库中内容的逐渐增加,对于同一待翻译语句,可能会存在多个版本的译文。在实际应用中,翻译系统会确定出多条与待翻译语句的属性信息匹配的语句,每个语句都对应于不同版本的译文,

翻译系统会最终将其中最新版本的译文显示于操作界面的第一预设位置上,比如界面重要。同时,对于其他版本的译文,也可以显示于操作界面的第二预设位置上,比如界面的一侧。翻译系统也可以通过响应于用户对其他版本译文的选择操作,将用户选中的译文确定为待翻译语句对应的译文。图6为另一种翻译结果的界面示意图,这部分内容可以结合图6理解。

本实施例中,若翻译记忆库中存在与待翻译语句对应的目标语句,则翻译系统可以直接输出译文,从而完成翻译过程。这种自动翻译的方式不仅可以大大提高翻译效率,也能够使得翻译记忆库中语句对的重复使用效率大大提高,不会出现现有技术中由于人工选择的翻译记忆库不恰当从而导致无法得到对应的目标语句以及译文的情况。若翻译记忆库中不存在目标语句,则还可以采用传统的人工翻译的方式,保证翻译质量,并且人工翻译的译文还可以自动关联属性信息,一并保存至对应的翻译记忆库中。

以下将详细描述本发明的一个或多个实施例的翻译装置。本领域技术人员可以理解,这些翻译装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。

图7为本发明实施例提供的翻译装置的结构示意图,如图7所示,该装置包括:

第一获取模块11,用于获取待翻译语句以及所述待翻译语句的属性信息。

第一确定模块12,用于根据所述属性信息,在翻译记忆库中确定与所述待翻译语句对应的目标语句,所述目标语句的属性信息与所述待翻译语句的属性信息匹配。

第二确定模块13,用于确定所述翻译记忆库中与所述目标语句对应的译文为所述待翻译语句对应的译文。

可选地,所述第一获取模块11具体用于:获取待翻译文件以及所述待翻译文件的属性信息;对所述待翻译文件进行分句处理,以得到所述待翻译语句;以及确定所述待翻译文件的属性信息为所述待翻译语句的属性信息;

其中,所述属性信息包括:所述待翻译文件的版本信息、所述翻译文件的适用领域、适用产品的产品信息中的至少一项;

其中,所述目标语句的属性信息与所述待翻译语句的属性信息匹配包括:所述待翻译语句与所述目标语句对应的适用领域和/或适用产品的产品信息相同。

可选地,所述第一确定模块12具体用于:在所述翻译记忆库中确定与所述待翻译语句的属性信息匹配的至少一个备选语句;确定所述待翻译语句与所述至少一个备选语句之间的语义相似度;以及将所述语义相似度符合要求的备选语句确定为所述目标语句。

可选地,所述翻译记忆库为多个;

所述第一确定模块12具体用于:根据多个翻译记忆库各自的属性信息,从所述多个翻译记忆库中确定与所述待翻译语句的属性信息匹配的至少两个备选记忆库,所述翻译记忆库关联的属性信息为所述翻译记忆库中语句的属性信息;在所述至少两个备选记忆库中,确定与所述待翻译语句的语义相似度符合要求的至少两个备选语句;以及根据所述至少两个备选语句各自归属的备选记忆库的权重值,确定对应于最高权重值的备选语句为所述目标语句。

可选地,所述装置还包括:

第二获取模块21,还用于响应于用户对所述译文触发的修改操作,获取修改后译文。

保存模块22,用于保存所述待翻译语句和所述修改后译文之间的关联关系至所述翻译记忆库。

可选地,所述装置还包括:

输出模块23,用于若所述翻译记忆库中不存在与所述待翻译语句对应的目标语句,则输出所述待翻译语句,以供人工翻译处理。

所述第二获取模块21,获取用户输入的与所述待翻译语句对应的译文。

可选地,所述保存模块22,还用于响应于所述用户触发的更新操作,保存所述待翻译语句和所述用户输入的译文之间的关联关系至所述翻译记忆库。

可选地,所述第一获取模块11具体用于:响应于所述用户在文档编辑系统中触发的发送操作,接收所述文档编辑系统发送的所述待翻译文件;以及响应于用户在文档编辑系统中触发的输入操作,接收所述文档编辑系统发送的所述待翻译文件的属性信息;根据所述待翻译文件的属性信息确定所述待翻译语句语句的属性信息。

图7所示装置可以执行图1至图6所示实施例的方法,本实施例未详细描述的部分,可参考对图1至图6所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图6所示实施例中的描述,在此不再赘述。

以上描述了翻译装置的内部功能和结构,在一个可能的设计中,翻译装置的结构可实现为一电子设备,如图8所示,该电子设备可以包括:处理器31和存储器32。其中,所述存储器32用于存储支持该电子设备执行上述图1至图6所示实施例中提供的翻译方法的程序,所述处理器31被配置为用于执行所述存储器32中存储的程序。

所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器31执行时能够实现如下步骤:

获取待翻译语句以及所述待翻译语句的属性信息;

根据所述属性信息,在翻译记忆库中确定与所述待翻译语句对应的目标语句,所述目标语句的属性信息与所述待翻译语句的属性信息匹配;

确定所述翻译记忆库中与所述目标语句对应的译文为所述待翻译语句对应的译文。

可选地,所述处理器31还用于执行前述图1至图6所示实施例中的全部或部分步骤。

其中,所述电子设备的结构中还可以包括通信接口33,用于该电子设备与其他设备或通信网络通信。

另外,本发明实施例提供了一种计算机存储介质,用于储存上述电子设备所用的计算机软件指令,其包含用于执行上述图1至图6所示方法实施例中翻译方法所涉及的程序。

为便于理解,结合如下的电商平台的应用场景对以上提供的翻译方法的具体实现过程进行示例性说明。

用户可以在数据处理设备的文件编辑系统中编写关于电商平台M1的说明文件,此文件中可以包括电商平台M1中各个页面显示的字段,具体字段可以如图9所示。其中,此说明文件即是上述各实施例中的待翻译文件,文件中的每个字段即是上述各实施例中的待翻译语句。

在编写的过程中,用户还可以在文件编辑系统的操作界面上选择文件的属性信息,文件的属性信息包括:适用于电商领域、产品信息为电商平台M1,版本信息为V1。

由于数据处理设备中的翻译系统已经和上述的文件编辑系统打通,二者能够实现信息共享,因此,此时翻译系统可以直接获取到说明文件以及说明文件的属性信息。翻译系统可以对获取到说明文件进行解析并分句,以得到说明文件中的每个句子,也即是待翻译语句。而用户设置的整个说明文件的属性信息也即是每个待翻译语句的属性信息。可选地,翻译系统和文件编辑系统也可以不打通时,此时就需要用户手动在翻译系统中上传说明文件以及其的属性信息。

由于翻译系统中可以包含多个的翻译记忆库,比如电商平台M1对应的记忆库1、电商平台M2对应的记忆库2、电商平台M3对应的记忆库3,门户网站P对应的记忆库4等等。因此,翻译系统在得到待翻译语句后,可以将其分别输入至多个翻译记忆库,并确定其中是否存在与待翻译语句的属性信息匹配的备选记忆库。

属性信息的匹配表明备选记忆库与待翻译语句适用于相同的领域相同,因此,备选记忆库也即是上述的记忆库1~3。并且相较于M3,M2的类型更加接近M1,因此,记忆库1~4各自的权重值依次降低。

进一步地,翻译系统再从记忆库1~3中确定是否存在与待翻译语句的属性信息匹配的备选语句。由于待翻译语句与备选记忆库的属性信息都相同,因此,记忆库1~3中的语句都可以认为是备选语句。此时,翻译系统就需要进一步计算待翻译语句与备选语句之间的语义相似度,将语义相似度符合条件的备选语句确定为目标语句,比如将最高语义相似度的备选语句确定为目标语句。

若记忆库1~3中语义相似度符合要求的备选语句为多个,则将属于最高权重值的记忆库1的备选语句确定为目标语句。若记忆库1中存在多个备选语句时,则翻译系统再计算多个备选语句与待翻译语句之间的语义相似度,将语义相似度最高的备选语句确定为目标语句。

经过上述过程确定出目标语句后,翻译系统则可以将此目标语句对应的译文确定为待翻译语句的译文,并将其展示给用户。若用户不满意此译文,可以进一步进行修改,翻译系统会对其进行保存。此时,待翻译语句以及修改后的译文具有的属性信息为:适用于电商领域、产品信息为电商平台M1,版本信息为V2。

另外,在实际应用中,也有翻译系统确定不出译文的情况,此时,翻译系统会将待翻译语句原样展示,以由用户人工输入译文。翻译系统会将待翻译语句以及用户输入的译文进行保存。

在将电商平台M1界面中的字段都翻译完成后,便可以使不同语种的用户也可以使用此网站,扩大网站的使用范围。

以上提供的翻译方法还可以用于产品说明书的翻译场景。具体来说,待翻译文件可以是品牌X型号X的电视的说明书,说明书中的每一条语句都可以是待翻译语句。此时,翻译系统对获取到待翻译文件进行分句处理后,即可得到至少一条待翻译语句。对于每一条待翻译语句,翻译系统都可以按照上述图1~6所示实施例提供的翻译方法进行翻译。从而最终得到翻译后的说明书。

另外,还可以结合人机交互场景对以上提供的翻译方法的具体实现过程进行示例性说明。

如智能机器人等的交互设备通常是使用中文用户来使用,当出现使用英语的另一用户发出语音指令时,智能机器人中的翻译系统会接收英语语音指令,并将语音指令输入至翻译系统。以由翻译系统在翻译记忆库中确定与输入的语音指令的属性信息匹配的目标语句。再进一步得到此目标语句对应的译文。此时,语音指令的属性信息可以包括智能机器人默认的日常聊天领域。可选地,发出语音指令的用户还可在智能机器人提供的交互界面上设置语音指令的属性信息。

对于目标语句确定的过程可以参见上述图1~6所示实施例中的相关描述,在此不再赘述。然后,智能机器人根据翻译系统确定出的译文在自身匹配的搜索引擎中进行搜索,并输出搜索结果,从而完成人机交互。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:电子邮件的翻译方法、装置和计算机设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!