一种基于翻译引擎的专业词汇的翻译方法、工具及电子设备

文档序号:1938187 发布日期:2021-12-07 浏览:19次 >En<

阅读说明:本技术 一种基于翻译引擎的专业词汇的翻译方法、工具及电子设备 (Translation engine-based professional vocabulary translation method, tool and electronic equipment ) 是由 刘何超 林雅婷 陈源圳 于 2021-08-25 设计创作,主要内容包括:本发明实施例涉及自然语言处理领域,公开了一种基于翻译引擎的专业词汇的翻译方法,该方法需要获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中,然后调用翻译引擎,根据配置文件处理需要翻译的资源文本,以得到翻译结果,本发明实施例提供的翻译方法,能够利用翻译引擎实现对带有无法翻译和不需要翻译的专业词汇的文本的翻译,翻译结果准确性高且可读性强。(The embodiment of the invention relates to the field of natural language processing, and discloses a translation method of professional vocabularies based on a translation engine.)

一种基于翻译引擎的专业词汇的翻译方法、工具及电子设备

技术领域

本发明实施例涉及自然语言处理领域,特别涉及一种基于翻译引擎的专业词汇的翻译方法、工具及电子设备。

背景技术

随着汽车行业的发展,德系汽车、美系汽车、日系汽车、韩系汽车、国产汽车等出口量呈增长趋势,对于汽车维修后市场而言,语言本地化变得非常重要。

谷歌、百度等翻译引擎由于其存储的翻译用例大数据,其翻译准确性和可读性较高,但是由于汽车技术专业性强以及翻译引擎的翻译规则的多样性,实际译稿需要人工检查和核对校正的工作量巨大,如何解决既能应用谷歌翻译引擎快速高效翻译的优点又能实现译文符合汽车技术专业的统一表述,成为亟待解决的难题。

发明内容

本申请实施例提供了一种基于翻译引擎的专业词汇的翻译方法、工具及电子设备,能够解决翻译引擎无法翻译专业名词的问题。

本发明实施例的目的是通过如下技术方案实现的:

为解决上述技术问题,第一方面,本发明实施例中提供了一种基于翻译引擎的专业词汇的翻译方法,包括:

获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中;

调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果。

在一些实施例中,

在所述调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果之前,所述方法还包括:

通过前端界面或者命令行的方式获取翻译参数,其中,所述翻译参数至少包括目标语言。

在一些实施例中,所述调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果,包括:

根据所述配置文件,对所述资源文本进行预处理;

通过翻译引擎将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本;

根据所述配置文件,对所述中间翻译文本进行后处理,优化译文,以得到所述翻译结果。

在一些实施例中,所述根据所述配置文件,对所述资源文本进行预处理,包括:

读取所述配置文件,用特定的占位符替换所述资源文本中不需要翻译的专业词汇。

在一些实施例中,所述对所述中间翻译文本进行后处理,包括:

将所述中间翻译文本中的占位符还原为相应的专业名词后,输出所述翻译结果。

在一些实施例中,所述翻译参数还包括资源文件路径,

所述通过翻译引擎将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本,包括:

根据所述资源文件路径,读取相应的资源文件;

调用翻译引擎接口,结合所述资源文件,将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本。

在一些实施例中,所述翻译参数还包括:所述翻译引擎的编码格式及文件类型,

在所述调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果之后,所述方法还包括:

将所述翻译结果按照所述翻译引擎的编码格式进行编码转换;

将编码转换后的所述翻译结果按照所述翻译引擎的文件类型输出。

在一些实施例中,所述将所述翻译结果按照所述翻译引擎的编码格式进行编码转换,进一步包括:

将所述翻译结果中,按照翻译引擎的编码格式转换编码后显示为乱码的字符进行强制转码。

为解决上述技术问题,第二方面,本发明实施例中提供了一种基于翻译引擎的专业词汇的翻译工具,包括:

配置模块,用于获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中;

翻译模块,用于调用翻译引擎,根据所述配置文件处理需要翻译的资源文本,以得到翻译结果。

在一些实施例中,所述翻译工具还包括:

获取模块,用于通过前端界面或者命令行的方式获取翻译参数。

在一些实施例中,所述翻译工具还包括:

输出模块,用于将所述翻译结果按照所述翻译引擎的编码格式进行编码转换,并将编码转换后的所述翻译结果按照所述翻译引擎的文件类型输出。

为解决上述技术问题,第三方面,本发明实施例提供了一种电子设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上第一方面所述的方法。

为解决上述技术问题,第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上第一方面所述的方法。

为解决上述技术问题,第五方面,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如上第一方面所述的方法。

与现有技术相比,本发明的有益效果是:区别于现有技术的情况,本发明实施例中提供了一种基于翻译引擎的专业词汇的翻译方法,该方法需要获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中,然后调用翻译引擎,根据配置文件处理需要翻译的资源文本,以得到翻译结果,本发明实施例提供的翻译方法,能够利用翻译引擎实现对带有无法翻译和不需要翻译的专业词汇的文本的翻译,翻译结果准确性高且可读性强。

附图说明

一个或多个实施例中通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件/模块和步骤表示为类似的元件/模块和步骤,除非有特别申明,附图中的图不构成比例限制。

图1是本发明实施例一中提供的一种基于翻译引擎的专业词汇的翻译方法的流程示意图;

图2是本发明实施例一中提供的一种基于翻译引擎的专业词汇的翻译方法的另一流程示意图;

图3是图1所述步骤130的一子流程示意图;

图4是本发明实施例一中提供的一种基于翻译引擎的专业词汇的翻译方法的另一流程示意图;

图5是本发明实施例二中提供的一种基于翻译引擎的专业词汇的翻译工具的结构示意图;

图6是本发明实施例二中提供的另一种基于翻译引擎的专业词汇的翻译工具的结构示意图;

图7是本发明实施例三中提供的一种电子设备的硬件结构示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。

需要说明的是,如果不冲突,本发明实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。

除非另有定义,本说明书所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本说明书中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是用于限制本发明。本说明书所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

具体地,下面结合附图,对本发明实施例作进一步阐述。

实施例一

本发明实施例提供了一种基于翻译引擎的专业词汇的翻译方法,请参见图1,其示出了本发明实施例提供的一种基于翻译引擎的专业词汇的翻译方法的流程,所述翻译方法包括但不限于以下步骤:

步骤110:获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中;

在本发明实施例中,对于如汽车等领域中所存在的大量的专业词汇,如特殊符号和不需要翻译的文本,这些词汇后后续翻译过程中可以保留不翻译。因此,首先,在开始翻译前,需要将这些专业词汇收集汇总并进行工具配置,以得到配置文件,翻译过程中可以通过调用配置文件对需要翻译的文本中的专业词汇进行匹配,自动保留或者替换这些专业词汇,从而减少手动替换或修改的工作量,提升程序运行效率。

步骤120:根据所述配置文件处理需要翻译的资源文件,以得到翻译结果。

在本发明实施例中,在配置好所述配置文件等翻译工具后,依据最终所要翻译成的目标语言,调用所述配置文件和翻译引擎对所述资源文本进行处理,从而得到最终的翻译结果。其中,所述翻译引擎可以是网页翻译引擎如谷歌翻译引擎、百度翻译引擎,也可以是电脑中的软件,或者手机中的应用程序等,如有道词典,甚至是离线保存的电子词典等,具体地,可根据实际需要进行设置,不需要拘泥于本发明实施例的限定。

在一些实施例中,请参见图2,其示出了本发明实施例提供的基于翻译引擎的专业词汇的翻译方法的另一流程,在所述调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果之前,所述方法还包括:

步骤130:通过前端界面或者命令行的方式获取翻译参数;

其中,所述翻译参数至少包括目标语言。进一步地,所述翻译参数还可以包括:资源文件路径、所述翻译引擎的编码格式及文件类型等。在本发明实施例中,需要获取的各种翻译参数,其可以是通过各种前端界面获取与翻译结果相关的各类参数,如通过统一资源定位器(Uniform Resource Locator,URL)获取网址信息,从而得到当前用户导入资源文本时所用的翻译引擎,或者,通过用户对语言菜单的选择,得到资源文本所要翻译的目标语言等,或者,通过cmd命令行获取需要翻译的资源文件路径等。其中,用户通过前端界面或命令行指定资源文件路径、当前语言、目标语言等翻译参数时,可以实现按序对多个资源文本文件进行翻译,使得每个翻译文件都会生成相应的译文文档。需要说明的是,由于不同的翻译引擎所采用的编码格式及导入和输出的译文文档的文件格式不同,因此,在执行翻译工作之前,还需要读取所述翻译引擎的编码格式及文件类型等翻译参数。

在一些实施例中,请参见图3,其示出了上述图1所示步骤130的一子流程,所述调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果,进一步包括:

步骤121:根据所述配置文件,对所述资源文本进行预处理;

具体地,读取所述配置文件,用特定的占位符替换所述资源文本中不需要翻译的专业词汇。在本发明实施例中,通过读取配置文件,将资源文本中不需要翻译以及特殊符号的文本替换为特定的占位符,从而实现对资源文本的预处理。其中,这些占位符在翻译过程中不会被翻译,在翻译结束后,在将占位符替换为相应的专业名词即可。

步骤122:通过翻译引擎将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本;

具体地,根据所述资源文件路径,读取相应的资源文件;调用翻译引擎接口,将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本。在本发明实施例中,在将资源文本中需要翻译以及特殊符号的文本替换为特定的占位符,得到包含占位符的资源文本后,调用翻译引擎接口,通过翻译引擎处理语法和常见词汇的翻译,以及对可翻译的专业词汇的通用翻译,从而得到包含占位符的已翻译至目标语音的中间翻译文本。

步骤123:根据所述配置文件,对所述中间翻译文本进行后处理,优化译文,以得到所述翻译结果。

具体地,将所述部分翻译结果中的占位符还原为相应的专业名词后,输出所述翻译结果。在本发明实施例中,在得到包含占位符的已翻译至目标语音的中间翻译文本之后,将占位符按照配置文件还原为相应的不需要翻译的专业词汇和/或特殊符号,即可完成对资源文本的全部翻译。进一步地,还可以对翻译的译文进行优化,如优化语法、优化语序等。

在一些实施例中,所述翻译参数还包括:所述翻译引擎的编码格式及文件类型,请参见图4,其示出了本发明实施例提供的基于翻译引擎的专业词汇的翻译方法的另一流程,在所述调用翻译引擎,根据所述配置文件处理需要翻译的资源文件,以得到翻译结果之后,所述方法还包括:

步骤141:将所述翻译结果按照所述翻译引擎的编码格式进行编码转换;

在本发明实施例中,由于不同的翻译引擎其编码格式及文件的导入导出类型不同,因此,在将翻译结果输出时,还需要按照翻译引擎的编码格式进行编码转换。以谷歌翻译引擎为例,谷歌翻译结果通常采用的是utf-8编码格式,因此,需要将翻译结果按照utf-8编码格式进行转换后输出。

进一步地,由于在进行转码时,还可能存在字符转换编码后显示为乱码的情况,因此还需要将所述翻译结果中,按照翻译引擎的编码格式转换编码后显示为乱码的字符进行强制转码。例如,采用utf-8编码格式进行转码时,部分utf-8字符转换编码后显示为乱码,对于这类情况,可根据要求提空强制转码功能,将要输出的翻译结果的译文文本中,按照翻译引擎的编码格式转换编码后显示为乱码的字符删除,从而实现强制转码。

步骤142:将编码转换后的所述翻译结果按照所述翻译引擎的文件类型输出。

最后,在将按照所述翻译引擎的编码格式进行编码转换的翻译结果,依照翻译引擎的文件类型输出,即可得到可视化的、和/或可导出的翻译结果。

实施例二

本发明实施例提供了一种基于翻译引擎的专业词汇的翻译工具,请参见图5,其示出了本发明实施例提供的一种基于翻译引擎的专业词汇的翻译工具的结构,所述基于翻译引擎的专业词汇的翻译工具200包括:配置模块210和翻译模块220。

所述配置模块210,用于获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中;

所述翻译模块220,用于调用翻译引擎,根据所述配置文件处理需要翻译的资源文本,以得到翻译结果。

在一些实施例中,请参见图6,其示出了本发明实施例提供的另一种基于翻译引擎的专业词汇的翻译工具的结构,所述翻译工具200还包括:获取模块230,用于通过前端界面或者命令行的方式获取翻译参数,其中,所述翻译参数至少包括目标语言。

在一些实施例中,所述翻译模块220还用于根据所述配置文件,对所述资源文本进行预处理;通过翻译引擎将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本;根据所述配置文件,对所述中间翻译文本进行后处理,优化译文,以得到所述翻译结果。

在一些实施例中,所述翻译模块220还用于读取所述配置文件,用特定的占位符替换所述资源文本中不需要翻译的专业词汇。

在一些实施例中,所述翻译模块220还用于将所述部分翻译结果中的占位符还原为相应的专业名词后,输出所述翻译结果。

在一些实施例中,所述翻译参数还包括资源文件路径,所述翻译模块220还用于根据所述资源文件路径,读取相应的资源文件;调用翻译引擎接口,结合所述资源文件,将所述预处理后的资源文本翻译为目标语言,以得到中间翻译文本。

在一些实施例中,请参见继续图6,所述翻译工具200还包括:输出模块240,用于将所述翻译结果按照所述翻译引擎的编码格式进行编码转换,并将编码转换后的所述翻译结果按照所述翻译引擎的文件类型输出。

在一些实施例中,所述输出模块240还用于将所述翻译结果中,按照翻译引擎的编码格式转换编码后显示为乱码的字符进行强制转码。

实施例三

本发明实施例还提供了一种电子设备,请参见图7,其示出了能够执行图1至图4所述基于翻译引擎的专业词汇的翻译方法的电子设备的硬件结构。

所述电子设备10包括:至少一个处理器11;以及,与所述至少一个处理器11通信连接的存储器12,图7中以一个处理器11为例。所述存储器12存储有可被所述至少一个处理器11执行的指令,所述指令被所述至少一个处理器11执行,以使所述至少一个处理器11能够执行上述图1至图4所述的基于翻译引擎的专业词汇的翻译方法。所述处理器11和所述存储器12可以通过总线或者其他方式连接,图7中以通过总线连接为例。

存储器12作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的基于翻译引擎的专业词汇的翻译方法对应的程序指令/模块,例如,图5至图6所示的各个模块。处理器11通过运行存储在存储器12中的非易失性软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例基于翻译引擎的专业词汇的翻译方法。

存储器12可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于翻译引擎的专业词汇的翻译装置的使用所创建的数据等。此外,存储器12可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器12可选包括相对于处理器11远程设置的存储器,这些远程存储器可以通过网络连接至基于翻译引擎的专业词汇的翻译装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器12中,当被所述一个或者多个处理器11执行时,执行上述任意方法实施例中的基于翻译引擎的专业词汇的翻译方法,例如,执行以上描述的图1至图4的方法步骤,实现图5至图6中的各模块和各单元的功能。

上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。

本申请实施例还提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1至图4的方法步骤,实现图5至图6中的各模块的功能。

本申请实施例还提供了一种计算机程序产品,包括存储在非易失性计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时时,使所述计算机执行上述任意方法实施例中的基于翻译引擎的专业词汇的翻译方法,例如,执行以上描述的图1至图4的方法步骤,实现图5至图6中的各模块的功能。

本发明实施例中提供了一种基于翻译引擎的专业词汇的翻译方法,该方法需要获取不需要翻译的专业词汇的汇总文本,并将所述汇总文本保存于配置文件中,然后调用翻译引擎,根据配置文件处理需要翻译的资源文本,以得到翻译结果,本发明实施例提供的翻译方法,能够利用翻译引擎实现对带有无法翻译和不需要翻译的专业词汇的文本的翻译,翻译结果准确性高且可读性强。

需要说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:身份验证装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!