多语言转换方法、装置、计算机设备和存储介质

文档序号:615776 发布日期:2021-05-07 浏览:11次 >En<

阅读说明:本技术 多语言转换方法、装置、计算机设备和存储介质 (Multi-language conversion method, device, computer equipment and storage medium ) 是由 袁旭嵩 孙刚 柳丽丽 胡培铭 刘合党 于 2020-12-31 设计创作,主要内容包括:本申请涉及人工智能技术领域,具体涉及一种多语言转换方法、装置、计算机设备和存储介质。方法包括:拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型;根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;获取待转换数据对应的数据类别;在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据,其中,目标语言转换数据可以存储至区块链节点中,采用本方法能够提高语言类型转换的效率。(The application relates to the technical field of artificial intelligence, in particular to a multi-language conversion method, a multi-language conversion device, computer equipment and a storage medium. The method comprises the following steps: intercepting a website data sending message, wherein the website data sending message carries data to be converted and a target language type corresponding to the data to be converted; matching a corresponding target language cache component according to the target language type, wherein data in the target language cache component is obtained based on a target language database corresponding to a target website; acquiring a data type corresponding to data to be converted; and matching data corresponding to the data type in the data prestored in the target language cache component, and determining target language conversion data according to the matched data, wherein the target language conversion data can be stored into the block link points.)

多语言转换方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域,特别是涉及一种多语言转换方法、装置、计算机设备和存储介质。

背景技术

随着国际化以及互联网技术的发展,对于网站而言已经不存在地域的限制,同一个网站需要面对不同语言类型需求的用户,即实现对网站的多语言转换。

传统技术中多语言网站的制作方案通常是对网站的源代码进行修改,具体是在源代码中增添能够实现翻译功能的代码,以根据新增代码实现对网站的翻译功能。

但是,上述多语言网站的翻译方式需要对网站的源代码进行修改,工作量较大,并且通过新增的代码对网站数据进行实时翻译,当待翻译数据量较大时会导致多语言网站数据获取效率低下。

发明内容

基于此,有必要针对上述技术问题,提供一种能提高语言类型转换效率的多语言转换方法、装置、计算机设备和存储介质。

一种多语言转换方法,应用于组件服务器,方法包括:

拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型;

根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;

获取待转换数据对应的数据类别;

在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。

在一个实施例中,拦截网站数据发送消息,包括:

拦截从业务服务器发送至终端的网站数据发送消息,网站数据发送消息是终端向业务服务器发送携带目标网站、请求转换数据以及目标语言类型的数据获取请求之后,业务服务器从目标网站对应的目标网站数据库中提取与请求转换数据对应的待转换数据,并将携带待转换数据以及目标语言类型的网站数据发送消息发送至终端的。

在一个实施例中,方法还包括:

获取目标网站对应的目标网站源数据;

通过预先配置的不同语言类型的语言转换组件分别对目标网站源数据进行语言类型转换得到不同数据类型的语言数据库。

在一个实施例中,方法还包括:

根据语言数据库对应的语言类型将语言数据库进行分语言类型存储,得到多个语言类型数据库;

对于每一个的语言类型数据库,对语言类型数据库中的数据进行数据聚类得到每一个数据对应的数据类别;

根据数据类别将语言类型数据库进行分类存储得到一个或者多个意图数据库。

在一个实施例中,获取待转换数据对应的数据类别,包括:

基于意图分析算法对待转换数据进行意图分析,得到待转换数据对应的数据意图类别;

在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据,包括:

在多个语言类型数据库中匹配与目标语言类型对应的目标语言数据库;

在目标语言数据库中匹配与数据意图类型对应的意图数据库;

在意图数据库中匹配与待转换数据对应的目标语言转换数据。

在一个实施例中,在意图数据库中匹配与待转换数据对应的目标语言转换数据之后,方法还包括:

当在意图数据库中无法匹配到与待转换数据对应的目标语言转换数据时,调取与目标语言类型对应的目标语言实时转换组件;

根据目标语言实时转换组件对待转换数据进行语言类型转换得到目标语言转换数据。

在一个实施例中,基于目标语言缓存组件匹配与待转换数据对应的目标语言转换数据之后,方法还包括:

获取与目标语言类型对应的本地化组件,本地化组件是基于业务需求对应配置的;

基于本地化组件对目标语言转换数据进行本地化转换得到符合业务需求的目标语言转换数据,目标语言转换数据存储至区块链中。

一种多语言转换装置,装置包括:

拦截模块,用于拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型;

类型转换模块,用于根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;

获取模块,用于获取待转换数据对应的数据类别;

匹配模块,用于在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。

一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任意实施例的方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的方法的步骤。

上述多语言转换方法、装置、计算机设备和存储介质,拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型。通过拦截请求消息,并对拦截到的请求消息中携带的数据进行单独处理,不会对目标网站的源数据进行更改,保证了目标网站信息的安全性。根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;获取待转换数据对应的数据类别;在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。通过组件进行语言数据类型的转换,提高了语言类型转换的灵活性,并且由于预先对目标网站对应的源数据进行多种语言类型数据的转换并进行分类别存储,从而在实际业务中可以直接在缓存中查找对应类型的数据,并得到目标语言转换数据,而不是实时进行语言转换,极大地提高了语言类型转换的效率。

附图说明

图1为一个实施例中多语言转换方法的应用环境图;

图2为一个实施例中多语言转换方法的流程示意图;

图3为一个实施例中提供的一种翻译系统工作流程图;

图4为一个实施例中多语言转换装置的结构框图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的多语言转换方法,可以应用于如图1所示的应用环境中。其中,终端102(如客户端)通过网络与业务服务器104进行通信,并且终端以及业务服务器通信过程中,组件服务器103还可以拦截数据,并对拦截到的数据执行数据语言类型的转换处理。具体地,组件服务器103拦截从业务服务器104发送至终端102的网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型;根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;获取待转换数据对应的数据类别;在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,业务服务器104以及组件服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种多语言转换方法,以该方法应用于图1中的组件服务器为例进行说明,包括以下步骤:

步骤202,拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型。

具体地,网站数据发送消息请求是从服务器发送至终端的消息请求,对应为当终端具有获取网站数据的请求时,终端在操作界面如网站页面中进行操作,以向服务器发送网站数据获取请求,服务器接收到终端发送的网站数据获取请求后,服务器从网站获取请求对应的目标网站中提取网站数据,并将网站数据进行封装并生成网站数据发送消息,并将网站数据发送消息发送至终端。

在服务器将网站数据发送消息发送至终端的过程中,可以通过拦截算法拦截对应的网站数据发送消息,并从拦截到的消息中提取消息携带的待转换数据以及待转换数据对应的目标语言类型。其中待转换数据只指需要进行语言类型转换的数据,如当待转换数据对应为中文地址数据时,以及目标语言类型对应为英语时,此时执行将中文地址数据转换为英文地址数据。

其中,拦截方法可以是基于路由拦截,比方说数据从客户端A传输至服务器B的过程中,从路由器中将数据拦截过来,然后做数据翻译处理,并把翻译后的数据再还给路由器,然后把翻译好的数据传输至服务器B,所以通过在中间拦截数据,并作翻译的过程,不是在客户端A也不是在服务器B中做翻译服务,实现了对客户端A和服务器B的无感化。

步骤204,根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到。

在一个具体的实施例中,根据目标语言类型匹配对应的目标语言转换组件,获取目标语言转换组件对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到。

其中,目标语言转换组件是预先配置的,并且可以用于实现转换语言类型。具体地,目标语言转换组件根据语言类型的不同可包括英文语言转换组件,用于实现将数据转换为英文表达方式,日文语言转换组件,用于实现将数据转换为日文表达方式,以及韩文语言转换组件,用于实现将数据转换为韩文表达方式。需要说明的是,目标语言转换组件具体可以是独立的插件形式,可以根据具体的业务需求自适应配置,并且在具体应用中可以根据不同的业务需求动态增加服务或者组件,并不会影响源网站数据,实现对源网站数据的无侵入,真正实现水平扩展以及热插拔。

目标语言缓存组件是用于存储目标网站对应的源数据的,并且具体可以根据语言类型的不同分类进行缓存得到与语言类型分别对应的缓存组件。如同一个目标网站可以同时具有英文语言缓存组件、日文语言缓存组件、韩文语言缓存组件等。具体地,抽取目标网站对应的源数据,抽取到的源数据具体可以为待转换语言类型的数据(待翻译数据),或者源数据库中也可以是目标网站的所有数据(包括本次待转换语言类型的数据以及不需要转换语言类型的数据),在此不作限制。

然后根据预配置的多种类型的语言转换组件(翻译器)对获取到的源数据进行语言类型转换,得到多种语言类型对应的语言数据库。通过预先对目标网站对应的源数据进行翻译并存储,进而在实际语言转换业务场景中可以直接从语言数据库中获取对应的待翻译数据,而不需要实时翻译,健儿减小了实时翻译的压力,提高了语言类型转换的效率。

并且,本提案中还提供了多种语言类型的语言缓存组件,并将语言数据库与语言缓存组件进行数据对接,以实现可以直接从语言数据库中提取待翻译数据并进行缓存处理,第一方面提高了待翻译数据的获取效率,另一方面也减少了实时翻译数据的压力,并且语言数据库中存储的数据可以是经过本地化处理后的数据,故而数据的准确率较高。

步骤206,获取待转换数据对应的数据类别。

具体地,可以通过对待转换数据的数据类别进行分析得到待转换数据的数据类别,其中数据类别分析可以是基于数据意图分析等人工智能算法,在此不作限制。

步骤208,在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。

其中,目标语言缓存生产器中可以包括网站中的所有数据,待转换数据可以是网站数据中的部分数据,故而可以根据用户需求的待转换数据从对应的目标语言缓存组件中匹配对应的数据,并将查找到目标语言转换数据发送至用户终端,实现对数据的不同语言类型转换。在一个具体的实施例中,可以根据数据类别将数据在语言缓存组件中进行分类别存储,进而实现对语言缓存组件的数据划分,使得每一个数据类别对应的数据量针对性较强以及数据量较小。进而,在实际语言类型转换过程中,可以通过在目标语言缓存组件中匹配与待转换数据的数据类别相匹配的类别数据,并在对应的类别数据中匹配目标语言转换数据,而不是在目标语言缓存组件中存储的所有数据中匹配数据,进而提高了数据匹配的效率,并提高了数据匹配的针对性,以及目标语言类型转换的效率。

在一个实施例中,系统中的数据生产模块、数据拦截模块以及数据翻译模块都是互相独立的模块,每一个模块组件的内部均可以通过插件化实现,并可以根据具体的业务需求进行部署配置。

上述实施例中,由于不同的模块、组件之间是相互独立配置的,故而模块或者组件的变化并不会对其他模块或者组件产生影响,即本申请中的所有模块、组件、插件均部署不敏感,真正实现了模块或者组件之间的独立部署以及无感化,可使用任意的分布式部署方案,提高了本申请中的多语言翻译的适用性。

在一个实施例中,拦截网站数据发送消息,包括:拦截从业务服务器发送至终端的网站数据发送消息,网站数据发送消息是终端向业务服务器发送携带目标网站、请求转换数据以及目标语言类型的数据获取请求之后,业务服务器从目标网站对应的目标网站数据库中提取与请求转换数据对应的待转换数据,并将携带待转换数据以及目标语言类型的网站数据发送消息发送至终端的。

其中,网站数据库中存储网站对应的网站源数据,网站源数据是指原始网站中对应的数据,如当网站对应为中文网站时,此时目标网站对应的网站源数据就为中文源数据。待转换数据是指需要进行目标语言类型转换的数据,如待转换数据具体可以是网站中的部分数据,如是“中国平安”,待转换数据还可以是网站中所有的数据,以实现对目标网站中所有的数据转换为目标语言类型对应的数据。目标语言具体可以包括英文、日文、韩文等语言类型,可以根据具体的实际需求进行配置。

在其中一个实施例中,组件服务器拦截网站数据发送消息后,对消息数据中携带的数据执行语言类型的转变,而不是在终端中或者在业务服务器中对语言类型的转换,在实现语言类型转换的过程中保证了不会对终端数据以及业务服务器数据进行变更,保证了终端以及业务服务器数据的完整性以及安全性。

在一个实施例中,方法还包括:获取目标网站对应的目标网站源数据;通过预先配置的不同语言类型的语言转换组件分别对目标网站源数据进行语言类型转换得到不同数据类型的语言数据库。

具体地,从数据库中获取网页源数据,并根据获取到的网页源数据执行数据缓存存储操作,以方便后续从网站中获取数据,提高获取数据的效率。并且,由于网站数据的数据量较大,故而还包括对网站数据进行分类别存储,以使得后续可以从对应类别的数据文件中查找对应的数据,进而提高数据查询的效率。

在一个实施例中,方法还包括:根据语言数据库对应的语言类型将语言数据库进行分语言类型存储,得到多个语言类型数据库;对于每一个的语言类型数据库,对语言类型数据库中的数据进行数据聚类得到每一个数据对应的数据类别,并根据数据类别将语言类型数据库进行分类存储得到一个或者多个意图数据库。

其中,分类别存储包括基于不同类型语言进行分类别存储得到不同语言类型对应的语言类型数据库,分类别存储还包括基于数据类别进行分类别存储。如可以将数据分为水果类型数据、植物类型数据以及饮食类型数据,进而可以将对应的数据进行分类型存储,并为不同类型的数据进行添加标签,为后续的数据索引提供条件。

在一个实施例中,获取待转换数据对应的数据类别,包括:基于意图分析算法对待转换数据进行意图分析,得到待转换数据对应的数据意图类别;在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据,包括:在多个语言类型数据库中匹配与目标语言类型对应的目标语言数据库;在目标语言数据库中匹配与数据意图类型对应的意图数据库;在意图数据库中匹配与待转换数据对应的目标语言转换数据。

具体地,基于意图分析算法对请求数据的意图进行分析,进而确定请求数据对应的数据类型,进而可以根据确定的类型在对应的目标语言数据库中匹配与数据类型对应的意图数据库,并在匹配到的意图数据库中提取对应的目标语言。

其中,意图分析可以包括对数据类型的意图分析,或者对要获取的数据类型的意图分析。比如,当待获取数据是一个地址请求时,此时进行意图分析可以确定意图为获取地址数据,此时可以在对应的生产数据库中查找地址信息,并将查找到的地址信息作为目标语言转换数据。在其他实施例中,意图分析可以对应为数据类型分析,如当接收到的数据类型为橘子时,此时可以确定对应的数据类型为水果类型,进而可以在对应水果类型的意图数据库中匹配对应的目标语言。

在一个实施例中,在意图数据库中匹配与待转换数据对应的目标语言转换数据之后,方法还包括:当在意图数据库中无法匹配到与待转换数据对应的目标语言转换数据时,调取与目标语言类型对应的目标语言实时转换组件;根据目标语言实时转换组件对待转换数据进行语言类型转换得到目标语言转换数据。

具体地,当无法匹配到对应的目标语言转换数据时,方法还包括调取目标语言实时转换组件,进而可以根据调取到的目标语言实时转换组件执行对待转换数据的语言类型的实时转换,其中实时语言转换插件可用于实现转换为不同语言类型的数据。

在一个实施例中,基于目标语言缓存组件匹配与待转换数据对应的目标语言转换数据之后,方法还包括:获取与目标语言类型对应的本地化组件,本地化组件是基于业务需求对应配置的;基于本地化组件对目标语言转换数据进行本地化转换得到符合业务需求的目标语言转换数据,目标语言转换数据存储至区块链中。

在其中一个实施例中,方法还包括:对目标语言转换数据进行适应性调整,具体可以获取目标语言类型对应的语言风格数据,根据语言风格数据对目标语言转换数据进行适应性调整,以使得得到的目标语言转换数据更加符合实际的业务需求。

需要强调的是,为进一步保证上述目标语言转换数据的私密和安全性,上述目标语言转换数据还可以存储于一区块链的节点中。

其中,适应性调整可以对应为本地化翻译服务器如本地化组件,本地化翻译服务包括:根据语言类型、语言环境以及语言要求等,将目标语言转换数据对应处理,如进行对应转换并适配。具体可以将日期转化为英文标准、时间转换为英文标准,以及将地址转换为目标语言对应的标准等。另外,本地化服务还包括专业化翻译,可以通过专业库实现对目标语言转换数据进行专业化处理。

在实际应用场景中,运营多语言网站,面临的不仅仅只是语言及翻译单方面的问题,还有网站页面内容编辑、内容更新、语言种类单一、网站本土化、多语言网站域名选择以及后期管理维护等一系列问题。目前的网站多语言制作方案较为传统。一部分做法是套用模版搭建网站,再将网站内容翻译成所需语言填充其中。如将网站中的某一部分数据做了翻译,然后在客户端嵌入服务或者在服务器中嵌入服务,此时是需要对客户端或者服务器的代码进行更该,一方面使得数据翻译比较复杂,另一方面会改变源数据,存在数据泄露的风险。这就造成了网站内容修改不便、中英文原站与多语言网站不能同步更新的难题。另外,传统技术中还有是需要卖家提供原站的源代码如开发数据等,以此来制作多语言站,这无形中增加了卖家网站信息泄露的风险。并且多个语言网站需分开管理,运营成本和难度都大大提高。

在一个具体的实施例中,如图3所示,图3为一个实施例中提供的一种翻译系统工作流程图。结合图3所示,翻译系统工作流程如下:预先链接原应用数据库、部署各语言数据翻译插件(组件)如英文翻译插件、日文翻译插件或者韩文翻译插件等,在不同的业务中可以根据实际的需求进行部署。并基于源网站数据生产翻译数据,具体通过数据生产模块执行数据生产,并且基于语言类型的不同,可以将生产翻译数据进行分语言类别存储,如可以分为英文语言类型生产翻译数据、日语语言类型生成翻译数据等。并且,更进一步地,还可以根据不同的数据类型进行分类型存储数据。还包括翻译数据库,具体地,可以将数据库中对应的数据翻译为不同语言类型的数据,具体可以根据不同语言类型对应的语言类型插件进行翻译数据。并且按照实际的业务需求从对应类型的数据库中加载缓存数据,实现按需加载缓存。通过拦截原程序返回,在具体应用中,通过拦截请求消息,并根据目标语言调用对应的语言类型翻译器,以根据对应的语言类型翻译器执行语言的翻译。进而根据调取到的翻译器选择使用不同的语言缓存或者翻译服务翻译数据。

在一个具体的实施例中,服务器server从数据库service db中获取数据,并将数据传送至客户端client中,在数据传输过程中,拦截服务器将客户端的所请求的数据进行拦截,并利用API服务对拦截的请求数据进行翻译服务,并最终将翻译好的数据在传输至客户端,这样实现了翻译服务既不在服务端执行也不在客户端执行,实现了真正的无感。并且,还可以实现将API翻译服务对接任何的网站,并且可以通过标准接口实现对所有类型网站的对接。

拦截服务器实现对请求的拦截后,将拦截到的数据传输至语言拦截器interceptor中,并发送至语言适配器adapter中,确定需要什么类型的语言翻译服务器,并在翻译服务库中匹配对应的翻译器,若没有查找到相匹配的语言翻译器,此时可以调用AI翻译器,也就是实时翻译器服务。并将语言翻译器与语言提供者建立连接,实现两者的匹配传输。

图3中的数据生产模块,用于从数据库service db中抽取网站数据,具体抽取的数据可根据用户需求确定,具体可以是整个网站中的所有数据,也可以是部分需要翻译的数据,在此不作限制。从网站数据库中读取数据后,可以将数据传送至对应的语言翻译器(生产器)中,其中语言生成器可以根据用户需求进行适配,用户需要什么语言类型的插件,就可以提供什么类型的插件,具体可以将数据送入英语翻译器、日语翻译器等类型的翻译器中,实现对数据的翻译,并将翻译数据按照类别存储至语言数据库中。其中语言数据库与语言类型提供模块之间进行数据通信。比如,可以从网站数据库中抽取“平安集团”“阿里”“百度”等数据,用户需求的翻译数据是“平安集团”这样就把平安集团对应的翻译数据给用户。具体地,还可以根据意图识别进行匹配,如可以从用户请求中识别用户的真实意图,比如可以根据地址识别用户意图,比如识别到用户想要翻译公司名称,此时可以从类别库中的公司信息库中提取数据,如果用户意图是水果类型翻译,那么可以从水果库中查找数据,通过意图识别,以及分类匹配,极大地提高了匹配效率。

继续参考图3中的语言类型转换提供模块用于将用户请求中携带的请求数据与语言类型数据库中抽取到的数据进行适配,进而获取到请求数据对应的翻译数据,并将翻译数据返回至客户端,实现一种翻译服务。通过本申请的方案通过拦截请求操作,在API接口中实现对多语言数据的翻译工作,解耦了具体地终端或者服务器,使得数据翻译步骤不会对源数据进行改变,保证了信息的安全性。通过配置插件的形式实现语言类型的转换步骤,使得可以具体不同的业务自适应配置不同语言类型的插件,使得插件配置更加灵活以及适用性更加广,以及通过插件的自适应增加以及减少可以避免对业务元数据的更改,进一步保证了对源数据信息的保留。在适配对应的目标语言数据时,可以通过意图识别算法实现快速定位到对应类型的数据库,进而可以在定位到的数据库中查找对应的数据,而不是在全部的数据库中执行数据查找,进一步提高了数据查找的效率。

基于结果拦截的本地化方案,该申请中解耦了原应用程序、数据翻译、程序翻译、外部翻译服务4大模块,第一方面:整个翻译的过程对原程序如原客户端或者服务器无感,原程序甚至不知道有翻译服务的存在。第二方面:由于翻译数据的生产模块与翻译模块是独立部署的,实现了翻译数据的生产和翻译过程无关,即翻译数据生产模块与翻译模块之间也是无感,互不干扰的,并且是可以根据不同的业务需求随意更换的。并且,对于底层翻译了什么,程序就动态适配什么,提高了翻译的灵活性。第三方面:并且,不同的模块以及组件均可以通过插件事件,实现了无论是数据生产还是实时翻译都使用插件的形式,并可以根据实际的业务需求动态增加服务和组件,通过组件的形式实现了对原流程无侵入,做到真正的水平扩展和热插拔。第四方面:通过插件的形式可以实现无缝对接外部其他翻译服务,对原程序和翻译流水线无感。第五方面:所有模块基于标准接口形式如socket通讯方式,故而可以应用于任何的网站,实现了方法的通用性以及适用性。并且还可以可使用不同语言、不同技术分布开发,对部署环境不敏感,自适应分布式和云环境。第六方面:本提案中的方法,通过一次开发,可拦截所有类型的服务和程序,适用性较强。

应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图4所示,提供了一种多语言转换装置,包括:

拦截模块402,用于拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型。

类型转换模块404,用于根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到。

获取模块406,用于获取待转换数据对应的数据类别。

匹配模块408,用于在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。

在一个实施例中,拦截模块402还用于拦截从业务服务器发送至终端的网站数据发送消息,网站数据发送消息是终端向业务服务器发送携带目标网站、请求转换数据以及目标语言类型的数据获取请求之后,业务服务器从目标网站对应的目标网站数据库中提取与请求转换数据对应的待转换数据,并将携带待转换数据以及目标语言类型的网站数据发送消息发送至终端的。

在一个实施例中,多语言转换装置还包括存储模块,存储模块用于获取目标网站对应的目标网站源数据;通过预先配置的不同语言类型的语言转换组件分别对目标网站源数据进行语言类型转换得到不同数据类型的语言数据库。

在一个实施例中,存储模块还用于根据语言数据库对应的语言类型将语言数据库进行分语言类型存储,得到多个语言类型数据库;对于每一个的语言类型数据库,对语言类型数据库中的数据进行数据聚类得到每一个数据对应的数据类别,根据数据类别将语言类型数据库进行分类存储得到一个或者多个意图数据库。

在一个实施例中,获取模块406还用于基于意图分析算法对待转换数据进行意图分析,得到待转换数据对应的数据意图类别;匹配模块408还用于在多个语言类型数据库中匹配与目标语言类型对应的目标语言数据库;在目标语言数据库中匹配与数据意图类型对应的意图数据库;在意图数据库中匹配与待转换数据对应的目标语言转换数据。

在一个实施例中,多语言转换装置还包括实时转换模块,实时转换模块用于当在意图数据库中无法匹配到与待转换数据对应的目标语言转换数据时,调取与目标语言类型对应的目标语言实时转换组件;根据目标语言实时转换组件对待转换数据进行语言类型转换得到目标语言转换数据。

在一个实施例中,多语言转换装置还包括本地模块,本地模块用于获取与目标语言类型对应的本地化组件,本地化组件是基于业务需求对应配置的;基于本地化组件对目标语言转换数据进行本地化转换得到符合业务需求的目标语言转换数据。

关于多语言转换装置的具体限定可以参见上文中对于多语言转换方法的限定,在此不再赘述。上述多语言转换装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储网站数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多语言转换方法。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型;根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;获取待转换数据对应的数据类别;在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:拦截从业务服务器发送至终端的网站数据发送消息,网站数据发送消息是终端向业务服务器发送携带目标网站、请求转换数据以及目标语言类型的数据获取请求之后,业务服务器从目标网站对应的目标网站数据库中提取与请求转换数据对应的待转换数据,并将携带待转换数据以及目标语言类型的网站数据发送消息发送至终端的。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取目标网站对应的目标网站源数据;通过预先配置的不同语言类型的语言转换组件分别对目标网站源数据进行语言类型转换得到不同数据类型的语言数据库。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据语言数据库对应的语言类型将语言数据库进行分语言类型存储,得到多个语言类型数据库;对于每一个的语言类型数据库,对语言类型数据库中的数据进行数据聚类得到每一个数据对应的数据类别;根据数据类别将语言类型数据库进行分类存储得到一个或者多个意图数据库。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:基于意图分析算法对待转换数据进行意图分析,得到待转换数据对应的数据意图类别。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:在多个语言类型数据库中匹配与目标语言类型对应的目标语言数据库;在目标语言数据库中匹配与数据意图类型对应的意图数据库;在意图数据库中匹配与待转换数据对应的目标语言转换数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:当在意图数据库中无法匹配到与待转换数据对应的目标语言转换数据时,调取与目标语言类型对应的目标语言实时转换组件;根据目标语言实时转换组件对待转换数据进行语言类型转换得到目标语言转换数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取与目标语言类型对应的本地化组件,本地化组件是基于业务需求对应配置的;基于本地化组件对目标语言转换数据进行本地化转换得到符合业务需求的目标语言转换数据,目标语言转换数据存储至区块链中。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:拦截网站数据发送消息,网站数据发送消息携带待转换数据以及待转换数据对应的目标语言类型;根据目标语言类型匹配对应的目标语言缓存组件,目标语言缓存组件中的数据是基于与目标网站对应的目标语言数据库得到;获取待转换数据对应的数据类别;在目标语言缓存组件中预先存储的数据中匹配与数据类别对应的数据,并根据匹配到的数据确定目标语言转换数据

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:拦截从业务服务器发送至终端的网站数据发送消息,网站数据发送消息是终端向业务服务器发送携带目标网站、请求转换数据以及目标语言类型的数据获取请求之后,业务服务器从目标网站对应的目标网站数据库中提取与请求转换数据对应的待转换数据,并将携带待转换数据以及目标语言类型的网站数据发送消息发送至终端的。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取目标网站对应的目标网站源数据;通过预先配置的不同语言类型的语言转换组件分别对目标网站源数据进行语言类型转换得到不同数据类型的语言数据库。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据语言数据库对应的语言类型将语言数据库进行分语言类型存储,得到多个语言类型数据库;对于每一个的语言类型数据库,对语言类型数据库中的数据进行数据聚类得到每一个数据对应的数据类别;根据数据类别将语言类型数据库进行分类存储得到一个或者多个意图数据库。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:基于意图分析算法对待转换数据进行意图分析,得到待转换数据对应的数据意图类别。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:在多个语言类型数据库中匹配与目标语言类型对应的目标语言数据库;在目标语言数据库中匹配与数据意图类型对应的意图数据库;在意图数据库中匹配与待转换数据对应的目标语言转换数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

当在意图数据库中无法匹配到与待转换数据对应的目标语言转换数据时,调取与目标语言类型对应的目标语言实时转换组件;根据目标语言实时转换组件对待转换数据进行语言类型转换得到目标语言转换数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取与目标语言类型对应的本地化组件,本地化组件是基于业务需求对应配置的;基于本地化组件对目标语言转换数据进行本地化转换得到符合业务需求的目标语言转换数据,目标语言转换数据存储至区块链中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:机器翻译方法、机器翻译模型训练方法、装置及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!