数据库表的外键映射方法、装置、电子设备和存储介质

文档序号:1170285 发布日期:2020-09-18 浏览:7次 >En<

阅读说明:本技术 数据库表的外键映射方法、装置、电子设备和存储介质 (External key mapping method and device of database table, electronic equipment and storage medium ) 是由 袁鹏文 刘强 胡婧 于 2020-04-28 设计创作,主要内容包括:本申请公开了数据库表的外键映射方法、装置、电子设备和存储介质,所述方法包括:获取目标字段的字段信息;对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象;建立所述目标字段与所述关联对象的数据库表的外键映射关系。通过本申请,解决了由于依赖人工进行数据库表的外键映射导致成本较高且映射效率不高的问题,实现了数据库表的外键自动匹配和映射,提高了外键映射效率和准确率。(The application discloses a method and a device for mapping external keys of a database table, electronic equipment and a storage medium, wherein the method comprises the following steps: acquiring field information of a target field; carrying out natural language processing on the field information to obtain text characteristics of the field information; determining the associated object of the target field according to the associated object classification model and the text characteristics; and establishing a foreign key mapping relation between the target field and the database table of the associated object. By the method and the device, the problems of high cost and low mapping efficiency caused by manually mapping the foreign key of the database table are solved, automatic matching and mapping of the foreign key of the database table are realized, and the foreign key mapping efficiency and accuracy are improved.)

数据库表的外键映射方法、装置、电子设备和存储介质

技术领域

本申请涉及机器学习技术领域,具体涉及数据库表的外键映射方法、装置、电子设备和存储介质。

背景技术

在基于Hadoop(一种分布式系统基础架构)的数据仓库中,事实表的维度字段众多。在数据测试时,外键一致性是数据测试的一个关键点,但由于Hadoop无主外键关系,数据仓库的事实表外键映射成为了一个难题。

目前在数据测试环节,事实表外键映射通常需要人工一一维护,费时费力;并且事实表中的维度字段与业务容易紧耦合,导致同一实体会有不同的维度字段名映射,无法使用简单规则判断。

发明内容

鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的数据库表的外键映射方法、装置、电子设备和存储介质。

依据本申请的第一方面,提供了一种数据库表的外键映射方法,包括:

获取目标字段的字段信息;

对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;

根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象;

建立所述目标字段与所述关联对象的数据库表的外键映射关系。

可选地,所述对所述字段信息进行自然语言处理,得到所述字段信息的文本特征包括:

对所述字段信息进行分词处理,以得到分词结果;

提取所述分词结果中的特征值,根据所述特征值确定所述字段信息的文本特征。

可选地,所述字段信息包括字段名,所述对所述字段信息进行分词处理,以得到分词结果包括:

按照预设的字段命名格式对所述字段名进行分词处理,得到多个词;

所述提取所述分词结果中的特征值包括:

对得到的各词分别提取所述特征值。

可选地,所述目标字段为Hadoop数据仓库中的事实表的维度字段,所述关联对象为Hadoop数据仓库中的维度表的实体。

可选地,所述关联对象分类模型包括决策树分类模型。

可选地,所述关联对象包括门店实体、项目实体以及销售实体,所述根据关联对象分类模型和所述文本特征,确定目标字段的关联对象包括:

若确定所述目标字段的关联对象为实体,则确定所述实体是否为所述门店实体;

若所述实体不是所述门店实体,则确定所述实体是否为所述项目实体;

若所述实体不是所述项目实体,则确定所述实体是否为所述销售实体。

可选地,所述方法还包括:

获取数据测试请求,所述数据测试请求包括待测试字段;

根据所述数据测试请求,读取所述待测试字段中的数据和所述待测试字段的外键映射关系;

根据所述外键映射关系确定目标数据库表,若读取的数据存在于所述目标数据库表中,则测试通过。

依据本申请的第二方面,提供了一种数据库表的外键映射装置,包括:

第一获取单元,用于获取目标字段的字段信息;

特征提取单元,用于对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;

确定单元,用于根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象;

建立单元,用于建立所述目标字段与所述关联对象的数据库表的外键映射关系。

可选地,所述特征提取单元还用于:

对所述字段信息进行分词处理,以得到分词结果;

提取所述分词结果中的特征值,根据所述特征值确定所述字段信息的文本特征。

可选地,所述字段信息包括字段名,所述特征提取单元还用于:

按照预设的字段命名格式对所述字段名进行分词处理,得到多个词;

对得到的各词分别提取所述特征值。

可选地,所述目标字段为Hadoop数据仓库中的事实表的维度字段,所述关联对象为Hadoop数据仓库中的维度表的实体。

可选地,所述关联对象分类模型包括决策树分类模型。

可选地,所述关联对象包括门店实体、项目实体以及销售实体,所述确定单元还用于:

若确定所述目标字段的关联对象为实体,则确定所述实体是否为所述门店实体;

若所述实体不是所述门店实体,则确定所述实体是否为所述项目实体;

若所述实体不是所述项目实体,则确定所述实体是否为所述销售实体。

可选地,所述装置还包括:

第二获取单元,用于获取数据测试请求,所述数据测试请求包括待测试字段;

读取单元,用于根据所述数据测试请求,读取所述待测试字段中的数据和所述待测试字段的外键映射关系;

测试单元,用于根据所述外键映射关系确定目标数据库表,若读取的数据存在于所述目标数据库表中,则测试通过。

依据本申请的第三方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。

依据本申请的第四方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。

由上述可知,本申请的技术方案,采用获取目标字段的字段信息;对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象的方式;建立所述目标字段与所述关联对象的数据库表的外键映射关系,解决了由于依赖人工进行数据库表的外键映射导致成本较高且映射效率不高的问题,实现了数据库表的外键自动匹配和映射过程,提高了外键映射效率和准确率。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的

具体实施方式

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本申请一个实施例的数据库表的外键映射方法的流程示意图;

图2示出了根据本申请一个实施例的数据库表的外键映射方法的流程框图;

图3示出了根据本申请一个实施例的决策树分类模型的逻辑示意图;

图4示出了根据本申请一个实施例的数据库表的外键映射装置的结构示意图;

图5示出了根据本申请一个实施例的电子设备的结构示意图;

图6示出了根据本申请一个实施例的计算机可读存储介质的结构示意图。

具体实施方式

下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。

Hadoop是一种能够允许大量数据在计算机集群中,通过使用简单的编程模型进行分布式处理的框架。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。

然而在Hadoop数据仓库中,由于无主外键映射关系导致数据仓库中的事实表与维度表的映射成为难题。目前通常采用的方式是依赖于人工来进行事实表与维度表的外键映射和维护,这种方式成本高且映射效率低。此外,由于事实表中涉及的维度字段容易与业务紧耦合,会导致同一实体映射不同的维度字段名,进而导致人工映射难度加大。

基于此,本申请实施例提供了一种数据库表的外键映射方法,如图1所示,所述方法包括如下的步骤S110至步骤S140:

步骤S110,获取目标字段的字段信息。

数据库表中通常包括多个字段,在建立外键映射关系之前,可以先判断该字段是否是需要进行外键映射的目标字段,如果是目标字段,则获取该目标字段对应的字段信息,以作为后续外键映射的基础,这里的目标字段的字段信息可以指字段名,例如,一个销售业务数据库表中可能包括销售人员、销售量、销售金额等字段,那么可以确定销售人员是需要进行外键映射的目标字段,进而获取该销售人员字段下对应的字段信息进行外键映射。

步骤S120,对所述字段信息进行自然语言处理,得到所述字段信息的文本特征。

在得到目标字段的字段信息后,需要对字段信息进行自然语言处理(NaturalLanguage Processing,简称NLP),自然语言处理可以利用语义分析、分词等方法将字段信息中的文本特征准确的提取出来,进而为后续模型分析提出数据基础。

例如,一个中文文本从形式上看是由汉字(包括标点符号等)组成的一个字符串。由字可组成词,由词可组成词组,由词组可组成句子,进而由一些句子组成段。无论在上述的各种层次:字(符)、词、词组、句子、段,还是在下一层次向上一层次转变中都可能存在着歧义和多义现象,即形式上一样的一段字符串,在不同的场景或不同的语境下,可以理解成不同的词串、词组串等,并有不同的意义。同理,数据库表中的字段信息也是由文本构成,其同样存在着由于场景或语境的不同导致含义不同的情况。因此,通过对文本的语义和语境进行精准分析,可以从中提取出更准确的文本特征,以尽可能表征该文本在该场景下的真实含义。

步骤S130,根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象。

本申请实施例预先构建了关联对象分类模型,该模型以现有的分类模型框架如决策树分类模型、贝叶斯分类模型、SVM(Support Vector Machine,支持向量机)以及KNN(K-Nearest Neighbor,K近邻分类算法)等为基础,对已标记的字段分类数据进行了训练和测试,进而得到了上述关联对象分类模型,通过将上述提取出的文本特征输入该关联对象分类模型,可以输出该文本特征对应的关联对象,进而确定数据库表中目标字段的关联对象。

步骤S140,建立所述目标字段与所述关联对象的数据库表的外键映射关系。

在通过分类模型判断出目标字段所对应的关联对象之后,建立该目标字段与关联对象的外键映射关系,进而实现数据库表中的字段与外键自动匹配和映射的过程。上述过程无需人工进行干预,降低了人工操作的成本,同时也避免了由于人工进行数据库表的外键映射导致映射效率和准确率不高的问题,提高了数据库表的外键映射效率和准确率。

如图2所示,提供了一种数据库表的外键映射方法的流程框图,首先获取目标字段,对目标字段的字段信息进行分词得到词A、词B、词C以及词D四部分,之后对分词结果进行特征匹配得到该目标字段对应的文本特征,将该特征值输入决策树分类模型进行分类,依次判断每个实体是否与该目标字段相匹配,若匹配则直接输出该实体,若不匹配,则进入下一实体的判断,直至确定出该目标字段所对应的实体维度,从而实现目标字段与实体映射关系的自动建立。本申请实施例中的实体可以指代门店、项目、员工等业务场景中涉及的可作为一个维度建立维度表的对象。

在本申请的一个实施例中,所述对所述字段信息进行自然语言处理,得到所述字段信息的文本特征包括:对所述字段信息进行分词处理,以得到分词结果;提取所述分词结果中的特征值,根据所述特征值确定所述字段信息的文本特征。

本申请实施例中采用分词方法对得到的字段信息进行自然语言处理,分词是指将连续的字符序列按照一定的规范重新组合成词序列的过程。NLP中常用的分词技术可以分为三类:基于字符串匹配的分词方法(如正向最大匹配法、逆向最大匹配法等)、基于统计的分词方法(如隐马尔可夫模型(Hidden Markov Model,HMM)、最大熵模型、条件随机场模型(Conditional Random Fields,CRF)和基于理解的分词方法。通过这些分词技术对字段信息进行分词处理,进而得到分词结果。具体采用哪种分词技术,本领域技术人员可以根据实际情况灵活选择,在此不做具体限定。

之后根据上述分词结果进行特征值的提取,根据该特征值确定字段信息对应的文本特征,作为后续分类模型的输入。这里的文本特征可以由一组特征集构成,例如,字段信息经过分词处理后可能得到多个分词结果,针对每个分词结果分别进行特征提取,进而得到与该字段信息对应的一组特征集,将该特征集作为一个整体输入后续的分类模型进行分类判断。当然,文本特征的形式也可以是本领域技术人员知晓的任何其他类型,在此不做具体限定。

在本申请的一个实施例中,所述字段信息包括字段名,所述对所述字段信息进行分词处理,以得到分词结果包括:按照预设的字段命名格式对所述字段名进行分词处理,得到多个词;所述提取所述分词结果中的特征值包括:对得到的各词分别提取所述特征值。

本申请实施例的字段信息可以包括字段名,利用分词技术对字段名进行分词处理,进而得到多个分词结果。例如,利用分词技术将字段名分成词A、词B、词C以及词D四部分,之后计算每个分词的特征值,作为后续分类模型的输入。

本申请实施例中预设的字段命名格式可以根据实际需求灵活设置,例如,字段名通常可以由字母、数字、下划线、汉字等组成,设定字段名的命名规则为:1)以小写英文命名;2)单词之间以“_”连接,那么以下表1中的“提成门店ID”为例,其所对应的字段名为“bonus_poi_id”,在进行分词处理时,就可以以该字段的命名格式来进行分词,例如以“_”为分词标记,最后得到的分词结果为“bonus”、“poi”和“id”,将三个分词分别转换成特征向量后输入分类模型进行分类判断,进而可以得到与该字段名对应的关联对象,可以发现,分词“poi”对应的特征值与门店实体维度是相匹配的,则建立该字段名与门店实体维度的映射关系。以此类推,完成全部字段名与实体维度的映射,具体映射结果如下表1所示。

表1

在本申请的一个实施例中,所述目标字段为Hadoop数据仓库中的事实表的维度字段,所述关联对象为Hadoop数据仓库中的维度表的实体。

本申请实施例中的目标字段可以为Hadoop数据仓库中的事实表的维度字段,关联对象可以为Hadoop数据仓库中的维度表的实体。每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行,其主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。维度表可以看作是用户来分析数据的窗口,维度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息,维度表包含帮助汇总数据的特性的层次结构。

同样以销售业务数据库表为例,假设其中一个数据表A中包含门店名称、销售时间、销售量和销售金额等数据字段,另一个数据表B中包含门店名称、城市和区域等数据字段,那么可以确定数据表A为事实表,数据表B为维度表,门店名称则为需要进行外键映射的字段名。

由于Hadoop数据仓库中没有主外键的映射关系,导致事实表与维度表的外键映射面临较大困难,而本申请实施例通过上述分词处理、模型分类以及映射关系建立的过程能够解决Hadoop数据仓库中缺少主外键映射关系的问题,实现事实表与维度表外键映射关系的自动匹配和建立。

在本申请的一个实施例中,所述关联对象分类模型包括决策树分类模型。

目标字段与关联对象的映射实质上可以归结为分类问题,在机器学习领域分类算法有多种,包括决策树分类模型、贝叶斯分类模型、KNN(K-Nearest Neighbor,K近邻分类算法)和SVM(Support Vector Machine,支持向量机)算法等。

决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。贝叶斯分类模型,是一种非规则的分类方法,通过对已分类的样本子集进行训练,学习归纳出分类函数,利用训练得到的分类器实现对未分类数据的分类。典型的贝叶斯分类算法有朴素贝叶斯分类算法(Naive Bayes)。KNN是最简单的机器学习算法之一,可以用于分类和回归,是一种监督学习算法。它的思路是,如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。也就是说,该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。SVM是一类按监督学习方式对数据进行二元分类的广义线性分类器,该分类器具有较好的稳健性与稀疏性。

以销售业务场景为例,该场景下数据库表的维度表可以包括实体维度,实体维度又进一步可以分为门店实体维度、项目实体维度和员工实体维度。选取常用的三个分类算法“决策树”、“贝叶斯”和“SVM”分别进行训练和测试,测试结果如下表2。

表2

可以发现,在相同数据相同特征的情况下,决策树分类模型的效果是最好的,整体准确率能达到98.8%,因此选取决策树分类模型来实现目标字段的分类能够取得更好的效果。当然,本领域技术人员也可以根据实际情况选取其他类型的分类模型,不应该以此对本申请的保护范围造成不利的限定。

在本申请的一个实施例中,所述关联对象包括门店实体、项目实体以及销售实体,所述根据关联对象分类模型和所述文本特征,确定目标字段的关联对象包括:若确定所述目标字段的关联对象为实体,则确定所述实体是否为所述门店实体;若所述实体不是所述门店实体,则确定所述实体是否为所述项目实体;若所述实体不是所述项目实体,则确定所述实体是否为所述销售实体。

分类决策树是一种描述对实例进行分类的树形结构。决策树由节点(node)和边(directed edge)组成。节点有两种类型:内部节点(internal node)和叶节点(leaf node)组成。内部节点表示一个特征或属性,叶节点表示一个分类。利用决策树分类,从根节点开始,对实例的某一个特征进行测试,根据测试结果,将实例分配到其子节点;每一个子节点对应着该特征的一个取值。如此递归的向下深度遍历,直到达到叶节点为止,最后将实例分配到叶节点的类中。

基于分类决策树的原理,结合具体的业务场景,本申请实施例的关联对象可以包括实体,实体又进一步可以划分为门店实体、项目实体以及销售实体等多个类别,如图3所示,在对目标字段进行分类时,首先确定该目标字段是否为实体维度,如果不是,则停止对该实体维度下的所有子节点的匹配,如果是实体,则判断该目标字段是否为门店实体,如果是门店实体,则输出该目标字段的关联对象为门店实体,如果不是,则继续判断该目标字段是否为项目实体,如果是项目实体,则输出该目标字段的关联对象为项目实体,如果不是,则继续判断该目标字段是否为销售实体,如果是销售实体,则输出该目标字段的关联对象为销售实体,如果不是,则继续进行其它子节点的判断,直至确定出该目标字段所对应的实体。

在本申请的一个实施例中,所述方法还包括:获取数据测试请求,所述数据测试请求包括待测试字段;根据所述数据测试请求,读取所述待测试字段中的数据和所述待测试字段的外键映射关系;根据所述外键映射关系确定目标数据库表,若读取的数据存在于所述目标数据库表中,则测试通过。

外键映射是保证数据一致性的关键手段之一,而对于外键映射结果的准确性可以通过数据测试环节来验证。通过获取数据测试请求,可以确定待测试的字段,读取该字段中的数据及该字段对应的外键映射关系,根据该外键映射关系调取相应的数据库表,判断该数据库表中是否存在该待测试字段中的数据,如果存在,则通过数据测试,说明外键映射结果准确,进而能够保证数据一致性。

依据本申请的第二方面,如图4所示,提供了一种数据库表的外键映射装置400,所述装置400包括:第一获取单元410、特征提取单元420、确定单元430及建立单元440。

本申请实施例的第一获取单元410,用于获取目标字段的字段信息。

数据库表中通常包括多个字段,在建立外键映射关系之前,可以先判断该字段是否是需要进行外键映射的目标字段,如果是,则获取该目标字段对应的字段信息,以作为后续外键映射的基础,这里的目标字段的字段信息可以指字段名,例如,一个销售业务数据库表中可能包括销售人员、销售量、销售金额等字段,那么可以确定销售人员是需要进行外键映射的目标字段,进而获取该销售人员字段下对应的字段信息进行外键映射。

本申请实施例的特征提取单元420,用于对所述字段信息进行自然语言处理,得到所述字段信息的文本特征。

在得到目标字段的字段信息后,需要对字段信息进行自然语言处理(NaturalLanguage Processing,简称NLP),自然语言处理可以利用语义分析、分词等方法将字段信息中的文本特征准确的提取出来,进而为后续模型分析提出数据基础。

例如,一个中文文本从形式上看是由汉字(包括标点符号等)组成的一个字符串。由字可组成词,由词可组成词组,由词组可组成句子,进而由一些句子组成段。无论在上述的各种层次:字(符)、词、词组、句子、段,还是在下一层次向上一层次转变中都可能存在着歧义和多义现象,即形式上一样的一段字符串,在不同的场景或不同的语境下,可以理解成不同的词串、词组串等,并有不同的意义。同理,数据库表中的字段信息也是由文本构成,其同样存在着由于场景或语境的不同导致含义不同的情况。因此,通过对文本的语义和语境进行精准分析,可以从中提取出更准确的文本特征,以尽可能表征该文本在该场景下的真实含义。

本申请实施例的确定单元430,用于根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象。

本申请实施例预先构建了关联对象分类模型,该模型以现有的分类模型框架如决策树分类模型、贝叶斯分类模型、SVM(Support Vector Machine,支持向量机)以及KNN(K-Nearest Neighbor,K近邻分类算法)等为基础,对已标记的字段分类数据进行了训练和测试,进而得到了上述关联对象分类模型,通过将上述提取出的文本特征输入该关联对象分类模型,可以输出该文本特征对应的关联对象,进而确定数据库表中目标字段的关联对象。

本申请实施例的建立单元440,用于建立所述目标字段与所述关联对象的数据库表的外键映射关系。

在通过分类模型判断出目标字段所对应的关联对象之后,建立该目标字段与关联对象的外键映射关系,进而实现数据库表中的字段与外键自动匹配和映射的过程。上述过程无需人工进行干预,降低了人工操作的成本,同时也避免了由于人工进行数据库表的外键映射导致映射效率和准确率不高的问题,提高了数据库表的外键映射效率和准确率。

在本申请的一个实施例中,所述特征提取单元420还用于:对所述字段信息进行分词处理,以得到分词结果;提取所述分词结果中的特征值,根据所述特征值确定所述字段信息的文本特征。

在本申请的一个实施例中,所述字段信息包括字段名,所述特征提取单元420还用于:按照预设的字段命名格式对所述字段名进行分词处理,得到多个词;对得到的各词分别提取所述特征值。

在本申请的一个实施例中,所述目标字段为Hadoop数据仓库中的事实表的维度字段,所述关联对象为Hadoop数据仓库中的维度表的实体。

在本申请的一个实施例中,所述关联对象分类模型包括决策树分类模型。

在本申请的一个实施例中,所述关联对象包括门店实体、项目实体以及销售实体,所述确定单元430还用于:若确定所述目标字段的关联对象为实体,则确定所述实体是否为所述门店实体;若所述实体不是所述门店实体,则确定所述实体是否为所述项目实体;若所述实体不是所述项目实体,则确定所述实体是否为所述销售实体。

在本申请的一个实施例中,所述装置400还包括:第二获取单元,用于获取数据测试请求,所述数据测试请求包括待测试字段;读取单元,用于根据所述数据测试请求,读取所述待测试字段中的数据和所述待测试字段的外键映射关系;测试单元,用于根据所述外键映射关系确定目标数据库表,若读取的数据存在于所述目标数据库表中,则测试通过。

需要说明的是,上述各装置实施例的具体实施方式可以参照前述对应方法实施例的具体实施方式进行,在此不再赘述。

综上所述,本申请的技术方案,采用获取目标字段的字段信息;对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象的方式;建立所述目标字段与所述关联对象的数据库表的外键映射关系,解决了由于依赖人工进行数据库表的外键映射导致成本较高且映射效率不高的问题,实现了数据库表的外键自动匹配和映射过程,提高了外键映射效率和准确率。

需要说明的是:

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的数据库表的外键映射装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

例如,图5示出了根据本申请一个实施例的电子设备的结构示意图。该电子设备500包括处理器510和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器520。存储器520可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器520具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码531的存储空间530。例如,用于存储计算机可读程序代码的存储空间530可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码531。计算机可读程序代码531可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图5所述的计算机可读存储介质。图6示出了根据本申请一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质600存储有用于执行根据本申请的方法步骤的计算机可读程序代码531,可以被电子设备500的处理器510读取,当计算机可读程序代码531由电子设备500运行时,导致该电子设备500执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码531可以执行上述任一实施例中示出的方法。计算机可读程序代码531可以以适当形式进行压缩。

应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于人工智能的意图识别的方法、装置、计算机设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!