数据处理的方法、装置、计算机设备和存储介质

文档序号:1505361 发布日期:2020-02-07 浏览:7次 >En<

阅读说明:本技术 数据处理的方法、装置、计算机设备和存储介质 (Data processing method and device, computer equipment and storage medium ) 是由 肖申波 何东旭 何鹏锐 于 2019-09-09 设计创作,主要内容包括:本申请涉及数据处理的技术领域,提供了一种数据处理的方法、装置、计算机设备和存储介质,分析EXCEL模板文件的数据内容结构的配置信息,并创建一个空白xml文件,将EXCEL模板文件的数据内容结构的配置信息分区域配置在空白xml文件中,形成一个xml配置文件;在导入第一EXCEL文件时,则解析出xml配置文件中配置的属性,并根据解析出来的属性对第一EXCEL文件的数据内容进行校验,校验成功则导入对应的数据内容;本申请中只需要维护xml配置文件以及EXCEL模板文件,就可以非常方便使用EXCEL的导入;无需以代码的形式进行,解决了目前使用代码导入文件时无法重用的问题。(The application relates to the technical field of data processing, and provides a data processing method, a data processing device, computer equipment and a storage medium, wherein the data processing method comprises the steps of analyzing configuration information of a data content structure of an EXCEL template file, creating a blank xml file, and configuring the configuration information of the data content structure of the EXCEL template file in the blank xml file in a partitioned mode to form an xml configuration file; when the first EXCEL file is imported, analyzing the attribute configured in the xml configuration file, checking the data content of the first EXCEL file according to the analyzed attribute, and importing the corresponding data content if the checking is successful; according to the method and the device, only the xml configuration file and the EXCEL template file need to be maintained, and the introduction of the EXCEL can be very conveniently used; the method does not need to be carried out in a code form, and solves the problem that the code can not be reused when the code is used for importing the file at present.)

数据处理的方法、装置、计算机设备和存储介质

技术领域

本申请涉及数据处理的技术领域,特别涉及一种数据处理的方法、装置、计算机设备和存储介质。

背景技术

目前数据导入导出(特别是excel表格文件)的处理过程中,基本上大部分是以代码的方式进行校验、转换、返回数据,然后进行数据导入导出;代码的方式指的是针对每一种excel表格文件模板,通过开发对应的代码程序进行数据的导入与导出。但是以代码的方式进行数据导入导出时,需要人工维护代码;且针对不同形式的文件在导入导出时需要开发不同的代码,在导入导出不同的文件时,需要重新开发代码,效率低下。

发明内容

本申请的主要目的为提供一种数据处理的方法、装置、计算机设备和存储介质,解决目前使用代码导入文件时重复开发代码的问题。

为实现上述目的,本申请提供了一种数据处理的方法,包括以下步骤:

分析EXCEL模板文件的数据内容结构的配置信息;所述配置信息包括所述EXCEL模板文件中的header部分、body部分的属性,所述属性包括header部分、body部分中各个单元格的位置属性、内容属性以及数据项的校验规则;

创建一个空白xml文件,将所述空白xml文件划分为第一配置区域以及第二配置区域;

将所述EXCEL模板文件中header部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第一xml配置,将所述第一xml配置添加至第一预设配置符中后形成第一内容,再将所述第一内容配置在所述空白xml文件的第一配置区域中;以及,将所述EXCEL模板文件中body部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第二xml配置,将所述第二xml配置添加至第二预设配置符中后形成第二内容,再将所述第二内容配置在所述空白xml文件的第二配置区域中,以生成xml配置文件;

接收到导入第一EXCEL文件的指令时,加载所述xml配置文件,从所述xml配置文件的第一配置区域以及第二配置区域中分别解析出header部分的属性和body部分的属性;并根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验;

若所述第一EXCEL文件的数据内容校验成功,则导入校验成功的所述数据内容;若所述第一EXCEL文件的数据内容校验不成功,则标记所述校验不成功的数据内容。

进一步地,以生成xml配置文件的步骤之后,还包括:

在所述xml配置文件中添加一个CRC校验元素,生成一个新的xml配置文件;所述CRC校验元素的值为原xml配置文件的CRC校验和;

启动所述新的xml配置文件,并搜索所述新的xml配置文件中的CRC校验元素;从所述CRC校验元素的文本字段得到原xml配置文件的CRC校验和X;

将新的xml配置文件全部读取到内存,得到xml配置文件的第一长度;

在内存中读取的新的xml配置文件中搜索CRC校验元素,得到CRC校验元素的第二长度,并删除CRC校验元素;

计算第一长度与第二长度的差值Y;

判断所述X和Y是否一致;若一致,校验通过,所述xml配置文件配置正确;若不一致,校验不通过,所述xml配置文件配置不正确。

进一步地,所述根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验的步骤,包括:

分析出所述第一EXCEL文件中的header部分以及body部分,并对所述header部分以及body部分中的数据进行转换;

验证第一EXCEL文件中的header部分以及body部分中转换后的数据是否与所述xml配置文件中解析出的header部分以及body部分的位置属性、内容属性相对应;并根据所述xml配置文件中解析出的header部分和body部分中数据项的校验规则验证所述第一EXCEL文件中的header部分以及body部分中转换后的数据是否正确。

进一步地,所述对所述header部分以及body部分中的数据进行转换的步骤,包括:

识别所述第一EXCEL文件中的header部分以及body部分中的数据的第一格式,以及从所述xml配置文件中解析出所述EXCEL模板文件的header部分、body部分中数据的内容属性;所述内容属性中包括数据的模板格式;

判断所述第一格式与所述内容属性中的模板格式是否相同;

若不相同,则判断是否内置有将所述第一格式转换为所述模板格式的转换器;

若有,则调用所述转换器对所述header部分以及body部分中的数据进行转换;若没有,则作出缺少所述转换器的提示以提示用户拓展所述转换器。

进一步地,所述以生成xml配置文件的步骤之后,包括:

查询出指定数据库的表格中的查询数据并接收到导出所述查询数据的指令时,解析出所述xml配置文件中的配置信息;所述配置信息至少包括EXCEL模板文件的header部分、body部分中各个单元格的位置属性;其中所述表格与所述EXCEL模板文件的配置信息一致;

根据所述xml配置文件解析出的header部分、body部分中各个单元格的位置属性,生成位置属性一致的第二EXCEL文件;

根据所述查询数据在数据库中表格的位置属性,将所述查询数据填充到所述第二EXCEL文件中相同位置属性的单元格中。

进一步地,所述以生成xml配置文件的步骤之后,包括:

获取所述xml配置文件中配置的各个单元格属性的起始位置以及结束位置;

在所述各个单元格属性的起始位置或者结束位置添加注释信息;

建立所述注释信息、所述各个单元格属性与所述起始位置或者结束位置之间的映射关系,并在所述xml配置文件中保存所述映射关系。

本申请还提供了一种数据处理的装置,包括:

分析单元,用于分析EXCEL模板文件的数据内容结构的配置信息;所述配置信息包括所述EXCEL模板文件中的header部分、body部分的属性,所述属性包括header部分、body部分中各个单元格的位置属性、内容属性以及数据项的校验规则;

创建单元,用于创建一个空白xml文件,将所述空白xml文件划分为第一配置区域以及第二配置区域;

配置单元,用于将所述EXCEL模板文件中header部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第一xml配置,将所述第一xml配置添加至第一预设配置符中后形成第一内容,再将所述第一内容配置在所述空白xml文件的第一配置区域中;以及,将所述EXCEL模板文件中body部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第二xml配置,将所述第二xml配置添加至第二预设配置符中后形成第二内容,再将所述第二内容配置在所述空白xml文件的第二配置区域中,以生成xml配置文件;

解析单元,用于接收到导入第一EXCEL文件的指令时,加载所述xml配置文件,从所述xml配置文件的第一配置区域以及第二配置区域中分别解析出header部分的属性和body部分的属性;并根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验;

处理单元,用于若所述第一EXCEL文件的数据内容校验成功,则导入校验成功的所述数据内容;若所述第一EXCEL文件的数据内容校验不成功,则标记所述校验不成功的数据内容。

进一步地,所述装置还包括:

生成单元,用于在所述xml配置文件中添加一个CRC校验元素,生成一个新的xml配置文件;所述CRC校验元素的值为原xml配置文件的CRC校验和;

启动单元,用于启动所述新的xml配置文件,并搜索所述新的xml配置文件中的CRC校验元素;从所述CRC校验元素的文本字段得到原xml配置文件的CRC校验和X;

读取单元,用于将新的xml配置文件全部读取到内存,得到xml配置文件的第一长度;

搜索单元,用于在内存中读取的新的xml配置文件中搜索CRC校验元素,得到CRC校验元素的第二长度,并删除CRC校验元素;

计算单元,用于计算第一长度与第二长度的差值Y;

判断单元,用于判断所述X和Y是否一致;若一致,校验通过,所述xml配置文件配置正确;若不一致,校验不通过,所述xml配置文件配置不正确。

本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请提供的数据处理的方法、装置、计算机设备和存储介质,分析EXCEL模板文件的数据内容结构的配置信息,并创建一个空白xml文件,将EXCEL模板文件的数据内容结构的配置信息分区域配置在空白xml文件中,形成一个xml配置文件;在导入第一EXCEL文件时,则解析出xml配置文件中配置的属性,并根据解析出来的属性对第一EXCEL文件的数据内容进行校验,校验成功则导入对应的数据内容;本申请中只需要维护xml配置文件以及EXCEL模板文件,就可以非常方便使用EXCEL的导入;无需以代码的形式进行,解决了目前使用代码导入文件时重复开发代码的问题。

附图说明

图1是本申请一实施例中数据处理的方法步骤示意图;

图2是本申请一实施例中数据处理的装置结构框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

参照图1,本申请实施例中提供了一种数据处理的方法,包括以下步骤:

步骤S1,分析EXCEL模板文件的数据内容结构的配置信息;所述配置信息包括所述EXCEL模板文件中的header部分、body部分的属性,所述属性包括header部分、body部分中各个单元格的位置属性、内容属性以及数据项的校验规则;

步骤S2,创建一个空白xml文件,将所述空白xml文件划分为第一配置区域以及第二配置区域;

步骤S3,将所述EXCEL模板文件中header部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第一xml配置,将所述第一xml配置添加至第一预设配置符中后形成第一内容,再将所述第一内容配置在所述空白xml文件的第一配置区域中;以及,将所述EXCEL模板文件中body部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第二xml配置,将所述第二xml配置添加至第二预设配置符中后形成第二内容,再将所述第二内容配置在所述空白xml文件的第二配置区域中,以生成xml配置文件;

步骤S4,接收到导入第一EXCEL文件的指令时,加载所述xml配置文件,从所述xml配置文件的第一配置区域以及第二配置区域中分别解析出header部分的属性和body部分的属性;并根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验;

步骤S5,若所述第一EXCEL文件的数据内容校验成功,则导入校验成功的所述数据内容;若所述第一EXCEL文件的数据内容校验不成功,则标记所述校验不成功的数据内容。

在本实施例中,如上述步骤S1所述的,上述EXCEL模板文件为数据系统中存储数据的模板文件,即上传至数据系统的数据需要以上述模板文件的结构形式进行上传。分析上述EXCEL模板文件的数据内容结构,从中分解出sheet(工作表),而每个sheet中包含header(表头)和body(表身),其中header中的内容为公用信息(可以理解为标题),比如项目名称、企业名称、上报期间等;body部分为具体上传的数据主体,包含横表格式和纵表格式。header和body包含若干个cell,每个cell为一个数据项,比如:header中的报表名称,body中对应企业名称的列;上述数据项中包含校验规则配置,比如必填校验、数字校验等。

上述EXCEL模板文件为预先设置的需要上传的EXCEL对应的模板文件;即上述EXCEL模板文件为预先制定的一个模板文件,后续系统中需要导入的EXCEL文件应当与该EXCEL模板文件的结构一致。上述EXCEL模板文件的结构即可以是上述EXCEL模板文件的数据内容结构的配置信息,上述配置信息包括所述EXCEL模板文件中的header部分(表头部分)、body部分(填入在对应上述表头的单元格中的具体数据)中各个单元格的位置属性、内容属性以及数据项的校验规则;上述位置属性为每个单元格在工作表中的位置信息,内容属性为单元格中内容的格式属性(英文格式、中文格式、大小写格式等)上述校验规则主要为用于校验上述header部分、body部分对应的单元格中是否必须填入数据,填入的数据是否正确等,具体如必填校验,数据类型校验,数字校验,数字大小、长度校验等。

解析出上述EXCEL模板文件的数据内容结构的配置信息之后,则需要将其配置在xml文件中。

如上述步骤S2所述的,创建一个空白的xml文件,并将其划分为两个区域,分别为第一配置区域以及第二配置区域;两个区域中用于分别配置上述EXCEL模板文件中不同部分的属性。其中,第一配置区域用于配置EXCEL模板文件中header部分的属性,第二配置区域用于配置EXCEL模板文件中body部分的属性。

如上述步骤S3所述的,针对EXCEL模板文件中header部分中每个单元格的位置属性、内容属性以及数据项的校验规则,将其依次进行组合时,可以直接拼接在一起(只用“、”“%”或者“-”进行隔开);组合后便得到每一个单元格的第一xml配置;每一个单元格的第一xml配置为该单元格所有的属性组合,例如组合为:位置属性%内容属性%数据项的校验规则。将每个单元格对应的第一xml配置均添加在一个第一预设配置符中后形成第一内容,再将第一内容保存在所述空白xml文件的第一配置区域中。其中,上述第一预设配置符用于各个单元格之间的第一xml配置进行隔断,避免各个单元格之间混淆。其可以为“%label=”、“%type=”等,例如,本实施例中,上述第一预设配置符为“%label=”,则header部分某一个单元格的属性配置后则为“%label=第一xml配置”。

针对EXCEL模板文件中body部分中每个单元格的位置属性、内容属性以及数据项的校验规则,将其依次进行组合时,可以直接拼接在一起(只用“、”“%”或者“-”进行隔开);组合后便得到每一个单元格的第二xml配置;每一个单元格的第二xml配置为该单元格所有的属性组合,例如组合为:位置属性-内容属性-数据项的校验规则。将每个单元格对应的第二xml配置均添加在一个第二预设配置符中后形成第二内容,再将第二内容保存在所述空白xml文件的第二配置区域中。其中,上述第二预设配置符用于各个单元格之间的第二xml配置进行隔断,避免各个单元格之间混淆。其可以为“%label=”、“%type=”等,例如,本实施例中,上述第二预设配置符为“%type=”,则body部分某一个单元格的属性配置后则为“%type=第二xml配置”。保存配置在所述第一配置区域以及所述第二配置区域中的所有内容,则生成一个xml配置文件。

本实施例中,将header部分、body部分的属性分别配置在xml文件的不同配置区域,并通过预设的不同配置符进行配置,便于进行区分,避免造成xml配置文件的错乱。

如上述步骤S4所述的,上述第一EXCEL文件为需要导入至系统的数据,在数据系统导入数据时,必须导入与EXCEL模板文件结构一致的数据,即上述第一EXCE文件中的数据内容的结构需要与上述EXCEL模板文件的数据内容结构一致。

第一EXCEL文件在格式上要求与EXCEL模板(或配置好的xml配置文件)一致,否则校验不会通过。因此,在本实施例中,对xml配置文件进行加载解析,分析所述xml配置文件中的两个配置区域,并解析各个配置区域内的配置符。xml配置文件中具有两个配置区域,一个用来配置header部分的属性,另一个用来配置body部分的属性;因此可以从xml配置文件中直接识别两个配置区域,再根据每个配置区域中使用的配置符不同,便可以确认出每个配置区域具体配置的是header部分的属性还是body部分的属性;如,从其中一个配置区域中识别到配置符“%label=”,则表明此配置区域为header部分的属性;而该配置区域中每个配置符中添加的则是header部分中每个单元格的具体属性。

本实施例中,根据配置符确定其配置的属性属于header部分的单元格还是body部分的单元格;再根据配置符中的第一xml配置或者第二xml配置确定EXCEL模板文件中每个单元格中数据的位置属性、内容属性、数据项的校验规则,并根据每个数据的位置属性、内容属性对所述第一EXCEL文件的数据内容进行校验,以及通过对应的校验规则校验第一EXCEL文件中的数据内容是否合法;例如,校验某一个单元格或某一列的数据必填,那么需要校验在上述第一EXCEL文件对应的单元格中的数据是否合法(必填、必须为数字等等)。

如上述步骤S5所述的,若上述第一EXCEL文件中的数据内容校验成功,则将校验成功的数据导入,若校验不成功,则标记该校验不成功的数据内容,例如使用颜色标记或者其它校验错误处理。本实施例中,只需要维护xml配置文件以及EXCEL模板文件,就可以非常方便使用EXCEL的导入,无需以代码的形式进行;且可以重复使用,避免重复开发代码。

在一实施例中,在配置完成上述xml配置文件之后,还需要对上述xml配置文件进行验证。

具体地,上述以生成xml配置文件的步骤S3之后,还包括:

步骤S50,在所述xml配置文件中添加一个CRC校验元素,生成一个新的xml配置文件;所述CRC校验元素的值为原xml配置文件的CRC校验和;

上述原xml配置文件中的数据项的长度和,将上述校验和作为CRC校验元素的值保存在上述xml配置文件中。

步骤S51,启动所述新的xml配置文件,并搜索所述新的xml配置文件中的CRC校验元素;从所述CRC校验元素的文本字段得到原xml配置文件的CRC校验和X;

步骤S52,将新的xml配置文件全部读取到内存,得到xml配置文件的第一长度;

上述校验和X是直接从上述CRC校验元素中得到的,本过程中,在内存中读取新的xml配置文件,得到新的xml配置文件的第一长度,该第一长度的值包括有上述CRC校验元素的长度以及原xml配置文件的长度。

步骤S53,在内存中读取的新的xml配置文件中搜索CRC校验元素,得到CRC校验元素的第二长度,并删除CRC校验元素;

在本实施例中,搜索CRC校验元素,计算得到CRC校验元素的第二长度;可以理解的是,上述第一长度减去第二长度便是上述原xml配置文件的长度。

步骤S54,计算第一长度与第二长度的差值Y;

步骤S55,判断所述X和Y是否一致;若一致,校验通过,所述xml配置文件配置正确;若不一致,校验不通过,所述xml配置文件配置不正确。

在本实施例中,计算第一长度与第二长度的差值Y,该差值Y则是在内存中读取新的xml配置文件时所计算出来的原xml配置文件的实际长度;由于上述长度是经过内存读取计算得到的,因此该长度为一准确值;将其与上述CRC校验元素中得到的校验和X进行对比,判断是否一致,若一致,校验通过,所述xml配置文件配置正确;若不一致,校验不通过,所述xml配置文件配置不正确,需要重新进行配置。

在一实施例中,上述步骤S4中,根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验的步骤,包括:

a、分析出所述第一EXCEL文件中的header部分以及body部分,并对所述header部分以及body部分中的数据进行转换;

b、验证第一EXCEL文件中的header部分以及body部分中转换后的数据是否与所述xml配置文件中解析出的header部分以及body部分的位置属性、内容属性相对应;并根据所述xml配置文件中解析出的header部分和body部分中数据项的校验规则验证所述第一EXCEL文件中的header部分以及body部分中转换后的数据是否正确。

在本实施例中,对待上传的第一EXCEL文件进行分析,分析出该文件中的header部分以及body部分;本系统中内置有多个转换器,比如日期转换、数字转换等,其用于对上述header部分以及body部分中的数据进行格式转换。本实施例中还支持转换器的扩展,便于进行数据转换。

在对数据进行格式转换之后,则继续验证上述第一EXCEL文件中的header部分以及body部分中转换后的数据是否与所述xml配置文件中解析出的header部分以及body部分的位置属性、内容属性一致,以及根据所述xml配置文件中解析出的header部分和body部分中数据项的校验规则验证所述第一EXCEL文件中的header部分以及body部分中转换后的数据是否正确;验证数据是否正确包括验证必须填入数据的单元格中是否具有数据,且该数据是否为正确的数据类型(如数字等)。

在本实施例中,对上述需要上传的第一EXCEL文件进行分解处理,对应第一EXCEL文件的每一部分数据内容有独立的处理逻辑,比如header部分的数据有HeaderTransfer类进行处理(读取、转换、校验等);每个部分的处理方式通过接口实现,需要调整或是扩展时,可以继承类或是实现接口的方式实现特定业务的逻辑,再接入到上一层的处理器,达到外部扩展而不修改逻辑的目的。

在一个实施例中,上述对所述header部分以及body部分中的数据进行转换的步骤,包括:

识别所述第一EXCEL文件中的header部分以及body部分中的数据的第一格式,以及从所述xml配置文件中解析出所述EXCEL模板文件的header部分、body部分中数据的内容属性;所述内容属性中包括数据的模板格式;

判断所述第一格式与所述内容属性中的模板格式是否相同;

若不相同,则判断是否内置有将所述第一格式转换为所述模板格式的转换器;

若有,则调用所述转换器对所述header部分以及body部分中的数据进行转换;若没有,则作出缺少所述转换器的提示以提示用户拓展所述转换器。

在本实施例中,上述EXCEL模板文件中的单元格的header部分、body部分中数据的内容属性包括有单元格中数据内容的模板格式;在上传上述第一EXCEL文件时,需要保障其单元格中的数据内容的格式与模板文件中对应单元格的模板格式一致。因此,分析出第一EXCEL文件中的header部分以及body部分中的数据的第一格式,进而判断其是否与内容属性中的模板格式是否相同;若不同,则需要对其进行格式转换;本实施例中,内置有多种转换器(如大小写转换、日期格式转换等),通过内置的转换器对上述第一EXCEL文件中的数据进行格式转换,以将所述第一格式转换为所述模板格式。若没有对应的转换器来实现转换,则作出缺少所述转换器的提示以提示用户拓展所述转换器;用户则可以上传对应的转换器进行拓展,以进行格式转换。

在一个实施例中,上述以生成xml配置文件的步骤S3之后,包括:

步骤S501,查询出指定数据库的表格中的查询数据并接收到导出所述查询数据的指令时,解析出所述xml配置文件中的配置信息;所述配置信息至少包括EXCEL模板文件的header部分、body部分中各个单元格的位置属性;其中所述表格与所述EXCEL模板文件的配置信息一致;

步骤S502,根据所述xml配置文件解析出的header部分、body部分中各个单元格的位置属性,生成位置属性一致的第二EXCEL文件;

步骤S503,根据所述查询数据在数据库中表格的位置属性,将所述查询数据填充到所述第二EXCEL文件中相同位置属性的单元格中。

在本实施例中,若需要从数据系统中导出查询出的数据,在导出时,也需要按照对应EXCEL模板文件的配置信息创建对应的第二EXCEL文件,然后根据所述查询数据在数据库中表格的位置属性,将查询数据填充到所述第二EXCEL文件中相同位置属性的单元格中。

在另一个实施例中,所述以生成xml配置文件的步骤S3之后,包括:

步骤S5a,获取所述xml配置文件中配置的各个单元格属性的起始位置以及结束位置;

步骤S5b,在所述各个单元格属性的起始位置或者结束位置添加注释信息;

步骤S5c,建立所述注释信息、所述各个单元格属性与所述起始位置或者结束位置之间的映射关系,并在所述xml配置文件中保存所述映射关系。

在本实施例中,在xml配置文件生成之后,为了记录各个单元格的属性位置,在上述xml配置文件中添加注释信息,该注释信息用于对其标注的单元格属性进行标记,建立所述注释信息、所述各个单元格属性与所述起始位置或者结束位置之间的映射关系保存在xml配置文件中,便于根据该映射关系可以直观了解到每个单元格的属性具体被配置在xml配置文件的哪个位置,便于查询以及维护、修改。

综上所述,为本申请提供的数据处理的方法,分析EXCEL模板文件的数据内容结构的配置信息,并创建一个空白xml文件,将EXCEL模板文件的数据内容结构的配置信息分区域配置在空白xml文件中,形成一个xml配置文件;在导入第一EXCEL文件时,则解析出xml配置文件中配置的属性,并根据解析出来的属性对第一EXCEL文件的数据内容进行校验,校验成功则导入对应的数据内容;本申请中只需要维护xml配置文件以及EXCEL模板文件,就可以非常方便使用EXCEL的导入;无需以代码的形式进行,解决了目前使用代码导入文件时重复开发代码的问题。

参照图2,本申请一实施例中还提供了一种数据处理的装置,包括:

分析单元10,用于分析EXCEL模板文件的数据内容结构的配置信息;所述配置信息包括所述EXCEL模板文件中的header部分、body部分的属性,所述属性包括header部分、body部分中各个单元格的位置属性、内容属性以及数据项的校验规则;

创建单元20,用于创建一个空白xml文件,将所述空白xml文件划分为第一配置区域以及第二配置区域;

配置单元30,用于将所述EXCEL模板文件中header部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第一xml配置,将所述第一xml配置添加至第一预设配置符中后形成第一内容,再将所述第一内容配置在所述空白xml文件的第一配置区域中;以及,将所述EXCEL模板文件中body部分中每个单元格的位置属性、内容属性以及数据项的校验规则依次进行组合得到每一个单元格的第二xml配置,将所述第二xml配置添加至第二预设配置符中后形成第二内容,再将所述第二内容配置在所述空白xml文件的第二配置区域中,以生成xml配置文件;

解析单元40,用于接收到导入第一EXCEL文件的指令时,加载所述xml配置文件,从所述xml配置文件的第一配置区域以及第二配置区域中分别解析出header部分的属性和body部分的属性;并根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验;

处理单元50,用于若所述第一EXCEL文件的数据内容校验成功,则导入校验成功的所述数据内容;若所述第一EXCEL文件的数据内容校验不成功,则标记所述校验不成功的数据内容。

在一实施例中,在配置完成上述xml配置文件之后,还需要对上述xml配置文件进行验证。

具体地,上述装置还包括:

生成单元,用于在所述xml配置文件中添加一个CRC校验元素,生成一个新的xml配置文件;所述CRC校验元素的值为原xml配置文件的CRC校验和;

启动单元,用于启动所述新的xml配置文件,并搜索所述新的xml配置文件中的CRC校验元素;从所述CRC校验元素的文本字段得到原xml配置文件的CRC校验和X;

读取单元,用于将新的xml配置文件全部读取到内存,得到xml配置文件的第一长度;

上述校验和X是直接从上述CRC校验元素中得到的,本过程中,在内存中读取新的xml配置文件,得到新的xml配置文件的第一长度,该第一长度的值包括有上述CRC校验元素的长度以及原xml配置文件的长度。

搜索单元,用于在内存中读取的新的xml配置文件中搜索CRC校验元素,得到CRC校验元素的第二长度,并删除CRC校验元素;

在本实施例中,搜索CRC校验元素,计算得到CRC校验元素的第二长度;可以理解的是,上述第一长度减去第二长度便是上述原xml配置文件的长度。

计算单元,用于计算第一长度与第二长度的差值Y;

判断单元,用于判断所述X和Y是否一致;若一致,校验通过,所述xml配置文件配置正确;若不一致,校验不通过,所述xml配置文件配置不正确。

在一实施例中,上述解析单元40根据解析出header部分的属性和body部分的属性对所述第一EXCEL文件的数据内容进行校验,具体包括:

第一分析子单元,用于分析出所述第一EXCEL文件中的header部分以及body部分,并对所述header部分以及body部分中的数据进行转换;

验证单元,用于验证第一EXCEL文件中的header部分以及body部分中转换后的数据是否与所述xml配置文件中解析出的header部分以及body部分的位置属性、内容属性相对应;并根据所述xml配置文件中解析出的header部分和body部分中数据项的校验规则验证所述第一EXCEL文件中的header部分以及body部分中转换后的数据是否正确。

在一个实施例中,上述第一分析子单元,包括:

识别模块,用于识别所述第一EXCEL文件中的header部分以及body部分中的数据的第一格式,以及从所述xml配置文件中解析出所述EXCEL模板文件的header部分、body部分中数据的内容属性;所述内容属性中包括数据的模板格式;

第一判断模块,用于判断所述第一格式与所述内容属性中的模板格式是否相同;

第二判断模块,用于若不相同,则判断是否内置有将所述第一格式转换为所述模板格式的转换器;

转换模块,用于若有,则调用所述转换器对所述header部分以及body部分中的数据进行转换;若没有,则作出缺少所述转换器的提示以提示用户拓展所述转换器。

在一个实施例中,上述数据处理的装置,还包括:

导出单元,用于查询出指定数据库的表格中的查询数据并接收到导出所述查询数据的指令时,解析出所述xml配置文件中的配置信息;所述配置信息至少包括EXCEL模板文件的header部分、body部分中各个单元格的位置属性;其中所述表格与所述EXCEL模板文件的配置信息一致;

文件生成单元,用于根据所述xml配置文件解析出的header部分、body部分中各个单元格的位置属性,生成位置属性一致的第二EXCEL文件;

填充单元,用于根据所述查询数据在数据库中表格的位置属性,将所述查询数据填充到所述第二EXCEL文件中相同位置属性的单元格中。

在另一个实施例中,上述数据处理的装置,还包括:

获取单元,用于获取所述xml配置文件中配置的各个单元格属性的起始位置以及结束位置;

添加单元,用于在所述各个单元格属性的起始位置或者结束位置添加注释信息;

建立单元,用于建立所述注释信息、所述各个单元格属性与所述起始位置或者结束位置之间的映射关系,并在所述xml配置文件中保存所述映射关系。

本实施例中的各个单元、子单元、模块的具体实现请参照上述方法实施例中所述,在此不再进行赘述。

综上所述,为本申请提供的数据处理的装置,分析EXCEL模板文件的数据内容结构的配置信息,并创建一个空白xml文件,将EXCEL模板文件的数据内容结构的配置信息分区域配置在空白xml文件中,形成一个xml配置文件;在导入第一EXCEL文件时,则解析出xml配置文件中配置的属性,并根据解析出来的属性对第一EXCEL文件的数据内容进行校验,校验成功则导入对应的数据内容;本申请中只需要维护xml配置文件以及EXCEL模板文件,就可以非常方便使用EXCEL的导入;无需以代码的形式进行,解决了目前使用代码导入文件时重复开发代码的问题。

参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储模板文件等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述任一种数据处理的方法。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一种数据处理的方法。

综上所述,为本申请实施例中提供的数据处理的方法、装置、计算机设备和存储介质,分析EXCEL模板文件的数据内容结构的配置信息,并创建一个空白xml文件,将EXCEL模板文件的数据内容结构的配置信息分区域配置在空白xml文件中,形成一个xml配置文件;在导入第一EXCEL文件时,则解析出xml配置文件中配置的属性,并根据解析出来的属性对第一EXCEL文件的数据内容进行校验,校验成功则导入对应的数据内容;本申请中只需要维护xml配置文件以及EXCEL模板文件,就可以非常方便使用EXCEL的导入;无需以代码的形式进行,解决了目前使用代码导入文件时重复开发代码的问题。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于文本分析技术的自动写稿系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!