一种文献著录格式转换方法

文档序号:1556934 发布日期:2020-01-21 浏览:20次 >En<

阅读说明:本技术 一种文献著录格式转换方法 (Document bibliographic format conversion method ) 是由 张金龙 于 2019-10-17 设计创作,主要内容包括:本发明公开了一种文献著录格式转换方法,包括:S1、获取待转换文献列表及目标著录格式;S2、识别待转换文献列表中每条待转换文献的原始格式;S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;S4、基于目标文献生成目标文献列表。通过本发明的方法,能够实现文献格式的自动转换,提高了转换效率,避免了人工转换容易出错的问题。(The invention discloses a document bibliographic format conversion method, which comprises the following steps: s1, acquiring a document list to be converted and a target bibliographic format; s2, identifying the original format of each document to be converted in the document list to be converted; s3, converting the document to be converted from the original format to the target format based on the target bibliographic format to obtain a target document; and S4, generating a target document list based on the target document. The method of the invention can realize automatic conversion of literature formats, improve conversion efficiency and avoid the problem that manual conversion is easy to make mistakes.)

一种文献著录格式转换方法

技术领域

本发明涉及数据处理,具体涉及一种文献著录格式转换方法。

背景技术

专业文献的引用、写作通常需要遵从一定的文献引用著录标准,如我国的参考文献著录规则、APA(American Psychological Association)格式、 Chicago 格式、MLA(Modern Language Association)格式、Harvard格式、Vancouver格式等。不同的出版本物,往往采用不同的标准。这给文献引用带来一定的困难:一是需要将不同格式的参考文献按同一种标准进行编辑;二是当论文需要改投到采用不同著录格式的出版物时,需要对原有的参考文献重新编辑。

现有技术中,对文献著录格式的转换主要采用人工编辑的方式,然而人工编辑繁杂、工作量大,容易出错,且要求作者十分熟悉不同的著录格式。

因此,如何实现文献著录格式的自动转换成为了本领域技术人员急需解决的问题。

发明内容

针对现有技术存在的上述不足,本发明实际需要解决的问题是:如何实现文献著录格式的自动转换。

本发明采用了如下的技术方案:

一种文献著录格式转换方法,包括:

S1、获取待转换文献列表及目标著录格式;

S2、识别待转换文献列表中每条待转换文献的原始格式;

S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;

S4、基于目标文献生成目标文献列表。

优选地,步骤S3包括:

当待转换文献的原始格式与目标著录格式相同,则将待转换文献作为目标文献,否则,基于待转换文献的原始格式将待转换文献分解为元数据,基于目标著录格式将元数据组合得到目标文献。

优选地,步骤S2至步骤S4具体包括:

S1001、识别待转换文献列表中待转换文献数量,待转换文献数量大于0时,执行步骤S1002,否则,执行步骤S1005;

S1002、识别待转换文献列表中第一条待转换文献的原始格式,执行步骤S1003;

S1003、当所述第一条待转换文献的原始格式与目标著录格式相同,则将所述第一条待转换文献作为目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001,否则,基于所述第一条待转换文献的原始格式将所述第一条待转换文献分解为元数据,执行步骤S1005;

S1004、基于目标著录格式将元数据组合得到所述第一条待转换文献对应的目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001;

S1005、将所有目标文献按待转换文献列表中的顺序生成目标文献列表。

优选地,识别待转换文献原始格式的方法包括:

获取文献格式规则;

将文献格式规则与待转换文献进行匹配并确定待转换文献的原始格式。

优选地,文献格式规则包括各种文献格式的识别特征,当待转换文献具有某种文献格式的识别特征时,则确定所述文献格式为待转换文献的原始格式。

优选地,元数据包括作者、文献标题、出版物名称、出版年、卷、期及页码中的任意一项或多项。

综上所述,本发明公开了一种文献著录格式转换方法,包括:S1、获取待转换文献列表及目标著录格式;S2、识别待转换文献列表中每条待转换文献的原始格式;S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;S4、基于目标文献生成目标文献列表。通过本发明的方法,能够实现文献格式的自动转换,提高了转换效率,避免了人工转换容易出错的问题。

附图说明

图1是本发明中的一种文献著录格式转换方法的一

具体实施方式

的流程图;

图2是本发明中的一种文献著录格式转换方法的另一具体实施方式的流程图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述说明。

如图1所示,本发明公开了一种文献著录格式转换方法,包括:

S1、获取待转换文献列表及目标著录格式;

S2、识别待转换文献列表中每条待转换文献的原始格式;

S3、基于目标著录格式将待转换文献由原始格式转换为目标格式得到目标文献;

S4、基于目标文献生成目标文献列表。

通过本发明的方法,能够实现文献格式的自动转换,提高了转换效率,避免了人工转换容易出错的问题。

具体实施时,步骤S3包括:

当待转换文献的原始格式与目标著录格式相同,则将待转换文献作为目标文献,否则,基于待转换文献的原始格式将待转换文献分解为元数据,基于目标著录格式将元数据组合得到目标文献。

本发明中可预存各种文献格式的分解规则,分解规则中明确了各种格式的文献的每一部分的意义,在确定了待转换文献的原始格式之后,根据分解规则可将待转换文献分解为元数据,之后再根据目标著录格式进行组合即可得到对应的目标文献。通过这种分解再组合的行驶可以实现多种格式之间的灵活转换。并且,当原始格式与目标著录格式相同时,不再转换,直接将其作为目标文献,减少了数据的处理量。

具体实施时,步骤S2至步骤S4具体包括:

S1001、识别待转换文献列表中待转换文献数量,待转换文献数量大于0时,执行步骤S1002,否则,执行步骤S1005;

S1002、识别待转换文献列表中第一条待转换文献的原始格式,执行步骤S1003;

S1003、当所述第一条待转换文献的原始格式与目标著录格式相同,则将所述第一条待转换文献作为目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001,否则,基于所述第一条待转换文献的原始格式将所述第一条待转换文献分解为元数据,执行步骤S1005;

S1004、基于目标著录格式将元数据组合得到所述第一条待转换文献对应的目标文献,并将所述第一条待转换文献标记为已转换,返回执行步骤S1001;

S1005、将所有目标文献按待转换文献列表中的顺序生成目标文献列表。

采取上述步骤,可以逐条实现待转换文献列表中的待转换文献的转换,防止重复转换及漏转的问题。

具体实施时,识别待转换文献原始格式的方法包括:

获取文献格式规则;

将文献格式规则与待转换文献进行匹配并确定待转换文献的原始格式。

本发明中通过预存的文献格式规则来与待转换文献进行匹配,从而实现待转换文献的原始格式的识别。文献格式规则可以是不同格式的文献的元数据的排列顺序,也可以是不同文献包括的不同的特征字符或信息。

具体实施时,文献格式规则包括各种文献格式的识别特征,当待转换文献具有某种文献格式的识别特征时,则确定所述文献格式为待转换文献的原始格式。

以下为常见几种文献著录格式及其特征字符(识别特征):

(1)China (国家标准《文后参考文献著录规则》):

作者. 文献标题[J]. 期刊名称, 出版年, 卷(期),页码.

特征字符:“[”

(2)APA (American Psychological Association):

作者. (出版年). 文献标题. 期刊名称, 卷(期), 页码.

特征字符:“. (”

(3)Harvard:

作者, 出版年. 文献标题. 期刊名称, 卷(期), pp.页码.

特征字符:“, pp.”

(4)Vancouver:

作者. 文献标题. 期刊名称. 出版年 月; 卷(期):页码.

特征字符:“):”

(5)MLA(Modern Language Association):

作者. “文献标题.” 期刊名称 卷.期 (出版年): 页码.

特征字符:“. "”且“):”

(6)Chicago:

作者. “文献标题.” 期刊名称 卷, no. 期 (出版年): 页码.

特征字符:“. “”且“, no.”且“):”

通过如图2所示的流程图,即可判断出待转换文献的原始格式。可根据预存的能够识别的各种格式,预设每种格式的判断顺序、特征字符及成立条件,这样可以以更少的特征字符及判断次数判断出各种格式,提高了格式的识别效率。

在判断上述6种格式时,首先判断是否含有“[”,若是,则认为是China格式,若不是,再判断是否含有“.(”,若是,则认为是APA格式,若不是,再判断是否含有“,pp.”,若是,则认为是Harvard格式,若不是,再判断是否含有“):”,若不是,则判断是其他格式,若无法判断出准确的格式,则可以进行报错,若是,再判断是否含有“. "”,若不是,则认为是Vancouver格式,若是,再判断是否含有“,pp.”,若不是,则认识是MLA格式,若是,则认为是Chicago格式。

采用上述方式,最多只需要6次判断即可实现格式的识别。

具体实施时,元数据包括作者、文献标题、出版物名称、出版年、卷、期及页码中的任意一项或多项。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:系统数据批量修改方法、装置、存储介质及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!