一种自动编目方法、设备及存储介质

文档序号:1861744 发布日期:2021-11-19 浏览:26次 >En<

阅读说明:本技术 一种自动编目方法、设备及存储介质 (Automatic cataloguing method, equipment and storage medium ) 是由 宋相濡 于 2021-08-23 设计创作,主要内容包括:本发明公开一种自动编目方法、设备及存储介质,方法包括:获取预设的编目规则,其中,所述编目规则由多个小规则组合而成;对所述编目规则进行解析,获取与所述编目规则对应的函数;获取待编目数据,执行所述函数,根据所述函数对所述待编目数据进行编目,以得到编目文件。本发明编目规则简单灵活,只需一次配置就能长期运行,而且实现了自动化编目,不需要人工介入,不容易出错,效率较高。(The invention discloses an automatic cataloguing method, equipment and a storage medium, wherein the method comprises the following steps: acquiring a preset cataloguing rule, wherein the cataloguing rule is formed by combining a plurality of small rules; analyzing the cataloguing rule to obtain a function corresponding to the cataloguing rule; and acquiring data to be catalogued, executing the function, and cataloguing the data to be catalogued according to the function to obtain a cataloguing file. The invention has simple and flexible cataloging rule, can run for a long time only by once configuration, realizes automatic cataloging, does not need manual intervention, is not easy to make mistakes and has higher efficiency.)

一种自动编目方法、设备及存储介质

技术领域

本发明涉及图书编目技术领域,具体涉及一种自动编目方法、设备及存储介质。

背景技术

编目是图书馆对于图书的电子化过程,编目软件是应用电子计算机处理图书馆文献编目业务的数据处理系统,由于不同的客户(学校、图书馆),对编目数据的要求不同。每个客户(学校、图书馆)所用的规则要求不同,需要的编目数据往往是多样化的。

目前大部分的编目工作因为流程繁琐,各个图书馆的编目要求不一致,而且因为现在图书分类的日益复杂,学科之间交叉较多,导致编目的复杂度日益提升,大多数的编目软件已经无法满足需求。

MARC(机器可读目录)数据看似规范,实则千差万别,一旦出现问题则需要耗费大量人力进行编目修正。

现在市面上的编目软件并没有做到真正意义上的自动化,而是半手动半自动的方式进行编目工作,不但容易出错,而且效率低下。

发明内容

本发明的目的在于克服上述技术不足,提供一种自动编目方法、设备及存储介质,解决现有技术中编目复杂、效率低下的技术问题。

为达到上述技术目的,本发明采取了以下技术方案:

第一方面,本发明提供一种自动编目方法,包括如下步骤:

获取预设的编目规则,其中,所述编目规则由多个小规则组合而成;

对所述编目规则进行解析,获取与所述编目规则对应的函数;

获取待编目数据,执行所述函数,根据所述函数对所述待编目数据进行编目,以得到编目文件。

优选的,所述的自动编目方法中,所述编目规则包括固定规则以及自定义规则。

优选的,所述的自动编目方法中,所述自定义规则至少包括馆藏地规则以及索书号规则。

优选的,所述的自动编目方法中,所述对所述编目规则进行解析,获取与所述编目规则对应的函数具体包括:

将所述编目规则解析成多个与小规则对应的文本;

识别各个所述文本,将无法识别出的文本所对应的规则筛除;

采用预设的函数库依次对将筛选后剩余的文本进行匹配,将匹配成功的文本所对应的函数加入执行队列中;

将执行队列中的函数进行优先级排序。

优选的,所述的自动编目方法中,所述执行队列为F I FO队列。

优选的,所述的自动编目方法中,所述将执行队列中的函数进行优先级排序具体为:

校验所述执行队列中的函数的顺序是否正确,如果不是,则对所述执行队列中的函数进行重排序。

优选的,所述的自动编目方法中,所述待编目数据为I SO格式、TXT格式或EXCEL格式中的一种。

优选的,所述的自动编目方法还包括:

对所述编目文件进行校验,并在所述编目文件无误时,对所述编目文件进行打包处理。

第二方面,本发明还提供一种自动编目设备,包括:处理器和存储器;

所述存储器上存储有可被所述处理器执行的计算机可读程序;

所述处理器执行所述计算机可读程序时实现如上所述的自动编目方法中的步骤。

第三方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的自动编目方法中的步骤。

与现有技术相比,本发明提供的自动编目方法、设备及存储介质中,编目规则由多个小规则组合而成,从而将编目规则解耦,粒度细化,可以方便的对编目规则进行配置,通过将多个小规则组合成一个大规则后,再根据规则进行编目,简单灵活,只需一次配置就能长期运行。当规则配置完成后,通过将规则解析为对应的函数,执行函数后,即可对获取的待编目数据进行编目,步骤简单,而且实现了自动化编目,不需要人工介入,不容易出错,效率较高。

附图说明

图1是本发明提供的自动编目方法的一较佳实施例的流程图;

图2是本发明自动编目程序的较佳实施例的运行环境示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

请参阅图1,本发明实施例提供的自动编目方法,包括如下步骤:

S100、获取预设的编目规则,其中,所述编目规则由多个小规则组合而成;

S200、对所述编目规则进行解析,获取与所述编目规则对应的函数;

S300、获取待编目数据,执行所述函数,根据所述函数对所述待编目数据进行编目,以得到编目文件。

本实施例中,首先设置编目规则,其中,所述编目规则是由多个小规则组合而成,从而将编目规则解耦,粒度细化,进而可以方便的对编目规则进行配置,通过将多个小规则组合成一个大规则后,再根据规则进行编目,简单灵活,只需一次配置就能长期运行。当规则配置完成后,通过将规则解析为对应的函数,执行函数后,即可对获取的待编目数据进行编目,步骤简单,而且实现了自动化编目,不需要人工介入,不容易出错,效率较高。

在一个优选的实施例中,所述步骤S100中,所述编目规则包括固定规则以及自定义规则,所述自定义规则至少包括馆藏地规则以及索书号规则。

具体的,所述固定规则是程序内置的规则,固定规则为硬编码的方式,大部分都为图书馆编目过程中需要的规则。所述自定义规则为自主定义的DSL语言。在进行自定义规则的设置时,首先打开浏览器并登陆,然后输入规则名称后,进行馆藏地规则和索书号规则的设置。

本实施例中,在进行馆藏地规则设置时,在显示界面,可选项包括分类号、分类号+复本、条码号+复本、是否覆盖已分配的馆藏地,其中,在是否覆盖已分配的馆藏地选项中,默认不覆盖已分配馆藏地的复本,当然,如果不分配馆藏地,也可不选择选项。其中,分类号选项是表示按照分类号和馆藏地对应的关系来分配,比如,:三国演义属于i 11分类,设置分类号分配规则时,设置i 11分类的书统一分配到A馆藏地,这样三国演义就对应分配为“A馆藏地”。分类号+复本选项是表示按照先匹配分类号,再匹配分类号下方配置的复本与馆藏地对应的关系来分配,比如:三国演义属于i 11分类,待分配复本为5,设置分类号+复本规则时,设置i 11分类号的书其中2复本分配到“A馆藏地”,另外3复本分配到“B馆藏地”;则三国演义中的书按照这个规则对应分配。条码号+复本选项是表示按照条码号从小到大的顺序一一对应分配馆藏地,比如:三国演义的复本数为3,条码号依次为“001,002,003”,设置条码号+复本分配规则时,设置复本为3的的馆藏地依次为:A馆藏地,A馆藏地,B馆藏地;则三国演义3个复本的馆藏地为:

001----》A馆藏地002----》A馆藏地003----》B馆藏地。

需要说明的是,如果待分配复本有缺号情况,优先按照条码号顺序分配有条码号的复本,无条码号的复本不分配馆藏地;如果设置馆藏地小于待分配复本数,先把设置的馆藏地分配后,剩余的复本不分配馆藏地。是否覆盖已分配馆藏地选项设置为“是”时,表示待分配文件中无论书目之前是否已分配馆藏地,统一按照这次馆藏地分配规则来执行,已分配馆藏地的书目会被新规则覆盖掉。

进一步的,在进行索书号规则设置时,进入索书号规则设置页面,进入后即可自定义设定,可通过分类号+种次号、分类号+著者号(拼音)、分类号+著者号(四角码)或者分类号+通用著者号这四种方式来设置规则。具体的,在采用分类号+种次号设置时,可通过导入文件方式设置,文件类型支持TXT、Excel,此外,在页面上还可下载提供的模板文件,在模板内笔记内容后即可导入页面中,而且可重复导入文件,导入的文件保存在服务器上后可下载。需要说明的是,在分类号+种次号设置时,导入文件必须必第一次导入的种次号大,例如第一次导入种次号为1,第二次必须要大于1。采用分类号+著者号(拼音)、分类号+著者号(四角码)或者分类号+通用著者号设置的方式与分类号+种次号设置的方式类似,在此不再赘述。

当编目规则设定完成后,即可根据编目规则对待编目数据进行编目。

在一个优选的实施例中,所述步骤S200具体包括;

将所述编目规则解析成多个与小规则对应的文本;

识别各个所述文本,将无法识别出的文本所对应的规则筛除;

采用预设的函数库依次对将筛选后剩余的文本进行匹配,将匹配成功的文本所对应的函数加入执行队列中;

将执行队列中的函数进行优先级排序。

本实施例中,首先规则引擎会对将该图书馆设置好的规则进行解析,将编目规则解析为文本形式,进入单向通道,将无法识别的规则抛出,随后进入后端监听器,去编目规则的函数库中匹配,匹配文本对应的规则,匹配成功的压入执行队列,队列为FIFO(先进先出)。到了执行队列,会通过优先级解析器进行排序,避免在执行规则时发生紊乱。其中,固定规则的函数为字符串形式,再通过Java中的反射得到类(Class),最后通过类中的方法对编目书目进行逐次处理,最后获得编目的文本。自定义规则先在内存中编译源代码,然后再将其转到JVM中,通过JVM运行。

优选的实施例中,所述执行对垒为FIFO队列,采用先进先出的方式,可以保证各个函数的顺序执行,避免编目时发生紊乱。

优选的实施例中,所述将执行队列中的函数进行优先级排序具体为:

校验所述执行队列中的函数的顺序是否正确,如果不是,则对所述执行队列中的函数进行重排序。

本实施例中,会通过优先级解析器进行解析,这里主要是校验规则是否符合规范、顺序是否正确,并将函数重排序。其中,判断顺序是否正确的方式具体为:当后一个函数执行时不会对前一个函数的执行结果发生干扰时,判定顺序正确,否则判定顺序不正确,需进行重排序,直至后一个函数执行时不会对前一个函数的执行结果发生干扰。

在一个优选的实施例中,所述步骤S300中,所述待编目数据为ISO格式、TXT格式或EXCEL格式中的一种。其中TXT格式需要有完整的MARC信息,EXCEL格式需设置表头ISBN、复本或者条码号,也可只有ISBN号。在显示界面,只需点击导入数据后,即可将待编目数据导入系统中,简单方便。

在一个优选的实施例中,所述自动编目方法还包括:

对所述编目文件进行校验,并在所述编目文件无误时,对所述编目文件进行打包处理。

本实施例中,为了保证编目结果的准确性,还需要对编目文件进行校验,具体校验编目文件中的编排结果是否有重复或者漏编情况,如果没有则校验通过,此时即可对所述编目文件进行打包处理生成ISO包,在显示界面,可对ISO包进行归档、书标打印等操作。

本发明实施例提供的自动编目方法操作简单灵活,步骤并不多,如果是之前已经配置过编目规则,则无需配置即可使用,对于熟悉编目的人员来说,很容易上手,一次配置长期稳定使用。另外,现在基本所有的编目系统都是基于window系统开发的,而我们的编目程序可以跨越系统集成在不同的程序中,在我们产品中为集成在后端Java程序,用户可以直接在浏览器上操作。而且能够做到自动化编目,大多数时候并不需要人工介入,相较于目前的编目软件的半手动半自动的方式,不容易出错,而且效率较高。

如图2所示,基于上述自动编目方法,本发明还相应提供了一种自动编目设备,所述自动编目设备可以是移动终端、桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该自动编目设备包括处理器10、存储器20及显示器30。图2仅示出了自动编目设备的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

所述存储器20在一些实施例中可以是所述自动编目设备的内部存储单元,例如自动编目设备的硬盘或内存。所述存储器20在另一些实施例中也可以是所述自动编目设备的外部存储设备,例如所述自动编目设备上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括自动编目设备的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述自动编目设备的应用软件及各类数据,例如所述安装自动编目设备的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有自动编目程序40,该自动编目程序40可被处理器10所执行,从而实现本申请各实施例的自动编目方法。

所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述自动编目方法等。

所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述自动编目设备的信息以及用于显示可视化的用户界面。所述自动编目设备的部件10-30通过系统总线相互通信。

在一实施例中,当处理器10执行所述存储器20中自动编目程序40时实现如上所述的自动编目方法中的步骤。

综上所述,本发明提供的自动编目方法、设备及存储介质中,编目规则由多个小规则组合而成,从而将编目规则解耦,粒度细化,可以方便的对编目规则进行配置,通过将多个小规则组合成一个大规则后,再根据规则进行编目,简单灵活,只需一次配置就能长期运行。当规则配置完成后,通过将规则解析为对应的函数,执行函数后,即可对获取的待编目数据进行编目,步骤简单,而且实现了自动化编目,不需要人工介入,不容易出错,效率较高。

以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:文本标注方法、装置、设备及介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!