将word文档生成符合s1000d标准描述类数据模块的方法

文档序号:1156526 发布日期:2020-09-15 浏览:3次 >En<

阅读说明:本技术 将word文档生成符合s1000d标准描述类数据模块的方法 (Method for generating WORD document into description class data module conforming to S1000D standard ) 是由 冯彬 张悦 程铮 曹亢 马永起 蒙立荣 郑翠芳 齐天永 吴家菊 于 2020-05-29 设计创作,主要内容包括:本发明公开了将WORD文档生成符合S1000D标准描述类数据模块的方法,包括以下步骤:确定WS规则元素,所述WS规则是基于WORD文档识别出需要关注的元素和S1000D描述类数据模块之间的映射规则;建立WS规则映射关系和转换规则;对需转换的WORD文档进行解析识别,对识别出的元素及内容按WS规则映射关系和转换规则进行转换,自动生成符合S1000D标准描述类数据模块文件。用户通过本发明所述方法可以非常准确、方便、快捷地将WORD文档自动生成符合S1000D标准描述类数据模块信息文件,从而提高了IETM数据内容编辑与制作的效率,降低了IETM数据内容编辑与制作的复杂度。(The invention discloses a method for generating a WORD document into a description class data module conforming to S1000D standard, which comprises the following steps: determining a WS rule element, wherein the WS rule is a mapping rule between an element needing attention based on the WORD document identification and the S1000D description class data module; establishing WS rule mapping relation and conversion rules; and analyzing and identifying the WORD document to be converted, converting the identified elements and contents according to the WS rule mapping relation and the conversion rule, and automatically generating a description data module file conforming to the S1000D standard. The user can accurately, conveniently and quickly automatically generate the WORD document into the description data module information file conforming to the S1000D standard by the method, thereby improving the efficiency of editing and making IETM data content and reducing the complexity of editing and making IETM data content.)

将WORD文档生成符合S1000D标准描述类数据模块的方法

技术领域

本发明涉及一种利用软件完成的数据编辑方法,尤其涉及一种将WORD文档生成符合S1000D标准描述类数据模块的方法。

背景技术

交互式电子技术手册(以下称IETM)采用文字、图形、表格、音视频等多种形式,是一种按标准数字格式编制,以人机交互方式提供装备基本原理、使用操作、技术维修等内容的技术出版物。目前,IETM技术日趋成熟,一些单位已通过IETM技术制作出满足用户要求的交互式电子技术手册,在制作ITEM过程中,采用先进的技术手段和制作工具尤其重要。

传统的IETM制作软件工具主要有两类,即专用制作软件和通用制作软件,同时也可分为中国国内和国外软件。国外IETM制作软件起步早、技术发展成熟、性能好、功能强并且已得到诸多用户的使用验证,但采用的技术标准版本较老,并且支持的标准不一定与中国IETM标准兼容,交互功能不好,价格昂贵以及维护和安全性方面欠佳。

但是,无论是中国国内还是国外,也无论是专业软件还是通用软件,内容编写过程中,需要将WORD文档的文本内容制作成满足要求的数据模块,均需工作人员使用具有XML编辑器功能的工具来进行内容的编辑,或者使用工具对WORD文档进行转换,需要处理为特定格式(如***标签)或者需要人工对内容格式设置好才能使用。也就是说:对于WORD文档全文,在编辑成数据模块内容部分的时候,目前有两种方式:(1)人工一个一个地将对应内容拷贝到对应位置上;(2)使用人工或人工使用工具对于WORD文档处理为特定格式(如***标签)等方式并进行转换。上述两种方式的缺陷在于:第一种方式在实际制作IETM时需要花费大量的人力,同时因为是人手工操作,还不能保证正确率,还需要多次核对;第二种方式也需要进行相应的人工或人工使用工具设置为特定格式才能完成。

S1000D标准是一种采用通用资源数据库来创建技术文档的国际标准,其提出数据模块和通用资源数据库这两个核心概念能够保证IETM间的信息共享和交换,所以非常便于IETM制作,但传统的IETM制作方式还没有将WORD文档与S1000D标准进行结合和转换的先例。

发明内容

本发明的目的就在于为了解决上述问题而提供一种能高效制作IETM的将WORD文档生成符合S1000D标准描述类数据模块的方法。

本发明通过以下技术方案来实现上述目的:

一种将WORD文档生成符合S1000D标准描述类数据模块的方法,包括以下步骤:

步骤1、确定WS规则元素,所述WS规则是基于WORD文档识别出需要关注的元素和S1000D描述类数据模块之间的映射规则;

步骤2、建立WS规则映射关系和转换规则,所述WS规则映射关系即确定的WS规则元素和符合S1000D标准描述数据模块信息元素之间的映射关系;所述转换规则即规则元素如何依据规则元素类型以及规则元素之间的组织结构、映射关系进行转换的规则;

步骤3、对需转换的WORD文档进行解析识别,对识别出的元素及内容按WS规则映射关系和转换规则进行转换,自动生成符合S1000D标准描述类数据模块文件。

作为优选,所述步骤1中,所述确定WS规则元素包括以下步骤:

步骤1.1、解析通用WORD文档结构;

步骤1.2、识别出WORD文档结构中需要关注的元素;

步骤1.3、将WORD文档结构中需要关注的元素确定为WS规则元素。

作为优选,所述步骤1.2和步骤1.3中,所述WORD文档结构中需要关注的元素包括但不限于各级标题元素、表格元素、图元素、正文元素、段元素、字母编号元素和数字编号元素。

作为优选,所述步骤2中的所述映射关系包括但不限于各级标题元素与S1000D标准定义的标题元素的映射关系、表格元素与S1000D标准定义的表格元素的映射关系、图元素与S1000D标准定义的图元素的映射关系、正文元素与S1000D标准定义的正文元素的映射关系、段元素与S1000D标准定义的段元素的映射关系、字母编号元素与S1000D标准定义的字母编号元素的映射关系以及数字编号元素与S1000D标准定义的数字字母编号元素的映射关系。

作为优选,所述步骤2中的所述转换规则包括标题元素转换规则、表格元素转换规则、图元素转换规则、正文元素转换规则、段元素转换规则、字母编号元素转换规则和数字编号元素转换规则。

作为优选,所述步骤3包括以下步骤:

步骤3.1、获取需转换的WORD文档素材;

步骤3.2、对该WORD文档素材进行解析,循环遍历该WORD文档素材把识别的元素及内容按照映射关系和转换规则自动转换生成符合S1000D标准描述类数据模块文件。

作为优选,所述步骤3.1的方法是:打开需转换的WORD文档素材,获取DOCUMENT对象,将指针定位在WORD文档开始位置,Document对象代表整个XML文档,是一棵文档树的根,提供对文档数据的最初或最顶层的访问入口;所述步骤3.2包括以下步骤:

步骤3.2.1、获取一个WORD文档元素对象进行解析识别,依据识别的结果对照映射关系和转换规则进行转换,将转换后的内容数据添加到该描述类数据模块中;

步骤3.2.2、WORD文档指针下移,重复执行步骤3.2.1,直到指针到WORD文档尾;

步骤3.2.3、关闭WORD文档,并保存在该描述类数据模块文件。

本发明的有益效果在于:

本发明通过解析WORD文档,分析WORD文档和S1000D标准描述类数据模块之间的关系,建立WORD文档识别出的需要关注的元素与S1000D标准数据模块描述信息元素之间的映射关系,将WORD文档中需要关注的元素及内容自动映射到S1000D标准描述类数据模块中,从而自动生成符合S1000D标准描述类数据信息,用户通过本发明所述方法可以非常准确、方便、快捷地将WORD文档自动生成符合S1000D标准描述类数据模块信息文件,从而提高了IETM数据内容编辑与制作的效率,降低了IETM数据内容编辑与制作的复杂度。同时,由于本发明是对WORD文档全文解析,所以仅用于对WORD文档全文解析自动生成符合S1000D标准描述类数据模块,不包括对其他类如程序类或故障类的自动生成。

附图说明

图1是本发明所述将WORD文档生成符合S1000D标准描述类数据模块的方法的流程图。

具体实施方式

下面结合附图对本发明作进一步说明:

如图1所示,本发明所述将WORD文档生成符合S1000D标准描述类数据模块的方法,包括以下步骤:

步骤1、确定WS规则元素,所述WS规则是基于WORD文档识别出需要关注的元素和S1000D描述类数据模块之间的映射规则。

本步骤具体包括以下步骤:

步骤1.1、解析通用WORD文档结构;

步骤1.2、识别出WORD文档结构中需要关注的元素;所述WORD文档结构中需要关注的元素包括但不限于各级标题元素、表格元素、图元素、正文元素、段元素、字母编号元素和数字编号元素;

步骤1.3、将WORD文档结构中需要关注的元素确定为WS规则元素。

步骤2、建立WS规则映射关系和转换规则,所述WS规则映射关系即确定的WS规则元素和符合S1000D标准描述数据模块信息元素之间的映射关系;所述转换规则即规则元素如何依据规则元素类型以及规则元素之间的组织结构、映射关系进行转换的规则;所述映射关系包括但不限于各级标题元素与S1000D标准定义的标题元素的映射关系、表格元素与S1000D标准定义的表格元素的映射关系、图元素与S1000D标准定义的图元素的映射关系、正文元素与S1000D标准定义的正文元素的映射关系、段元素与S1000D标准定义的段元素的映射关系、字母编号元素与S1000D标准定义的字母编号元素的映射关系以及数字编号元素与S1000D标准定义的数字字母编号元素的映射关系;所述转换规则包括标题元素转换规则、表格元素转换规则、图元素转换规则、正文元素转换规则、段元素转换规则、字母编号元素转换规则和数字编号元素转换规则。

本步骤中,建立各种映射关系的具体方法是:

建立各级标题元素与S1000D标准定义的标题元素的映射关系为:

<levelledPara>

<title>标题名称</title>

</levelledPara>;

建立表格元素与S1000D标准定义的表格元素的映射关系为:

<table>表</table>;

建立图元素与S1000D标准定义的图元素的映射关系为:

<figure>图</figure>;

建立正文元素与S1000D标准定义的正文元素的映射关系为:

<para>正文内容</para>;

建立段元素与S1000D标准定义的段元素的映射关系为:

<para>段内容</para>;

建立字母编号元素与S1000D标准定义的字母编号元素的映射关系为:

<listItem>数字值及内容</listItem>,

其中:字母编号值要转换为数字值;

建立数字编号元素与S1000D标准定义的数字字母编号元素的映射关系为:

<listItem>数据值及内容</listItem>。

上述各映射关系汇总如下表所示:

WS规则映射表

步骤3、对需转换的WORD文档进行解析识别,对识别出的元素及内容按WS规则映射关系和转换规则进行转换,自动生成符合S1000D标准描述类数据模块文件。

本步骤包括以下步骤:

步骤3.1、获取需转换的WORD文档素材;具体方法是:打开需转换的WORD文档素材,获取DOCUMENT对象,将指针定位在WORD文档开始位置;

步骤3.2、对该WORD文档素材进行解析,循环遍历该WORD文档素材把识别的元素及内容按照映射关系和转换规则自动转换生成符合S1000D标准描述类数据模块文件。

步骤3.2包括以下具体步骤:

步骤3.2.1、获取一个WORD文档元素对象进行解析识别,依据识别的结果对照映射关系和转换规则进行转换,将转换后的内容数据添加到该描述类数据模块中;

步骤3.2.2、WORD文档指针下移,重复执行步骤3.2.1,直到指针到WORD文档尾;

步骤3.2.3、关闭WORD文档,并保存在该描述类数据模块文件。

上述实施例只是本发明的较佳实施例,并不是对本发明技术方案的限制,只要是不经过创造性劳动即可在上述实施例的基础上实现的技术方案,均应视为落入本发明专利的权利保护范围内。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种自动化分类器的构造方法以及从软件开发文本类制品中识别决策的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!