一种专利申请文本的自动撰写方法和装置

文档序号:1043315 发布日期:2020-10-09 浏览:6次 >En<

阅读说明:本技术 一种专利申请文本的自动撰写方法和装置 (Automatic patent application text writing method and device ) 是由 刘恺 张灏 周适 于 2020-05-18 设计创作,主要内容包括:本发明公开了一种专利申请文本的自动撰写方法和装置。所述方法包括:根据输入信息生成技术交底文本,技术交底文本的技术说明部分包括层级结构的标题体系;针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书;根据技术说明部分或权利要求书生成专利申请文本的说明书。能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,同时提高了专利申请文本的撰写效率和质量。(The invention discloses an automatic writing method and device of a patent application text. The method comprises the following steps: generating a technical background text according to the input information, wherein a technical description part of the technical background text comprises a title system of a hierarchical structure; aiming at the title in the technical description part, extracting the title and the next-level title of the title from the technical description part, and combining the title and the next-level title to generate a first claim text corresponding to the title; combining the first claim texts to generate claims of the patent application texts according to the hierarchical relation of the titles in the technical specification part; the specification of the patent application text is generated from the technical description part or the claims. The technical filing information can be generated according to the input technical filing information, the patent application text is automatically written according to the technical filing information, manpower is saved, and the writing efficiency and quality of the patent application text are improved.)

一种专利申请文本的自动撰写方法和装置

技术领域

本发明涉及信息智能处理技术领域,特别涉及一种专利申请文本的自动撰写方法和装置。

背景技术

随着技术创新的飞速发展,专利申请量也在逐步增加,但目前专利申请文本主要依赖于申请人或专利代理师的人工撰写,专利代理师的数量与市场需求之间的差距较大,导致专利代理师的工作量较大,而专利申请文本的撰写,比较耗时耗精力。

同时,专利申请人自己撰写专利申请文本时,往往不能很好的掌握撰写思路,不能很好的完成专利申请文本的撰写。所以迫切需要能够基于技术交底内容智能生成专利申请文本,来提高专利申请文本的撰写效率和质量。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种专利申请文本的自动撰写方法和装置。

第一方面,本发明实施例提供一种专利申请文本的自动撰写方法,包括:

根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;

针对所述技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;

根据所述技术说明部分中标题的层级关系,将所述第一权利要求文本组合生成专利申请文本的权利要求书;

根据所述技术说明部分或所述权利要求书生成所述专利申请文本的说明书。

在一些可选的实施例中,所述将所述第一权利要求文本组合生成专利申请文本的权利要求书,还包括:

从所述技术说明部分中获取标题的至少一段具有预设特征的描述文本,将所述描述文本输入预先训练的第一文本生成模型,得到第二权利要求文本;

确定所述第二权利要求文本,引用所述描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将所述第二权利要求文本添加到所述权利要求书中的对应位置。

在一些可选的实施例中,所述从所述技术说明部分中获取标题的至少一段具有预设特征的描述文本,具体包括:

将所述技术说明部分中标题的每段描述文本在预设数据库中进行检索,确定所述描述文本与所述数据库的相似度;

根据所述相似度确定至少一段具有预设特征的描述文本。

在一些可选的实施例中,所述第一文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述文本和与所述该描述文本对应的权利要求文本。

在一些可选的实施例中,所述根据所述技术说明部分或所述权利要求书生成所述专利申请文本的说明书,具体包括:

按预设规则将所述技术说明部分或所述权利要求书分解成至少一个描述单元;

将各所述描述单元输入预先训练的第二文本生成模型,得到所述描述单元对应的实施例文本段;

将所述实施例文本段组合生成所述专利申请文本的说明书的实施例文本。

在一些可选的实施例中,所述第二文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述单元和与该描述单元对应的实施例文本段。

在一些可选的实施例中,所述根据输入信息生成技术交底文本,具体包括:

根据用户输入技术说明栏中的信息,生成所述技术交底文本的技术说明部分;对应的,根据输入信息生成技术交底文本,还包括执行至少下述一项:

根据用户输入概要栏的标题子栏中的信息,生成所述技术交底文本的摘要部分;

根据用户输入概要栏的技术领域子栏中的信息,生成所述技术交底文本的技术领域部分;

根据用户输入概要栏的背景技术子栏中的信息,生成所述技术交底文本的背景技术部分;

根据用户输入摘要栏中的信息,生成所述技术交底文本的摘要部分;

根据用户输入附图栏中的信息,生成所述技术交底文本的附图部分。

在一些可选的实施例中,所述根据用户输入技术说明栏中的信息,生成所述技术交底文本的技术说明部分,具体包括:

当接收到用户在技术说明栏中勾选方法选项时,向用户展示包括步骤子栏的技术说明栏,所述步骤子栏用于输入包括步骤的标题和每个标题的具体说明,根据输入所述标题子栏的信息生成所述技术交底文本中层级结构的技术说明部分;

当接收到用户在技术说明栏中勾选产品选项时,向用户展示包括部件子栏的技术说明栏,所述部件子栏用于输入部件的名称及每个部件的功能作用和工作原理,根据输入所述部件名称子栏的信息生成层所述技术交底文本中层级结构的技术说明部分。

在一些可选的实施例中,所述方法还包括:

确定所述技术说明部分中的至少一个可能具备创新性的段落文本;

对至少一个所述可能具备创新性的段落文本中包含的语句进行聚类分析,得到至少一个中心语句;

以所述中心语句为检索对象在预先建立的检索数据库中进行检索,确定检索到的相似语句与所述中心语句的相似度值;

将所述相似度值与预设的相似度阈值进行比较,根据比较结果评估所述技术交底文本中的可能具备创新性的段落文本的创新性。

第二方面,本发明实施例提供一种专利申请文本的自动撰写装置,包括:

第一生成模块,用于根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;

第二生成模块,用于针对所述第一生成模块生成的技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;

第三生成模块,用于根据所述技术说明部分中标题的层级关系,将所述第二生成模块生成的第一权利要求文本组合生成专利申请文本的权利要求书;

第四生成模块,用于根据所述第一生成模块生成的技术说明部分或第三生成模块生成的所述权利要求书生成所述专利申请文本的说明书。

第三方面,本发明实施例提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述专利申请文本的自动撰写方法。

第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机指令,当该指令被处理器执行时实现上专利申请文本的自动撰写方法。

本发明实施例提供的上述技术方案的有益效果至少包括:

本发明实施例提供的专利申请文本的自动撰写方法,包括:根据输入信息生成技术交底文本,技术交底文本的技术说明部分包括层级结构的标题体系;针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书;根据技术说明部分或权利要求书生成专利申请文本的说明书。能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,提高了专利申请文本的撰写效率和质量,同时避免了专利申请文本的形式问题。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例一中专利申请文本的自动撰写方法的流程图;

图2为本发明实施例二中专利申请文本的自动撰写方法的具体实现流程图;

图3为本发明实施例三中专利申请文本的权利要求书生成方法的流程图;

图4为本发明实施例四中专利申请文本的权利要求书生成方法的另一流程图;

图5为本发明实施例五中专利申请文本的说明书实施例文本生成方法的流程图;

图6为本发明实施例专利申请文本的自动撰写装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

为了解决现有技术中存在的申请人或代理人人工撰写专利申请文本费时费力的问题,本发明实施例提供一种专利申请文本的自动撰写方法和装置,能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,同时提高了专利申请文本的撰写效率和质量。

实施例一

本发明实施例一提供一种专利申请文本的自动撰写方法,参照图1所示,包括如下步骤:

步骤S11:根据输入信息生成技术交底文本。

具体的,技术交底文本的技术说明部分包括层级结构的标题体系。

在一个实施例中,可以包括:

1、根据用户输入技术说明栏中的信息,生成技术交底文本的技术说明部分。

具体的,可以是通过导航栏获取输入的结构化的技术交底信息,参照表1 所示,导航栏又可以分为:概要栏、详细说明栏、摘要栏和附图栏。

表1导航栏明细表

Figure BDA0002497049630000061

其中,详细说明栏供用户填写技术交底的详细内容,在一个实施例中,可以包括,当接收到用户在技术说明栏中勾选方法选项时,向用户展示包括步骤子栏的技术说明栏,步骤子栏用于输入包括步骤的标题和每个标题的具体说明,根据输入步骤子栏的信息生成技术交底文本中层级结构的技术说明部分;当接收到用户在技术说明栏中勾选产品选项时,向用户展示包括部件子栏的技术说明栏,部件子栏用于输入部件的名称及每个部件的功能作用和工作原理,根据输入部件子栏的信息生成技术交底文本中层级结构的技术说明部分。

具体的,用户可以在步骤子栏中只输入步骤的标题;可选的,还可以输入步骤标题的基础上输入步骤标题的具体说明,和/或,子步骤的标题及子步骤的具体说明。根据输入步骤子栏的信息生成技术交底文本中层级结构的技术说明部分,技术说明部分中标题(包括步骤和子步骤的标题)的描述文本是根据输入的标题的具体说明生成的。

用户可以在部件子栏中只输入部件的名称;可选的,还可以输入部件名称的基础上输入部件的具体说明,和/或,子部件的名称及子部件的具体说明。根据输入部件子栏的信息生成技术交底文本中层级结构的技术说明部分,技术说明部分中标题(包括部件和子部件的名称)的描述文本是根据输入的部件的具体说明生成的。

2、根据用户输入概要栏的标题子栏中的信息,生成技术交底文本的标题部分。

导航栏中的概要栏包括标题子栏、技术领域子栏和背景技术子栏。其中,标题子栏用于根据发明内容填写一个合适的标题。

3、根据用户输入概要栏的技术领域子栏中的信息,生成技术交底文本的技术领域部分。

技术领域子栏用于根据发明所应用的背景填写所处的技术领域。

4、根据用户输入概要栏的背景技术子栏中的信息,生成技术交底文本的背景技术部分。

背景技术子栏用于填写总结的在本申请之前的技术发明的成果和技术发展情况,即相关技术背景;还可以包括与本发明相关的现有技术和现有技术的缺点(主要指本申请解决了的技术问题),等。

5、根据用户输入摘要栏中的信息,生成技术交底文本的摘要部分。

摘要栏用于填写总结的发明要解决的技术问题,以及解决该技术问题的技术方案等。

6、根据用户输入附图栏中的信息,生成技术交底文本的附图部分。

具体的,上述第1项技术说明栏中的信息,是必须填写的,其他信息视具体情况,可以填写或不填写。

步骤S12:针对技术说明部分中的标题,从技术说明部分中抽取标题及标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。

技术交底文本为方法类时,由步骤S11得到的技术交底文本的技术说明部分的标题是根据输入的每一步骤或子步骤的标题生成的,子步骤可以是步骤的子步骤,也可以是任一层级的子步骤的下一层级步骤,为了描述方便,将步骤或子步骤统称为步骤,将得到的层级结构的标题统称为标题;标题的描述文本是根据输入的步骤的具体说明生成的。

技术交底文本为产品类时,由步骤S11得到的技术交底文本的技术说明部分的标题是根据输入的每一部件或子部件的名称生成的,子部件可以是部件的子部件,也可以是任一层级的子部件的下一层级部件,为了描述方便,将部件或子部件统称为部件,将得到的层级结构的标题统称为标题;标题的描述文本是根据输入的部件的功能作用和工作原理生成的。

步骤S13:根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书。

按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成专利申请文本的权利要求书。

具体权利要求书的生成方法,后续实施例中详细介绍。

步骤S14:根据技术说明部分或权利要求书生成专利申请文本的说明书。

在一个实施例中,可以包括,按预设规则将技术说明部分或权利要求书分解成至少一个描述单元;将各描述单元输入预先训练的第二文本生成模型,得到描述单元对应的实施例文本段;将实施例文本段组合生成专利申请文本的说明书的实施例文本。

第二文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和 /或序列到序列Seq2Seq模型训练得到的,数据对包括描述单元和与该描述单元对应的实施例文本段。

实施例文本的生成,可以是直接利用技术说明部分生成;也可以是先生成权利要求书,再根据权利要求书生成实施例文本。具体区别在于使用的第二文本生成模型是根据不同的样本数据训练得到的,样本数据的每一数据对包括描述单元和与该描述单元对应的实施例文本段,但前者描述单元是技术语言,后者的描述单元是符合专利审查指南的权利要求语言;可选的,也可以是描述单元既包括技术语言的描述文本段,有包括符合专利审查指南的权利要求语言的描述文本段。

具体说明书的实施例文本的生成方法,后续实施例中详细介绍。

本发明实施例一提供的专利申请文本的自动撰写方法,包括:根据输入信息生成技术交底文本,技术交底文本的技术说明部分包括层级结构的标题体系;针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书;根据技术说明部分或权利要求书生成专利申请文本的说明书。能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,提高了专利申请文本的撰写效率和质量,同时避免了专利申请文本的形式问题。

实施例二

本发明实施例二提供一种专利申请文本的自动撰写方法的具体实现,参照图2所示,包括如下步骤:

步骤S21:通过导航栏获取结构化的技术交底信息。

具体的,可以是通过导航栏获取输入的结构化的技术交底信息,导航栏可以包括概要栏、详细说明栏、摘要栏和附图栏,其中概要栏包括标题子栏、技术领域子栏和背景技术子栏。

详细说明栏的填写首先选择是方法类或产品类,两者从逻辑结构上没有差别,差别在于里面内容的分块上。例如:

1、方法类。

可填写整体方法的具体说明和优势,基本填写单元是步骤或子步骤,填写的内容是“具体说明”,具体说明是对步骤或子步骤内容的具体说明。

可根据发明内容的实际情况,为一级步骤添加同级步骤,同级步骤的数量没有限制。如一级步骤中存在子步骤,可为一级步骤添加子步骤,每按一次添加子步骤就会按顺序排列添加子步骤,或在子步骤中点击“添加同级步骤”同样生成一个顺序的子步骤,两种操作的结果等效。

2、产品类。

可填写产品整体的工作原理和性能优势,基本填写单元是部件或子部件,填写的内容是“功能作用”、“工作原理”和“其它”;“功能作用”主要是描述部件或子部件在整个产品或其父模块中所起的作用;“工作原理”主要是描述部件或子部件如何进行工作,内部运行的机制是什么;不属于“功能作用”或“工作原理”的内容可以填写在“其它”中。

可根据发明内容的实际情况,为一级部件添加同级部件,同级部件的数量没有限制。如一级部件中存在子部件,可为一级部件添加子部件,每按一次添加子部件就会按顺序排列添加子部件,或在子部件中点击“添加同级部件”同样生成一个顺序的子部件,两种操作的结果等效。

填写完一个步骤或子步骤、部件或子部件,按保存按钮保存填写内容,填写的内容自动进行收缩,有利于保持页面清晰的逻辑。如想对已填写的内容继续进行编辑,可点击收放按钮,将内容展开,对填写内容进行编辑。

已保存的步骤或子步骤、部件或子部件能够进行拖动,调整其顺序,调整完顺序后,将自动根据已调整的顺序重新进行编号。

已保存的子步骤、子部件可进行整块内容的删除。

已保存的步骤或部件如存在子步骤、子部件,需要将子步骤、子部件删除后,再进行删除操作。

如在填写的过程中不知道如何撰写,可点击“看看其他人怎么写”按钮,会弹出相应的样例,供用户(申请人)参考。

填写完“产品类”或“方法类”后,还可以继续添加另外一个类,或者直接到下一步。例如:添加完“产品类”后再添加一个“方法类”,或添加完“方法类”后再添加一个“产品类”。

为了能够有效的获取输入的内容,方便生成技术交底文本,用户可以在每次输入完一个完整的意思表达后,按“回车键”进行分段撰写,生成技术交底文本时根据回车键来划分文本单元。

生成的技术交底文本中包括根据详细说明栏中的输入信息生成的技术说明部分。

步骤S22:技术说明部分的查重。

在一个实施例中,可以包括,确定技术说明部分中的至少一个可能具备创新性的段落文本;对至少一个可能具备创新性的段落文本中包含的语句进行聚类分析,得到至少一个中心语句;以中心语句为检索对象在预先建立的检索数据库中进行检索,确定检索到的相似语句与中心语句的相似度值;将相似度值与预设的相似度阈值进行比较,根据比较结果评估技术说明部分中的可能具备创新性的段落文本的创新性。

展示检索数据库中与中心语句的相似度值高于相似度阈值的相似文本,可以提供可能影响本申请创造性的现有技术文本,供申请人参考是否需要修改技术交底信息,或如何修改技术交底信息。

步骤S23:根据技术交底信息生成技术交底文本。

步骤S24:根据技术交底文本生成专利申请文本。

1、根据技术交底文本生成专利申请文本的标题。

当获取到的技术交底信息中包括标题时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的标题作为专利申请文本的标题;也可以是根据从技术交底文本中抽取的标题和技术说明部分生成专利申请文本的标题。

当获取到的技术交底信息中不包括标题时,可以根据技术说明部分生成专利申请文本的标题。

2、根据技术交底文本生成专利申请文本的技术领域。

当获取到的技术交底信息中包括技术领域时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的技术领域作为专利申请文本的技术领域;也可以是根据从技术交底文本中抽取的技术领域和技术说明部分生成专利申请文本的技术领域。

当获取到的技术交底信息中不包括技术领域时,可以根据技术说明部分生成专利申请文本的技术领域。例如,抽取技术说明部分的层级标题,根据层级标题生成文本段,根据文本段在预先建立的数据库中检索,根据检索到的技术领域生成专利申请文本的技术领域。

3、根据技术交底文本生成专利申请文本的背景技术。

当获取到的技术交底信息中包括背景技术时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的背景技术作为专利申请文本的背景技术;也可以是根据从技术交底文本中抽取的背景技术和技术说明部分生成专利申请文本的背景技术。

当获取到的技术交底信息中不包括背景技术时,可以根据技术说明部分生成专利申请文本的背景技术。例如,抽取技术说明部分的层级标题,根据层级标题生成文本段,根据文本段在预先建立的数据库中检索,根据检索到的背景技术生成专利申请文本的背景技术。

4、根据技术交底文本生成专利申请文本的权利要求书。

可以包括,针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书。

在一个实施例中,还可以包括,从技术说明部分中获取标题的至少一段具有预设特征的描述文本,将描述文本输入预先训练的第一文本生成模型,得到第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。

从技术说明部分中获取标题的至少一段具有预设特征的描述文本,可以包括:将技术说明部分中标题的每段描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;根据相似度确定至少一段具有预设特征的描述文本。

具体的,第一文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述文本和与该描述文本对应的权利要求文本。

具体权利要求书的生成方法后续实施例中详细介绍。

5、根据技术交底文本生成专利申请文本的实施例文本。

具体实施例文本的生成方法后续实施例中详细介绍。

6、根据技术交底文本生成专利申请文本的摘要。

当获取到的技术交底信息中包括摘要时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的摘要作为专利申请文本的摘要;也可以是根据从技术交底文本中抽取的摘要和技术说明部分生成专利申请文本的摘要。

当获取到的技术交底信息中不包括摘要时,可以根据技术说明部分生成专利申请文本的摘要。例如,根据技术说明部分,概括出每块内容的概述信息,组成摘要。

7、根据技术交底文本生成专利申请文本的说明书附图。

具体的,附图可以是从技术交底文本中直接获取的;也可以是步骤S22技术说明部分的查重过程中,从相似文档中获取的;也可以是按照预设的模板和实施例文本中的步骤说明生成的,可以是根据实施例文本中每个步骤的标题,调用visio或其他的软件,按照预设的模板生成对应的流程图,例如,根据本实施例二中专利申请文本的自动撰写方法的具体实现的各个步骤,可以自动生成如附图2所示的附图。

后续实施例三到实施例五,分别介绍专利申请文本的权利要求书和说明书实施例文本的生成方法,都是根据技术交底文本的技术说明部分生成的,为了便于描述,将技术说明部分称为技术交底文本。

实施例三

本发明实施例三提供一种专利申请文本的权利要求书生成方法,参照图3 所示,包括如下步骤:

步骤S31:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题。

具体的,针对技术交底文本中的每个标题,确定是否有下一层级的标题,若是,从技术交底文本中抽取标题及标题的下一层级标题。

获取到的技术交底文本包含多层级标题,其最高层级的标题是发明名称或发明名称;可选的,若获取到的技术交底文本的最高层级的标题不是发明名称或发明名称,可以先对技术交底文本进行预处理:抽取所有最高层级的标题,确定能够概括抽取的标题的名称,将概括出的名称作为最高层级添加到技术交底文本中。

具体的,确定能够概括抽取的标题的名称,可以是抽取标题中的关键词,将抽取到的关键词按预设模板组合成名称。

上述技术交底文本的格式可以是非结构化的,每个标题带有标签,用于标明标题间的层级关系,故可以根据标题的标签确定标签的下一层级标签,从技术交底文本中抽取该标题,抽取下一层级标签所属标题作为该标题的下一层级标题。可选的,上述技术交底文本的格式也可以是树形结构的,从树状结构的技术交底文本中抽取标题及该标题的下一层级标题。

步骤S32:将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。

在一个实施例中,可以包括,根据技术交底文本的类型确定匹配的权利要求生成模板;将标题及下一层级标题,按照模板组合生成与标题对应的一项第一权利要求文本。

技术交底文本的类型可以是发明或发明,发明又可以分为方法类和产品类,不同的类型对应的权利要求文本的生成模板也不同。以发明中的方法类为例,权利要求生成模板可以是“1、一种……方法,其特征在于,包括下述步骤:……”,用于根据最高层级的标题和下一层级的标题,生成最高层级的标题对应的第一权利要求文本(最终生成权利要求书中的独立权利要求文本)。也可以是“x、如权利要求x所述的方法,其特征在于,所述……,具体包括:……” (模板中的“……”是生成权利要求文本时需要补充的内容,“x”是生成权利要求文本时需要替换的内容),用于生成非最高层级的标题对应的第一权利要求文本(最终生成权利要求书中的从属权利要求文本),以非最高层级的标题为标题A为例,模板中的第一个省略号处可以补充为标题A对应的文本,第二个省略号处可以补充为标题A的下一层级标题对应的文本;将模板中的第二个x替换为标题A的上一层级标题对应的权利要求文本的序号;第一个x为生成的权利要求文本的序号,在步骤S34中生成权利要求书时将x进行替换。

步骤S33:按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系。

例如标题A的下一层级的标题是标题B、标题C和标题D,标题B的下一层级的标题是标题E和标题F;根据标题A、标题B、标题C和标题D组合生成的第一权利要求文本为标题A对应的第一权利要求文本A;根据标题B、标题E和标题F组合生成的第一权利要求文本为标题B对应的第一权利要求文本B;根据标题A和标题B的层级关系确定第一权利要求文本A和第一权利要求文本B之间的引用关系,因为标题A是标题B的上一层级的标题,所以确定第一权利要求文本A被第一权利要求文本B引用。

步骤S34:根据第一权利要求文本和引用关系生成权利要求书。

根据引用关系确定第一权利要求文本的序号,被引用的第一权利要求文本排在引用他的第一权利要求的前面,将确定的第一权利要求文本的序号替换对应的第一权利要求文本中的第一个x,将第一权利要求文本排列生成权利要求书。

在一个实施例中,从技术交底文本中,确定标题的至少一段具有预设特征的描述文本,将描述文本输入预先训练的文本生成模型,得到第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。

技术交底文本包括多层级的标题外,至少一个标题还可以具有至少一段描述文本,用于详细描述该标题。故,以标题A为例,生成一个标题A对应的第一专利申请文本A后,若确定标题A的至少一段描述文本具有预设特征,则针对每段具有预设特征的描述文本,以描述文本B为例,利用描述文本和预先训练的文本生成模型,生成第二权利要求文本B。可选的,也可以在生成所有的第一权利要求文本后,再生成第二权利要求文本。具体第二权利要求文本的生成方法,后续实施例二中详细介绍。

上述确定的具有预设特征的描述文本,可以是技术交底文本中预先标记好的描述文本。也可以是将技术交底文本中标题的每段描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;根据相似度确定至少一段具有预设特征的描述文本,例如,将相似度低于设定阈值的描述文本确定为具有预设特征的描述文本。

具体的,上述预设特征可以是具有一定的创造性,申请人在输入技术交底的相关内容时将自己认为的具有创造性的描述文本进行勾选,在根据申请人输入的技术交底内容生成技术交底文本的过程中,根据申请人的选择将描述文本进行标记。判断描述文本是否具有预设特征可以直接根据描述文本有无对应的标注来判断。

可选的,获取到的技术交底文本也可以是没有上述标注,判断描述文本是否具有预设特征,可以包括,将描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;若确定的相似度小于预先设定的阈值,则确定描述文本具有预设特征。

可选的,也可以是先根据是否有标注确定描述文本是否具有预设特征,对于没有标注的描述文本,再根据相似度检索确定是否具有预设特征。

描述文本是否具有预设特征的判断方法,本实施例不做具体限定。

在一个实施例中,还可以包括,利用选定的分词模型将第一权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第一权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词,或为该第一权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词。该步骤可以在生成每一个第一权利要求文本后执行,也可以在生成所有的第一权利要求文本后再执行,也可以在生成所有的第一权利要求文本和第二权利要求文本后执行。和/或,

利用选定的分词模型将第二权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第二权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词,或为该第二权利要求文本中的该词标注知识库中与该词匹配的上一层级的词。该步骤可以在生成每一个第二权利要求文本后都执行,也可以在生成所有的第二权利要求文本后再执行。

上述替换使得生成的第一或第二权利要求文本的保护范围变大;若没有替换,只是在对应的词的预设位置进行标注,可以方便专利申请文本的撰写人员根据标注的词来确定选用哪个词更为合理,省去了撰写人员自己查询的麻烦,或避免了撰写人员忘记上位撰写(将对应的词替换为层级更高的词)以争取更大的保护范围。

实施例四

本发明实施例四提供一种专利申请文本的权利要求书生成方法的具体实现,其流程如图4所示,包括如下步骤:

步骤S401:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题。

步骤S402:将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。

步骤S403:按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系。

针对技术交底文本中的每个标题的每段描述文本,执行步骤S404-步骤 S410。

步骤S404:判断描述文本是否标注有具有预设特征。

具体的,上述技术交底文本可以是预先根据用户的选择对描述文本进行了标注,例如用户判断哪段描述文本具有创造性,便会在描述文本对应的是否具有创造性处勾选,故根据用户输入的信息生成技术交底文本的过程中,可以根据用户的选择对描述文本进行是否具有创造性的标注。判断描述文本是否具有预设特征可以直接根据描述文本有无对应的标注来判断。

若判断描述文本标注有具有预设特征,执行步骤S405;否则,执行步骤 S406。

步骤S405:将描述文本在预设数据库中进行检索,得到数据库中与描述文本的相似度满足预设条件的相似文档。

步骤S405后执行步骤S409。

步骤S406:将描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度。

具体的,可以将描述文本与数据库中的文档相似度最高值确定为描述文本与数据库的相似度。

步骤S407:判断确定的相似度是否小于预设的阈值。

若是,则确定描述文本具有预设特征,执行步骤S408;若否,确定描述文本不具有预设特征。

步骤S408:得到数据库中与描述文本的相似度满足预设条件的相似文档。

步骤S409:将描述文本输入预先训练的文本生成模型,得到第二权利要求文本。

在一个实施例中,上述文本生成模型,可以是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述文本和与该描述文本对应的权利要求文本。

步骤S410:确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,得到第二权利要求文本与第一权利要求文本之间的引用关系。

步骤S411:根据第一权利要求文本、第二权利要求文本、相似文档和引用关系,生成权利要求书。

具体的,上述引用关系包括步骤S403中确定的第一权利要求文本之间的引用关系,和步骤S410中确定的第二权利要求文本与第一权利要求文本之间的引用关系。

下述为了表述方便,将第二权利要求文本与第一权利要求文本合称为权利要求文本。

可以是以标记的形式根据权利要求文本在权利要求书中的位置,将权利要求文本对应的相似文档添加到权利要求书中。

步骤S412:利用选定的分词模型将权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词。

可选的,也可以不是将权利要求文本中的词进行替换,而是为权利要求文本中的词标注知识库中与该词匹配的上一层级的词。标注的词供用户参考是否需要修改。可选的,也可以是不只标注与选定的词匹配的上一层级的词,可以同时标注知识库中与该词匹配的高层级的多个层级的词。

上述流程中的步骤没有严格的顺序关系,上述步骤顺序仅是一种示意,例如,可以生成标题对应的一项第一权利要求文本后,生成标题对应的第二权利要求文本;还可以每生成一项第一或第二权利要求文本后,就将权利要求文本中的词进行知识库匹配后的替换。

实施例五

本发明实施例五提供一种专利申请文本的说明书实施例文本生成方法,参照图5所示,包括如下步骤:

步骤S51:按预设规则将技术数据分解成至少一个描述单元。

具体的,上述技术数据可以是根据获取到的技术交底信息生成的技术交底文本,生成的技术交底文本包括多层级的标题和至少一个标题的至少一段描述文本。按预设规则将技术交底文本分解成至少一个描述单元,可以包括:将从技术交底文本中分解出的每个标题确定为一个描述单元;针对技术交底文本中标题的每段描述文本,按照预设的分隔符分解成至少一个描述单元。

具体的,技术交底文本是根据用户输入的技术交底信息生成的,例如可以预先约定用户在输入描述文本时,每输入完一个完整的意思表达后,按“回车键”进行分段撰写,故生成的技术交底文本中可以包含回车键标识,以回车键标识为分隔符将一段描述文本分解成至少一个描述单元。

可选的,也可以不直接从技术交底文本中分解描述单元,而是先根据技术交底文本自动生成权利要求书,从权利要求书中的每项权利要求文本中分解描述单元。可以是,以分号为分隔符,将权利要求文本的特征部分或附加技术特征部分分解成至少一个描述文本;也可以是,将每项权利要求文本的特征部分或附加技术特征部分整体分解为一个描述文本。

根据技术交底文本自动生成权利要求书,在一个实施例中,可以包括:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本;按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成权利要求书;从技术交底文本中,确定标题的至少一段具有预设特征的描述文本,利用描述文本和预先训练的文本生成模型,生成第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。

根据技术交底文本自动生成权利要求书的具体实现流程后续实施例中详细介绍。

上述描述单元可以为一段描述文本,也可以是至少一张图片,也可以是描述文本和描述图片的组合。

步骤S52:将各描述单元输入预先训练的文本生成模型,得到描述单元对应的实施例文本段。

在一个实施例中,文本生成模型,可以是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述单元和与该描述单元对应的实施例文本段。

在一个实施例中,数据对中的描述单元为描述文本或至少一张描述图片,或是描述文本和描述图片的组合。其中,描述文本可以是技术交底中的技术描述文本(获取的申请人单从技术角度撰写的描述文本);也可以是将技术描述文本转换成符合专利审查指南要求的权利要求文本;也可以是将技术描述文本输入第二文本生成模型得到的权利要求文本。第二文本生成模型是利用获取到的多个第二数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,第二数据对包括描述文本和与该描述文本对应的权利要求文本。

将一个描述单元输入预先训练的文本生成模型,得到该描述单元对应的实施例文本段。

步骤S53:将实施例文本段组合生成实施例文本。

在一个实施例中,根据技术数据的类型确定匹配的实施例文本生成模板;根据技术数据中描述单元的层级结构,确定描述单元对应的实施例文本段的层级结构;按照生成模板和实施例文本段的层级结构,将实施例文本段组合生成实施例文本。

可选的,将实施例文本段组合生成实施例文本,还可以包括,将实施例文本段对应的描述单元以预设形式与实施例文本段一起添加进实施例文本,可以使得专利申请文本的撰写人员在查阅或者修改自动生成的实施例文本时,清晰的了解到每段实施例文本段是根据哪个描述单元生成的。

在一个实施例中,上述方法还可以包括,将描述单元在预设数据库中进行检索,得到数据库中与描述单元的相似度满足预设条件的相似文档;根据描述单元对应的实施例文本段在实施例文本中的位置,使用标注的方式将相似文档添加进实施例文本中。

可以使得专利申请文本的撰写人员在查阅或者修改自动生成的实施例文本时,参照每段实施例文本段对应的相似文档,将实施例文本段进一步补充完善,或修改实施例文本段及对应的权利要求文本,使得申请保护的权利要求文本与现有技术不同,具有创造性。

基于本发明的发明构思,本发明实施例还提供一种专利申请文本的自动撰写装置,其结构如图6所示,包括:

第一生成模块61,用于根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;

第二生成模块62,用于针对第一生成模块61生成的技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;

第三生成模块63,用于根据所述技术说明部分中标题的层级关系,将第二生成模块62生成的第一权利要求文本组合生成专利申请文本的权利要求书;

第四生成模块64,用于根据第一生成模块61生成的技术说明部分或第三生成模块63生成的所述权利要求书生成所述专利申请文本的说明书。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

基于本发明的发明构思,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,当该指令被处理器执行时实现上述专利申请文本的自动撰写方法。

基于本发明的发明构思,本发明实施例还提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述本发明的自动撰写方法。

除非另外具体陈述,术语比如处理、计算、运算、确定、显示等等可以指一个或更多个处理或者计算系统、或类似设备的动作和/或过程,所述动作和/ 或过程将表示为处理系统的寄存器或存储器内的物理(如电子)量的数据操作和转换成为类似地表示为处理系统的存储器、寄存器或者其他此类信息存储、发射或者显示设备内的物理量的其他数据。信息和信号可以使用多种不同的技术和方法中的任何一种来表示。例如,在贯穿上面的描述中提及的数据、指令、命令、信息、信号、比特、符号和码片可以用电压、电流、电磁波、磁场或粒子、光场或粒子或者其任意组合来表示。

应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。

在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。

本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。

结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM 存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM 或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于 ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。

对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。

上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

22页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:离婚纠纷裁判文书标签提取方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!