一种基于文本风格迁移技术的文字美化方法

文档序号:226941 发布日期:2021-11-09 浏览:24次 >En<

阅读说明:本技术 一种基于文本风格迁移技术的文字美化方法 (Character beautifying method based on text style migration technology ) 是由 张楠坤 于 2021-06-30 设计创作,主要内容包括:本发明提供一种基于文本风格迁移技术的文字美化方法,包括下列步骤:S1:获取用户的第一输入文本,提取第一输入文本中的关键字,对关键字进行标签分类;S2:获取用户输入的风格要求的第二输入文本,通过语言模型判断风格要求所属的主题;S3:通过语言模型提取描述符合同一风格主题的若干语料文本,并进行排序处理;S4:根据描述主体所属标签类型,引入关联性密切的相关描述主体,并根据带有相关描述主体的语料文本,提取后作为补充描述文本;S5:输出与所述第一输入文本语义相同的第二写作风格的目标文本。本方法实现了文本写作风格的转换,有效解决了文本写作风格领域自适应问题,提高了文本写作风格转换的准确性。(The invention provides a character beautification method based on a text style migration technology, which comprises the following steps: s1: acquiring a first input text of a user, extracting keywords in the first input text, and performing label classification on the keywords; s2: acquiring a second input text of the style requirement input by the user, and judging a theme to which the style requirement belongs through a language model; s3: extracting and describing a plurality of corpus texts which accord with the same style theme through a language model, and sequencing; s4: introducing related description main bodies with close relevance according to the types of the labels to which the description main bodies belong, and extracting the language material texts with the related description main bodies to be used as supplementary description texts; s5: and outputting the target text of the second writing style with the same semantic meaning as the first input text. The method realizes the conversion of the writing style of the text, effectively solves the problem of self-adaption in the field of the writing style of the text, and improves the accuracy of the conversion of the writing style of the text.)

一种基于文本风格迁移技术的文字美化方法

技术领域

本发明涉及一种描述扩展方法,尤其是涉及一种基于文本风格迁移技术的文字美化方法。

背景技术

自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

近些年来,智能写作技术得到了极大发展,尤其是利用神经网络来进行智能写作的发展更是迅速。智能写作通常是指给定包括一个或多个关键词的关键词序列的情况下,利用神经网络生成一段与所述关键词序列有关的描述文本。例如,给定描述外貌的几个关键词,利用神经网络根据提供的词语生成一段描写外貌的文本。然而,目前使用的神经网络生成的文本的句式和风格都很固定和单一,并不能满足用户日常写作或创作的需要。

发明内容

本发明提供了一种基于文本风格迁移技术的文字美化方法,解决了文本语义在扩展时的处理问题,其技术方案如下所述:

一种基于文本风格迁移技术的文字美化方法,包括下列步骤:

S1:获取用户的第一输入文本,提取第一输入文本中的关键字,对关键字进行标签分类;

S2:获取用户输入的风格要求的第二输入文本,通过语言模型判断风格要求所属的主题;

S3:通过语言模型提取描述符合同一风格主题的若干语料文本,并进行排序处理;

S4:根据描述主体所属标签类型,引入关联性密切的相关描述主体,并根据带有相关描述主体的语料文本,提取后作为补充描述文本;

S5:输出与所述第一输入文本语义相同的第二写作风格的目标文本。

进一步的,步骤S1中,所述标签类型包括名词标签和形容词标签。

所述形容词标签从消极到积极两个方向划分为多个严重程度不同的设定形容等级,所述形容词根据其权重,分配到不同的形容等级中。

进一步的,步骤S2中,所述主题包括多种目标应用场景,每种目标应用场景中训练有语料文本。

进一步的,步骤S3中,所述语料文本设有标记,标记内容包括描述主体和标记形容等级。

步骤S3中,若干具有描述主体的语料文本,按照空间顺序或者时间顺序进行排序。

进一步的,步骤S5中,对于输出的第二写作风格的目标文本,用户进行进一步的编辑和保存,语言模型对于确定的第二写作风格的目标文本,结合第一输入文本和第二输入文本,作为训练集进行语料文本的训练。

一种基于文本风格迁移技术的文字美化系统,包括获取模块、处理模块;

所述获取模块,用于获取第一写作风格的第一输入文本,以及获取用户输入的风格要求的第二输入文本;

所述处理模块,采用预先训练风格要求的语言模型,对所述第一输入文本进行处理,得到与所述第一输入文本语义相同的第二写作风格的目标文本;

所述语言模型判断风格要求所属的主题,并根据该主题调取符合第一输入文本所在目标应用场景环境的语料文本,通过调取若干预料文本并按序排列,完成处理过程。

所述基于文本风格迁移技术的文字美化方法可以帮助用户编写华丽的描述语言,实现了文本写作风格的转换,有效解决了文本写作风格领域自适应问题,提高了文本写作风格转换的准确性。

附图说明

图1是所述基于文本风格迁移技术的文字美化方法的流程示意图。

具体实施方式

如图1所示,所述基于文本风格迁移技术的文字美化方法,包括以下步骤:

S1:获取用户的第一输入文本,提取第一输入文本中的关键字,对关键字进行标签分类;

所述标签类型包括名词标签和形容词标签,所述名词标签分为人物、动物、植物、天气、地理、历史等,所述形容词标签从消极到积极两个方向划分为多个严重程度不同的设定等级,每个等级中含有多个形容词,形容词根据其权重,分配到不同的形容等级中。举例来说,假定消极方向的等级设定有6个,那么形容词“罪孽深重”属于严重程度最高的第六等级,形容词“顽皮”属于严重程度最低的第一等级。

S2:获取用户输入的风格要求的第二输入文本,通过语言模型判断风格要求所属的主题;

所述主题包括多种目标应用场景,每种目标应用场景中训练有大量的语料文本,所述语料文本初始通过手动输入、网络内容粘贴等录入,后期经过语言模型强化训练实现。

所述语料文本设有标记,标记内容包括描述主体和标记形容等级两部分,描述主体可以通过语料文本的关键词获取,形容等级通过语言模型强化训练实现。

S3:通过语言模型提取描述符合同一风格主题的若干语料文本,并进行排序处理;

提取的若干具有描述主体的语料文本,按照空间顺序或者时间顺序进行排序。

且语料文本的形容等级符合第一输入文本形容词标签的等级,以使的内容更加丰富。

S4:根据描述主体所属标签类型,引入关联性密切的相关描述主体,并根据带有相关描述主体的语料文本,提取3~6句作为补充描述文本;

描述主体联系比较紧密的,比如星星、太阳和月亮,晴空和白云,大海和蓝天等,这样用户输入的关键字里面涉及有其中一个描述主体,但在提取该描述主体的若干语料文本后,能够补充相关描述主体的语料文本作为修饰。

同理,相关描述主体的语料文本,对应的形容等级符合第一输入文本形容词标签的等级。

S5:输出与所述第一输入文本语义相同的第二写作风格的目标文本。

对于输出的第二写作风格的目标文本,用户进行进一步的编辑和保存,语言模型对于确定的第二写作风格的目标文本,结合第一输入文本和第二输入文本,作为训练集进行语料文本的训练。

本方法通过系统实现,所述基于文本风格迁移技术的文字美化系统,包括获取模块、处理模块;

所述获取模块,用于获取第一写作风格的第一输入文本,以及获取用户输入的风格要求的第二输入文本;

所述处理模块,采用预先训练风格要求的语言模型,对所述第一输入文本进行处理,得到与所述第一输入文本语义相同的第二写作风格的目标文本,

所述语言模型判断风格要求所属的主题,并根据该主题调取符合第一输入文本所在目标应用场景环境的语料文本,通过调取若干预料文本并按序排列,完成处理过程。

所述基于文本风格迁移技术的文字美化方法,可应用在朋友圈等社交媒体上,帮助用户编写华丽的描述语言。该方法使用语言模型达到文本风格迁移的目标,用户只需要按照自己的发文风格撰写文字,并选择美化风格,该算法即可完成一段相同含义的描述文本。比如,用户照像,并输入配文“天气不错”,选择风格“凡尔赛文学”,得到美化后文本如“晚秋底澄清的天,像一望无际的平静的碧海;强烈的白光在空中跳动着,宛如海面泛起的微波;山脚下片片的高粱时时摇曳着丰满的穗头,好似波动着的红水;而衰黄了的叶片却给田野着上了凋敝的颜色”。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种注意力模型、特征提取方法及相关装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!