一种错别字的生成方法及终端

文档序号：1127727 发布日期：2020-10-02 浏览：14次 >En<

阅读说明：本技术 一种错别字的生成方法及终端 (Wrongly written character generation method and terminal ) 是由刘德建李上杰方振华陈宏� 郭玉湖于 2020-05-06 设计创作，主要内容包括：本发明公开一种错别字的生成方法及终端,将正确字拆分成笔划,每一笔划有对应的路径数据；根据所述正确字的各个笔划以及错别字类型生成对应的错别字；根据所述错别字类型及所述正确字与所述错别字之间的差值对应的路径数据对所述错别字进行存储；一方面基于拆分后的笔划以及错别字类型能够快速方便直观地生成对应的错别字,另一方面能够方便确定出正确字与错别字之间的差异,并根据错别字类型及所述差异对错别字进行存储,不需要将整个错别字进行存储,降低了错别字的存储空间,提高空间利用率。(The invention discloses a method and a terminal for generating wrongly written characters, which are used for splitting correct characters into strokes, wherein each stroke has corresponding path data; generating corresponding wrongly written characters according to all strokes of the correct characters and the wrongly written character types; storing the wrongly-written characters according to the wrongly-written character types and path data corresponding to the difference values between the correct characters and the wrongly-written characters; on the one hand, the corresponding wrongly-written characters can be quickly, conveniently and intuitively generated based on the split strokes and the wrongly-written character types, on the other hand, the difference between the correct characters and the wrongly-written characters can be conveniently determined, the wrongly-written characters are stored according to the wrongly-written character types and the difference, the whole wrongly-written characters do not need to be stored, the storage space of the wrongly-written characters is reduced, and the space utilization rate is improved.)

一种错别字的生成方法及终端

技术领域

本发明涉及字体处理领域，尤其涉及一种错别字的生成方法及终端。

背景技术

现实中，除了正确字外，错别字也起到一定作用。在很多应用场景中都会用到错别字，比如错别字练习题中，需要列出与正确字容易混淆的错别字以让做习题者分辨出哪一个字是正确字或错别字；或者学生在学习、做作业过程中出现错别字，需要将容易错的正确字及其对应的错别字进行保存，形成错别字集，以方便日后复习。这就涉及到错别字的生成以及存储，现有技术中，通常都是根据生成的错别字直接进行存储，当要进行正确字及其对应的错别字的调用时，再分别从存储的正确字库中和错别字库中进行调取，这样往往造成存储空间的浪费，需要占用比较大的空间来存储正确字及其对应的错别字。

发明内容

本发明所要解决的技术问题是：提供一种错别字的生成方法及终端，能够降低错别字的存储空间。

为了解决上述技术问题，本发明采用的一种技术方案为：

一种错别字的生成方法，包括步骤：

S1、将正确字拆分成笔划，每一笔划有对应的路径数据；

S2、根据所述正确字的各个笔划以及错别字类型生成对应的错别字；

S3、根据所述错别字类型及所述正确字与所述错别字之间的差值对应的路径数据对所述错别字进行存储。

为了解决上述技术问题，本发明采用的另一种技术方案为：

一种错别字的生成终端，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

S1、将正确字拆分成笔划，每一笔划有对应的路径数据；

S2、根据所述正确字的各个笔划以及错别字类型生成对应的错别字；

S3、根据所述错别字类型及所述正确字与所述错别字之间的差值对应的路径数据对所述错别字进行存储。

本发明的有益效果在于：将正确字进行笔划拆分，每一笔划有对应的路径数据，根据正确字的笔划及错别字类型生成对应的错别字，并根据错别字类型及正确字和错别字之间的差值对应的路径数据对错别字进行存储，一方面基于拆分后的笔划以及错别字类型能够快速方便直观地生成对应的错别字，另一方面能够方便确定出正确字与错别字之间的差异，并根据错别字类型及所述差异对错别字进行存储，不需要将整个错别字进行存储，降低了错别字的存储空间，提高空间利用率。

附图说明

图1为本发明实施例的一种错别字的生成方法的步骤流程图；

图2为本发明实施例的一种错别字的生成终端的结构示意图；

图3为本发明实施例的“龙”对应的路径数据集合示意图；

图4为本发明实施例的“尤”对应的路径数据集合示意图；

标号说明：

1、一种错别字的生成终端；2、存储器；3、处理器。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果，以下结合实施方式并配合附图予以说明。

请参照图1，一种错别字的生成方法，包括步骤：

S1、将正确字拆分成笔划，每一笔划有对应的路径数据；

S2、根据所述正确字的各个笔划以及错别字类型生成对应的错别字；

S3、根据所述错别字类型及所述正确字与所述错别字之间的差值对应的路径数据对所述错别字进行存储。

从上述描述可知，本发明的有益效果在于：将正确字进行笔划拆分，每一笔划有对应的路径数据，根据正确字的笔划及错别字类型生成对应的错别字，并根据错别字类型及正确字和错别字之间的差值对应的路径数据对错别字进行存储，一方面基于拆分后的笔划以及错别字类型能够快速方便直观地生成对应的错别字，另一方面能够方便确定出正确字与错别字之间的差异，并根据错别字类型及所述差异对错别字进行存储，不需要将整个错别字进行存储，降低了错别字的存储空间，提高空间利用率。

进一步的，所述错别字类型包括减少笔划；

所述S3包括：

根据所述正确字和错别字确定减少的笔划，根据所述减少的笔划确定其对应的路径数据索引；

根据所述错别字类型及所述减少的笔划对应的路径数据索引对所述错别字进行存储。

由上述描述可知，如果错别字类型是减少笔划，则进行存储时，只需要存储其对应的错别字类型是减少笔划以及减少的笔划对应路径数据索引即可，根据所存储的内容及该错别字对应的正确字即能够生成对应的错别字，相较于要存储整错别字，存储空间大大降低。

进一步的，所述错别字类型包括增加笔划；

所述S3包括：

根据所述正确字和错别字确定增加的笔划，根据所述增加的笔划确定其对应的路径数据；

根据所述错别字类型及所述增加的笔划对应的路径数据对所述错别字进行存储。

由上述描述可知，如果错别字类型是增加笔划，则进行存储时，只需要存储其对应的错别字类型是增加笔划以及增加的笔划对应的路径数据即可，根据所存储的内容及该错别字对应的正确字即能够生成对应的错别字，相较于要存储整错别字，存储空间大大降低。

进一步的，所述错别字类型包括替换笔划；

所述S3包括：

根据所述正确字和错别字确定替换的笔划，根据所述替换的笔划确定替换前的笔划对应的路径数据索引以及替换后的笔划对应的路径数据；

根据所述错别字类型、所述替换前的笔划对应的路径数据索引及所述替换后的笔划对应的路径数据对所述错别字进行存储。

由上述描述可知，如果错别字类型是替换笔划，则进行存储时，只需要存储其对应的错别字类型是替换笔划、所述替换前的笔划对应的路径数据索引以及替换的笔划对应的路径数据即可，根据所存储的内容及该错别字对应的正确字即能够生成对应的错别字，相较于要存储整错别字，存储空间大大降低。

进一步的，所述S1之前包括：

从各个终端平台收集借助所述终端平台生成的字；

通过机器学习对收集的字进行自动识别和对比，确定收集的字中每一个正确字对应的预选错别字列表；

基于笔划相似度和笔划数差异度确定每一个正确字对应的预选错别字列表中的前预设个错别字，将所述前预设个错别字作为每一个正确字对应的候选错别字列表；

对于每一个正确字及其对应的候选错别字中的每一个错别字，确定其对应的错别字类型，并依次执行S2-S3。

由上述描述可知，通过各终端平台收集生成的字，通过机器学习确定每一正确字对应的候选错别字列表，并基于笔划相似度和笔划数差异度确定候选错别字列表，基于候选错别字列表生成错别字，通过大数据分析筛选出可能性最大的错别字，保证了所生成的错别字的有用性。

请参照图2，一种错别字的生成终端，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

S1、将正确字拆分成笔划，每一笔划有对应的路径数据；

S2、根据所述正确字的各个笔划以及错别字类型生成对应的错别字；

S3、根据所述错别字类型及所述正确字与所述错别字之间的差值对应的路径数据对所述错别字进行存储。

进一步的，所述错别字类型包括减少笔划；

所述S3包括：

根据所述正确字和错别字确定减少的笔划，根据所述减少的笔划确定其对应的路径数据索引；

根据所述错别字类型及所述减少的笔划对应的路径数据索引对所述错别字进行存储。

进一步的，所述错别字类型包括增加笔划；

所述S3包括：

根据所述正确字和错别字确定增加的笔划，根据所述增加的笔划确定其对应的路径数据；

根据所述错别字类型及所述增加的笔划对应的路径数据对所述错别字进行存储。

进一步的，所述错别字类型包括替换笔划；

所述S3包括：

根据所述正确字和错别字确定替换的笔划，根据所述替换的笔划确定替换前的笔划对应的路径数据索引以及替换后的笔划对应的路径数据；

根据所述错别字类型、所述替换前的笔划对应的路径数据索引及所述替换后的笔划对应的路径数据对所述错别字进行存储。

进一步的，所述S1之前包括：

从各个终端平台收集借助所述终端平台生成的字；

通过机器学习对收集的字进行自动识别和对比，确定收集的字中每一个正确字对应的预选错别字列表；

对于每一个正确字及其对应的候选错别字中的每一个错别字，确定其对应的错别字类型，并依次执行S2-S3。

实施例一

请参照图1，一种错别字的生成方法，包括步骤：

S1、将正确字拆分成笔划，每一笔划有对应的路径数据；

其中，每个路径数据，即path数据，都存储每一笔划形成所需要的参数值，包括构成该笔划的点集中每一点的位置以及大小，每一路径数据有对应的索引，所有笔划对应的路径数据索引构成path序列索引集合，根据所述path序列索引集合即可写成对应的正确字；

如图3所示即为正确字“龙”的五个笔划对应的path路径数据，可以按顺序依次编码为索引1-5；

其中，每一path数据对应的参数值可以通过矢量来绘制，这样生成的正确字是一矢量图，支持放大缩小不变形；

S2、根据所述正确字的各个笔划以及错别字类型生成对应的错别字；

S3、根据所述错别字类型及所述正确字与所述错别字之间的差值对应的路径数据对所述错别字进行存储；

其中，错别字类型包括减少笔画、增加笔画和替换笔画，在进行错别字存储时，可以分别用不同的唯一标识来标识各个错别字类型，比如可以分别用01,10,00来标识；

若错别字类型为减少笔划；

所述S3包括：

根据所述正确字和错别字确定减少的笔划，根据所述减少的笔划确定其对应的路径数据索引；

根据所述错别字类型及所述减少的笔划对应的路径数据索引对所述错别字进行存储；

例如，对于正确字“龙”，如果错别字类型是减少笔画，对应减少的笔画是最后的那一点，该点对应的路径数据索引为5，则进行存储时，只需要存储对应的错别字类型标识01以及该减少的笔画对应的路径数据索引5，这样在生成错别字时，知道只需将路径数据索引为5的笔画删除即可，即可以根据存储的正确字“龙”的path序列索引集合，删除索引为5的路径数据，得到如图4所示的path路径数据，这样就可以据此生成对应的错别字，就不需要存储整个错别字所有笔划的路径数据，无需进行重复的冗余保存；

其实，减少的笔画数可以有多笔，比如，可以减少最后的那一点以及右下角的那一撇，存储时只需要存储减少的笔划对应的索引值即可；

若错别字类型为增加笔划；

所述S3包括：

根据所述正确字和错别字确定增加的笔划，根据所述增加的笔划确定其对应的路径数据；

根据所述错别字类型及所述增加的笔划对应的路径数据对所述错别字进行存储；

例如，对于正确字“尤”，如果增加一笔划，变成“龙”，则“龙”即为其对应的错别字，进行存储时，只需要存储对应的错别字类型标识10以及增加的那一笔划撇对应的路径数据即可；

这样，在生成“龙”时，只需要根据存储的“尤”的path数据以及新增的那一笔划撇对应的路径数据即可组合成对应的错别字“龙”；

在一个可选的实施例中，可以从正确字“龙”中确定笔划撇的路径数据索引，则进行“尤”对应的错别字“龙”的存储时，存储笔划撇的路径数据索引即可，这样在生成错别字“龙”时，将“尤”的path路径数据和根据所述路径数据索引从“龙”中调取对应的path数据，二者合并即可；

若错别字类型为替换笔划；

所述S3包括：

根据所述正确字和错别字确定替换的笔划，根据所述替换的笔划确定替换前的笔划对应的路径数据索引以及替换后的笔划对应的路径数据；

根据所述错别字类型、所述替换前的笔划对应的路径数据索引及所述替换后的笔划对应的路径数据对所述错别字进行存储；

例如，对于正确字“同”，若将其横折钩替换成横折，则就构成对应的替换笔划形成的错别字；

“同”中横折钩对应的路径数据索引值为2，则在存储时，存储替换笔划对应的标识00，替换前的笔划对应的路径数据索引值2以及替换后的笔划对应的路径数据即可，这样在生成“同”对应的错别字时，将“同”对应的路径数据集合中删除索引值为2的路径数据，将其替换为替换后的笔划对应的路径数据，这样即可生成对应的错别字。

实施例二

本实施例与实施例一的不同在于，所述S1之前包括：

从各个终端平台收集借助所述终端平台生成的字；

除了收集之外，也可以主动引入错别字进行入库；

其中，终端平台包括手写终端；

通过机器学习对收集的字进行自动识别和对比，确定收集的字中每一个正确字对应的预选错别字列表；

具体的，可以事先确定正确的字，然后将正确的字与收集的字中的每一个字进行整体外形轮廓的依次匹配，根据匹配出的相似度确定是否将其写入正确的字对应的预选错别字列表中，若相似度大于预设值，则将其写入所述预选错别字列表中；

其中，笔划相似度可以通过相同笔划个数占总的笔划个数的比值确定出来，笔划数差异度可以通过相差的笔划个数占总的笔划个数的比值确定出来；

在确定出笔划相似度和笔划数差异度之后，设置各自的权重，根据公式：笔划相似度*权重1-笔划数差异度*权重2即可算出匹配度，根据匹配度大小排序，选取前预设个错别字作为每一个正确字对应的候选错别字列表；

对于每一个正确字及其对应的候选错别字中的每一个错别字，确定其对应的错别字类型，并依次执行S2-S3；

其中，错别字与其对应的正确字可以通过各自存储的数据主键ID关联，这样在生成错别字时，可以通过与其存储的第一数据主键ID关联的第二数据主键ID来获取对应的正确字的存储数据，从而执行后续的生成操作；

生成错别字字库后，可以应用于多个应用场景，比如增加一个错别字的题型，类似错别字练习，需要练习者在给出的题目中确定哪些是错别字，找出错别字；或者可以实现错别字题集，即能够将自己容易错的字进行收集整合，放入错题本里；或者可以在手写终端中增设一个识别错别字的模块，用于确定用户输入的是否为错别字，此时新增一个自定义字库，字库中存储的是错别字，基于自定义字库中存储的错别字对用户输入的字进行识别以确定是否为错别字，得到识别结果；

因为输入的是错别字库，如果用户写的是错字，且为错别字库中的字，则识别率高，能够准确识别出定义的错别字；

如果输入的是正确的字，则不能被识别出来，相反能够给出一个和库中最相似的字和相似度。

实施例三

请参照图2，一种错别字的生成终端1，包括存储器2、处理器3及存储在存储器2上并可在处理器3上运行的计算机程序，所述处理器3执行所述计算机程序时实现实施例一或实施例二的各个步骤。

综上所述，本发明提供的一种错别字的生成方法及终端，将正确字进行笔划拆分，每一笔划有对应的路径数据，根据正确字的笔划及错别字类型生成对应的错别字，并根据错别字类型及正确字和错别字之间的差值对应的路径数据对错别字进行存储，只需存储错别字类型标识以及根据正确字和错别字差值确定的对应笔划的索引值或路径数据，大大降低了错别字存储的存储空间，一方面基于拆分后的笔划以及错别字类型能够快速方便直观地生成对应的错别字，另一方面能够方便确定出正确字与错别字之间的差异，并根据错别字类型及所述差异对错别字进行存储，不需要将整个错别字进行存储，降低了错别字的存储空间，提高空间利用率；并且可以通过AI自动收集各个终端平台采集的字，自动分析出最常见、最可能出错的错别字，作为错别字库的基础，保证了所生成的错别字字库的有用性。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等同变换，或直接或间接运用在相关的技术领域，均同理包括在本发明的专利保护范围内。

12页详细技术资料下载

一种错别字的生成方法及终端

相关技术

网友询问留言