一种基于计算机的字库设计方法

文档序号：1296844 发布日期：2020-08-07 浏览：7次 >En<

阅读说明：本技术 一种基于计算机的字库设计方法 (Word stock design method based on computer ) 是由伍曙光孙淑伟韩金宝陶天毅宋春雨于 2020-04-15 设计创作，主要内容包括：本发明提供一种基于计算机的字库设计方法,包括如下步骤：a.对所有汉字字型进行细化处理,得到汉字结构数据库和汉字笔画数据库；b.读取设计师的设计文件,对设计师设计好的所有字型进行细化处理,得到第一样字结构数据库和样字笔画数据库；c.应用计算机分析处理汉字结构数据库和第一样字结构数据库,得到一个训练模型；d.应用训练模型将汉字结构变换成样字结构并存储为第二样字结构数据库；e.应用计算机分析处理第二样字结构数据库、汉字笔画数据库和样字笔画数据库,得到符合设计师风格的所有汉字字型的字库。本发明解决了字库设计周期长、工作繁琐、效率低下、成本很高、不标准化等问题。(The invention provides a computer-based word stock design method, which comprises the following steps: a. thinning all Chinese character patterns to obtain a Chinese character structure database and a Chinese character stroke database; b. reading a design file of a designer, and refining all fonts designed by the designer to obtain a first font structure database and a font stroke database; c. analyzing and processing the Chinese character structure database and the first character structure database by using a computer to obtain a training model; d. applying a training model to convert the Chinese character structure into a character-like structure and storing the character-like structure as a second character-like structure database; e. and analyzing and processing the second sample character structure database, the Chinese character stroke database and the sample character stroke database by using a computer to obtain a character library of all Chinese character types according with the style of a designer. The invention solves the problems of long word stock design period, fussy work, low efficiency, high cost, non-standardization and the like.)

一种基于计算机的字库设计方法

技术领域

本发明涉及字库技术领域，更具体地涉及一种基于计算机的字库设计方法。

背景技术

中文字库设计标准：GB2312-80是1980年发布的国家标准，收集汉字6763个；GBK是1995年发布的《汉字编码扩展规范》，包含了GB2312-80的全部汉字，一共收集汉字20902字；2013年国家发布的通用汉字规范表，一共收集汉字8105个。

目前需要挨个设计每一个汉字然后转码成字库，设计一套字库需要花费半年以上，甚至一两年，传统字库设计有的甚至需要两三年。当字体设计人员在制作字型时，往往需要对每一个汉字进行设计并修正，比如单独对这个字的每一个笔画进行设计，或者对已设计好的笔画结构做适当的裁剪、变形后重新使用，然后把设计好的笔画，偏旁或部首拖动到合适的位置，如果得到的字看起来不够美观，甚至需要重新去设计笔画并重复拖动的过程。这样就会使得制作字型的整个过程变得比较麻烦，导致设计一套完整的字库需要花费大量的时间和精力。

目前常见的解决方法往往是事先设计好汉字的常用笔画结构，并规定好笔画首位和弯折处的角度等要素，后面设计的所有字型都由这些设计好的笔画结构或笔画结构的适当形变拼接而成。采用这种方法尽管在一定程度上提高了整体设计效率和美观性，但由于少不了大量的人工干预，要设计出一套完整的字库仍是一件费时费力的事情。

另外，目前也存在基于计算机来减少汉字设计工作量的尝试，但他们只是解决汉字设计过程中的某一环节，设计师前期还是需要进行大量的设计工作，且最后生成的结果还是需要设计师逐一调整、优化，设计周期长，工作繁琐、效率低下，需要设计师工作大量时间，成本很高，设计师工作量并没有减少很多。而且最终结果具有随机性，不符合字库设计的标准化需求，最终结果还需要设计师大量调整、优化。

发明内容

本发明提供了一种基于计算机的字库设计方法，解决了字库设计周期长、工作繁琐、效率低下、成本很高、不标准化等问题。

为解决上述技术问题，本发明所采用的技术方案是：一种基于计算机的字库设计方法，包括如下步骤：

步骤a.应用计算机对所有汉字字型进行细化处理，得到汉字结构数据库和汉字笔画数据库；

步骤b.应用计算机读取设计师的设计文件，对设计师设计好的所有字型进行细化处理，得到第一样字结构数据库和样字笔画数据库；

步骤c.应用计算机分析处理汉字结构数据库和第一样字结构数据库，得到一个训练模型；

步骤d.应用训练模型将汉字结构变换成样字结构并存储为第二样字结构数据库；

步骤e.应用计算机分析处理第二样字结构数据库、汉字笔画数据库和样字笔画数据库，得到符合设计师风格的所有汉字字型的字库。

较佳地，步骤a包括：

步骤a1.提取每个汉字的单像素骨架信息存储为汉字结构数据库。

较佳地，步骤a还包括：

步骤a2.提取每个汉字的笔画和笔顺信息存储为汉字笔画数据库。

较佳地，单像素骨架信息为字体的结构信息。

较佳地，设计文件包括字体设计数据文件和配置文件，字体设计数据文件存储了设计师设计的样字字型信息，配置文件存储了字库涉及的汉字范围。

较佳地，步骤b包括：

步骤b1.提取设计师设计好的字体的单像素骨架信息存储为第一样字结构数据库。

较佳地，步骤b包括：

步骤b2.提取设计师设计好的字体的笔画和笔顺信息存储为样字笔画数据库。

较佳地，步骤c中，对第一样字结构数据库里面每个单像素骨架信息对应的汉字，提取其在汉字结构数据库中对应的单像素骨架信息，分别记作样字骨架信息和标准汉字骨架信息，应用计算机分析并学习从标准汉字骨架信息变换到样字骨架信息的过程，得到一个训练模型。

较佳地，步骤d中，从汉字结构数据库里面提取出配置文件里汉字范围内的每个汉字对应的单像素骨架，把训练模型应用到提取出的单像素骨架中，得到符合设计师风格的单像素骨架，将变换后的单像素骨架信息存储为第二样字结构数据库。

较佳地，步骤e中，对配置文件里汉字范围内的每个汉字，分别从第二样字结构数据库和样字笔画数据库中提取对应的单像素骨架信息和所需要的笔画信息，按照汉字笔画数据库中定义的笔顺信息，将提取的笔画按顺序填充到提取的单像素骨架上，每一个笔画填充都由计算机控制，选出最合适的笔画信息进行填充。

优选地，步骤e包括：

步骤e1.对每个填充完笔画的字，应用计算机对汉字笔画角度、中宫、字重、视觉中心等特征进行调整。

步骤e2.应用计算机对字库整体进行字体美化处理，包括常用词组，常用句子中出现的汉字，确保字库整体风格协调统一。

步骤e3.通过交互界面将字库展示给设计师，设计师可以选择继续微调，最终得到符合设计师风格的所有汉字字型的字库。

优选地，汉字结构数据库存储标准汉字的结构信息，即每个汉字的骨架结构。

优选地，第一样字结构数据库存储设计师设计的样字的结构信息，即符合设计师风格的样字的骨架结构。

优选地，第二样字结构数据库存储经训练模型变换后的在配置文件里汉字范围内所有汉字对应的所有样字的结构信息。

优选地，汉字笔画数据库存储汉字的笔画的书写顺序，记录汉字第几笔写哪个笔画，例如字的第一笔是点。

优选地，汉字笔画数据库中对于复杂的笔画的书写顺序的存储，如横折钩等笔画需要继续拆解后存储。

优选地，样字笔画数据库存储样字每个笔画的具体形状，记录样字每一笔画的几何特征，包括保留点、横、竖、撇和捺等基本的笔画。

优选地，步骤e中，由于不同设计风格的汉字笔顺并无差别，即同一个汉字在汉字笔画数据库和样字笔画数据库中的笔顺信息均相同，在进行笔画填充时，汉字笔画数据库和样字笔画数据库中的笔顺信息即能一一对应，确保笔画填充的准确性与填充效率。

与现有技术相比，本发明具有以下有益效果：通过本发明，使得字体设计师只需要设计50到100字，由计算机自动分析并学习这些设计好的字型的风格，自动设计符合设计师字体设计风格的其他上万个字，从而大大简化了字库设计流程，大幅度减少字体设计师的工作量，数十倍的提高了字库整体设计效率。通过计算机，让字库设计变得更加简单。大幅度提高字库设计效率，节约字库设计时间。

本发明绝大部分的工作都是由计算机完成，字库设计师只需要设计50到100个风格字即可，由计算机自动生成其它需要设计的文字，让字库设计的工作变得更加高效、简单。基于机器学习，本发明在字库设计师设计的风格字体基础上，字体的设计会更加标准、规范、美观，字库设计质量将大幅度提高。

附图说明

图1为本发明一种基于计算机的字库设计方法的步骤示意图。

图2为本发明一种基于计算机的字库设计方法的原理示意图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案，但本发明的保护范围不局限于以下所述。

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

下面结合实施例对本发明作进一步的描述，所描述的实施例仅仅是本发明一部分实施例，并不是全部的实施例。基于本发明中的实施例，本领域的普通技术人员在没有做出创造性劳动前提下所获得的其他所用实施例，都属于本发明的保护范围。

请参阅图1至图2，图中所示者为本发明所选用的实施例结构，此仅供说明之用，在专利申请上并不受此种结构的限制。

实施例一

如图1所示，一种基于计算机的字库设计方法，包括如下步骤：

步骤a.应用计算机对所有汉字字型进行细化处理，得到汉字结构数据库和汉字笔画数据库；

步骤b.应用计算机读取设计师的设计文件，对设计师设计好的所有字型进行细化处理，得到第一样字结构数据库和样字笔画数据库；

步骤c.应用计算机分析处理汉字结构数据库和第一样字结构数据库，得到一个训练模型，如SVM模型或者神经网络模型；

步骤d.应用训练模型将汉字结构变换成样字结构并存储为第二样字结构数据库；

步骤e.应用计算机分析处理第二样字结构数据库、汉字笔画数据库和样字笔画数据库，得到符合设计师风格的所有汉字字型的字库。

其中，步骤a包括：

步骤a1.提取每个汉字的单像素骨架信息存储为汉字结构数据库。

步骤a2.提取每个汉字的笔画和笔顺信息存储为汉字笔画数据库。

此方案中，设计文件包括字体设计数据文件和配置文件，字体设计数据文件存储了设计师设计的样字字型信息，配置文件存储了字库涉及的汉字范围。

本实施例中，步骤b包括：

步骤b1.提取设计师设计好的字体的单像素骨架信息存储为第一样字结构数据库。

步骤b2.提取设计师设计好的字体的笔画和笔顺信息存储为样字笔画数据库。

更优地，步骤c中，对第一样字结构数据库里面每个单像素骨架信息对应的汉字，提取其在汉字结构数据库中对应的单像素骨架信息，分别记作样字骨架信息和标准汉字骨架信息，应用计算机分析并学习从标准汉字骨架信息变换到样字骨架信息的过程，得到一个训练模型。

具体地，步骤d中，从汉字结构数据库里面提取出配置文件里汉字范围内的每个汉字对应的单像素骨架，把训练模型应用到提取出的单像素骨架中，得到符合设计师风格的单像素骨架，将变换后的单像素骨架信息存储为第二样字结构数据库。

更好地，步骤e中，对配置文件里汉字范围内的每个汉字，分别从第二样字结构数据库和样字笔画数据库中提取对应的单像素骨架信息和所需要的笔画信息，按照汉字笔画数据库中定义的笔顺信息，将提取的笔画按顺序填充到提取的单像素骨架上，每一个笔画填充都由计算机控制，选出最合适的笔画信息进行填充。

此方案中，单像素骨架信息为字体的结构信息。

实施例二

步骤e包括：

步骤e1.对每个填充完笔画的字，应用计算机对汉字笔画角度、中宫、字重、视觉中心等特征进行调整。

步骤e2.应用计算机对字库整体进行字体美化处理，包括常用词组，常用句子中出现的汉字，确保字库整体风格协调统一。

步骤e3.通过交互界面将字库展示给设计师，设计师可以选择继续微调，最终得到符合设计师风格的所有汉字字型的字库。

数据库的设计如下：

汉字结构数据库存储标准汉字的结构信息，即每个汉字的骨架结构。

第一样字结构数据库存储设计师设计的样字的结构信息，即符合设计师风格的样字的骨架结构。

第二样字结构数据库存储经训练模型变换后的在配置文件里汉字范围内所有汉字对应的所有样字的结构信息。

汉字笔画数据库存储汉字的笔画的书写顺序，记录汉字第几笔写哪个笔画，例如字的第一笔是点。

汉字笔画数据库中对于复杂的笔画的书写顺序的存储，如横折钩等笔画需要继续拆解后存储。

样字笔画数据库存储样字每个笔画的具体形状，记录样字每一笔画的几何特征，包括保留点、横、竖、撇和捺等基本的笔画。

实施例三

如图2所示，本发明设计原理包括以下步骤：

1)汉字结构数据库：对所有汉字字型进行细化处理后，只提取每个汉字的单像素骨架，这些骨架只保留了标准汉字的结构信息。

2)将1)中提取到的所有骨架信息存储为汉字结构数据库，第1、2步只需操作一次，后面可以永久使用。

3)汉字笔画数据库：应用计算机对所有汉字字型，计算每个汉字的笔画和笔顺。

4)将3)中得到的笔画和笔顺信息按照每个汉字存储为汉字笔画数据库，第3、4步只需操作一次，后面可以永久使用。

5)读取设计师数据文件：读取设计师设计的字体数据文件和配置文件，配置文件定义了设计师想要通过计算机生成的汉字的范围。

6)提取骨架：对5)中设计师设计好的所有字型进行细化处理后，得到设计师设计好字体对应的单像素骨架，将这些骨架信息作为样字结构数据存储起来。

7)骨架生成：对6)中样字结构数据里面每个骨架信息指向的汉字，提取其在2)中得到的汉字结构数据库中对应的骨架信息，分别记作样字骨架信息和标准汉字骨架信息。如骨架信息是在设计师设计的“大”这个汉字字型细化的基础上得到的，那么这个骨架信息对应的汉字就是“大”字，这个骨架信息我们记作样字骨架信息，接着提取对应汉字在2)中得到的汉字结构数据库中对应的骨架信息，如对应的“大”字就提取“大”字的骨架信息，这个骨架信息我们记作标准汉字骨架信息。需要区别的是，2)中得到的汉字结构数据和6)中得到的样字结构数据存储的都是汉字的骨架，只不过2)中的骨架信息的结构特征是标准汉字提取得到的，这里我们认为它不包括设计风格，而6)中得到的骨架信息的结构特征是由设计师自由设计的，包括设计师的风格。这样做的目的即为得到同一汉字在标准风格和设计师风格下结构特征的不同表现形式，以便后面寻找两个风格之间变换的特征。6)中之所以称作样字结构“数据”而不是“数据库”，是因为6)中得到的骨架信息对应的汉字范围是5)中设计师配置文件指定的，不是全部汉字范围。

8)应用计算机分析并学习7)中得到的从标准汉字骨架信息变换到样字骨架信息的过程，得到一个训练模型。主要对设计师没有涉及过的字根据标准汉字骨架做结构方面的调整，假设设计师样字提供了“大”、“伏”、“羹”等若干个字，通过计算机分析这些字对应的7)中得到的标准汉字骨架变换到设计师样字骨架的规律，应用该规律就能够得到设计师没有设计过的“状”等字的符合设计师风格的骨架信息，这个规律就是我们需要的训练模型。

9)按照5)中设计师定义的配置文件，从2)中得到的汉字结构数据库里面提取出配置文件里对应的所有骨架，把8)中得到的训练模型应用到提取出的这些骨架中，得到符合设计师风格和配置文件范围内所有汉字的变换后骨架信息。

10)样字结构数据库：将9)中得到的所有变换后骨架信息存储为样字结构数据库，这个数据库里面只包括符合设计师风格和范围的结构信息，存储了全部汉字范围内所有符合设计师设计风格的骨架信息和结构特征，即为样字结构数据库。

11)提取笔画：对5)中设计师设计好的所有字型进行笔画拆解，得到符合设计师风格的独立笔画信息。

12)样字笔画数据库：将11)中得到的所有笔画信息按照笔画类型分类存储为样字笔画数据库，这个数据库中同一类型的笔画可能存储着多个符合要求的笔画信息。如“大”、“伏”、“羹”都有“捺”笔画，但明显三个字中“捺”笔画是完全不一样的，数据库中我们以笔画名称为主键，笔画信息为键值，那么这里对应的主键就是“捺”，键值就是这些不同的“捺”笔画信息，可能有三个甚至更多。

13)填充骨架：对于5)中配置文件里的每一个字，分别从10)中得到的样字结构数据库和12)中得到的样字笔画数据库中提取对应的骨架信息和所需要的笔画信息。如5)中定义了一个“伏”字，我们先从10)中提取出符合设计师风格的“伏”字的骨架信息，接着从12)中提取出“伏”这个字包括的每一笔画对应的全部笔画信息，如“伏”字包括“捺”笔画，那就需要把12)得到的样字数据库中以“捺”为主键的所有“捺”笔画信息都提取出来。

14)按照4)中得到的汉字笔画数据库中定义的笔顺信息，将13)中得到的笔画按顺序填充到13)中得到的骨架上，每一个笔画填充都由计算机控制，选出最合适的笔画信息进行填充。如填充“伏”字，按照“撇”、“竖”、“横”、“撇”、“捺”、“点”的笔画顺序依次填充，假设现在我们按照这个笔画顺序填充到了“捺”笔画，12)中样字笔画数据库里同时提供了“大”字拆解后的“捺”笔画和“状”字拆解后的“捺”笔画，那么根据计算机的计算和判断，最终会选择“状”字拆解的“捺”笔画作为最优解填充到10)中样子结构数据库里“伏”骨架对应的位置上。

15)字体微调：对14)中每个填充完笔画的字，应用计算机对汉字笔画角度、中宫、字重、视觉中心等特征进行调整。

16)重复13)、14)和15)，得到符合设计师风格和范围的所有汉字字型，并存储为中间字库。

17)对16)中得到的中间字库整体应用字体美化处理，包括常用词组，常用句子中出现的汉字，确保整体风格协调统一，这步由计算机自动进行。

18)通过交互界面把17)中得到的结果展示给设计师，设计师可以选择继续微调，最终得到符合设计师风格的所有汉字字型。

19)生成字库：将18)中得到的汉字字型封装成字库文件，即为符合设计师设计风格的字库，供设计师下载使用。

其中，涉及到的所有数据库：

汉字结构数据库：存储标准汉字的结构信息，即每个汉字的骨架结构。

样字结构数据库：存储设计师设计样字的结构信息，即符合设计师风格的的骨架结构。

汉字笔画数据库：存储汉字的笔画的书写顺序，记录汉字第几笔写哪个笔画，如“字”第一笔是点，对于复杂的笔画的书写顺序的存储，如横折钩等笔画需要继续拆解后存储。

样字笔画数据库：存储汉字每个笔画的具体形状，记录汉字每一笔画的几何特征，尽量只保留“点”、“横”、“竖”、“撇”、“捺”这样的基本笔画。

以上所述实施例是用以说明本发明，并非用以限制本发明，所以举例数值的变更或等效元件的置换仍应隶属本发明的范畴。

由以上详细说明，可使本领域普通技术人员明了本发明的确可达成前述目的，实已符合专利法的规定，现提出专利申请。

11页详细技术资料下载

一种基于计算机的字库设计方法

相关技术

网友询问留言