一种万物分类表

文档序号:1783063 发布日期:2019-12-06 浏览:13次 >En<

阅读说明:本技术 一种万物分类表 (Universal classification chart ) 是由 甘亚 冯良荣 于 2019-09-03 设计创作,主要内容包括:本发明将宇宙万物分门别类,以大类中分小类的形式形成多等级分类,并在一个统一的数值空间中对各等级分类或最底层类里面的个体赋予一个数字和/或者字符串值,从而将宇宙万物在一个统一的数值空间中赋值或命名。本发明的优点是,宇宙万物与一个统一的数值空间中的一个数字和/或者字符串值一一对应,避免了不同学科或者不同的人类语言对同一事物有不同的命名,有利于利用机器学习、人工智能、物联网等程序进行处理、识别和分类等操作。(The invention classifies universe objects into classes, forms multi-level classification in the form of large class, small class and large class, and assigns a number and/or character string value to each level classification or an individual in the bottom class in a unified numerical space, thereby assigning values or naming universe objects in a unified numerical space. The invention has the advantages that all objects in the universe correspond to one number and/or character string value in a unified numerical space one by one, thereby avoiding different disciplines or different human languages from naming the same object, and being beneficial to processing, identifying, classifying and other operations by utilizing programs such as machine learning, artificial intelligence, Internet of things and the like.)

一种万物分类表

技术领域

本发明属于分类学和系统学,涉及对宇宙万物的分类及其分类列表。

背景技术

分类学历史悠久,世间也存在各种各样的分类,分类的标准也多种多样。有名且科学的分类,如生物学的分类,将地球上存在过的动物、植物、微生物等到进行鉴定、命名和描述,把物种科学地划分到一种等级分类系统,即界、门、纲、目、科、属、种。另外比如有图书分类,学科分类,化合物分类等等。

现有的分类,一般将本学科门类里面的事物进行分类,以方便检索、归纳、分析为目的;各个学科领域的分类之间没有联系,各自为政。但是,随着计算机计算能力的提高,人工智能、机器学习近年得到巨大的发展。而人工智能和机器学习的大比重的内容就是在对事物进行识别即分类。

目前人工智能对事物进行分类,一般需要对事物(的照片)进行标注,比如“猫”、“老虎”或者“狗”。在英语里面或许标注为“cat”、“tiger”和“dog”。但是,对于相同的比如猫的图片的训练集,中文标注和英文标注,人工智能可能输出的分别是“猫”和“cat”,是两个不同的单词或者东西,是两个不同的字符串。甚至在人工智能的研究过程中,对特定几种事物的分类,可能临时的分别赋予该几种事物不同的数字,比如1、2、3等。对于这样的人工智能,既不能反应得到的是否是同一个事物,也不能反应所识别的事物中的内在联系。同时这样所得的人工智能,其可学习和应用能力的可迁移性、同理性也很差。

比如百度百科词条ImageNet所描述的世界著名的ImageNet数据库:

ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释,以指示图片中的对象;在至少一百万个图像中,还提供了边界框。ImageNet包含2万多个类别; [2]一个典型的类别,如“气球”或“草莓”,包含数百个图像。第三方图像URL的注释数据库可以直接从ImageNet免费获得;但是,实际的图像不属于ImageNet。自2010年以来,ImageNet项目每年举办一次软件比赛,即ImageNet大规模视觉识别挑战赛(ILSVRC),软件程序竞相正确分类检测物体和场景。 ImageNet挑战使用了一个“修剪”的1000个非重叠类的列表。2012年在解决ImageNet挑战方面取得了巨大的突破,被广泛认为是2010年的深度学习革命的开始。

ImageNet数据库其实就是一个分类数据库或者分类表,虽然其极大的促进了人工智能的发展,但是采用ImageNet数据库的分类值(如“气球”或“草莓”)训练人工智能,就具有如前述的弊端。

人工智能的发展,也要求将更多的范围更广的事物纳入研究和识别的范围。最终极的要求,当然是需要对宇宙万事万物进行识别和分类。不但需要对事物进行识别和分类,还需要对事物的内在联系,对事实、关系和逻辑等等进行识别和分类。因此也应当将这些内容纳入分类的范围。

但是,即使将宇宙万物进行分类,如果这个分类不是在同一个分类空间进行的,各种分类方法或分类列表之间没有联系、各自为政,如同现在多个学科内部的分类一样,不同学科内部的分类在学科之间没有联系,最终,宇宙万物在分类学里面也形成多个孤岛各自为政。

因此,需要有一个对宇宙万物的统一分类,将宇宙万物在一个统一的数值空间赋值,使得万事万物与相应的数值和/或字符串值一一对应,并且这些数值和/或字符串值处于同一个数值空间。这样的一一对应关系形成一个列表或者数据库。这样的万物分类列表或者数据库将为人工智能、机器学习、学科发展或者人类的认识能力发展提供方便性并起到巨大的促进作用。

发明内容

本发明的目的在于将宇宙万物进行分门别类,以大类中分小类的形式形成多等级的种类,并在一个统一的数值空间中对各等级种类和/或最底层种类里面的个体赋予一个数字和/或字符串值,这些事物和相应的数值和/或字符串形成对应关系,这些关系成为一个列表或者数据库,即万物分类表。这是一个系统性的构建工作及其结果。

本发明的目的是这样实现的:

一种万物分类表,其特征在于:将宇宙万物分门别类,以大类中分小类的形式形成等级种类,并在一个统一的数值空间中对各等级种类和/或最底层种类里面的个体赋予一个数字和/或字符串值;所述的万物分类表由所述的万物种类和/或个体与对应的所述的数字和/或字符串值构成。

进一步的是,对所述的多等级种类的每一个具体种类,在不考虑其所属种类或上级种类的情况下,赋予一个数值和/或字符串(下称该数值和/或字符串为种类名);将所述的某个具体种类的种类名以及其所属的各等级种类的种类名依次排列或者通过运算所得的数字和/或字符串(下称种位名)用以指代所述的具体种类在所述的万物分类表或者万物分类中的位置。

进一步的是,对处于所述的最底层分类里面的一个具体的个体,在不考虑其所属种类或上级种类的情况下,赋予一个数值和/或字符串(下称为证号名,比如公民身份证号);将所述的最底层分类里面的一个具体的个体的证号名以及其所属的各等级种类的种类名依次排列或者通过运算所得的数字和/或字符串(下称个体名)用以指代所述的个体在所述的万物分类表或者万物分类中的位置。

进一步的是,根据用于分类的一种或者多种性质和/或性状的相近程度,对程度更相近的种类,赋予大小更相近的种类名。

进一步的是,根据用于区分属于或者不属于同一个分类的个体的一种或者多种性质和/或性状的相近程度,对程度更相近的个体,赋予大小更相近的证号名。

进一步的是,所述的万物分类表中包含哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、管理学、军事学、艺术学13大学科门类所描述和/或论述的内容的分类。该万物分类表将2011年,国务院学位委员会、***颁布的《学位授予和人才培养学科目录(2011年)》的分类方法或分类标准用于分类高等级的种类。参照该13个一级学科门类之下110个二级学科的分类方法,进一步的将宇宙万物进行分类(当然也可以参照其它国家或者学科的对学科的分类方法来对宇宙万物进行分类)。完成分类后,再对每个等级的每个分类在同一个数值空间中统一赋值。

进一步的是,对于所述学科门类所描述和/或论述的内容的既有分类方法或分类表,将该分类方法或分类表中的种类重新赋予所述的万物分类表中所述的种类名、种位名、证号名和/或个体名。

与已有技术相比,本发明具有如下特点:

1)本发明的分类列表包罗宇宙万物,是宇宙万物在一个统一的数值空间里面的镜像。

2)在赋值过程中,可以留出保留字段,方便加入新发现的种类。

3) 方便在计算机数字世界中对宇宙万物进行识别、关系运算等操作。

4)由于对性质或者性状相近的种类和相近的个体赋予相近的种类名和证号名,因此它们也有相近的种位名和个体名,这样的种位名或个体名本身就具有聚类的性质,在一定程度上反应了事物之间的内在联系。甚至可以从种位名和个体名推断该物种或者个体的多种自然或者社会属性。

5)由于本发明的种位名或个体名本身就具有聚类的性质,在一定程度上反应了事物之间的内在联系,用本发明所述的种位名或个体名作为人工智能或者机器学习的目标函数或者目标值,使得人工智能的神经网络能够更加具有内在的逻辑。

6)所述的万物分类表,可以包含关系和逻辑等抽象事物的分类,比如上下左右前后的位置关系,属于、包含、相交、因果等逻辑关系,父子、母女、邻居、伴侣、同事等社会关系。

7)物联网或者5G通讯,会给事物一个IP地址,万物分类列表会给事物一个实名。就比如个人有了电话号码,许多应用还需要实名验证一样,电话号码相当于个人的IP地址,实名才代表了这个真实的个人。

具体实施方式

现结合实施例说明本发明的具体技术解决方案。以下实施例只是说明本发明的技术方案可以可靠有效的实现,但本发明的技术解决方案并不仅限于以下实施例。

实施例1

根据用于分类的一种或者多种性质和/或性状的相近程度,对该程度更相近的种类,赋予大小更相近的种类名。将宇宙万物的足够细分的分类在二进制64bit的数值空间中赋值。64bit的数值空间约有18*1018个数值,也就是最多可以将宇宙万物细分为18*1018个种类。性状相近的种类,如猫和虎,赋予相近的种类名,如34567890和34567891;各种族的人到大猩猩的各种灵长类,在1~10000范围类赋值。如此形成的万物分类表或者数据库中,种类等级数较少,等级比较扁平。其优点是,可以用较少的二进制输出位囊括宇宙万物。如此得到的万物分类表用于人工智能神经网络识别或分类时,相似的类,有相近的种类名或者种位名,比如灵长类的可能为前10位的输出有响应,猫科动物可能是另外一个区域的16个输出位有响应。

实施例2

有一个人工智能神经网络,其输出位64个二进制位,用于识别或者分类宇宙万物,其输出值与宇宙万物就形成一个一一对应的列表或者数据库,识别的过程就相当于根据该神经网络的输入检索出该输入对应的种位名或个体名的过程。其用于识别或者分类时,可以将某一个位对应于某事物是否具有某个属性或者性质或者性状。为了叙述方便,将64个二进制输出位排列成8*8的矩阵,用(x,y,1)表示该矩阵中第x列第y行的输出位输出1(0≤x, y≤7),用(x,y,0)表示该矩阵中第x列第y行的输出位输出0。比如有4足的物体,可能4足触发输出(a,b,1),包括椅子和猪;有足可能触发(c,d,1);是否动物可能使得某个位置1或者置0比如(e,f,1)。本实施例中的万物分类列表的等级也比较扁平,其64位二进制的某些位或者位的组合起作大小等级的分类的作用。

实施例3

根据《GB/T13745-2009中华人民共和国学科分类与代码国家标准》,将其中近6000个三级学科作为万物分类表中的最高等级的分类(第一级类),将每一个三级学科研究的事物种类在16位二进制数值空间即0~65535数值范围类赋值,并在各分类之间留出保留数值段。在其中的每个分类里面再进一步的分类。比如将各种生物的分类,界、门、纲、目、科、属、种中的每一个界,也在16位二进制数值空间赋值,其下的每个门也在也在16位二进制数值空间中赋值种类名,如此依次赋值,就将所有的生物分类完成。然后将各等级的种类依次排列,就得到某个比如科的种位名。对最底级的种这个分类里面,再对个体进行赋予一个数值,作为证号名。

实施例4

有一个人工智能神经网络,其输出位64个二进制位,用于识别或者对分类宇宙万物,其输出值与宇宙万物就形成一个一一对应的列表或者数据库,识别的过程就相当于根据该神经网络的输入检索出该输入对应的种位名或个体名的过程。其用于识别或者分类时,将所述的64位输出分成两个32位,其中一个32位用于对宇宙万物赋值种类名(也就是最多可以将宇宙万物分成232个种类),另外一个32位用于赋值证号名(也就是对每一个种类,最多可以区分232个个体)。用于赋值种类名的32位,可以将某一个位对应于某事物是否具有某个属性或者性质或者性状。当然也可以将赋值种类名的32位当作0~4294967295(即232-1)的数值,将其赋值给宇宙万物的细分种类(毕竟人类还没有把宇宙万物分出40多亿个种类来)作为种类名,属性相近的种类赋予相近的数值。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种微博突发事件的检测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!