互联网移动终端中多媒体文件进行自动分类的方法及系统
阅读说明:本技术 互联网移动终端中多媒体文件进行自动分类的方法及系统 (method and system for automatically classifying multimedia files in Internet mobile terminal ) 是由 不公告发明人 于 2019-09-01 设计创作,主要内容包括:本发明公开了一种对互联网移动终端中的多媒体文件进行自动分类的方法及系统,其中方法包括:获取多媒体文件的多个内容描述项,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词;在移动终端的存储器中创建新的存储区域;在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;将已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。(The invention discloses a method and a system for automatically classifying multimedia files in an internet mobile terminal, wherein the method comprises the following steps: acquiring a plurality of content description items of a multimedia file, and performing keyword division on each content description item in the plurality of content description items to determine a plurality of subject terms related to each content description item; creating a new storage area in a memory of the mobile terminal; after receiving an instruction for automatically classifying the multimedia files, the mobile terminal stores each acquired new multimedia file in a file cache region, records the cache starting time of each new multimedia file stored in the file cache region, and generates summary information for each new multimedia file; each of a plurality of multimedia files that have been stored in an original storage area in a memory of the mobile terminal is classified as an original multimedia file.)
技术领域
本发明涉及移动互联网领域,并且更具体地,涉及一种对移动互联网内的移动终端中的多媒体文件进行自动分类的方法及系统。
背景技术
目前,随着移动互联网的迅猛发展,越来越多的移动终端基于移动互联网进行信息交互。由于各种应用的功能越来越完善和丰富,移动终端内所存储的各种类型的多媒体文件,例如,视频、音频等,越来越多。然而,目前,在现有技术中,没有基于互联网移动互联网内的移动终端中的多媒体文件的特性进行适当分类的技术。
发明内容
根据本发明的一个方面,提供一种对互联网移动终端中的多媒体文件进行自动分类的方法,所述方法包括:
当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;
将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。
将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理包括:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值:
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件。
当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件。
当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息;
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
根据本发明的另一个方面,提供一种对互联网移动终端中的多媒体文件进行自动分类的系统,所述系统包括:
分配装置,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
创建装置,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
生成装置,在接收到对多媒体文件进行自动分类的指示之后,将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息;
分类装置,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理。
所述分类装置将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值:
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件。
还包括处理装置,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
还包括展示装置,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
附图说明
图1为本发明的对互联网移动终端中的多媒体文件进行自动分类的方法的流程图;
图2为本发明的对互联网移动终端中的多媒体文件进行自动分类的系统的结构示意图。
具体实施方式
图1为本发明的对互联网移动终端中的多媒体文件进行自动分类的方法100的流程图。如图1所示,方法100从步骤101处开始。在步骤101,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词;
多媒体文件包括视频文件、音频文件和图像文件;其中多媒体文件的多个内容描述项是由移动终端的用户所生成的,或多媒体文件的多个内容描述项是由移动终端的操作系统所生成的。每个内容描述项是由与时间、地点、内容和主题相关联的信息所构成的描述信息。所述移动终端的存储器中存储多个多媒体文件。虚拟文件夹是不需要真实地创建的文件夹;虚拟文件夹利用关联关系来为每个内容描述项提供服务;文件夹标识符能够唯一地标识虚拟文件夹。虚拟文件夹与虚拟文件夹内的多个多媒体文件存在关联关系,但是虚拟文件夹内的多个多媒体文件中的每个多媒体文件仍存储在初始位置处,而不会因为与虚拟文件夹存在关联关系而被复制或移动到虚拟文件夹内。
将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词包括:将多个内容描述项中每个内容描述项进行关键词划分,将与时间相关联的信息和与地点相关联的信息均作为主题词,将与内容相关联的信息中的所有名词作为主题词和与主题相关联的信息中的所有名词作为主题词,从而确定每个内容描述项所涉及的多个主题词。
在多个主题词中确定一个主要主题词或多个次要主题词包括:根据移动终端的用户预先设置的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词;或根据移动终端的操作系统的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词。所述主要主题词是与时间相关联的信息或与地点相关联的信息。所述主要主题词是与内容相关联的信息中的所有名词中的一个;或者是与主题相关联的信息中的所有名词中的一个。次要主题词是多个主题词中除了一个主要主题词之外的所有其它主题词。
在步骤102,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件;
所述移动终端的存储器中包括原始的存储区域和新的存储区域,所述原始的存储区域用于存储在接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示之前已经被存储在存储器中的多媒体文件。分类识别存储区包括多个存储单元,每个存储单元均对应一个虚拟文件夹,存储单元的数量与虚拟文件夹的数量相同。
在步骤103,在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息。
为每个新的多媒体文件生成摘要信息包括:根据每个新的多媒体文件的介绍信息来生成摘要信息,或对每个新的多媒体文件的介绍信息进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行信息提取来生成摘要信息。
在步骤104,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值。
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度包括:将原始的多媒体文件的摘要信息与每个内容描述项的主要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的主要主题词的关联度KAi;
将原始的多媒体文件的摘要信息与每个内容描述项的每个次要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的每个次要主题词的关联度,基于原始的多媒体文件与每个内容描述项的每个次要主题词的关联度确定原始的多媒体文件与每个内容描述项的所有次要主题词的平均关联度PAi,
原始的多媒体文件与每个内容描述项的关联度Ai=α×KAi+β×PAi;
N≥i≥1,其中i和N均为自然数,N为内容描述项的数量,Ai为原始的多媒体文件与第i个内容描述项的关联度;KAi为原始的多媒体文件与第i个内容描述项的主要主题词的关联度;PAi为原始的多媒体文件与第i个内容描述项的所有次要主题词的平均关联度;
其中1>α>0;1>β>0,并且α+β=1;
例如,α=0.75,β=0.25,α=0.5,β=0.5,α=0.25,β=0.75。
其中将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理为:将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件并针对每个原始的多媒体文件进行分类处理。第一关联度阈值为50%、60%、70%、80%或90%;
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
与相应的虚拟文件夹相关联的关联信息包括多个关联二元组,并且每个关联二元组中的虚拟文件夹的文件夹标识符均是相应的虚拟文件夹的文件夹标识符。与相应的虚拟文件夹相关联的关联信息用于记录或指示与相应的虚拟文件夹相关联的多个原始的多媒体文件,或与相应的虚拟文件夹相关联的关联信息用于记录或指示相应的虚拟文件夹所包括的多个原始的多媒体文件。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件;
在步骤105,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
在分类处理完成后,为与虚拟文件夹相关联的原始的多媒体文件添加分类描述信息,所述分类描述信息是原始的多媒体文件所归属的虚拟文件夹的文件夹标识符。基于当前时间和缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间;将当前时间和缓存开始时间之间的时间间隔确定为文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间。第一时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度包括:将新的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的每个主题词的关联度,基于新的多媒体文件与每个内容描述项的每个主题词的关联度确定新的多媒体文件与每个内容描述项的所有主题词的平均关联度,将新的多媒体文件与每个内容描述项的所有主题词的平均关联度确定为新的多媒体文件与每个内容描述项的关联度。第二关联度阈值为40%、50%、60%、70%或80%。
在步骤106,当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹包括:将未分类的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定未分类的多媒体文件与每个内容描述项的每个主题词的关联度,基于未分类的多媒体文件与每个内容描述项的每个主题词的关联度确定未分类的多媒体文件与每个内容描述项的所有主题词的平均关联度,将与未分类的多媒体文件的平均关联度大于第三关联度阈值的至少一个内容描述项确定为未分类的多媒体文件的至少一个推荐内容描述项。将与至少一个推荐内容描述项中每个推荐内容描述项相关联的虚拟文件夹确定为未分类的多媒体文件的推荐的虚拟文件夹,从而为每个未分类的多媒体文件推荐至少一个虚拟文件夹;或者,将根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹替换为:从多个虚拟文件夹中为每个未分类的多媒体文件随机推荐至少一个虚拟文件夹。第三关联度阈值为40%、50%、60%、70%或80%。
在步骤107,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行预览式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行缩略式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行小图标式的关联展示。由移动终端的用户生成针对于被推荐的至少一个未分类的多媒体文件的关联指示信息。所述关联指示信息的格式为<虚拟文件夹的文件夹标识符,相关性>;其中相关性包括:文件相关或文件不相关。
在步骤108,当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
基于当前时间和分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间;将当前时间和分类开始时间之间的时间间隔确定为无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间。第二时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
对与未分类的多媒体文件相关联的所有关联指示信息进行统计包括:按照虚拟文件夹的文件夹标识符对与未分类的多媒体文件相关联的所有关联指示信息进行统计,以获取未分类的多媒体文件与多个虚拟文件夹中每个虚拟文件夹相关的关联指示信息的总数量和内容为文件相关的关联指示信息的相关数量。
根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹包括:将多个虚拟文件夹中相关数量与总数量的比值最大的虚拟文件夹确定为未分类的多媒体文件所归属的虚拟文件夹。
图2为本发明的对互联网移动终端中的多媒体文件进行自动分类的系统200的结构示意图。系统200包括:分配装置201、创建装置202、生成装置203、分类装置204、处理装置205以及展示装置206。分配装置201,当接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示时,获取多媒体文件的多个内容描述项,为每个内容描述项分配一个虚拟文件夹,并为每个虚拟文件夹设置文件夹标识符,将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词,在多个主题词中确定一个主要主题词或多个次要主题词。
多媒体文件包括视频文件、音频文件和图像文件;其中多媒体文件的多个内容描述项是由移动终端的用户所生成的,或多媒体文件的多个内容描述项是由移动终端的操作系统所生成的。每个内容描述项是由与时间、地点、内容和主题相关联的信息所构成的描述信息。所述移动终端的存储器中存储多个多媒体文件。虚拟文件夹是不需要真实地创建的文件夹;虚拟文件夹利用关联关系来为每个内容描述项提供服务;文件夹标识符能够唯一地标识虚拟文件夹。虚拟文件夹与虚拟文件夹内的多个多媒体文件存在关联关系,但是虚拟文件夹内的多个多媒体文件中的每个多媒体文件仍存储在初始位置处,而不会因为与虚拟文件夹存在关联关系而被复制或移动到虚拟文件夹内。
将多个内容描述项中每个内容描述项进行关键词划分以确定每个内容描述项所涉及的多个主题词包括:将多个内容描述项中每个内容描述项进行关键词划分,将与时间相关联的信息和与地点相关联的信息均作为主题词,将与内容相关联的信息中的所有名词作为主题词和与主题相关联的信息中的所有名词作为主题词,从而确定每个内容描述项所涉及的多个主题词。
在多个主题词中确定一个主要主题词或多个次要主题词包括:根据移动终端的用户预先设置的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词;或根据移动终端的操作系统的选择规则从在多个主题词中确定一个主要主题词或多个次要主题词。所述主要主题词是与时间相关联的信息或与地点相关联的信息。所述主要主题词是与内容相关联的信息中的所有名词中的一个;或者是与主题相关联的信息中的所有名词中的一个。次要主题词是多个主题词中除了一个主要主题词之外的所有其它主题词。
创建装置202,在移动终端的存储器中创建新的存储区域,新的存储区域包括:文件缓存区、分类识别存储区以及无类别存储区,其中文件缓存区用于存储在接收到对多媒体文件进行自动分类的指示之后,移动终端所获取的新的多媒体文件,分类识别存储区内为每个虚拟文件夹创建一个相应的存储单元,每个存储单元用于存储与所归属的虚拟文件夹相关联的关联信息,以及无类别存储区用于存储不属于任何虚拟文件夹的多媒体文件。
所述移动终端的存储器中包括原始的存储区域和新的存储区域,所述原始的存储区域用于存储在接收到对移动互联网内移动终端中的多媒体文件进行自动分类的指示之前已经被存储在存储器中的多媒体文件。分类识别存储区包括多个存储单元,每个存储单元均对应一个虚拟文件夹,存储单元的数量与虚拟文件夹的数量相同。
生成装置203,在接收到对多媒体文件进行自动分类的指示之后,移动终端将所获取的每个新的多媒体文件存储在文件缓存区中并记录每个新的多媒体文件被存储在文件缓存区中的缓存开始时间,为每个新的多媒体文件生成摘要信息。
为每个新的多媒体文件生成摘要信息包括:根据每个新的多媒体文件的介绍信息来生成摘要信息,或对每个新的多媒体文件的介绍信息进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行概括来生成摘要信息;或对每个新的多媒体文件的文件内容进行信息提取来生成摘要信息。
分类装置204,将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理:
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度,确定原始的多媒体文件与每个内容描述项的关联度中最大的关联度是否大于第一关联度阈值。
将原始的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的关联度包括:将原始的多媒体文件的摘要信息与每个内容描述项的主要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的主要主题词的关联度KAi;
将原始的多媒体文件的摘要信息与每个内容描述项的每个次要主题词进行关联度计算以确定原始的多媒体文件与每个内容描述项的每个次要主题词的关联度,基于原始的多媒体文件与每个内容描述项的每个次要主题词的关联度确定原始的多媒体文件与每个内容描述项的所有次要主题词的平均关联度PAi,
原始的多媒体文件与每个内容描述项的关联度Ai=α×KAi+β×PAi;
N≥i≥1,其中i和N均为自然数,N为内容描述项的数量,Ai为原始的多媒体文件与第i个内容描述项的关联度;KAi为原始的多媒体文件与第i个内容描述项的主要主题词的关联度;PAi为原始的多媒体文件与第i个内容描述项的所有次要主题词的平均关联度;
其中1>α>0;1>β>0,并且α+β=1;
例如,α=0.75,β=0.25,α=0.5,β=0.5,α=0.25,β=0.75。
其中将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件以进行分类处理为:将在接收到对多媒体文件进行自动分类的指示之前已经存储在移动终端的存储器中原始的存储区域里的多个多媒体文件中的每个多媒体文件作为原始的多媒体文件并针对每个原始的多媒体文件进行分类处理。第一关联度阈值为50%、60%、70%、80%或90%;
如果是,则将与原始的多媒体文件的关联度最大的内容描述项作为原始的多媒体文件的归属内容描述项,确定与原始的多媒体文件的归属内容描述项相关联的虚拟文件夹,利用虚拟文件夹的文件夹标识符和原始的多媒体文件的标识符构建关联二元组,关联二元组的格式为<原始的多媒体文件的标识符、虚拟文件夹的文件夹标识符>,根据虚拟文件夹的文件夹标识符将多个关联二元组中每个关联二元组保存到相应的虚拟文件夹的存储单元中,以由关联二元组来构成与相应的虚拟文件夹相关联的关联信息;
如果否,则将原始的多媒体文件从原始的存储区域移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间。
与相应的虚拟文件夹相关联的关联信息包括多个关联二元组,并且每个关联二元组中的虚拟文件夹的文件夹标识符均是相应的虚拟文件夹的文件夹标识符。与相应的虚拟文件夹相关联的关联信息用于记录或指示与相应的虚拟文件夹相关联的多个原始的多媒体文件,或与相应的虚拟文件夹相关联的关联信息用于记录或指示相应的虚拟文件夹所包括的多个原始的多媒体文件。
当对所有原始的多媒体文件的分类处理完成后,将分类识别存储区的每个存储单元的关联信息中的关联二元组内的虚拟文件夹的文件夹标识符作为每个存储单元内的每个原始的多媒体文件的分类描述信息,以利用分类描述信息来指示每个原始的多媒体文件所归属的虚拟文件夹而不改变每个原始的多媒体文件的存储位置并且因此确定每个虚拟文件夹各自所包括的多个多媒体文件;
处理装置205,当基于缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间到达第一时间阈值时,将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度,基于新的多媒体文件与每个内容描述项的关联度确定新的多媒体文件与多个内容描述项的平均关联度,当新的多媒体文件与多个内容描述项的平均关联度大于或等于第二关联度阈值时,将与新的多媒体文件的关联度最大的内容描述项作为新的多媒体文件的归属内容描述项,确定与新的多媒体文件的归属内容描述项相关联的虚拟文件夹,将与新的多媒体文件的归属内容描述项相关联的虚拟文件夹的标识符作为新的多媒体文件的分类描述信息,以利用分类描述信息来指示新的多媒体文件所归属的虚拟文件夹并且将新的多媒体文件移动到原始的存储区域中;
在分类处理完成后,为与虚拟文件夹相关联的原始的多媒体文件添加分类描述信息,所述分类描述信息是原始的多媒体文件所归属的虚拟文件夹的文件夹标识符。基于当前时间和缓存开始时间确定文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间;将当前时间和缓存开始时间之间的时间间隔确定为文件缓存区中存储的新的多媒体文件在文件缓存区中的存储时间。第一时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
将新的多媒体文件的摘要信息与每个内容描述项的多个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的关联度包括:将新的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定新的多媒体文件与每个内容描述项的每个主题词的关联度,基于新的多媒体文件与每个内容描述项的每个主题词的关联度确定新的多媒体文件与每个内容描述项的所有主题词的平均关联度,将新的多媒体文件与每个内容描述项的所有主题词的平均关联度确定为新的多媒体文件与每个内容描述项的关联度。第二关联度阈值为40%、50%、60%、70%或80%。
当新的多媒体文件与多个内容描述项的平均关联度小于关联度阈值时,将新的多媒体文件移动到无类别存储区以作为未分类的多媒体文件并记录每个未分类的多媒体文件被存储在无类别存储区中的分类开始时间,根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹,将所推荐的每个虚拟文件夹的标识符作为无类别存储区中未分类的多媒体文件的推荐信息,以指示为每个未分类的多媒体文件所推荐的至少一个虚拟文件夹并且因此确定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件;
根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹包括:将未分类的多媒体文件的摘要信息与每个内容描述项的多个主题词中的每个主题词进行关联度计算以确定未分类的多媒体文件与每个内容描述项的每个主题词的关联度,基于未分类的多媒体文件与每个内容描述项的每个主题词的关联度确定未分类的多媒体文件与每个内容描述项的所有主题词的平均关联度,将与未分类的多媒体文件的平均关联度大于第三关联度阈值的至少一个内容描述项确定为未分类的多媒体文件的至少一个推荐内容描述项。将与至少一个推荐内容描述项中每个推荐内容描述项相关联的虚拟文件夹确定为未分类的多媒体文件的推荐的虚拟文件夹,从而为每个未分类的多媒体文件推荐至少一个虚拟文件夹;或者,将根据无类别存储区中每个未分类的多媒体文件的摘要信息为每个未分类的多媒体文件推荐至少一个虚拟文件夹替换为:从多个虚拟文件夹中为每个未分类的多媒体文件随机推荐至少一个虚拟文件夹。第三关联度阈值为40%、50%、60%、70%或80%。
当基于分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间到达第二时间阈值时,对与未分类的多媒体文件相关联的所有关联指示信息进行统计,并根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹,并将所归属的虚拟文件夹的标识符作为未分类的多媒体文件的分类描述信息,以利用分类描述信息来指示未分类的多媒体文件所归属的虚拟文件夹。
基于当前时间和分类开始时间确定无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间;将当前时间和分类开始时间之间的时间间隔确定为无类别存储区中的未分类的多媒体文件在无类别存储区中的存储时间。第二时间阈值为:5个小时、10个小时、20个小时、30个小时、50个小时、100个小时、300个小时或720个小时。
对与未分类的多媒体文件相关联的所有关联指示信息进行统计包括:按照虚拟文件夹的文件夹标识符对与未分类的多媒体文件相关联的所有关联指示信息进行统计,以获取未分类的多媒体文件与多个虚拟文件夹中每个虚拟文件夹相关的关联指示信息的总数量和内容为文件相关的关联指示信息的相关数量。
根据统计结果确定未分类的多媒体文件所归属的虚拟文件夹包括:将多个虚拟文件夹中相关数量与总数量的比值最大的虚拟文件夹确定为未分类的多媒体文件所归属的虚拟文件夹。
展示装置206,当特定虚拟文件夹中多个多媒体文件中的目标多媒体文件在移动终端内被浏览或使用时,将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示,并获取针对于特定虚拟文件夹所包括的被推荐的至少一个未分类的多媒体文件中每个的关联指示信息。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行预览式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行缩略式的关联展示。
将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行关联展示为:在预览区域在将特定虚拟文件夹内多个多媒体文件中除目标多媒体文件之外的所有其它多媒体文件进行小图标式的关联展示。由移动终端的用户生成针对于被推荐的至少一个未分类的多媒体文件的关联指示信息。所述关联指示信息的格式为<虚拟文件夹的文件夹标识符,相关性>;其中相关性包括:文件相关或文件不相关。
- 上一篇:一种医用注射器针头装配设备
- 下一篇:一种针对水下作业场景的图片检索方法