基于视频数据的结构化数据提取方法及装置

文档序号：1861313 发布日期：2021-11-19 浏览：17次 >En<

阅读说明：本技术 基于视频数据的结构化数据提取方法及装置 (Structured data extraction method and device based on video data ) 是由刘学亮徐杰任继远于 2021-08-23 设计创作，主要内容包括：本发明提供了一种基于视频数据的结构化数据提取方法及装置,通对视频上传系统进行结构化数据提取,从而确定待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略,以用于根据结构化数据提取策略来对待结构化数据提取的源视频互动数据进行结构化数据提取。(The invention provides a method and a device for extracting structured data based on video data, which are used for extracting the structured data of source video interactive data to be extracted according to a structured data extraction strategy, wherein the source video interactive data to be extracted according to the structured data extraction strategy is determined to correspond to the structured data extraction strategy of each video interactive service scene.)

基于视频数据的结构化数据提取方法及装置

技术领域

本发明涉及计算机技术领域，具体而言，涉及一种基于视频数据的结构化数据提取方法及装置。

背景技术

在结构化数据提取过程中，如何提高结构化数据提取的可靠性是进行结构化数据提取的重要考虑点，因此对视频上传系统进行结构化数据提取进行结构化数据提取策略配置显得非常重要。

发明内容

鉴于以上内容，本发明提供一种基于视频数据的结构化数据提取方法及装置，通对视频上传系统进行结构化数据提取，从而确定待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，以用于根据结构化数据提取策略来对待结构化数据提取的源视频互动数据进行调整。

根据本发明的一个方面，提供一种基于视频数据的结构化数据提取方法，应用于视频服务系统，所述视频服务系统与视频上传系统通信连接，所述方法包括：

获取待结构化数据提取的源视频互动数据和多个视频互动服务轨迹，并获取互动类别分布与所述待结构化数据提取的源视频互动数据的互动类别分布匹配的目标互动类别关联信息；

根据所述待结构化数据提取的源视频互动数据的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息，并根据所述目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息；

根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息，确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，并根据所述结构化数据提取策略对视频互动服务场景产生的目标视频服务互动数据进行结构化数据提取。

详细地，所述根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息，确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略的步骤，包括：

根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息确定各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量；

根据各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略。

详细地，所述根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息确定各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量的步骤，包括：

确定各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息与各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息是否应用于相同的场景关联信息网格内；

若应用于相同的场景关联信息网格内，则将各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量配置为第一参考轨迹特征向量；

若应用于相同的场景关联信息网格外，则将各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量配置为第二参考轨迹特征向量。

详细地，所述目标互动类别关联信息为多个；

所述根据所述目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息的步骤，包括：

根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息，在多个视频互动服务轨迹中确定相对应各所述视频互动服务场景的目标视频互动服务轨迹；

使用各所述目标互动类别关联信息分别确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息；

在多个场景关联信息网格中，分别确定得到的各所述场景关联信息所在的场景关联信息网格；

在多个场景关联信息网格中，确定包含的场景关联信息最多的场景关联信息网格；根据确定的场景关联信息网格中包含的场景关联信息，确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。

详细地，所述根据确定的场景关联信息网格中包含的场景关联信息，确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息，包括：

在确定的场景关联信息网格中包含的场景关联信息中，确定一个场景关联信息，配置为所述目标视频互动服务轨迹相对应所述视频互动服务场景的目标场景关联信息；

或者，计算确定的场景关联信息网格中包含的所有场景关联信息的关联置信度，配置为所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息；

或者，在确定的场景关联信息网格中包含的所有场景关联信息中抽取最优的场景关联信息，配置为所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。

根据本发明的另一方面，提供一种在线网络的视频服务互动数据装置，应用于视频服务系统，所述视频服务系统与视频上传系统通信连接，所述装置包括：

获取模块，用于获取待结构化数据提取的源视频互动数据和多个视频互动服务轨迹，并获取互动类别分布与所述待结构化数据提取的源视频互动数据的互动类别分布匹配的目标互动类别关联信息；

确定模块，用于根据所述待结构化数据提取的源视频互动数据的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息，并根据所述目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息；

提取模块，用于根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息，确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略以进行结构化数据提取。

相较于现有技术而言，本发明提供的基于视频数据的结构化数据提取方法及装置，通过获取待结构化数据提取的源视频互动数据和多个视频互动服务轨迹，并获取互动类别分布与待结构化数据提取的源视频互动数据的互动类别分布匹配的目标互动类别关联信息，然后根据待结构化数据提取的源视频互动数据的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息，并根据目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息，接着根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。如此，通对视频上传系统进行结构化数据提取，从而确定待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，以用于根据结构化数据提取策略来对待结构化数据提取的源视频互动数据进行结构化数据提取。

为使本发明的上述目的、特征和优点能更明显易懂，下面将结合实施例，并配合所附附图，作详细说明。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明所提供的基于视频数据的结构化数据提取方法的流程示意图；

图2是本发明所提供的在线网络的视频服务互动数据装置的功能模块框图。

具体实施方式

为了使本技术领域的学员更好地理解本发明方案，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。根据本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都相对应本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等(若存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1示出了本发明提供的基于视频数据的结构化数据提取方法的流程示意图，该基于视频数据的结构化数据提取方法可由舆情视频服务系统执行。所述舆情视频服务系统可以包括基于视频数据的结构化数据提取装置、机器可读存储介质和处理器。示例性地，本实施例中，机器可读存储介质与处理器可以相互通信连接，由处理器通过总线接口来访问。结构化数据提取装置可以包括存储在机器可读存储介质的软件功能模块。当处理器执行结构化数据提取装置中的软件功能模块时，可以实现本发明实施例提供的方法。

其中，本实施例中的机器可读存储介质可以包含高速随机存取存储器(英文：RandomAccess Memory；简称：RAM)，也可以还包括非不稳定的存储器(英文：non-volatilememory；简称：NVM)，例如至少一个磁盘存储器。本实施例中，机器可读存储介质存储了处理器执行上述方法所需要的程序。

本实施例中的总线可以是ISA总线(英文：Industry Standard Architecture；简称：工业标准体系结构)、PCI总线(英文：Peripheral Component Interconnect；简称：外设部件互连标准)或EISA总线(英文：Extended Industry Standard Architecture；简称：扩展工业标准结构)等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，

本实施例中的处理器可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。该处理器可以是通用处理器，包括中央处理器(英文：Central Processing Unit、简称：CPU)、网络处理器(英文：Network Processor，简称NP)等；还可以是数字信号处理器(英文：Digital Signal Processing、简称：DSP)、或是专用集成电路(英文：ApplicationSpecific Integrated Circuit、简称：ASIC)、或是现成可编程门阵列(英文：Field－Programmable Gate Array、简称：FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。

本发明实施例任意实施例揭示的流程或定义的装置所执行的方法可以应用于处理器中，或者由处理器实现。处理器在接收到执行指令后，通过总线调用存储在机器可读存储介质中的程序后，处理器则可以执行方法的流程。

所述基于视频数据的结构化数据提取方法的实现方式介绍如下。

步骤S100，获取待结构化数据提取的源视频互动数据和多个视频互动服务轨迹，并获取互动类别分布与所述待结构化数据提取的源视频互动数据的互动类别分布匹配的目标互动类别关联信息；

步骤S200，根据所述待结构化数据提取的源视频互动数据的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息，并根据所述目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息；

步骤S300，根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息，确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，并根据所述结构化数据提取策略对视频互动服务场景产生的目标视频服务互动数据进行结构化数据提取。

基于上述步骤，本发明通过获取待结构化数据提取的源视频互动数据和多个视频互动服务轨迹，并获取互动类别分布与待结构化数据提取的源视频互动数据的互动类别分布匹配的目标互动类别关联信息，然后根据待结构化数据提取的源视频互动数据的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息，并根据目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息，接着根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。如此，通对视频上传系统进行结构化数据提取，从而确定待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，以用于根据结构化数据提取策略来对待结构化数据提取的源视频互动数据进行调整。

详细地，在步骤S300，本发明可以根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息确定各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量，然后根据各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，并根据所述结构化数据提取策略对视频互动服务场景产生的目标视频服务互动数据进行结构化数据提取。。

例如，可以确定各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息与各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息是否应用于相同的场景关联信息网格内。若应用于相同的场景关联信息网格内，则将各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量配置为第一参考轨迹特征向量；若应用于相同的场景关联信息网格外，则将各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息的轨迹特征向量配置为第二参考轨迹特征向量。

详细地，在步骤S200，所述目标互动类别关联信息为多个，本发明可以根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息，在多个视频互动服务轨迹中确定相对应各所述视频互动服务场景的目标视频互动服务轨迹，然后使用各所述目标互动类别关联信息分别确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息，接着在多个场景关联信息网格中，分别确定得到的各所述场景关联信息所在的场景关联信息网格，同时在多个场景关联信息网格中，确定包含的场景关联信息最多的场景关联信息网格。如此，可以根据确定的场景关联信息网格中包含的场景关联信息，确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。

例如，可以在确定的场景关联信息网格中包含的场景关联信息中，确定一个场景关联信息，配置为所述目标视频互动服务轨迹相对应所述视频互动服务场景的目标场景关联信息。

又例如，计算确定的场景关联信息网格中包含的所有场景关联信息的关联置信度，配置为所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。

又例如，在确定的场景关联信息网格中包含的所有场景关联信息中抽取最优的场景关联信息，配置为所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息。

图2示出了本发明提供的在线网络的视频服务互动数据装置20的功能模块图，该在线网络的视频服务互动数据装置20实现的功能可以对应上述方法执行的步骤。设备的处理器，也可以理解为独立于上述视频服务系统或处理器之外的在视频服务系统的控制下实现本发明功能的组件，下面分别对该在线网络的视频服务互动数据装置20的各个功能模块的功能进行详细阐述。

获取模块21，用于获取待结构化数据提取的源视频互动数据和多个视频互动服务轨迹，并获取互动类别分布与所述待结构化数据提取的源视频互动数据的互动类别分布匹配的目标互动类别关联信息；

确定模块22，用于根据所述待结构化数据提取的源视频互动数据的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的场景关联信息，并根据所述目标互动类别关联信息的互动频繁项信息确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息；

提取模块23，用于根据各所述视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息和各所述视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息，确定所述待结构化数据提取的源视频互动数据对应于各所述视频互动服务场景的结构化数据提取策略，并根据所述结构化数据提取策略对视频互动服务场景产生的目标视频服务互动数据进行结构化数据提取。

详细地，所述提取模块23具体用于：

详细地，所述确定模块22具体用于：

详细地，所述目标互动类别关联信息为多个，所述确定模块22通过以下方式确定各所述视频互动服务轨迹分别相对应各所述视频互动服务场景的目标场景关联信息的步骤，包括：

使用各所述目标互动类别关联信息分别确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的场景关联信息；

在多个场景关联信息网格中，分别确定得到的各所述场景关联信息所在的场景关联信息网格；

所述确定模块22通过以下方式确定所述目标视频互动服务轨迹相对应各所述视频互动服务场景的目标场景关联信息：

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的根据硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以多个模块集成形成一个独立的部分。

可以替换的，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线（例如同轴电缆、光纤、数字用户线（DSL））或无线（例如红外、无线、微波等）方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质（例如固态硬盘SolidState Disk (SSD)）等。

需要说明的是，在本文中，术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句"包括一个……"限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其它的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图进销存确认视为限制所涉及的权利要求。

13页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：用于内容发现的人工智能

基于视频数据的结构化数据提取方法及装置

相关技术

网友询问留言