一种基于图像及ocr识别的关键词获取方法
阅读说明:本技术 一种基于图像及ocr识别的关键词获取方法 (Keyword acquisition method based on image and OCR recognition ) 是由 唐明宏 于 2019-10-25 设计创作,主要内容包括:本发明涉及图像识别技术领域,特别为一种基于图像及OCR识别的关键词获取方法。本发明包括如下步骤:步骤一:连续获取视频中帧画面,并依照帧画面的获取顺序对各帧画面依次进行兴趣点识别处理;步骤二:根据兴趣图像的位置信息获得目标识别区域,采用OCR识别算法获得目标识别区域内的关键词,提取该关键词。本发明能够自动识别并获取用于指定的关键词。(The invention relates to the technical field of image recognition, in particular to a keyword acquisition method based on image and OCR recognition. The invention comprises the following steps: the method comprises the following steps: continuously acquiring frame pictures in a video, and sequentially identifying interest points of each frame picture according to the acquisition sequence of the frame pictures; step two: and obtaining a target recognition area according to the position information of the interest image, obtaining a keyword in the target recognition area by adopting an OCR recognition algorithm, and extracting the keyword. The invention can automatically identify and acquire the specified keywords.)
技术领域
本发明涉及图像识别技术领域,特别为一种基于图像及OCR识别的关键词获取方法。
背景技术
随着现代科技的飞速发展,图像识别技术作为现代社会关键的基础技术之一被人们广泛地运用到生活中的各个场景当中,图像识别的算法日新月异。
然而,在某些特殊的场景中,图像识别的应用仍然不够人性化,有待进一步改进。例如,在现代化智能阅读这一场景领域,人们利用摄像头结合OCR识别技术在人们阅读的过程当中同步快速识别用户当前阅读的内容,并通过算法快速提取高频关键词,并利用关键词进行关联检索从而为用户提供联想阅读、关键词释义等等智能阅读的服务。然而,由于读者的兴趣点各异,因而在上述这一场景中就存在这样一种阅读需求,即读者的兴趣点并非高频关键词,而是其指定的某一低频词汇,显然,在现有本领域的技术当中,还未有研发出相关的算法以满足阅读场景下用户的这一需求。
发明内容
本发明的目的在于:提供一种基于图像及OCR识别的关键词获取方法,其能够自动识别并获取用于指定的关键词。
本发明通过如下技术方案实现:一种基于图像及OCR识别的关键词获取方法,其特征在于包括如下步骤:
步骤一:连续获取视频中帧画面,并依照帧画面的获取顺序对各帧画面依次进行兴趣点识别处理;
所述兴趣点识别处理包括采用图像识别技术识别帧画面中是否存在预设的兴趣图像,若不存在兴趣图像则继续识别下一副帧画面,若存在兴趣图像,则初始化该带有兴趣图像的帧画面的坐标信息,并获取该兴趣图像的位置信息;
分别连续记录从初始获得兴趣图像的初始帧画面到不再获得兴趣图像的末了帧画面为止期间所有连续帧画面的兴趣图像的位置信息数据组,并根据位置信息数据组计算出兴趣图像在这一组帧画面过程当中兴趣图像的动作;若
兴趣图像的动作与预设动作不一致,则继续对剩余帧画面依次进行兴趣点识别处理,若兴趣图像的动作与预设动作一致,则进入下一步骤;
步骤二:根据兴趣图像的位置信息获得目标识别区域,采用OCR识别算法获得目标识别区域内的关键词,提取该关键词。
为了更好的实施本方案,还提供如下优化方案:
进一步的,所述兴趣图像为手指图像或标记笔图像。
进一步的,所述预设动作为停留、划线或划圈。
较之前技术而言,本发明的有益效果为:通过本方法采用图像识别与OCR 识别算法相结合的技术解决了现有图像识别领域无法获取用户指定关键词的问题,算法运算简单高效。
具体实施方式
本实施例具体介绍了本方法在阅读场景下的应用之一,在该场景下,采用一固定摄像头正对读者正在阅读的书籍,提取关键词步骤如下:
步骤一:连续获取摄像头中所获得视频中帧画面,并依照帧画面的获取顺序对各帧画面依次进行兴趣点识别处理;这里我们预设的兴趣图像为读者的右手食指伸出时的图像。
所述兴趣点识别处理包括采用图像识别技术识别帧画面中是否存在预设的兴趣图像,若不存在兴趣图像则继续识别下一副帧画面,若存在兴趣图像,则初始化该带有兴趣图像的帧画面的坐标信息,并获取该兴趣图像的位置信息;
分别连续记录从初始获得兴趣图像的初始帧画面到不再获得兴趣图像的末了帧画面为止期间所有连续帧画面的兴趣图像的位置信息数据组,并根据位置信息数据组计算出兴趣图像在这一组帧画面过程当中兴趣图像的动作;若
兴趣图像的动作与预设动作不一致,则继续对剩余帧画面依次进行兴趣点识别处理,若兴趣图像的动作与预设动作一致,则进入下一步骤;这里预设动作为停留。
步骤二:根据兴趣图像的位置信息获得目标识别区域,采用OCR识别算法获得目标识别区域内的关键词,提取该关键词。这里的目标识别区域为位于直线变化轨迹上方的方形区域。方形区域的长度与直线变化轨迹的长度,方形区域的宽度设定为一个字体的长度。
为了更好的理解,下面结合具体的场景画面行为进一步介绍本方法所实现的功能:在步骤一中,在检测到读者伸出右手食指伸出时,即进入到步骤二;由于预设的轨迹为直线,即当检测到读者伸出右手食指做出划横的动作时,即判定与预设一致,即进入到步骤三;步骤三中即识别右手食指做出划横轨迹上方区域内的目标区域内的文字,并提取该关键词。
通过上述方法的过程,可以实现的场景,即读者在阅读的过程当中,发现书本上存在其感兴趣的关键词例如“宋朝”时,只需伸出右手手指在书本上宋朝一词底部做出停留的动作,而后既能够即能够抓取出“宋朝”这一关键词,进行下一步的延伸服务。
此外,在其他实施方式当中可将画圈作为预设动作,并设定画圈动作方位内的区域为目标区域,例如读者在阅读的过程当中,发现书本上存在其感兴趣的关键词例如“宋朝”时,只需伸出右手手指在书本上宋朝一词四周做出画圈的动作将“宋朝”一词划出,并根据画圈内部所确定的目标区域进行的OCR识别既能够实现抓取用户所感兴趣的“宋朝”这一关键词,进行下一步的延伸服务。
尽管本发明采用具体实施例及其替代方式对本发明进行示意和说明,但应当理解,只要不背离本发明的精神范围内的各种变化和修改均可实施。因此,应当理解除了受随附的权利要求及其等同条件的限制外,本发明不受任何意义上的限制。
- 上一篇:一种医用注射器针头装配设备
- 下一篇:车牌螺丝检测方法、装置和计算机设备