图像处理方法及装置

文档序号：193397 发布日期：2021-11-02 浏览：55次 >En<

阅读说明：本技术 图像处理方法及装置 (Image processing method and device ) 是由王俊贤于 2021-07-28 设计创作，主要内容包括：本申请公开了一种图像处理的方法及装置,属于信息处理技术领域。所述方法包括：接收用户的第一输入,所述第一输入用于选择目标图像,以及输入目标信息；响应于所述第一输入,将所述目标信息与目标对象进行关联,以生成目标文件；向第二终端发送所述目标文件；其中,所述目标图像包括所述目标对象；所述目标信息包括文字信息或语音信息中的至少一项；所述目标文件用于所述第二终端显示将所述目标信息与所述目标对象进行关联后的图像信息。(The application discloses an image processing method and device, and belongs to the technical field of information processing. The method comprises the following steps: receiving a first input of a user, wherein the first input is used for selecting a target image and inputting target information; in response to the first input, associating the target information with a target object to generate a target file; sending the target file to a second terminal; wherein the target image comprises the target object; the target information comprises at least one item of text information or voice information; the target file is used for the second terminal to display the image information which associates the target information with the target object.)

图像处理方法及装置

技术领域

本申请属于信息处理技术领域，具体涉及一种图像处理方法及装置。

背景技术

在非面对面的情况下，想要跟他人分享或描述某张图片时，需要在通讯软件发送一张图片的同时，再发送一段描述文字或语音，来让接收者明白发送图片的原因和发送者想要表达的意思。

在该场景中，由于图片和文字或语音资源是分开发送，会将视觉与文字或语音操作分离开，很难做到像面对面一样轻松的口语化描述，接收者也更难理解接收到的信息。

发明内容

本申请实施例的目的是提供一种图像处理方法及装置，能够解决非面对面分享图片场景下带来的图片描述效率不高、精度较差的技术问题。

第一方面，本申请实施例提供了一种图像处理方法，该方法包括：

接收用户的第一输入，所述第一输入用于选择目标图像，以及输入目标信息；

响应于所述第一输入，将所述目标信息与目标对象进行关联，以生成目标文件；

向第二终端发送所述目标文件；

其中，所述目标图像包括所述目标对象；所述目标信息与所述目标对象对应，所述目标信息包括文字信息或语音信息中的至少一项；

所述目标文件用于所述第二终端显示将所述目标信息与所述目标对象进行关联后的图像信息。

第二方面，本申请实施例提供了一种图像处理方法，该方法包括：

接收第一终端发送的目标文件；其中，所述目标文件包括所述第一终端将目标信息与目标图像中的目标对象进行关联后生成的图像信息，所述目标信息是针对所述目标对象的信息，并且包括文字信息或语音信息中的至少一项；

显示所述图像信息。

第三方面，本身实施例提供了一种图像处理装置，该装置包括：

接收模块，用于接收用户的第一输入，所述第一输入包括选择目标图像，以及输入目标信息；

关联模块，用于响应于所述第一输入，将所述目标信息与目标对象进行关联，以生成目标文件；

发送模块，用于向第二终端发送所述目标文件；

其中，所述目标图像包括所述目标对象；所述目标信息与所述目标对象对应，所述目标信息包括文字信息或语音信息中的至少一项；

所述目标文件用于所述第二终端显示将所述目标信息与所述目标对象进行关联后的图像信息。

第四方面，本申请实施例提供了一种图像处理装置，该装置包括：

接收模块，用于接收第一终端发送的目标文件；其中，所述目标文件包括所述第一终端将目标信息与目标图像中的目标对象进行关联后生成的图像信息，所述目标信息是针对所述目标对象的信息，并且包括文字信息或语音信息中的至少一项；

显示模块，用于显示所述图像信息。

第五方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面或第二方面所述的方法的步骤。

第六方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面或第二方面所述的方法的步骤。

第七方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面或第二方面所述的方法的步骤。

本申请实施例提供的图像处理方法及装置，通过将图像以及针对该图像的文字或语音资源进行关联生成目标文件，可以实现视觉与文字或语音的结合，以便于接收者明白发送图片的原因和发送者想要表达的意思，从而提高了非面对面分享图片场景下的图片描述效率以及描述精度，有效提高了用户体验。

附图说明

图1是本申请实施例提供的图像处理方法的流程示意图之一；

图2是根据本申请实施例的将目标信息与目标对象进行关联的示意图之一；

图3是根据本申请实施例的将目标信息与目标对象进行关联的示意图之二；

图4是根据本申请实施例的将目标信息与目标对象进行关联的示意图之三；

图5是根据本申请实施例的将目标信息与目标对象进行关联的示意图之四；

图6是根据本申请实施例的将目标信息与目标对象进行关联的示意图之五；

图7是根据本申请实施例的将目标信息与目标对象进行关联的示意图之六；

图8是根据本申请实施例的将目标信息与目标对象进行关联的示意图之七；

图9是根据本申请实施例的将目标信息与目标对象进行关联的示意图之八；

图10是根据本申请实施例的将目标信息与目标对象进行关联的示意图之九；

图11是本申请实施例提供的图像处理方法的流程示意图之二；

图12是根据本申请实施例的显示目标文件的示意图；

图13是本申请实施例提供的图像处理装置的结构示意图之一；

图14是本申请实施例提供的图像处理装置的结构示意图之二；

图15是根据本申请实施例的电子设备的结构示意图；

图16是实现本申请实施例的一种电子设备的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的图像处理方法及装置进行详细地说明。

图1是本申请实施例提供的图像处理方法的流程示意图之一。参照图1，本申请实施例提供一种图像处理方法，可以包括：

步骤110、接收用户的第一输入，第一输入用于选择目标图像，以及输入目标信息；

步骤120、响应于第一输入，将目标信息与目标对象进行关联，以生成目标文件；

步骤130、向第二终端发送目标文件；

其中，目标图像包括目标对象；目标信息与目标对象对应，目标信息包括文字信息或语音信息中的至少一项；

目标文件用于第二终端显示将目标信息与目标对象进行关联后的图像信息。

需要说明的是，本申请实施例提供的图像处理方法的执行主体可以是第一终端。第一终端可以是智能电子设备，例如手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等。

用户可以在使用例如聊天APP时，使APP进入特定的模式。在该模式中，用户可以选定目标图片，并输入目标信息。

在步骤110中，第一终端可以接收用户的第一输入，该第一输入用于选择目标图像，以及输入目标信息。

如图2所示，目标图像可以为包含5只卡通猫形象的图像，目标对象可以为该图像中包含的5只卡通猫形象中的至少一个。

目标信息为与目标对象对应的信息。例如，目标信息可以是文字信息，例如“我最喜欢这只猫”等；也可以是语音信息，例如“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”等。

在步骤120中，第一终端可以响应于第一输入，将目标信息与目标对象进行关联，从而生成目标文件。

例如，在目标信息是文字信息“我最喜欢这只猫”的情况下，第一终端可以将“这只猫”与5只卡通猫形象中的任一个进行关联。在目标信息是语音信息“我最喜欢左下角这只猫了，上面中间这只猫是最小的，也很可爱”的情况下，第一终端可以将{左下角,猫}与位于目标图像左下角的卡通猫形象进行关联，并将{中间,猫}与位于目标图像中间的卡通猫形象进行关联。

在将目标信息与目标对象进行关联后，第一终端可以根据关联结果生成目标文件。

在步骤130中，第一终端会将目标文件发送至第二终端，以供第二终端对目标文件进行解析，从而显示将目标信息与目标对象进行关联后的图像信息。

需要说明的是，第二终端可以是智能电子设备，例如手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personalcomputer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等。

第二终端与第一终端可以是相同类型的终端，例如第二终端与第一终端可以均为手机。第二终端与第一终端也可以是不同类型的终端，例如第二终端可以是PC，而第一终端可以是手机。

本申请实施例提供的图像处理方法，通过将图像以及针对该图像的文字或语音资源进行关联生成目标文件，可以实现视觉与文字或语音的结合，以便于接收者明白发送图片的原因和发送者想要表达的意思，从而提高了非面对面分享图片场景下的图片描述效率以及描述精度，有效提高了用户体验。

在一个实施例中，在目标信息包括文字信息的情况下，将目标信息与目标对象进行关联，可以包括：

从文字信息中选择目标文字并在目标图像中标记目标对象；

将目标文字与标记后的目标对象进行关联。

如图2所示，用户可以在将目标信息与目标对象进行关联之前，从文字输入框中输入文字信息，例如“我最喜欢这只猫”。

之后，第一终端可以接收用户的上述输入，该输入包括用户的两个操作指令：

操作指令1：从用户输入的文字信息中选择目标文字，例如“这只猫”，如图3所示。接着，用户可以进行操作指令2：从目标图像中标记目标对象，例如，当用户所表达的“这只猫”指的是中间的卡通猫形象时，则用户会从目标图像中标记中间的卡通猫形象，如图4所示。

可选地，第一终端可以记录用户对所述目标对象的标记操作，如用户对目标对象双指放大操作，第一终端记录该操作的操作时长等操作相关信息，目标文件包括操作信息，便于在第二终端接收到目标文件后，可以根据操作信息解析显示关联后的图像信息。

其中，标记目标对象可以包括：改变目标对象在目标图像中的显示方式。

例如，用户可以对目标图像中间的卡通猫形象进行操作，以使中间的卡通猫形象在目标图像中放大显示、高亮显示、振动显示、圈出显示等。本申请实施例对标记的具体方式不作具体限定。

之后，第一终端可以响应于用户的上述输入，将目标文字“这只猫”与被标记后的目标图像中间的卡通猫形象进行关联。

其中，将目标文字与标记后的目标对象进行关联可以是在目标文字被选中的情况下，在目标图像中显示标记后的目标对象。

如图5所示，当用户选中目标文字“这只猫”时，第一终端可以在目标图像中以放大显示、高亮显示、振动显示以及圈出显示中的至少一种方式来显示位于目标图像中间的卡通猫形象。

在用户完成操作，第一终端将目标文字与目标对象进行关联后，第一终端可以将操作信息、文字信息(包括目标文字)以及图像信息(包括与目标文字对应的目标对象)合成为预定格式的目标文件。

其中，预定格式可以为例如PPT、GIF等。

本申请实施例提供的图像处理方法，通过根据用户的输入将目标文字与目标对象进行关联，可以实现根据用户的意愿确定关联结果，从而可以进一步提高图片描述效率以及描述精度。

在一个实施例中，本申请实施例提供的图像处理方法，还可以包括：

在目标文件中突出显示目标文字。

可以理解的是，通过在目标文件中突出显示目标文字，可以便于第二终端的用户从文字信息中快速定位到目标文字，从而选中该目标文字以确定目标对象，进而进一步提高了对发送图片的原因和发送者想要表达的意思的理解速度。

在一个实施例中，在目标信息包括语音信息的情况下，将目标信息与目标对象进行关联，可以包括：

接收用户触发语音识别和图像识别的第二输入；

响应于第二输入，提取语音信息中的关键字，并根据关键字从目标图像中确定目标对象；将关键字与目标对象进行关联。

在步骤110中，第一终端可以接收用户输入的针对目标对象的语音信息，并将该语音信息保存，如图6所示。

第二输入可以是将语音信息拖入目标图像的操作指令，如图7所示。即，当用户将语音信息拖入目标图像后，第一终端会响应于该输入，触发图像识别功能和语音识别功能。

通过图像识别功能，第一终端可以确定目标图像中的各个目标对象：位于左下角的卡通猫形象、位于右下角的卡通猫形象、位于中间的卡通猫形象、位于左上角的卡通猫形象以及位于右上角的卡通猫形象。

通过语音识别功能，第一终端可以确定语音信息中包括的与目标对象相关的关键字。

例如，当语音信息为“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”时，则第一终端可以提取出与目标对象相关的关键字“左下角”、“猫”、“中间”、“猫”。

由于从语音信息中提取出的关键字有多个，因此第一终端可以通过语义识别算法，将这些关键字进行组合：{左下角,猫}、{中间,猫}。

之后，第一终端可以根据{左下角,猫}、{中间,猫}，将位于目标图像左下角的卡通猫形象以及位于目标图像中间的卡通猫形象分别作为目标对象。

接着，第一终端会将关键字与目标对象进行关联。

其中，将关键字与目标对象进行关联，可以包括：

在播放语音信息的情况下，从语音信息中关键字对应的播放时刻开始显示关键图像，直到语音信息播放结束或者开始播放下一关键字时取消显示关键图像；

其中，关键图像是对关键字对应的目标对象进行标记后的图像。

第一终端会先对目标对象进行标记，例如分别将位于目标图像左下角的卡通猫形象以及位于目标图像中间的卡通猫形象圈出，并保存，如图8所示。

之后，第一终端会播放语音信息，当开始播放“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”中的“左”字时，第一终端会显示被标记后的位于目标图像左下角的卡通猫形象，直到开始播放“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”中的“中”字，如图9所示。

当开始播放“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”中的“中”字时，第一终端会显示被标记后的位于目标图像中间的卡通猫形象，直到语音信息播放结束，如图10所示。

在用户通过第一终端将关键字与目标对象进行关联后，第一终端可以将语音信息(包括关键字)以及图像信息(包括与关键字对应的目标对象)合成为视频格式或带语音信息的GIF格式的目标文件。

本申请实施例提供的图像处理方法，通过根据用户的输入将语音信息中的关键字与目标对象进行关联，可以实现根据用户的意愿确定关联结果，从而可以进一步提高图片描述效率以及描述精度。

图11是本申请实施例提供的图像处理方法的流程示意图之二。参照图11，本申请实施例还提供一种图像处理方法，可以包括：

步骤1110、接收第一终端发送的目标文件；其中，目标文件包括第一终端将目标信息与目标图像中的目标对象进行关联后生成的图像信息，目标信息是针对目标对象的信息，并且包括文字信息或语音信息；

步骤1120、显示图像信息。

需要说明的是，本申请实施例提供的图像处理方法的执行主体可以是第二终端。第二终端可以是智能电子设备，例如手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等。

在步骤1110中，第二终端可以通过例如聊天APP，来接收第一终端发送的目标文件。该目标文件是第一终端根据如下方式确定的：

第一终端可以接收用户的第一输入，该第一输入用于选择目标图像，以及输入目标信息。

如图2所示，目标图像可以为包含5只卡通猫形象的图像，目标对象可以为该图像中包含的5只卡通猫形象中的至少一个。

第一终端可以响应于第一输入，将目标信息与目标对象进行关联，从而生成目标文件。

在将目标信息与目标对象进行关联后，第一终端可以根据关联结果生成目标文件，并将目标文件通过例如聊天APP等发送给第二终端。

在步骤1120中，当第二终端接收到第一终端发送的目标文件后，会对目标文件进行解析，从而显示将目标信息与目标对象进行关联后的图像信息。

在一个实施例中，在目标信息包括文字信息的情况下，步骤1120可以包括：

显示文字信息；

接收用户选中文字信息中的目标文字的第三输入；

响应于第三输入，在目标图像中显示标记后的目标对象；

其中，目标文字与目标对象对应，目标文字为第一终端标记目标对象所使用的文字。

如图5所示，当用户选中经过标记的目标文字“这只猫”时，第二终端可以响应于该输入，在目标图像中显示标记后的位于目标图像中间的卡通猫形象。

其中，目标文字“这只猫”与位于目标图像中间的卡通猫形象对应。

本申请实施例提供的图像处理方法，通过在用户选中目标文字的情况下，显示与目标文字关联的目标对象，可以进一步提高图片描述效率以及描述精度。

在一个实施例中，在第二终端接收到第一终端发送的目标文件后，可以对目标文件进行解析以确定与目标对象进行关联后的目标文字，并突出显示目标文字。

或者，在第一终端已经对目标文字进行突出显示的情况下，第二终端也可以直接突出显示目标文字。

可以理解的是，通过突出显示目标文字，可以便于第二终端的用户从文字信息中快速定位到目标文字，从而选中该目标文字以确定目标对象，进而进一步提高了对发送图片的原因和发送者想要表达的意思的理解速度。

在一个实施例中，在目标信息包括语音信息的情况下，步骤1120可以包括：

接收用户选择进行播放语音的第四输入；

响应于第四输入，在显示图像信息的情况下播放语音信息；

其中，在播放语音信息的情况下，从语音信息中关键字对应的播放时刻开始显示关键图像，直到语音信息播放结束或者开始播放下一关键字时取消显示关键图像；

关键图像是对关键字对应的目标对象进行标记后的图像。

如图12所示，目标文件的封面上可以设置播放按钮。用户可以点击该播放按钮以使第二终端开始播放语音。

第二终端接收到该输入后，会响应于该输入，在显示图像信息的情况下播放语音信息。当开始播放“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”中的“左”字时，第二终端会显示被标记后的位于目标图像左下角的卡通猫形象，直到开始播放“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”中的“中”字，如图9所示。

当开始播放“我最喜欢左下角这只猫了，中间这只猫是最小的，也很可爱”中的“中”字时，第二终端会显示被标记后的位于目标图像中间的卡通猫形象，直到语音信息播放结束，如图10所示。

本申请实施例提供的图像处理方法，通过将语音信息中的关键字与目标对象进行关联，可以实现根据用户的意愿确定关联结果，从而可以进一步提高图片描述效率以及描述精度。

需要说明的是，本申请实施例提供的图像处理方法，执行主体可以为图像处理装置，或者该图像处理装置中的用于执行图像处理方法的控制模块。本申请实施例中以图像处理装置执行图像处理方法为例，说明本申请实施例提供的图像处理装置。

图13是本申请实施例提供的图像处理装置的结构示意图之一。参照图13，本申请实施例提供一种图像处理装置，可以包括：

接收模块1310，用于接收用户的第一输入，所述第一输入包括选择目标图像，以及输入目标信息；

关联模块1320，用于响应于所述第一输入，将所述目标信息与目标对象进行关联，以生成目标文件；

发送模块1330，用于向第二终端发送所述目标文件；

其中，所述目标图像包括所述目标对象；所述目标信息与所述目标对象对应，所述目标信息包括文字信息或语音信息中的至少一项；

所述目标文件用于所述第二终端显示将所述目标信息与所述目标对象进行关联后的图像信息。

本申请实施例提供的图像处理装置，通过将图像以及针对该图像的文字或语音资源进行关联生成目标文件，可以实现视觉与文字或语音的结合，以便于接收者明白发送图片的原因和发送者想要表达的意思，从而提高了非面对面分享图片场景下的图片描述效率以及描述精度，有效提高了用户体验。

在一个实施例中，在所述目标信息包括文字信息的情况下，所述关联模块1320具体用于：

从所述文字信息中选择目标文字并在所述目标图像中标记所述目标对象；

将所述目标文字与标记后的目标对象进行关联。

在一个实施例中，所述关联模块1320具体用于：

改变所述目标对象在所述目标图像中的显示方式。

在一个实施例中，所述关联模块1320具体用于：

在所述目标文字被选中的情况下，在所述目标图像中显示标记后的目标对象。

在一个实施例中，在所述目标信息包括语音信息的情况下，所述关联模块1320具体用于：

接收用户触发语音识别和图像识别的第二输入；

响应于所述第二输入，提取所述语音信息中的关键字，并根据所述关键字从所述目标图像中确定所述目标对象；

将所述关键字与所述目标对象进行关联。

在一个实施例中，所述关联模块1320具体用于：

在播放所述语音信息的情况下，从所述语音信息中关键字对应的播放时刻开始显示关键图像，直到所述语音信息播放结束或者开始播放下一关键字时取消显示所述关键图像；

其中，所述关键帧是对所述关键字对应的目标对象进行标记后的图像。

图14是本申请实施例提供的图像处理装置的结构示意图之二。参照图14，本申请实施例提供一种图像处理装置，可以包括：

接收模块1410，用于接收第一终端发送的目标文件；其中，所述目标文件包括所述第一终端将目标信息与目标图像中的目标对象进行关联后生成的图像信息，所述目标信息是针对所述目标对象的信息，并且包括文字信息或语音信息中的至少一项；

显示模块1420，用于显示所述图像信息。

在一个实施例中，在所述目标信息包括所述文字信息的情况下，所述显示模块1420具体用于：

显示所述文字信息；

接收用户选中所述文字信息中的目标文字的第三输入；

响应于所述第三输入，在所述目标图像中显示标记后的目标对象；

其中，所述目标文字与所述目标对象对应，所述目标文字为所述第一终端标记所述目标对象所使用的文字。

在一个实施例中，在所述目标信息包括所述语音信息的情况下，所述显示模块1420具体用于：

接收用户选择进行播放语音的第四输入；

响应于所述第四输入，在显示所述图像信息的情况下播放所述语音信息；

其中，在播放所述语音信息的情况下，从所述语音信息中关键字对应的播放时刻开始显示关键图像，直到所述语音信息播放结束或者开始播放下一关键字时取消显示所述关键图像；

所述关键图像是对所述关键字对应的目标对象进行标记后的图像。

本申请实施例中的图像处理装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personaldigital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的图像处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的图像处理装置能够实现图1至图12的方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选地，如图15所示，本申请实施例还提供一种电子设备1500，包括处理器1501，存储器1502，存储在存储器1502上并可在所述处理器1501上运行的程序或指令，该程序或指令被处理器1501执行时实现上述图像处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图16为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备1600包括但不限于：射频单元1601、网络模块1602、音频输出单元1603、输入单元1604、传感器1605、显示单元1606、用户输入单元1607、接口单元1608、存储器1609、以及处理器1610等部件。

本领域技术人员可以理解，电子设备1600还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器1610逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图16中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，输入单元1604用于接收用户的第一输入，所述第一输入用于选择目标图像，以及输入目标信息；

处理器1610，用于响应于所述第一输入，将所述目标信息与所述目标对象进行关联，以生成目标文件；

射频单元1601用于向第二终端发送所述目标文件；

其中，所述目标图像包括所述目标对象；所述目标信息与所述目标对象对应，所述目标信息包括文字信息或语音信息中的至少一项；

所述目标文件用于所述第二终端显示将所述目标信息与所述目标对象进行关联后的图像信息。

本申请实施例提供的电子设备，通过将图像以及针对该图像的文字或语音资源进行关联生成目标文件，可以实现视觉与文字或语音的结合，以便于接收者明白发送图片的原因和发送者想要表达的意思，从而提高了非面对面分享图片场景下的图片描述效率以及描述精度，有效提高了用户体验。

可选地，所述处理器1610还用于：

从所述文字信息中选择目标文字并在所述目标图像中标记所述目标对象；

将所述目标文字与标记后的目标对象进行关联。

可选地，所述处理器1610具体用于改变所述目标对象在所述目标图像中的显示方式。

可选地，所述处理器1610具体用于在所述目标文字被选中的情况下，在所述目标图像中显示标记后的目标对象。

可选地，所述输入单元1604还用于接收用户触发语音识别和图像识别的第二输入；

所述处理器1610还用于：

响应于所述第二输入，提取所述语音信息中的关键字，并根据所述关键字从所述目标图像中确定所述目标对象；

将所述关键字与所述目标对象进行关联。

可选地，所述处理器1610具体用于：

其中，所述关键图像是对所述关键字对应的目标对象进行标记后的图像。

应理解的是，本申请实施例中，输入单元1604可以包括图形处理器(GraphicsProcessing Unit，GPU)16041和麦克风16042，图形处理器16041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1606可包括显示面板16061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板16061。用户输入单元1607包括触控面板16071以及其他输入设备16072。触控面板16071，也称为触摸屏。触控面板16071可包括触摸检测装置和触摸控制器两个部分。其他输入设备16072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器1609可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器110可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1610中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述图像处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述图像处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

27页详细技术资料下载

图像处理方法及装置

相关技术

网友询问留言