信息处理装置、存储介质及信息处理方法

文档序号：97860 发布日期：2021-10-12 浏览：20次 >En<

阅读说明：本技术 信息处理装置、存储介质及信息处理方法 (Information processing apparatus, storage medium, and information processing method ) 是由新川绫佳佐藤英树于 2020-08-03 设计创作，主要内容包括：本发明提供一种信息处理装置、存储介质及信息处理方法,即使在未对利用者进行认证或未对利用者的语音进行识别的情况下,也能够根据利用者的认证结果及语音的识别结果而对执行处理进行操作。信息处理装置,其特征在于,具备处理器,所述处理器进行如下处理：获取利用者的语音；利用所述语音对所述利用者进行认证,并且对该语音进行识别；将根据所述利用者的认证结果及所述语音的识别结果而不同且在执行处理的操作中使用的操作画面显示于显示部。(The invention provides an information processing apparatus, a storage medium, and an information processing method, which can operate an execution process according to the authentication result of a user and the recognition result of a voice even when the user is not authenticated or the voice of the user is not recognized. An information processing device is characterized by comprising a processor, wherein the processor performs the following processing: acquiring the voice of a user; authenticating the user with the voice and recognizing the voice; and displaying, on a display unit, an operation screen that differs according to the authentication result of the user and the recognition result of the voice and is used for an operation of executing a process.)

信息处理装置、存储介质及信息处理方法

技术领域

本发明涉及一种信息处理装置、存储介质及信息处理方法。

背景技术

已知一种使用语音对装置进行操作的技术。例如，专利文献1中记载有获取用户的语音而进行声纹认证，并按照对该语音进行语音识别而得到的文本数据来执行处理的技术。专利文献2中记载有人靠近时接收语音而进行语音识别来生成命令，且向执行命令时所需要的功能部供给电力的技术。专利文献3中记载有对利用者的语音进行识别而提取关键词，该关键词与注册到声纹图案文件中的关键词一致时，以对话形式与利用者进行互动，并按照利用者的语音指示进行图像形成的动作的技术。

专利文献1：日本特开2007-188001号公报

专利文献2：日本特开2017-028355号公报

专利文献3：日本特开2007-193138号公报

发明内容

如上述专利文献1中所记载的技术，当仅在利用者的认证及语音识别这两方面都成功的情况下执行处理时，不接受用于在未对利用者进行认证或未对利用者的语音进行识别的情况下执行处理的操作，且不执行处理。

本发明的目的在于，即使在未对利用者进行认证或未对利用者的语音进行识别的情况下，也能够根据利用者的认证结果及语音的识别结果而对处理的执行进行操作。

方案1所述的发明为信息处理装置，其特征在于，具备处理器，所述处理器进行如下处理：获取利用者的语音；利用所述语音对所述利用者进行认证，并且对该语音进行识别；将根据所述利用者的认证结果及所述语音的识别结果而不同且在执行处理的操作中使用的操作画面显示于显示部。

方案2所述的发明在方案1所述的信息处理装置中，其特征在于，当对所述利用者进行了认证时，所述操作画面根据所述语音的识别结果而不同，所述操作画面中包括对于所述进行了认证的利用者预先设定的所述处理的设定值。

方案3所述的发明在方案2所述的信息处理装置中，其特征在于，当所述设定值未被预先设定时，所述操作画面包括所述利用者之前在所述处理中使用的设定值。

方案4所述的发明在方案1所述的信息处理装置中，其特征在于，当对所述利用者进行了认证时，所述处理器不显示所述操作画面，且即使无所述操作也执行所述处理。

方案5所述的发明在方案4所述的信息处理装置中，其特征在于，当所述利用者未进行执行所述处理时所需要的工作时，所述处理器将提示所述工作的信息显示于所述显示部。

方案6所述的发明在方案1所述的信息处理装置中，其特征在于，所述处理器根据位于所述信息处理装置的正面的所述利用者的检测而进行所述利用者的认证及所述语音的识别。

方案7所述的发明在方案1所述的信息处理装置中，其特征在于，当使用所述语音未对所述利用者进行认证而对所述语音进行了识别时，所述处理器使用由摄像部拍摄的所述利用者的图像对所述利用者进行认证，使用所述图像对所述利用者进行认证时，显示所述操作画面。

方案8所述的发明在方案1所述的信息处理装置中，其特征在于，当使用所述语音未对所述利用者进行认证时，所述处理器将通过其他认证方法对所述利用者进行的认证中使用的认证画面显示于所述显示部。

方案9所述的发明在方案8所述的信息处理装置中，其特征在于，在对所述语音进行了识别的情况下，通过所述其他认证方法而对所述利用者进行了认证时，所述处理器将所述操作画面显示于显示部。

方案10所述的发明在方案1所述的信息处理装置中，其特征在于，当未对所述利用者进行认证而对所述语音进行了识别时，与对所述利用者进行了认证时显示的第1操作画面相比，所述处理器将设定值被限制的第2操作画面显示于所述显示部。

方案11所述的发明在方案1所述的信息处理装置中，其特征在于，当未对所述利用者进行认证而对所述语音进行了识别时，与对所述利用者进行了认证时相比，所述处理器限制功能。

方案12所述的发明为存储介质，其存储有用于使计算机执行如下步骤的程序：获取利用者的语音；使用所述语音对所述利用者进行认证，并且对该语音进行识别；及将根据所述利用者的认证结果及所述语音的识别结果而不同且在执行处理的操作中使用的操作画面显示于显示部。

方案13所述的发明为信息处理方法，其特征在于，包括如下步骤：获取利用者的语音；使用所述语音对所述利用者进行认证，并且对该语音进行识别；及将根据所述利用者的认证结果及所述语音的识别结果而不同且在执行处理的操作中使用的操作画面显示于显示部。

发明效果

根据本发明的第1方案，即使在未对利用者进行认证或未对利用者的语音进行识别的情况下，也能够根据利用者的认证结果及语音的识别结果而对执行处理进行操作。

根据本发明的第2方案，与对于利用者预先设定的处理的设定值不包含在操作画面中的情况相比，能够轻松地使用该设定值。

根据本发明的第3方案，与利用者在之前处理中使用的设定值不包含在操作画面中的情况相比，能够轻松地使用该设定值。

根据本发明的第4方案，利用者执行处理而未使用操作画面进行操作。

根据本发明的第5方案，可知利用者执行处理时所需要的工作。

根据本发明的第6方案，能够防止通过除了信息处理装置的利用者以外的人的语音进行利用者的认证及语音识别。

根据本发明的第7方案，即使在使用语音未对利用者进行认证的情况下，也能够利用信息处理装置。

根据本发明的第8方案，即使在使用语音未对利用者进行认证的情况下，也能够利用信息处理装置。

根据本发明的第9方案，即使在使用语音未对利用者进行认证的情况下，也能够根据利用者的认证结果及语音的识别结果而对执行处理进行操作。

根据本发明的第10方案，即使在未对利用者进行认证的情况下，也能够按照被限制的设定值而执行处理。

根据本发明的第11方案，即使在未对利用者进行认证的情况下，也能够执行功能被限制的处理。

根据本发明的第12方案，即使在未对利用者进行认证或未对利用者的语音进行识别的情况下，也能够根据利用者的认证结果及语音的识别结果而对执行处理进行操作。

根据本发明的第13方案，即使在未对利用者进行认证或未对利用者的语音进行识别的情况下，也能够根据利用者的认证结果及语音的识别结果而对执行处理进行操作。

附图说明

根据以下附图,对本发明的实施方式进行详细叙述。

图1为表示实施方式所涉及的图像处理系统100结构的一例的图；

图2为表示图像处理装置120结构的一例的图；

图3为表示语音数据库211的一例的图；

图4为表示图像处理装置120的动作的一例的流程图；

图5为表示登录画面140的一例的图；

图6为表示设定画面150的一例的图；

图7为表示菜单画面160的一例的图；

图8为表示认证结果画面170的一例的图；

图9为表示限制模式的设定处理的一例的序列图；

图10为表示传真的发送地址的设定画面175的一例的图；

图11为表示通知画面180的一例的图；

图12为表示对象处理为复印处理时的限制模式的设定画面185的一例的图；

图13为表示对象处理为传真处理时的限制模式的设定画面190的一例的图。

符号说明

100-图像处理系统，110-服务器装置，120-图像处理装置，121-处理器，122-存储器，123-通信部，124-操作部，125-显示部，126-图像读取部，127-图像形成部，128-语音获取部，129-摄像部。

具体实施方式

1.构成

图1为表示实施方式所涉及的图像处理系统100结构的一例的图。图像处理系统100具备服务器装置110和图像处理装置120。服务器装置110与图像处理装置120经由互联网等的通信线路130而连接。图像处理装置120使用利用者的语音对利用者进行认证，并且对利用者的语音进行识别并接收根据其识别结果的操作(以下，称为“语音操作”。)。当在利用者的认证中失败但在语音的识别中成功时，服务器装置110根据成为图像处理装置120的处理对象的图像而判断是否允许执行图像处理装置120的处理。服务器装置110具有对图像中包含的字符进行识别的功能。该功能例如通过OCR(Optical Character Recognition：光学字符识别)而实现。

图2为表示图像处理装置120结构的一例的图。图像处理装置120具有复印功能、打印功能、扫描功能、传真功能等对图像进行处理的复数个功能。图像处理装置120根据利用者的操作而进行实现这些功能的处理。该操作中包括语音操作和使用了画面的操作。图像处理装置120具备处理器121、存储器122、通信部123、操作部124、显示部125、图像读取部126、图像形成部127、语音获取部128及摄像部129。这些部位经由总线而连接。

处理器121通过执行程序而控制图像处理装置120的各部来进行实现图像处理装置120的功能的处理。处理器121中使用例如CPU(Central Processing Unit：中央处理器)。存储器122中存储有用于执行图像处理装置120的处理的程序和储存预先注册的利用者的语音的语音数据库211。存储器122中使用例如ROM(Read Only Memory：只读存储器)及RAM(Random Access Memory：随机存取存储器)。并且，除了ROM及RAM以外，存储器122例如还可以使用硬盘驱动器或SSD(Solid State Drive：固态驱动器)。通信部123与通信线路130连接。通信部123经由通信线路130与服务器装置110进行数据通信。操作部124使用于由利用者进行的图像处理装置120的操作。操作部124例如使用触摸面板和按钮。显示部125显示与图像处理装置120的处理有关的各种画面。显示部125例如使用液晶显示器。图像读取部126读取图像并转换为图像数据。图像读取部126例如使用图像扫描仪。图像形成部127在纸张等介质上形成与图像数据对应的图像。图像形成部127例如使用打印机。语音获取部128获取利用者的语音。语音获取部128例如使用麦克风。摄像部129拍摄利用者的图像。摄像部129例如使用相机。

图3为表示语音数据库211的一例的图。语音数据库211中包含用户ID、处理ID及语音。用户ID为唯一识别利用者的信息。处理ID为唯一识别处理的信息。该处理ID还起到作为命令选择或执行处理的命令的作用。语音为由利用者发出的各处理的操作字的语音。该语音通过利用者而预先注册。具体而言，利用者预先确定各处理的操作字，并将该操作字的语音注册到语音数据库211。例如，当利用者A将复印处理的操作字确定为“复印”时，利用者A发出“复印”这一语音。该语音通过语音获取部128获取，并转换为数字信号之后，如图3所示，对利用者A的用户ID与复印处理的处理ID的组建立关联而存储。并且，当利用者A将传真处理的操作字确定为“传真”时，利用者A发出“传真”这一语言。该语音通过语音获取部128获取，并转换为数字信号之后，如图3所示，对利用者A的用户ID与传真处理的处理ID的组建立关联而存储。

另外，语音数据库211中包含的语音并不限定于利用者自身的语音，可以为利用者的语音的特征量，也可以为通过对利用者的语音进行机器学习而得到的机器学习模型。关于机器学习模型，例如使利用者将操作字的语音发出复数次，并对这些语音进行机器学习而生成。在输入语音时，机器学习模型判别是否为相对应的利用者的语音。

2.动作

在以下说明中，当将处理器121记载为处理的主体时，这意味着通过存储在存储器122中的程序与执行该程序的处理器121的协作而处理器121进行运算或控制其他硬件组件的动作来进行处理。

图4为表示图像处理装置120的动作的一例的流程图。该动作例如在利用者利用图像处理装置120时开始。在步骤S11中，处理器121将登录画面140显示于显示部125。图5为表示登录画面140的一例的图。例如，在复印原稿图像的情况下，复印处理的操作字为“复印”时，利用者发出“复印”这一语音。

在步骤S12中，处理器121通过语音获取部128获取利用者的语音。例如，当利用者发出“复印”这一语音时，通过语音获取部128获取该语音。

在步骤S13中，处理器121使用在步骤S12中获取到的语音来进行用户认证处理和语音识别处理。这些处理并行而同时进行。即，与用户认证处理的结果无关，进行语音识别处理。另外，在此所述的“同时”可以不是完全相同的时刻，也可以稍有偏差。

在用户认证处理中使用语音对利用者进行认证。例如，对在步骤S12中获取到的语音的声纹与存储在存储器122中的语音数据库211中包含的语音的声纹进行对照。在此，当在步骤S12中获取到的语音的声纹与在语音数据库211中与利用者A的用户ID建立了关联的语音的声纹一致时，对利用者A进行认证而在用户认证中成功。另一方面，当在语音数据库211中不存在与在步骤S12中获取到的语音和声纹一致的语音时，未对利用者进行认证而在用户认证中失败。例如，对于未预先注册的利用者，语音数据库211中未注册有语音，因此用户认证失败。并且，当在语音数据库211中包含各利用者的语音的机器学习模型时，可以将在步骤S12中获取到的语音输入这些机器学习模型而判别是否为任意利用者的语音。

在语音识别处理中对利用者的语音进行识别。在此所述的“语音的识别”并不限定于对语音所表示的操作字自身进行识别，还包含识别语音所表示的操作字的对象处理的含义。例如，对在步骤S12中获取到的语音与存储在存储器122中的语音数据库211中包含的语音进行对照。在此，当在步骤S12中获取到的语音与在语音数据库211中对利用者A的用户ID与复印处理的处理ID的组建立了关联的语音一致时，对利用者A的复印处理的操作字进行识别。并且，当在语音数据库211中包含各利用者的语音的机器学习模型时，可以将在步骤S12中获取到的语音输入到这些机器学习模型而判别是否为任意处理的操作字。另一方面，例如当利用者发出表示除了操作字以外的语言的语音时，未对操作字进行识别而在语音识别中失败。

在步骤S14中，处理器121对在步骤S13中进行的用户认证处理的结果和语音识别处理的结果进行判定。例如，当用户认证和语音识别均失败时(步骤S14的判定为“用户认证失败语音识别失败”)，返回到上述步骤S11的处理。此时，可以在显示部125显示登录失败的消息。另一方面，当在用户认证和语音识别均成功时(步骤S14的判定为“用户认证成功语音识别成功”)，进入步骤S15的处理。

在步骤S15中，处理器121将通过语音识别处理识别的操作字的对象处理的设定画面150显示于显示部125。该设定画面150使用于执行对象处理的操作。执行该对象处理的操作中包含进行对象处理的设定的操作。并且，设定画面150可以包含通过用户认证识别的利用者固有的信息。设定画面150为本发明所涉及的“操作画面”或“第1操作画面”的一例。

图6为表示设定画面150的一例的图。在此，通过用户认证处理对利用者A进行识别，并通过语音识别处理对利用者A的复印处理的操作字进行识别。在该情况下，如图6所示，显示在进行复印处理的设定的操作中使用的设定画面150。利用者使用设定画面150进行复印处理的设定操作。并且，设定画面150可以为进行了认证的利用者A专用的画面。例如，当通过利用者A预先设定了复印处理的设定值时，如图6所示，设定画面150中可以包含表示该设定值的设定按钮151。该设定值可以是复数个设定值的集合。利用者可以通过进行按下设定按钮151的操作而使用预先设定的复印处理的设定值。另一方面，当未通过利用者A预先设定了复印处理的设定值时，可以在设定画面150包含表示利用者A在上一次复印处理中使用的设定值的设定按钮。在该情况下，存储器122中按每一利用者存储各处理的设定值的使用履历，并根据该使用履历确定利用者上一次使用的设定值。

另外，当通过语音识别处理对利用者A的传真处理的操作字进行了识别时，显示进行传真处理的设定的操作中使用的设定画面。同样地，当通过语音识别处理对利用者A的扫描处理的操作字进行了识别时，显示进行扫描处理的设定的操作中使用的设定画面。如此，在步骤S15中根据语音识别的结果而显示不同的设定画面。

当在上述步骤S14中判定的结果为在用户认证中成功且在语音识别中失败这一结果时(步骤S14的判定为“用户认证成功语音识别失败”)，进入步骤S16的处理。在步骤S16中，处理器121将通过用户认证处理进行了认证的利用者专用的菜单画面160显示于显示部125。菜单画面160使用于执行图像处理装置120的处理的操作。在该操作中包含选择图像处理装置120的处理的操作。并且，菜单画面160包含通过用户认证处理进行了识别的利用者固有的信息。菜单画面160为本发明所涉及的“操作画面”的一例。

图7为表示菜单画面160的一例的图。在此，通过用户认证处理对利用者A进行了识别。如图7所示，菜单画面160中包含在选择复印处理、扫描处理、传真处理的操作中所使用的选择按钮161～163。选择按钮161～163接受选择图像处理装置120的处理的操作。利用者A可以通过进行选择选择按钮161～163中的任一个的操作来选择这些处理中的任一个。若选择图像处理装置120的处理中的任一个，则显示进行该处理的设定的设定画面。例如，若进行按下选择按钮161的操作，则选择复印处理，因此显示图6所示的复印处理的设定画面150。

并且，当通过利用者A关于复印处理、扫描处理预先设定了设定值时，在菜单画面160中包含在选择根据预先设定的设定值的复印处理、扫描处理的操作中使用的选择按钮164及165。该设定值可以是复数个设定值的集合。利用者A可以通过进行按下选择按钮164或165的操作来选择根据预先设定的设定值的复印处理或扫描处理。

而且，如图7所示，菜单画面160中可以包含语音操作的引导信息166。引导信息166中可以包含特定的处理的操作字。该特定的处理例如可以为利用者A的利用频率为阈值以上的处理。在该情况下，按每一利用者计算各处理的利用频率，并存储于存储器122。例如，当基于利用者A的复印处理的利用频率为阈值以上时，引导信息166中包含表示在图3中所示的语音数据库211中与利用者A的用户ID和复印处理的处理ID建立了关联的语音所表示的“复印”这一操作字。

当在上述步骤S14中判定的结果为在用户认证中失败且在语音识别中成功这一结果时(步骤S14的判定为“用户认证失败语音识别成功”)，进入步骤S17的处理。在步骤S17中，处理器121判定是否重新进行用户认证。此时，处理器121将表示认证结果的认证结果画面170显示于显示部125。图8为表示认证结果画面170的一例的图。再次，在用户认证中失败，但通过语音识别处理对“复印”这一复印处理的操作字进行了识别。如图8所示，在认证结果画面170中包含表示在用户认证中失败的情况的认证结果和“复印”这一语音识别结果。并且，在认证结果画面170中包含在选择重新进行用户认证的操作中使用的选择按钮171和选择在限制模式执行处理的操作中使用的选择按钮172。该限制模式是指，与在用户认证中成功的情况相比，限制功能的动作模式。在限制模式中，允许执行认为从信息安全的观点考虑无问题的处理。即，在限制模式中，禁止执行认为从信息安全的观点考虑有问题的处理。如此，即使在用户认证中失败的情况下，能够执行限制模式下的处理的原因在于，无法确定利用者但在语音识别中成功，并能够对利用者所希望的处理进行识别，因此认为可以允许从信息安全的观点考虑无问题的范围内执行处理。

当重新进行用户认证时，利用者进行按下选择按钮171的操作。若进行该操作，则判定为重新进行用户认证(步骤S17的判定为“是”)，并返回到上述步骤S11的处理。另一方面，当欲在限制模式下执行处理而并不重新进行用户认证时，利用者进行按下选择按钮172的操作。若进行该操作，则判定为不重新进行用户认证(步骤S17的判定为“否”)，并进入步骤S18的限制模式的设定处理。

图9为表示限制模式的设定处理的一例的序列图。另外，服务器装置110与图像处理装置120同样地具备处理器、存储器及通信部。在以下说明中，当将服务器装置110记载为处理的主体时，这意味着通过存储在存储器中的程序与执行该程序的处理器的协作而处理器进行运算或控制其他硬件组件的动作来进行处理。

在步骤S21中，图像处理装置120的处理器121向服务器装置110发送询问是否可以执行对象处理的请求。该请求包含表示在对象处理中使用的图像的图像数据。例如，当通过语音识别处理对复印处理的操作字进行了识别时，对象处理成为复印处理，因此询问请求中包含表示通过图像读取部126读取的原稿图像的图像数据。另一方面，当在上述步骤S13中对传真处理的操作字进行了识别时，对象处理成为传真处理。在该情况下，处理器121首先将传真的发送地址的设定画面175显示于显示部125。图10为表示传真的发送地址的设定画面175的一例的图。设定画面175接受指定传真的发送地址的操作。但是，设定画面175不接受仅对预先注册的发送地址指定发送地址的操作。例如，如图10所示，在设定画面175中包含接受选择预先注册的发送地址即X公司及Y公司的操作的选择按钮176及177。另一方面，设定画面175中不包含接受指定新的发送地址的操作的操作图像，且不接受这种操作。利用者使用设定画面175进行指定发送地址的操作。例如，若利用者进行按下选择按钮176的操作，则将传真的发送地址指定为“X公司”。在该情况下，询问请求中包含表示通过图像读取部126读取的原稿图像的图像数据和表示“X公司”这一发送地址的发送地址信息。另外，该询问请求未必一定进行。例如，当对象处理为扫描处理时，可以不进行询问请求。

在步骤S22中，服务器装置110根据从图像处理装置120接收的图像数据判定是否允许执行对象处理。例如，服务器装置110通过OCR对图像数据中包含的字符进行识别。例如，当图像数据中包含特定的字符时，判定为禁止执行对象处理。该特定的字符例如为“公司机密”或“禁止复印”等字符，且可以按每一处理预先设定。并且，例如当与图像数据同时接收了发送地址信息时，判定为在表示图像数据中包含的发送地址的字符列并不表示发送地址信息所表示的发送地址的情况下，禁止执行对象处理。另一方面，在除了这些以外的情况下判定为允许执行对象处理。在步骤S23中，服务器装置110向图像处理装置120发送表示步骤S22的判定结果的响应。

在步骤S24中，图像处理装置120的处理器121根据从服务器装置110接收的响应判定是否允许执行对象处理。例如，当服务器装置110的响应表示禁止执行对象处理的判定结果时，判定为禁止执行对象处理(步骤S24的判定为“否”)。在该情况下，在步骤S25中，处理器121将通知不执行对象处理的通知画面180显示于显示部125。图11为表示当对象处理为复印处理时显示的通知画面180的一例的图。如图11所示，在通知画面180中包含表示不执行复印处理的消息。

另一方面，在上述步骤S24中，当服务器装置110的响应表示允许执行对象处理这一判定结果时，判定为允许执行对象处理(步骤S24的判定为“是”)。在该情况下，在步骤S26中，处理器121将限制模式下的对象处理的设定画面显示于显示部125。与在用户认证中成功时显示的设定画面150同样地，该限制模式的设定画面使用于执行通过语音识别处理进行了识别的操作字的对象处理的操作。该操作中包含进行对象处理的设定的操作。但是，在限制模式的设定画面中，与在用户认证中成功时显示的设定画面150相比，限制可设定的设定值。在限制模式的设定画面中，仅可设定认为从信息安全的观点考虑无问题的设定值。换言之，在限制模式的设定画面中，无法设定认为从信息安全的观点考虑有问题的设定值。限制模式的设定画面为本发明所涉及的“第2操作画面”的一例。按每一处理预先确定了在限制模式下可设定的设定值。

关于复印处理及打印处理，例如颜色仅限制为黑白，且将复印张数限制为上限以下。并且，关于打印处理，仅允许USB(Universal Serial Bus：通用串行总线)打印，并限制为无法有效地进行网络打印。该USB打印是指，打印与存储在USB存储器中的图像数据对应的图像的功能。该网络打印是指，打印与经由互联网等通信线路发送的图像数据对应的图像的功能。网络打印的利用者为不确定的复数人，相对于此，USB打印的利用者限定为位于图像处理装置120附近的人，因此认为USB打印的信息安全风险小。关于传真处理，例如发送地址被限制为预先注册的发送地址，限制成无法禁用打印发送源信息，并限制成无法进行重拔。该重拔是指，当在初次传真发送中失败时，自动进行重拔的功能。关于扫描处理，例如存储地址被限制成访客用存储地址，且图像的属性被限制成只读属性。当图像的属性为只读属性时，无法对图像进行编辑。

图12为表示对象处理为复印处理时显示的限制模式的设定画面185的一例的图。该设定画面185使用于进行复印处理的设定的操作。但是，与图6所示的设定画面150相比，设定画面185被限制成可设定的设定值。例如，设定画面150接收设定黑白的操作及设定彩色的操作，但设定画面185仅接受设定黑白的操作而不接收设定彩色的操作。并且，设定画面150在接受设定任意份的复印张数的操作，但设定画面185不接受设定大于上限的复印张数的操作。

图13为表示对象处理为传真处理时显示的限制模式的设定画面190的一例的图。该设定画面190使用于进行传真处理的设定的操作。但是，与图12所示的设定画面185同样地，在设定画面190上限制可设定的设定值。在限制模式下，能够在初始设定中进行打印发送源信息的设定有效，且在设定画面190上不接受无法进行打印发送源信息的设定的操作。而且，在设定画面190上不接受能够进行重拔的操作。

如此，根据用户认证的结果及语音识别的结果，在显示部125显示不同的操作画面。在上述步骤S15、S16或S26之后，进入图4所示的步骤S19的处理。在步骤S19中，处理器121按照通过利用者的操作设定的内容来执行处理。例如，若在图6所示的设定画面150上设定为彩色、10份之后，进行按下开始按钮153的操作时，通过图像形成部127在纸张上形成10份与图像数据对应的彩色图像。并且，若在图12所示的设定画面185上被设定为黑白、1份之后，进行按下开始按钮186的操作时，通过图像形成部127在纸张上形成1份与图像数据对应的黑白图像。在限制模式下，与在用户认证中成功的情况相比，限制执行的处理的内容。

根据上述实施方式，当在用户认证中成功且在语音识别中失败时，显示利用者的菜单画面160，当在用户认证中失败且在语音识别中成功时，显示限制模式的设定画面，因此即使在未对利用者进行认证或未对利用者的语音进行识别的情况下，也能够根据利用者的认证结果及语音的识别结果对执行处理进行操作。并且，即使在用户认证中失败的情况下在语音识别中成功时，显示限制模式下的处理的设定画面，因此能够使用被限制的设定值并从信息安全的观点考虑无问题的范围内执行功能被限制的处理。因此，当用户认证的精度低时，也能够抑制利用者的便利性下降。而且，在设定画面150及限制模式的设定画面上接受通过语音识别处理进行了识别的操作字的对象处理的操作，因此节省选择对象处理的操作时间。而且，在设定画面150及菜单画面160包含在用户认证处理中进行了认证的利用者固有的信息，因此便利性得以提高。

而且，预先注册利用者的操作字的语音，且与该语音对照而进行语音识别，因此即使例如由于口音或饶舌的问题等而利用者的发音与标准发音差异大时，也能够对操作字进行识别。其结果，语音识别的精度得以提高。而且，操作字由利用者自由确定，因此能够防止其他利用者通过冒充行为而非法进行语音操作。其结果，信息安全得以强化。并且，通过利用者的语音操作而显示设定画面150或菜单画面160，因此能够在执行处理之前确认处理的内容。如此，在执行处理之前需要由利用者进行操作，由此当语音识别的精度低时，也能够防止利用者执行与所希望的处理不同的处理。

而且，在设定画面150包含表示通过利用者预先设定的复印处理的设定值的设定按钮151，因此与不包含该设定按钮151的情况相比，能够轻松地使用该设定值。而且，当设定画面150中包含表示利用者在上一次复印处理中所使用的设定值的设定按钮时，与不包含该设定按钮的情况相比，能够轻松地使用该设定值。

3.变形例

上述实施方式为本发明的一例。本发明并不限定于上述实施方式。并且，上述实施方式可以如以下例那样变形而实施。此时，可以组合使用以下2个以上的变形例。

在上述实施方式中，在用户认证及语音识别中成功时，处理器121未必一定显示设定画面150。例如，在该情况下，处理器121可以不显示设定画面150，且无需利用者的操作而执行对象处理。例如，关于常规处理，有时通过利用者预先设定了设定值。当对象处理为这种处理时，即使不显示设定画面150且利用者不使用操作部124进行操作，也可以按照预先设定的设定值来执行处理。根据该变形例，即使利用者不进行使用了画面的操作，仅通过发出操作字的语音而执行处理。并且，该变形例中，当通过利用者未进行执行对象处理时所需要的工作时，可以将提示该工作的信息显示于显示部125。例如，当对象处理为复印处理时，在图像读取部126未放置原稿时，可以将提示放置原稿的工作的消息显示于显示部125。图像读取部126中是否放置原稿例如使用检测原稿的传感器来判定。根据该变形例，可知利用者在执行处理时所需要的工作。

在上述实施方式中，除了使用了语音的用户认证以外，还可以进行使用了通过摄像部129拍摄到的图像的用户认证。处理器121将通过摄像部129拍摄到的利用者的面部图像与预先注册的利用者的面部图像进行对照而进行利用者的认证。如此，除了使用了语音的用户认证以外，通过进行使用了图像的用户认证，能够防止例如使用预先录制在录音机中的其他人的语音进行语音操作的冒充行为。

在上述实施方式中，仅当利用者位于图像处理装置120的正面时可以进行用户认证处理及语音识别处理。该正面表示从图像处理装置120观察时对图像处理装置120进行操作的利用者站立的方向。在该情况下，若获取利用者的语音，则摄像部129对图像处理装置120的正面的图像进行拍摄。处理器121例如对通过摄像部129拍摄到的图像进行分析，由此检测位于图像处理装置120的正面的利用者。或者，处理器121可以使用红外线传感器检测位于图像处理装置120的正面的利用者。而且，当检测到位于图像处理装置120的正面的利用者时，处理器121进行用户认证处理及语音识别处理。在该情况下，如上所述，除了使用了语音的用户认证以外，还可以进行使用了通过摄像部129拍摄到的图像的用户认证。另一方面，当未检测到位于图像处理装置120的正面的利用者时，处理器121不进行用户认证处理及语音识别处理。根据该变形例，能够防止例如由除了无意对图像处理装置120进行操作的利用者以外的人发出的语音进行用户认证处理及语音识别处理。

在上述实施方式中，即使在用户认证中失败且在语音识别中成功的情况下，也可以返回到上述步骤S11而显示登录画面140。并且，返回到步骤S11时，可以通过与使用了语音的用户认证不同的其他认证方式进行用户认证。其他认证方式例如可以为使用了通过摄像部129拍摄到的利用者的图像的认证方式。在该情况下，处理器121将通过摄像部129拍摄到的利用者的面部图像与预先注册的利用者的面部图像进行对照而进行用户认证。若在用户认证中成功，则处理器121将设定画面150显示于显示部125。根据该变形例，即使在通过语音未对利用者进行认证的情况下，也能够利用图像处理装置120。

在上述实施方式中，当在用户认证中失败且在语音识别中成功时，可以替代利用者专用的菜单画面160而显示所有利用者共通的菜单画面。所有的利用者共通的菜单画面中不包含利用者固有的信息、例如选择按钮164及165以及引导信息166。

在上述实施方式中，在上述步骤S14的处理之后返回步骤S11的处理时，可以通过与使用了语音的用户认证不同的其他认证方式进行用户认证。在该情况下，处理器121将基于其他认证方法的用户认证中使用的认证画面显示于显示部125。其他认证方式例如可以为使用了通过摄像部129拍摄到的利用者的图像的认证方式。并且，在语音识别中成功的情况下，通过其他认证方法用户认证成功时，处理器121将设定画面150显示于显示部125。根据该变形例，即使在通过语音未对利用者进行认证时，也能够利用图像处理装置120来执行处理。

在上述实施方式中，操作字未必一定是处理的名称。例如，操作字中可以包含用户名。当对该操作字进行了识别时，例如显示与该用户名对应的利用者专用的菜单画面160。

上述实施方式中的图像处理系统100的处理的主体为例示而并不限定于该例。例如，在图像处理装置120中进行的处理的至少一部分可以在其他装置中进行。并且，服务器装置110中进行的处理的至少一部分可以在其他装置中进行。例如，可以替代服务器装置110而判定是否允许图像处理装置120在限制模式下执行处理。在该情况下，可以不设置服务器装置110。并且，上述实施方式中的图像处理系统100的处理为例示，只要无矛盾则可以替换顺序。

在上述实施方式中，本发明所涉及的信息处理装置并不限定于图像处理装置120。信息处理装置例如只要为智能手机、个人计算机等、根据利用者的操作而执行处理的装置，则可以为任何装置。例如，在智能手机中，当利用者发出对于电子邮件的处理预先确定的“邮件”这一操作字的语音时，可以使用该语音进行用户认证处理及语音识别处理，若在用户认证及语音识别中成功，则启动电子邮件的应用程序，并显示电子邮件的操作中使用的邮件画面。

在上述实施方式中，处理器是指广义上的处理器，且包含通用的处理器(例如CPU：Central Processing Unit(中央处理器)等)、专用的处理器(例如GPU：GraphicsProcessing Unit(图形处理器)、ASIC：Application Specific Integrated Circuit(专用集成电路)、FPGA：Field Programmable Gate Array(现场可编程门阵列)、可编程逻辑器件等)。

并且，上述实施方式中的处理器的动作并不仅由1个处理器执行，也可以由存在于物理上分离的位置上的复数个处理器协作执行。并且，处理器的各动作的顺序并不仅限定于在上述各实施方式中所记载的顺序而可以适当地进行变更。

本发明可以作为在图像处理装置120及服务器装置110的每一个中执行的程序而提供。另外，图像处理装置120及服务器装置110分别为本发明所涉及的计算机的一例。该程序可以经由互联网等通信线路而下载，也可以以记录于磁记录媒体(磁带、磁盘等)、光记录媒体(光盘等)、光磁记录媒体、半导体存储器等计算机能够读取的记录媒体的状态提供。

上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的特定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。

23页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：终端装置、图像处理装置的检索方法以及记录介质

信息处理装置、存储介质及信息处理方法

相关技术

网友询问留言