一种基于麦克风阵列的智能语音转文字及同声翻译系统

文档序号:50771 发布日期:2021-09-28 浏览:37次 >En<

阅读说明:本技术 一种基于麦克风阵列的智能语音转文字及同声翻译系统 (Intelligent voice-to-character and simultaneous interpretation system based on microphone array ) 是由 胡程远 于 2021-06-11 设计创作,主要内容包括:本发明公开了一种基于麦克风阵列的智能语音转文字及同声翻译系统,涉及语音翻译技术领域,该系统包括:麦克风阵列,由N个声学传感器构成麦克风阵列;远近场判断模块,用于对声源和麦克风阵列之间的距离进行判定,并根据距离的远近分别定义为远场波和近场波;远近场补偿模块,用于对远场波和近场波分别计算其延时,分情况对麦克风阵列进行远近场延时补偿。本发明通过设置远近场判断模块和远近场补偿模块,用于对声源和麦克风阵列之间的距离进行判定,并根据距离的远近分别定义为远场波和近场波,用于对远场波和近场波分别计算其延时,分情况对麦克风阵列进行远近场延时补偿,保证了麦克风阵列各声学传感器对待声源处理的一致性。(The invention discloses an intelligent voice character-to-character and simultaneous interpretation system based on a microphone array, which relates to the technical field of voice interpretation and comprises: a microphone array which is formed by N acoustic sensors; the far-near field judging module is used for judging the distance between the sound source and the microphone array and respectively defining the distance as far-field waves and near-field waves according to the distance; and the far-near field compensation module is used for respectively calculating the time delay of the far-field waves and the near-field waves and carrying out far-near field time delay compensation on the microphone array according to conditions. The distance between a sound source and the microphone array is judged by arranging the far-near field judging module and the far-near field compensating module, the far-near field judging module and the far-near field compensating module are respectively defined as far-field waves and near-field waves according to the distance, the far-field waves and the near-field waves are respectively used for calculating the time delay of the far-field waves and the near-field waves, the far-near field time delay compensation is carried out on the microphone array according to conditions, and the consistency of each acoustic sensor of the microphone array in processing the sound source is ensured.)

一种基于麦克风阵列的智能语音转文字及同声翻译系统

技术领域

本发明涉及语音翻译

技术领域

,尤其涉及一种基于麦克风阵列的智能语音转文字及同声翻译系统。

背景技术

在现在的国际化背景下,我们与国际友人沟通的契机越来越多,然而不同国籍的人的母语不同,不同的语言是沟通中的一个巨大障碍;尽管翻译软件、同声翻译软件都已经出现,但是根据声源由远有近,尤其对于麦克风阵列不同的声学传感器之间具备不同的延时,造成语音转文字及同声翻译由于延时的原因重复翻译,无法保证麦克风阵列各声学传感器对待声源处理的一致性。

发明内容

本发明的目的是为了解决上述的问题,而提出的一种基于麦克风阵列的智能语音转文字及同声翻译系统。

为了实现上述目的,本发明采用了如下技术方案:

一种基于麦克风阵列的智能语音转文字及同声翻译系统,该系统包括:

麦克风阵列,由N个声学传感器构成麦克风阵列,N为正整数,用于对声音信号进行实时采集;

远近场判断模块,用于对声源和麦克风阵列之间的距离进行判定,并根据距离的远近分别定义为远场波和近场波;

远近场补偿模块,用于对远场波和近场波分别计算其延时,分情况对麦克风阵列进行远近场延时补偿;

声音信号筛选模块,用于对麦克风阵列采集的声音信号进行分析,剔除其中高于70dB而低于40dB的声音;

声音特征分析模块,用于对声音信号筛选器筛选后的声音进行分析,将声音与语音数据库中语音比对判断其语言属性;

声音翻译模块,用户选择需要翻译的语言属性,声音翻译模块根据该语言属性匹配对应语言属性的文字数据库和语音数据库,将语音信号转化为用户选定语言属性的文字信号和语音信号;

显示模块,用于对声音翻译器输出的文字信号进行显示;

声音输出模块,用于对对声音翻译器输出的语音信号进行播放。

可选地,在上述的远近场判断模块中,对声源的频率λ连续采样m次并取中值,

即λ=median[f1,f2,f3,......,fm],设声学传感器之间的距离为t,若声源到麦克风阵列的距离则定义为远场波;若声源到麦克风阵列的距离则定义为近场波。

可选地,在上述的远近场补偿模块中,麦克风阵列具备N个声学传感器,声学传感器之间的间距为d,信号入射角为r,声音传播速度为v,则第N个声学传感器的延时为其中0≤N≤N-1,其中ω为声波的角频率,θ为传播方向。

可选地,该系统还包括翻译合成模块,当所述声音翻译模块中文字数据库或语音数据库无法单独翻译声源,则无法翻译的声源对应的文字或语音进行二次翻译,并将翻译内容与原文字或语音译文合成新文字或语音译文。

可选地,该系统还包括常用语存储模块,将经所有由声音翻译模块翻译的文字或语音译文存储在常用语存储模块中,在新文字或语音译文添加进常用语存储模块时,与常用语存储模块的现有文字或语音译文进行比对,若相同则标记该文字或语音译文为常用语,若不同则待常用语存储模块满载后按照时间顺序替换尚未标记为常用语的文字或语音译文。

本发明具备以下优点:

本发明通过设置远近场判断模块和远近场补偿模块,用于对声源和麦克风阵列之间的距离进行判定,并根据距离的远近分别定义为远场波和近场波,用于对远场波和近场波分别计算其延时,分情况对麦克风阵列进行远近场延时补偿,保证了麦克风阵列各声学传感器对待声源处理的一致性。

具体实施方式

实施例

由N个声学传感器构成麦克风阵列,N为正整数,用于对声音信号进行实时采集。

远近场判断模块用于对声源和麦克风阵列之间的距离进行判定,并根据距离的远近分别定义为远场波和近场波。

在上述的远近场判断模块中,对声源的频率λ连续采样m次并取中值,即λ=median[f1,f2,f3,......,fm],设声学传感器之间的距离为t,若声源到麦克风阵列的距离则定义为远场波;若声源到麦克风阵列的距离则定义为近场波。

远近场补偿模块用于对远场波和近场波分别计算其延时,分情况对麦克风阵列进行远近场延时补偿。

在上述的远近场补偿模块中,麦克风阵列具备N个声学传感器,声学传感器之间的间距为d,信号入射角为r,声音传播速度为v,则第N个声学传感器的延时为其中0≤N≤N-1,其中ω为声波的角频率,θ为传播方向。

声音信号筛选模块用于对麦克风阵列采集的声音信号进行分析,剔除其中高于70dB而低于40dB的声音。

声音特征分析模块用于对声音信号筛选器筛选后的声音进行分析,将声音与语音数据库中语音比对判断其语言属性。

声音翻译模块作用在于,用户选择需要翻译的语言属性,声音翻译模块根据该语言属性匹配对应语言属性的文字数据库和语音数据库,将语音信号转化为用户选定语言属性的文字信号和语音信号。

显示模块用于对声音翻译器输出的文字信号进行显示。

声音输出模块用于对对声音翻译器输出的语音信号进行播放。

该系统还包括翻译合成模块,当所述声音翻译模块中文字数据库或语音数据库无法单独翻译声源,则无法翻译的声源对应的文字或语音进行二次翻译,并将翻译内容与原文字或语音译文合成新文字或语音译文。

该系统还包括常用语存储模块,将经所有由声音翻译模块翻译的文字或语音译文存储在常用语存储模块中,在新文字或语音译文添加进常用语存储模块时,与常用语存储模块的现有文字或语音译文进行比对,若相同则标记该文字或语音译文为常用语,若不同则待常用语存储模块满载后按照时间顺序替换尚未标记为常用语的文字或语音译文。

以上所述,仅为本发明较佳的具体实施方式,这里无法对所有的实施方式予以穷举,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

5页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音识别测试方法、装置、测试设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!