数字模拟信息信号的电子编辑，如音频或视频信号

本公开提供了一种录制音频的方法及装置、计算设备和介质,涉及人工智能技术领域,尤其涉及语音测试集的录制。实现方案为：控制录音设备录制音频片段集合；对音频片段集合中的至少一个音频片段中的每个音频片段执行操作,操作包括：基于与该音频片段相对应的第一时间和第二时间以及声音在预定距离上的传播时延,标注该音频片段的音频在该音频片段内的开始时间；以及基于与该音频片段相对应的第一时间和第四时间、预定超时时间以及传播时延,标注该音频片段的音频在该音频片段内的结束时间。

2021-11-02

访问量：39

图像处理方法及装置

本申请公开了一种图像处理的方法及装置,属于信息处理技术领域。所述方法包括：接收用户的第一输入,所述第一输入用于选择目标图像,以及输入目标信息；响应于所述第一输入,将所述目标信息与目标对象进行关联,以生成目标文件；向第二终端发送所述目标文件；其中,所述目标图像包括所述目标对象；所述目标信息包括文字信息或语音信息中的至少一项；所述目标文件用于所述第二终端显示将所述目标信息与所述目标对象进行关联后的图像信息。

2021-11-02

访问量：55

变化音频回放

一种用于控制要在音频输出处呈现的音轨的回放拍速的方法,该音轨包括多个音频分量,多个音频分量的第一音频分量与多个音频数据组相关联,其中多个音频数据组中的每个音频数据组与相应的回放拍速范围相关联,该方法包括：接收用于在音频输出处呈现音轨的回放拍速；从多个音频数据组选择具有包括接收的回放拍速的相关联的回放拍速范围的音频数据组；以及将所选择的音频数据组分配给第一音频分量以在音频输出处呈现音轨。

2021-11-02

访问量：35

多媒体文件中moov容器的写入方法和计算机可读存储介质

本发明公开了一种多媒体文件中moov容器的写入方法以及相应的计算机可读存储介质,通过为moov容器中的每个子容器分配预留空间,预先确定各容器在存储载体中的存储位置偏移,并在整个文件写入过程中保持子容器存储位置偏移不变来更新子容器,解决moov容器写入异常所导致的多媒体文件不能读取的风险。

2021-10-26

访问量：24

视频拆条方法和装置

本申请提供了一种视频拆条方法和装置,根据多个模态的信息来决定视频拆分点,从而提高视频拆条的准确性。第一方面,提供了一种视频拆条方法,该方法包括：根据视频的镜头切换点和视频的语音停顿点获取视频的多个细粒度拆条片段；提取多个细粒度拆条片段中每个细粒度拆条片段的特征,特征包括图片特征、音频特征；根据第一神经网络模型对多个细粒度拆条片段的特征进行处理,以得到视频的拆分点预测序列,拆分点预测序列包括多个拆分点和多个拆分点对应的概率。

2021-10-22

访问量：40

数据匹配方法、装置、介质及电子设备

本公开涉及一种数据匹配方法、装置、介质及电子设备。方法包括：获取第一多媒体数据的第一特征序列和第二多媒体数据的第二特征序列；若两个序列长度不相等,则根据该两个序列,确定帧匹配距离矩阵；根据帧匹配距离矩阵中的元素,确定匹配路径的起点和终点；根据起点、终点及帧匹配距离矩阵,确定最佳匹配路径；基于最佳匹配路径,将第一多媒体数据与第二多媒体数据进行匹配。这样,可实现第一多媒体数据和第二多媒体数据的自动匹配,并保证最佳匹配路径的准确度,提升第一多媒体数据和第二多媒体数据的匹配度。由此,本公开提供的数据匹配方法,可将视频画面特征和音频节奏特征有效结合,提高用户的观看沉浸感,有身临其境的感受。

2021-10-08

访问量：33

用于从视频自动生成课程的系统和方法

本发明提供用于从视频自动生成课程的系统和方法,具体地,提出了用于自动创建外语学习课程的系统和方法。收到输入视频后,对音轨进行去噪,然后根据音轨中的句子对音轨进行分割。抄录句子,并对抄录文本中的单词评分。基于合计评分,将视频视为外语学习的正面示例或反面示例。将视频和句子的抄录文本制作为教学材料。可以对抄录文本中的单词进行标记以指示母语为另一语言的学习者可能容易说错的单词。

2021-09-28

访问量：37

注册成为会员可查看更多数据。

热门专题

技术分类