自然语言生成
语料生成方法、装置、电子设备以及存储介质
本公开提供了一种语料生成方法、装置、电子设备以及存储介质,涉及人工智能领域,尤其涉及深度学习、自然语言处理等领域。具体实现方案为:基于基础的第一反向翻译模型,生成至少一个第二反向翻译模型,其中,第二反向翻译模型的模型参数集合与第一反向翻译模型的模型参数集合不同;基于至少一个第二反向翻译模型,生成目标语言中单语语料的伪平行语料。由此,能够实现在反向翻译的过程中生成高质量且多样的语料。

2021-11-02

访问量:25

语音翻译文本校正系统、方法、装置及设备
本申请公语音翻译文本校正系统、方法、装置及相关设备。其中,所述系统通过服务端确定与客户端实时采集的语音流数据对应的源语言文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后第一子句文本,确定与第一子句文本对应的目标语言第二子句文本,将第二子句文本发送至客户端;客户端实时采集语音流数据,发送语音流数据;以及,显示文本片段,确定第一子句文本,发送第一子句文本;以及,显示第二子句文本。采用这种处理方式,使得随着实时语音识别进度,对原文子句文本进行人工校正,并在一句话识别完成前,对经过人工校正的原文子句文本进行翻译,实现子句粒度的翻译文本校正处理;因此,可以有效提升校正效率和校正质量。

2021-11-02

访问量:32

文本生成方法、装置、电子设备和存储介质
本公开公开了文本生成方法、装置、电子设备和存储介质,涉及自然语言处理技术领域。在对上文文本进行编码得到编码序列后,针对上文文本的编码序列和可控属性进行解码,得到下文文本的隐状态,从而使得下文文本的隐状态是符合可控属性的。进而再对符合可控属性的该隐状态和上文文本的编码序列进行下一步的解码,使得解码出的下文文本在语义上是针对该上文文本的回复。通过对下文文本的生成过程拆分为两步,使得第一步生成的下文文本的隐状态是符合可控属性的,基于此进行下一步解码,使得解码得到的下文文本在语义上是针对该上文文本的回复,同时符合了可控属性,使得下文文本的生成质量得到了提升。

2021-10-26

访问量:19

神经机器翻译系统
本申请涉及神经机器翻译系统。用于神经机器翻译的方法、系统和设备,其包括在计算机存储介质上编码的计算机程序。系统中的一个包括编码器神经网络和解码器子系统,编码器神经网络包括:正向输入长短期记忆LSTM层,被配置成以正向次序对输入序列中的每个输入语言符号进行处理,以生成每个输入语言符号的相应正向表示;反向输入LSTM层,被配置成以反向次序对每个输入语言符号进行处理,以生成每个输入语言符号的相应反向表示;以及多个隐藏LSTM层,被配置成以正向次序对输入语言符号中的每个的相应组合表示进行处理,以生成输入序列中的每个的相应编码表示;解码器子系统被配置成接收相应编码表示且对编码表示进行处理以生成输出序列。

2021-10-26

访问量:25

富文本文档的翻译方法及装置
本申请公开了一种富文本文档的翻译方法及装置,所述翻译方法包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。

2021-10-22

访问量:39

自然语言编程方法、装置、设备及存储介质
本发明涉及一种自然语言编程方法、装置、设备及存储介质,该方法包括:接收用户输入的自然语言描述的目标场景,所述目标场景包括人物和目标任务;将所述目标场景输入至预先训练好的语言模型;利用所述语言模型,生成与所述人物执行所述目标任务的结果对应的文本,作为编程结果文本。利用本发明的自然语言编程方法,实现了利用自然语言来进行编程。

2021-10-22

访问量:31

一种机器与人工翻译相融合的口语翻译方法
本发明提供一种机器与人工翻译相融合的口语翻译方法。所述机器与人工翻译相融合的口语翻译方法包括以下步骤:S1:获取待识别语音数据,对语音数据进行语种识别并确定语种类型;S2:对所述语音数据进行识别并进行断句,得到以句子为单位的输入文本;S3:建立机器翻译模型,将所述输入文本带入所述机器翻译模型进行翻译并得到机器翻译结果;S4:对所述机器翻译结果进行置信度打分;S5:由人工翻译所输入文本获得人工翻译结果并进行质量评估;S6:根据所述机器翻译结果的翻译置信度评估以及所述人工翻译结果的质量评估。本发明提供的机器与人工翻译相融合的口语翻译方法具有语种覆盖面广、翻译时考虑外部世界场景信息因素、翻译准确率高的优点。

2021-10-19

访问量:34

基于语义理解的从文本序列到指令序列的在线翻译系统及方法
本发明提出基于语义理解的从文本序列到指令序列的在线翻译,尤其涉及研究利用语言预训练模型和深度学习来进行文本序列到指令序列的翻译,属于自然语言处理领域;为解决现有技术中无法将人工文本和json语言进行直接转换以及文本转换过程中复杂语句无法翻译的问题;本发明引入模板生成层,可以根据训练数据中的SQL语句,抽取出SQL模板,让模型可以根据输入问句不同,选择不同的模板,依据模板进而可以划分出不同的SQL子任务,在此基础上生成结构复杂的SQL语句;拓展了填充SQL子语句的方法,可以生成复杂的SQL语句;并且不需要额外的编码器和解码器,除此之外,也不需要引入额外的中间表示层,这些特点降低了模型复杂度,并且能提高模型泛化能力。

2021-10-19

访问量:34

适配自动化助理以用多种语言使用
本文所述的技术可以用于增加自动化助理系统的语言覆盖范围,即它们可以用于增加自动化助理能够递送合理响应的一种或多种非本机语言的查询的数量。例如,本文描述了用于训练和利用机器翻译模型来将一种语言的多个语义相关自然语言输入映射到另一种语言的一个或多个规范翻译的技术。在各种实现方式中,规范翻译可以被选择和/或优化以用于由自动化助理确定说话者的意图,使得可以基于说话者的意图来执行一个或多个响应动作。换句话说,规范翻译可以被具体格式化以用于向自动化助理指示说话者的意图。

2021-09-17

访问量:43

注册成为会员可查看更多数据。
技术分类