使用非常大的语料库,例如Web
语料生成方法、装置、电子设备以及存储介质
本公开提供了一种语料生成方法、装置、电子设备以及存储介质,涉及人工智能领域,尤其涉及深度学习、自然语言处理等领域。具体实现方案为:基于基础的第一反向翻译模型,生成至少一个第二反向翻译模型,其中,第二反向翻译模型的模型参数集合与第一反向翻译模型的模型参数集合不同;基于至少一个第二反向翻译模型,生成目标语言中单语语料的伪平行语料。由此,能够实现在反向翻译的过程中生成高质量且多样的语料。

2021-11-02

访问量:25

一种面向地质文本的地质实体语义关系提取方法及装置
本发明提供了一种面向地质文本资料的语义关系提取方法及装置,主要用于文本特征模式多样、内容冗余的非结构化地质文本资料中地质实体语义关系的提取。本发明充分结合了地质文本的表达特点,提供了完善的语义关系提取流程及装置。所述装置包括:地质文本输入模块;数据处理模块;数据标注模块;重要性计算模块;阈值设定模块;结果输出模块。本发明通过对地质文本资料中能够表达地质实体语义关系的词汇的相关特点进行了定量分析,提供了一种有效的面向地质文本资料的地质实体语义关系提取方法。

2021-10-08

访问量:35

信息的搜索方法、装置、设备以及存储介质
本发明公开了一种信息的搜索方法,包括:获取基础关键词;对基础关键词执行预设的自动翻译操作,得到基础关键词对应的翻译关键词;根据基础关键词和翻译关键词执行预设的搜索操作,得到基础关键词对应的搜索网页;基于每两个搜索网页之间的跳转概率值从所有的搜索网页中筛选出目标网页,以作为基础关键词的搜索结果,其中,跳转概率值是根据两个网页之间的跳转关系计算得到的数值。可见,本发明能够实现对基础关键词的多语种搜索,提高搜索的广度,且根据每两个搜索网页之间的跳转概率值对搜索网页进行筛选以得到搜索结果,从而能够实现使用相对复杂的标准进行搜索网页的筛选,提高搜索的准确度。本发明还涉及区块链技术领域。

2021-10-08

访问量:26

注册成为会员可查看更多数据。
技术分类