提取参数的预测系数

本发明公开了一种端到端语音转文本罕见词优化方法,训练集语料库对应标注文本中罕见词列表的构造,首先,整理分析训练集语料的标注文本；然后,使用分词工具对标注文本进行分词并使用SRILM语言模型工具统计单词词频；最后,将词频小于所设置的词频阈值的单词定义为罕见词,将其加入到罕见词列表中,本发明提出的一种端到端语音转文本罕见词优化技术,通过对训练集语料对应的文本标注进行统计分析,并构造包含罕见词的文本语料列表,能够有效搜索出端到端语音识别模型中未充分训练的文本语料。

2021-10-22

访问量：31

注册成为会员可查看更多数据。

热门专题

技术分类