-
公开(公告)号:CN115083437A
公开(公告)日:2022-09-20
申请号:CN202210535600.2
申请日:2022-05-17
Applicant: 北京语言大学
Abstract: 本发明涉及发音质量评估技术领域,特别是指一种确定学习者发音的不确定性的方法及装置。方法包括:获取学习者的发音数据;基于所述学习者的发音数据,获取基准测听数据;基于所述学习者的发音数据以及所述基准测听数据,构建所述学习者的音素混淆矩阵,根据所述学习者的音素混淆矩阵,确定所述学习者的发音的不确定性。采用本发明,可以对学习者发音的不确定性进行量化,并且对不同音素发音的不确定性进行单一向量的对比研究。
-
公开(公告)号:CN110349567B
公开(公告)日:2022-09-13
申请号:CN201910741238.2
申请日:2019-08-12
Applicant: 腾讯科技(深圳)有限公司 , 北京语言大学
Abstract: 本发明公开了一种语音信号的识别方法和装置、存储介质及电子装置。其中,该方法包括:在目标应用中获取与第一目的语的目标文本对应的第一目的语的第一语音信号;在目标应用中获取由目标识别模型对第一语音信号进行识别的识别结果,其中,目标识别模型中的目标声学模型是使用第一目的语的第一训练数据和第二目的语的第二训练数据对初始声学模型进行训练得到的模型,目标声学模型用于输出第一语音信号中每一帧信号对应于第一目的语中的目标音素的概率;在识别结果表示第一语音信号中存在发音偏误的音素的情况下,在目标应用中标记目标文本中与发音偏误的音素对应的字符。本发明解决了相关技术中语音偏误检测不准确的技术问题。
-
公开(公告)号:CN114999526A
公开(公告)日:2022-09-02
申请号:CN202210466983.2
申请日:2022-04-29
Applicant: 北京语言大学
Abstract: 本发明公开了一种利用发音属性和参考文本的发音偏误检测方法及装置,所述方法包括:提取二语学习者语音帧的发音属性,得到第一发音属性序列;将参考文本中的标准音素序列映射到发音属性,得到第二发音属性序列;采用逐块注意力机制,将第一发音属性序列和第二发音属性序列进行分块对齐;对齐后提取音素向量,并与声学特征和发音特征拼接后作为检测模型的输入,进行发音偏误检测。本发明在发音偏误检测任务中加入参考文本信息,采用逐块注意力机制,利用发音属性作为约束条件将参考文本和二语学习者的语音分块对齐,利用参考文本中有效信息的同时避免了引入误导性信息和造成对误发音的错误接受,提升了系统音素识别能力和发音偏误检测能力。
-
公开(公告)号:CN114417838B
公开(公告)日:2022-06-21
申请号:CN202210336467.8
申请日:2022-04-01
Applicant: 北京语言大学
IPC: G06F40/247 , G06F40/289
Abstract: 本发明涉及同义语块对提取技术领域,特别是指一种基于transformer模型提取同义语块对的方法,方法包括:获取待提取语句对并输入到transformer模型,获取transformer模型内部的ec_att_matrix和ecdc_att_matrix;在ec_att_matrix中,确定满足第一条件的最小内部矩阵,记录对应的语块以及标号,将语块确定为Query语块;对每个Query语块,确定满足第二条件的最小矩阵,确定Query语块对应的Title语块;根据Query语块以及对应的Title语块确定同义语块对。采用本发明,可以解决口语与书面语表达不一致的检索问题,提高效率和准确率。
-
公开(公告)号:CN114139532B
公开(公告)日:2022-04-19
申请号:CN202210113483.0
申请日:2022-01-30
Applicant: 北京语言大学
IPC: G06F40/242 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种基于多任务框架进行简单释义生成的方法与系统,所述方法包括:构建训练数据集,所述训练数据集中包含待释义词、待释义词所在上下文的知识信息、待释义词对应的释义以及简单句的知识信息;构建释义生成模型,用于为待释义词生成释义;使用所述训练数据集对所述释义生成模型进行训练;利用训练好的释义生成模型对未包含在所述训练数据集中的待释义词进行释义生成,同时生成复杂释义和简单释义。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有技术在生成释义时没有考虑释义复杂度,不能生成对二语学习者友好的简单释义的问题。
-
公开(公告)号:CN114283852A
公开(公告)日:2022-04-05
申请号:CN202111004261.7
申请日:2021-08-30
Applicant: 腾讯科技(深圳)有限公司 , 北京语言大学
Abstract: 本申请涉及一种发音偏误检测方法、装置、计算机设备和存储介质。所述方法包括:获取语音信息以及语音信息对应的标准发音文本信息;根据语音信息和标准发音文本信息进行语音识别,获得语音信息对应的预测发音文本信息;根据预测发音文本信息和标准发音文本信息,对语音信息的发音偏误进行检测。采用本方法能够提升发音偏误检测准确性。
-
公开(公告)号:CN114139532A
公开(公告)日:2022-03-04
申请号:CN202210113483.0
申请日:2022-01-30
Applicant: 北京语言大学
IPC: G06F40/242 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种基于多任务框架进行简单释义生成的方法与系统,所述方法包括:构建训练数据集,所述训练数据集中包含待释义词、待释义词所在上下文的知识信息、待释义词对应的释义以及简单句的知识信息;构建释义生成模型,用于为待释义词生成释义;使用所述训练数据集对所述释义生成模型进行训练;利用训练好的释义生成模型对未包含在所述训练数据集中的待释义词进行释义生成,同时生成复杂释义和简单释义。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有技术在生成释义时没有考虑释义复杂度,不能生成对二语学习者友好的简单释义的问题。
-
公开(公告)号:CN114023346A
公开(公告)日:2022-02-08
申请号:CN202111285653.5
申请日:2021-11-01
Applicant: 北京语言大学
IPC: G10L21/0208 , G10L25/30
Abstract: 本发明涉及一种可分离循环注意力的语音增强方法,包括步骤1:将语音信号输入至前置网络单元进行傅里叶变换,输出第一幅度流信号和第一相位流信号;步骤2:将所述第一幅度流信号和第一相位流信号输入注意力网络单元进行降噪,输出第二幅度流信号和第二相位流信号;所述注意力网络单元包括串联的多级极坐标注意力模块,每级极坐标注意力模块包括幅度注意力模块、相位自调节模块、相位它调节模块;步骤3:将所述第二幅度流信号和第二相位流信号输入至后置网络单元进行逆傅里叶变换,输出增强后的语音信号。本发明计算量小,能够有效保证语音降噪效果。
-
公开(公告)号:CN113934850A
公开(公告)日:2022-01-14
申请号:CN202111289536.6
申请日:2021-11-02
Applicant: 北京语言大学
Abstract: 本发明公开了一种融合文本分布律特征的中文文本可读性评价方法及系统,所述方法包括:确定文本特征候选集,所述文本特征候选集包括:字、词、句、篇、分布律、可读性公式六类特征;计算用于拟合可读性公式参数和用于训练机器学习模型的训练篇章文本的上述六类特征的特征值;基于所述文本特征候选集中的特征及计算的特征值,进行可读性公式设计或者机器学习模型训练;利用设计的可读性公式或者训练的机器学习模型对任意篇章文本进行可读性预测。本发明将文本分布律特征与字、词、句、篇、可读性公式特征相结合,经过特征选择后,进行可读性公式设计和机器学习模型训练,篇章文本可读性预测准确率有明显提升。
-
公开(公告)号:CN113569016A
公开(公告)日:2021-10-29
申请号:CN202111132931.3
申请日:2021-09-27
Applicant: 北京语言大学
Abstract: 本发明公开了一种基于Bert模型的专业术语提取方法及装置,涉及词语提取技术领域,方法包括:将待提取数据分别输入到通用Bert模型以及专业Bert模型,得到通用attention矩阵以及专业attention矩阵;在专业attention矩阵中确定出满足成词条件的最小矩阵,将最小矩阵对应的词语加入到专业术语候选集;在通用attention矩阵中确定专业术语候选集中的词语对应的关系矩阵,将不满足成词条件的词语确定为专业术语。采用本发明,可以节省成本,提高专业术语提取的准确率。
-
-
-
-
-
-
-
-
-