Patent search ap:("清华大学") AND inv:"史慧宇" Page 1

1.

发明授权
一种语音提取方法、装置及设备有权

公开(公告)号：CN113744719B

公开(公告)日：2024-08-06

申请号：CN202111032297.6

申请日：2021-09-03

Applicant: 清华大学

Inventor： 史慧宇 , 尹首一 , 韩慧明 , 刘雷波 , 魏少军

IPC: G10L15/02 , G10L15/06 , G10L21/0272

Abstract: 本说明书实施例提供一种语音提取方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号；利用所述混合语音样本数据训练预设语音分离模型，得到预训练语音分离模型；基于所述预训练语音分离模型构建策略网络和评估网络；所述策略网络和评估网络对应有网络参数；基于所述网络参数确定目标量化策略；利用目标量化策略更新所述预训练语音分离模型得到语音提取模型；利用所述语音提取模型从待处理语音数据中提取目标对象语音信号。上述方法减小了语音提取模型的规模，进而快速有效地对单通道语音中的目标对象的语音实现了分离。

2.

发明公开
一种语音提取方法、装置及设备有权

公开(公告)号：CN113782006A

公开(公告)日：2021-12-10

申请号：CN202111033767.0

申请日：2021-09-03

Applicant: 清华大学

Inventor： 史慧宇 , 尹首一 , 韩慧明 , 刘雷波 , 魏少军

IPC: G10L15/02 , G10L15/06 , G10L21/0272

Abstract: 本说明书实施例提供一种语音提取方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据为单通道语音信号；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和向导语音；所述向导语音包括对应于目标对象的语音；构建语音分离网络；所述语音分离网络包括编码器、全局编码器、向导模块、分离模块和解码器；基于预设损失函数和所述预测目标语音更新所述语音分离网络得到语音提取模型；利用所述语音提取模型从待处理语音数据中提取目标对象语音信号；所述待处理语音数据包括单通道语音信号。上述方法准确有效地从单通道语音中进行了语音提取，满足了后续语音处理的相关需求。

3.

发明授权
一种语音提取方法、装置及设备有权

公开(公告)号：CN113782006B

公开(公告)日：2024-08-20

申请号：CN202111033767.0

申请日：2021-09-03

Applicant: 清华大学

Inventor： 史慧宇 , 尹首一 , 韩慧明 , 刘雷波 , 魏少军

IPC: G10L15/02 , G10L15/06 , G10L21/0272

Abstract: 本说明书实施例提供一种语音提取方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据为单通道语音信号；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和向导语音；所述向导语音包括对应于目标对象的语音；构建语音分离网络；所述语音分离网络包括编码器、全局编码器、向导模块、分离模块和解码器；基于预设损失函数和所述预测目标语音更新所述语音分离网络得到语音提取模型；利用所述语音提取模型从待处理语音数据中提取目标对象语音信号；所述待处理语音数据包括单通道语音信号。上述方法准确有效地从单通道语音中进行了语音提取，满足了后续语音处理的相关需求。

4.

发明公开
一种基于语音提取的模型训练方法、装置及设备有权

公开(公告)号：CN113763936A

公开(公告)日：2021-12-07

申请号：CN202111032300.4

申请日：2021-09-03

Applicant: 清华大学

Inventor： 尹首一 , 史慧宇 , 韩慧明 , 刘雷波 , 魏少军

IPC: G10L15/06 , G10L15/16 , G10L15/02

Abstract: 本说明书实施例提供一种基于语音提取的模型训练方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据为单通道语音信号；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号；构建初始语音提取模型；所述初始语音提取模型包括基于深度神经网络所构建的模型；将所述混合语音样本数据输入所述初始语音提取模型得到预测目标语音；基于所述预测目标语音和预设损失函数对所述初始语音提取模型进行优化，得到语音提取模型；所述语音提取模型用于对单通道语音信号中的目标语音信号进行提取。上述方法准确有效地从单通道语音中进行了语音提取，满足了后续语音处理的相关需求。

5.

发明公开
一种语音提取方法、装置及设备有权

公开(公告)号：CN113744719A

公开(公告)日：2021-12-03

申请号：CN202111032297.6

申请日：2021-09-03

Applicant: 清华大学

Inventor： 史慧宇 , 尹首一 , 韩慧明 , 刘雷波 , 魏少军

IPC: G10L15/02 , G10L15/06 , G10L21/0272

Abstract: 本说明书实施例提供一种语音提取方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号；利用所述混合语音样本数据训练预设语音分离模型，得到预训练语音分离模型；基于所述预训练语音分离模型构建策略网络和评估网络；所述策略网络和评估网络对应有网络参数；基于所述网络参数确定目标量化策略；利用目标量化策略更新所述预训练语音分离模型得到语音提取模型；利用所述语音提取模型从待处理语音数据中提取目标对象语音信号。上述方法减小了语音提取模型的规模，进而快速有效地对单通道语音中的目标对象的语音实现了分离。

6.

发明授权
一种基于语音提取的模型训练方法、装置及设备有权

公开(公告)号：CN113763936B

公开(公告)日：2025-01-24

申请号：CN202111032300.4

申请日：2021-09-03

Applicant: 清华大学

Inventor： 尹首一 , 史慧宇 , 韩慧明 , 刘雷波 , 魏少军

IPC: G10L15/06 , G10L15/16 , G10L15/02

Abstract: 本说明书实施例提供一种基于语音提取的模型训练方法、装置及设备。所述方法包括：获取混合语音样本数据；所述混合语音样本数据为单通道语音信号；所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号；构建初始语音提取模型；所述初始语音提取模型包括基于深度神经网络所构建的模型；将所述混合语音样本数据输入所述初始语音提取模型得到预测目标语音；基于所述预测目标语音和预设损失函数对所述初始语音提取模型进行优化，得到语音提取模型；所述语音提取模型用于对单通道语音信号中的目标语音信号进行提取。上述方法准确有效地从单通道语音中进行了语音提取，满足了后续语音处理的相关需求。

Patent Agency Ranking