Patent search ap:("阿里巴巴集团控股有限公司") AND inv:"李宏言" Page 1

1.

发明授权
语音识别方法及装置有权

公开(公告)号：CN106683677B

公开(公告)日：2021-11-12

申请号：CN201510752397.4

申请日：2015-11-06

Applicant: 阿里巴巴集团控股有限公司

Inventor： 李晓辉 , 李宏言

IPC: G10L15/30 , G10L15/187

Abstract: 本申请公开了一种语音识别方法，包括：利用预设的语音知识源，生成包含客户端预设信息的、用于对语音信号进行解码的搜索空间；提取待识别语音信号的特征矢量序列；计算特征矢量对应于搜索空间基本单元的概率；以所述概率为输入、在所述搜索空间中执行解码操作，得到与所述特征矢量序列对应的词序列。本申请同时提供一种语音识别装置，以及另一种语音识别方法及装置。采用本申请提供的方法，由于在生成用于解码的搜索空间时包含了客户端预设信息，因此在对客户端采集的语音信号进行识别时能够相对准确地识别出与客户端相关的信息，从而可以提高语音识别的准确率，提升用户的使用体验。

2.

发明授权
基于语音的角色分离方法及装置有权

公开(公告)号：CN106683661B

公开(公告)日：2021-02-05

申请号：CN201510744743.4

申请日：2015-11-05

Applicant: 阿里巴巴集团控股有限公司

Inventor： 李晓辉 , 李宏言

IPC: G10L15/02 , G10L15/14 , G10L15/18 , G10L17/00

Abstract: 本申请公开了一种基于语音的角色分离方法，包括：从语音信号中逐帧提取特征矢量，得到特征矢量序列；为特征矢量分配角色标签；利用具有角色标签的特征矢量训练深度神经网络DNN模型；根据所述DNN模型和利用特征矢量训练得到的隐马尔科夫模型HMM，判定特征矢量序列对应的角色序列，并输出角色分离结果；其中，所述DNN模型用于根据输入的特征矢量输出对应每个角色的概率，HMM用于描述角色间的跳转关系。本申请同时提供一种基于语音的角色分离装置。本申请提供的上述方法，由于采用了具有强大特征提取能力的DNN模型对说话人角色进行建模，比传统的GMM具有更为强大的刻画能力，对角色的刻画更加精细、准确，因此能够获得更为准确的角色分离结果。

3.

发明公开
语音识别的方法及装置有权

公开(公告)号：CN107016994A

公开(公告)日：2017-08-04

申请号：CN201610057651.3

申请日：2016-01-27

Applicant: 阿里巴巴集团控股有限公司

Inventor： 李宏言

IPC: G10L15/08 , G10L15/26 , G10L15/10

Abstract: 本申请提供了一种语音识别的方法及装置。其中，该方法包括：利用基于汉字的语音识别，对待识别命名实体语音进行语音识别，以识别出作为所述待识别命名实体语音的汉字识别结果的汉字序列；利用基于拼音的语音识别，对所述待识别命名实体语音进行语音识别，以识别出作为所述待识别命名实体语音的拼音识别结果的拼音序列；根据识别出的所述汉字序列和所述拼音序列，确定特定命名实体列表中的各个候选命名实体与所述待识别命名实体语音的相似度；根据所述各个候选命名实体与所述待识别命名实体语音的相似度，从所述特定命名实体列表中确定所述待识别命名实体语音的语音识别结果。本申请提高了对命名实体语音的识别的准确性。

4.

发明公开
一种设定操作的执行方法及装置有权

公开(公告)号：CN106940998A

公开(公告)日：2017-07-11

申请号：CN201511029741.3

申请日：2015-12-31

Applicant: 阿里巴巴集团控股有限公司

Inventor： 王志铭 , 李宏言

IPC: G10L15/06 , G10L15/16

CPC classification number: G10L15/06 , G10L15/063 , G10L15/16

Abstract: 本申请公开了一种设定操作的执行方法及装置，该方法包括：获得语音信号声学特征，将获得的各语音信号声学特征输入训练好的神经网络模型；其中，对所述神经网络模型进行训练所用的样本，至少包含设定词对应的语音信号声学特征样本；根据训练好的神经网络模型输出的、所述各语音信号声学特征对应于与所述设定词对应的音素的概率，判断是否执行设定操作。本申请中采用的神经网络模型进行计算的方式，可以有效降低计算量级，减少耗费的处理资源。

5.

发明授权
一种设定操作的执行方法及装置有权

公开(公告)号：CN106940998B

公开(公告)日：2021-04-16

申请号：CN201511029741.3

申请日：2015-12-31

Applicant: 阿里巴巴集团控股有限公司

Inventor： 王志铭 , 李宏言

IPC: G10L15/06 , G10L15/16

Abstract: 本申请公开了一种设定操作的执行方法及装置，该方法包括：获得语音信号声学特征，将获得的各语音信号声学特征输入训练好的神经网络模型；其中，对所述神经网络模型进行训练所用的样本，至少包含设定词对应的语音信号声学特征样本；根据训练好的神经网络模型输出的、所述各语音信号声学特征对应于与所述设定词对应的音素的概率，判断是否执行设定操作。本申请中采用的神经网络模型进行计算的方式，可以有效降低计算量级，减少耗费的处理资源。

6.

发明授权
对待测试语音识别系统的自动测试方法和装置有权

公开(公告)号：CN107039050B

公开(公告)日：2020-12-04

申请号：CN201610081167.4

申请日：2016-02-04

Applicant: 阿里巴巴集团控股有限公司

Inventor： 李宏言

IPC: G10L25/75 , G10L13/08 , G06F40/40 , G06F40/279

Abstract: 本申请提供了一种对待测试语音识别系统的自动测试方法和装置。该方法包括：对测试文本进行具有不同转换参数的文语转换，得到不同的测试语音；将得到的不同的测试语音输入待测试语音识别系统，得到所述待测试语音识别系统对所述测试语音的识别结果；将所述识别结果与所述测试文本比对，得到所述待测试语音识别系统的测试结果。本申请满足了语音识别系统的自动、快速的测试需求。

7.

发明授权
一种中文词语发音预测方法及装置有权

公开(公告)号：CN106910497B

公开(公告)日：2021-04-16

申请号：CN201510976061.6

申请日：2015-12-22

Applicant: 阿里巴巴集团控股有限公司

Inventor： 王志铭 , 李晓辉 , 李宏言

IPC: G10L15/16 , G10L25/48

Abstract: 本申请公开了一种中文词语发音预测方法及装置，该方法包括：获取包含各词语与发音音素序列之间的对应关系的训练集，其中，所述词语中包含的每个字是用反映了该字的语义的字向量表示的；根据所述训练集，对深度神经网络进行训练，获得中文词语发音预测模型，以用于对目标新词进行发音预测。通过上述方法，所述各词语可以从现有的语音识别发音词典中获取，可以根据生成的中文词语发音预测模型，预测出新词语对应的发音音素序列，并加入现有的语音识别发音词典中，因此，可以提高语音识别的准确性。

8.

发明公开
一种中文词语发音预测方法及装置有权

公开(公告)号：CN106910497A

公开(公告)日：2017-06-30

申请号：CN201510976061.6

申请日：2015-12-22

Applicant: 阿里巴巴集团控股有限公司

Inventor： 王志铭 , 李晓辉 , 李宏言

IPC: G10L15/16 , G10L25/48

CPC classification number: G10L15/16 , G10L25/48

Abstract: 本申请公开了一种中文词语发音预测方法及装置，该方法包括：获取包含各词语与发音音素序列之间的对应关系的训练集，其中，所述词语中包含的每个字是用反映了该字的语义的字向量表示的；根据所述训练集，对深度神经网络进行训练，获得中文词语发音预测模型，以用于对目标新词进行发音预测。通过上述方法，所述各词语可以从现有的语音识别发音词典中获取，可以根据生成的中文词语发音预测模型，预测出新词语对应的发音音素序列，并加入现有的语音识别发音词典中，因此，可以提高语音识别的准确性。

9.

发明公开
基于语音的角色分离方法及装置有权

公开(公告)号：CN106683661A

公开(公告)日：2017-05-17

申请号：CN201510744743.4

申请日：2015-11-05

Applicant: 阿里巴巴集团控股有限公司

Inventor： 李晓辉 , 李宏言

IPC: G10L15/02 , G10L15/14 , G10L15/18 , G10L17/00

Abstract: 本申请公开了一种基于语音的角色分离方法，包括：从语音信号中逐帧提取特征矢量，得到特征矢量序列；为特征矢量分配角色标签；利用具有角色标签的特征矢量训练深度神经网络DNN模型；根据所述DNN模型和利用特征矢量训练得到的隐马尔科夫模型HMM，判定特征矢量序列对应的角色序列，并输出角色分离结果；其中，所述DNN模型用于根据输入的特征矢量输出对应每个角色的概率，HMM用于描述角色间的跳转关系。本申请同时提供一种基于语音的角色分离装置。本申请提供的上述方法，由于采用了具有强大特征提取能力的DNN模型对说话人角色进行建模，比传统的GMM具有更为强大的刻画能力，对角色的刻画更加精细、准确，因此能够获得更为准确的角色分离结果。

10.

发明公开
语音识别方法及其系统有权

公开(公告)号：CN105845127A

公开(公告)日：2016-08-10

申请号：CN201510017014.9

申请日：2015-01-13

Applicant: 阿里巴巴集团控股有限公司

Inventor： 李宏言

IPC: G10L15/02 , G10L15/06 , G10L21/0208 , G10L21/16

Abstract: 本发明涉及语音识别领域，公开一种语音识别方法及系统。语音识别方法包括以下步骤：对获取的N路语音信号分别进行频谱分析，得到多维的N路初步频谱特征参数，输入预先训练好的基于深层神经网络的听觉感知模型的N个实例中进行特征变换，得到N路经提练的听觉感知特征；将N路经提练的听觉感知特征的组合输入预先训练好的声学分类模型中，对输出进行解码以识别出语音信号所对应的文字内容。本发明中，通过对获取的多路语音信号分别进行频谱分析和特征变换，实现对听觉感知的互补作用，提取得到的听觉感知特征更符合人耳听觉感知的特点，能够提高语音识别准确率和抗噪能力。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification