-
公开(公告)号:CN116798411A
公开(公告)日:2023-09-22
申请号:CN202210255889.2
申请日:2022-03-15
Applicant: 清华大学 , 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G10L15/06 , G10L15/02 , G10L19/038 , G10L25/30
Abstract: 本发明公开了一种多语言训练方法、装置及存储介质,包括:通过神经网络获取音韵特征后,转化为以矢量编码的音素嵌入矢量,其中,将音韵特征编码为音韵矢量;获取声谱后,通过声学模型DNN提取声学特征;将音素嵌入矢量与声学特征进行内积后计算出音素的后验概率。采用本发明,避免了现有技术中训练音韵特征提取器的麻烦。使得跨语言zero‑shot的学习成为了可能,对于从未见过的音素,也能有较好的迁移效果。
-
公开(公告)号:CN112949255B
公开(公告)日:2025-02-18
申请号:CN201911267701.0
申请日:2019-12-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN116737885A
公开(公告)日:2023-09-12
申请号:CN202210199563.2
申请日:2022-03-02
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F40/35
Abstract: 本申请公开了一种信息处理方法、装置、设备和可读存储介质,涉及计算机技术领域,以提高端到端任务型对话系统的输出的准确性。该方法包括:获取用户的输入信息;将所述输入信息作为端到端任务型对话系统的输入,得到输出信息;其中,所述端到端任务型对话系统所采用的处理模型通过基于生成式预训练模型的有监督的预训练、并在预训练获得的模型基础上进行半监督训练获得。本申请实施例可以提高端到端任务型对话系统的输出的准确性。
-
公开(公告)号:CN112949255A
公开(公告)日:2021-06-11
申请号:CN201911267701.0
申请日:2019-12-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN116975243A
公开(公告)日:2023-10-31
申请号:CN202210453846.5
申请日:2022-04-24
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06F16/335 , G06F16/31
Abstract: 本发明提供一种社交媒体平台对话数据的处理方法、装置及设备,其中,社交媒体平台对话数据的处理方法包括:获取至少一个社交媒体平台的对话数据;对所述至少一个社交媒体平台的对话数据,分别使用所述对话数据专用的第一级过滤器进行过滤处理,得到至少一个社交媒体平台的对话数据的第一级过滤结果;将所述至少一个社交媒体平台的对话数据的第一级过滤结果,输入到通用的第二级过滤器进行过滤处理,得到第二级过滤结果;将所述第二级过滤结果,输入到对话相关性过滤器进行第三级过滤处理,得到最终的目标过滤结果。本发明的方案可以针对于不同的社交媒体平台的对话数据进行对话上下文相关性过滤处理,方便使用,具有极强的通用性和易用性。
-
公开(公告)号:CN116822807A
公开(公告)日:2023-09-29
申请号:CN202210260914.6
申请日:2022-03-16
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06Q10/0631
Abstract: 本申请公开了一种任务推荐方法、装置、分类系统及可读存储介质,属于知识图谱领域。本申请实施例的任务推荐方法包括:获取每位标注员在多个叶子概念中的每个叶子概念上的标注水平分数值;根据获取的标注水平分数值,计算每位标注员对应的混淆矩阵;该混淆矩阵中的每一项表示当对应标注员所标注的实例的真实概念为第一概念的情况下,该实例被标注为第二概念的概率;计算多个待标注实例中的每个待标注实例被标注为各个叶子概念的后验概率;根据每个待标注实例被标注为各个叶子概念的后验概率,从多个待标注实例中选取目标待标注实例,并将目标待标注实例推荐给目标标注员进行标注。根据本申请实施例,可以提升标注质量。
-
公开(公告)号:CN118800430A
公开(公告)日:2024-10-18
申请号:CN202311810246.0
申请日:2023-12-26
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本发明公开一种医疗辅助决策方法、装置、设备及存储介质,通过将待处理数据输入预先训练好的基于双任务的稀疏化模型,计算出稀疏化模型中每一任务的处理结果,双任务包括意图识别任务和疾病预测任务;当意图识别任务对于待处理数据的识别结果为疾病预测意图时,通过根据疾病预测任务对于待处理数据的疾病预测结果和待处理数据来查找医疗案例数据库,最终输出决策结果;其中,医疗案例数据库记录有医疗案例数据,每一医疗案例数据与至少一项疾病结果对应。本发明实施例通过引入基于双任务的稀疏化模型和医疗案例数据库,降低了对推断规则和专家经验的依赖性,提高了模型的集成性和可扩展性,解决了现有技术仅针对单一决策结果进行推断的问题。
-
公开(公告)号:CN118797335A
公开(公告)日:2024-10-18
申请号:CN202410106368.X
申请日:2024-01-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F18/214 , G06F40/284 , G06F40/211 , G06N20/00
Abstract: 本申请实施例提供一种模型训练方法、模型训练装置、电子设备、芯片、计算机可读存储介质及计算机程序产品,所述方法包括:提取第一任务的训练数据的第一非实体词,得到所述第一非实体词的第一表征矩阵;基于所述第一表征矩阵,生成基础模型的第一主梯度空间正交基;基于所述第一梯度空间正交基,更新所述基础模型的参数,得到第一模型。
-
公开(公告)号:CN116910176A
公开(公告)日:2023-10-20
申请号:CN202310314956.8
申请日:2023-03-28
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Inventor: 黄毅
IPC: G06F16/33 , G06F16/35 , G06F16/36 , G06F40/284
Abstract: 本申请公开了一种上下位关系获取方法、装置、设备及存储介质,涉及通信技术领域,以解决现有技术准确地获取词语之间的上下位关系的问题而发明。上下位关系获取方法,包括:将词语集合输入到预先训练的上下位关系抽取模型;通过所述上下位关系抽取模型的下位词投影模块,对所述词语集合中的词语进行上位词到下位词的映射,获取第一上下位关系映射结果;通过所述上下位关系抽取模型的上位词投影模块,对所述词语集合中的词语进行下位词到上位词的映射,获取第二上下位关系映射结果;根据所述第一上下位关系映射结果和所述第二上下位关系映射结果,通过所述上下位关系抽取模型的上下位关系分类模块,获取所述词语集合中词语之间的上下位关系。
-
公开(公告)号:CN116361424A
公开(公告)日:2023-06-30
申请号:CN202111613286.7
申请日:2021-12-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/35 , G06F18/22 , G06F18/23213 , G06F40/186
Abstract: 本申请提供一种对话回复方法、装置、通信设备及可读存储介质,其中,所述方法包括:根据预训练的小样本学习模型对回复语料进行识别,获得至少一个第一回复模板;在所述至少一个第一回复模板中将与待回复信息匹配程度最高的第一回复模板确定为目标回复模板;将所述待回复信息填入所述目标回复模板,生成第一回复语句;将所述第一回复语句下发至用户端。利用小样本学习模型构建回复模板的方式,提高回复模板生成阶段的效率,降低回复模板的生成成本,同时使回复模板的生成过程具备可扩展性,以适配人机对话系统在业务增广或业务迁移过程中的需求变化。
-
-
-
-
-
-
-
-
-