-
公开(公告)号:CN116798411A
公开(公告)日:2023-09-22
申请号:CN202210255889.2
申请日:2022-03-15
Applicant: 清华大学 , 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G10L15/06 , G10L15/02 , G10L19/038 , G10L25/30
Abstract: 本发明公开了一种多语言训练方法、装置及存储介质,包括:通过神经网络获取音韵特征后,转化为以矢量编码的音素嵌入矢量,其中,将音韵特征编码为音韵矢量;获取声谱后,通过声学模型DNN提取声学特征;将音素嵌入矢量与声学特征进行内积后计算出音素的后验概率。采用本发明,避免了现有技术中训练音韵特征提取器的麻烦。使得跨语言zero‑shot的学习成为了可能,对于从未见过的音素,也能有较好的迁移效果。
-
公开(公告)号:CN112949255B
公开(公告)日:2025-02-18
申请号:CN201911267701.0
申请日:2019-12-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN116450921A
公开(公告)日:2023-07-18
申请号:CN202210001415.5
申请日:2022-01-04
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06F16/9535 , G06N3/04 , G06N3/096
Abstract: 本发明提供一种兴趣信息的推荐方法、装置及设备。兴趣信息的推荐方法,包括:获取用户的当前操作数据的上下文信息;将所述上下文信息输入预设兴趣推荐模型进行处理,得到目标兴趣分布;根据所述目标兴趣分布,产生推荐的兴趣信息。本发明的方案根据预设兴趣推荐模型推断用户当前的兴趣分布,进而决定推荐符合用户兴趣的产品,可以平衡不同种类用户的需求。
-
公开(公告)号:CN116958616A
公开(公告)日:2023-10-27
申请号:CN202210373908.1
申请日:2022-04-11
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V10/774 , G06N3/084
Abstract: 本申请提供一种分类模型训练方法、图像识别方法及相关设备,分类模型训练方法包括:使用图像分类模型分别对多个第一样本数据进行前向传播计算,以得到多个第一样本数据的第一损失值,图像分类模型包括多个出口,每一第一样本数据的第一损失值包括在多个出口的损失值,多个第一样本数据为第一采样得到的图像帧数据;使用权重预测模型对多个第一样本数据的第一损失值进行权重预测,得到多个第一样本数据分别在每一出口的目标权重;基于多个第一样本数据分别在每一出口的预测权重,以及多个第一样本数据的第一损失值,对图像分类模型进行训练,得到用于对图像进行分类的图像分类模型。本申请可以提升模型性能。
-
公开(公告)号:CN116737885A
公开(公告)日:2023-09-12
申请号:CN202210199563.2
申请日:2022-03-02
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F40/35
Abstract: 本申请公开了一种信息处理方法、装置、设备和可读存储介质,涉及计算机技术领域,以提高端到端任务型对话系统的输出的准确性。该方法包括:获取用户的输入信息;将所述输入信息作为端到端任务型对话系统的输入,得到输出信息;其中,所述端到端任务型对话系统所采用的处理模型通过基于生成式预训练模型的有监督的预训练、并在预训练获得的模型基础上进行半监督训练获得。本申请实施例可以提高端到端任务型对话系统的输出的准确性。
-
公开(公告)号:CN112949255A
公开(公告)日:2021-06-11
申请号:CN201911267701.0
申请日:2019-12-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN116744325A
公开(公告)日:2023-09-12
申请号:CN202210210062.X
申请日:2022-03-04
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
Abstract: 本发明提供一种基站流量预测方法及相关设备,涉及通信领域,其中,所述基站流量预测方法包括:根据基站之间的地理距离信息,确定待预测基站的临近基站;确定临近基站中的邻居基站,邻居基站的历史流量记录与待预测基站的历史流量记录之间存在因果关系;对待预测基站与邻居基站的历史流量记录进行特征提取,得到特征数据;根据特征数据预测待预测基站的预测流量。本发明实施例,在特征数据对象的筛选过程中,充分考虑空间因素避免了特征数据选择的单一性,同时还充分考虑基站流量之间的因果联系,从而避免特征数据选择的盲目性,减少冗余特征干扰,提高特征选择的有效性,从而提高基站流量预测精度和效率。
-
公开(公告)号:CN116975243A
公开(公告)日:2023-10-31
申请号:CN202210453846.5
申请日:2022-04-24
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06F16/335 , G06F16/31
Abstract: 本发明提供一种社交媒体平台对话数据的处理方法、装置及设备,其中,社交媒体平台对话数据的处理方法包括:获取至少一个社交媒体平台的对话数据;对所述至少一个社交媒体平台的对话数据,分别使用所述对话数据专用的第一级过滤器进行过滤处理,得到至少一个社交媒体平台的对话数据的第一级过滤结果;将所述至少一个社交媒体平台的对话数据的第一级过滤结果,输入到通用的第二级过滤器进行过滤处理,得到第二级过滤结果;将所述第二级过滤结果,输入到对话相关性过滤器进行第三级过滤处理,得到最终的目标过滤结果。本发明的方案可以针对于不同的社交媒体平台的对话数据进行对话上下文相关性过滤处理,方便使用,具有极强的通用性和易用性。
-
公开(公告)号:CN116828450A
公开(公告)日:2023-09-29
申请号:CN202210285960.1
申请日:2022-03-22
Applicant: 清华大学 , 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本发明提供一种移动预测方法、装置、终端及存储介质,涉及数据处理技术领域。本发明的方法包括获取多个第一训练样本,第一训练样本基于本地存储的用户的历史移动数据生成;根据第二训练样本对第一移动预测模型进行训练,得到第二移动预测模型;第二训练样本为第一训练样本经噪声加扰后的训练样本;第一移动预测模型由服务器基于来自多个终端的、经噪声加扰后的本地模型梯度生成,服务器和多个终端为参与联邦学习的各个参与者;获取待预测的目标时间之前的第一移动数据;将第一移动数据输入至第二移动预测模型,得到预测的目标移动数据。本发明在移动预测场景下,能够进一步加强对用户隐私数据的保护,防止敏感的位置的信息泄露。
-
公开(公告)号:CN116827809A
公开(公告)日:2023-09-29
申请号:CN202210285966.9
申请日:2022-03-22
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: H04L41/147 , H04W24/02 , H04W24/06
Abstract: 本发明公开了一种输出流量预测方法、装置及存储介质,包括:获取基站的历史流量序列以及基站的地理位置信息;确定时间和空间维度最相近的至少一个邻居基站作为目标基站的邻居子图;通过阈值设置规则处理获得原始流量序列以及流量离散序列;通过图注意力网络获取邻居子图中各基站与目标基站之间在流量上相似或相反的空间依赖关系;将原始流量序列与离散流量序列分别通过TCN获取时间依赖关系;通过软注意力机制根据空间依赖关系与时间依赖关系输出流量预测结果。采用本发明,避免学习了过多冗余信息。提高了网络流量过载预测的准确率。能挖掘更深层次的空间依赖关系。在多步预测准确率以及运算速度上有了很大的提升。
-
-
-
-
-
-
-
-
-