-
公开(公告)号:CN118797057A
公开(公告)日:2024-10-18
申请号:CN202410245014.3
申请日:2024-03-04
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/289 , G06N3/0455 , G06N3/0464 , G06N20/10 , G06N3/0442
Abstract: 本申请公开了一种模型训练方法、分类方法、装置、第一设备、第二设备、存储介质和计算机程序产品。其中,方法包括:针对所有样本数据中的每个样本数据,利用样本数据的真实标签,确定样本数据的伪标签,并确定与样本数据相关的第一数据和第二数据,所述第一数据属于真实标签对应的第一类别,所述第二数据属于所述伪标签对应的第二类别;针对所有样本数据N个类别中的每个类别,确定类别的特征,N为大于或等于2的整数;利用所有样本数据、每个样本数据的伪标签、与每个样本数据相关的第一数据和第二数据以及N个类别的特征确定第一损失函数;利用所述第一损失函数,训练第一模型,所述第一模型用于对待分类的数据进行分类。
-
公开(公告)号:CN116912864A
公开(公告)日:2023-10-20
申请号:CN202310255423.7
申请日:2023-03-10
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V30/412 , G06V30/413 , G06F40/279
Abstract: 本申请公开了一种文本识别方法、装置、电子设备及可读存储介质,属于自然语言处理领域。本申请实施例的文本识别方法包括:获取N个待识别文本以及K个属于广告营销类的目标文本,所述N和K为大于1的整数;根据所述N个待识别文本和所述K个目标文本,构建图结构模型,并根据所述图结构模型进行迭代计算,获得每个所述待识别文本与所述K个目标文本的关系值;所述图结构模型中的节点表征所述待识别文本或所述目标文本,所述图结构模型中的边表征所述边对应的两节点所表征的文本之间的关系;根据每个待识别文本与所述K个目标文本的关系值,判定每个待识别文本是否属于广告营销类。由此,可以准确识别广告营销类的文本内容。
-
公开(公告)号:CN117009505A
公开(公告)日:2023-11-07
申请号:CN202211203590.9
申请日:2022-09-29
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F16/33 , G06F18/214 , G06F18/2413 , G06N3/044 , G06N3/048 , G06F40/211 , G06F40/289
Abstract: 本发明公开了一种观点识别方法、装置、设备及存储介质。其中,所述方法包括:获取第一测试样本和第二测试样本;将所述第一测试样本和所述第二测试样本输入预先训练的目标模型,以通过所述目标模型进行样本差异和样本观点预测,得到对应的样本识别结果;所述样本识别结果包括所述第一测试样本和所述第二测试样本是否存在差异的对比结论、所述第一测试样本对应的观点识别结果和所述第二测试样本对应的观点识别结果;其中,所述目标模型基于训练正样本集合和训练负样本集合,对用于计算样本距离的第一模型进行训练得到;所述第一模型基于所述训练正样本集合和所述训练负样本集合,对预测模型进行训练得到。
-
-