-
公开(公告)号:CN118378723B
公开(公告)日:2024-09-13
申请号:CN202410813561.7
申请日:2024-06-21
Applicant: 中国电信股份有限公司 , 中国电信股份有限公司技术创新中心
IPC: G06N20/00 , G06F40/284 , G06F40/216 , G06F18/24 , G06F18/22
Abstract: 本公开提供一种模型训练数据处理方法、装置与电子设备,涉及数据处理技术领域。模型训练数据处理方法包括:获取包括多个训练文本的待处理模型训练数据,对每个所述训练文本进行分词预处理,以得到与每个训练文本对应的词汇集合;根据所述词汇集合提取每个所述训练文本的K个关键词,根据所述K个关键词将所述多个训练文本分为多组,K≥1;生成每个所述词汇集合内每个词汇的词向量;对每个训练文本,根据一个所述词汇与所述关键词的距离确定该词汇的权值,根据所述训练文本对应的多个词汇的词向量以及所述权值确定所述训练文本的文本向量;在同组内对所述文本向量的相似度大于预设阈值的训练文本进行去重。本公开实施例可以提高模型训练效率。
-
公开(公告)号:CN117076518A
公开(公告)日:2023-11-17
申请号:CN202310854529.9
申请日:2023-07-12
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/2458 , G06F16/28 , G06F16/27 , G06F16/36
Abstract: 本公开提供了一种元数据查询方法、装置、系统以及相关设备,涉及大数据治理技术领域。该方法包括:获取分布式部署的多个数据库中的元数据;按照预设规则对元数据进行分类存储,获得分布式部署的多个元数据集;对分布式部署的每个元数据集进行处理,获得多维度的元数据知识图谱,元数据知识图谱用于响应各业务系统发送的数据查询指令,返回待查询的元数据。本公开能够在一定程度上克服相关技术在超大规模分布式数据管理过程中,元数据查询效率较低的问题。
-
公开(公告)号:CN116932660A
公开(公告)日:2023-10-24
申请号:CN202310847844.9
申请日:2023-07-11
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/28 , G06F17/16 , G06F17/11 , G06N3/0455 , G06N3/08
Abstract: 本公开实施例提供了一种元数据关系提取的建模方法、元数据关系的提取方法、装置、计算机设备、可读存储介质及程序,涉及计算机技术领域。该方法包括:获取元数据和与元数据对应的句子;根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;将所述元数据输入第一BERT模型以获取元数据表示;将所述句子输入第二BERT模型以获取句子表示;根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;根据所述句子表示和所述个性掩码矩阵获取个性表示;根据所述共性表示和所述个性表示获取所述元数据的关系。本公开实施例提供的元数据关系提取的建模方法,能够获取元数据的关系的元数据关系提取模型。
-
公开(公告)号:CN118378723A
公开(公告)日:2024-07-23
申请号:CN202410813561.7
申请日:2024-06-21
Applicant: 中国电信股份有限公司 , 中国电信股份有限公司技术创新中心
IPC: G06N20/00 , G06F40/284 , G06F40/216 , G06F18/24 , G06F18/22
Abstract: 本公开提供一种模型训练数据处理方法、装置与电子设备,涉及数据处理技术领域。模型训练数据处理方法包括:获取包括多个训练文本的待处理模型训练数据,对每个所述训练文本进行分词预处理,以得到与每个训练文本对应的词汇集合;根据所述词汇集合提取每个所述训练文本的K个关键词,根据所述K个关键词将所述多个训练文本分为多组,K≥1;生成每个所述词汇集合内每个词汇的词向量;对每个训练文本,根据一个所述词汇与所述关键词的距离确定该词汇的权值,根据所述训练文本对应的多个词汇的词向量以及所述权值确定所述训练文本的文本向量;在同组内对所述文本向量的相似度大于预设阈值的训练文本进行去重。本公开实施例可以提高模型训练效率。
-
公开(公告)号:CN116860818A
公开(公告)日:2023-10-10
申请号:CN202310854679.X
申请日:2023-07-12
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/2457 , G06Q30/0203
Abstract: 本公开提供了一种数据排序方法及装置、电子设备及存储介质,涉及计算机技术领域。该方法:获取待排序数据的第一排序结果和第二排序结果,其中,待排序数据包括:多个数据,第一排序结果为多个数据在第一维度的排序结果,第二排序结果为多个数据在第二维度的排序结果;获取每个数据在第一排序结果和第二排序结果中的排序位置;根据每个数据在第一排序结果和第二排序结果中的排序位置,对待排序数据中的多个数据进行排序,得到第三排序结果。本公开计算简便可靠性强,可以节省大量时间及财力,得到理论上最优的衡量数据效果的排序。
-
公开(公告)号:CN119903152A
公开(公告)日:2025-04-29
申请号:CN202411978364.7
申请日:2024-12-30
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/3329 , G06F16/332 , G06F16/338 , G06F16/36 , G06F18/22
Abstract: 本公开提供了一种基于检索增强生成模型的答案生成方法、装置及相关设备,涉及计算机技术领域,该方法包括:获取用户查询的目标问题;将目标问题输入至检索增强生成模型中,输出至少一个与目标问题相关联的检索结果;基于至少一个与目标问题相关联的检索结果逆向生成至少一个与检索结果对应的问题;根据每个检索结果对应的问题与目标问题之间的相似度,确定目标问题对应的目标答案。本公开能够提高问答结果的准确性。
-
公开(公告)号:CN119646138A
公开(公告)日:2025-03-18
申请号:CN202411668403.3
申请日:2024-11-20
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/3329 , G06F16/353 , G06F16/334 , G06F16/36 , G06F40/30 , G06F40/295 , G06N5/022 , G06Q30/015 , G06Q50/50
Abstract: 本公开提供了一种客服交互优化方法、装置、设备、存储介质和程序产品,涉及计算机技术领域。其中,客服交互优化方法包括:响应于接收到的用户问题,基于心智模型对用户问题进行意图识别;基于意图识别的结果确定用于语义增强的对应领域知识库;基于对语义空间对齐谱图的查询操作对用户问题进行改写,得到待检索信息;基于待检索信息检索对应领域知识库,得到对用户问题增强的业务知识片段;将业务知识片段输入大语言模型进行应答,输出用户问题的答复信息。通过本公开的技术方案,能够有效弥补知识库与用户提问之间的语义隔阂,提升了大语言模型对用户意图的理解准确性,进而有利于改善用户在智能客服系统交互中的使用体验。
-
公开(公告)号:CN118350861A
公开(公告)日:2024-07-16
申请号:CN202410448012.4
申请日:2024-04-12
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 郭枝虾
IPC: G06Q30/0202 , G06N3/045 , G06N3/08
Abstract: 本公开提供了一种点击率预测方法、装置、电子设备、计算机可读存储介质,涉及大数据技术领域。该方法包括:点击预测模型基于因子分解机网络,根据目标点击稀疏特征预测得到第一点击预测数据;点击预测模型基于具有共享网络及多个专有网络的注意力多域网络,将点击稠密向量及点击稠密特征处理得到的待处理稠密特征进行处理得到专有预测值,并得到第二点击预测数据,根据第一点击预测数据及第二点击预测数据等得到目标点击预测数据;本公开实施例中因子分解机网络及注意力多域网络共享相同的稠密向量,能够学习到低阶和高阶特征组合,提高多场景点击率预估的场景信息学习,及提升模型整体效果,节约资源。
-
公开(公告)号:CN117893267A
公开(公告)日:2024-04-16
申请号:CN202410064389.X
申请日:2024-01-16
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 郭枝虾
IPC: G06Q30/0283 , G06F17/15
Abstract: 本公开提供一种待售物品的定价方法、装置、电子设备和可读介质,其中,待售物品的定价方法包括:基于训练好的转化率模型确定待售物品的目标转化率;根据目标转化率、待售物品的品牌信息的独热编码、加购待售产品的用户数和促销活动的时间信息确定隐含价格;根据隐含价格、待售物品的折扣信息和预设分位数确定待售物品的推荐价格,并将推荐价格发送至与待售物品关联的终端。通过本公开实施例,提升了待售物品的定价的计算效率和时效性,也提高了待售物品的定价的准确性和可靠性。
-
公开(公告)号:CN117078857A
公开(公告)日:2023-11-17
申请号:CN202311056709.9
申请日:2023-08-21
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本公开涉及一种三维模型的重建方法、装置、电子设备及计算机可读介质,属于人工智能技术领域。该方法包括:获取三维空间中的多个采样点;根据输入图像以及采样点的位置信息得到采样点的二维特征向量和三维特征向量;确定采样点的融合特征,并构造采样点的邻接特征矩阵;将邻接特征矩阵输入分层图卷积网络中得到采样点特征,其中,分层图卷积网络由下采样支路和上采样支路组成,下采样支路由多层局部注意力图卷积层构成,上采样支路由多层局部注意力图反卷积层构成;根据采样点的采样点特征得到采样点的位置预测结果,并构建输入图像对应的三维模型。本公开可以有效地提取三维空间中采样点的局部空间特征,实现三维模型的高精度重建。
-
-
-
-
-
-
-
-
-