一种模型训练数据处理方法、装置与电子设备

    公开(公告)号:CN118378723B

    公开(公告)日:2024-09-13

    申请号:CN202410813561.7

    申请日:2024-06-21

    Abstract: 本公开提供一种模型训练数据处理方法、装置与电子设备,涉及数据处理技术领域。模型训练数据处理方法包括:获取包括多个训练文本的待处理模型训练数据,对每个所述训练文本进行分词预处理,以得到与每个训练文本对应的词汇集合;根据所述词汇集合提取每个所述训练文本的K个关键词,根据所述K个关键词将所述多个训练文本分为多组,K≥1;生成每个所述词汇集合内每个词汇的词向量;对每个训练文本,根据一个所述词汇与所述关键词的距离确定该词汇的权值,根据所述训练文本对应的多个词汇的词向量以及所述权值确定所述训练文本的文本向量;在同组内对所述文本向量的相似度大于预设阈值的训练文本进行去重。本公开实施例可以提高模型训练效率。

    元数据关系提取的建模方法、提取方法及相关设备

    公开(公告)号:CN116932660A

    公开(公告)日:2023-10-24

    申请号:CN202310847844.9

    申请日:2023-07-11

    Abstract: 本公开实施例提供了一种元数据关系提取的建模方法、元数据关系的提取方法、装置、计算机设备、可读存储介质及程序,涉及计算机技术领域。该方法包括:获取元数据和与元数据对应的句子;根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;将所述元数据输入第一BERT模型以获取元数据表示;将所述句子输入第二BERT模型以获取句子表示;根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;根据所述句子表示和所述个性掩码矩阵获取个性表示;根据所述共性表示和所述个性表示获取所述元数据的关系。本公开实施例提供的元数据关系提取的建模方法,能够获取元数据的关系的元数据关系提取模型。

    一种模型训练数据处理方法、装置与电子设备

    公开(公告)号:CN118378723A

    公开(公告)日:2024-07-23

    申请号:CN202410813561.7

    申请日:2024-06-21

    Abstract: 本公开提供一种模型训练数据处理方法、装置与电子设备,涉及数据处理技术领域。模型训练数据处理方法包括:获取包括多个训练文本的待处理模型训练数据,对每个所述训练文本进行分词预处理,以得到与每个训练文本对应的词汇集合;根据所述词汇集合提取每个所述训练文本的K个关键词,根据所述K个关键词将所述多个训练文本分为多组,K≥1;生成每个所述词汇集合内每个词汇的词向量;对每个训练文本,根据一个所述词汇与所述关键词的距离确定该词汇的权值,根据所述训练文本对应的多个词汇的词向量以及所述权值确定所述训练文本的文本向量;在同组内对所述文本向量的相似度大于预设阈值的训练文本进行去重。本公开实施例可以提高模型训练效率。

    数据排序方法及装置、电子设备及存储介质

    公开(公告)号:CN116860818A

    公开(公告)日:2023-10-10

    申请号:CN202310854679.X

    申请日:2023-07-12

    Inventor: 郭枝虾 李馨迟

    Abstract: 本公开提供了一种数据排序方法及装置、电子设备及存储介质,涉及计算机技术领域。该方法:获取待排序数据的第一排序结果和第二排序结果,其中,待排序数据包括:多个数据,第一排序结果为多个数据在第一维度的排序结果,第二排序结果为多个数据在第二维度的排序结果;获取每个数据在第一排序结果和第二排序结果中的排序位置;根据每个数据在第一排序结果和第二排序结果中的排序位置,对待排序数据中的多个数据进行排序,得到第三排序结果。本公开计算简便可靠性强,可以节省大量时间及财力,得到理论上最优的衡量数据效果的排序。

    点击率预测方法、装置、电子设备及存储介质

    公开(公告)号:CN118350861A

    公开(公告)日:2024-07-16

    申请号:CN202410448012.4

    申请日:2024-04-12

    Inventor: 郭枝虾

    Abstract: 本公开提供了一种点击率预测方法、装置、电子设备、计算机可读存储介质,涉及大数据技术领域。该方法包括:点击预测模型基于因子分解机网络,根据目标点击稀疏特征预测得到第一点击预测数据;点击预测模型基于具有共享网络及多个专有网络的注意力多域网络,将点击稠密向量及点击稠密特征处理得到的待处理稠密特征进行处理得到专有预测值,并得到第二点击预测数据,根据第一点击预测数据及第二点击预测数据等得到目标点击预测数据;本公开实施例中因子分解机网络及注意力多域网络共享相同的稠密向量,能够学习到低阶和高阶特征组合,提高多场景点击率预估的场景信息学习,及提升模型整体效果,节约资源。

    待售物品的定价方法、装置、电子设备和可读介质

    公开(公告)号:CN117893267A

    公开(公告)日:2024-04-16

    申请号:CN202410064389.X

    申请日:2024-01-16

    Inventor: 郭枝虾

    Abstract: 本公开提供一种待售物品的定价方法、装置、电子设备和可读介质,其中,待售物品的定价方法包括:基于训练好的转化率模型确定待售物品的目标转化率;根据目标转化率、待售物品的品牌信息的独热编码、加购待售产品的用户数和促销活动的时间信息确定隐含价格;根据隐含价格、待售物品的折扣信息和预设分位数确定待售物品的推荐价格,并将推荐价格发送至与待售物品关联的终端。通过本公开实施例,提升了待售物品的定价的计算效率和时效性,也提高了待售物品的定价的准确性和可靠性。

    三维模型的重建方法、装置、电子设备及计算机可读介质

    公开(公告)号:CN117078857A

    公开(公告)日:2023-11-17

    申请号:CN202311056709.9

    申请日:2023-08-21

    Abstract: 本公开涉及一种三维模型的重建方法、装置、电子设备及计算机可读介质,属于人工智能技术领域。该方法包括:获取三维空间中的多个采样点;根据输入图像以及采样点的位置信息得到采样点的二维特征向量和三维特征向量;确定采样点的融合特征,并构造采样点的邻接特征矩阵;将邻接特征矩阵输入分层图卷积网络中得到采样点特征,其中,分层图卷积网络由下采样支路和上采样支路组成,下采样支路由多层局部注意力图卷积层构成,上采样支路由多层局部注意力图反卷积层构成;根据采样点的采样点特征得到采样点的位置预测结果,并构建输入图像对应的三维模型。本公开可以有效地提取三维空间中采样点的局部空间特征,实现三维模型的高精度重建。

Patent Agency Ranking