数据库的数据冗余处理方法、装置、电子设备及存储介质

    公开(公告)号:CN113568894B

    公开(公告)日:2025-03-07

    申请号:CN202010348004.4

    申请日:2020-04-28

    Abstract: 本发明实施例提供了一种数据库的数据冗余处理方法、装置、电子设备及存储介质。该数据库的数据冗余处理方法,包括:获取预存储于数据库中的第一汇总表和第二汇总表;基于预设的矩阵转换策略信息,分别将第一汇总表转换为第一矩阵、第二汇总表转换为第二矩阵;基于第一矩阵和第二矩阵,确定第一汇总表和第二汇总表之间的第一相似度;当确定第一相似度达到相似度阈值时,基于预设映射关系,针对数据库执行第一相似度对应的第一数据冗余处理操作;其中,预设映射关系为相似度和数据冗余处理操作之间的映射关系。根据本发明实施例的数据库的数据冗余处理方法,能够提高数据库的数据冗余处理效果。

    数据库的数据冗余处理方法、装置、电子设备及存储介质

    公开(公告)号:CN113568894A

    公开(公告)日:2021-10-29

    申请号:CN202010348004.4

    申请日:2020-04-28

    Abstract: 本发明实施例提供了一种数据库的数据冗余处理方法、装置、电子设备及存储介质。该数据库的数据冗余处理方法,包括:获取预存储于数据库中的第一汇总表和第二汇总表;基于预设的矩阵转换策略信息,分别将第一汇总表转换为第一矩阵、第二汇总表转换为第二矩阵;基于第一矩阵和第二矩阵,确定第一汇总表和第二汇总表之间的第一相似度;当确定第一相似度达到相似度阈值时,基于预设映射关系,针对数据库执行第一相似度对应的第一数据冗余处理操作;其中,预设映射关系为相似度和数据冗余处理操作之间的映射关系。根据本发明实施例的数据库的数据冗余处理方法,能够提高数据库的数据冗余处理效果。

    样本数据生成方法、装置、电子设备及存储介质

    公开(公告)号:CN116992287A

    公开(公告)日:2023-11-03

    申请号:CN202310960301.8

    申请日:2023-07-31

    Abstract: 本申请公开了一种样本数据生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,即本申请中的重组样本是通过聚类模型的聚类结果所生成的,即重组样本的组成元素均来自于聚类结果中同一个族群,故重组样本的组成元素之间具有较高的相关度,从而保证了重组样本集中重组样本的质量,进一步的,得到重组样本集后,再通过第二聚类模型的聚类核心对所述重组样本集进行筛选得到目标重组样本集,由于第二聚类模型的聚类核心是通过原始样本集确定的,所以目标重组样本集中的重组样本与原始样本具有较强的相关性,也即重组样本更贴合于实际生成的样本,故本申请实施例生成的重组样本质量更有保障,保证了重组样本用于模型训练的价值。

    结构化数据生成模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN116150125A

    公开(公告)日:2023-05-23

    申请号:CN202310155495.4

    申请日:2023-02-20

    Abstract: 本申请实施例提供了一种结构化数据生成模型的训练方法、装置、设备及存储介质,训练方法包括:获取与第一样本所在的数据表具有关联关系且属于同一业务领域的关联数据表,构成关联数据表集;对关联数据表集中的数据进行向量化和归一化处理,得到第一训练样本;将第一训练样本输入至生成器,得到第一生成样本;将第一训练样本和第一生成样本输入至判别器,得到第一判别结果;根据第一判别结果,确定结构化数据生成模型的损失函数值;在损失函数值不满足预设训练停止条件的情况下,更新结构化数据生成模型的模型参数,直至损失函数值满足预设训练停止条件时为止。根据本申请实施例训练得到的模型适用于大数据库场景下结构化数据的样本扩充。

    用户驻留信息分析方法、装置、电子设备及存储介质

    公开(公告)号:CN116939520A

    公开(公告)日:2023-10-24

    申请号:CN202210350746.X

    申请日:2022-04-02

    Abstract: 本申请涉及IT应用和传输技术领域,提供一种用户驻留信息分析方法、装置、电子设备及存储介质,该方法包括:根据预设信息对待处理信令数据进行缺失数据处理,得到第一信令数据;根据重复信令数据的拟合距离进行重复数据处理,得到第二信令数据;通过贝叶斯分类算法进行乒乓数据处理,得到第三信令数据;根据第三信令数据的相邻信令数据进行漂移数据处理,得到最终信令数据;通过用户位置驻留模型结合最终信令数据的位置信息,分析驻留信息。本申请实施例提供的用户驻留信息分析方法结合缺失数据处理、重复数据处理、贝叶斯分类算法的乒乓数据处理、漂移数据处理和用户位置驻留模型进行用户驻留信息分析,提高了用户驻留信息分析的准确性。

    预警方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN116483820A

    公开(公告)日:2023-07-25

    申请号:CN202310567445.7

    申请日:2023-05-18

    Abstract: 本申请公开了一种预警方法、装置、设备及计算机可读存储介质。其中,该方法包括:获取与目标事件对应的报备信息;在历史事件影响数据库中查找与报备信息的相似度最大的目标描述信息,历史事件影响数据库中包括与多个历史事件分别对应的描述信息;将历史事件影响库中与目标描述信息对应的基础数据确定为受目标事件影响的第一基础数据;向第一用户发送与第一基础数据对应的第一预警信息,第一用户为负责第一业务的用户,第一业务为涉及第一基础数据的业务。根据本申请实施例的预警方法,能够保证基础数据的数据质量,提高业务分析结果的准确性。

    数据质量检测方法、装置、设备及其存储介质

    公开(公告)号:CN116910675A

    公开(公告)日:2023-10-20

    申请号:CN202310883986.0

    申请日:2023-07-18

    Abstract: 本申请公开了一种数据质量检测方法、装置、设备及其存储介质,属于计算机技术领域。数据质量检测方法包括:获取待检测业务数据,并根据预设的形式检测规则,对待检测业务数据进行形式检测,得到形式检测结果;根据待检测业务数据所属的业务类型,从预设的元数据库中调取业务类型下的历史业务数据;对历史业务数据的基础信息进行分类与汇总,得到各种类基础信息的标准范围,以作为待检测业务数据的业务检测规则;根据业务检测规则,对待检测业务数据进行业务检测,得到业务检测结果;根据形式检测结果和业务检测结果,生成待检测业务数据的数据质量检测报告。本申请解决了常规的数据质量检测的准确性较低的技术问题。

Patent Agency Ranking