一种隐私增强的关系型表格数据仿真生成方法

    公开(公告)号:CN119622822A

    公开(公告)日:2025-03-14

    申请号:CN202510161837.2

    申请日:2025-02-14

    Abstract: 本发明提供了一种隐私增强的关系型表格数据仿真生成方法,挖掘链接表L与具有外键关联的单表U、V中高度相关的属性,并将属性与链接表L进行合并,得到k个属性对相应的U、V表中的属性;根据链接表L的外键对应关系,将得到的属性与链接表L进行拼接,得到合并表#imgabs0#,根据链接表L的属性,将合并表#imgabs1#按列切分,得到仿真生成的链接表#imgabs2#;根据链接表#imgabs3#的合成结果,使用马尔科夫随机场模型仿真生成表#imgabs4#;根据链接表#imgabs5#的合成结果,使用马尔科夫随机场模型仿真生成表#imgabs6#。在仿真数据生成时提高仿真数据的效用,确保仿真数据在保护隐私的同时仍能保持其真实性和有效性。

    一种结构化数据洞察生成方法、系统及介质

    公开(公告)号:CN118626494B

    公开(公告)日:2024-11-26

    申请号:CN202411046420.3

    申请日:2024-08-01

    Abstract: 本发明提供了一种结构化数据洞察生成方法、系统及介质,该方法包括以下步骤:使用对应的表格、问题和答案数据集对开源自然语言模型进行微调后,得到数据定位模型和洞察生成模型;数据定位模型从表格中识别出与问题相关的位置并标注;数据定位模型对表格使用预生成事实的方法从模板中生成相关推理事实;将标注后的表格、问题和生成的推理事实输入到洞察生成模型中,洞察生成模型给出最终的结构化数据洞察。相较现有技术,本发明减少了收集数据时人工标注的压力,提高了模型预测的可解释性和准确率,减少了语言模型在推理(尤其是数值推理)时的模型幻觉问题。

    数据流通交易违规行为处理方法、设备和计算机存储介质

    公开(公告)号:CN118798821A

    公开(公告)日:2024-10-18

    申请号:CN202411139998.3

    申请日:2024-08-20

    Abstract: 本申请涉及大数据大模型技术领域,提供了数据流通交易违规行为处理方法,该方法包括:基于数据流通交易的历史违规行为相关法律文书,构建历史违规行为所属类型对应的证据链;通过监控目标数据流通交易的过程,预测目标数据流通交易所属违规行为的类型;根据目标数据流通交易所属违规行为的类型和历史违规行为所属类型对应的证据链,确定目标数据流通交易的证据相关联的证据类型;根据目标数据流通交易的证据相关联的证据类型,构建目标数据流通交易的证据链;根据目标数据流通交易的证据链计算违规权重并与由具有相同违规行为类型的历史违规行为的证据链计算出的违规权重进行比较,确定目标数据流通交易是否违规。本申请的技术方案可以对数据流通交易过程中的违规行为进行有效判定和溯源。

    一种隐私保护分布式机器的学习调试方法及调试系统

    公开(公告)号:CN115169594A

    公开(公告)日:2022-10-11

    申请号:CN202211100671.6

    申请日:2022-09-09

    Abstract: 本发明适用于分布式机器学习调试领域,提供了一种隐私保护分布式机器的学习调试方法及调试系统,所述学习调试方法包括以下步骤:步骤S1:首先数据分析师建好分布式机器学习pipeline;步骤S2:在本地客户端训练过程中;步骤S3:服务端接收来自本地训练的模型和计算的调试中间值;步骤S4:服务端调试模块根据分布式机器学习调试算法基于服务端收集的调试元数据和各个客户端传送的调试中间值对本轮联邦训练进行检测;步骤S5:联邦训练结束后,输出本次训练的调试报告。旨在解决背景技术中存在的技术问题。

    一种结构化数据洞察生成方法、系统及介质

    公开(公告)号:CN118626494A

    公开(公告)日:2024-09-10

    申请号:CN202411046420.3

    申请日:2024-08-01

    Abstract: 本发明提供了一种结构化数据洞察生成方法、系统及介质,该方法包括以下步骤:使用对应的表格、问题和答案数据集对开源自然语言模型进行微调后,得到数据定位模型和洞察生成模型;数据定位模型从表格中识别出与问题相关的位置并标注;数据定位模型对表格使用预生成事实的方法从模板中生成相关推理事实;将标注后的表格、问题和生成的推理事实输入到洞察生成模型中,洞察生成模型给出最终的结构化数据洞察。相较现有技术,本发明减少了收集数据时人工标注的压力,提高了模型预测的可解释性和准确率,减少了语言模型在推理(尤其是数值推理)时的模型幻觉问题。

    一种结构化仿真数据生成系统及生成方法

    公开(公告)号:CN115169252A

    公开(公告)日:2022-10-11

    申请号:CN202211086686.1

    申请日:2022-09-07

    Abstract: 本发明公开了一种结构化仿真数据生成系统及生成方法,所述系统包括数据预处理单元以及训练和生成单元,所述数据预处理单元用于将原始数据中的每个样本转换成向量表示,并且在转换的过程中建模贝叶斯网络用以描述特征间的关联关系;所述训练和生成单元利用原始数据转换后的向量表示进行训练,得到仿真数据生成模型,利用所述仿真数据生成模型生成仿真数据记录。本发明系统和方法能够同时生成含有连续型特征和离散型特征的仿真数据记录;针对生成仿真数据,既保持了与原始数据一致的数据分布,也保证了与原始数据一致的特征间关联关系;同时提出一种根据所需条件生成仿真数据的方法,能够根据不同的仿真数据应用场景生成分析所需的仿真数据记录。

Patent Agency Ranking