大语言模型评测方法及装置、电子设备、可读存储介质

    公开(公告)号:CN118364250A

    公开(公告)日:2024-07-19

    申请号:CN202410499728.7

    申请日:2024-04-24

    Abstract: 本公开提供了一种大语言模型评测方法及装置、电子设备、可读存储介质,属于智能对话技术领域,该方法包括:基于第一问题和多个第一追问问题依次对第一语言模型进行静态测试,得到第一语言模型针对于第一问题和多个第一追问问题的第一回复信息;基于第一问题和多个第二追问问题依次对第一语言模型进行动态测试,得到第一语言模型针对于第一问题和多个第二追问问题的第二回复信息;基于第一回复信息和第二回复信息确定第一语言模型的评测结果。本公开提出的静态测试和动态测试结合的评估方法能够更准确地评估模型的多轮对话能力,从而更好地反映模型在真实世界应用中的表现。

    一种满足本地差分隐私的轨迹数据收集方法及系统

    公开(公告)号:CN114091100B

    公开(公告)日:2024-05-03

    申请号:CN202111391595.4

    申请日:2021-11-23

    Abstract: 本申请公开了一种满足本地差分隐私的轨迹数据收集方法及系统,本申请实施例提供的方法,首先,将设定的地理区域进行网栅离散化,在地理区域内形成满足本地差分隐私的网栅,以离散用户的轨迹数据;其次,根据形成的网栅,离散化用户的轨迹数据,即将用户的轨迹数据中的每个地理位置替换为该位置所在晶格的索引值;再次,以在网栅中的每个晶格内的用户轨迹数据为样本,学习得到隐马尔科夫模型;最后,从学习得到的隐马尔科夫模型中抽样生成该地理区域的轨迹数据集。由于在用户轨迹数据收集过程中每个用户的轨迹数据都通过最优本地哈希法进行扰动处理,所以解决了用户隐私泄露问题,提供的设定地理区域的轨迹数据集中剔除了用户隐私信息。

    共享数据确定方法、装置、电子设备及存储介质

    公开(公告)号:CN115454949A

    公开(公告)日:2022-12-09

    申请号:CN202210892219.1

    申请日:2022-07-27

    Inventor: 苏森 程祥 王振亚

    Abstract: 本申请提供一种共享数据确定方法、装置、电子设备及存储介质。该方法包括:接收当前批次的生成记录数据和敏感记录数据;利用局部判别器网络根据当前批次的生成记录数据和敏感记录数据更新局部判别器网络;利用更新后的局部判别器网络构造局部判别器响应,并利用数据共享平台根据预先获取到的真实集成记录训练数据、合成集成记录训练数据和判别器响应训练关系判别器以更新生成器网络;将预先采集到的随机向量输入至更新后的生成器网络以得到生成记录数据组;生成记录数据组,包括:多个生成记录数据;根据每个生成记录数据的权重构建目标共享数据。实现了能够在保证避免隐私泄露的同时实现垂直分割的数据共享,保证共享数据具有较高的可用性。

    一种图像数据处理方法和装置
    4.
    发明公开

    公开(公告)号:CN115439708A

    公开(公告)日:2022-12-06

    申请号:CN202210845137.1

    申请日:2022-07-18

    Abstract: 本申请一个实施例提供一种图像数据处理方法和装置,该方法包括:获取图像数据集;对于图像数据集中的每一个像素点,计算以每一个像素点为中心的预设领域窗口内的像素值的加权中位数,进而更新为对应的像素点的像素值,响应于达到预设终止条件,终止数据预处理进程,进而更新图像数据集,以得到更新后的图像数据集;响应于第一预测类别与各个第二预测类别不同并且第一置信度与各个第二置信度不同,确定图像数据集为异常图像数据集并输出;或者响应于各个第二预测类别与第一预测类别相同并且第一置信度与各个第二置信度的差异均超过阈值,确定图像数据集为异常图像数据集并输出。极大地减轻对抗样本对模型的安全形成存在的巨大威胁。

    一种满足本地差分隐私的真值发现方法和电子设备

    公开(公告)号:CN115329368A

    公开(公告)日:2022-11-11

    申请号:CN202210787996.X

    申请日:2022-07-04

    Inventor: 程祥 苏森 张朋飞

    Abstract: 本申请提供一种满足本地差分隐私的真值发现方法和电子设备包括:发布多个真值发现任务,并根据所述多个任务生成指示矩阵;根据所述指示矩阵和所述多个任务的阈值范围以及隐私预算确定对所述指示矩阵的采样比例;根据所述采样比例对所述指示矩阵进行两阶段随机采样并生成索引矩阵后将所述索引矩阵发送至多个用户端口;所述多个用户端口对所述索引矩阵内的数据进行加噪处理得到加噪数据;计算所述多个用户端口的权重后根据所述加噪数据和所述权重对未被采样到的数据进行推断统计;根据所述加噪数据和所述推断统计得到的剩余数据值得到每个采样任务的真值。本申请通过两阶段随机采样以及多可客户端口赋予不同的权重,最终得到每个采样任务的真值。

    虚拟中毒图像数据的后门触发器拟合方法及相关设备

    公开(公告)号:CN115170855A

    公开(公告)日:2022-10-11

    申请号:CN202210492940.1

    申请日:2022-05-07

    Abstract: 本公开提供一种虚拟中毒图像数据的后门触发器拟合方法及相关设备。所述方法包括:根据原始图像数据集,随机生成张量数据;基于协方差自适应调整的进化策略(CMA‑ES),随机生成原始图像数据集的多个候选坐标位置,并根据原始图像数据集和张量数据构造第一虚拟中毒图像数据集;将原始图像数据集和第一虚拟中毒图像数据集输入到预先训练的注入后门的分类模型中,根据计算得到的激活后门的第一成功率确定目标坐标位置并构造目标虚拟中毒图像数据集;迭代训练张量数据,将训练好的张量数据确定为虚拟中毒图像数据的后门触发器。本公开的方案拟合出的后门触发器没有尺寸大小的限制,检测后门更具通用性,从而提升神经网络模型的安全性。

    满足差分隐私的域自适应方法及相关设备

    公开(公告)号:CN114357503A

    公开(公告)日:2022-04-15

    申请号:CN202111402040.5

    申请日:2021-11-19

    Inventor: 程祥 金凯忠

    Abstract: 本申请提供了一种满足差分隐私的域自适应方法及相关设备,对目标域的特征空间进行划分,采用差分隐私噪声扰动划分出的目标子空间的协方差矩阵后恢复协方差矩阵的半正定性质。根据划分出的目标子空间对源域的特征空间进行相同的划分得到源子空间,根据源子空间的协方差矩阵和恢复了半正定性质的协方差矩阵计算出映射矩阵,根据映射矩阵对源子空间进行特征变换,采用随机梯度下降方法处理变换后的源子空间得到差分隐私模型。其中划分出多个目标子空间,把高维数据场景转化为多个低维数据场景,避免了噪音协方差矩阵误差上界的增大。恢复噪音协方差矩阵的半正定性质,减轻了差分隐私噪声对域自适应方法性能的破坏。

    满足本地化差分隐私的真值发现方法及电子设备

    公开(公告)号:CN114357502A

    公开(公告)日:2022-04-15

    申请号:CN202111364079.2

    申请日:2021-11-17

    Abstract: 本申请提供一种满足本地化差分隐私的真值发现方法及电子设备,在每一个时间点,客户端使用显著性检验中的单样本t检验方法判断相邻时间点间的原始数据变化是否显著,以决定是否更新真值的投票信息并在扰动后上传给服务器,服务器汇总所有客户端的投票信息决定当前时间点需要重新进行真值发现的任务;客户端本地扰动相应任务的数据并上传给服务器,服务器进行考虑客户端权重和任务真值的时间平滑性的动态真值发现,以更新当前时间点的任务真值。这样,能够在保护每一个时间点的客户端原始数据隐私的同时保证较高的真值发现准确度。

Patent Agency Ranking