-
公开(公告)号:CN112364908B
公开(公告)日:2022-11-11
申请号:CN202011224742.4
申请日:2020-11-05
Applicant: 浙江大学
Abstract: 本发明公开了一种面向决策树的纵向联邦学习方法,该方法主要包括如下步骤:1)所有参与者对于本地的每一个特征,将本地数据进行排序,随后将排序后的数据按序等分为不同的块,将每一块称为一个桶。2)对于每一个特征所对应的一组数据,每一个数据在该特征下的桶号有一定概率变为其它桶号,选取适当的概率使得这种加密方式满足差分隐私的定义。3)每个参与者将不同数据在不同特征下分到的桶的序号,发送给持有标签的参与者。将这个参与者称为协调者。4)协调者根据这些数据训练决策树模型,训练过程不再需要其他参与者。本发明首次提出在决策树的联邦学习中传递排序的方法,在维持联邦学习安全性的同时,极大的提升了训练速度。
-
公开(公告)号:CN114363016A
公开(公告)日:2022-04-15
申请号:CN202111564710.3
申请日:2021-12-20
Applicant: 浙江大学
IPC: H04L9/40
Abstract: 本发明公开了一种基于关键词的隐私保护流量检测方法。该方法主要包括如下步骤:1)关键词提取:基于正则表达式,提取出关键词集合;2)流量处理:找出流量中匹配到关键词的位置,将未匹配的部分替换为脱敏信息;3)流量检测:使用正则表达式检测处理后的流量并记录检测结果4)数据校验:校验数据完整性,确保检测系统正常工作。本发明首次提出了基于关键词的中间盒隐私保护流量检测技术,在保护用户流量隐私的同时达到与明文检测相似的精准度,适用于当前以高频率短连接为主的网络环境,效果优于现有方法,且具有效率高、延迟低、方便部署等特点。
-
公开(公告)号:CN119848940A
公开(公告)日:2025-04-18
申请号:CN202411924005.3
申请日:2024-12-24
Applicant: 浙江大学 , 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多方数据安全分组的方法及装置,在对多个参与方共同安全持有的目标数据集中的多条目标数据按照预定属性进行分组时,各个参与方可以先对目标数据集进行乱序,以切断各个参与方对目标数据位置信息的把控,然后经由基于安全比较的快速排序和归并排序为乱序后的目标数据集按照预定属性上的属性值大小进行排序,得到有序数据集,再利用安全比较基于有序数据集进行数据分组。该技术方案可以提高安全分组的效率。
-
公开(公告)号:CN112364908A
公开(公告)日:2021-02-12
申请号:CN202011224742.4
申请日:2020-11-05
Applicant: 浙江大学
Abstract: 本发明公开了一种面向决策树的纵向联邦学习方法,该方法主要包括如下步骤:1)所有参与者对于本地的每一个特征,将本地数据进行排序,随后将排序后的数据按序等分为不同的块,将每一块称为一个桶。2)对于每一个特征所对应的一组数据,每一个数据在该特征下的桶号有一定概率变为其它桶号,选取适当的概率使得这种加密方式满足差分隐私的定义。3)每个参与者将不同数据在不同特征下分到的桶的序号,发送给持有标签的参与者。将这个参与者称为协调者。4)协调者根据这些数据训练决策树模型,训练过程不再需要其他参与者。本发明首次提出在决策树的联邦学习中传递排序的方法,在维持联邦学习安全性的同时,极大的提升了训练速度。
-
公开(公告)号:CN114363016B
公开(公告)日:2023-05-23
申请号:CN202111564710.3
申请日:2021-12-20
Applicant: 浙江大学
IPC: H04L9/40
Abstract: 本发明公开了一种基于关键词的隐私保护流量检测方法。该方法主要包括如下步骤:1)关键词提取:基于正则表达式,提取出关键词集合;2)流量处理:找出流量中匹配到关键词的位置,将未匹配的部分替换为脱敏信息;3)流量检测:使用正则表达式检测处理后的流量并记录检测结果4)数据校验:校验数据完整性,确保检测系统正常工作。本发明首次提出了基于关键词的中间盒隐私保护流量检测技术,在保护用户流量隐私的同时达到与明文检测相似的精准度,适用于当前以高频率短连接为主的网络环境,效果优于现有方法,且具有效率高、延迟低、方便部署等特点。
-
公开(公告)号:CN112308157B
公开(公告)日:2022-07-22
申请号:CN202011222998.1
申请日:2020-11-05
Applicant: 浙江大学
Abstract: 本发明公开了一种面向决策树的横向联邦学习方法,该方法包括:所有参与者基于二分法查找数据特征集合中每个特征的分位数草图;参与者根据分位数草图,利用本地持有数据特征,为每个特征构建局部直方图;在所有局部直方图添加满足差分隐私的噪声,并通过安全聚合方法处理后发送给协调者;所述协调者将每个特征的局部直方图合并为一个全局的直方图,并根据所述直方图训练第一棵决策树的根节点;所述协调者将所述节点信息发送给其余参与者;所有参与者更新局部直方图并重复以上过程进行训练,得到训练好的决策树。本发明的横向联邦学习方法具有使用简便、训练高效等优点,可以保护数据隐私,为数据保护水平提供量化支持。
-
公开(公告)号:CN113222181A
公开(公告)日:2021-08-06
申请号:CN202110473993.4
申请日:2021-04-29
Applicant: 浙江大学
Abstract: 本发明公开了一种面向k‑means聚类算法的联邦学习方法,该方法包括纵向联邦学习与横向连邦学习。横向联邦学习,包括如下步骤:1)初始化K个聚类,不同参与者将本地样本分给距离该样本最近的聚类2)对每个聚类,计算该聚类的新的聚类中心。3)如果聚类中心发生变化,那么回到步骤1);纵向联邦学习,包括如下步骤:1)L个参与者分别在本地运行k‑means聚类算法得到T个聚类且做交集得到新的TL个聚类或AP聚类算法得到Ti个聚类且做交集得到新的个聚类。2)将新的个聚类中心作为输入样本,初始化K个聚类。3)将每个样本分给距离它最近的聚类。4)对每个聚类,计算该类的新的聚类中心。5)如果聚类中心发生变化,那么回到步骤3)。
-
公开(公告)号:CN117521809A
公开(公告)日:2024-02-06
申请号:CN202311492207.0
申请日:2023-11-10
Applicant: 浙江大学
Abstract: 本发明公开了一种基于大模型激活函数GELU的隐私推理方法,该方法针对大型语言模型推理过程中常用的GELU函数,设计使用密码学协议,使得能够在GELU函数输入是双方秘密共享的情况下,完成GELU函数的计算。通过设计分段函数近似、安全查表、安全比较结合安全选择的方法,能够良好的支持这一函数的安全计算,同时提高计算准确度,降低计算开销及通信开销。
-
公开(公告)号:CN113222181B
公开(公告)日:2022-05-17
申请号:CN202110473993.4
申请日:2021-04-29
Applicant: 浙江大学
Abstract: 本发明公开了一种面向k‑means聚类算法的联邦学习方法,该方法包括纵向联邦学习与横向联邦学习。横向联邦学习,包括如下步骤:1)初始化K个聚类,不同参与者将本地样本分给距离该样本最近的聚类2)对每个聚类,计算该聚类的新的聚类中心。3)如果聚类中心发生变化,那么回到步骤1);纵向联邦学习,包括如下步骤:1)L个参与者分别在本地运行k‑means聚类算法得到T个聚类且做交集得到新的TL个聚类或AP聚类算法得到Ti个聚类且做交集得到新的个聚类。2)将新的个聚类中心作为输入样本,初始化K个聚类。3)将每个样本分给距离它最近的聚类。4)对每个聚类,计算该类的新的聚类中心。5)如果聚类中心发生变化,那么回到步骤3)。
-
公开(公告)号:CN112308157A
公开(公告)日:2021-02-02
申请号:CN202011222998.1
申请日:2020-11-05
Applicant: 浙江大学
Abstract: 本发明公开了一种面向决策树的横向联邦学习方法,该方法包括:所有参与者基于二分法查找数据特征集合中每个特征的分位数草图;参与者根据分位数草图,利用本地持有数据特征,为每个特征构建局部直方图;在所有局部直方图添加满足差分隐私的噪声,并通过安全聚合方法处理后发送给协调者;所述协调者将每个特征的局部直方图合并为一个全局的直方图,并根据所述直方图训练第一棵决策树的根节点;所述协调者将所述节点信息发送给其余参与者;所有参与者更新局部直方图并重复以上过程进行训练,得到训练好的决策树。本发明的横向联邦学习方法具有使用简便、训练高效等优点,可以保护数据隐私,为数据保护水平提供量化支持。
-
-
-
-
-
-
-
-
-