-
公开(公告)号:CN118551761A
公开(公告)日:2024-08-27
申请号:CN202310176248.2
申请日:2023-02-24
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06F16/35 , G06N3/084 , G06N3/047 , G06N3/0464
Abstract: 本发明提出一种基于主动学习的文本关系抽取方法和系统,包括:从文档库中筛选出所有和知识库中实体对相异的新实体对;使用噪声预测模型筛除所有新实体对中的噪声数据,得到中间实体对,使用关系预测模型对所有中间实体对进行打分,为得分高于阈值的中间实体打标注,形成新关系数据集;合并新关系数据集、重标注数据集和清洁数据集,形成远程监督关系抽取数据集;使用K个具有不同噪声转换矩阵的句子编码器分别拟合句子的向量表示在各标签类型上的噪声分布,以将真实标签的语义表征映射到噪声标签的语义表征空间中,得到句子的预测标签,其中K为标签类型总数;基于训练完成后的K个句子编码器产生的预测结果,得到目标句子中实体对的文本关系。
-
公开(公告)号:CN118070868A
公开(公告)日:2024-05-24
申请号:CN202410293163.7
申请日:2024-03-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于边缘计算架构的模型结构化剪枝方法及装置,该方法包括:根据集群中每一边缘设备的硬件资源信息,对边缘设备进行分组;对于同一组的边缘设备,将神经网络加速器在该边缘设备硬件的实际运行时间与内存资源消耗作为资源约束条件,对该边缘设备上部署的神经网络模型进行剪枝;校准修剪后的神经网络模型。该方法提高了计算设备的硬件处理速度,降低了内存消耗,进而提升了计算机系统的内部性能。
-
公开(公告)号:CN118070071A
公开(公告)日:2024-05-24
申请号:CN202410353576.X
申请日:2024-03-26
Applicant: 中国科学院计算技术研究所
IPC: G06F18/22 , G06F18/23213 , G06F18/2433 , G06F18/25 , G06N3/0464 , G06N3/042 , G06N3/0455 , G06Q50/00 , G06N3/048
Abstract: 本发明提出一种基于图卷积聚类的社交机器人群体检测方法,包括:使用已知账号的个体特征,训练专家模型;获取目标账号的个体特征,通过该专家模型将该目标账号识别为种子账号或待定账号;以图卷积聚类方法,将该目标账号划分为多个群体,获取每个群体的群体特征;将该目标账号的个体特征,与其所在群体的群体特征进行拼接融合,获得该目标账号的识别特征;将该待定账号的识别特征与其所在群体的种子账号的识别特征进行相似度比较,以相似度大于识别阈值的待定账号为识别账号;将该种子账号和该识别账号标识为社交机器人。本发明还提出一种基于图卷积聚类的社交机器人群体检测装置,以及一种计算机可读存储介质和一种电子设备。
-
公开(公告)号:CN117668857A
公开(公告)日:2024-03-08
申请号:CN202311675503.4
申请日:2023-12-07
Applicant: 中国科学院计算技术研究所
IPC: G06F21/57 , G06F18/22 , G06F18/214
Abstract: 本发明提出一种基于模拟数据投毒攻击的推荐系统安全性测试方法和系统。通过梯度传递技术可以加速替代推荐系统的训练过程,以在有限时间内得到更准确的替代模型。梯度传递技术可以增强现有模拟攻击样本的准确性。通过加速替代模型训练得到更准确的替代模型,可以从替代模型中获得更好的优化指导,从而增强现有模拟攻击样本的准确性。梯度传递可以广泛增强基于替代系统的攻击方法,包括大部分现有的推荐系统模拟投毒攻击,这为后续的研发提供了基础。同时,也可以帮助发现了推荐系统的弱点,为设计更可靠的防御方法提供启示。
-
公开(公告)号:CN117353891A
公开(公告)日:2024-01-05
申请号:CN202311183915.6
申请日:2023-09-14
Applicant: 中国科学院计算技术研究所
IPC: H04L9/00 , H04L9/40 , H04L9/32 , H04L67/1097 , G06F21/60 , G06F21/64 , G06F40/289
Abstract: 本发明提供了一种去中心化的数据交易平台,包括:元数据管理模块,被配置为:获取卖方待售的数据对应的元数据以及数据对应的加密数据,所述元数据包括数据描述信息和卖方地址;数据查重模块,被配置为:根据所述数据对应的加密数据以及已有数据对应的加密数据以非解密状态进行数据查重,确定所述待售的数据的重复率,所述重复率影响所述数据的评分;数据交易模块,被配置为:在买方根据所述待售的数据的元数据和评分确定向卖方购买数据后,在卖方和买方之间建立基于智能合约的数据传输支付协议并通过加密信道传输数据。
-
公开(公告)号:CN116662480A
公开(公告)日:2023-08-29
申请号:CN202310505568.8
申请日:2023-05-06
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/295 , G06N5/022 , G06N3/045
Abstract: 本发明提出一种基于实体增强的文本语义表示方法和系统,包括:获取文本编码模型和实体增强编码模型,实体增强编码模型由串联的外部实体向量表示模块和上下文相关的实体信息编码模块组成;通过文本编码模型提取目标文本的第一表示向量;以外部实体向量表示模块识别目标文本中表示实体的词项序列,并确定词项序列和知识库中的哪些实体相关联,获得词项序列对应实体的在知识库中的实体向量表示;实体信息编码模块包括多个串联的实体适配器层,实体信息编码模块的输入为实体向量表示和文本编码模型中间层的隐状态;最后一个实体适配器层输出的特征作为目标文本的第二表示向量;融合第一表示向量和第二表示向量,得到目标文本的语义表示结果。
-
公开(公告)号:CN116541569A
公开(公告)日:2023-08-04
申请号:CN202310539720.4
申请日:2023-05-15
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9035 , G06Q50/00 , G06F16/901
Abstract: 本发明提供了一种社交网络图的处理方法,包括:获取包括第一社交网络图和第二社交网络图的待处理网络图,以及两个图对应的初始锚点对集合;针对所述第一社交网络图和所述第二社交网络图分别提取两个图的节点结构信息;根据所述两个图的节点结构信息采用启发式的过滤规则基于多种相似度计算方式从所述初始锚点对集合中筛选出满足预设相似性要求的初始锚点对,得到经过滤的初始锚点对集合,其中,至少部分相似度计算方式依据两个图中能表征邻居结构的相关特征来计算相似度;基于所述节点结构信息和所述经过滤的初始锚点对集合确定所述第一社交网络图和所述第二社交网络图中节点间的关联关系。
-
公开(公告)号:CN111738003B
公开(公告)日:2023-06-06
申请号:CN202010541415.5
申请日:2020-06-15
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例提供了命名实体识别模型训练方法、命名实体识别方法和介质,本发明考虑先用源领域标记数据和目标领域未标记数据集对第一训练模型进行训练,基于第一训练模型的参数设置第二训练模型,再用目标领域标记数据集对第二训练模型进行微调,从而得到最终的命名实体识别模型,由此,避免了需要大量标记目标领域的样本用于训练的问题。
-
公开(公告)号:CN115761414A
公开(公告)日:2023-03-07
申请号:CN202211536222.6
申请日:2022-12-01
Applicant: 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/82
Abstract: 本发明提出一种鲁棒数据集蒸馏方法,包括:在原训练数据集中进行随机采样,作为初始化的蒸馏数据集;对该原训练数据集进行随机采样,得到原样本采样集;为该原样本采样集添加对抗扰动,得到扰动样本采样集;分别计算该扰动样本采样集与该蒸馏数据集的特征表示或网络梯度,以该特征表示或网络梯度的差异作为损失函数;根据该损失函数反向传播对该蒸馏数据集进行优化更新,不断迭代优化过程,直至损失函数收敛,保存当前蒸馏数据集作为最终的鲁棒蒸馏数据集。以该鲁棒蒸馏数据集代替该原训练数据集,训练目标深度神经网络模型完成图像识别分类。本发明将对抗鲁棒特性蒸馏到鲁棒蒸馏数据集,从而提升蒸馏数据集训练得到模型的鲁棒性。
-
公开(公告)号:CN115756781A
公开(公告)日:2023-03-07
申请号:CN202211415669.8
申请日:2022-11-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于无中心自组织流式数据计算引擎调度的任务执行方法和系统,通过无中心自组织的形式实现流式数据计算引擎调度器,无中心作业管理器负责集群计算任务相关信息存储及共享。微集群采用任务驱动方式创建,每个微集群负责一个计算任务执行。采用微集群的形式可以降低传统无中心系统计算延迟。
-
-
-
-
-
-
-
-
-