-
公开(公告)号:CN119045823A
公开(公告)日:2024-11-29
申请号:CN202410642450.4
申请日:2024-05-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种支持多硬件的深度学习模型编译方法和编译器,包括:获取需要编译的深度学习模型的计算图与目标设备信息;将目标设备信息基于预设的硬件模型转换为硬件属性中间形式,基于深度学习模型的基本操作获取线性操作中间形式,基于深度学习模型的张量,获取张量形状中间形式;基于张量与张量形状中间形式,获取内存中间形式,并采用异构内存传输折叠方法优化内存拷贝行为;基于获取的线性操作中间形式获取循环中间形式,采用融合、堆叠、向量化的方法,优化循环中间形式中的循环,并转化为向量中间形式,基于预设的计算模型获取异构设备数据操作规则中间形式;基于前面获取的多个中间形式,获取可在目标设备进行推理的可执行代码。
-
公开(公告)号:CN118445392A
公开(公告)日:2024-08-06
申请号:CN202410577965.0
申请日:2024-05-10
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F16/33 , G06F40/284 , G06F40/30
Abstract: 本发明提出一种面向网页的阅读理解模型的训练方法、装置、存储介质,该方法包括:获取网页基于DOM树结构的路径信息,利用该路径信息表征网页的逻辑结构信息表示;获取网页基于网页快照的坐标信息,利用该坐标信息表征网页的空间结构信息表示;获取网页中的提示词,利用该提示词对初始问题文本进行信息增强,得到目标问题文本;将该逻辑结构信息表示与该空间结构信息表示融合,输入到网页阅读理解模型中;以及将该目标问题文本与该网页内容文本拼接,输入到该网页阅读理解模型中,获取答案。该方法提升了模型的网页理解能力,进而提高答案的准确性和相关性。
-
公开(公告)号:CN118364163A
公开(公告)日:2024-07-19
申请号:CN202310072620.5
申请日:2023-01-16
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/9536 , G06Q50/00
Abstract: 本发明提出一种基于事件聚合的网络舆情专报自动生成方法和系统,包括:获取待舆情监测的全量媒体新闻,分类该全量媒体新闻,得到该全量新闻中属于目标类别的目标文本;提取该目标文本的关键词,将该关键词与该目标文本中每篇文章组成特征文本,经文本向量化处理,得到每篇文章的特征向量,聚类该特征向量,将该目标文本中属于同一事件的文章聚类成事件集合,将每个事件集合内所有文章的特征词合并,作为每个事件的标签;结合用户关注的关键词以及各事件的媒体报道量,量化所有事件的标签,得到每个该事件集合的重要度,展示重要度大于预设值的事件及其标签。
-
公开(公告)号:CN118193995A
公开(公告)日:2024-06-14
申请号:CN202410323557.2
申请日:2024-03-20
Applicant: 中国科学院计算技术研究所
IPC: G06F18/21 , G06F18/22 , G06F18/241 , G06Q30/0601 , G06F16/532 , G06F16/583 , G06F16/9532 , G06N3/0499 , G06N3/084
Abstract: 本发明提出一种人工智能模型的个体公平性度量方法,包括:根据人工智能模型的数据的输入数据范围,构建人工智能模型的输入样本集合;从输入样本集合中选择样本构成样本对,计算样本对中两样本间的样本相似性,将样本对中样本分别输入人工智能模型,得到样本对经过人工智能模型处理的结果对,计算结果对中结果间的结果相似性,判断结果相似性和样本相似性的差异绝对值是否低于阈值,若是则为样本对分配代表公平对待的公平性度量结果,否则为样本对分配代表不公平对待的公平性度量结果;重复多次公平性确定步骤,得到公平性报告,公平性报告包含多个样本对及各样本对的公平性度量结果。本发明可揭示和证明人工智能模型算法中存在的个体不公平现象。
-
公开(公告)号:CN118014752A
公开(公告)日:2024-05-10
申请号:CN202410245083.4
申请日:2024-03-04
Applicant: 中国科学院计算技术研究所
IPC: G06Q50/00 , G06N3/0464 , G06N3/08 , G06F18/241
Abstract: 本发明提供一种基于类别的社交机器人检测方法及检测系统,该检测方法包括以下步骤:依据行为模式和目的将社交机器人分成n个类别,其中n为正整数;基于所述类别构建通用模型加专用模型的集成学习检测框架;获取社交平台的用户数据作为样本,将所述样本输入所述集成学习检测框架并依据一投票模式判定所述样本是否为社交机器人。本发明的检测方法形成了行为模式更加鲜明的社交机器人分类,在将社交机器人归类的同时辅以相应的集成学习检测框架,识别泛化性和准确性均有提升。
-
公开(公告)号:CN117440003A
公开(公告)日:2024-01-23
申请号:CN202310644427.4
申请日:2023-06-01
Applicant: 中国科学院计算技术研究所
IPC: H04L67/1097 , H04L67/1023 , G06F16/245 , G06F16/27
Abstract: 本发明提出一种无中心的分布式存储方法和系统,包括:获取包括n个存储节点的分布式存储系统,根据一致性哈希所有存储节点和键值K映射并以数轴的形式排列到哈希空间σ;n个节点将数轴划分为n+1个区间,根据数轴上n个节点之间的距离可以将数轴划分为n个节点对应的近邻空间;键值K对应的数据存储至距键值K哈希距离最短的存储节点。本发明的方法对于无中心分布式系统负载不均和查询性能低下的缺陷做出一定适应场景的优化,其意义不仅在于促进关于分布式存储的研究,为研究者们解决上述问题提供了新的思路,还有助于大数据计算、大数据分析等与分布式存储密切相关的实际场景应用的发展。
-
公开(公告)号:CN117273073A
公开(公告)日:2023-12-22
申请号:CN202211061838.2
申请日:2022-08-31
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/049 , G06N3/084 , G06N3/0895 , G06N3/094
Abstract: 本发明实施例公开了基于网络表示的训练方法、系统及存储介质和终端设备,应用于信息处理技术领域。基于网络表示的训练系统会将动态网络表示模型分为两个部分,即稳定特征模块和动态特征模块,从而通过多个时刻的样本网络来分别调整稳定特征模块和动态特征模块,从而通过稳定特征模块获取动态网络中各节点的稳定特征,通过动态特征模块获取动态网络中各节点的动态特征。训练的动态网络表示模型中的稳定特征模块和动态特征模块,针对性地对动态网络的各个节点中基于时序不变的特征与基于时序可变的特征进行分离表示,以面对不同的下游任务时可采用不同的侧重方,比如预测节点随时间不变的性质时可以采用稳定特征模块获取的稳定特征等。
-
公开(公告)号:CN117150378A
公开(公告)日:2023-12-01
申请号:CN202310943983.1
申请日:2023-07-28
Applicant: 中国科学院计算技术研究所
IPC: G06F18/2415 , G06F18/25 , G06F18/213 , G06F40/12 , G06F18/22 , G06N3/0464 , G06N3/08 , G06Q50/00 , G06F123/02
Abstract: 本发明为一种特征融合的多重图卷积神经网络社交机器人检测方法与装置,包括以下步骤:获取社交平台的用户账号数据;根据用户账号数据构建基于社交网络显式内容关系和隐式内容关系的多重图网络关系;对多重图网络关系进行显式特征提取,得到第一特征数据;对多重图网络关系进行隐式特征提取,得到第二特征数据;将第一特征数据和第二特征数据进行融合,得到第一特征融合数据;对第一图网络关系和/或第二图网络关系进行重叠社群划分,计算重叠社群的节点特征,得到第三特征数据;将第三特征数据和第一特征融合数据进行融合,得到第二特征融合数据;将第二特征融合数据输入到多重图卷积神经网络中进行训练,生成社交机器人检测分类器。
-
公开(公告)号:CN117149940A
公开(公告)日:2023-12-01
申请号:CN202310942975.5
申请日:2023-07-28
Applicant: 中国科学院计算技术研究所
IPC: G06F16/31 , G06F16/35 , G06F16/332 , G06F40/30 , G06F40/126 , G06N3/04 , G06N3/047 , G06N3/08
Abstract: 本发明提出一种事件论元抽取方法、装置,方法包含:分别对训练数据、事件类型进行编码,得到触发词上下文语义表示、事件类型的表示,并将两者表示交互,得到含事件类型信息的触发词表示,并预测事件类型;生成对应事件类型的论元抽取问题,并将待抽取文本与论元抽取问题拼接编码,得到标签的上下文语义表示、待抽取句子各个词的上下文语义表示、论元角色的上下文语义表示;将标签的上下文语义表示、待抽取句子中的各个词的上下文语义表示分别与需要抽取的论元角色的上下文语义表示拼接后,输入判别网络,分别得到判别概率、标注概率;结合判别概率和标注概率确定最终论元角色对应的抽取结果。该方法提高了事件抽取性能。
-
公开(公告)号:CN116991973A
公开(公告)日:2023-11-03
申请号:CN202311091925.7
申请日:2023-08-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/169 , G06Q50/00
Abstract: 本发明提供一种基于微博平台文本特征的社交机器人检测系统,所述系统包括:显式文本特征提取模块,用于提取微博平台账号对应的账号元信息文本与原发评论转发文本对应的显式文本特征;隐式文本特征提取模块,用于提取微博平台账号对应的账号元信息文本与原发评论转发文本对应的隐式文本特征;深层文本语义特征提取模块,用于对微博平台账号对应的账号元信息文本与原发评论转发文本进行情感检测、立场检测、垃圾内容检测、昵称检测和文本生成检测以获取对应的深度文本语义特征;社交机器人判定模块,用于将显式文本特征、隐式文本特征、深度文本语义特征拼接以得到融合特征,并根据融合特征判断微胖平台账号是否是社交机器人。
-
-
-
-
-
-
-
-
-