-
公开(公告)号:CN112307278B
公开(公告)日:2024-02-23
申请号:CN202011154213.1
申请日:2020-10-26
Applicant: 中国科学院计算技术研究所
IPC: G06F16/903 , G06F16/901
Abstract: 本发明提出一种任意尺度的话题脉络实时生成方法及系统,包括:获取话题历史数据,该话题历史数据包括指定时间范围内预设时间单位的子话题及各子话题所包含的文档;以子话题作为节点,根据该指定时间范围内子话题间的相关性,建立节点间的连边,得到该话题历史数据的图数据;通过动态规划得到该指定时间范围内预设时间单位中各节点的路径权值最大的前k条路径,从所有的出度为0的各节点的该前k条路径中选出权值最大的前k条路径作为该话题历史数据的话题脉络,其中k为正整数。
-
公开(公告)号:CN117333738A
公开(公告)日:2024-01-02
申请号:CN202311308831.0
申请日:2023-10-10
Applicant: 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/764 , G06V10/40
Abstract: 本发明实施例提供了一种图像分类模型训练方法,该方法包括:S1、获取包括多个图像样本的原始图像数据集及其对应的特征矩阵;S2、对原始图像数据集对应的特征矩阵进行降维处理,并将降维处理后的特征矩阵进行高斯建模以获得特征矩阵中每个特征值的高斯分布;S3、基于步骤S2中每个特征值的高斯分布对其依次进行高斯采样,以使高斯采样所得的所有特征值构成新的特征矩阵,并基于新的特征矩阵生成新的图像数据集;S4、采用新的图像数据集和原始图像数据集构成增强图像训练集训练图像分类模型至收敛。该方法提高了图像分类模型在少样本情况下的性能。
-
公开(公告)号:CN117076598A
公开(公告)日:2023-11-17
申请号:CN202310518172.7
申请日:2023-05-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F16/953 , G06F40/30 , G06F18/25
Abstract: 本发明提出一种基于自适应权重的语义检索模型融合方法,包括:以检索信息进行稀疏检索,获取稀疏检索结果及对应的稀疏排序分值;以该检索信息进行稠密检索,获取稠密检索结果及对应的稠密排序分值;构建权重预测模型,基于该检索信息、该稀疏检索结果和该稠密检索结果通过该权重预测模型获取融合权重;以该融合权重、该稀疏排序分值和该稠密排序分值,生成融合排序分值;根据该融合排序分值,将该稀疏检索结果和该稠密检索结果进行排序,生成最终检索结果。本发明还提出一种基于自适应权重的语义检索模型融合系统,以及一种用于基于自适应权重的语义检索模型融合的数据处理装置。
-
公开(公告)号:CN116595406A
公开(公告)日:2023-08-15
申请号:CN202310385316.6
申请日:2023-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06F18/24 , G06F18/214 , G06F16/23 , G06F40/289 , G06F18/25 , G06F17/16 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种基于角色一致性的事件论元角色分类方法及系统,采用图神经网络结构,将每个论元的预估角色概率分布融入事件触发词与事件论元的关联特征建模中,通过在触发词与各论元连接的星形图上进行多阶图神经网络交互,使得每个论元感知其他论元的角色信息,从而提高事件内所有论元角色整体的一致性。
-
公开(公告)号:CN116126553A
公开(公告)日:2023-05-16
申请号:CN202211689339.8
申请日:2022-12-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于编排执行的信息获取方法,包括:根据对目标信源的多层树状采集需求生成任务树,编排该任务树的初始配置;将该初始配置放入任务队列;由原子采集器获取该初始配置,根据该初始配置生成根采集任务;执行该根采集任务,生成该根采集任务的子任务的任务配置,将该任务配置放入任务队列,并输出该根采集任务的采集结果;由原子采集器获取任务配置,根据该任务配置生成当前任务;执行该当前任务,生成该当前任务的子任务的任务配置,将该任务配置放入任务队列,并输出该当前任务的采集结果;重复本步骤,直到完成该任务树。本发明还提出一种基于编排执行的信息获取系统,以及一种用于实现基于编排执行的信息获取的数据处理装置。
-
公开(公告)号:CN111914152B
公开(公告)日:2023-05-12
申请号:CN202010615515.8
申请日:2020-06-30
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9532 , G06F16/33 , G06F16/35
Abstract: 本发明提出一种网络事件预警方法及系统,包括:针对现有网络事件预警技术在子指标的计算、指标权重的赋值、预警效果的评价方面缺乏足够客观性,进而影响预警准确率的问题,本发明提出一种网络事件预警方法及系统。在计算子指标方面,本发明充分考虑消息之间的相互影响,利用物理学中的安培定律,让预警结果尽可能地反应整个事件的走向,提升客观性,提高预警准确率。在通过子指标逐级向上计算父指标方面,本发明利用物理学中场的概念来分析指标之间的关系,并借用场的度量方法为子指标赋权重,不需要专家参与,提升赋值过程的客观性,提高预警准确率。在网络事件预警评价方面,本发明借鉴异常检测思想提出客观的预警评价方法,提高评价的准确率。
-
公开(公告)号:CN110705597B
公开(公告)日:2022-11-11
申请号:CN201910833900.7
申请日:2019-09-04
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62 , G06F16/953
Abstract: 本发明提出一种基于事件因果关系抽取的网络苗头事件检测方法及系统,包括:将苗头因果事件对中原因事件作为苗头事件,存入苗头事件样本库,以苗头事件样本库的数据作为训练集,训练基于机器学习的第一苗头事件分类器,并将苗头因果事件对的因果联系作为苗头事件判定规则,存入苗头事件判定规则库,以苗头事件判定规则库构建基于规则的第二苗头事件分类器;对指定的网络平台进行事件抽取,得到多个结构化事件,并将多个结构化事件中指代同一个事件的结构化事件统一为一个共指事件,并对共指事件进行泛化,得到网络平台的抽象事件,使用第一苗头事件分类器和第二苗头事件分类器分别处理抽象事件,综合两者的结果作为网络平台苗头事件的检测结果。
-
公开(公告)号:CN110704717B
公开(公告)日:2022-09-27
申请号:CN201910833905.X
申请日:2019-09-04
Applicant: 中国科学院计算技术研究所
IPC: G06F16/953 , G06F16/33
Abstract: 本发明提出一种基于动力学模型的网络突发事件检测方法及系统,包括:对指定的网络平台进行事件抽取,得到多个结构化事件,并将多个结构化事件中指向同一基本事件的结构化事件进行消解聚合,得到多个结构化事件对应的多个基本事件;以结构化事件的自身属性作为结构化事件的质量,并以结构化事件的传播流行度作为位移,根据位移和结构化事件的从发布到被采集的时间,通过动力学模型确定结构化事件的加速度;根据结构化事件的加速度和质量,通过动力学模型确定各结构化事件的外力,集合各基本事件中结构化事件的外力,作为各基本事件的外力,根据基本事件的外力确定网络平台中各基本事件是否为广义突发事件。
-
公开(公告)号:CN114997177A
公开(公告)日:2022-09-02
申请号:CN202210561797.7
申请日:2022-05-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于多标签序列标注的指代消解方法,包括:S1、将待处理文本分割成预设长度且不重合的多个文本片段;S2、采用预训练模型对每个文本片段进行编码得到每个字符的语义表达;S3、基于每个字符的语义表达分别判断每个字符是否属于B I E标签;S4、基于每个字符对应的标签,在连续I标签序列中,基于预设的组合策略组合任意的BE标签对应的字符构成短语,其中,连续I标签序列表示一个连续的字符序列中的每个字符均具有I标签;S5、计算任意两个短语之间的相似性得分,为每个短语保留与其相似性得分排名靠前的预设个数的短语作为其前置候选短语;S6、采用排序模型将每个短语的前置候选短语进行排序并将得分第一的前置候选短语作为其互指对象。
-
公开(公告)号:CN114528459A
公开(公告)日:2022-05-24
申请号:CN202210044347.0
申请日:2022-01-14
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06F16/958 , G06F16/35 , G06F40/30 , G06F40/146
Abstract: 本发明提出一种基于语义的网页信息抽取方法,包括:获取目标网页的目标DOM树,对该目标DOM树的目标骨架节点按句进行分裂,得到该目标DOM树的目标骨架子节点;以分类模型按目标任务语义对所有该目标骨架子节点进行分类,获得该目标DOM树的目标信息子节点;对所有该目标信息子节点形成的节点路径进行聚类,获得该目标网页的目标信息树,对该目标信息树中包含的网页信息进行抽取。本发明还提出一种基于语义的网页信息抽取系统,以及一种用于实现基于语义的网页信息抽取的数据处理装置。
-
-
-
-
-
-
-
-
-