-
公开(公告)号:CN113569539A
公开(公告)日:2021-10-29
申请号:CN202110164573.8
申请日:2021-02-05
Applicant: 中国科学院计算技术研究所 , 腾讯科技(深圳)有限公司
IPC: G06F40/166 , G06F40/279
Abstract: 本申请的实施例提供了一种文本内容的衍生方法、装置、计算机可读介质及电子设备。该文本内容的衍生方法包括:获取原始文本内容,基于原始文本内容以及与原始条件相对应的反事实条件,从原始结尾中识别出与原始条件相关的因果内容;基于原始结尾以及原始结尾中的因果内容,确定表示原始结尾的文本架构的结尾框架;基于前提、反事实条件以及结尾框架构成的序列,生成原始结尾对应的反事实结尾;本实施例中生成的反事实结尾在原始结尾的基础上,基于原始文本内容中的因果内容生成,在因果内容与原始文本内容一致性的前提下,使得生成的反事实结尾更加符合因果逻辑,增加表达的流畅性。
-
公开(公告)号:CN110389953B
公开(公告)日:2021-10-29
申请号:CN201910508926.4
申请日:2019-06-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/22
Abstract: 本发明涉及一种基于压缩图的数据存储方法、系统和存储介质,该方法包括:步骤100,生成点表逻辑定义,根据该逻辑定义构建点表,并向该点集中插入数据;步骤200,生成边表逻辑定义,根据该逻辑定义构建边表,从所述点表中选择与该边表相关联的点表,并向所述边表中插入数据;步骤300,设置和执行压缩图定义命令,生成所述压缩图的建图逻辑,设置函数获取与所述压缩图定义关联的所述边表,形成边集聚合组,并生成与所述压缩图定义关联的所述点表的代理结构;步骤400,设置和执行压缩图重置命令,根据所述压缩图的建图逻辑构建所述压缩图。本方法降低了多次建图与建多类图的开销,增加了图构建的灵活性与表示性,减少了重复建图的排序工作量。
-
公开(公告)号:CN109840298B
公开(公告)日:2021-09-24
申请号:CN201811637902.0
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06F16/955
Abstract: 本发明涉及一种大规模网络数据的多信息来源采集方法,包括:获取多种传媒上的网络数据所在的信源;生成采集任务,启动并初始化采集节点上的采集器;将该采集任务的参数配置信息加载至该采集器;以该采集器获取该信源的目标信息内容链接,并建立链接队列;以该采集器依次采集该链接队列中对应的目标信息内容为结构化数据;将该结构化数据进行持久化操作,并进行输出。本发明提出的方法可以感知信息来源的变化,能够定点定主题的获取信息来源的网络数据,并且具有泛化能力,采集能力与传媒种类无关。
-
公开(公告)号:CN110557428B
公开(公告)日:2021-08-24
申请号:CN201910646748.1
申请日:2019-07-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于Kubernetes的脚本解释型服务代理方法和系统,该方法包括:设置一客户端,用于生成代理脚本并作为服务请求;设置一Kubernetes系统,并在该Kubernetes系统中部署若干服务;设置一服务执行单元,用于处理该服务请求,并返回处理结果至该客户端;该方法包括:函数绑定步骤,该服务执行单元根据一预设协议,定期查询API SERVER,获取该Kubernetes系统中的服务,并为每一服务绑定一函数名称;服务调用步骤,该服务执行单元接收并解析执行该客户端发送的该服务请求中的代理脚本,并在执行脚本的过程中,依据函数名调用Kubernetes中的服务。本发明有效解决了复杂服务以及远程和不可靠环境下的访问问题。
-
公开(公告)号:CN109753596B
公开(公告)日:2021-05-25
申请号:CN201811637397.X
申请日:2018-12-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/95
Abstract: 本发明涉及一种网络数据采集的信源管理与配置方法,包括:感知网络数据的信息来源,将该信息来源拆分为传媒、信簇和信源;根据信簇类别对该信簇进行类别标注;根据信源类别对该信源进行类别标注;根据该信源的信源类别配置采集模板;根据该信源所包含的网络数据配置抽取模板;当验证该信源为潜在失效信源时,将该信源置为无效,或重新配置该采集模板和/或该抽取模板。本发明的信源管理与配置系统,通过“传媒‑信簇‑信源”三级结构的分层概念体系和多维度的信息来源分类体系对来自不同类型的信息来源进行合理高效组织,进而实现对大规模网络信息来源的精确感知并设计采集策略。
-
公开(公告)号:CN112287274A
公开(公告)日:2021-01-29
申请号:CN202011162449.X
申请日:2020-10-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/958 , G06F16/35 , G06F16/957 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种网站列表页面的分类方法,方法包括:步骤100,获取一组网站页面集合,网站页面集合归属于同一网站;步骤200,分别针对每一网站页面提取网页数据特征;步骤300,通过网站页面的超链接列表以及网站网页的链接地址(URL)与节点编号之间的匹配关系形成的哈希表,创建网站的全局拓扑结构;步骤400,将网页数据特征以及网站的全局拓扑结构输入图卷积神经网络进行图卷积神经网络的训练,得到网站列表页面分类器;步骤500,获取待分类的网站网页,分别根据待分类的网站网页的网页数据特征和网站的全局拓扑结构,并将待分类的网站网页的网页数据特征和网站的全局拓扑结构输入网站列表页面分类器,判断该待分类的网站网页是否为网站列表页面。
-
公开(公告)号:CN109828995B
公开(公告)日:2020-12-11
申请号:CN201811533324.6
申请日:2018-12-14
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/28 , G06K9/62
Abstract: 本发明涉及一种基于视觉特征的图数据检测方法和系统,包括:获取待分析的图数据,并统计该图数据的分布特征;将该分布特征输入基于视觉特征的分类模型,得到该图数据中具有相同类别的节点,通过将类别相同的该节点划分至同一分组,得到多个分组;利用基于视觉的分析模型对该分组进行聚合分析,得到每个分组的聚类特征,根据每个分组的该聚类特征进行模式总结和异常检测处理,并将每个分组的该聚类特征、模式总结结果和异常检测结果作为该图数据的检测结果。本发明不直接对大图数据的邻接矩阵或者拉普拉斯矩阵进行分解操作,处理速度快,效率高,具有更强的及时性。
-
公开(公告)号:CN111291229A
公开(公告)日:2020-06-16
申请号:CN202010071390.7
申请日:2020-01-21
Applicant: 中国科学院计算技术研究所
IPC: G06F16/901 , G06F16/9035 , G06Q40/04
Abstract: 本发明提出一种基于稠密多部子图的检测方法及系统,包括:步骤1、根据链式特征中的信息流动,构建交易网络的多部图,根据预设的账户间信息流动阈值筛选该多部图,得到该多部图中的稠密子图;步骤2、以固定账户存在超阈值的信息流且在中间账户中保留低于阈值的权重为约束条件,生成该稠密子图中节点子集的异常值;步骤3、根据该异常值,输出该多部图中存在异常行为的节点子集作为异常行为检测结果。本发明通过具有有效性和鲁棒性和良好的可扩展性。
-
公开(公告)号:CN106874489B
公开(公告)日:2020-05-12
申请号:CN201710092869.7
申请日:2017-02-21
Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于卷积神经网络的肺结节图像块检索方法及装置,通过对获取的肺结节图像块进行切片处理,得到至少两张肺结节切片扫描图,通过构造卷积神经网络提取肺结节切片扫描图的图像特征,得到肺结节的局部特征集合,获取数据库中所有肺结节的局部特征集合,对所有肺结节的局部特征集合进行聚类构建视觉词典,基于视觉词典获取肺结节带权特征向量,通过倒排索引的方式对肺结节带权特征向量构建索引库,根据输入的查询信息对索引库执行检索,得到符合查询条件的肺结节图像块。本发明能够快速、准确的检索出与待检索肺结节最相似的肺结节图像序列。
-
公开(公告)号:CN111062214A
公开(公告)日:2020-04-24
申请号:CN201911166642.8
申请日:2019-11-25
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于深度学习的集成实体链接方法及系统。首先选取某一个局部相似度模型,对待链接文档给出初步的链接结果。随后,根据每个指称词相应候选实体集合的局部相似度得分,候选实体集合生成方法本发明不加以限制,可采用现有任意候选实体生成方法;局部相似度得分即所选用的局部相似度模型对每个候选实体计算出来的相似度得分,按照下述方法计算每个指称词的有效候选实体集合表达向量。结合全局推断算法,利用指称词所在的文档的文本信息和同一文档中指称词之间的相互关联性完成实体链接任务。本发明利用同一文档中指称词之间的相互关联丰富指称词的语义信息,能够更好地辨别指称词的含义,达到良好的实体链接性能。
-
-
-
-
-
-
-
-
-