一种基于多层划分框架的RDF分布式存储方法

    公开(公告)号:CN109344259B

    公开(公告)日:2022-02-22

    申请号:CN201810803364.1

    申请日:2018-07-20

    Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

    一种面向课程领域的图像文本聚合方法及系统

    公开(公告)号:CN113221882A

    公开(公告)日:2021-08-06

    申请号:CN202110512070.5

    申请日:2021-05-11

    Abstract: 本发明公开了一种面向课程领域的图像文本聚合方法及系统,将对象特征及邻接矩阵作为输入构建图像对应的对象关系图,利用图卷积神经网络更新关系图中节点的特征;将所有语块特征向量的集合作为整个文本描述的特征表示;以对象特征集合和步语块特征集合作为输入,构建图文对之间的局部相似度矩阵;计算整个课程领域图像和文本描述之间的全局相似度;通过梯度下降法训练图文匹配模型的参数,通过已学习到的参数得出全局相似度最高的一段文本描述作为和该张图像相匹配的描述文本,实现图像文本聚合。本发明能够有效提取课程领域图像和文本描述的特征,从而将课程领域示意图和文本知识碎片聚合,进而自动化构建跨模态的知识碎片。

    一种基于图匹配网络的可对比学习对象生成方法及系统

    公开(公告)号:CN113095361A

    公开(公告)日:2021-07-09

    申请号:CN202110249307.5

    申请日:2021-03-08

    Abstract: 本发明公开了一种基于图匹配网络的可对比学习对象生成方法及系统,通过解析半结构化数据获得两个学习对象间的关系和学习对象的初始属性集合,将初始属性集合中所有属性的概率值进行迭代传播,利用学习对象所对应的属性词进行相关性操作得到两个属性词的注意力权重,解决远程监督带来的噪声问题,用图神经网络来捕获学习对象属性间关联的整体和局部结构,基于图匹配网络进行学习对象的结构间对齐,将学习对象的属性重要性计算转化为在属性关联上的中心度计算问题,采用属性节点中心度来实现可对比学习对象识别方法,实现非结构化的文本进行知识点和属性抽取,提高非结构化的文本学习对象的快速识别,为学习者提供一种可对比的学习对象生成结果。

    一种通过标签传播算法进行主题分面挖掘的方法

    公开(公告)号:CN109815495B

    公开(公告)日:2020-06-05

    申请号:CN201910041002.8

    申请日:2019-01-16

    Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题‑分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题‑分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。

    一种基于主题信息的文本切割方法

    公开(公告)号:CN110110326A

    公开(公告)日:2019-08-09

    申请号:CN201910339645.0

    申请日:2019-04-25

    Abstract: 本发明公开了一种基于主题信息的文本切割方法,具体操作如下:对输入文本以及训练集进行预处理,获得一系列单词组成的句子;然后进行特征提取,得到其特征向量;再根据其蕴含的语义信息对输入文本进行聚类操作,得到一系列句子簇,并为每个簇按顺序分配一个数字标号,得到一系列带有数字标号的单句;为每一个句子分配一个训练集中已有的主题标签,使得训练集中已有的主题标签分配至文本中的所有句子;利用数字标签标注结果和主题标签标注结果,进行修正,得到带主题标签的文本片段,将主题标签分配到切割后的文本上,使句子描述的主题都清晰可见,可以方便的根据主题定位到文本中描述该主题的位置,使得检索更为方便。

    一种通过标签传播算法进行主题分面挖掘的方法

    公开(公告)号:CN109815495A

    公开(公告)日:2019-05-28

    申请号:CN201910041002.8

    申请日:2019-01-16

    Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题-分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题-分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。

    一种基于特定行为共现网络的人物共现关系图谱构建方法

    公开(公告)号:CN105760439B

    公开(公告)日:2018-12-07

    申请号:CN201610073885.7

    申请日:2016-02-02

    Abstract: 本发明公开了一种基于特定行为共现网络的人物共现关系图谱构建方法。首先构建标准训练数据集和触发词表,用字符串匹配的方法,对所有待测试句子进行过滤得到候选特定行为句的集合;然后抽取标准训练数据集中所有句子的全词特征向量,用于训练SVM分类器识别特定行为,用训练好的SVM分类器对候选特定行为句进行分类,识别出特定行为句;最后构建出包含命名实体及其共现关系的特定行为共现网,在特定行为共现网的基础上构建人物共现关系图谱。本发明能在大量真实网络舆情数据上有效识别特定行为句,并在此基础上构建出特定行为共现网和人物共现关系图谱,为舆情分析提供新的可视化分析方法。

    一种从维基百科半结构化数据自动构建分类树的方法

    公开(公告)号:CN103778238A

    公开(公告)日:2014-05-07

    申请号:CN201410040234.9

    申请日:2014-01-27

    CPC classification number: G06F17/30938

    Abstract: 本发明公开了一种从维基百科半结构化数据自动构建分类树的方法,包括(1)半结构化数据的抽取,通过分析获取到页面的HTML,识别出含有半结构化数据的页面。(2)半结构化数据中上下位关系的抽取,依据维基目录页面的布局特点,获取其中包含的上下位关系;解析HTML元素,依据导航表的结构,获取表格中包含的上下位关系。(3)源于不同半结构化数据的上下位关系融合,依据抽取到的上下位关系集构建向无权简单图,然后基于图的深度优先遍历算法生成分类树。本发明能够自动抽取维基页面中的上下位关系,并构建分类树,减少领域专家构建的成本,充分重用了志愿者手工构建的上下位关系。

Patent Agency Ranking