-
公开(公告)号:CN113221577B
公开(公告)日:2024-10-29
申请号:CN202110464651.6
申请日:2021-04-28
Applicant: 西安交通大学
IPC: G06F40/30 , G06F40/216 , G06F40/284 , G06N3/0442 , G06N3/0455 , G06N3/048
Abstract: 本发明公开了一种教育文本知识归纳方法、系统、设备及可读存储介质,通过从教育文本中拾取领域术语,然后爬取维基百科中对该术语的解释作为理解该术语所需的外部知识,并分别对教育文本和外部知识进行编码,生成语境向量辅助摘要生成过程,弥补了机器自动生成摘要时对背景知识的缺失,利用双注意力机制计算当前时刻解码状态关于教育文本的语境向量和外部知识库的语境向量,并将二者融合参与解码过程。使用了双拷贝机制计算复制概率,从而实现从教育文本或外部知识中复制相关内容到摘要中,提高了模型捕捉细节的能力,同时缓解了未登录词或低频词带来的问题。
-
公开(公告)号:CN109344259B
公开(公告)日:2022-02-22
申请号:CN201810803364.1
申请日:2018-07-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。
-
公开(公告)号:CN113221882A
公开(公告)日:2021-08-06
申请号:CN202110512070.5
申请日:2021-05-11
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向课程领域的图像文本聚合方法及系统,将对象特征及邻接矩阵作为输入构建图像对应的对象关系图,利用图卷积神经网络更新关系图中节点的特征;将所有语块特征向量的集合作为整个文本描述的特征表示;以对象特征集合和步语块特征集合作为输入,构建图文对之间的局部相似度矩阵;计算整个课程领域图像和文本描述之间的全局相似度;通过梯度下降法训练图文匹配模型的参数,通过已学习到的参数得出全局相似度最高的一段文本描述作为和该张图像相匹配的描述文本,实现图像文本聚合。本发明能够有效提取课程领域图像和文本描述的特征,从而将课程领域示意图和文本知识碎片聚合,进而自动化构建跨模态的知识碎片。
-
公开(公告)号:CN113095361A
公开(公告)日:2021-07-09
申请号:CN202110249307.5
申请日:2021-03-08
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于图匹配网络的可对比学习对象生成方法及系统,通过解析半结构化数据获得两个学习对象间的关系和学习对象的初始属性集合,将初始属性集合中所有属性的概率值进行迭代传播,利用学习对象所对应的属性词进行相关性操作得到两个属性词的注意力权重,解决远程监督带来的噪声问题,用图神经网络来捕获学习对象属性间关联的整体和局部结构,基于图匹配网络进行学习对象的结构间对齐,将学习对象的属性重要性计算转化为在属性关联上的中心度计算问题,采用属性节点中心度来实现可对比学习对象识别方法,实现非结构化的文本进行知识点和属性抽取,提高非结构化的文本学习对象的快速识别,为学习者提供一种可对比的学习对象生成结果。
-
公开(公告)号:CN109815495B
公开(公告)日:2020-06-05
申请号:CN201910041002.8
申请日:2019-01-16
Applicant: 西安交通大学
IPC: G06F40/284 , G06F40/30
Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题‑分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题‑分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。
-
公开(公告)号:CN110110326A
公开(公告)日:2019-08-09
申请号:CN201910339645.0
申请日:2019-04-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于主题信息的文本切割方法,具体操作如下:对输入文本以及训练集进行预处理,获得一系列单词组成的句子;然后进行特征提取,得到其特征向量;再根据其蕴含的语义信息对输入文本进行聚类操作,得到一系列句子簇,并为每个簇按顺序分配一个数字标号,得到一系列带有数字标号的单句;为每一个句子分配一个训练集中已有的主题标签,使得训练集中已有的主题标签分配至文本中的所有句子;利用数字标签标注结果和主题标签标注结果,进行修正,得到带主题标签的文本片段,将主题标签分配到切割后的文本上,使句子描述的主题都清晰可见,可以方便的根据主题定位到文本中描述该主题的位置,使得检索更为方便。
-
公开(公告)号:CN109815495A
公开(公告)日:2019-05-28
申请号:CN201910041002.8
申请日:2019-01-16
Applicant: 西安交通大学
IPC: G06F17/27
Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题-分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题-分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。
-
公开(公告)号:CN105760439B
公开(公告)日:2018-12-07
申请号:CN201610073885.7
申请日:2016-02-02
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于特定行为共现网络的人物共现关系图谱构建方法。首先构建标准训练数据集和触发词表,用字符串匹配的方法,对所有待测试句子进行过滤得到候选特定行为句的集合;然后抽取标准训练数据集中所有句子的全词特征向量,用于训练SVM分类器识别特定行为,用训练好的SVM分类器对候选特定行为句进行分类,识别出特定行为句;最后构建出包含命名实体及其共现关系的特定行为共现网,在特定行为共现网的基础上构建人物共现关系图谱。本发明能在大量真实网络舆情数据上有效识别特定行为句,并在此基础上构建出特定行为共现网和人物共现关系图谱,为舆情分析提供新的可视化分析方法。
-
公开(公告)号:CN103778238A
公开(公告)日:2014-05-07
申请号:CN201410040234.9
申请日:2014-01-27
Applicant: 西安交通大学
IPC: G06F17/30
CPC classification number: G06F17/30938
Abstract: 本发明公开了一种从维基百科半结构化数据自动构建分类树的方法,包括(1)半结构化数据的抽取,通过分析获取到页面的HTML,识别出含有半结构化数据的页面。(2)半结构化数据中上下位关系的抽取,依据维基目录页面的布局特点,获取其中包含的上下位关系;解析HTML元素,依据导航表的结构,获取表格中包含的上下位关系。(3)源于不同半结构化数据的上下位关系融合,依据抽取到的上下位关系集构建向无权简单图,然后基于图的深度优先遍历算法生成分类树。本发明能够自动抽取维基页面中的上下位关系,并构建分类树,减少领域专家构建的成本,充分重用了志愿者手工构建的上下位关系。
-
公开(公告)号:CN116704244A
公开(公告)日:2023-09-05
申请号:CN202310593041.5
申请日:2023-05-24
Applicant: 西安交通大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06V10/42 , G06V10/44 , G06V10/74 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种课程领域示意图对象检测方法、系统、设备及存储介质,属于图像目标检测技术领域,对象检测方法包括提取图像全局特征信息以及待检测对象的局部特征信息并进行融合,得到融合特征信息;获取融合特征信息对应的预测概率,将待检测对象的局部特征信息与预测概率组成键值对;将键值对写入记忆网络,更新键值对并通过传递损失函数进行对象检测网络模型的训练,输入课程领域示意图至训练好的对象检测网络模型,输出课程领域示意图中所包含对象。本发明能够解决课程领域示意图视觉特征信息差异大、样本高度稀缺的问题,丰富特征信息,增强局部特征信息的视觉信息表示,提升课程领域示意图对象的检测性能。
-
-
-
-
-
-
-
-
-