一种基于任务感知元学习的持续关系抽取方法

    公开(公告)号:CN112667732B

    公开(公告)日:2024-08-16

    申请号:CN202110099305.2

    申请日:2021-01-25

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于任务感知元学习的持续关系抽取方法,包括:步骤1)构建基于任务感知元学习的持续关系抽取框架;所述框架包含:关系抽取神经网络分类模型、任务序列、记忆数据仓库、记忆数据选择器、负例标签选择器、元学习网络模型训练方法和参数更新方法。步骤2)结合任务与分类模型交互信息和任务自身语义信息,使用负例标签选择器为训练数据选择合适的负例标签。步骤3)训练关系抽取神经网络模型,并结合元学习思想对模型参数进行更新。步骤4)利用聚类方法从训练数据中挑选出一批记忆缓存。步骤5)将更新后的参数载入到模型,并进行性能测试。所述于基于任务感知元学习的持续关系抽取方法可以有效提升持续关系抽取效果。

    一种基于句法感知提示学习的句子级问题生成方法

    公开(公告)号:CN115759042A

    公开(公告)日:2023-03-07

    申请号:CN202211218782.7

    申请日:2022-10-07

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于句法感知提示学习的句子级问题生成方法,本发明首先根据给定的句子,构建相应的双向句法依存图,通过基于关系感知的注意力图编码器获取其语义表示,并将编码后的向量的输入softmax层,根据概率选取前k个向量作为连续型prompt。以前缀调整的方式将prompt拼接在给定源文本和答案上,共同输入到BERT模型中编码。然后将编码结果送入Transformer模型解码,并且在解码的每个时间步,建模已生成文本序列的句法依存信息,结合该信息和源句子的句法依存信息共同决定解码器需要重点关注的部分,辅助当前词的生成。同时,引入了复制机制来解决生成的单词不在问题词汇表中的情况,使得模型可以直接从源文本中复制单词。

    一种基于多种实体上下文的实体对齐方法

    公开(公告)号:CN112988917B

    公开(公告)日:2022-11-18

    申请号:CN202110346496.8

    申请日:2021-03-31

    Applicant: 东南大学

    Abstract: 本专利公开了一种基于多种实体上下文的实体对齐方法,主要处理因为实体结构异构性、实体属性异构性以及实体文本描述异构性引起的实体对齐困难问题。对于实体结构异构性问题,本专利使用TransE和RDF2Vec方法分别处理一跳和多跳结构信息,获取实体结构编码。对于实体属性异构性,本专利使用图卷积网络技术和图注意力机制,对每个实体按其属性的重要性提取其属性、属性值的信息,并映射到低维稠密的向量空间中。对于实体文本描述异构性,本专利使用预训练语言模型BERT获取文本语义信息,基于种子对齐实体信息进行模型的训练和学习,将实体的文本信息映射到低维稠密的向量空间。最后,本专利使用拼接技术和多视角技术对多种实体上下文进行联合对齐学习。

    基于层级式法律知识与双图联合表示学习的罪名预测方法

    公开(公告)号:CN115048510A

    公开(公告)日:2022-09-13

    申请号:CN202210147755.9

    申请日:2022-02-17

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于层级式法律知识与双图联合表示学习的罪名预测方法,主要用于依据案件事实描述对被告自动进行罪名预测,尤其是易混淆罪名的预测,辅助法官判案。本发明首先利用爬虫技术从中国裁判文书网上爬取大量法律文书,并对裁判文书进行初步处理,提取出每份文书的事实描述部分以及对应的判决罪名,构建结构图和语义图,并使用联合图交互得到事实描述的语义表示向量。然后利用爬虫技术爬取所有罪名的构成要件,作为专业法律知识用以区分罪名,并使用双图联合表示学习得到每个罪名知识的语义表示向量。然后利用注意力机制,得到知识感知的事实描述语义向量,最后将其与原事实向量相结合,输入到softmax层得到该事实描述对应的罪名预测结果。

    基于多模态表征的细粒度图像分类方法

    公开(公告)号:CN109002834B

    公开(公告)日:2022-02-11

    申请号:CN201810627958.1

    申请日:2018-06-15

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多模态表征的细粒度图像分类方法,利用知识库的嵌入模型,将知识用分布式的向量表达,结合文本的分布式词嵌入表达形式,从而获取图像分类中标签的语义向量表达。并且设计深度学习模型,分别通过检测网络和分类网络学习图像不同层面的特征,将图像与其对应的分类标签的语义向量表达形式联合映射分类,提高了细粒度图像分类的精确度。

    一种基于网络表示学习的相似案例推荐方法

    公开(公告)号:CN112100321A

    公开(公告)日:2020-12-18

    申请号:CN202010760699.7

    申请日:2020-07-31

    Applicant: 东南大学

    Abstract: 一种基于网络表示学习的相似案例推荐方法,主要用于给定法律文书的情况下在庞大的法律文书数据库中找出该法律文书最相似的10篇法律文书。本发明以互联网上的法律文书作为起点,利用爬虫技术爬取大量的法律文书,利用正则表达式对法律文书进行初步处理;利用爬虫技术爬取大量的法律实体,并通过bert计算法律实体与法律实体之间的相似度,达到阈值的法律实体之间构建相似实体关系,利用法律实体和法律文书构建法律知识网络,并将构建完成的网络输入到网络表示学习模型中,得到法律文书的向量值,利用余弦相似度计算得到该法律文书最相似的10篇文书。

    RDF数据上基于图匹配的why-not查询回答方法

    公开(公告)号:CN107193882B

    公开(公告)日:2020-11-20

    申请号:CN201710285751.6

    申请日:2017-04-27

    Applicant: 东南大学

    Inventor: 漆桂林 黄超 高桓

    Abstract: 本发明公开了一种RDF数据上基于图匹配的why‑not查询回答方法,包括如下步骤:(1)离线数据结构处理;(2)将why‑not问题中的关键字映射到RDF数据上的实体;(3)从候选实体出发,构造一个局部图;(4)查询分解;(5)图匹配;(6)生成why‑not问题的解释。本发明的有益效果为:本发明采用的方法可以更好、更高效的确定导致用户感兴趣的项被筛选掉的原因,并且给出相应的比较具体的修改意见,方便用户更好的去探索用户期望得到的结果,通常可以让用户更加满意。

    一种基于主题模型的跨语言层次分类体系匹配方法

    公开(公告)号:CN107391565B

    公开(公告)日:2020-11-03

    申请号:CN201710441927.2

    申请日:2017-06-13

    Applicant: 东南大学

    Abstract: 本发明公开一种基于主题模型的跨语言层次分类体系匹配方法,首先根据给定的两个不同语言层次分类体系产生相对应的背景文本,并对每个分类候选值进行预筛选;然后使用先前产生的背景文本作为语料库,使用一种基于主题模型的训练方法对每个分类生成其在语料库中对应的高维主题分布,接下来采用典型关联分析算法对两种不同语言的语料库对应的高维主题分布进行空间向量映射,最后对映射后每个分类的每个预筛选候选值进行计算其余弦相似度,并判断该候选值是否可以作为该分类的一个最相关分类。本发明能够为一种语言的层次分类体系中的每个分类识别其在另一种语言的层次分类体系中最相关的分类。

    一种面向关系型数据库的图查询方法

    公开(公告)号:CN106874422B

    公开(公告)日:2019-07-26

    申请号:CN201710055713.1

    申请日:2017-01-25

    Applicant: 东南大学

    Inventor: 漆桂林 孙松 张晓

    Abstract: 本发明公开了一种面向关系型数据库的图查询方法,主要应用于普通用户查询关系型数据库的场景。本发明中,离线处理阶段首先将关系型数据转换成图数据,并在该图数据上建立相关索引。在线查询阶段允许数据查询者用自己的词汇来构建图查询,然后对图查询的节点做初步匹配,最后进行Top‑k不精确子图匹配,对用户构建的图查询和离线转换得到的图数据进行图匹配。通过匹配,用户能够得到满足其查询要求的若干子图,而这些子图则作为查询结果返回给用户。

    一种基于图模型的实体链接方法

    公开(公告)号:CN108959461A

    公开(公告)日:2018-12-07

    申请号:CN201810627959.6

    申请日:2018-06-15

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于图模型的实体链接方法,主要用于处理非结构化文本的实体链接问题。本发明首先将同一文本中得到的所有实体指称项和相应的候选实体集合,构造出一张该文本的实体关联图,作为动态实体消歧算法的依据。然后利用基于图和PageRank的动态实体消歧算法,每轮挑选出最高得分的未消歧候选实体作为该实体指称的目标实体,逐步完成实体指称对应多个候选实体的消歧选择过程。最后使用机器学习领域中的XGBoost对实体指称的目标实体进行判断,将知识库中已登陆的目标实体正确链接,对知识库中未登录的目标实体正确识别。

Patent Agency Ranking