基于多模态表征的细粒度图像分类方法

    公开(公告)号:CN109002834A

    公开(公告)日:2018-12-14

    申请号:CN201810627958.1

    申请日:2018-06-15

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多模态表征的细粒度图像分类方法,利用知识库的嵌入模型,将知识用分布式的向量表达,结合文本的分布式词嵌入表达形式,从而获取图像分类中标签的语义向量表达。并且设计深度学习模型,分别通过检测网络和分类网络学习图像不同层面的特征,将图像与其对应的分类标签的语义向量表达形式联合映射分类,提高了细粒度图像分类的精确度。

    一种基于机器学习的跨语言分类结构匹配方法

    公开(公告)号:CN104699778B

    公开(公告)日:2017-09-01

    申请号:CN201510105414.5

    申请日:2015-03-10

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于机器学习的跨语言分类结构匹配方法,主要用于处理不同语言分类结构之间的匹配问题。本发明首先根据给定的两个分类结构产生一个双语的对照字典;然后对于给定的两个分类结构生成所有待匹配的分类对;接下来使用先前产生的字典作为辅助,使用一种基于机器学习的判定方法对每个分类对中两个分类是否可以匹配做出判定,该判定方法包含两步,第一步使用三个不同的评价方法(基于结构的相似度,基于属性的相似度,基于属性取值的相似度)对每个分类对中两个分类的可匹配程度进行评价,第二步使用机器学习的方法综合三种评价方法并对是否可匹配给出判定;最后,将所有被判定为可以匹配的分类对作为分类结构的匹配结果。

    使用基于MapReduce的蚁群优化技术求解组合优化问题的方法

    公开(公告)号:CN102982389A

    公开(公告)日:2013-03-20

    申请号:CN201210433343.8

    申请日:2012-11-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种使用基于MapReduce的蚁群优化技术求解组合优化问题的方法,属于组合优化问题求解技术领域。本发明包括如下步骤:根据设定的mapper的数量划分指定组合优化问题的解空间;Map阶段,每个mapper独立并行地在步骤1)划分得到的子问题解空间中执行改进的蚁群算法,搜索局部最优解;Reduce阶段,reducer接受所有mapper在不同解空间搜索到的局部最优解,根据步骤1)中采用的解空间划分情况综合得到全局最优解;输出reducer当前得到的全局最优解,结束。本发明具有更好的可伸缩性,能够更好的改善求解大规模组合优化问题的效率。

    一种基于课程规划元学习的增量关系抽取方法

    公开(公告)号:CN112084330B

    公开(公告)日:2025-01-14

    申请号:CN202010806791.2

    申请日:2020-08-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于课程规划元学习的增量关系抽取方法,包括以下步骤:构建课程规划元学习增量关系抽取框架;计算关系间相似度,并根据相似度重新规划记忆缓存训练顺序;训练关系抽取神经网络模型,并结合元学习思想,使用元学习参数更新公式对关系抽取神经网络模型的参数进行更新;利用聚类方法从训练数据中挑选出一批记忆缓存;将更新后的参数载入到关系抽取神经网络模型,并进行性能测试。本发明将课程学习和元学习思想引入到增量关系抽取任务中,有效提升了模型的平均准确率和整体准确率,并降低了模型的误差范围,从而有效缓解了增量学习中的“灾难性遗忘”和“次序敏感”问题,在主流的数据集上取得了优于传统方法的效果。

    一种基于跨语言知识图谱的多跳推理问答方法

    公开(公告)号:CN114780754B

    公开(公告)日:2024-12-17

    申请号:CN202210552441.7

    申请日:2022-05-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于跨语言知识图谱的多跳推理问答方法,主要用于改进现有的智能问答系统,使之能够在回答用户提出的问题时有效融合和利用不同语言的知识图谱中的信息。本发明关注传统问答方法在使用跨语言知识图谱时依赖预先融合图谱导致的错误传递问题,提出了一种跨图谱推理方法,并且进一步建立了一种迭代框架,用于联合多跳推理与实体对齐方法。前者使用multilingual‑BERT对文本进行通用表示,使推理信息能够在不同语言的图谱间传递.使用双向LSTM编码问题、推理路径。通过注意力机制更新问题表示,用于关系预测。后者将前者与实体对齐方法组合,以输入问题为query,从图谱上生成多组候选路径,迭代的从中抽取伪对齐标注增强实体对齐方法,从而提升问答性能。

    基于双重掩码散度的多模态大语言模型知识遗忘方法

    公开(公告)号:CN118761438A

    公开(公告)日:2024-10-11

    申请号:CN202410626273.0

    申请日:2024-05-20

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于双重掩码散度的多模态大语言模型知识遗忘方法,该方法首先确定目标遗忘概念,然后通过引入双重掩码KL散度损失来细化训练损失,从而在不损害模型整体性能的情况下,有效地移除特定概念的记忆。双重掩码包括句子级掩码和令牌级掩码,分别在句子和令牌级别排除或调整相关标记的处理,以减少目标概念在模型输出中的概率。此外,本发明还涉及一个综合基准测试,用于评估多模态大语言模型中的知识遗忘效果,评估指标包括功效、通用性、特异性、流畅性和运行成本。此方法特别适用于处理个人隐私信息或受版权保护的内容的遗忘,为多模态场景中的知识遗忘提供了一个高效和可靠的技术方案。

    一种基于知识图谱技术的分布式系统故障根因溯源方法

    公开(公告)号:CN113377567B

    公开(公告)日:2024-10-08

    申请号:CN202110722163.0

    申请日:2021-06-28

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于知识图谱技术的分布式系统故障根因溯源方法,用于解决大型分布式系统故障根因溯源困难问题。分布式系统故障根因溯源任务是找出导致系统故障的根本原因。本发明针对分布式系统中的故障为每类故障构建了故障知识图谱,构建过程中使用了模板技术从历史故障数据中生成事件,然后利用机器学习模型学习事件之间的关系构建故障传播图,最后使用合并算法抽取相同类型故障的故障传播图的共有结构生成故障知识图谱。故障发生时,通过构建计算实时故障传播图并与故障知识图谱之间的相似度,得到与实时故障传播图最相似的故障知识图谱,从而根据故障知识图谱标志的故障根因得到导致系统故障的根本原因。

    面向Web表格的成对实体联合消歧方法

    公开(公告)号:CN113361283B

    公开(公告)日:2024-09-24

    申请号:CN202110720148.2

    申请日:2021-06-28

    Applicant: 东南大学

    Abstract: 本发明公开了面向Web表格的成对实体联合消歧方法,用于解决面向Web表格的实体链接任务。面向Web表格的实体链接任务是将Web表格中的实体提及无歧义的链接到知识库中的实体。本发明针对表格特点设计成对实体联合消歧方法,迭代的对置信度最高的一对实体提及联合消歧,逐步实现整个表格中实体提及的全部消歧。置信度计算方法全面考虑了多种信息,包括实体提及和候选实体的相似度、链接实体之间的一致性以及表格中行、列语义一致性。在算法迭代过程中,已链接的实体具有很高的置信度,能够为后续链接工作提供有效的辅助信息,从而实现高质量的联合消歧。

    基于层级式法律知识与双图联合表示学习的罪名预测方法

    公开(公告)号:CN115048510B

    公开(公告)日:2024-07-23

    申请号:CN202210147755.9

    申请日:2022-02-17

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于层级式法律知识与双图联合表示学习的罪名预测方法,主要用于依据案件事实描述对被告自动进行罪名预测,尤其是易混淆罪名的预测,辅助法官判案。本发明首先利用爬虫技术从中国裁判文书网上爬取大量法律文书,并对裁判文书进行初步处理,提取出每份文书的事实描述部分以及对应的判决罪名,构建结构图和语义图,并使用联合图交互得到事实描述的语义表示向量。然后利用爬虫技术爬取所有罪名的构成要件,作为专业法律知识用以区分罪名,并使用双图联合表示学习得到每个罪名知识的语义表示向量。然后利用注意力机制,得到知识感知的事实描述语义向量,最后将其与原事实向量相结合,输入到softmax层得到该事实描述对应的罪名预测结果。

    基于规则挖掘的实例匹配方法

    公开(公告)号:CN113157819B

    公开(公告)日:2024-06-21

    申请号:CN202110320754.5

    申请日:2021-03-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于规则挖掘的实例匹配方法,用于解决不同知识库之间的融合问题。本发明的方法包括步骤:1)将多个知识库之间已知的等价实例作为种子集合;2)从种子集合的等价实例中挖掘出等价实例的匹配规则,并筛选掉上一轮评估效果不好的匹配规则;3)把匹配规则作用在多个知识库的数据上,匹配得到新的等价实例,把新的等价实例添加到种子集合中;4)利用匹配规则挖掘出的新的等价实例对匹配规则进行评估;5)使用期望最大值算法框架,迭代重复步骤2)~步骤4)的内容,直到没有新的匹配规则和等价实例产生。通过不断迭代,完成等价实例的寻找,实现知识的融合。

Patent Agency Ranking