-
公开(公告)号:CN118504695B
公开(公告)日:2024-11-01
申请号:CN202410979834.5
申请日:2024-07-22
Applicant: 北京邮电大学
Abstract: 本申请提出了一种基于时间概率分布的时序知识图谱逻辑推理方法及装置,涉及大数据、人工智能与知识图谱技术领域,其中,时序知识图谱基于文本数据生成,文本数据中的每段文本表示现实世界的一个事件,时序知识图谱以#imgabs0#的形式存储现实世界的一个事件,该方法包括:通过链接预测器补全时序知识图谱;将补全的时序知识图谱建模为时序概率分布,并将时序概率分布通过筛选转化为稀疏矩阵形式;针对用户输入的逻辑查询,在稀疏矩阵形式的时序概率分布上进行模糊逻辑运算,得到从起点到终点的中间路径以及对应的概率分布,并将概率值最高的路径作为查询结果。采用上述方案的本申请能够有效提高对复杂时间逻辑查询的处理能力。
-
公开(公告)号:CN118395205A
公开(公告)日:2024-07-26
申请号:CN202410597296.3
申请日:2024-05-14
Applicant: 北京邮电大学 , 北京万方数据股份有限公司
Abstract: 本申请提出了一种多模态跨语言检测方法及装置,涉及计算机技术领域,其中,该方法包括:获取论文原始数据,并通过解析工具将论文原始数据分解为普通文本模态、结构文本模态和图像模态;将普通文本模态输入跨语言相似度模型,输出第一向量数据,并将结构文本模态输入跨语言相似度模型,输出第二向量数据;将图像模态输入图像相似度模型,输出第三向量数据;将第一向量数据、第二向量数据和第三向量数据输入多模态融合学习模型,输出检测结果。采用上述方案的本申请能够有效实现对不同语言论文数据的相似度检测。
-
公开(公告)号:CN115269799A
公开(公告)日:2022-11-01
申请号:CN202210908399.8
申请日:2022-07-29
Applicant: 北京邮电大学
Abstract: 本发明提出一种基于向量逻辑的知识图谱多跳推理方法与装置,其中方法包括,获取知识图谱,将知识图谱中的的知识与知识的描述信息解耦合,得到知识图谱数据;根据知识图谱数据构建知识图谱多跳推理模型,知识图谱多跳推理模型用于在知识图谱上进行多跳逻辑推理;获取知识图谱中的查询请求;根据知识图谱多跳推理模型获得查询请求对应的答案实体集。本发明可以在各类场景中的知识图谱回答涉及多跳查询。
-
公开(公告)号:CN118690017B
公开(公告)日:2025-01-24
申请号:CN202410802140.4
申请日:2024-06-20
Applicant: 北京万方数据股份有限公司 , 北京邮电大学
IPC: G06F16/355 , G06F16/335 , G06F40/205 , G06F40/284 , G06F18/214 , G06F18/243
Abstract: 本公开实施例提供了一种学术不端文本识别方法、装置、电子设备和存储介质,涉及数据挖掘技术领域。方法包括:解析待识别文本,获取待识别文本中多个不同组成部分的内容文本;将多个内容文本,分别输入各内容文本对应的、预先训练的文本检测模型中,获取各文本检测模型输出的检测结果,检测结果用于指示基于对应文本内容预测待识别文本为学术不端文本的概率;根据各检测结果,确定待识别文本的识别结果,识别结果用于指示待识别文本是否为学术不端文本。通过解析得到待识别文本对应的内容文本并分别使用对应的文本检测模型进行检测,能够获取多个不同维度的检测结果,综合各检测结果确定识别结果,能够有效提高学术不端文本识别结果的准确性。
-
公开(公告)号:CN118468003A
公开(公告)日:2024-08-09
申请号:CN202410911583.7
申请日:2024-07-09
Applicant: 北京邮电大学 , 北京万方数据股份有限公司
IPC: G06F18/213 , G06F18/24 , G06F18/214 , G06F40/284 , G06N5/01 , G06F18/2431
Abstract: 本申请提出了一种基于异质引文网络自动检测论文工厂论文的方法,该方法包括:获取论文工厂论文作为原始数据,对原始数据进行处理,构建引文异构图网络,并基于引文异构图网络生成多种元路径;对每个论文工厂论文进行文字特征提取,获取每个论文节点的初始嵌入向量;基于引文异构图网络、多种元路径和每个论文节点的初始嵌入向量,依次对每个论文节点进行节点级注意学习和语义级注意学习,获得每个论文节点的最终嵌入特征向量;通过最终嵌入特征向量训练分类器模块,并利用训练完成的分类器模块检测待处理论文。该方法针对论文的引用关系构建检测模型,能够自动检测出论文工厂论文,提高了论文工厂论文检测的效率和准确性。
-
公开(公告)号:CN117828513A
公开(公告)日:2024-04-05
申请号:CN202410240393.7
申请日:2024-03-04
Applicant: 北京邮电大学 , 北京万方数据股份有限公司
IPC: G06F18/2433 , G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/0895 , G06F16/901 , G06N3/042 , G06F18/213
Abstract: 本申请提出了一种论文主题无关引用检查方法及装置,涉及计算机技术领域,其中,该方法包括:获取论文原始数据,并对论文原始数据进行解析,得到文本数据;对文本数据进行文本特征提取,得到文本数据的向量表示;基于文本数据和向量表示构建引文网络,其中,引文网络的节点为论文及其引文,边为节点之间的引用关系;对引文网络进行图异常检测,得到每个节点的综合异常分数,并基于设定的异常分数阈值确定检查结果,其中,图异常检测包括通过生成属性重建识别属性空间中的异常,通过多视图对比学习识别结构空间中的异常。采用上述方案的本申请能够实现对词语替换、句子重组等形式的句子相似性的快速、准确检测。
-
公开(公告)号:CN118690017A
公开(公告)日:2024-09-24
申请号:CN202410802140.4
申请日:2024-06-20
Applicant: 北京万方数据股份有限公司 , 北京邮电大学
IPC: G06F16/35 , G06F16/335 , G06F40/205 , G06F40/284 , G06F18/214 , G06F18/243
Abstract: 本公开实施例提供了一种学术不端文本识别方法、装置、电子设备和存储介质,涉及数据挖掘技术领域。方法包括:解析待识别文本,获取待识别文本中多个不同组成部分的内容文本;将多个内容文本,分别输入各内容文本对应的、预先训练的文本检测模型中,获取各文本检测模型输出的检测结果,检测结果用于指示基于对应文本内容预测待识别文本为学术不端文本的概率;根据各检测结果,确定待识别文本的识别结果,识别结果用于指示待识别文本是否为学术不端文本。通过解析得到待识别文本对应的内容文本并分别使用对应的文本检测模型进行检测,能够获取多个不同维度的检测结果,综合各检测结果确定识别结果,能够有效提高学术不端文本识别结果的准确性。
-
公开(公告)号:CN118468003B
公开(公告)日:2024-09-24
申请号:CN202410911583.7
申请日:2024-07-09
Applicant: 北京邮电大学 , 北京万方数据股份有限公司
IPC: G06F18/213 , G06F18/24 , G06F18/214 , G06F40/284 , G06N5/01 , G06F18/2431
Abstract: 本申请提出了一种基于异质引文网络自动检测论文工厂论文的方法,该方法包括:获取论文工厂论文作为原始数据,对原始数据进行处理,构建引文异构图网络,并基于引文异构图网络生成多种元路径;对每个论文工厂论文进行文字特征提取,获取每个论文节点的初始嵌入向量;基于引文异构图网络、多种元路径和每个论文节点的初始嵌入向量,依次对每个论文节点进行节点级注意学习和语义级注意学习,获得每个论文节点的最终嵌入特征向量;通过最终嵌入特征向量训练分类器模块,并利用训练完成的分类器模块检测待处理论文。该方法针对论文的引用关系构建检测模型,能够自动检测出论文工厂论文,提高了论文工厂论文检测的效率和准确性。
-
公开(公告)号:CN118069869A
公开(公告)日:2024-05-24
申请号:CN202410466869.9
申请日:2024-04-18
Applicant: 北京邮电大学
IPC: G06F16/36 , G06F40/295 , G06N3/0442 , G06N5/04
Abstract: 本申请提出一种基于时间规律捕获的时序知识图谱推理方法及装置,涉及大数据、人工智能与知识图谱技术领域,该方法包括:获取用户查询输入,构建查询四元组,并获取历史数据;对四元组数据进行重复事实编码,得到历史数据统计向量;对动态图数据进行时间线拟合,得到筛选后的动态图数据和实体数据;对静态图数据进行全局编码,得到静态图上的实体和关系的编码矩阵,并使用局部编码方式、基于筛选后的动态图数据对编码矩阵进行更新;对查询四元组进行解码,将解码结果与更新后的编码矩阵进行得分计算,并将计算的解码得分与历史数据统计向量、实体数据结合,得到预测结果。采用上述方案的本申请能够基于历史数据,实现对较远的未来事实的准确预测。
-
公开(公告)号:CN116541549B
公开(公告)日:2023-09-19
申请号:CN202310822891.8
申请日:2023-07-06
Applicant: 北京邮电大学 , 北京万方数据股份有限公司
IPC: G06F16/583 , G06V10/26 , G06V10/764 , G06V10/774 , G06V30/19 , G06V30/41
Abstract: 本申请实施例提供了一种子图分割方法、装置、电子设备及计算机可读存储介质,涉及图像处理领域,该方法包括:确定插图以及与插图对应的文本,插图包括多个子插图,文本包括多个子插图各自的题注;将插图输入分割模型,获得分割模型输出的插图中各子插图的位置,将插图输入至筛选模型,获得筛选模型输出的各子插图序号的位置;根据各子插图的位置和各子插图序号的位置,确定每个子插图对应的子插图序号;从文本中确定题注和子插图序号的关系,结合每个子插图对应的子插图序号,确定每个子插图对应的题注;对于每个子插图,根据子插图对应的题注确定所述子插图的检索范围,以进行检索,本申请实施例解决了论文插图检索效率低和检索准确度差的问题。
-
-
-
-
-
-
-
-
-