-
公开(公告)号:CN116150360A
公开(公告)日:2023-05-23
申请号:CN202211653394.1
申请日:2022-12-21
Applicant: 吉林大学
Abstract: 本申请通过提供一种文本聚类方法、装置、电子设备和计算机可读存储介质,基于用以表示各训练文本的全文语义对应的锚词,得到与锚词相应的锚词模型特征,避免额外嘈杂特征的引入,之后,基于锚词模型特征得到各训练文本的第一聚类结果和第二聚类结果,并基于各第一聚类结果与各第二聚类结果分别确定多个训练文本的自训练目标函数,以及确定自训练目标函数的自训练目标值;最后基于自训练目标值更新文本聚类模型,直到文本聚类模型收敛,将收敛后的文本聚类模型应用于文本聚类,经过不断训练直到收敛的文本聚类模型的准确性和稳定性均在不断提高,并且避免了文本聚类的准确率受到额外嘈杂特征的影响。
-
公开(公告)号:CN117648602A
公开(公告)日:2024-03-05
申请号:CN202311582355.1
申请日:2023-11-24
Applicant: 吉林大学
IPC: G06F18/24 , G06V10/764 , G06V20/70 , G06N20/20
Abstract: 本发明涉及计算机应用技术领域,特别是指一种基于联合学习框架的Wasserstein偏多标记学习方法及装置。一种基于联合学习框架的Wasserstein偏多标记学习方法包括:根据不可靠众包的标记图像,获得带有噪声图像;将带有噪声图像进行数据转换,获得矩阵数据;对矩阵数据进行预处理,获得处理后矩阵数据;基于联合学习框架以及Wasserstein距离进行模型构建,获得多标签分类模型;使用处理后矩阵数据,对多标签分类模型进行训练,获得最优多标签分类模型;获取待标记图像;将待标记图像输入最优多标签分类模型,获得标注图像。本发明是一种基于噪声标签的产生原因和改进欧氏距离的准确、高效的偏多标记学习方法。
-
公开(公告)号:CN116665093A
公开(公告)日:2023-08-29
申请号:CN202310563249.2
申请日:2023-05-18
Applicant: 吉林大学
IPC: G06V20/40 , G06V10/80 , G06V20/62 , G06V10/774 , G06V10/764
Abstract: 本发明提供一种解决特征中和效应的多模态虚假新闻检测方法及装置,所述方法包括:对于多模态虚假新闻检测任务,给定训练数据集;所述训练数据集包括多组图像模态和文本模态的内容;使用深度学习模型对图像模态和文本模态的内容进行特征提取,并映射到同一特征空间,得到每组中图像模态和文本模态的深层特征,形成特征对;获取两个模态对应的单模态真实性预测结果;对于每个特征对,结合单模态真实性预测结果,将特征对融合为一个多模态特征;对多模态特征的真实性进行预测。本发明能够解决多模态特征融合导致的中和效应问题,提高虚假新闻检测的准确率。
-
公开(公告)号:CN117520813A
公开(公告)日:2024-02-06
申请号:CN202311392732.5
申请日:2023-10-25
Applicant: 吉林大学
IPC: G06F18/213 , G06F18/214 , G06F18/24 , G06F40/30 , G06N3/0442 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种基于动态社会背景的虚假新闻检测的方法及装置,属于虚假新闻检测技术领域。所述方法包括:获取新闻训练集与初始的新闻动态背景表示矩阵,对初始的虚假新闻检测模型进行预训练,获得训练好的虚假新闻检测模型;将新闻训练集按照样本新闻的发布时间划分多个子集,对初始的新闻动态背景模型进行训练,获得训练好的新闻动态背景表示模型;根据训练好的新闻动态背景表示模型得到新闻动态背景表示真实值,对初始的时间序列模型进行训练,获得训练好的时间序列模型;基于待识别新闻、待识别新闻的发布时间以及时间序列模型与预先训练的虚假新闻检测模型,确定待识别新闻的真实性结果。采用本发明,可以提高虚假新闻真实性准确率。
-
公开(公告)号:CN116629311A
公开(公告)日:2023-08-22
申请号:CN202310396053.9
申请日:2023-04-14
Applicant: 吉林大学
Abstract: 本发明公开了一种应用于糖尿病分析、集成的自适应神经模糊系统,包括步骤S1:将数据集输入该模型中,模型先对数据集进行标准化;步骤S2:采用因果推理方式计算每个特征对应于预测结果的因果系数,并以此作为特征的权重;步骤S3:随机选择多个不同的子集,对于每个不同的子集分别构建自适应模糊推理系统,并得到每个推理系统的预测结果;步骤S4:通过集成学习方式得到整个模型的预测结果。本发明涉及计算机算法技术领域,本发明的有益效果是,将因果推理方法引入特征选择中,并以因果系数为权重随机生成数据子集进行训练,降低了模型训练成本,且能达到较好的模型效能。
-
公开(公告)号:CN116384450A
公开(公告)日:2023-07-04
申请号:CN202310431951.3
申请日:2023-04-21
Applicant: 吉林大学
IPC: G06N3/0464 , G06N3/08 , G06N3/043 , G06N3/084 , G16H50/70
Abstract: 本发明提供了一种面向医疗数据的深度卷积模糊神经网络及其训练方法,包括基于深度卷积模糊神经网络的医疗数据可解释性预测模型(IP‑DCFNN)IP‑DCFNN由三个部分组成:模糊逻辑前件部分:模糊逻辑前件部分提取输入数据,输入数据通过模糊逻辑前件部分中的隶属函数的运算从数值转化为一组对于模糊语言标量的隶属度值;深度卷积计算部分:深度卷积部分提取输入规则权重中的隐藏特征,并将隐藏层权重转换为高纬度信息表示;模糊结果表示部分:模糊结果表示部分是用来处理模糊推理中去模糊化的过程。本发明涉及计算机技术技术领域,本发明所述的IP‑DCFNN在模糊推理系统的基础上加入深度卷积神经网络的理念来达到针对医疗数据的可解释性预测能力。
-
公开(公告)号:CN116665093B
公开(公告)日:2024-12-27
申请号:CN202310563249.2
申请日:2023-05-18
Applicant: 吉林大学
IPC: G06V20/40 , G06V10/80 , G06V20/62 , G06V10/774 , G06V10/764
Abstract: 本发明提供一种解决特征中和效应的多模态虚假新闻检测方法及装置,所述方法包括:对于多模态虚假新闻检测任务,给定训练数据集;所述训练数据集包括多组图像模态和文本模态的内容;使用深度学习模型对图像模态和文本模态的内容进行特征提取,并映射到同一特征空间,得到每组中图像模态和文本模态的深层特征,形成特征对;获取两个模态对应的单模态真实性预测结果;对于每个特征对,结合单模态真实性预测结果,将特征对融合为一个多模态特征;对多模态特征的真实性进行预测。本发明能够解决多模态特征融合导致的中和效应问题,提高虚假新闻检测的准确率。
-
公开(公告)号:CN116338651B
公开(公告)日:2023-11-14
申请号:CN202310201235.6
申请日:2023-03-03
Applicant: 吉林大学
Abstract: 本发明涉及自动驾驶技术领域,具体是涉及一种模拟雪天激光雷达点云雪噪点的方法和相关装置。本发明根据雪花尺度谱分布函数和光束的包络空间体积,确定光束内所包含雪粒子的粒子总数,再根据每个雪花粒子相对激光发射器的距离、粒子尺度及反射率,计算每个雪花粒子造成激光束能量的衰减。根据接收能量与激光雷达的接收机的灵敏度阈值比较,得到模拟的点云雪噪点。本发明的点云雪噪点是一组数据,用于记录模拟的由雪花粒子造成的激光雷达检测点。本发明能够准确计算粒子总数,从而使得计算出的粒子总数吻合于光束实际涵盖的雪粒子总数,进而使得模拟出的点云雪噪点吻合于真实的点云雪噪点。
-
公开(公告)号:CN116364277A
公开(公告)日:2023-06-30
申请号:CN202310355857.4
申请日:2023-04-04
Applicant: 吉林大学
Abstract: 本发明公开了一种结合神经网络预测糖尿病的自适应网络模糊推理系统,包括如下模块:数据预处理模块;降维模块;ANFIS与神经网络的结合模块,本发明专利1)提出ANFIS‑NN模型,既具有可解释性,又有高预测精度,能够预测个体将来患糖尿病的可能性,也可以应用于其他疾病的预测问题中;(2)将自适应模糊推理系统与普通网络结合,既一定程度保留了可解释性,又提升了模型的分类性能;(3)使用因果推理进行特征选择,可以与当前已有知识进行结合,进一步提升模型的分类性能;(4)在多个数据集上构建模型,验证模型的可行性和优良性能。
-
公开(公告)号:CN103699695B
公开(公告)日:2017-02-01
申请号:CN201410014995.7
申请日:2014-01-14
Applicant: 吉林大学
IPC: G06F17/30
Abstract: 基于中心法的自适应文本聚类算法是一种迭代分割聚类算法,迭代之前,算法首先初始化相关参数,然后随机将数据集分割为大小相同的一组聚簇,并计算每个聚簇的CFC向量;在此之后,算法进入迭代过程,在进入迭代过程之后,每次迭代过程包括下列主要步骤:根据每个文本和不同聚簇的CFC向量的相似度重新组织每个文本,以得到新的一组聚簇;在重新组织每个文本之后,重新计算每个非空聚簇的CFC向量;判定算法是否满足终止条件,若满足则终止,否则继续进行迭代过程;具有如下主要优点:(1)方法简单,易于实现(;2)具有自适应性。
-
-
-
-
-
-
-
-
-