-
公开(公告)号:CN119312070B
公开(公告)日:2025-03-25
申请号:CN202411855277.2
申请日:2024-12-17
Applicant: 华侨大学
IPC: G06F18/2113 , G06N5/01 , G06V10/771 , G06F18/214 , G06F18/243
Abstract: 本发明提供一种偏多标签特征选择方法、装置、设备和介质,涉及数据预处理技术领域。方法包含S1、获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建标签的分布区域。S2、根据近邻的分布,更新标签置信度矩阵,对不可信标签的分布区域进行消歧,以及对不确定标签的分布区域进行迭代更新,直至达到最大迭代次数,获取消歧后的标签。S3、根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签。S4、根据虚拟粗粒度标签,结合从样本数据中获取的多个特征,构建适用于偏多标记数据的邻域粗糙集模型,并采用前向贪婪搜索算法选择重要性最高的特征。
-
公开(公告)号:CN119312070A
公开(公告)日:2025-01-14
申请号:CN202411855277.2
申请日:2024-12-17
Applicant: 华侨大学
IPC: G06F18/2113 , G06N5/01 , G06V10/771 , G06F18/214 , G06F18/243
Abstract: 本发明提供一种偏多标签特征选择方法、装置、设备和介质,涉及数据预处理技术领域。方法包含S1、获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建标签的分布区域。S2、根据近邻的分布,更新标签置信度矩阵,对不可信标签的分布区域进行消歧,以及对不确定标签的分布区域进行迭代更新,直至达到最大迭代次数,获取消歧后的标签。S3、根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签。S4、根据虚拟粗粒度标签,结合从样本数据中获取的多个特征,构建适用于偏多标记数据的邻域粗糙集模型,并采用前向贪婪搜索算法选择重要性最高的特征。
-