-
公开(公告)号:CN116401361A
公开(公告)日:2023-07-07
申请号:CN202310038679.2
申请日:2023-01-13
Applicant: 东北大学
IPC: G06F16/35 , G06N3/042 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供一种基于自监督双粒度多图学习的文本分类方法,涉及文本分类技术领域。该方法首先获得原始文本数据集与对应的标签集,并对原始文本数据集进行数据预处理,得到多图数据集;再利用增强编码器对图数据进行增强,并使用图编码器学习增强后的图表示;然后将多头自注意力机制作用于图表示,学习图包中各个图之间的上下文信息,生成包级图,并利用包编码器通过包级图学习包表示;再通过图‑图的学习机制同时学习图表示和包表示,并设计包级对比损失和图级对比损失作为损失函数,自监督地学习包表示和图表示;最后对待分类的文本分类任务利用学习到的包表示和图表示,在粗粒度和细粒度上对待分类的文本同时进行标签预测,实现文本分类。
-
公开(公告)号:CN117574227A
公开(公告)日:2024-02-20
申请号:CN202311533979.4
申请日:2023-11-17
Applicant: 东北大学
IPC: G06F18/241 , G06F18/20 , G06F18/214 , G06F18/21
Abstract: 本发明提供一种基于最优运输规划的图自监督分类方法,涉及人工智能技术领域。该方法首先收集原始图数据,并对每个图数据进行图增强,生成两个扰动图,得到扰动图的图表示;再使用图神经网络作为编码器,生成图中各个节点的嵌入,得到扰动图的节点表示;然后对两个扰动图的图表示和节点表示分别生成最优运输概率矩阵;并以两个相同维度的最优运输概率矩阵为基础构建编码器的损失函数,将节点的向量表示空间与图空间对齐进行比较;重复执行该过程,直至损失函数收敛至数值稳定,获得扰动图的节点表示的编码器作为下游任务的预训练模型。该方法不依赖正负样本对的区分,不使用优化意义模糊的损失函数,能够在数据不完整的情况下表现出良好的性能。
-
公开(公告)号:CN111461265B
公开(公告)日:2023-07-25
申请号:CN202010459805.8
申请日:2020-05-27
Applicant: 东北大学
IPC: G06V10/774 , G06V10/764 , G06V20/00 , G06V10/26 , G06T3/40
Abstract: 本发明提供一种基于粗‑细粒度多图多标签学习的场景图像标注方法,涉及图像分类技术领域。该方法首先获得原始场景图像数据集与对应的标签集,并对原始场景图像数据集进行数据预处理得到多图数据结构即图包;定义基于图核的图级分值函数和每个标签的包级分值函数;构建基于排序损失的目标函数;通过次梯度下降算法优化基于排序损失的目标函数,得到每个标签的最优权重值,进而构建图级和包级的分类器,从而实现对未知多图数据包的标签集和包中图的标签集进行预测,完成场景图像的标注。本发明方法基于定义的图级和包级分值函数,允许在粗粒度(包级)和细粒度(包中的图)上同时进行标签预测,扩展了传统多图多标签分类的范畴。
-
公开(公告)号:CN116403214A
公开(公告)日:2023-07-07
申请号:CN202310395061.1
申请日:2023-04-13
Applicant: 东北大学
IPC: G06V20/70 , G06V10/774 , G06V10/74 , G06V10/764 , G06V10/50 , G06V10/56 , G06F17/16
Abstract: 本发明提供一种能够处理新标记和缺失标记的图像标注方法,涉及图像分类技术领域。本发明通过对真实的原始图像数据集进行处理,获得多图数据集,将多图包中的每个图从图空间映射到高维特征空间,得到每个图的基于图核的图表示;利用权重矩阵对类别标记进行语义描述,对图与标记之间的关系进行建模;构造最小化目标函数以对图的新标记和缺失标记进行学习,通过加速近端梯度法和近端梯度法对最小化目标函数进行优化更新,得到更新后的权重矩阵,进而构建能够同时对新标记和缺失标记进行建模的分类器,给定测试集中的一个测试包,根据权重矩阵构建图级分类器,对测试包中的图进行标记预测,实现对未知多图包的标记预测,完成图像数据的标注。
-
公开(公告)号:CN111461265A
公开(公告)日:2020-07-28
申请号:CN202010459805.8
申请日:2020-05-27
Applicant: 东北大学
Abstract: 本发明提供一种基于粗-细粒度多图多标签学习的场景图像标注方法,涉及图像分类技术领域。该方法首先获得原始场景图像数据集与对应的标签集,并对原始场景图像数据集进行数据预处理得到多图数据结构即图包;定义基于图核的图级分值函数和每个标签的包级分值函数;构建基于排序损失的目标函数;通过次梯度下降算法优化基于排序损失的目标函数,得到每个标签的最优权重值,进而构建图级和包级的分类器,从而实现对未知多图数据包的标签集和包中图的标签集进行预测,完成场景图像的标注。本发明方法基于定义的图级和包级分值函数,允许在粗粒度(包级)和细粒度(包中的图)上同时进行标签预测,扩展了传统多图多标签分类的范畴。
-
-
-
-