-
公开(公告)号:CN114626372B
公开(公告)日:2024-06-04
申请号:CN202210195759.4
申请日:2022-02-25
Applicant: 华南理工大学 , 广州启辰电子科技有限公司
IPC: G06F40/284 , G06F40/211 , G06F40/30 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/09 , G06Q50/00
Abstract: 本发明涉及一种基于扰动改良的自注意力机制社交网络文本情感分析方法,用于在网络中分析文本表达的情感。步骤如下:将网络文本数据中的句子用分词工具切分为词,并用词嵌入矩阵将每个词转化为词向量;将词向量输入预训练语言模型(BERT‑base)中得到每个词的隐层状态(特征表示);将词的隐层状态输入分类器获得句子的分类概率分布;将每个词的隐层状态和句子的分类概率分布进行扰动改良,得到注意力监督信息;用注意力监督信息二次训练预训练语言模型;将词向量输入改良训练后的语言模型得到隐层状态,并用分类器输出最终分类结果。
-
公开(公告)号:CN117557825A
公开(公告)日:2024-02-13
申请号:CN202311301817.8
申请日:2023-10-10
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/82 , G06N3/0985 , G06N3/08
Abstract: 本发明公开了一种基于任务难度自适应元学习的心电图分类方法,基于任务难度建模与自适应元学习实现,首先,利用元学习策略在多个心电图分类任务上训练模型,目的是让模型学习如何从有限的样本中快速适应新任务。然后,通过量化每个任务的难度,例如分析心电图的波动程度,调整模型的学习策略。根据这些量化的难度指标,自动调整模型的学习参数,如学习率,以更好地适应不同难度的任务。为了进一步增强模型的分类性能,本发明还设计了一种微调策略,通过使用少量的心电图数据进行模型微调,确保模型在少样本心电图分类任务上实现高效准确的分类。
-
公开(公告)号:CN114647778A
公开(公告)日:2022-06-21
申请号:CN202210218635.3
申请日:2022-03-04
Applicant: 华南理工大学 , 广州启辰电子科技有限公司
IPC: G06F16/9535 , G06K9/62 , G06N3/04 , G06V10/762
Abstract: 本发明公开了一种基于深度聚类算法的电影个性化序列推荐方法,实现个性化的电影推荐。过程如下:获取电影数据集,分离出所需数据;通过深度聚类从所获得的数据中挖掘用户的高层次意图,形成融合用户高层次意图的交互序列;通过对所获得的数据进行用户静态特征的挖掘,并与用户观影序列结合,形成用户特征动态序列;将融合用户高层次意图的交互序列与用户特征动态序列结合输入门控循环单元,得到融合的序列信息;用融合的序列信息计算出所有候选项目与此序列的匹配得分,并从中选取排名前K个项目作为推荐结果。本发明可以有效捕捉到用户在观看电影时较高层次的意图特征,并通过聚类的分布来缓解长尾问题,最终生成个性化的电影推荐。
-
公开(公告)号:CN114595427A
公开(公告)日:2022-06-07
申请号:CN202210238130.3
申请日:2022-03-10
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于非自回归模型的含缺失值车辆轨迹序列填补修复方法,包括以下步骤:获取车辆轨迹序列数据集,对数据集进行归一化处理并将归一化后的数据集划分为训练集与测试集;构建深度神经网络,包括缺失信息衰减模块和非自回归填补网络,并使用训练集对构建好的深度神经网络进行训练以确定深度网络的各项参数;将测试集输入到深度网络中,得到填补后的测试集数据,即含缺失值车辆轨迹数据的填补结果。本发明可为车辆轨迹数据提供一种非自回归的填补框架,解决了传统的基于自回归模型的方法中存在的误差累积问题,同时也能有效地建模车辆轨迹序列的时序信息。
-
公开(公告)号:CN114429138A
公开(公告)日:2022-05-03
申请号:CN202210063062.1
申请日:2022-01-19
Applicant: 广州启辰电子科技有限公司 , 华南理工大学
IPC: G06F40/30 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向试题知识点分类的层次化语义匹配方法。本发明方法首先构建了试题知识点层次化结构,将试题文本语义和知识点层次化语义映射到两者的联合空间中,使用语义匹配方法建模试题文本语义与不同试题知识点层次化结构的匹配关系。该匹配关系由试题知识点层次化结构所决定。具体而言,试题文本语义与试题核心考察的知识点语义是较为匹配的,与无关的知识点语义是不匹配的。在试题知识点分类应用时,本发明方法可以根据试题文本语义与知识点文本语义的匹配距离远近,获得层次化感知的知识点分类结果,该发明方法分类效果较好,具有一定的解释性。
-
公开(公告)号:CN114429121A
公开(公告)日:2022-05-03
申请号:CN202210063061.7
申请日:2022-01-19
Applicant: 广州启辰电子科技有限公司 , 华南理工大学
IPC: G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图卷积网络的试题文本中情感与原因的句子配对抽取方法,所述方法包括以下步骤:获取试题文本数据,对数据进行分句预处理;使用BERT预训练语言模型将句子转换成向量表示;使用全连接层网络将句子表示生成对应的配对组合表示;使用相对位置嵌入向量增强配对组合表示向量;对句子向量表示使用平均池化得到文档表示;使用图卷积网络对情感句子、原因句子、配对组合和文档四种表示进行编码交互;最后使用多层感知机模型预测配对组合是否成立。本发明在建模配对组合时充分考虑了配对组合中两个句子之间的因果关系,能够有效避免错误配对组合被预测成立的情况,从而提高预测的准确率。
-
公开(公告)号:CN112948541A
公开(公告)日:2021-06-11
申请号:CN202110135244.0
申请日:2021-02-01
Applicant: 华南理工大学
IPC: G06F16/33 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于图卷积网络的金融新闻文本情感倾向分析方法,步骤如下:确定数据源获取金融文本数据;对金融文本数据进行预处理,得到清洁文本列表;对清洁文本列表进行采样得到样本列表;对样本列表进行人工标注;使用清洁文本列表建立异质图;对异质图进行特征提取得到特征矩阵、标签矩阵和邻接矩阵;以特征矩阵为输入,标签矩阵为监督信息,邻接矩阵为图卷积操作的支持矩阵,建立四层图卷积网络;通过迭代训练得到样本列表的分类准确率和清洁文本列表的分类结果。本方法在异质图中引入无标注数据,并可以在没有先验词嵌入知识的情况下进行学习,摆脱web环境下情感词典难以构建、维护的困境和对有标签数据比例和词嵌入效果的强依赖。
-
公开(公告)号:CN112732907A
公开(公告)日:2021-04-30
申请号:CN202011578594.6
申请日:2020-12-28
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于多尺度循环神经网络的金融舆情分析方法,包括以下步骤:获取金融文本数据,对数据进行预处理;使用滑动窗口对预处理后的金融文本数据采样得到每个时间步的子序列,将子序列输入组循环神经网络提取文本序列的局部特征表示,通过最大池化操作得到文本序列的显著性特征表示;使用多个不同尺度的滑动窗口提取文本序列不同的显著性特征表示,最后拼接得到序列的多尺度特征表示;将多尺度特征表示输入全连接层和softmax层进行分类。本发明使用不同尺度大小的滑动窗口采样文本子序列,通过组循环神经网络建模不同尺度的局部短语特征,将不同尺度特征融合得到文本的语义特征,进一步提高金融舆情分析的准确率。
-
公开(公告)号:CN112528168A
公开(公告)日:2021-03-19
申请号:CN202011540244.0
申请日:2020-12-23
Applicant: 华南理工大学
IPC: G06F16/9536 , G06F40/289 , G06F40/211 , G06N3/04
Abstract: 本发明公开了一种基于可形变自注意力机制的社交网络文本情感分析方法,用于分析用户话语的情感。步骤如下:将用户话语文本数据中的每个句子切分为词,将每个词用词向量表示;将词向量序列输入双向循环神经网络(Bi‑LSTM)中得到每个词的编码表示;利用可形变自注意力机制,将词的编码表示转化为多种具有不同上下文范围的句子编码表示;将多种句子编码表示融合得到一个句子编码表示;将融合的句子编码表示输入到前馈神经网络(FFN)中分类,输出结果;根据模型输出结果和数据真实结果,最小化交叉熵损失函数迭代训练模型更新参数;将待分类的社交网络文本输入到经过训练的模型得到情感分析结果。
-
公开(公告)号:CN112507937A
公开(公告)日:2021-03-16
申请号:CN202011492176.5
申请日:2020-12-17
Applicant: 华南理工大学
Abstract: 本发明公开了一种融合多源数据的卫星影像无监督分类方法和装置,步骤如下:获取多个数据源的卫星图像数据集,分离出数据的样本信息以及类别信息;构建编解码器模型,为每一种数据来源的数据设计适合其数据类型及数据维度的编解码器;将K均值聚类损失引入到每一个编解码器中,将提取特征与聚类目标进行融合,再加入不同数据源之间的约束;把多个数据源的卫星图像输入深度聚类模型,通过反向传播算法训练进行训练,指导隐层特征的生成;使用K均值算法对由训练过程生成的每个数据源的隐层特征进行聚类,得到多个聚类结果,最后通过投票的方式,得到最后的类别分配结果。本发明将多个数据源的卫星图像进行融合,实现有效的无监督分类目标。
-
-
-
-
-
-
-
-
-