-
公开(公告)号:CN112948541B
公开(公告)日:2022-09-20
申请号:CN202110135244.0
申请日:2021-02-01
Applicant: 华南理工大学
IPC: G06F16/33 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于图卷积网络的金融新闻文本情感倾向分析方法,步骤如下:确定数据源获取金融文本数据;对金融文本数据进行预处理,得到清洁文本列表;对清洁文本列表进行采样得到样本列表;对样本列表进行人工标注;使用清洁文本列表建立异质图;对异质图进行特征提取得到特征矩阵、标签矩阵和邻接矩阵;以特征矩阵为输入,标签矩阵为监督信息,邻接矩阵为图卷积操作的支持矩阵,建立四层图卷积网络;通过迭代训练得到样本列表的分类准确率和清洁文本列表的分类结果。本方法在异质图中引入无标注数据,并可以在没有先验词嵌入知识的情况下进行学习,摆脱web环境下情感词典难以构建、维护的困境和对有标签数据比例和词嵌入效果的强依赖。
-
公开(公告)号:CN112948541A
公开(公告)日:2021-06-11
申请号:CN202110135244.0
申请日:2021-02-01
Applicant: 华南理工大学
IPC: G06F16/33 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于图卷积网络的金融新闻文本情感倾向分析方法,步骤如下:确定数据源获取金融文本数据;对金融文本数据进行预处理,得到清洁文本列表;对清洁文本列表进行采样得到样本列表;对样本列表进行人工标注;使用清洁文本列表建立异质图;对异质图进行特征提取得到特征矩阵、标签矩阵和邻接矩阵;以特征矩阵为输入,标签矩阵为监督信息,邻接矩阵为图卷积操作的支持矩阵,建立四层图卷积网络;通过迭代训练得到样本列表的分类准确率和清洁文本列表的分类结果。本方法在异质图中引入无标注数据,并可以在没有先验词嵌入知识的情况下进行学习,摆脱web环境下情感词典难以构建、维护的困境和对有标签数据比例和词嵌入效果的强依赖。
-