-
公开(公告)号:CN112925908A
公开(公告)日:2021-06-08
申请号:CN202110195634.7
申请日:2021-02-19
Applicant: 东北林业大学
IPC: G06F16/35 , G06F40/289 , G06N3/04
Abstract: 本发明提出一种基于Attention的图注意力网络的文本分类方法,属于自然语言处理领域,目的是解决处理地理文本中包含的非结构化文本隐晦不精准、现有技术对大量数据获取分类困难的问题。本发明通过在文本图卷积网络中引入注意力机制,从而将卷积操作中的普通的归一化过程赋予不同的权重,使得要被分类的节点(文本)能够根据上下文对其的重要程度以不同的权重学习到特征。该方法在自建的地理文本数据集中以上下文的关系进行特征的聚合,在标记数据的作用下,对未知标签的数据对是否属于地理文本进行分类。该基于Attention的图注意力网络的文本分类方法能够在数量较多的文本信息中准确的抽取出包含地理信息的文本,以便于有效的为下游任务提供可靠的数据。