-
公开(公告)号:CN111078833B
公开(公告)日:2022-05-20
申请号:CN201911223541.X
申请日:2019-12-03
Applicant: 哈尔滨工程大学
IPC: G06F16/33 , G06F16/35 , G06F40/30 , G06F40/284 , G06F40/289 , G06N3/04
Abstract: 本发明属于文本分类技术领域,具体涉及一种基于神经网络的文本分类方法。了解决传统文本分类方法不能同时有效的利用文本的语义信息和结构信息的问题,本发明可以提取文本的不同层次的语义信息和结构信息,包括单词级语义信息、单词级结构信息、短语级语义信息、短语级结构信息。为了得到文本的最终表示,本发明又提出两种融合方法来融合四种信息,分别是静态融合和基于注意力机制的动态融合。本发明基于神经网络,综合利用文本不同层次的语义信息和结构信息,提高了文本分类的准确率。
-
公开(公告)号:CN112836062A
公开(公告)日:2021-05-25
申请号:CN202110039879.0
申请日:2021-01-13
Applicant: 哈尔滨工程大学 , 中电科大数据研究院有限公司
IPC: G06F16/36 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明属于关系抽取技术领域,具体涉及一种文本语料库的关系抽取方法。本发明解决了传统关系分类模型不能很好的利用句子中重要的信息对关系进行建模,并且一些神经网络模型往往需要使用NLP工具来提取额外的特征的问题,提出了基于注意力机制的分段循环神经网络。本发明所提出模型可以突出考虑句子中的关键部分,而且能够利用句子的其他部分对关键部分进行补充,然后利用潜在关系向量和注意力机制得到句子的关系表示向量,在这个过程中不需要任何手工设计的特征或者NLP工具。本发明通过依存句法分析发现关系类型,并提出了一种用来构建训练语料的弱监督方法。实验结果显示提出的关系抽取模型在弱监督获取的训练数据集上达到了较高的性能。
-
公开(公告)号:CN112836062B
公开(公告)日:2022-05-13
申请号:CN202110039879.0
申请日:2021-01-13
Applicant: 哈尔滨工程大学 , 中电科大数据研究院有限公司
IPC: G06F16/36 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明属于关系抽取技术领域,具体涉及一种文本语料库的关系抽取方法。本发明解决了传统关系分类模型不能很好的利用句子中重要的信息对关系进行建模,并且一些神经网络模型往往需要使用NLP工具来提取额外的特征的问题,提出了基于注意力机制的分段循环神经网络。本发明所提出模型可以突出考虑句子中的关键部分,而且能够利用句子的其他部分对关键部分进行补充,然后利用潜在关系向量和注意力机制得到句子的关系表示向量,在这个过程中不需要任何手工设计的特征或者NLP工具。本发明通过依存句法分析发现关系类型,并提出了一种用来构建训练语料的弱监督方法。实验结果显示提出的关系抽取模型在弱监督获取的训练数据集上达到了较高的性能。
-
公开(公告)号:CN111078833A
公开(公告)日:2020-04-28
申请号:CN201911223541.X
申请日:2019-12-03
Applicant: 哈尔滨工程大学
IPC: G06F16/33 , G06F16/35 , G06F40/30 , G06F40/284 , G06F40/289 , G06N3/04
Abstract: 本发明属于文本分类技术领域,具体涉及一种基于神经网络的文本分类方法。了解决传统文本分类方法不能同时有效的利用文本的语义信息和结构信息的问题,本发明可以提取文本的不同层次的语义信息和结构信息,包括单词级语义信息、单词级结构信息、短语级语义信息、短语级结构信息。为了得到文本的最终表示,本发明又提出两种融合方法来融合四种信息,分别是静态融合和基于注意力机制的动态融合。本发明基于神经网络,综合利用文本不同层次的语义信息和结构信息,提高了文本分类的准确率。
-
-
-