-
公开(公告)号:CN110413995B
公开(公告)日:2022-12-23
申请号:CN201910601361.4
申请日:2019-07-03
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F16/28
Abstract: 本发明提供一种基于双向MGU神经网络的关系抽取方法。解决了单向MGU模型对后文依赖性不足,无法处理后文信息的问题。通过实验表明了该方法的训练时间更短,抽取准确率、召回率和F值更高。通过分析不同关系类型的抽取性能,发现了关系类型的选取以及语料特点对抽取性能存在一定影响。
-
公开(公告)号:CN110413995A
公开(公告)日:2019-11-05
申请号:CN201910601361.4
申请日:2019-07-03
Applicant: 北京信息科技大学
Abstract: 本发明提供一种基于双向MGU神经网络的关系抽取方法。解决了单向MGU模型对后文依赖性不足,无法处理后文信息的问题。通过实验表明了该方法的训练时间更短,抽取准确率、召回率和F值更高。通过分析不同关系类型的抽取性能,发现了关系类型的选取以及语料特点对抽取性能存在一定影响。
-
公开(公告)号:CN111738002A
公开(公告)日:2020-10-02
申请号:CN202010454177.4
申请日:2020-05-26
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于Lattice LSTM的古文领域命名实体识别方法、系统、电子设备及可读存储介质,其中,该方法包括:采用甲言分词对预训练古文数据进行分词;采用word2vec模型对分词后的预训练古文数据进行预训练得到预训练的字词向量;将数据集数据和所述预训练的字词向量输入至Lattice LSTM模型中进行训练,得到优化后的Lattice LSTM模型;将待识别古文数据输入至优化后的Lattice LSTM模型进行命名实体识别。该方法采用甲言(jiayan)分词工具进行古文数据的分词,分词效果较好且符合语境,提高了古文分词的准确性;利用word2vec训练古文字、词向量,通过大量的文本获得质量更高的字词向量;将字向量和词向量共同作为Lattice LSTM模型的输入,提升了古文领域数据实体识别的效果。
-
-