-
公开(公告)号:CN111753101A
公开(公告)日:2020-10-09
申请号:CN202010623201.2
申请日:2020-06-30
Applicant: 华侨大学
Abstract: 本发明提出了一种融合实体描述及类型的知识图谱表示学习方法,包括以下步骤:步骤S1:利用翻译模型获得三元组实体的嵌入,将三元组中的关系当作头实体和尾实体间翻译操作,得到每个三元组实体和关系的数值向量表示;步骤S2:采用Doc2Vec模型,对实体描述的文本信息进行嵌入;步骤S3:通过Trans模型得到的实体嵌入,与实体层次类型映射矩阵结合,得到三元组实体类型的嵌入;步骤S4:将所有的表示向量进行连接,得到最终的三元组实体向量,采用随机梯度下降的方法优化训练模型,进行效果评估。本发明提出的方法,通过实体描述及实体类型的嵌入,提高了知识图谱三元组实体表示的语义信息。
-
公开(公告)号:CN114818717B
公开(公告)日:2024-08-20
申请号:CN202210575509.3
申请日:2022-05-25
Applicant: 华侨大学
IPC: G06F40/295 , G06F40/242 , G06F40/253 , G06N3/0464 , G06N3/049 , G06N3/08 , G06N3/0442
Abstract: 本发明公开一种融合词汇和句法信息的中文命名实体识别方法及系统,包括以下步骤:步骤1、将原始输入文本映射为字向量,使用改进后的词集匹配算法引入外部词汇信息,并整合在每个字的输入表示中;步骤2、根据字的输入表示,利用双向LSTM抽取上下文信息;步骤3、使用NLP工具从原始输入文本中获取词性标签和句法成分,并且使用健值记忆网络构造句法向量,再通过门控机制对上下文向量与句法向量进行加权融合,获得特征向量;步骤4、将特征向量输入标签预测层的CRF中,实现中文命名实体识别。本发明能够解决中文命名实体中实体边界信息不足的问题和融合输入文本的句法信息。
-
公开(公告)号:CN111753101B
公开(公告)日:2022-06-07
申请号:CN202010623201.2
申请日:2020-06-30
Applicant: 华侨大学
Abstract: 本发明提出了一种融合实体描述及类型的知识图谱表示学习方法,包括以下步骤:步骤S1:利用翻译模型获得三元组实体的嵌入,将三元组中的关系当作头实体和尾实体间翻译操作,得到每个三元组实体和关系的数值向量表示;步骤S2:采用Doc2Vec模型,对实体描述的文本信息进行嵌入;步骤S3:通过Trans模型得到的实体嵌入,与实体层次类型映射矩阵结合,得到三元组实体类型的嵌入;步骤S4:将所有的表示向量进行连接,得到最终的三元组实体向量,采用随机梯度下降的方法优化训练模型,进行效果评估。本发明提出的方法,通过实体描述及实体类型的嵌入,提高了知识图谱三元组实体表示的语义信息。
-
公开(公告)号:CN114818717A
公开(公告)日:2022-07-29
申请号:CN202210575509.3
申请日:2022-05-25
Applicant: 华侨大学
IPC: G06F40/295 , G06F40/242 , G06F40/253 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种融合词汇和句法信息的中文命名实体识别方法及系统,包括以下步骤:步骤1、将原始输入文本映射为字向量,使用改进后的词集匹配算法引入外部词汇信息,并整合在每个字的输入表示中;步骤2、根据字的输入表示,利用双向LSTM抽取上下文信息;步骤3、使用NLP工具从原始输入文本中获取词性标签和句法成分,并且使用健值记忆网络构造句法向量,再通过门控机制对上下文向量与句法向量进行加权融合,获得特征向量;步骤4、将特征向量输入标签预测层的CRF中,实现中文命名实体识别。本发明能够解决中文命名实体中实体边界信息不足的问题和融合输入文本的句法信息。
-
-
-