基于门控机制和图注意力网络的中文实体关系抽取方法

    公开(公告)号:CN114722820A

    公开(公告)日:2022-07-08

    申请号:CN202210281501.6

    申请日:2022-03-21

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于门控机制和图注意力网络的中文实体关系抽取方法,首先,使用中文BERT预训练模型将文本转换为机器可以识别的向量形式;其次,将实体嵌入拼接到每个词嵌入后面,采用一种全局信息门控机制,计算门控向量,实现词嵌入的实体语义强化;然后,对文本进行依存句法分析,获得依存句法树,构造出邻接矩阵、依赖类型矩阵和依赖方向矩阵,使用掩码自注意力求得注意力权重矩阵,进而在图注意力网络中对文本进行特征提取;最后,从图注意力网络的输出中,获取两个实体和句子的表征向量,经过多层感知机将该向量转换到分类空间,输入至分类器中完成关系分类。

    一种节能型水利灌溉系统

    公开(公告)号:CN105815193A

    公开(公告)日:2016-08-03

    申请号:CN201610308735.X

    申请日:2016-05-11

    Applicant: 河海大学

    Abstract: 本发明公开了一种节能型水利灌溉系统,本发明具有结构合理简单、生产成本低、使用方便,第一水泵从河里直接抽取水到沉淀室中沉淀,在进入到储水室中,通过水肥室混合水肥,再经由第二水泵和加压泵的作用下,最后通过伸缩水管和喷嘴进行灌溉,在伸缩水管上设置挡水罩和旋转叶加大了灌溉时候的面积,喷嘴采用四通的结构,可以全方位进行喷洒,还设置了风电和太能源装置供电,大大减低了能源的消耗,实现了环保减排,且极大程度上合理利用水利资源,还设置了农药储存室,可以实现农药喷洒。

    面向语义结构特征联合增强的代码摘要生成方法

    公开(公告)号:CN119537579A

    公开(公告)日:2025-02-28

    申请号:CN202411440402.3

    申请日:2024-10-15

    Applicant: 河海大学

    Abstract: 本发明公开了一种面向语义结构特征联合增强的代码摘要生成方法。本发明遵循编码器‑解码器架构,采用一种多形式联合的语义特征增强方法自动生成代码摘要。其中编码器在令牌和语句级别学习代码语义,解码器接收代码嵌入并结合注意力机制来生成代码摘要。不同于单一的树或图编码过程,本方法使用图表示增强区间划分的树结构。联合解码器聚合文本序列信息与包含位置结特征的结构序列信息,预测并生成模型理解后代码摘要文本。本发明缓解了因代码文本特征无序造成的不同长度代码文本的重复和冗余问题。在较为复杂的代码文本数据集中,减少了因知识信息理解不足出现的词语歧义现象,并生成质量较高的代码摘要。同时,方法具备较好的收敛性能。

    基于多级分类层次注意力的远程监督关系抽取方法

    公开(公告)号:CN119149746A

    公开(公告)日:2024-12-17

    申请号:CN202411369025.9

    申请日:2024-09-29

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于多级分类层次注意力的远程监督关系抽取方法,使用基于多级分类层次注意力的远程监督关系抽取(MCHRE)模型。该模型利用图注意力网络(GraphAttention Networks,GATs)对关系的层次结构进行建模,深入挖掘关系类别间的隐含语义联系,生成感知全局层次结构的关系嵌入;在分类策略部分,以层次注意力机制为基础,引入多级分类结构,实现更细粒度的分类过程,引导知识由头关系向尾关系迁移,从而实现数据降噪,并有效改善长尾关系的抽取性能。本发明具备强大的抗噪声干扰能力,在关系抽取性能上表现优异,在长尾抽取上的表现全面优于基线模型,是解决远程监督关系抽取中数据长尾问题的有效方法。

    一种基于小样本学习的文本实体关系分类方法

    公开(公告)号:CN114780720A

    公开(公告)日:2022-07-22

    申请号:CN202210318340.3

    申请日:2022-03-29

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于小样本学习的文本实体关系分类方法,包括以下步骤:1)采用卷积神经网络作为实例编码器提取数据集中实例向量的语义特征;2)在小样本学习场景下,通过设计原型级注意力机制模块,为每个实例赋予权重,以加权求和的方式表示每个关系的原型;3)在小样本学习场景下,更换新的度量函数。通过距离级注意力机制模块,利用卷积操作提取支持集向量中的特征系数,并用曼哈顿距离公式与特征系数的乘积作为新的度量函数来计算支持集中每一个关系原型和查询实例之间的距离;4)利用softmax函数实现小样本关系分类。

    一种基于Spark的并行化萤火虫算法

    公开(公告)号:CN108038187A

    公开(公告)日:2018-05-15

    申请号:CN201711305609.X

    申请日:2017-12-11

    Applicant: 河海大学

    CPC classification number: G06F16/27 G06F16/24532 G06N20/00

    Abstract: 本发明公开了一种基于Spark的并行化萤火虫算法,该方法包括以下步骤:(1)随机生成初始萤火虫种群,初始化萤火虫位置和亮度,设置算法参数;(2)从初始萤火虫种群创建Spark的RDD,并将RDD划分为多个分区分布到Spark集群的多个节点中,每个分区对应一个萤火虫子种群;(3)各个萤火虫子种群在各自的节点上进行目标函数值的计算和萤火虫位置的更新,每个萤火虫子种群通过萤火虫位置的更新,寻找到局部最优解;(4)将萤火虫子种群合并为完整的萤火虫种群,找出当前的最优解。

Patent Agency Ranking