-
公开(公告)号:CN104657750B
公开(公告)日:2018-04-27
申请号:CN201510127450.1
申请日:2015-03-23
Applicant: 苏州大学张家港工业技术研究院 , 苏州大学
IPC: G06K9/62
Abstract: 本发明公开了一种用于人物关系抽取的方法和装置。该方法在获取属于人物实体的页面后,对页面中的人物实体构建人物实体列表。进而,在对文本中的人物实体进行标注时,采用人物实例列表与文本中的人物实体名称进行匹配,完成对人物实体的标注。同时,将已知的用于表征人物实体之间关系的家庭关系三元组映射到文本中,实现对文本中的人物实体之间的人物关系的标注,得到训练语料,并利用训练语料建立分类模型,抽取文中的新的人物实体关系。与现有技术相比,本发明无需人工对人物实体和人物实体之间的人物关系标注时,省时省力,提高了工作效率。
-
公开(公告)号:CN105138520B
公开(公告)日:2018-08-17
申请号:CN201510530965.6
申请日:2015-08-26
Applicant: 苏州大学张家港工业技术研究院 , 苏州大学
Abstract: 本发明公开了一种事件触发词识别方法及装置,该方法包括:将待识别原始语料进行整句翻译和逐词翻译,获得翻译语料;根据所述原始语料以及所述翻译语料,确定当前候选词的双语特征,所述双语特征包括原始语料的第一单语特征以及翻译语料的第二单语特征;通过所述双语特征,使用预先建立的二元分类器对所述当前候选词进行分类,以确定所述当前候选词是否为事件触发词;其中,所述二元分类器为通过对多个具有双语特征的训练样本进行训练得到的。本发明所提供的事件触发词识别方法及装置,同时从事件的原始以及翻译语料入手,使用二者的综合信息去识别事件的触发词,可以避免语料的稀疏问题,有利于提高系统的识别性能。
-
公开(公告)号:CN111488733B
公开(公告)日:2023-12-19
申请号:CN202010265414.2
申请日:2020-04-07
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/221 , G06F40/253 , G06N3/044 , G06N3/084
Abstract: 本发明涉及一种基于Mask机制与孪生网络的汉语零指代消解方法及系统,包括在零代词所在的位置加“[MASK]”标记,得到补全后的零代词所在的句子,其中若先行词和[MASK]在同一句中,则不进行拼接处理,若所述先行词和[MASK]不在同一句中,将先行词所在的句子和补全后零代词所在的句子进行拼接处理;将上述预处理后的句子输入至预训练的BERT模型提取出第一先行词和第一零代词;将注意力机制融入至所述BERT模型中,对于第一先行词,通过第一线性函数处理得到第二先行词;对于第一零代词,结合预选的手工特征,分别通过各自线性函数处理得到第二零代词;计算所述第二先行词和第二零代词的相似度,输出相似度最高的先行词。本发明避免了信息的冗余及噪声。
-
公开(公告)号:CN110210033B
公开(公告)日:2023-08-15
申请号:CN201910476073.0
申请日:2019-06-03
Applicant: 苏州大学
IPC: G06F40/253 , G06N3/08
Abstract: 本发明公开了一种基于主述位理论的汉语基本篇章单元识别方法。本发明基于主述位理论的汉语基本篇章单元识别方法,包括:通过确定EDU中主、述位的位置间接获得EDU的边界,因此可将EDU识别分成两个部分,首先进行主、述位识别,然后在识别主位和述位后再依据一定的规则合并得到EDU。本发明的有益效果:参考了英文基本篇章单元的识别方法,结合汉语实际情况,在使用深度学习方法的同时引入主述位结构,一方面将EDU识别当作关于主述位的序列化标注问题,实现了主述位结构与EDU的联合识别;另一方面从EDU内部构成的完整性角度进行EDU边界的识别,提升了EDU的识别性能。
-
公开(公告)号:CN109885841B
公开(公告)日:2023-07-11
申请号:CN201910212569.7
申请日:2019-03-20
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/289
Abstract: 本发明公开了一种基于结点表示法的指代消解方法,包括:结点表示法:给定成分句法树,通过后序遍历得到其对应的结点序列,然后通过“字词嵌入替换法”获得其初始表示,通过双向长短时记忆网络获得其上下文表示;特征补充法:从成分句法树上提出每个结点的特征集加入初始表示中,丰富节点的表示;结点更新法:结合注意力机制与门控机制,利用孩子节点序列更新双亲结点的表示;结点枚举策略。本发明的有益效果:通过“结点表示法”、“特征补充法”、“节点更新法”与节点枚举策略,将整棵成分句法树的信息编码加入模型中,弥补了传统模型忽略结构信息与句法信息的不足,增强了句法结构信息在指代消解系统中的表达。
-
公开(公告)号:CN109325242B
公开(公告)日:2023-06-13
申请号:CN201811094517.6
申请日:2018-09-19
Applicant: 苏州大学
IPC: G06F40/58 , G06F40/289 , G06F40/242 , G06N3/0464 , G06N3/044 , G06N3/045
Abstract: 本发明公开了一种基于词典和翻译判断句子是否对齐的方法,在对源文本句进行分词得到源文本词之后,还确定了与源文本词对应的翻译文本词,并据此更新了源文本词序列,最后根据源文本句以及目标文本句对应的隐藏状态序列,判断源文本句与目标文本句是否对齐。可见,该方法不依赖于源文本句与目标文本句本身去判断二者是否对齐,而是结合源文本句中各个词的翻译,将该翻译的信息融入到了源文本句的抽象表示中,进而根据源文本句与目标文本句的抽象表示来判断二者是否对齐,极大的提高了判断的精准性。此外,本发明还提供了一种基于词典和翻译判断句子是否对齐的装置、设备及计算机可读存储介质,其作用与上述方法相对应。
-
公开(公告)号:CN109960803B
公开(公告)日:2023-04-18
申请号:CN201910212932.5
申请日:2019-03-20
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/295
Abstract: 本发明公开了一种基于成分句法压缩树的指代消解方法。本发明基于成分句法压缩树的指代消解方法,包括:(1)定义“压缩”操作;(2)针对成分句法树的压缩算法;(3)从成分句法压缩树上提取特征应用于指代消解任务。本发明的有益效果:减小了原始成分句法树的复杂结构,消除了对于指代消解任务无关的冗余结点的信息,为指代消解任务提供了简洁而精确的结构信息,增强了结构信息与层次关系在神经指代消解系统中的表达。
-
公开(公告)号:CN115687611A
公开(公告)日:2023-02-03
申请号:CN202211136811.5
申请日:2022-09-19
Applicant: 苏州大学
IPC: G06F16/35 , G06F40/284 , G06F40/289 , G06F40/126 , G06F40/30 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本申请公开了一种生物医学事件组装方法、装置、设备及介质,涉及自然语言处理技术领域,该方法包括:基于待组装文本的触发词类型,将所述待组装文本的触发词和所述待组装文本的论元进行组合,以得到所述待组装文本的候选事件;利用嵌套标记法对所述候选事件的触发词和所述候选事件的论元进行标记,以得到候选实例;利用预设深度学习模型对所述候选实例进行编码,以得到所述候选实例的语义信息的输出表征;获取所述输出表征的预设合法类别的第一概率结果以及预设非法类别的第二概率结果,然后基于所述第一概率结果和所述第二概率结果从所述候选事件中确定出目标生物医学事件。能够提高生物医学事件组装的性能。
-
公开(公告)号:CN115081436B
公开(公告)日:2022-12-30
申请号:CN202210831553.6
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/279 , G06F40/268 , G06F40/284 , G06F40/44 , G06K9/62
Abstract: 本发明公开了一种否定焦点的识别方法及系统,将待识别文本转换成词序列输入已经训练好的模型中,将词序列生成编码向量和特征向量,再基于给定的否定条件利用编码向量、特征向量及之前生成的所有否定焦点的起始标记和结束标记,计算生成下一个否定焦点的起始标记或结束标记;相比于现有的序列标注模型,对待识别文本中每个词进行标注,本发明生成标记为每个否定焦点的起始和结束,最终得到的是否定焦点范围,在计算下一个否定焦点时不需要根据词序列中每个词再计算,一定程度上减少了计算量,提高了计算效率,同时也能满足在单一否定条件下的否定焦点识别,计算量减少了,计算效率也提高了。
-
公开(公告)号:CN115048924B
公开(公告)日:2022-12-23
申请号:CN202210976289.5
申请日:2022-08-15
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于否定前后缀信息的否定句识别方法,本发明基于否定前后缀信息的否定句识别方法首先利用单词训练集训练辅助任务模型,用于获取带有否定前后缀的单词的信息;然后利用句子训练集训练主任务模型,用于否定句的识别,在主任务模型训练过程中,利用训练好的辅助任务模型得到句子中带有否定前后缀的单词的第一隐层特征表示,并将其插入至所在句子的第二隐层特征表示中更新整个句子的隐层特征表示,进行主任务模型的训练;最后利用训练好的主任务模型和辅助任务模型对目标句子进行识别。本发明将否定词识别建模为匹配模型,通过对句子中的带有否定前后缀的单词进行识别并更新句子的隐层特征表示,可以大幅提升否定句识别准确率。
-
-
-
-
-
-
-
-
-