一种用于人物关系抽取的方法和装置

    公开(公告)号:CN104657750B

    公开(公告)日:2018-04-27

    申请号:CN201510127450.1

    申请日:2015-03-23

    Abstract: 本发明公开了一种用于人物关系抽取的方法和装置。该方法在获取属于人物实体的页面后,对页面中的人物实体构建人物实体列表。进而,在对文本中的人物实体进行标注时,采用人物实例列表与文本中的人物实体名称进行匹配,完成对人物实体的标注。同时,将已知的用于表征人物实体之间关系的家庭关系三元组映射到文本中,实现对文本中的人物实体之间的人物关系的标注,得到训练语料,并利用训练语料建立分类模型,抽取文中的新的人物实体关系。与现有技术相比,本发明无需人工对人物实体和人物实体之间的人物关系标注时,省时省力,提高了工作效率。

    一种事件触发词识别方法及装置

    公开(公告)号:CN105138520B

    公开(公告)日:2018-08-17

    申请号:CN201510530965.6

    申请日:2015-08-26

    Abstract: 本发明公开了一种事件触发词识别方法及装置,该方法包括:将待识别原始语料进行整句翻译和逐词翻译,获得翻译语料;根据所述原始语料以及所述翻译语料,确定当前候选词的双语特征,所述双语特征包括原始语料的第一单语特征以及翻译语料的第二单语特征;通过所述双语特征,使用预先建立的二元分类器对所述当前候选词进行分类,以确定所述当前候选词是否为事件触发词;其中,所述二元分类器为通过对多个具有双语特征的训练样本进行训练得到的。本发明所提供的事件触发词识别方法及装置,同时从事件的原始以及翻译语料入手,使用二者的综合信息去识别事件的触发词,可以避免语料的稀疏问题,有利于提高系统的识别性能。

    基于大小导师知识蒸馏的少样本情感分类方法

    公开(公告)号:CN114722805B

    公开(公告)日:2022-08-30

    申请号:CN202210653730.6

    申请日:2022-06-10

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于大小导师知识蒸馏的少样本情感分类方法,包括收集大量情感分类任务上的未标注样本和有标注样本,使用有标注样本训练大导师模型和小导师模型;全部未标注样本经过小导师模型得到每个样本概率的不确定性,然后根据阈值筛选出样本概率高度不确定的样本再次经过大导师模型;结合大导师模型和小导师模型的概率输出形成软标签来蒸馏学生模型,使用蒸馏后的学生模型进行分类预测。本发明减少了访问大导师模型的频率,减少了训练学生模型过程中的蒸馏时间,减少资源消耗的同时提升了分类识别的正确率。

    一种基于微观话题结构的指代消解方法及系统

    公开(公告)号:CN106445911B

    公开(公告)日:2022-02-22

    申请号:CN201610156465.5

    申请日:2016-03-18

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于微观话题结构的指代消解方法及系统,首先获取文本并对文本进行篇章基本话题单元切割构成篇章微观话题结构;然后从篇章微观话题结构中识别主述位;再以主述位为连接端口识别篇章基本话题单元之间的衔接关系;最后根据识别的衔接关系,将照应语中候选先行语的范围落在与其所在主述位结构相衔接的前一个篇章基本话题的主位或述位中,减少消解对的数量,再提取限定范围内的名词所拥有的词性、句法及语义特征,最后利用最大熵分类算法完成消解单元的识别。该方法是基于主位和述位,以话题为中心,立足于小句层面的指代消解方法,利用主述位结构及主位推进模式,缩小了指代消解对的数量,降低计算的复杂度,从而提高指代消解性。

    基于融合模态内和模态间关系的数据处理方法及系统

    公开(公告)号:CN113254741A

    公开(公告)日:2021-08-13

    申请号:CN202110665991.5

    申请日:2021-06-16

    Applicant: 苏州大学

    Abstract: 本申请涉及基于融合模态内和模态间关系的数据处理方法及系统,包括:获取社交网络指向目标分类的样本数据,并将样本数据划分为训练集、验证集和测试集,获得训练集样本数据、验证集样本数据和测试集样本数据;构建预设分类模型,所述预设分类模型包括特征提取网络,与所述特征提取网络相连的目标分类主任务网络和多模态主题信息辅助任务网络;将所述训练集样本数据输入所述预设分类模型并利用预设的损失函数进行训练,使用门控机制融合主任务和辅助任务的输出,得到社交数据分类模型,所述社交数据分类模型用于对输入的待分类数据进行分类。本申请能够有效的提升社交网络数据指向目标分类的性能。

    融合局部特征与深度学习的事件联合抽取方法

    公开(公告)号:CN110134720B

    公开(公告)日:2021-02-09

    申请号:CN201910412962.0

    申请日:2019-05-17

    Applicant: 苏州大学

    Abstract: 本发明公开了一种融合局部特征与深度学习的事件联合抽取方法。本发明融合局部特征与深度学习的事件联合抽取方法,包括:抽取实体、词性与依存分析,利用PV‑DM模型训练文档向量;学习隐藏特征,进入GCN;再次,识别出事件元素与事件触发之间的记忆单元,帮助识别事件类型与事件论元;最后,使用CRF对最终的事件类型进行标注,全连接层中,用Softmax函数对事件元素进行识别。本发明的有益效果:借助文档向量学习文章中的主旨信息,其次利用图卷积网络挖掘事件之间的联系,最后利用记忆单元与局部特征学习事件类型与事件元素之间的信息,以此完成事件联合抽取,提高其识别性能。

    英文事件同指消解方法和系统

    公开(公告)号:CN109359184B

    公开(公告)日:2020-08-18

    申请号:CN201811203139.0

    申请日:2018-10-16

    Applicant: 苏州大学

    Abstract: 本发明公开了一种英文事件同指消解方法和系统。本发明英文事件同指消解方法,包括:读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合。本发明的有益效果:利用从事件句中抽取的信息特征和事件对匹配特征,采用循环神经网络对事件对之间的同指关系进行判定;本发明采用循环神经网络模型,利用深度学习来解决事件同指消解问题;本发明的方法和系统,与现有的方法和系统相比,英文事件同指消解性能得到了明显提升。

    一种中文事件事实性识别方法和系统

    公开(公告)号:CN106844448B

    公开(公告)日:2020-05-15

    申请号:CN201611170133.9

    申请日:2016-12-16

    Applicant: 苏州大学

    Abstract: 本发明涉及一种中文事件事实性识别方法和系统,利用事件事实性信息和它们之间的联系,采用机器学习和推理相结合的方法来识别中文事件的事实性。本发明的方法和系统,与现有的方法和系统相比,总体的识别性能有所提升,同时,在处理类别的不均衡问题上有更好的效果,尤其在事件数目较少的类别的事实性识别上有明显的性能提升。

    英文事件触发词抽取方法和系统

    公开(公告)号:CN109325228A

    公开(公告)日:2019-02-12

    申请号:CN201811093486.2

    申请日:2018-09-19

    Applicant: 苏州大学

    Abstract: 本发明涉及一种英文事件触发词抽取方法,包括:读取标注文档的实体标注信息和事件标注信息,对标注文档中的每一个事件句调用词形还原工具进行词形还原,分别得到标注语料实体集合、标注语料事件集合和词形还原文档集合;对标注语料事件集合中每个触发词,匹配词形还原文档集合中的词原形。上述英文事件触发词抽取方法,基于论元预测的事件触发词抽取系统和方法,将预测的论元和句子转化成词向量,利用循环神经网络自动的捕获触发词和论元之间的隐含特征,以及论元的深层语义信息。本发明的方法和系统,与现有方法和系统相比,触发词抽取性能得到了提升。

    一种新闻分类方法和系统

    公开(公告)号:CN103324758B

    公开(公告)日:2017-07-14

    申请号:CN201310288756.6

    申请日:2013-07-10

    Applicant: 苏州大学

    Abstract: 本申请提供一种新闻分类方法和系统。其中,一种新闻分类方法包括:使用预先构建的每个基分类器对待分类新闻进行分类,得到每个基分类器的分类结果;依据每个基分类器的分类结果,分别对待分类新闻进行情绪判定,得到判定结果;使用判定结果,得到待分类新闻含有的所有情绪类别。由于情绪判定是指判定待分类新闻是否含有用户看到待分类新闻时产生的情绪,判定结果表明所述待分类新闻含有的情绪,所以使用判定结果,即可以得到所述待分类新闻含有的所有情绪类别,并将待分类新闻划分到其含有的所有情绪类别对应的新闻中,实现依据情绪对新闻划分。进一步依据不同情绪推荐新闻,使推荐给用户的新闻更能满足用户当前的需求。

Patent Agency Ranking