识别自然语言中的命名实体的方法和装置

    公开(公告)号:CN101075228B

    公开(公告)日:2012-05-23

    申请号:CN200610079890.5

    申请日:2006-05-15

    CPC classification number: G06F17/278 G06F17/2785 G06F17/289 G06K9/222

    Abstract: 本发明提供了一种识别自然语言中的命名实体的方法,包括步骤:对自然语言执行逐步式解析模型训练,以获得分类模型;基于得到的所述分类模型对自然语言执行逐步式解析识别,以得到侯选命名实体的位置和类型信息;利用拒识器对侯选命名实体进行拒识处理;和对经过拒识处理的侯选命名实体生成侯选命名实体网络,并执行最优路径搜索。本发明使用候选命名实体的全局特征,在得到仅使用局部特征的前向解析识别结果和后向解析识别结果的基础上,使用一个单类分类器对这些结果进行打分或评判,来得到最为可靠的命名实体起始和终止边界。

    识别自然语言中的命名实体的方法和装置

    公开(公告)号:CN101075228A

    公开(公告)日:2007-11-21

    申请号:CN200610079890.5

    申请日:2006-05-15

    CPC classification number: G06F17/278 G06F17/2785 G06F17/289 G06K9/222

    Abstract: 本发明提供了一种识别自然语言中的命名实体的方法,包括步骤:对自然语言执行逐步式解析模型训练,以获得分类模型;基于得到的所述分类模型对自然语言执行逐步式解析识别,以得到候选命名实体的位置和类型信息;利用拒识器对候选命名实体进行拒识处理;和对经过拒识处理的候选命名实体生成候选命名实体网络,并执行最优路径搜索。本发明使用候选命名实体的全局特征,在得到仅使用局部特征的前向解析识别结果和后向解析识别结果的基础上,使用一个单类分类器对这些结果进行打分或评判,来得到最为可靠的命名实体起始和终止边界。

Patent Agency Ranking