一种面向细粒度实体分类的噪声标签修正方法

    公开(公告)号:CN114912436A

    公开(公告)日:2022-08-16

    申请号:CN202210587889.2

    申请日:2022-05-26

    Abstract: 本发明公开了一种面向细粒度实体分类的噪声标签修正方法,包括以下步骤:1)获取样本中句子和句子中已经标注出的实体提及作为输入;2)将句子和句子中已经标注出的实体提及二元组按照进行转换;3)将转换后的输入作为预训练语言模型BERT的输入,对[MASK]位置进行预测,将标签在[MASK]位置处的出现概率作为样本拥有该标签的概率;4)在步骤3)中,在模型网络过拟合前,依据模型在过拟合前输出的logits估计样本标签为正的概率;5)利用模型在过拟合前输出的logit估计数据标签为正或负的后验概率,选取潜在噪声标签,利用半监督学习方法对潜在噪声标签进行重标注。本发明方法在不引入人工先验知识的情况下,可有效修正细粒度实体分类数据中的噪声标签。

    一种面向细粒度实体分类的噪声标签修正方法

    公开(公告)号:CN114912436B

    公开(公告)日:2024-10-22

    申请号:CN202210587889.2

    申请日:2022-05-26

    Abstract: 本发明公开了一种面向细粒度实体分类的噪声标签修正方法,包括以下步骤:1)获取样本中句子和句子中已经标注出的实体提及作为输入;2)将句子和句子中已经标注出的实体提及二元组按照进行转换;3)将转换后的输入作为预训练语言模型BERT的输入,对[MASK]位置进行预测,将标签在[MASK]位置处的出现概率作为样本拥有该标签的概率;4)在步骤3)中,在模型网络过拟合前,依据模型在过拟合前输出的logits估计样本标签为正的概率;5)利用模型在过拟合前输出的logit估计数据标签为正或负的后验概率,选取潜在噪声标签,利用半监督学习方法对潜在噪声标签进行重标注。本发明方法在不引入人工先验知识的情况下,可有效修正细粒度实体分类数据中的噪声标签。

    基于隐空间多属性控制的个性对话生成方法与装置

    公开(公告)号:CN117669732A

    公开(公告)日:2024-03-08

    申请号:CN202311681066.7

    申请日:2023-12-06

    Abstract: 本发明公开了一种基于隐空间多属性控制的个性对话生成方法,该方法包括以下步骤:1)将复杂个性解耦为多个独立个性属性的相互组合;2)生成基于每个独立个性属性值的多轮对话,获得个性稠密数据;3)利用条件变分自编码器,将回复r从离散的文本空间,映射到同一连续隐空间,进行对话模型训练;4)实现基于复杂个性P的个性化对话生成。本发明通过将复杂个性解耦为多个个性属性的相互组合,创建个性稠密数据,并利用条件变分自编码器,将文本空间的每个单独个性属性映射到同一隐空间,实现复杂个性的细粒度建模和个性化对话可控生成的精确性。

Patent Agency Ranking