一种零样本文本分类方法及应用
    1.
    发明公开

    公开(公告)号:CN118520107A

    公开(公告)日:2024-08-20

    申请号:CN202410562517.3

    申请日:2024-05-08

    Inventor: 赵峰 万贤林 闫成

    Abstract: 本发明公开了一种零样本文本分类方法及应用,属于自然语言处理技术领域;在对无标签样本集中的文本样本进行分类之前,通过计算无标签样本集中各文本样本对应的相对概率分布的平均值,预先测量了预训练语言模型在分类任务各标签词的偏差分布;将无标签样本集中的每一个文本样本所对应的相对概率分布与偏差分布逐元素对应相除,消除了预训练语言模型在标签词的偏差;模型在标签词的偏差包括模型蕴含偏差和提示模板偏差,通过对偏差进行消除,大幅减少了提示学习效果与模板格式的相关性,降低了人工设计效果稳定且质量高的模板的难度,同时也校准了预训练语言模型对无标签样本集的原始分类结果,能够在零样本场景下准确且稳定地对文本样本进行分类。

    贝叶斯小样本学习的知识图谱推理模型、系统及推理方法

    公开(公告)号:CN114861917A

    公开(公告)日:2022-08-05

    申请号:CN202210490127.0

    申请日:2022-04-29

    Inventor: 赵峰 闫成 金海

    Abstract: 本发明涉及一种贝叶斯小样本学习的知识图谱推理模型、系统及推理方法,所述方法至少包括:对知识图谱中的实体和关系进行高斯分布的建模以降低知识图谱的不确定性;将每个实体作为一个任务,以模拟动态知识图谱中新出现实体的元训练过程进行任务采样;基于图神经网络构建元学习器并进行随机推理;训练所述元学习器以使用支持集来表示新出现实体。本发明经过训练的模型具有快速适应的能力,无需重新训练就能推断出新的事实或出现的实体。

    基于规划选择和图结构感知的知识图谱生成文本的方法

    公开(公告)号:CN117610504A

    公开(公告)日:2024-02-27

    申请号:CN202311569466.9

    申请日:2023-11-21

    Abstract: 本发明公开了一种基于规划选择和图结构感知的知识图谱生成文本的方法,属于自然语言生成领域,包括:构建初始样本集;以规划选择器和基准模型二者输出的BLEU趋于一致为目标,利用初始样本集训练规划选择器;对于初始样本集中各知识图谱,利用规划选择器从其对应的多个三元组线性化序列中,选择BLEU值最高的一个作为其最优线性化序列,对初始样本集中部分最优线性化序列进行替换以构建困难负样本;结合正样本、简单负样本、困难负样本、目标文本和最优线性化序列,训练编码器‑解码器模型;目标知识图谱对应的多个三元组线性化序列依次经规划选择器和编码器‑解码器模型后,输出其对应的文本。提高知识图谱生成文本内容的准确性和完整性。

    贝叶斯小样本学习的知识图谱推理模型、系统及推理方法

    公开(公告)号:CN114861917B

    公开(公告)日:2024-10-18

    申请号:CN202210490127.0

    申请日:2022-04-29

    Inventor: 赵峰 闫成 金海

    Abstract: 本发明涉及一种贝叶斯小样本学习的知识图谱推理模型、系统及推理方法,所述方法至少包括:对知识图谱中的实体和关系进行高斯分布的建模以降低知识图谱的不确定性;将每个实体作为一个任务,以模拟动态知识图谱中新出现实体的元训练过程进行任务采样;基于图神经网络构建元学习器并进行随机推理;训练所述元学习器以使用支持集来表示新出现实体。本发明经过训练的模型具有快速适应的能力,无需重新训练就能推断出新的事实或出现的实体。

Patent Agency Ranking