基于主动学习的文本标记方法、装置、设备和存储介质

    公开(公告)号:CN117828088B

    公开(公告)日:2024-12-20

    申请号:CN202410053934.5

    申请日:2024-01-15

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请涉及计算机技术领域,尤其涉及自然语言处理技术领域,提供一种基于主动学习的文本标记方法、装置、设备和存储介质,用于提高文本标记的准确性和效率。该方法基于文本样本池对文本分类模型进行迭代训练时,除了使用标记文本本身外,还使用了预先标注的表征文本与标签间的因果关系的真实解释,使模型准确理解文本的深层语义信息,减少模型对文本表面语义含义的依赖,提高标签预测的泛化性和准确性;同时,还利用了各标记文本的真实解释和相应的评估值产生的损失,使模型能够准确对解释进行评估,以便选取出类别信息量较为丰富的多个候选文本进行标注,从而提高文本类别的丰富性同时降低标注占用的资源,提升文本标注效率。

    基于连续学习的模型推理方法、装置及存储介质

    公开(公告)号:CN118780333A

    公开(公告)日:2024-10-15

    申请号:CN202310390229.X

    申请日:2023-04-04

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请公开了一种基于连续学习的模型推理方法、装置及存储介质。本方法通过获取目标推理任务以及目标推理任务对应的推理数据;将推理数据输入至训练后的神经网络模型中,得到模型输出数据;从记忆数据集合中获取与目标推理任务关联的关联记忆数据;根据关联记忆数据与模型输出数据之间的关联关系,在关联记忆数据中确定多个目标记忆数据;基于多个目标记忆数据对应的标签数据确定推理结果。该方法可以提升模型推理的效率。

    论证关系挖掘方法、装置、介质及电子设备

    公开(公告)号:CN117077656B

    公开(公告)日:2024-01-02

    申请号:CN202311233294.8

    申请日:2023-09-22

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请属于人工智能技术领域,具体涉及一种论证关系挖掘方法、论证关系挖掘装置、计算机可读介质、电子设备以及计算机程序产品。该论证关系挖掘方法包括:获取需要挖掘论证关系的文本数据,所述文本数据包括连续分布的多个命题语句,所述论证关系包括两个命题语句之间存在的反对关系、支持关系或无关系;对所述命题语句进行特征提取,得到所述命题语句的第一语义特征;对连续分布的多个命题语句的第一语义特征进行融合处理,得到所述命题语句的第二语义特征;根据所述第一语义特征和所述第二语义特征,对两个命题语句进行分类处理,得到所述两个命题语句的论证关系。本申请可以提高论证关系挖掘的准确性。

    连续学习模型的通用性评估方法、装置及电子设备

    公开(公告)号:CN118586444A

    公开(公告)日:2024-09-03

    申请号:CN202310255313.0

    申请日:2023-03-02

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请涉及一种连续学习模型的通用性评估方法、装置及电子设备。该方法包括:利用目标分类任务对应的目标测试任务集分别对连续学习语言模型和单任务语言模型进行分类任务测试处理,得到连续学习语言模型对应的第一分类准确率以及单任务语言模型对应的第二分类准确率;利用探针任务集分别对连续学习语言模型和初始预训练语言模型的文本通用表征进行测试处理,得到连续学习语言模型对应的第一测试结果和初始预训练语言模型对应的第二测试结果;根据第一分类准确率和第二分类准确率之间的差异,以及第一测试结果和第二测试结果之间的差异,确定目标通用评估结果。本申请的技术方案能够准确地解释连续学习模型的通用性变化和控制文本通用表征能力。

    基于主动学习的文本标记方法、装置、设备和存储介质

    公开(公告)号:CN117828088A

    公开(公告)日:2024-04-05

    申请号:CN202410053934.5

    申请日:2024-01-15

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请涉及计算机技术领域,尤其涉及自然语言处理技术领域,提供一种基于主动学习的文本标记方法、装置、设备和存储介质,用于提高文本标记的准确性和效率。该方法基于文本样本池对文本分类模型进行迭代训练时,除了使用标记文本本身外,还使用了预先标注的表征文本与标签间的因果关系的真实解释,使模型准确理解文本的深层语义信息,减少模型对文本表面语义含义的依赖,提高标签预测的泛化性和准确性;同时,还利用了各标记文本的真实解释和相应的评估值产生的损失,使模型能够准确对解释进行评估,以便选取出类别信息量较为丰富的多个候选文本进行标注,从而提高文本类别的丰富性同时降低标注占用的资源,提升文本标注效率。

    一种分类模型的训练方法、装置、电子设备和存储介质

    公开(公告)号:CN117540024B

    公开(公告)日:2024-03-19

    申请号:CN202410029694.5

    申请日:2024-01-09

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供一种分类模型的训练方法、装置、电子设备和存储介质。方法包括:基于训练样本集对待训练的分类模型进行多轮训练;在一轮训练中,预测文本样本针对描述目标的立场;基于真实标签对应的一个因果分析的第二文本特征,结合相应文本样本的第一文本特征,生成相应的因果释义;基于文本样本对应的各因果分析集的第三文本特征集,对相应文本样本的各因果分析的正确性概率进行预测与排序,得到对应的预测排序结果;基于各预测立场、各因果释义和各预测排序结果,进行参数调整。由于本申请同时使模型进行文本样本本身以及因果分析的学习,因此可以提高模型的学习能力,进一步提高模型准确性。

    一种分类模型的训练方法、装置、电子设备和存储介质

    公开(公告)号:CN117540024A

    公开(公告)日:2024-02-09

    申请号:CN202410029694.5

    申请日:2024-01-09

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供一种分类模型的训练方法、装置、电子设备和存储介质。方法包括:基于训练样本集对待训练的分类模型进行多轮训练;在一轮训练中,预测文本样本针对描述目标的立场;基于真实标签对应的一个因果分析的第二文本特征,结合相应文本样本的第一文本特征,生成相应的因果释义;基于文本样本对应的各因果分析集的第三文本特征集,对相应文本样本的各因果分析的正确性概率进行预测与排序,得到对应的预测排序结果;基于各预测立场、各因果释义和各预测排序结果,进行参数调整。由于本申请同时使模型进行文本样本本身以及因果分析的学习,因此可以提高模型的学习能力,进一步提高模型准确性。

    论证关系挖掘方法、装置、介质及电子设备

    公开(公告)号:CN117077656A

    公开(公告)日:2023-11-17

    申请号:CN202311233294.8

    申请日:2023-09-22

    Inventor: 罗云 杨振 孟凡东

    Abstract: 本申请属于人工智能技术领域,具体涉及一种论证关系挖掘方法、论证关系挖掘装置、计算机可读介质、电子设备以及计算机程序产品。该论证关系挖掘方法包括:获取需要挖掘论证关系的文本数据,所述文本数据包括连续分布的多个命题语句,所述论证关系包括两个命题语句之间存在的反对关系、支持关系或无关系;对所述命题语句进行特征提取,得到所述命题语句的第一语义特征;对连续分布的多个命题语句的第一语义特征进行融合处理,得到所述命题语句的第二语义特征;根据所述第一语义特征和所述第二语义特征,对两个命题语句进行分类处理,得到所述两个命题语句的论证关系。本申请可以提高论证关系挖掘的准确性。

Patent Agency Ranking