模型训练方法、文本分类方法、装置、设备、介质及产品

    公开(公告)号:CN118070063A

    公开(公告)日:2024-05-24

    申请号:CN202410218782.X

    申请日:2024-02-28

    Inventor: 刘劲

    Abstract: 本申请实施例提供了一种模型训练方法、文本分类方法、装置、设备、介质及产品。其中,模型训练方法包括:获取训练文本及训练层次标签列表;对所述训练文本进行处理,得到训练文本嵌入表示;将所述训练文本嵌入表示输入神经网络模型,输出预测层次标签序列;根据所述预测层次标签序列和训练层次标签序列计算目标损失函数,所述训练层次标签序列是根据所述训练层次标签列表生成的;基于所述目标损失函数对所述神经网络模型的参数进行调整,得到文本分类模型。本申请实施例根据层次标签列表生成层次标签序列用于模型的训练,不需要针对不同层次的标签分别训练模型,节省了模型训练和推理的时间和成本,提高了分类的标签层次结构的正确性。

Patent Agency Ranking