-
公开(公告)号:CN118070063A
公开(公告)日:2024-05-24
申请号:CN202410218782.X
申请日:2024-02-28
Applicant: 广州市百果园信息技术有限公司
Inventor: 刘劲
IPC: G06F18/214 , G06F18/241 , G06F16/35 , G06N3/0455 , G06N3/084
Abstract: 本申请实施例提供了一种模型训练方法、文本分类方法、装置、设备、介质及产品。其中,模型训练方法包括:获取训练文本及训练层次标签列表;对所述训练文本进行处理,得到训练文本嵌入表示;将所述训练文本嵌入表示输入神经网络模型,输出预测层次标签序列;根据所述预测层次标签序列和训练层次标签序列计算目标损失函数,所述训练层次标签序列是根据所述训练层次标签列表生成的;基于所述目标损失函数对所述神经网络模型的参数进行调整,得到文本分类模型。本申请实施例根据层次标签列表生成层次标签序列用于模型的训练,不需要针对不同层次的标签分别训练模型,节省了模型训练和推理的时间和成本,提高了分类的标签层次结构的正确性。