面向地铁设备故障维护信息的命名实体识别方法及系统

    公开(公告)号:CN119647471A

    公开(公告)日:2025-03-18

    申请号:CN202411490327.1

    申请日:2024-10-24

    Abstract: 本发明公开了面向地铁设备故障维护信息的命名实体识别方法及系统,涉及命名实体识别技术领域,包括预处理,对原始文本数据进行序列标注以及标签化分类;构建地铁列车故障维护文本数据集;构建RoBERTa‑WWM‑BiLSTM_KAN‑CRF模型用于命名实体识别;对RoBERTa‑WWM‑BiLSTM_KAN‑CRF模型进行训练和评估,通过测试损失、预测结果和真实标签,评估模型性能;通过模型实现对地铁列车故障维护文本的命名实体识别。本发明通过构建地铁列车故障维护文本数据集,增加KAN层在模型中负责对特征进行空间变换和添加噪声,提高模型的表达能力和泛化能力,本发明在识别准确度、文本利用率以及识别效果方面都取得更加良好的效果。

Patent Agency Ranking