一种基于命名实体识别的中标数据解析治理方法、装置及介质

    公开(公告)号:CN116151219A

    公开(公告)日:2023-05-23

    申请号:CN202310238430.6

    申请日:2023-03-14

    Abstract: 本发明公开了一种基于命名实体识别的中标数据解析治理方法、装置及介质,涉及命名实体识别领域,该方法通过获取中标文件,对中标文件进行解析和数据清洗,得到中标文本;将中标文本输入实体识别模型,实体识别模型包括依次连接的ERNIE模块和CRF模块,得到最优标签序列;根据最优标签序列构造双向链表结构,基于双向链表结构采用实体类型限制条件和/或规则库限制条件对最优标签序列进行过滤,得到具有标签的中标文本;对具有标签的中标文本进行校正和格式化处理,得到中标文本的命名实体识别结果。该方法不仅能够提高解析效率,降低解析成本,还能够提高命名实体识别的准确性,解决中标文件形式多样、解析效率低、准确率不佳的问题。

Patent Agency Ranking