水利数据的关键词提取方法、装置、设备及存储介质

    公开(公告)号:CN119204002A

    公开(公告)日:2024-12-27

    申请号:CN202411306909.X

    申请日:2024-09-19

    Abstract: 本申请公开了水利数据的关键词提取方法、装置、设备及存储介质,涉及自然语言处理技术领域。该方法包括:对水利数据进行特征提取,得到所述水利数据的N种特征向量;其中,所述N种特征向量中包括所述水利数据的统计特征向量、词汇特征向量、上下文特征向量,所述N为大于2的整数;将所述统计特征向量、所述词汇特征向量、所述上下文特征向量输入到训练好的关键词提取模型中,得到所述水利数据的M个候选关键词,以及所述M个候选关键词各自的关键词评分;其中,所述M为大于0的整数;根据所述M个候选关键词各自的关键词评分,从所述M个候选关键词中筛选出大于评分阈值的P个目标关键词,用以提高关键词提取的准确性。

Patent Agency Ranking