一种文本流实体同义词实时挖掘方法及装置

    公开(公告)号:CN119067104A

    公开(公告)日:2024-12-03

    申请号:CN202410944222.2

    申请日:2024-07-15

    Abstract: 本发明涉及同义词识别技术领域,具体涉及一种文本流实体同义词实时挖掘方法及装置,本发明利用预训练语言模型从实体提及的多个上下文中提取实体提及嵌入,能够捕捉多角度的实体提及上下文语义;本发明利用Transformer的多头子注意力机制,从提取的实体提及嵌入中学习集合特征,能够更好的捕捉集合的全局语义,在一定程度上能够缓解错误累积问题;本发明能够读取文本流,实时的从文本流中挖掘实体同义词集合,相比传统方法的离线操作,更加灵活高效。

Patent Agency Ranking