-
公开(公告)号:CN117933252A
公开(公告)日:2024-04-26
申请号:CN202410072157.9
申请日:2024-01-17
Applicant: 哈尔滨商业大学
IPC: G06F40/295 , G06F40/211 , G06F40/30 , G06F18/213 , G06F18/241 , G06F18/25 , G06N3/045 , G06N3/0442 , G06N3/048 , G06N3/084
Abstract: 基于多交叉注意力特征融合的生物医学命名实体识别方法,涉及自然语言处理技术领域,本申请同时使用CharCNN和CharLSTM,两个字符特征提取模型,CharCNN通过卷积操作捕捉局部特征,而CharLSTM通过模拟时序依赖关系捕捉长期依赖关系。它们的结合可以更好地理解文本数据的语义信息,提高特征提取的准确性。有效缓解了现有方法通常只通过拼接的方法对字词特征进行融合,忽略了字词相互融合过程中的特征信息,进而导致了提取的特征准确率低,最终导致实体识别准确率低的问题,本申请使用BioDistilBERT提取单词嵌入后分别和CharCNN和CharLSTM提取的字符级嵌入进行交叉注意力融合,弥补了单一提取词特征和字符特征的不足。