-
公开(公告)号:CN117933252A
公开(公告)日:2024-04-26
申请号:CN202410072157.9
申请日:2024-01-17
Applicant: 哈尔滨商业大学
IPC: G06F40/295 , G06F40/211 , G06F40/30 , G06F18/213 , G06F18/241 , G06F18/25 , G06N3/045 , G06N3/0442 , G06N3/048 , G06N3/084
Abstract: 基于多交叉注意力特征融合的生物医学命名实体识别方法,涉及自然语言处理技术领域,本申请同时使用CharCNN和CharLSTM,两个字符特征提取模型,CharCNN通过卷积操作捕捉局部特征,而CharLSTM通过模拟时序依赖关系捕捉长期依赖关系。它们的结合可以更好地理解文本数据的语义信息,提高特征提取的准确性。有效缓解了现有方法通常只通过拼接的方法对字词特征进行融合,忽略了字词相互融合过程中的特征信息,进而导致了提取的特征准确率低,最终导致实体识别准确率低的问题,本申请使用BioDistilBERT提取单词嵌入后分别和CharCNN和CharLSTM提取的字符级嵌入进行交叉注意力融合,弥补了单一提取词特征和字符特征的不足。
-
公开(公告)号:CN111881299B
公开(公告)日:2023-06-30
申请号:CN202010786373.1
申请日:2020-08-07
Applicant: 哈尔滨商业大学
IPC: G06F16/35 , G06F40/30 , G06F40/211 , G06F40/289 , G06F40/295 , G06F18/2433 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/084
Abstract: 基于复制神经网络的离群事件检测与识别方法,涉及信息技术领域,针对现有技术中多数方法为了能够顺利完成深度学习模型训练严重依赖异常数据,但异常数据不易获取的问题,包括以下步骤:步骤一:获取待处理中文文本序列数据;步骤二:对待处理中文文本序列数据进行时间序列分析;步骤三:对时间序列分析后的中文文本序列数据进行浅层语义分析;步骤四:对浅层语义分析后的中文文本序列数据,利用基于深度学习策略进行事件触发词的识别与抽取;步骤五:对事件触发词识别与抽取后的中文文本序列数据进行候选事件识别;步骤六:将候选事件识别后的中文文本序列数据作为输入,利用训练好的复制神经网络进行离群事件的检测与识别。
-
公开(公告)号:CN111881299A
公开(公告)日:2020-11-03
申请号:CN202010786373.1
申请日:2020-08-07
Applicant: 哈尔滨商业大学
IPC: G06F16/35 , G06F40/30 , G06F40/211 , G06F40/289 , G06F40/295 , G06K9/62 , G06N3/04
Abstract: 基于复制神经网络的离群事件检测与识别方法,涉及信息技术领域,针对现有技术中多数方法为了能够顺利完成深度学习模型训练严重依赖异常数据,但异常数据不易获取的问题,包括以下步骤:步骤一:获取待处理中文文本序列数据;步骤二:对待处理中文文本序列数据进行时间序列分析;步骤三:对时间序列分析后的中文文本序列数据进行浅层语义分析;步骤四:对浅层语义分析后的中文文本序列数据,利用基于深度学习策略进行事件触发词的识别与抽取;步骤五:对事件触发词识别与抽取后的中文文本序列数据进行候选事件识别;步骤六:将候选事件识别后的中文文本序列数据作为输入,利用训练好的复制神经网络进行离群事件的检测与识别。
-
-