-
-
公开(公告)号:CN112101028B
公开(公告)日:2022-08-26
申请号:CN202010824303.0
申请日:2020-08-17
Applicant: 淮阴工学院
IPC: G06F40/295 , G06F40/284 , G06F40/216 , G06F40/30 , G06F40/117 , G06F16/35
Abstract: 本发明公开了一种多特征双向门控领域专家实体抽取方法及系统。该方法首先通过构建领域专家语料库以训练实体抽取模型;接着,使用BERT方法进行字嵌入表示,对语料库专业领域词汇构造要素进行特征分析并提取边界特征;然后,利用双向门控神经网络和注意力机制有效获取特定词语长距离依赖关系;最后,结合条件随机场模型实现命名实体识别,将抽取后的信息建立高质量的实体信息索引项返还WEB应用系统。本发明方法可有效抽取领域专家信息实体,充分利用文本字嵌入特征、边界特征以及上下文特征以获得更好的NER性能,从而解决人工特征提取成本高和专业新词无法识别等问题。
-
公开(公告)号:CN114218380B
公开(公告)日:2022-07-29
申请号:CN202111471016.7
申请日:2021-12-03
Applicant: 淮阴工学院
IPC: G06F16/35 , G06V10/762 , G06K9/62 , G06V10/764 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/04
Abstract: 本发明公开了一种基于多模态的冷链配载用户画像标签抽取方法及装置,将带标签的文本集作为BERT模型的输入,并利用长短期记忆网络进一步提取特征;使用YOLO提取图片特征,将提取的双模态特征使用激活函数tanh与其他模态嵌入的关联表示进行补充,并将补充过后的双模态特征向量进行拼接,将其与双模态条件向量进行矩阵相乘,结果作为Softmax函数输入得到双模态交互注意力矩阵;将双模态交互注意力矩阵与被补充过的双模态特征拼接,将其作为全连接层的输入得到模态间交互特征和模态内部特征,最后输入至Softmax进行分类。本发明利用多模态特征融合算法对不同模态的用户特征合并融合,建立起不同模态间的交互关系,减少了抽取的噪声。
-
公开(公告)号:CN112101014B
公开(公告)日:2022-07-26
申请号:CN202010842606.5
申请日:2020-08-20
Applicant: 淮阴工学院
IPC: G06F40/284 , G06F40/289 , G06F40/117 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种混合特征融合的中文化工文献分词方法,首先构建化工科学文献语料库来训练中文分词任务;接着,利用BiLSTM和CNN提取并融合文档特征,结合边界特征构建条件随机场训练端到端中文分词模型;然后,开放模型接口,对用户输入文本进行分词;最后,通过ECharts渲染分词结果实现化工关键词可视化,系统接受用户反馈并进行处理。本发明将自然语言处理和深度学习方法应用于化工领域,通过特征融合提高对包含中英文专业词汇的化工中文文档分词效果,解决大量新词和中英文混合专业词汇给分词结果造成化工领域术语识别率低的问题。
-
公开(公告)号:CN114398485B
公开(公告)日:2023-04-18
申请号:CN202111648377.4
申请日:2021-12-29
Applicant: 淮阴工学院
IPC: G06F16/35 , G06F18/23213 , G06F18/2431 , G06F18/214 , G06N3/044 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了基于多视角融合的专家画像构建方法及装置。首先使用K‑means对专家数据集D1进行聚类及预处理后得到样本集D2,再将D2划分为多个样本子集,每个样本子集代表一种信息,分别选择BERT、BiGRU及CNN三种基分类器对样本集D2进行分类,得到不同的分类结果;接着,根据三种基分类器中的分类结果对基分类器赋权值,根据权值对分类器的分类结果使用加权投票法进行集成,计算出所有类别的总票数,根据实际需求选取分类结果;最后,获得模型最终的集成结果,使用词云图将分类结果可视化,进而构建专家画像。本发明提供了基于多视角融合的专家画像构建方法及装置,能够有效地融合不同分类的结果,解决专家画像建模中标签化建模不全面的问题。
-
公开(公告)号:CN114399250B
公开(公告)日:2023-04-07
申请号:CN202111660790.2
申请日:2021-12-30
Applicant: 淮阴工学院
IPC: G06Q10/0832 , G06F16/36 , G06F16/215 , G06F18/25 , G06F18/241 , G06N3/045
Abstract: 本发明公开了一种基于认知图谱的冷链多温混配选温方法及装置。该方法首先对货源信息的货物类型、货物体积、保存适宜温度、运输时间限制、路线和车源信息的可配载货物类型、剩余车厢体积大小、途径路线标签作标记处理和定义,得到标签空间以及标签集合;然后利用点互信息(PMI)和TF‑IDF分别基于冷链货源信息标签集合和冷链车源信息标签集合计算标签权重,构建货源(货物信息)关联图和车货源(货物与运输车信息)关联图;将车源与货源关联图输入图卷积神经网络(GCN),通过增加注意力机制对货源关联图的节点选择性增强,得出了关键特征表示,再通过Softmax分类选择温度。本发明普遍适用于匹配选择冷链物流中货源信息和车源信息,实现提高运载效率,减少了运输成本以及空车率。
-
公开(公告)号:CN114399250A
公开(公告)日:2022-04-26
申请号:CN202111660790.2
申请日:2021-12-30
Applicant: 淮阴工学院
IPC: G06Q10/08 , G06F16/36 , G06F16/215 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于认知图谱的冷链多温混配选温方法及装置。该方法首先对货源信息的货物类型、货物体积、保存适宜温度、运输时间限制、路线和车源信息的可配载货物类型、剩余车厢体积大小、途径路线标签作标记处理和定义,得到标签空间以及标签集合;然后利用点互信息(PMI)和TF‑IDF分别基于冷链货源信息标签集合和冷链车源信息标签集合计算标签权重,构建货源(货物信息)关联图和车货源(货物与运输车信息)关联图;将车源与货源关联图输入图卷积神经网络(GCN),通过增加注意力机制对货源关联图的节点选择性增强,得出了关键特征表示,再通过Softmax分类选择温度。本发明普遍适用于匹配选择冷链物流中货源信息和车源信息,实现提高运载效率,减少了运输成本以及空车率。
-
公开(公告)号:CN114218380A
公开(公告)日:2022-03-22
申请号:CN202111471016.7
申请日:2021-12-03
Applicant: 淮阴工学院
IPC: G06F16/35 , G06K9/62 , G06V10/762 , G06V10/764 , G06V10/80 , G06V10/774 , G06N3/04
Abstract: 本发明公开了一种基于多模态的冷链配载用户画像标签抽取方法及装置,将带标签的文本集作为BERT模型的输入,并利用长短期记忆网络进一步提取特征;使用YOLO提取图片特征,将提取的双模态特征使用激活函数tanh与其他模态嵌入的关联表示进行补充,并将补充过后的双模态特征向量进行拼接,将其与双模态条件向量进行矩阵相乘,结果作为Softmax函数输入得到双模态交互注意力矩阵;将双模态交互注意力矩阵与被补充过的双模态特征拼接,将其作为全连接层的输入得到模态间交互特征和模态内部特征,最后输入至Softmax进行分类。本发明利用多模态特征融合算法对不同模态的用户特征合并融合,建立起不同模态间的交互关系,减少了抽取的噪声。
-
公开(公告)号:CN112269909A
公开(公告)日:2021-01-26
申请号:CN202010964492.1
申请日:2020-09-15
Applicant: 淮阴工学院
IPC: G06F16/951 , G06F16/9535 , G06F40/216 , G06F40/258 , G06F40/30
Abstract: 发明公开了一种基于多源信息融合技术的专家推荐方法,包括:爬取技术专家科技论文、发明专利、基金项目信息和Web网页信息构建知识库,并根据知识库关键词字段构建关键词词典keywords;抽取知识库作者字段进行词频共现分析,构建专家合作关系子网;分别使用正则表达式和命名实体识别算法抽取Web页面专家研究方向与个人信息构建Web子网;分别通过lda算法对知识库摘要字段提取文档‑主题和主题‑关键词,TF‑IDF算法提取摘要字段权重最大的5个词共同构建主题子网;以专家姓名‑机构为约束条件结合三种子网构建并计算专家信息网络中专家中心度值,对专家中心度值排序并推荐排名前5的专家作为推荐结果。
-
-
-
-
-
-
-
-