-
公开(公告)号:CN119314189A
公开(公告)日:2025-01-14
申请号:CN202411357589.0
申请日:2024-09-27
Applicant: 国网山东省电力公司德州供电公司 , 北京邮电大学
IPC: G06V30/41 , G06V30/414 , G06V30/42 , G06V30/19 , G06V30/146 , G06N5/025 , G06N5/04
Abstract: 本发明提供一种基于大模型的生成式视觉文档零样本信息抽取方法,包括六个单元架构:数据预处理、多模态特征提取任务、基于大语言模型的布局增强任务、特征融合任务、适配器预训练任务以及基于大语言模型的信息抽取任务;本发明进行特征的融合和处理,以供大语言模型执行信息抽取任务;通过文本区域预测任务和坐标映射文本恢复任务进行训练,以增强特征处理能力;充分利用视觉文档的各方面特征和大语言模型理解能力,提升文档信息抽取的准确性,无需预定义实体类别的文档信息抽取,从而快速扩展供应链语义词典的业务范围,并显著提高信息处理的灵活性与效率,适合推广应用。
-
公开(公告)号:CN118113832A
公开(公告)日:2024-05-31
申请号:CN202410174038.4
申请日:2024-02-07
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/31 , G06F16/35 , G06N5/04 , G06N5/022 , G06F40/35 , G06F40/216
Abstract: 本发明公开了一种融合大语言模型和领域知识的问答系统构建方法,通过引入大语言模型和领域知识提取技术,实现领域知识库的自动构建以及可靠答案的准确生成,解决了领域问答系统数据成本高昂、知识构建复杂和生成效果难以保证等问题,整体展现出零人工标注、跨领域适用、自适应性知识库构建、智能匹配与高效生成等优势,显著提升领域知识获取、理解和利用的效率,适用于构建多类端到端自适应性领域问答系统。
-