-
公开(公告)号:CN118939741A
公开(公告)日:2024-11-12
申请号:CN202411406533.X
申请日:2024-10-10
Applicant: 浙江华东工程数字技术有限公司 , 中国电建集团华东勘测设计研究院有限公司
IPC: G06F16/28 , G06Q10/0633 , G06Q50/08
Abstract: 本发明的工程合同流程图抽取方法,从用户输入的合同中自动抽取流程图。具体包括对用户输入的合同文本进行预处理,得到文本段集合;定义实体节点,构建实体对以及设计实体对关系抽取的提示词;以合同的项目类型、待抽取流程图对应的条款类别以及实体对为索引从样本标注数据集中进行匹配,得到样本条款,对文本段进行匹配,得到目标文本段;将实体节点、实体对关系抽取的提示词、抽取案例以及目标文本段构建总体提示词输入大语言模型,得到抽取结果。本发明提供的方法替代了合同审查阶段人工阅读、抽取、知识管理的大量人力成本,提升了合同流程管理的效率和精度;同时避免了现有方法中需要人工定义大量规则的步骤,具有更高的灵活性和泛化性。
-
公开(公告)号:CN119128182A
公开(公告)日:2024-12-13
申请号:CN202411039710.5
申请日:2024-07-31
Applicant: 中国电建集团华东勘测设计研究院有限公司
IPC: G06F16/38 , G06F18/22 , G06F18/25 , G06F40/284
Abstract: 本发明涉及检索技术领域,公开了一种基于大语言模型的法律条款向量检索方法,具体按以下步骤执行:首先对输入的合同文档进行处理,将合同分割成多个章节;每个章节进一步根据规则细分为段落;进行加权平均处理,确定最终章节,其中非表格的自然章节根据标题特征进行划分,表格按照表头信息进行按行划分成独立的章节,将每个分割后的章节单独保存,形成多个独立的文本块;其中对于自然段落直接划分为段落,对于列举式需要整体作为一个整体的段落,选择式只将选择式的标题与相应被选中的选项作为一个整体的段落。本发明简洁且效率高,摒弃与风险描述无关信息的影响,可以有效避免合同文本过长,内容过于复杂对于大模型向量检索效果的负面影响。
-
公开(公告)号:CN118916463A
公开(公告)日:2024-11-08
申请号:CN202411039747.8
申请日:2024-07-31
Applicant: 中国电建集团华东勘测设计研究院有限公司
IPC: G06F16/332 , G06F18/22 , G06N20/00
Abstract: 本发明涉及信息检索技术领域,公开了一种合同问答精准定位条款的方法,首先将合同的内容根据标题划分为多个章节,对于提出的第一轮问题,直接结合通过关键字语义检索,进行至少一轮筛选,对提出的问题进行回答;在上述步骤的回答的内容中查找是否需要借助其他不在已经给出的章节中的章节,若需要,则找到被引用的章节并以一个多轮对话的方式将引用章节加入;将上述步骤中得到的章节分成更小的粒度块,并通过向量相似度查找模型分别计算这些块与大模型最终答案、相似条款以及用户输入的问题的相似度并进行汇总,保留最终相似度较高的块,并将其一一进行编号。本发明通过高效的信息检索和处理能力,为用户提供更加精准和深入的解答服务。
-
-