一种基于大语言模型的法律条款向量检索方法

    公开(公告)号:CN119128182A

    公开(公告)日:2024-12-13

    申请号:CN202411039710.5

    申请日:2024-07-31

    Abstract: 本发明涉及检索技术领域,公开了一种基于大语言模型的法律条款向量检索方法,具体按以下步骤执行:首先对输入的合同文档进行处理,将合同分割成多个章节;每个章节进一步根据规则细分为段落;进行加权平均处理,确定最终章节,其中非表格的自然章节根据标题特征进行划分,表格按照表头信息进行按行划分成独立的章节,将每个分割后的章节单独保存,形成多个独立的文本块;其中对于自然段落直接划分为段落,对于列举式需要整体作为一个整体的段落,选择式只将选择式的标题与相应被选中的选项作为一个整体的段落。本发明简洁且效率高,摒弃与风险描述无关信息的影响,可以有效避免合同文本过长,内容过于复杂对于大模型向量检索效果的负面影响。

    一种合同问答精准定位条款的方法

    公开(公告)号:CN118916463A

    公开(公告)日:2024-11-08

    申请号:CN202411039747.8

    申请日:2024-07-31

    Abstract: 本发明涉及信息检索技术领域,公开了一种合同问答精准定位条款的方法,首先将合同的内容根据标题划分为多个章节,对于提出的第一轮问题,直接结合通过关键字语义检索,进行至少一轮筛选,对提出的问题进行回答;在上述步骤的回答的内容中查找是否需要借助其他不在已经给出的章节中的章节,若需要,则找到被引用的章节并以一个多轮对话的方式将引用章节加入;将上述步骤中得到的章节分成更小的粒度块,并通过向量相似度查找模型分别计算这些块与大模型最终答案、相似条款以及用户输入的问题的相似度并进行汇总,保留最终相似度较高的块,并将其一一进行编号。本发明通过高效的信息检索和处理能力,为用户提供更加精准和深入的解答服务。

Patent Agency Ranking