相似文本的确定方法、类案检索模型的训练方法及装置

    公开(公告)号:CN119848233A

    公开(公告)日:2025-04-18

    申请号:CN202510013687.0

    申请日:2025-01-03

    Abstract: 本申请涉及计算机技术领域,公开了一种相似文本的确定方法、类案检索模型的训练方法及装置,该方法包括:获取预设文本和用户输入的第一提问文本;确定预设文本对应的整体语义特征和字词语义特征;基于整体语义特征确定预设文本对应的核心语义特征,并基于字词语义特征确定预设文本对应的标签信息;基于预设文本对应的整体语义特征、核心语义特征和标签信息,确定第一提问文本与预设文本之间的相似度;在预设文本与第一提问文本之间的相似度大于预设相似度阈值的情况下,将预设文本确定为与第一提问文本相似的目标预设文本。本申请能够针对用户输入的第一提问文本确定出与其相类似的目标预设文本,并提高文本相似度匹配的准确度。

    一种问答知识库及其建立方法、智能问答方法和系统

    公开(公告)号:CN119848231A

    公开(公告)日:2025-04-18

    申请号:CN202411907913.1

    申请日:2024-12-24

    Abstract: 本发明涉及一种问答知识库及其建立方法、智能问答方法和系统,包括源数据采集单元,用于采集计算机系统中的数据并标记为源数据;特征提取与分类单元,提取源数据的文本语义结构、关键词类型和信息格式等特征数据以对源数据进行分类,得到区别数据QB并标识,且能对区别数据QB中的关联数据进行分析生成预处理数据Yc。具体涉及问答知识库技术领域,本发明通过源数据处理模块,能够精准地提取源数据的文本语义结构、关键词类型和信息格式等特征数据,从而实现对源数据的有效分类,得到区别数据QB并进行标识。这有助于快速定位和筛选与问答相关的数据,提高数据处理的效率和准确性,为后续的问答知识构建奠定坚实基础。

    基于心智认知机理的个性化记忆辅助交互方法

    公开(公告)号:CN119848217A

    公开(公告)日:2025-04-18

    申请号:CN202510167056.4

    申请日:2025-02-14

    Abstract: 本申请公开了一种基于心智认知机理的个性化记忆辅助交互方法,具体涉及智能体交互的领域。包括:确定输入文本的欲望类型和个人角色摘要,并将欲望类型和个人角色摘要作为语义记忆;将当前输入文本作为情景记忆,在当前的对话日期结束时,对该对话日期内的所有输入文本进行总结,得到日常事件摘要,将日常事件摘要作为抽象记忆;根据当前的输入文本在记忆库进行相似性检索,得到相关的历史语义记忆、历史情景记忆、历史抽象记忆,将上述检索结果作为工作记忆;根据工作记忆生成响应文本,进行交互。能够深刻理解和记忆用户的角色与个性特征,有利于生成个性化的响应,以及能有效关联历史对话。

    一种基于信息检索和大语言模型驱动的机器遗忘学习方法

    公开(公告)号:CN119848214A

    公开(公告)日:2025-04-18

    申请号:CN202510071938.0

    申请日:2025-01-16

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于信息检索和大语言模型驱动的机器遗忘学习方法,用于在法律领域中对知识丰富的大语言模型进行遗忘学习。对于给定的用户查询,重新定义了遗忘学习任务,采取不改动模型参数的方式,通过为模型添加禁止访问遗忘集的权限,从而使模型拒绝回答有关遗忘集的信息,达到遗忘学习目标。首先通过混合检索机制将用户查询在遗忘集语料中执行信息检索。然后基于本发明设计的重排序器,将检索出的段落按照相关性重新排序。接着将最相关的前n个段落输入到基于大语言模型的校验器中进行校验,进一步明确用户查询是否涉及遗忘集的信息。本发明方法在遗忘学习任务上具有较高的整体性能,能够在实现精准可靠的遗忘学习的同时,兼顾效率与成本。

    一种基于问题特征的企业管理咨询客服分配方法

    公开(公告)号:CN119848206A

    公开(公告)日:2025-04-18

    申请号:CN202411958551.9

    申请日:2024-12-29

    Inventor: 苑晓铭 张博熙

    Abstract: 本发明涉及企业管理咨询技术领域。本发明涉及一种基于问题特征的企业管理咨询客服分配方法。其包括以下步骤:S1、收集客服的历史问题解决记录,并结合历史问题解决记录构建企业管理知识图谱,同时对每个客服的负责领域进行设定;S2、根据历史问题解决记录进行问题解决质量分析,获取问题解决记录的解决质量,同时对高解决质量的问题解决记录进行问题特征以及对应的回复话语保留;本发明通过实时收集客户问题数据,并结合企业管理知识图谱进行问题领域分析,能够快速、精准地确定问题所属领域,如识别出是供应链问题、营销推广问题还是产品售后问题等,再依据问题特征复杂难度动态设置相似阈值,与历史问题解决记录精准匹配。

    对话流程处理方法、装置、设备、介质及程序产品

    公开(公告)号:CN119848203A

    公开(公告)日:2025-04-18

    申请号:CN202411941921.8

    申请日:2024-12-25

    Inventor: 漆春海

    Abstract: 本公开提供一种对话流程处理方法、装置、设备、介质及程序产品。对话流程处理方法包括:响应于第一节点选择指令,在画布中显示被选取的多个第一流程节点,其中,所述多个第一流程节点包括用于调用知识库的知识库节点和用于调用语言模型的模型节点中的至少一者;响应于第一节点连接指令,在所述画布中显示所述多个第一流程节点的连接关系;根据所述多个第一流程节点的连接关系,生成对话流程;响应于接收到第一对话信息,基于所述对话流程生成所述第一对话信息的回复信息。本公开简化了对话流程的开发过程,提高了对话过程中生成的回复信息的准确性。

    信息检索方法和装置
    87.
    发明公开

    公开(公告)号:CN119848201A

    公开(公告)日:2025-04-18

    申请号:CN202411934990.6

    申请日:2024-12-25

    Abstract: 本申请一个或多个实施例提供一种信息检索方法和装置,该方法包括:获取用于触发信息检索的查询文本,并针对查询文本进行命名实体识别,以从查询文本中识别出实体词作为检索实体词;基于图,计算各个候选实体词相对于检索实体词的关联度;其中,图中的各个节点代表各个候选实体词,图中的各条边连接的节点代表的候选实体词存在关联关系;将相对于检索实体词的关联度最高的预设数量的候选实体词确定为关联实体词,并根据关联实体词相对于检索实体词的关联度,计算各个候选文档相对于查询文本的关联度;将相对于查询文本的关联度最高的预设数量的候选文档确定为关联文档,并将关联文档确定为与查询文本对应的信息检索结果。

    一种基于停留帧的视频文本敏感信息检查方法、系统、设备以及介质

    公开(公告)号:CN119848195A

    公开(公告)日:2025-04-18

    申请号:CN202411907342.1

    申请日:2024-12-24

    Abstract: 本发明涉及一种基于停留帧的视频文本敏感信息检查方法、系统、设备以及介质,其中,方法包括:从视频数据中连续提取帧序列,并对帧序列中每一帧进行关键点的检测和描述,以生成特征向量;通过比较相邻帧之间特征向量的相似性,得到相邻帧的匹配特征点对,并基于相邻帧的匹配特征点对间的动态行为识别并提取出停留帧;采用Paddle OCR深度学习模型对停留帧进行文本识别,获得视频中内嵌的文本内容;通过对文本内容进行相似度计算以排除重复文本,并对非重复文本进行敏感信息匹配和标记。由此,本发明通过深入理解视频数据和精准提取文本信息,解决了传统信息安全手段在应对高分辨率摄像设备非法拍摄敏感信息泄露方面的不足。

    一种基于立体网络的关系抽取算法

    公开(公告)号:CN119848184A

    公开(公告)日:2025-04-18

    申请号:CN202411195270.2

    申请日:2024-08-29

    Abstract: 本发明公开了一种基于立体网络的关系抽取算法。本发明包括以下步骤:首先利用预训练语言模型作为文本编码器对输入文本进行编码;其次,设计一个立体网络作为实体对抽取器,用于计算头尾立方体中每个元素作为头尾实体对的概率,通过与预定义的阈值进行比较,获取一组候选头尾实体对;接着,在三元组立方体的所有关系矩阵中标记每个头尾实体对,基于共享文本编码器获得每个候选头尾实体对的上下文表示;最后,设计另一个新的立体网络作为三元组抽取器,用于确定每个头尾实体对之间的关系,获取最终的三元组结果。本发明适用于关系抽取任务,通过设计一种联合实体和关系抽取的新型立体网络框架,显著提高模型三元组抽取的精度。

Patent Agency Ranking