-
公开(公告)号:CN106156082A
公开(公告)日:2016-11-23
申请号:CN201510150011.2
申请日:2015-03-31
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种本体对齐方法及装置,方法为,结合待对齐本体名称,待对齐本体的属性信息,待对齐本体的类别标签,分别计算待对齐本体与每一个候选本体之间的相似度;根据计算得到的相似度,获取每一个查找到的候选本体的综合评分;从所有综合评分中选取综合评分大于或等于预设综合评分阈值,且综合评分最高的候选本体;将待对齐本体与选取的候选本体进行对齐。采用本发明技术方案,在对本体进行对齐的过程中,除考虑本体名称之外,还综合考虑本体的属性信息和类别标签,避免了仅根据本体名称进行本体对齐所造成的对齐结果不准确的问题,保证了本体对齐的准确性,降低了本体对齐的错误率。
-
公开(公告)号:CN105528349B
公开(公告)日:2019-02-01
申请号:CN201410513189.4
申请日:2014-09-29
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G06F16/332
Abstract: 本发明实施例提供一种知识库中问句解析的方法,包括:接收用户输入的问句;对问句进行短语检测确定候选短语;将候选短语映射到知识库中的资源项;进一步确定观察谓词的值和可能的问句分析空间。对可能的问句分析空间中的每一个命题集合,根据观察谓词和隐含谓词的值进行不确定性推理计算置信度,并获取置信度满足预设条件的命题集合中的真命题的组合;根据所述真命题的组合,生成形式化查询语句。本发明实施例利用观察谓词和隐含谓词,进行不确定性推理,能够将自然语言问句转化为形式化查询语句。并且,不确定性推理的方法能够应用于任何领域的知识库,具有领域扩展性,这样无需针对知识库人工地配置转换规则。
-
公开(公告)号:CN105528349A
公开(公告)日:2016-04-27
申请号:CN201410513189.4
申请日:2014-09-29
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F17/30654 , G06F17/11 , G06F17/2755 , G06F17/2775 , G06F17/30401 , G06F17/3043 , G06F17/3053 , G06F17/30958 , G06N5/04 , G06N7/005 , G06N99/005
Abstract: 本发明实施例提供一种知识库中问句解析的方法,包括:接收用户输入的问句;对问句进行短语检测确定候选短语;将候选短语映射到知识库中的资源项;进一步确定观察谓词的值和可能的问句分析空间。对可能的问句分析空间中的每一个命题集合,根据观察谓词和隐含谓词的值进行不确定性推理计算置信度,并获取置信度满足预设条件的命题集合中的真命题的组合;根据所述真命题的组合,生成形式化查询语句。本发明实施例利用观察谓词和隐含谓词,进行不确定性推理,能够将自然语言问句转化为形式化查询语句。并且,不确定性推理的方法能够应用于任何领域的知识库,具有领域扩展性,这样无需针对知识库人工地配置转换规则。
-
公开(公告)号:CN106156082B
公开(公告)日:2019-09-20
申请号:CN201510150011.2
申请日:2015-03-31
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
Abstract: 本发明公开了一种本体对齐方法及装置,方法为,结合待对齐本体名称,待对齐本体的属性信息,待对齐本体的类别标签,分别计算待对齐本体与每一个候选本体之间的相似度;根据计算得到的相似度,获取每一个查找到的候选本体的综合评分;从所有综合评分中选取综合评分大于或等于预设综合评分阈值,且综合评分最高的候选本体;将待对齐本体与选取的候选本体进行对齐。采用本发明技术方案,在对本体进行对齐的过程中,除考虑本体名称之外,还综合考虑本体的属性信息和类别标签,避免了仅根据本体名称进行本体对齐所造成的对齐结果不准确的问题,保证了本体对齐的准确性,降低了本体对齐的错误率。
-
公开(公告)号:CN119917606A
公开(公告)日:2025-05-02
申请号:CN202411716751.3
申请日:2024-11-27
Applicant: 中国科学院自动化研究所 , 北京智源人工智能研究院
IPC: G06F16/3329 , G06F16/334 , G06F16/353 , G06F40/30 , G06N5/04 , G06N3/045 , G06N3/0895
Abstract: 本发明提供一种基于检索增强的大语言模型长文本回答方法及装置,方法包括:通过第一大语言模型对候选文本中文本片段生成提问样本,构建问答训练样本数据后通过对比学习训练第二大语言模型,得到文本检索器;从外部知识数据库中获取目标检索文本,根据预设的滑动窗口在目标检索文本上滑动,调用文本检索器对滑动窗口内文本进行基于因果注意力机制的特征提取,得到每个检索句子的检索语义特征;调用文本检索器对查询语义特征进行检索,得到召回知识文本,结合目标提问文本进行文本问答。通过本申请,克服在文本问答时需要对待检索文本进行分块检索,限制了检索增强有效召回,导致大语言模型根据检索证据进行文本回答时准确率低下的缺陷。
-
公开(公告)号:CN119378692B
公开(公告)日:2025-04-29
申请号:CN202411945230.5
申请日:2024-12-27
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06N3/045 , G06F40/20 , G06F40/295
Abstract: 本发明提供一种幻觉文本缓解方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:获取大语言模型生成的第一幻觉文本;通过基础修正器对所述第一幻觉文本进行修正,得到第二幻觉文本;通过评估器评估所述第二幻觉文本,得到文本评价信息和此次修正过程的质量评分;在所述质量评分超过预设阈值的情况下,将所述第二幻觉文本作为输出文本;在所述质量评分不超过所述预设阈值的情况下,基于所述文本评价信息,通过反思器确定缓解策略;根据所述缓解策略调整所述基础修正器的修正策略,并将所述第二幻觉文本重新输入调整后的所述基础修正器中。
-
公开(公告)号:CN119441453A
公开(公告)日:2025-02-14
申请号:CN202411285071.0
申请日:2024-09-13
Applicant: 中国科学院自动化研究所
IPC: G06F16/334 , G06F16/3329 , G06F40/16
Abstract: 本发明提供一种问答任务处理方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:获取问答任务的输入问题和问答实例;从所述问答实例中确定与所述输入问题相似度最高的目标实例,从预训练的低秩适配LORA模块库中确定与所述目标实例相似度最高的多个LORA模块;采用非梯度参数优化技术将所述多个LORA模块与第一问答模型进行融合处理,得到第二问答模型,并将所述输入问题输入所述第二问答模型得到对应回答。
-
公开(公告)号:CN119378692A
公开(公告)日:2025-01-28
申请号:CN202411945230.5
申请日:2024-12-27
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06N3/045 , G06F40/20 , G06F40/295
Abstract: 本发明提供一种幻觉文本缓解方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:获取大语言模型生成的第一幻觉文本;通过基础修正器对所述第一幻觉文本进行修正,得到第二幻觉文本;通过评估器评估所述第二幻觉文本,得到文本评价信息和此次修正过程的质量评分;在所述质量评分超过预设阈值的情况下,将所述第二幻觉文本作为输出文本;在所述质量评分不超过所述预设阈值的情况下,基于所述文本评价信息,通过反思器确定缓解策略;根据所述缓解策略调整所述基础修正器的修正策略,并将所述第二幻觉文本重新输入调整后的所述基础修正器中。
-
公开(公告)号:CN119358624A
公开(公告)日:2025-01-24
申请号:CN202411309928.8
申请日:2024-09-19
Applicant: 中国科学院自动化研究所
IPC: G06N3/082 , G06N3/0495 , G06N3/042 , G06N3/0499
Abstract: 本发明提供一种基于冲突注意力头剪枝的知识冲突消除方法以及装置,其中,上述方法包括:获取原始输入与干扰输入;基于原始输入运行目标语言模型,确定每个注意力头的原始激活状态;基于干扰输入运行目标语言模型,确定每个注意力头的干扰激活状态;分别将每个注意力头的原始激活状态替换为干扰激活状态,确定每个注意力头的输出变化量;进而确定每个注意力头的代理重要性分数;基于每个注意力头的代理重要性分数进行排序,将目标序号的注意力头作为冲突注意力头,其中,冲突注意力头为上下文头;对冲突注意力头进行注意力剪枝,以消除目标语言模型的知识冲突;通过本发明能够提高模型在处理内部记忆和外部上下文时的灵活性。
-
公开(公告)号:CN115309858B
公开(公告)日:2024-12-06
申请号:CN202210754115.4
申请日:2022-06-28
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06F40/216 , G06F40/237 , G06N3/045 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种算术表达式的生成方法、装置、设备、介质及产品,该方法包括:获取目标问题对应的表格和文本;表格和文本用于确定目标问题的算术表达式;基于表格、文本和目标问题,确定目标问题的异质图;基于图处理模型,确定异质图的目标嵌入矩阵;通过树解码器,对目标嵌入矩阵和预设符号字典进行处理,得到目标问题的算术表达式。本发明提供的算术表达式的生成方法、装置、设备、介质及产品用于提高算术表达式的准确率。
-
-
-
-
-
-
-
-
-