-
公开(公告)号:CN117763126A
公开(公告)日:2024-03-26
申请号:CN202410039037.9
申请日:2024-01-10
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/36 , G06F40/194 , G06F40/279 , G06F40/30
Abstract: 本发明属于人工智能技术领域,公开了一种知识检索方法、设备、存储介质及装置,本发明通过对预设知识库中的知识文档进行分割,获得多个知识片段;基于预设大语言模型对用户输入的问题信息进行答案解析,获得候选答案;基于预设BERT模型对所述问题信息、知识片段以及候选答案进行相似度分析,获得综合相似度;基于预设大语言模型以及综合相似度确定目标答案,本发明使用大语言模型将用户提问进行候选答案生成后,对问题、候选答案和知识片段进行综合相似度计算,可以更准确地衡量问题、答案和知识片段之间的相似度,从而筛选出最精准的目标答案。
-
公开(公告)号:CN118193698A
公开(公告)日:2024-06-14
申请号:CN202410329919.9
申请日:2024-03-21
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34 , G06Q30/015
Abstract: 本申请公开了一种信息处理方法、装置、设备、计算机存储介质及程序产品。该方法包括:获取第一问题;从向量数据库中查找与第一问题相关的n个第一文本块向量;再分别查找与每个第一文本块向量的语义相关度大于预设相关度的第二文本块向量,得到n个第一相关向量集合;通过去重处理,得到m个第二相关向量集合;根据预设标签长度阈值去除m个第二相关向量集合中的部分文本块向量,得到文本块向量总集合;对于其文本块向量进行组合,得到与第一问题对应的目标文本向量。根据本申请实施例,能够得到语义相对完整的文本块,提高语料信息语义的完整性,从而提高后续问答模型在应答问题时的准确性。
-
公开(公告)号:CN117609447A
公开(公告)日:2024-02-27
申请号:CN202311533288.4
申请日:2023-11-16
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/33 , G06F18/22
Abstract: 本申请公开了一种问答背景信息的生成方法、装置、设备及存储介质,涉及人工智能领域。该问答背景信息的生成方法包括:基于知识语料信息,生成多个问答对,问答对包括问题和问题对应的答案;针对每个问答对,分别计算问答对中问题与用户问题的相似度以及问答对中答案与用户问题的相似度,并根据相似度得到问答对的综合相似度;将多个问答对中答案相同的问答对划分为一组,得到多个分组,形成多个问答对集合;根据问答对集合中各个问答对的综合相似度,确定问答对集合中各问答对集合的集合相似度;从问答对集合中筛选集合相似度满足预设阈值的目标问答对集合,并将目标问答对集合中的问答对确定为用户问题的问答背景信息。
-
公开(公告)号:CN118153556A
公开(公告)日:2024-06-07
申请号:CN202410361675.2
申请日:2024-03-27
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/211 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种模型上下文长度扩充方法、装置、设备、存储介质及计算机程序产品。该方法包括:基于缩放因子通过优化大语言模型的位置编码函数扩充所述大语言模型的上下文长度,获得优化后大语言模型;根据测试数据集确定所述优化后大语言模型对应的困惑度;基于所述困惑度和所述缩放因子从所述优化后大语言模型中选择目标大语言模型。由于本发明是通过缩放因子优化大语言模型的位置编码函数,得到优化后大语言模型,再通过优化后大语言模型对应的困惑度选择目标大语言模型。相对于现有的使用更长的训练数据去微调大语言模型来扩展大语言模型的上下文窗口的方式,本发明上述方式能够提高大语言模型上下文长度扩充效率。
-
公开(公告)号:CN115410065A
公开(公告)日:2022-11-29
申请号:CN202110585921.9
申请日:2021-05-27
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明提供一种图像描述方法、装置、电子设备及存储介质,采用的图像描述模型基于Transformer模型构建,替代传统的循环神经网络模型,可以提高目标图像的描述文本的可读性。而且,通过通用中文语料库进行第一阶段训练以及通过图像描述语料库进行第二阶段训练得到图像描述模型,不仅可以使图像描述模型得到的描述文本更加流畅通顺,还可以减少图像描述模型在训练过程中对训练样本的数量的需求,降低图像描述模型的训练成本以及人工成本。
-
公开(公告)号:CN114579101A
公开(公告)日:2022-06-03
申请号:CN202011382265.4
申请日:2020-12-01
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供了一种业务流程处理方法、装置、设备及存储介质。该方法包括:获取用户发起的目标业务的流转请求;根据流转请求从预先构建的节点条目表中获取目标业务所处的目标节点的流转条件,解析出所需要的业务数据字段;向流程取数模块发送携带有业务数据字段的取数请求,以使取数模块通过反射机制获取业务数据字段对应的字段值,并根据业务数据字段和字段值生成键值对;接收取数模块返回的键值对;根据键值对和目标业务的各分支流转条件,确定目标业务流转的下一分支节点;控制目标业务流转到下一分支节点。根据本申请实施例技术方案,实现了流转处理逻辑的统一化,配置化,大幅提升了流程引擎的通用性与便利性,节省了开发工作量。
-
-
-
-
-