-
公开(公告)号:CN117131181B
公开(公告)日:2024-04-05
申请号:CN202311376793.2
申请日:2023-10-24
Applicant: 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网思极数字科技(北京)有限公司
Inventor: 郑蓉蓉 , 薛文婷 , 王晨辉 , 曾京文 , 于霄洋 , 杨林傲 , 武志栋 , 罗大勇 , 张韬 , 刘亚庆 , 殷红涛 , 刘孟奇 , 夏昂 , 肖磊 , 袁韶祖 , 祝天刚
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/157 , G06F40/18
Abstract: 本发明提供了一种异构知识问答模型的构建方法、信息提取方法及系统,包括:对异构知识中的表格信息进行文本转换处理,得到文本化表述的表格信息;利用文本化表述的表格信息对生成式模型进行SQL隐式训练,得到能感知和理解表格的生成式模型;采用追一数据集对能感知和理解表格的生成式模型进行问答训练,得到含表格信息的异构知识问答模型。本发明对表格信息进行表格SQL隐式训练,提高了对表格的理解能力,克服异构数据汇总表格不满足预训练需求的问题。而且本发明采用追一数据集对所述能感知和理解表格的生成式模型进行问答训练,使得生成的异构知识问答模型具备了可以直接从表格信息中提取有用信息的功能。
-
公开(公告)号:CN117114103A
公开(公告)日:2023-11-24
申请号:CN202311360974.6
申请日:2023-10-20
Applicant: 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网思极数字科技(北京)有限公司
Inventor: 郑蓉蓉 , 薛文婷 , 王晨辉 , 曾京文 , 于霄洋 , 杨林傲 , 武志栋 , 罗大勇 , 张韬 , 刘亚庆 , 殷红涛 , 张哲宁 , 魏家辉 , 曹津平 , 袁韶祖 , 祝天刚
IPC: G06N5/022 , G06N3/08 , G06F18/214 , G06F18/24 , G06N3/0464 , G06N3/042 , G06N3/045
Abstract: 本发明涉及人工智能技术领域,具体提供了一种语料库的重构方法及装置,包括:利用预先训练的预测模型对语料库中的样本数据进行预测,得到预测结果;基于所述预测结果确定所述语料库对应的混淆矩阵;基于所述混淆矩阵确定语料库中各知识库名称之间的混淆度;基于所述语料库中各知识库名称之间的混淆度对所述语料库中各知识库名称对应的样本数据进行合并。本发明提供的技术方案能够自动判别技术对知识库进行重构和优化,保证了语料的可靠性,同时可以对未知语料进行知识判别,扩充已有知识库。
-
公开(公告)号:CN117131181A
公开(公告)日:2023-11-28
申请号:CN202311376793.2
申请日:2023-10-24
Applicant: 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网思极数字科技(北京)有限公司
Inventor: 郑蓉蓉 , 薛文婷 , 王晨辉 , 曾京文 , 于霄洋 , 杨林傲 , 武志栋 , 罗大勇 , 张韬 , 刘亚庆 , 殷红涛 , 刘孟奇 , 夏昂 , 肖磊 , 袁韶祖 , 祝天刚
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/157 , G06F40/18
Abstract: 本发明提供了一种异构知识问答模型的构建方法、信息提取方法及系统,包括:对异构知识中的表格信息进行文本转换处理,得到文本化表述的表格信息;利用文本化表述的表格信息对生成式模型进行SQL隐式训练,得到能感知和理解表格的生成式模型;采用追一数据集对能感知和理解表格的生成式模型进行问答训练,得到含表格信息的异构知识问答模型。本发明对表格信息进行表格SQL隐式训练,提高了对表格的理解能力,克服异构数据汇总表格不满足预训练需求的问题。而且本发明采用追一数据集对所述能感知和理解表格的生成式模型进行问答训练,使得生成的异构知识问答模型具备了可以直接从表格信息中提取有用信息的功能。
-
公开(公告)号:CN118864888A
公开(公告)日:2024-10-29
申请号:CN202410856506.6
申请日:2024-06-28
Applicant: 国家电网有限公司信息通信分公司 , 京东科技信息技术有限公司 , 国网思极数字科技(北京)有限公司
IPC: G06V10/70 , G06V10/44 , G06F16/583 , G06F40/258 , G06F40/216 , G06F40/284 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/092
Abstract: 一种图像标题生成方法、系统、设备及介质,包括:基于待生成标题的图像利用卷积神经网络提取图像特征并进行平均池化处理,得到平均池化图像特征集;基于平均池化图像特征集按照时间步顺序依次利用预先构建的时序回顾视觉保留模型进行计算,得到各单词并生成标题;利用注意力波动监督模型对所述标题进行优化,得到优化后的图像标题;本申请提出的时序回顾视觉保留模型考虑了之前所有时刻的可视化上下文,解决了背离人的注意力机制这一问题;注意力波动监督模型增强了视觉信息在强化学习中的影响,能够在计算强化学习奖励时考虑到图片的特征。
-
公开(公告)号:CN113869067A
公开(公告)日:2021-12-31
申请号:CN202111111415.2
申请日:2021-09-23
Applicant: 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 河南九域腾龙信息工程有限公司
Inventor: 王晨辉 , 薛文婷 , 郑蓉蓉 , 曾诣佳 , 朱京 , 冯显时 , 邹晓颖 , 李雅西 , 李枫 , 武志栋 , 刘娇丽 , 闫瑜 , 王蕊 , 韩笑 , 罗大勇 , 杜加文 , 蒋炜 , 郑思远 , 张大伟 , 李伟华 , 彭苒
IPC: G06F40/35 , G06F16/332 , G06F16/35 , G06F40/205 , G06F40/216 , G06F40/279
Abstract: 本申请提供的一种基于智能客服业务的应答响应方法及系统,将前端客服交互设备实时接收到的当前互动咨询请求输入至事先配置得到的交互内容解析线程中进行解析,得到交互内容解析结果。根据交互内容解析结果中的每个关键内容属性的标签划定出当前互动咨询请求中的交互内容描述事项,将当前互动咨询请求的交互内容描述事项与当前互动咨询请求的历史互动咨询请求的交互内容描述事项进行比较,确定当前互动咨询请求的目标描述事项。如此,后端应答处理设备根据确定出的目标描述事项可对互动咨询请求进行精确地交互内容识别,并有效地结合历史互动咨询请求进行比较,以便能够提高对用户意图精确地理解,从而改善能客服业务的应答响应不完整的问题。
-
公开(公告)号:CN115358774A
公开(公告)日:2022-11-18
申请号:CN202210974456.2
申请日:2022-08-15
Applicant: 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 河南九域腾龙信息工程有限公司
Inventor: 于霄洋 , 郑蓉蓉 , 王晨辉 , 薛文婷 , 武志栋 , 曾诣佳 , 朱京 , 冯显时 , 李雅西 , 李枫 , 刘娇丽 , 闫瑜 , 王蕊 , 邹晓颖 , 许大卫 , 罗大勇 , 杜加文 , 张伟 , 蒋一凡 , 彭苒 , 宫晓峰
IPC: G06Q30/02 , G06F16/23 , G06F16/33 , G06F16/332 , G06F40/289 , G06F40/30 , G10L15/01 , G10L15/06 , G10L15/18 , G10L15/22 , G10L25/51 , G06Q10/04 , G06Q10/06 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种智慧客服机器人数据处理方法及系统,包括计算智慧客服机器人语音识别单字准确率A、语义识别准确率N、整体业务准确率P、问题解决率S和机器人独立接待占比P和其他机器人基础指标数值,建立智慧客服机器人的服务质量总体性指标AN‑PSR;用户根据基础数据设置自定义指标;根据设定AN‑PSR指标阈值或自定义指标阈值及智慧客服机器人指标数值,对智慧客服机器人的性能进行评价,生成优化策略;系统包括机器人关键指标获取模块、机器人优化建议模块和机器人自定义指标获取模块。设定了智能客服总体性服务质量评价指标,根据指标提出优化指标的方法。提出机器自动化更新数据库、知识库,完成智能智慧客服机器人的优化迭代。
-
公开(公告)号:CN118885318A
公开(公告)日:2024-11-01
申请号:CN202410749172.2
申请日:2024-06-11
Applicant: 国家电网有限公司信息通信分公司 , 石家庄远捷信息技术有限责任公司
Abstract: 本申请公开了一种一致性检测方法、系统、设备及介质,通过获取本地文件列表中各个文件对应的目标文档元素,以及服务器文件列表中各个文件对应的目标文档元素,根据目标文档元素,判断所述本地文件列表与所述服务器文件列表是否一致,响应于判断结果表征所述本地文件列表与所述服务器文件列表不一致,基于所述服务器文件列表中的文件对所述本地文件列表中的文件进行调整,直至所述本地文件列表与所述服务器文件列表一致。当检测到本地文件列表与服务器文件列表不一致时,自动化工具可以自动进行必要的调整,如更新、删除或添加文件,以确保两个列表的一致性。减少了人工干预的需要,提高了同步的效率和准确性。
-
公开(公告)号:CN118708403A
公开(公告)日:2024-09-27
申请号:CN202410749187.9
申请日:2024-06-11
Applicant: 国家电网有限公司信息通信分公司 , 石家庄远捷信息技术有限责任公司
Abstract: 本申请公开了一种文件备份方法、系统及设备,通过获取目标文件夹内的变化信息,并将所述变化信息存储至待备份文件;响应于所述待备份文件符合备份启动条件,基于服务器CPU使用率,和/或,内存使用率,确定目标线程模式,所述目标线程模式用于指示服务器基于预设数量线程,对所述待备份文件中的变化信息进行打包;将打包得到的子文件合并,得到增量备份文件。在备份启动前,系统根据CPU使用率和内存使用情况来动态确定线程模式。在服务器资源充裕时,可以启用更多线程并行处理,加速备份过程;而当资源紧张时,减少线程数量,避免备份任务过度占用资源。既保证了数据备份的及时性和完整性,又最大限度地维护了服务器的正常运行效率。
-
公开(公告)号:CN118779507B
公开(公告)日:2025-02-11
申请号:CN202410916307.X
申请日:2024-07-09
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/9532 , G06F16/958 , G06F40/186 , G06F40/247 , G06F40/30
Abstract: 本申请提供一种面向专家画像的信息追踪方法及装置,方法包括:基于专家信息库中的目标专家的基础专家数据以及该目标专家的简历数据,采用大语言模型获取针对简历数据的缺失信息查询式;应用缺失信息查询式在网络中查找缺失信息关联网页并识别得到目标网页文本数据;对目标网页文本数据和文档数据进行针对用于表示缺失信息的缺失数据的提取、汇总和验证,并验证新增专家属性描述短语及其的语义信息,再基于专家评审规则确定新增专家属性描述短语的标签等级。本申请能够提高面向专家画像的信息追踪的全面性及准确性;并能够提高面向专家画像的信息追踪的效率、准确性以及可靠性,进而能够提高专家画像更新或构建的实时性、准确性及全面性。
-
公开(公告)号:CN119025668A
公开(公告)日:2024-11-26
申请号:CN202411109959.9
申请日:2024-08-13
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/335 , G06F16/31 , G06F16/33 , G06N3/0455
Abstract: 本申请公开了一种基于研究方向的实体匹配方法、装置、设备以及存储介质。该方法包括:获取待匹配研究方向词;采用2GRAM模型分别对待匹配研究方向词和学术主题词库中学术主题词进行切分处理,得到待匹配研究方向词对应的第一双对序列和学术主题词各自对应的第二双字对序列;将每个第二双字对序列分别与第一双对序列进行相似度比对以从学术主题词库中确定多个待匹配学术主题词;采用BERT模型依次对待匹配研究方向词与待匹配学术主题词进行文本向量化处理,并计算得到的待匹配学术主题向量与待匹配研究方向向量的相似度,确定出一个待匹配学术主题词作为目标学术主题词。本申请的方法提高了研究方向实体匹配的效率。
-
-
-
-
-
-
-
-
-