-
公开(公告)号:CN119201984A
公开(公告)日:2024-12-27
申请号:CN202411263035.4
申请日:2024-09-10
Applicant: 哈尔滨理工大学 , 哈尔滨工业大学 , 国网黑龙江省电力有限公司电力科学研究院
Inventor: 张宏国 , 赵天诚 , 马超 , 张罗刚 , 关志博 , 李双翼 , 黄海 , 于海宁 , 王孝余 , 尚方 , 刘生 , 史心月 , 宋杭选 , 袁泽 , 王莹莹 , 李丹丹 , 林扬
IPC: G06F16/2452 , G06F16/242 , G06F16/33
Abstract: 基于检索增强生成的电力领域SQL自动生成方法及系统,涉及数据处理技术领域。解决了为了解决传统的SQL自动生成方法数据处理的效率和准确性低的问题。本发明首先将用户输入的问题编码为向量,并在预先编码的向量知识库中匹配相似度排名最高的k个键和描述信息。再基于排名最高的k个键及键对应的描述信息生成指令信息,SQL生成模型根据指令信息生成精准的SQL查询语句。本发明主要应用于电力领域自然语言问题转化为SQL查询语句。
-
公开(公告)号:CN115148319A
公开(公告)日:2022-10-04
申请号:CN202210877630.1
申请日:2022-07-25
Applicant: 哈尔滨理工大学 , 黑龙江省网络空间研究中心
Abstract: 本发明提出一种多临床分期疾病的辅助分类方法、设备及存储介质,所述方法包括:确定病历数据集;提取其中的特征值和标签,组成特征值集合和标签集合;使用二分类模型对病历数据集进行二分类;对所述特征值集合进行关联度分析,得到优化后的特征值集合;对优化后的特征值集合进行筛选,得到关键特征值集合;在健康数据集中查找到特征值符合中确诊条件的病历数据,并将其加入到患病数据集中,构成新的患病数据集;对新的患病数据集进行多分类,得到对疾病不同分期的预测。本发明通过分类算法模型,对疾病分期预测,辅助医生进行疾病诊断。
-
公开(公告)号:CN115098887A
公开(公告)日:2022-09-23
申请号:CN202210921066.9
申请日:2022-08-02
Applicant: 哈尔滨理工大学 , 中数(深圳)时代科技有限公司
Abstract: 本发明提出一种用于数据价值优化的匿名化模型推荐方法、设备,包括:导入原始数据,根据原始数据的类型和级别,确定原始数据的风险阈值;根据用户需求,判断匿名化方法为正向辅助推荐或反向主动推荐;分别根据选择的匿名化方法匹配一组候选配置方案,并对原始数据进行匿名化处理;对匿名化处理后的数据进行风险分析,保留符合风险阈值的数据;再对数据进行效用分析,选择其中最大值对应的匿名后数据作为输出;并将结果加入历史配置方案资源池。本发明能够在保证数据安全的前提下,在对数据进行匿名化处理后使得数据价值最大化。
-
公开(公告)号:CN113220905A
公开(公告)日:2021-08-06
申请号:CN202110582984.9
申请日:2021-05-27
Applicant: 哈尔滨理工大学
IPC: G06F16/36 , G06F16/335 , G06F40/211 , G06F40/216 , G06F40/284 , G06F40/295
Abstract: 本发明提供一种融合知识图谱的服务推荐方法,包括:对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;通过TF‑IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
-
-
-