-
公开(公告)号:CN116186092A
公开(公告)日:2023-05-30
申请号:CN202310242329.8
申请日:2023-03-14
Applicant: 哈尔滨工业大学
IPC: G06F16/2455 , G06F16/2453 , G06F16/901 , G06F16/172 , G06F16/182 , G06F40/253
Abstract: 基于Hadoop的知识图谱关系表存储的缓存方法及系统,涉及数据库技术领域,针对现有技术中把热点查询涉及到的连接结果,或连接中间结果,以物化视图的方式存储在额外的表中,导致多表连接的响应速度慢的问题,本申请提出了一种缓存式框架,利用Hadoop的高效并行处理能力,将连接结果或中间结果缓存在文件系统中,降低数据库的处理和维护压力,从而加速多表连接的响应速度。本申请将属性表的查询执行结果或中间结果以文件块的方式缓存在HDFS文件系统中,这样避免了直接将结果以物化视图的方式存储在数据库中,降低了数据库存储负担,并且利用了Hadoop的并行处理能力,降低了属性表的连接负担,进而加速多表连接的响应速度。
-
公开(公告)号:CN115330840A
公开(公告)日:2022-11-11
申请号:CN202211029647.8
申请日:2022-08-25
Applicant: 哈尔滨工业大学
Abstract: 基于轨迹异常检测的轨迹预测方法及系统,具体涉及一种基于轨迹预测模型和轨迹异常检测模型的轨迹预测方法及系统,为解决由于轨迹预测模型缺少合理高效的训练方法和无监督的模型在线评估方法,导致预测的轨迹可信度低,准确率不高的问题,合并获取的轨迹预测模型和轨迹异常检测模型的搜索空间;根据搜索空间用自动机器学习技术构建TP异常检测模型;获取行人轨迹预测信息及对应的预测轨迹,再用TP异常检测模型训练轨迹预测模型,得到轨迹预测模型;将待预测轨迹的行人轨迹预测信息输入轨迹预测模型,得到多条轨迹预测结果,用TP异常检测模型计算每条轨迹预测结果的异常分数,将最小异常分数的预测轨迹作为轨迹预测模型的输出。
-
公开(公告)号:CN114218287B
公开(公告)日:2022-11-04
申请号:CN202111662253.1
申请日:2021-12-30
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
IPC: G06F16/2455 , G06F16/2458 , G06F16/28 , G06K9/62
Abstract: 一种面向时序数据库的查询时间预测方法,涉及计算机技术领域,针对现有技术中查询时间预测速度慢的问题,包括:步骤一:读取时序数据;步骤二:将时序数据写入CnosDB,CnosDB使用CnoSQL查询语句对时序数据进行查询检索,并记录查询时间;步骤三:将查询语句编码为向量化数据;步骤四:对向量化数据提取数据分布特征;步骤五:使用PCA对数据分布特征进行降维;步骤六:利用向量化数据和降维后的数据分布特征作为输入,查询时间作为输出,训练梯度提升回归树模型;步骤七:利用训练好的梯度提升回归树模型进行查询时间预测。本申请在预测时间上,在上述实验中本模型都能在几十毫秒内给出预测结果,具有非常可观的响应速度。
-
公开(公告)号:CN115081549A
公开(公告)日:2022-09-20
申请号:CN202210879802.9
申请日:2022-07-25
Applicant: 哈尔滨工业大学
IPC: G06K9/62
Abstract: 一种基于自适应随机卷积的时间序列分类方法,具体涉及一种基于自适应随机卷积的工业传感器的监控时间序列分类方法,解决工业传感器的监控时间序列分类方法在对工业传感器是否发生故障分类时准确率较低的问题,先采集若干个时间序列进行类别标注,将若干个已标注类别的时间序列作为样本数据,并进行预处理;构建随机卷积操作,根据预处理的样本数据利用贝叶斯优化搜索所述随机卷积操作的最优超参数,得到最佳的随机卷积操作;利用最佳的卷积操作对待分类的时间序列进行卷积,得到待分类的时间序列的特征,将待分类的时间序列的特征输入线性分类器,输出时间序列分类结果的准确率,得到时间序列分类结果。属于数据挖掘技术领域。
-
公开(公告)号:CN114897181A
公开(公告)日:2022-08-12
申请号:CN202210499772.9
申请日:2022-05-09
Applicant: 哈尔滨工业大学
Abstract: 一种基于因果关系的元学习解释方法,涉及机器学习技术领域,本申请将元学习可解释性归纳为元学习过程的可解释性以及元学习结果在具体问题中的可解释性两方面,并且分别从两方面实现了元学习的可解释性。元学习过程的可解释技术构建的推荐网络能够根据问题的元描述自动推荐一个合适的决策方法,并且结合积分梯度实现推荐网络的可解释,能够显式地为用户提供问题描述与决策方法选择上的直接关系。元学习结果在具体问题中的可解释技术结合因果关系分别从准确度量特征重要性和生成合理有效的反事实两方面实现可解释性,能够帮助使用者更好地理解元学习推荐结果在具体问题中的预测结果,从而在未来决策中作出更合理的判断。
-
公开(公告)号:CN114665884A
公开(公告)日:2022-06-24
申请号:CN202210318623.8
申请日:2022-03-29
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
Abstract: 时序数据库自适应有损压缩方法、系统及介质,涉及计算机技术领域,针对现有技术中缺少提高数据压缩比的方法的问题,本申请自适应用户的压缩精度需求。用户可以确定压缩精度,通过存储数据段的基和部分偏差来确保压缩在相应的精度内。数据库的数据压缩比高,节省存储空间。有损压缩降低精度,在保持基的同时将部分偏差丢弃,降低存储空间。使用类似Huffman编码的思想进行编码,进一步提升压缩比。编码方式灵活。可以更换编码方式,Huffman编码需要整段全解压缩才能够查询,查询效率低时可以选择更换不同的编码方式来提升效率。
-
公开(公告)号:CN114328669A
公开(公告)日:2022-04-12
申请号:CN202111662250.8
申请日:2021-12-30
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/22 , G06F16/25 , G06N3/04 , G06N3/08
Abstract: 基于深度学习的自动化时序数据库索引推荐方法、存储介质及设备,属于数据库技术领域。为了目前针对时序数据库还没有有效可行的自动化索引推荐方法的问题。本发明所述方法通过强化学习模型进行时序数据库的索引推荐,强化学习模型的代理负责决策的过程;代理与数据库的环境模型进行交互,环境模型计算代理因其决策而获得的状态转换和代价;DBMS接口负责执行数据库的创建、升级或删除动作并获取当前的索引配置的统计信息。本发明主要用于时序数据库的索引推荐。
-
公开(公告)号:CN111400571B
公开(公告)日:2021-11-19
申请号:CN202010075197.0
申请日:2020-01-22
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/9536 , G06F16/35 , G06F40/289 , G06Q50/00 , G06N20/00
Abstract: 基于关联规则的社交网络用户信息填充方法,涉及网络技术领域。本发明是为了解决社交网络用户信息填充的准确性差的问题。本发明基于SCRAPY爬虫框架获取用户的在网络社交平台上的个人信息和每个用户在网络社交平台上发布的信息;利用ICTCLAS系统对每个有效用户在社交网络平台发布的信息进行分词,并提取每个有效用户的关键词;利用FP‑Growth算法对有效用户的关键词进行关联,利用强关联规则集合将信息缺失的用户与无信息缺失的用户进行不同关键词关联,利用与其关联的无信息缺失用户的信息对信息缺失用户缺失的信息进行填充,或者使用补充算法KNNI对信息缺失用户缺失的信息进行填充。本发明适用于网络平台用户信息填充使用。
-
公开(公告)号:CN112905806A
公开(公告)日:2021-06-04
申请号:CN202110318765.X
申请日:2021-03-25
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06F16/28 , G06F40/279
Abstract: 基于强化学习的知识图谱实体化视图生成器及生成方法,属于计算机领域。本发明是为了解决现有知识图谱存储方案无法同时满足存储大规模知识图谱数据和高效处理复杂查询工作负载的要求。复杂子查询识别器对知识图谱查询语句中谓语进行识别,若谓语个数大于给定阈值数量,将数据库中含有所述谓语的语句形成语句集合;实体化视图在线生成模型采用Q学习算法判断是否对语句集合生成实体化视图,如果否,在数据库中完成查询语句集合操作,如果是,再次判断所述语句集合生成实体化视图后的存储量是否达到预算值,结果为否时,将语句集合构造成实体化视图;结果为是时,利用Q学习算法从语句集合中挑选出部分语句生成新的实体化视图。它用于提升查询效率。
-
公开(公告)号:CN107944479B
公开(公告)日:2020-10-30
申请号:CN201711135644.1
申请日:2017-11-16
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及一种基于半监督学习的疾病预测模型建立方法及装置,包括以下步骤:将有标签数据进行分类,得到有标签数据的基础分类模型;选取部分无标签数据;将选取的部分无标签数据通过聚类方法进行分类,并且利用所述基础分类模型对选取的部分无标签数据进行标记,根据所述无标签数据的聚类结果和预测结果得到无标签数据的标记结果,再与有标签数据合并起来进行分类,得到更新的基础分类模型,从剩下的无标签数据中继续选取部分无标签数据重新建模,如此迭代直至所有无标签数据处理完毕,得到最终分类模型。本发明对无标签数据进行建模,具体结合了有标签的分类方法和无标签的聚类方法,并通过迭代方式提升预测精度,更好地提升模型预测精度。
-
-
-
-
-
-
-
-
-