-
公开(公告)号:CN119249079A
公开(公告)日:2025-01-03
申请号:CN202411282952.7
申请日:2024-09-13
Applicant: 北京工业大学
IPC: G06F18/15 , G06F18/10 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 本发明提出一种结合Patch Savitsky‑Golay滤波和Transformer的水质指标预测模型。首先,利用滑动窗口技术将水质时间序列划分为多个子序列,以捕捉序列内在趋势和语义信息。基于此,通过Savitsky‑Golay滤波器对子序列进行去噪,进而提高信号‑噪声比,以确保水质序列数据的质量。最后,引入Transformer模块,利用其自注意力机制处理时间序列的非线性特性,从而增强模型对序列长期依赖关系的捕捉能力。以上策略有效提升水质指标预测的精度和可靠性。
-
公开(公告)号:CN118761459A
公开(公告)日:2024-10-11
申请号:CN202410740134.0
申请日:2024-06-07
Applicant: 北京工业大学
Abstract: 本发明提供一种面向集成学习的大语言模型微调下的问答方法及装置,该方法包括:对LLMs模型进行预训练得到基准LLMs模型;基于集成学习策略对奖励模型进行训练,得到集成奖励模型;基于强化学习策略根据所述集成奖励模型输出的奖励分数对所述基准LLMs模型进行微调,得到目标LLMs模型;将用户的问题输入目标LLMs模型,得到所述问题的答案。本发明通过融合基于集成学习策略的奖励模型和基于人类反馈的强化学习技术,以实现对人类偏好的精准对齐,提高LLMs在特定领域的性能。
-
公开(公告)号:CN115694985B
公开(公告)日:2024-07-09
申请号:CN202211344093.0
申请日:2022-10-31
Applicant: 北京工业大学
IPC: H04L9/40 , H04L41/147 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/049 , G06N3/09
Abstract: 本发明涉及一种基于时间卷积网络和多头注意力机制的网络攻击预测方法,特别是一种基于结合时间卷积神经网络(Temporal Convolutional Network,TCN),多头注意力机制(Multi‑head SelfAttention)和双向门控循环神经网络(Bi‑direction Gated Recurrent Unit,Bi‑GRU)的混合网络攻击预测方法TMB。首先,对原始数据采用Savitzky‑Golay滤波器去除噪声。其次,将数据使用归一化操作,并通过滑动窗口将归一化后的数据转化为有监督数据。再次,搭建混合网络攻击模型TMB,该模型由TCN,多头注意力机制和Bi‑GRU组成。通过模型对网络攻击数据的迭代训练,最终得到预测模型。最后,利用该模型预测未来的网络攻击数量,最终获取准确度较高的网络攻击预测结果。
-
公开(公告)号:CN117875312A
公开(公告)日:2024-04-12
申请号:CN202410049211.8
申请日:2024-01-12
Applicant: 北京工业大学
IPC: G06F40/242 , G06F40/295 , G06F40/30
Abstract: 本发明涉及一种面向中文水环境文本的命名实体识别的方法,特别是涉及一种基于多特征嵌入的双向长短时记忆神经网络(Bi‑directional Long Short Term Memory,BiLSTM),高速自注意力机制(Highway Self‑attention)与条件随机场(Conditional Random Field,CRF)混合神经网络的中文水环境文本命名实体识别方法。首先,将获取到的中文水环境文本数据用预先训练好的词典进行词嵌入,将中文字符与词语映射成向量。同时,将文本数据转换成拼音、五笔编码,通过模型预训练出拼音、结构与字体特征词典作为补充特征向量进行补充嵌入。然后,使用BiLSTM神经网络层从两个方向对拼接后的多特征数据进行训练提取。接着使用Highway Self‑attention对进一步提取句子级特征。最后使用CRF来解码特征,并获取准确度较高的命名实体所属类别的预测结果。
-
公开(公告)号:CN111563611B
公开(公告)日:2023-11-24
申请号:CN202010282888.8
申请日:2020-04-13
Applicant: 北京工业大学
IPC: G06Q10/04 , G06Q50/06 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明公开一种面向图卷积网络的云数据中心可再生能源时空预测方法,基于绿色云数据中心的目标太阳能站及其邻近站的空间特征构建图的拓扑结构。在此基础上,构建绿色云数据中心太阳能的时空预测模型。该时空预测模型集成图卷积网络和长短时记忆网络,并结合图注意力机制对云数据中心可再生太阳能进行学习并预测。通过对可再生能源的迭代训练,优化模型参数,最终得到预测模型。进一步利用训练完成的预测模型对其云数据中心的太阳能进行不同时间粒度的预测。最后,将预测结果与测试数据集进行对比,对时空预测模型进行误差分析与性能评估。本发明综合考虑绿色云数据中心可再生能源的时间和空间特性,有效地提高不同时间粒度的太阳能预测精度。
-
公开(公告)号:CN115865410A
公开(公告)日:2023-03-28
申请号:CN202211354317.6
申请日:2022-11-01
IPC: H04L9/40 , G06F18/24 , G06N3/006 , G06N3/126 , G06N3/0442 , G06N3/0455 , G06N3/086
Abstract: 本发明涉及一种网络攻击检测的方法,特别是涉及一种基于堆叠稀疏收缩自动编码器(StackedSparseContractiveAutoencoders,SSCA)、模拟退火遗传粒子群优化(GeneticSimulated‑annealing‑basedParticleSwarmOptimization,GSPSO)、引入注意力机制的双向长短时记忆网络(Attention‑based BidirectionalLong‑termandShort‑termMemory,AB‑LSTM)分类器以及决策融合的网络入侵检测方法。首先,将获取到网络流量数据进行归一化处理,而后将其传入SSCA中,对该流量数据进行特征提取,使用GSPSO算法对SSCA的超参数进行优化以提取到更有效的N个特征集,然后将获得的N个特征集传入N个AB‑LSTM分类器中输出N个分类结果,最后利用决策融合算法,将N个分类器的分类结果融合,输出最终的准确分类结果。
-
公开(公告)号:CN115687322A
公开(公告)日:2023-02-03
申请号:CN202211344086.0
申请日:2022-10-31
Applicant: 北京工业大学
IPC: G06F16/215 , G06N3/0442 , G06N3/0455 , G06N3/0475 , G06N3/049 , G06N3/084 , G06N3/094
Abstract: 本发明涉及一种面向水质指标的数据补全方法,特别是涉及一种基于编码器‑解码器和自回归网络的时间序列生成对抗网络(GenerativeAdversarialNetworkswith Encoder‑DecoderandAutoregressivenetwork,GEDA)的缺失数据补全方法。首先,针对获取到的水质指标历史数据进行归一化处理,并对水质指标时间序列数据按照预设的滑动窗口大小划分为多个子序列作为特征序列,输入到生成对抗网络中进行训练。然后,针对有缺失的水质指标时间序列数据输入到训练好的网络中,生成完整的时间序列数据用于补全真实数据的缺失部分。最后,获得完整的与真实数据接近的水质指标数据。
-
公开(公告)号:CN115563981A
公开(公告)日:2023-01-03
申请号:CN202211344073.3
申请日:2022-10-31
Applicant: 北京工业大学
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种面向水环境的中文命名实体识别的方法,特别是涉及一种基于Lattice双向长短时记忆(LatticeBi‑directionalLongShortTermMemory,LatticeBiLSTM),带有位置编码的自注意力机制与条件随机场(ConditionalRandomField,CRF)混合神经网络的中文命名实体识别方法。首先,将获取到的中文水环境文本数据用预先训练好的词典进行词嵌入,将中文字符与词语映射成向量。然后,使用LatticeBiLSTM神经网络层从两个方向对数据的字符级和词语级特征进行提取。接着使用带有位置编码的自注意力机制对数据的位置以及句子级特征进行提取。最后使用CRF来解码特征,并获取精准度较高的命名实体所属类别的预测结果。
-
-
公开(公告)号:CN110852515B
公开(公告)日:2022-05-06
申请号:CN201911116695.9
申请日:2019-11-15
Applicant: 北京工业大学
Abstract: 本发明公开一种基于混合长短时记忆神经网络的水质指标预测方法,首先,将获取到的水质指标历史数据依照时间序列进行排序,并对该水质历史数据采用SG滤波平滑预处理。然后,再进行水质数据的归一化处理,将水质时间序列数据按照预设的滑动窗口大小划分为多个子序列作为特征序列,也就是转为有监督的数据后,输入基于编码‑解码器的长短时记忆ED‑LSTM神经网络模型,预测未来多个时间点的水质指标值,最终获取精准度较高的水质指标预测结果。
-
-
-
-
-
-
-
-
-