利用基于忆阻器阵列的环境模型的策略优化方法和装置

    公开(公告)号:CN114819093B

    公开(公告)日:2024-11-01

    申请号:CN202210497721.2

    申请日:2022-05-09

    Applicant: 清华大学

    Abstract: 一种利用基于忆阻器阵列的动态环境模型的策略优化方法和策略优化装置。该方法包括:获取基于忆阻器阵列的动态环境模型;根据动态环境模型以及对象策略进行多个时刻的多次预测,得到包括对象策略对应于多个时刻的优化代价的数据样本集合;基于数据样本集合,使用策略梯度优化算法进行策略搜索以对对象策略进行优化。该方法利用基于忆阻器阵列的动态环境模型来生成数据样本集合,实现基于动态环境模型的长期动态规划,然后使用策略梯度优化算法等更加稳定的算法进行策略搜索,能够有效地优化对象策略。

    忆阻贝叶斯神经网络的关键权重在线更新方法及装置

    公开(公告)号:CN117787350A

    公开(公告)日:2024-03-29

    申请号:CN202311518309.5

    申请日:2023-11-14

    Applicant: 清华大学

    Abstract: 本发明涉及忆阻贝叶斯神经网络技术领域,特别涉及一种忆阻贝叶斯神经网络的关键权重在线更新方法及装置,其中,方法包括:利用预设数据集对忆阻贝叶斯神经网络进行训练,以优化权重的后验分布,得到最优权重后验分布;根据最优权重后验分布计算损失函数对均值的梯度和标准差的梯度;根据均值的梯度和标准差的梯度计算权重信噪比变化值;选择训练后的忆阻贝叶斯神经网络的当前关键权重,利用权重信噪比变化值更新当前关键权重,得到新的关键权重,以作为当前关键权重,迭代执行训练过程,直至训练后的忆阻贝叶斯神经网络达到预设收敛条件。由此,解决了现有训练过程中需要进行大量读取和编程操作,难以实现高速且高效的在线训练等问题。

    基于忆阻器阵列的贝叶斯神经网络的变分推理方法和装置

    公开(公告)号:CN114819128A

    公开(公告)日:2022-07-29

    申请号:CN202210497666.7

    申请日:2022-05-09

    Applicant: 清华大学

    Abstract: 一种基于忆阻器阵列的贝叶斯神经网络的变分推理方法和装置。忆阻器阵列包括多个忆阻器,贝叶斯神经网络的经训练得到的权重矩阵被映射至忆阻器阵列中,该方法包括:对于被映射后的忆阻器阵列,获得当前忆阻器阵列的多个忆阻器的电导态;获取对于贝叶斯神经网络的权重矩阵的每个权重的多个权重采样样本,并使用忆阻器阵列进行多次前向传播以得到多个输出结果;基于每个权重的多个权重采样样本和多个输出结果,获取贝叶斯神经网络的损失函数的损失值;对损失函数进行反向传播,得到忆阻器阵列中用于贝叶斯神经网络的权重矩阵的每个权重的忆阻器的电导态的梯度;根据梯度更新忆阻器阵列中用于贝叶斯神经网络的权重矩阵的忆阻器的电导态。

    训练方法及装置、电子设备和计算机存储介质

    公开(公告)号:CN116128035A

    公开(公告)日:2023-05-16

    申请号:CN202211490875.5

    申请日:2022-11-25

    Applicant: 清华大学

    Abstract: 一种用于基于忆阻器阵列的贝叶斯神经网络的训练方法及装置、电子设备和存储介质。忆阻器阵列中的忆阻器的电导值用于映射贝叶斯神经网络的权重,该训练方法包括:获取忆阻器阵列基于忆阻器的内在非理想特性的第一先验知识和第二先验知识;基于第一先验知识,计算贝叶斯神经网络的总损失函数;对总损失函数进行反向传播,以对贝叶斯神经网络中的当前参数进行更新得到对象参数;以及基于第二先验知识对对象参数进行约束,以得到贝叶斯神经网络的权重的训练结果。该训练方法能够提高网络对忆阻器电导值波动的鲁棒性。

    权重部署方法及装置、电子设备和存储介质

    公开(公告)号:CN115796250A

    公开(公告)日:2023-03-14

    申请号:CN202211490851.X

    申请日:2022-11-25

    Applicant: 清华大学

    Abstract: 一种基于忆阻器阵列的神经网络的权重部署方法及装置、电子设备和存储介质。该权重部署方法包括:获取神经网络中待部署到忆阻器阵列中的目标权重;确定目标权重是第一类型权重还是第二类型权重,第一类型权重对神经网络的重要性高于第二类型权重对神经网络的重要性;对于忆阻器阵列执行权重映射操作,若目标权重是第一类型权重,将目标权重映射到忆阻器阵列中与目标权重对应的忆阻器单元,或者,若目标权重是第二类型权重,则将忆阻器阵列中与目标权重对应的忆阻器单元的电导值写入为选择的目标值。该权重部署方法能够提高神经网络的权重部署于忆阻器阵列的效率。

    利用基于忆阻器阵列的环境模型的策略优化方法和装置

    公开(公告)号:CN114819093A

    公开(公告)日:2022-07-29

    申请号:CN202210497721.2

    申请日:2022-05-09

    Applicant: 清华大学

    Abstract: 一种利用基于忆阻器阵列的动态环境模型的策略优化方法和策略优化装置。该方法包括:获取基于忆阻器阵列的动态环境模型;根据动态环境模型以及对象策略进行多个时刻的多次预测,得到包括对象策略对应于多个时刻的优化代价的数据样本集合;基于数据样本集合,使用策略梯度优化算法进行策略搜索以对对象策略进行优化。该方法利用基于忆阻器阵列的动态环境模型来生成数据样本集合,实现基于动态环境模型的长期动态规划,然后使用策略梯度优化算法等更加稳定的算法进行策略搜索,能够有效地优化对象策略。

    基于忆阻器阵列的数据处理方法和数据处理装置

    公开(公告)号:CN114742218A

    公开(公告)日:2022-07-12

    申请号:CN202210498347.8

    申请日:2022-05-09

    Applicant: 清华大学

    Abstract: 一种基于忆阻器阵列的数据处理方法和数据处理装置。该方法包括:获取贝叶斯神经网络,其中,贝叶斯神经网络具有经训练得到的权重矩阵;根据贝叶斯神经网络的权重矩阵得到对应的多个目标电导值,将多个目标电导值映射到忆阻器阵列中;将对应于动态系统的当前状态特征向量和隐输入变量作为输入信号输入到权重映射后的忆阻器阵列,通过忆阻器阵列对当前状态特征向量和隐输入变量按照贝叶斯神经网络进行处理,从忆阻器阵列获取对应于处理结果的输出信号,其中,输出信号用于得到动态系统的下一状态的预测结果。该方法利用基于忆阻器阵列的带隐输入变量的贝叶斯神经网络对动态系统进行预测,功耗低、计算速度快、计算能效高。

    利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置

    公开(公告)号:CN110956256B

    公开(公告)日:2022-05-17

    申请号:CN201911251361.2

    申请日:2019-12-09

    Applicant: 清华大学

    Abstract: 本发明公开了一种利用忆阻器本征噪声实现贝叶斯神经网络的方法及装置,其中,该方法包括:获取贝叶斯网络,根据选定的数据集对所述贝叶斯网络进行训练得到所述贝叶斯网络的权重分布;对所述贝叶斯网络的权重分布进行处理,根据处理后的权重分布及多个忆阻器的电导进行计算,得到目标电导值,将所述目标电导值映射到所述忆阻器中。该方法利用忆阻器交叉阵列实现贝叶斯神经网络,功耗低,计算速度快,计算能效高。

    忆阻贝叶斯深度神经网络在线学习方法及装置

    公开(公告)号:CN120012837A

    公开(公告)日:2025-05-16

    申请号:CN202411849571.2

    申请日:2024-12-16

    Applicant: 清华大学

    Abstract: 本申请涉及一种忆阻贝叶斯深度神经网络在线学习方法及装置,其中,方法包括:在数字计算机上,利用训练数据集进行离线训练,得到初始BDNN模型,并将训练好的网络权重写入忆阻器中,得到实际BDNN模型;利用实际BDNN模型预测未标记数据集中每个数据样本的数据类别,并计算每个数据样本的预测不确定性值;基于预测不确定性值确定未标记数据集中的目标数据样本,并将目标数据样本加入至训练数据集中,以得到新训练数据集,并利用新训练数据集进行在线训练,以更新忆阻器的电导值,直至满足预设停止条件,得到满足预设性能条件的忆阻BDNN模型。由此,解决了相关技术中,确定性计算平台在计算过程中存在巨大的延迟和能耗,难以满足贝叶斯深度神经网络学习的高速、高效计算的需求的技术问题。

    权重写入方法及装置、电子设备和存储介质

    公开(公告)号:CN115796252A

    公开(公告)日:2023-03-14

    申请号:CN202211496175.7

    申请日:2022-11-25

    Applicant: 清华大学

    Abstract: 一种应用于忆阻器阵列的神经网络的权重写入方法及装置、电子设备和存储介质。该权重写入方法包括:获取写入到忆阻器阵列中目标忆阻器单元的目标权重值和用于写入目标权重值的误差幅度,误差幅度基于目标权重值对应的概率分布确定;获取目标忆阻器单元的当前权重值;判断当前权重值与目标权重值之差的绝对值是否在误差幅度内;响应于当前权重值与目标权重值之差的绝对值在误差幅度内,确定目标权重值已经写入目标忆阻器单元。该权重写入方法能够提高神经网络的权重写入于忆阻器阵列的效率。

Patent Agency Ranking