-
公开(公告)号:CN115393012A
公开(公告)日:2022-11-25
申请号:CN202211018277.8
申请日:2022-08-24
Applicant: 电子科技大学
IPC: G06Q30/06 , G06N3/04 , G06F16/9535
Abstract: 本发明提出了一种基于双通道注意力加权网络的会话推荐方法,属于会话推荐技术领域。本发明基于一次会话中的用户交互序列,其中用户交互序列包括物品名称序列、物品类别序列与用户操作序列,首先根据用户交互序列分别生成物品、类别、操作的高维空间表示;然后,利用注意力机制,从三种表示的结合中分别提取出融合操作信息的用户‑物品兴趣度与用户‑类别兴趣度;最后,建立基于双通道注意力加权的兴趣融合机制,形成用户兴趣表征,实现对用户下一刻点击物品的预测;本发明所述方法融合了物品类型和用户操作信息,从用户与物品交互在不同粒度下的兴趣特征出发,能够从不同粒度对用户兴趣建模,解决了用户兴趣建模不准确、不合理的问题。
-
公开(公告)号:CN115481323A
公开(公告)日:2022-12-16
申请号:CN202211219181.8
申请日:2022-09-30
Applicant: 电子科技大学
IPC: G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/06
Abstract: 本发明公开了一种基于自适应的用户兴趣双重纠偏的会话推荐方法,属于会话推荐技术领域。本发明所述方法主要包括以下步骤:初始化用户点击序列中各物品的高维空间语义及位置表示,拼接得到物品表示矩阵,再生成包含时序和上下文信息的物品表示矩阵;利用第一自适应纠偏机制初始化当前的用户兴趣表示,再利用包含第二自适应纠偏机制的用户兴趣表示蒸馏模块输出下一时刻的用户兴趣表示;进而对物品字典中所有物品于下一时刻被点击的概率进行预测。本发明所述方法采用自适应纠偏机制,有效解决了最后一次物品点击无法准确表示用户当前兴趣的问题,降低了噪声信息在下一时刻的用户兴趣表示中的含量,具有更高的预测精准度。
-
公开(公告)号:CN118175647A
公开(公告)日:2024-06-11
申请号:CN202410284545.3
申请日:2024-03-12
Applicant: 电子科技大学 , 中国电子科技集团公司第五十四研究所
Abstract: 本发明公开了一种基于感知增强网络的自适应干扰资源分配方法,属于深度强化学习技术领域。本发明所设计的感知增强网络包括状态识别网络和动作价值网络,其中状态识别网络用于识别通信方的状态价值,增强对通信方抗干扰状态的感知能力,然后将状态价值反馈给动作价值网络以选择最优干扰动作,从而帮助模型更精准地匹配最优干扰资源分配策略。并且,构建了一个双目标优化奖励函数,通过调整两个归一化后的奖励函数的相对重要性权重,达到干扰成功和资源节约之间的最佳平衡。此外,设计了动态修正的优先经验回放机制,以实现对数据样本的高效利用并确保策略的快速收敛。
-
公开(公告)号:CN116886236A
公开(公告)日:2023-10-13
申请号:CN202311099669.6
申请日:2023-08-29
Applicant: 电子科技大学
Abstract: 本发明公开了一种面向资源优化的协同干扰策略生成算法,属于通信对抗领域。该模型为:在多干扰机与多通信电台的通信对抗场景中,通信电台具有隐藏的抗干扰策略,干扰方利用协同干扰策略生成算法,不断调整干扰策略,最大化干扰成功率的同时最优化资源消耗。算法为:首先建立通信对抗场景,然后构建干扰约束条件式,使得干扰功率最小化问题可转化为求解满足约束条件式的最优化问题,其次通过对误码率和功率的约束设计了双动态惩罚函数,保证在有效干扰的条件下最小化资源消耗,最后结合双动态惩罚函数和双深度Q网络算法构建协同干扰策略生成模型。本发明可以显著提升干扰效果,且相对于无约束算法而言节约25%干扰资源。
-
-
-