-
公开(公告)号:CN116915869A
公开(公告)日:2023-10-20
申请号:CN202311017986.9
申请日:2023-08-14
Applicant: 南京信息工程大学
IPC: H04L67/61 , H04L67/10 , G06N3/0464
Abstract: 本发明公开了基于云边协同的时延敏感型智能服务快速响应方法,基于双延迟深度确定性策略算法,实现对卷积核分割与服务器资源分配的联合优化,其核心思想是将每个边缘服务器中的计算资源进行分区,每个区域内的资源只用以推理某个卷积神经网络中某个卷积层的某一部分;一个场景中基于同一类别卷积神经网络的所有智能服务被置于一个队列中,且根据优先级决定不同服务的推理顺序;每个智能服务对应的卷积神经网络中,各卷积层都被分割成多个部分,实现卷积神经网络在不同服务器上的并行推理;整个算法具备卷积核分割合理、资源分配精确、高优先级服务请求优先处理的特征,能满足高任务负载场景中时延敏感型智能服务的快速响应需求。