上海交通大学无线通信网络实验室

研究课题

当前位置：首页 >> 研究课题 >> 智能计算与学习 >> 智能计算平台

基于深度强化学习的动态边缘服务器预留算法

边缘计算有望为互联车辆提供计算资源。由于车辆的移动性，其对边缘服务器的资源需求有所不同。因此，预留边缘服务器以满足不断变化的需求是一项挑战。现有的机制依赖于资源需求的统计信息来确定边缘服务器的预留情况。由于基于统计的保留不能适应时变需求，因此在实践中是不可行的。本文提出了一种时空强化学习方案DeepReserve来学习可变的需求，并据此预留边缘服务器。DeepReserve是根据deep deterministic policy gradient算法改编而来的，有两个主要的改进。首先，我们通过观察车辆流量的时空相关性导致CVs的资源需求具有相同的性质，采用卷积LSTM网络对边缘服务器观测到的资源需求进行编码，以推断未来的需求。其次，我们设计了一个动作修正器，以确保动作不违反时空相关性。我们还设计了一种新的训练方法，即DR-Train，以稳定训练过程。根据实际数据集，通过实验对DeepReserve进行了评价。结果表明，与需要准确需求信息的最新方法相比，该方法具有更好的性能。

参与人员：

张嘉伟，陈苏鸿

上篇文章下篇文章