基于深度强化学习的组合优化研究进展
精品论文推荐
李凯文,张涛,王锐*,覃伟健,黄鸿,贺惠辉,基于深度强化学习的组合优化研究进展,自动化学报,2020, 41(x): 1−17 doi: 10.16383/j.aas.c200551
(http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200551)
组合优化问题广泛存在于国防、交通、工业、生活等各个领域,但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高,传统运筹优化方法在组合优化问题的在线求解上面临很大的计算压力。近年来随着深度强化学习的迅猛发展及其在围棋、机器人等领域所展现出的强大的学习能力与序贯决策能力,基于深度强化学习的组合优化方法成为近年来的研究热点,涌现出了一系列相关研究。鉴于此,文章《基于深度强化学习的组合优化研究进展》对近年来基于深度强化学习的组合优化方法的研究进展进行了综述介绍。
文章对当前该领域的研究进行了分类研究和分析总结,列举了基于Pointer Network的端到端方法、基于图神经网络的端到端方法、多目标优化方法、深度强化学习改进的局部搜索方法等基于深度强化学习解决组合优化问题的代表性算法,对其算法原理、优化性能、优缺点进行了对比和介绍,并对各类方法未来的研究方向进行了分析。
从算法求解能力方面,对不同方法在经典TSP、VRP问题上的算法表现进行了实验结果对比分析。
从算法应用方面,针对研究中经典的一系列组合优化问题,文章分门别类对近年来各研究所采用的模型细节进行归纳与比较,对不同类型方法求解不同类型问题上的适用性进行了分析。
从深度强化学习解决实际组合优化问题的应用方面,文章综述了其在网络与通信领域的应用,具体包括了资源分配、拓扑与路由优化与计算迁移研究问题中的方法应用。除此之外,文章还对基于深度强化学习的组合优化在交通、生产制造、高性能计算和微电网能量管理等其他领域的研究进行了介绍。
最后,文章在模型、研究对象、模型训练方法、在线应用等层面,就现阶段深度强化学习解决组合优化问题的研究的不足之处提出了未来展望。