最新 最热

Adversarial Reinforcement Learning for Unsupervised Domain Adaptation

将知识从已有的标记域转移到新的域时,往往会发生域转移,由于域之间的差异导致性能下降。 领域适应是缓解这一问题的一个突出方法。 目前已有许多预先训练好的神经网络用于特征提取。 然而,很少有工作讨论如何在源域和目...

2022-09-02
0

计算机视觉最新进展概览2021年10月24日到2021年10月30日

神经体系结构搜索(Neural Architecture Search, NAS)通过自动发现最优的体系结构,在有效减少网络设计的人工工作量方面显示了巨大的潜力。 值得注意的是,尽管目标检测在计算机视觉中具有重要的意义,但到目前为止,NAS算法...

2022-09-02
1

跟我学强化学习之六——强化学习基础

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

跟我学强化学习之五——深度学习

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

跟我学强化学习之四——神经网络

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

跟我学强化学习之三——机器学习

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

跟我学强化学习之二——概率统计与随机过程

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

跟我学强化学习之一——强化学习导论

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

跟我学强化学习之七——马尔科夫决策过程

导读:本书系统地介绍了强化学习,内容包括强化学习概述、强化学习预备知识、强化学习基础、表格求解法、近似求解法、实践与前沿六部分,系统、条理,涵盖了强化学习的方方面面。理论与实践结合,偏重实践应用,通过算法原理与...

2022-09-01
0

深度强化学习中的对抗攻击和防御

本篇文章分享论文『Attacking and Defending Deep Reinforcement Learning Policies』,深度强化学习中的对抗攻击和防御。

2022-09-01
0