每天给你送来NLP技术干货!
文末留言送书!
我们在上学的时候,都会希望能拥有一本学霸笔记,这样能让学习变得事半功倍。要是学霸还顺带帮你押了题,那简直如有神助!
现在强化学习越来越热,作为机器学习及人工智能领域的一种重要方法,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。同时,强化学习对应的岗位高薪、前景广阔,吸引了许多人学习。
但是,是强化学习的学习门槛很高,光入门就特别难。如果能有学霸的帮忙,那可就能事半功倍了!
这本“蘑菇书”《Easy RL:强化学习教程》,就是一本很典型的“学霸笔记”,既有老师上课画的重点——3门公开课的精华内容,还有学霸凝练的精华和扩展的内容——作者们在大部分章末设置了原创的关键词、习题和面试题,并提供Python代码实现,帮助读者提高和巩固对所学知识的清晰度和掌握度。
这本《Easy RL:强化学习教程》在豆瓣评分9.2,被称为“强化学习最好入门书”。
1、说说这本书的书名
看到这本书时,总会被书封中的蘑菇吸引,作者们的意图是希望这本《Easy RL:强化学习教程》,让读者像采蘑菇一样轻松入门强化学习。
当读者们“吃”下这本“蘑菇书”之后,能够饶有兴致地探索强化学习。像马里奥那样愈加强大,继而在人工智能领域觅得意外的收获。
同时,这本书的作者王琦、杨毅远、江季都是硕士在读的学生,Datawhale的成员,他们离入门的读者特别近。“蘑菇书Easy RL”是他们在自学强化学习公开课的过程中,根据自身的理解整理优化得来的。
最初他们在GitHub上发布了学习笔记,在线上发布9个月的时间内,就获得了3.3k 的GitHub Star和1w 的下载。
▲“蘑菇书”获得了3.3k 的GitHub Star
这本书就是为强化学习入门者打造的一本学霸笔记,还能像吃蘑菇一样简单~
2、说说这本书的内容
这本《Easy RL:强化学习教程》的主要内容源自B站3门累计播放量破百万的强化学习课程:李宏毅“深度强化学习”、周博磊“强化学习纲要”、李科浇“世界冠军带你从零实践强化学习”。
书中主要提取了3门公开课的精髓部分:
- 根据李宏毅老师的“深度强化学习”整理而来的策略梯度、近端策略优化、深度Q 网络、演员-评论员算法、稀疏奖励、模仿学习;
- 根据周博磊老师的“强化学习纲要”凝练而成的强化学习绪论、马尔可夫决策过程;
- 根据李科浇老师的“世界冠军带你从零实践强化学习”总结而来的表格型方法、深度确定性策略梯度;
这一本“蘑菇书”涵盖了3门大热公开课的内容,自然能够收获众多学习者的支持和喜爱。
▲在b站搜索“强化学习”
这本书还结合编著者自身学习体验中的难点和重点加以强调、阐释和引申,让其他学习者“学得快、少踩坑”!
● 内容系统全面,并通过关键词巩固学习
为了尽可能地降低阅读门槛,作者们在“蘑菇书”中对3门公开课的精华内容进行了选取和优化,对所涉及的公式给出了详细的推导过程,对较难理解的知识点进行了重点讲解和强化,以方便读者轻松入门。并且,为了丰富内容,书中还补充了不少3门公开课之外的强化学习相关知识。
“蘑菇书”全书共13章,分为两部分。第一部分介绍强化学习的基础知识以及传统强化学习算法,第二部分介绍深度强化学习算法及其常见问题的解决方法。
▲“蘑菇书”目录
内容虽多,但是作者们非常贴心地整理了强化学习中的大量关键词,总结了对应章节的重点概念,以方便读者高效地回忆并掌握核心内容。
▲原创关键词巩固学习
● 精选习题和面试题,助力大厂offer
“蘑菇书”还拓展了习题和面试题:
习题部分以问答的形式阐述了相应章中出现的知识点,帮助读者厘清知识脉络;
面试题部分的内容源于大厂的算法岗面试真题,通过还原真实的面试场景和面试问题,帮助读者开阔思路,助力大家面试理想的岗位。
▲精选习题和面试题,助力理想offer
并且作者还为大家准备了习题和面试题的电子版答案,有疑问也可以通过Datawhale和作者进行沟通答疑。
● 理论与应用结合,基于Python实现强化学习
强化学习是一个理论与实践相结合的学科,我们不仅要理解算法背后的原理,还要通过上机实践来实现算法,让理论知识得到实际的应用。
“蘑菇书”的作者深谙此道,精心为读者准备了强化学习的Python代码实现,并且源代码可以在购书后通过异步社区进行下载,让大家亲自动手实现各种经典的强化学习算法,通过实战更清晰地理解算法并快速应用。
▲案例生动形象,描述深入浅出,代码简洁易懂,注释详细
最后,这是一本通过开源方式多人协作写成,并且获得业内多位大咖力荐的“升级纸质书”。
在众多优秀开源教程的启发下,编著者决定将该笔记制作成教程来让更多的强化学习初学者受益。为此,他们采用在GitHub上开源协作的方式完成本书的优化升级。
在磨菇书的初稿完成后,三位作者为了更好地优化这套教程,便把它当作教材,组织了上百人的组队学习活动。
“实践是检验一切的真理”,“蘑菇书”的这次实践自然也得到了一致好评。不仅如此,编著者们还根据学习者们对初版教程的上百次反馈,经历了1年多的开源协作修改,完成了磨菇书的优化,并在出版社老师们的规范化加工后,最终得以出版。
开源协同创作这种方式,具有多人分工合作、相互校验、透明监督等优点,不仅让书的质量得以保证,也提高了内容输出的效率。
或许正是因为书籍内容质量之高和审核之严,让磨菇书一经问世,便收获一片好评,获得了李宏毅、周博磊、李科浇、汪军、张伟楠、李升波、胡裕靖共7位强化学习领域大咖的亲笔推荐!
学习这种事儿,越早越好!
文末留言,点赞前四名送书!截止时间:2022.4.10晚8:00
最近文章
EMNLP 2022 和 COLING 2022,投哪个会议比较好?
一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA
阿里 北大 | 在梯度上做简单mask竟有如此的神奇效果
代码语言:javascript复制下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套! 后台回复【五件套】
下载二:南大模式识别PPT 后台回复【南大模式识别】
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
代码语言:javascript复制整理不易,还望给个在看!