本书理论完备,涵盖主流经典强化学习算法和深度强化学习算法;实战性强,基于Python、Gym、TensorFlow 2、AlphaZero等构建,配套代码与综合案例。全书共12章,主要内容如下。
第1章:介绍强化学习的基础知识与强化学习环境库Gym的使用,并给出完整的编程实例。
第2~9章:介绍强化学习的理论知识。以Markov决策过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。
第10~12章:介绍了多个热门综合案例,包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。
肖智清
强化学习一线研发人员,清华大学工学博士,现就职于全球知名投资银行。擅长概率统计和机器学习,近5年发表SCI/EI论文十余篇,是多个顶级期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛上获得冠军。
之前了解深度强化学习算法比较多,而且主要是通过案例学习,这次通过这本书学习了理论知识,还了解在深度强化学习诞生前那些基础算法。原来很多深度强化学习算法比如DQN啥的只是在那些基础算法的基础上改进了一点点,并且很多深度强化学习算法的技巧实际上早就有非深度的版本,...
评分 评分我是学生物科学的本科生,最感兴趣的研究方向是计算生物物理,本次是第一次参加华章鲜读的活动,但遗憾的是,由于个人学习工作繁忙,本书也只是略读看完。作者肖智清博士从数学原理开始深入浅出地讲述强化学习的理论方法和具体实践,gym环境简单的界面无疑让这本书对新手了解强...
评分 评分用数学语言描述理论初衷不错,也没发现什么大错误,但是在讲解方面极其糟糕,很多地方为了讲解而讲解,有“为赋新词强说愁”之感,大概作者自己的理解都不到位。 算法实现我自己没跑不评价,选的例子大都比较简单,起不到太大的练习作用,建议再版里设置更多好题交给读者。 本...
都说一流程序员靠数学,看来果然是这样的。
评分已购
评分精华在最后三章,虽然内容很新,但是感觉讲的知识并不深入。
评分无利益相关:挺好的书,符号系统兼容introduction那本书,推导详尽;代码也挺丰富的。很不错的补充阅读材料。
评分TensorFlow 2都出了,发展真快
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有