本书理论完备,涵盖主流经典强化学习算法和深度强化学习算法;实战性强,基于Python、Gym、TensorFlow 2、AlphaZero等构建,配套代码与综合案例。全书共12章,主要内容如下。
第1章:介绍强化学习的基础知识与强化学习环境库Gym的使用,并给出完整的编程实例。
第2~9章:介绍强化学习的理论知识。以Markov决策过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。
第10~12章:介绍了多个热门综合案例,包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。
肖智清
强化学习一线研发人员,清华大学工学博士,现就职于全球知名投资银行。擅长概率统计和机器学习,近5年发表SCI/EI论文十余篇,是多个顶级期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛上获得冠军。
用数学语言描述理论初衷不错,也没发现什么大错误,但是在讲解方面极其糟糕,很多地方为了讲解而讲解,有“为赋新词强说愁”之感,大概作者自己的理解都不到位。 算法实现我自己没跑不评价,选的例子大都比较简单,起不到太大的练习作用,建议再版里设置更多好题交给读者。 本...
评分没想到自动驾驶也能用到强化学习,不错。
评分同时买了几本强化学习书,只有这本才真正是章章有代码、章章可操作。其他书往往只实现了一个DQN,然后其他算法说的天花乱坠但是就是没有代码。而这本书的代码非常齐全,并且以Notebook的形式挂在github网页上,运行结果和代码附在一起,用手机就能随时查阅。另外这本书所有章节的字母符号都是统一的,而不像其他某些圈钱书一章抄一篇文章换一套字母。
评分开发环境是最新的,其他人还在tensorflow1的时候这本书已经tensorflow2了,而tensorflow2api才是最近几个月才基本确定的。理论也是最新的,其他人还在alphago或alphgozero时,这本书已经详细介绍了它们的改进版本alphazero,而alphazero18年11月才正式刊登在science上。这书再过5年都不过时。
评分TensorFlow 2都出了,发展真快
评分TensorFlow 2都出了,发展真快
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有