本书理论完备,涵盖主流经典强化学习算法和深度强化学习算法;实战性强,基于Python、Gym、TensorFlow 2、AlphaZero等构建,配套代码与综合案例。全书共12章,主要内容如下。
第1章:介绍强化学习的基础知识与强化学习环境库Gym的使用,并给出完整的编程实例。
第2~9章:介绍强化学习的理论知识。以Markov决策过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。
第10~12章:介绍了多个热门综合案例,包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。
肖智清
强化学习一线研发人员,清华大学工学博士,现就职于全球知名投资银行。擅长概率统计和机器学习,近5年发表SCI/EI论文十余篇,是多个顶级期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛上获得冠军。
用数学语言描述理论初衷不错,也没发现什么大错误,但是在讲解方面极其糟糕,很多地方为了讲解而讲解,有“为赋新词强说愁”之感,大概作者自己的理解都不到位。 算法实现我自己没跑不评价,选的例子大都比较简单,起不到太大的练习作用,建议再版里设置更多好题交给读者。 本...
已购
评分强化学习现在是必备知识了,要好好学习。
评分都说一流程序员靠数学,看来果然是这样的。
评分已购
评分没想到自动驾驶也能用到强化学习,不错。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有