Reinforcement learning, one of the most active research areas in artificial intelligence, is a computational approach to learning whereby an agent tries to maximize the total amount of reward it receives when interacting with a complex, uncertain environment. In Reinforcement Learning, Richard Sutton and Andrew Barto provide a clear and simple account of the key ideas and algorithms of reinforcement learning. Their discussion ranges from the history of the field's intellectual foundations to the most recent developments and applications. The only necessary mathematical background is familiarity with elementary concepts of probability.The book is divided into three parts. Part I defines the reinforcement learning problem in terms of Markov decision processes. Part II provides basic solution methods: dynamic programming, Monte Carlo methods, and temporal-difference learning. Part III presents a unified view of the solution methods and incorporates artificial neural networks, eligibility traces, and planning; the two final chapters present case studies and consider the future of reinforcement learning.
这是一本极好的书,不仅能使你对强化学习有精确、透彻的理解,更能够提升你的思维层次。 接触人工智能领域6年多了,用过统计学习和深度学习做过一些项目。目前,David Silver的教学视频已经过完,这本书读到了第10章(第二版)。下面说一下个人浅陋的理解。 目前应用最广泛的监...
评分http://incompleteideas.net/book/the-book-2nd.html 有 第二版的 PDF(http://incompleteideas.net/book/bookdraft2018jan1.pdf) ,还有 Python 实现(https://github.com/ShangtongZhang/reinforcement-learning-an-introduction)。
评分http://incompleteideas.net/book/the-book-2nd.html 有 第二版的 PDF(http://incompleteideas.net/book/bookdraft2018jan1.pdf) ,还有 Python 实现(https://github.com/ShangtongZhang/reinforcement-learning-an-introduction)。
评分可以在线阅读,还不错的 我还没仔细读,先把网址公布出来,大家一起学习 http://webdocs.cs.ualberta.ca/~sutton/book/ebook/the-book.html
评分这是一本极好的书,不仅能使你对强化学习有精确、透彻的理解,更能够提升你的思维层次。 接触人工智能领域6年多了,用过统计学习和深度学习做过一些项目。目前,David Silver的教学视频已经过完,这本书读到了第10章(第二版)。下面说一下个人浅陋的理解。 目前应用最广泛的监...
这本书真是写得很一般,很多问题都没太讲清楚,条理也乱糟糟的,Sutton自己上课讲课都不是按书里的思路来。习题问得模棱两可,不明就里。
评分快速的看过 Part 1 和 Part 2,配合 David Silver 的课程一起看的
评分配合David Silver的课程看的电子书,数学上配合Algorithms for reinforcement learning那本看的,有一些计划中的章节似乎没还没写完,但对于基本的几种方法,dynamic programming, Monte Carlo和TD都写得很容易理解,读一遍算是对这一领域有一个初步的了解,有一些新的发展可以参考David Silver的课程ppt
评分木有具体的实现,还是不太会用
评分港真,RL我是先看优酷上David Sliver的视频,然后再看的这书,虽然相比其他的书确实深入浅出的多,但是无奈我英文差,前后花了2个月的下班和周末看完,却一点感觉都没有,搞得我都开始怀疑起自己的智商了,不过话说回来,这确实算是好书,第一次英文原文吸收知识感觉懂了一部分的书。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有