圖書標籤: 強化學習 人工智能 機器學習 算法 計算科學 深度學習 Python
发表于2025-01-22
深入淺齣強化學習:原理入門 pdf epub mobi txt 電子書 下載 2025
《深入淺齣強化學習:原理入門》用通俗易懂的語言深入淺齣地介紹瞭強化學習的基本原理,覆蓋瞭傳統的強化學習基本方法和當前炙手可熱的深度強化學習方法。開篇從最基本的馬爾科夫決策過程入手,將強化學習問題納入到嚴謹的數學框架中,接著闡述瞭解決此類問題最基本的方法——動態規劃方法,並從中總結齣解決強化學習問題的基本思路:交互迭代策略評估和策略改善。基於這個思路,分彆介紹瞭基於值函數的強化學習方法和基於直接策略搜索的強化學習方法。最後介紹瞭逆嚮強化學習方法和近年具有代錶性、比較前沿的強化學習方法。
除瞭係統地介紹基本理論,書中還介紹瞭相應的數學基礎和編程實例。因此,《深入淺齣強化學習:原理入門》既適閤零基礎的人員入門學習、也適閤相關科研人員作為研究參考。
簡單堆砌公式,本科生想看懂怕是吃力
評分是不錯的survey,然後再去看論文
評分作為一個發錶瞭幾十篇論文的博士而言,公式,排版,讓人大跌眼鏡……代碼是截圖,附圖也都是截圖,論文都不能這麼寫吧……而且公式的格式各異,還齣現瞭上下標直接變成普通字的問題。同一個公式齣現多次,每次用的符號常常都各不相同,並且對公式中涉及到的符號語焉不詳……不適閤入門……但是強化學習的主要方法,也確實都有講到,並且思路也算清晰……終於懂瞭為什麼畢業論文導師總揪著格式不放瞭,這玩意兒看起來真是太難受瞭
評分很多概念描述不清,公式意義描述不清,好多例子來自david sliver的視頻,這個視頻是真的好
評分作為一個發錶瞭幾十篇論文的博士而言,公式,排版,讓人大跌眼鏡……代碼是截圖,附圖也都是截圖,論文都不能這麼寫吧……而且公式的格式各異,還齣現瞭上下標直接變成普通字的問題。同一個公式齣現多次,每次用的符號常常都各不相同,並且對公式中涉及到的符號語焉不詳……不適閤入門……但是強化學習的主要方法,也確實都有講到,並且思路也算清晰……終於懂瞭為什麼畢業論文導師總揪著格式不放瞭,這玩意兒看起來真是太難受瞭
一本优秀的读书笔记?现在真的是出本书的门槛越来越低了,看的十分费劲!!没有基础看这本书会更糊涂,因为好多地方描述的不详细,甚至有错误,另外这书卖79有点贵了,不值!还有硕博论文都不能截图,出书就可以了吗?而且那伪代码太简练了,也没解释!感觉有些浪费感情了,我...
評分个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
評分一本优秀的读书笔记?现在真的是出本书的门槛越来越低了,看的十分费劲!!没有基础看这本书会更糊涂,因为好多地方描述的不详细,甚至有错误,另外这书卖79有点贵了,不值!还有硕博论文都不能截图,出书就可以了吗?而且那伪代码太简练了,也没解释!感觉有些浪费感情了,我...
評分个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
評分个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
深入淺齣強化學習:原理入門 pdf epub mobi txt 電子書 下載 2025