本書理論完備,涵蓋主流經典強化學習算法和深度強化學習算法;實戰性強,基於Python、Gym、TensorFlow 2、AlphaZero等構建,配套代碼與綜閤案例。全書共12章,主要內容如下。
第1章:介紹強化學習的基礎知識與強化學習環境庫Gym的使用,並給齣完整的編程實例。
第2~9章:介紹強化學習的理論知識。以Markov決策過程為基礎模型,覆蓋瞭所有主流強化學習理論和算法,包括資格跡等經典算法和深度確定性梯度策略等深度強化學習算法。所有章節都提供瞭與算法配套的Python程序,使讀者完全掌握強化學習算法的原理與應用。
第10~12章:介紹瞭多個熱門綜閤案例,包括電動遊戲、棋盤遊戲和自動駕駛。算法部分涵蓋瞭在《自然》《科學》等權威期刊上發錶的多個深度強化學習明星算法。
肖智清
強化學習一綫研發人員,清華大學工學博士,現就職於全球知名投資銀行。擅長概率統計和機器學習,近5年發錶SCI/EI論文十餘篇,是多個頂級期刊和會議審稿人。在國內外多項程序設計和數據科學競賽上獲得冠軍。
之前了解深度强化学习算法比较多,而且主要是通过案例学习,这次通过这本书学习了理论知识,还了解在深度强化学习诞生前那些基础算法。原来很多深度强化学习算法比如DQN啥的只是在那些基础算法的基础上改进了一点点,并且很多深度强化学习算法的技巧实际上早就有非深度的版本,...
評分 評分 評分用数学语言描述理论初衷不错,也没发现什么大错误,但是在讲解方面极其糟糕,很多地方为了讲解而讲解,有“为赋新词强说愁”之感,大概作者自己的理解都不到位。 算法实现我自己没跑不评价,选的例子大都比较简单,起不到太大的练习作用,建议再版里设置更多好题交给读者。 本...
評分之前了解深度强化学习算法比较多,而且主要是通过案例学习,这次通过这本书学习了理论知识,还了解在深度强化学习诞生前那些基础算法。原来很多深度强化学习算法比如DQN啥的只是在那些基础算法的基础上改进了一点点,并且很多深度强化学习算法的技巧实际上早就有非深度的版本,...
強化學習的優勢就在於同一套參數能解決多個問題,所以掌握這門技術非常有必要。
评分整體脈絡和Sutton那本書差不多,入門還是不錯的,就是第一版小的錯誤實在太多瞭。。。
评分強化學習現在是必備知識瞭,要好好學習。
评分有幸在華章電子書的鮮讀欄目接觸到這本《強化學習:原理與Python實現》。作者肖誌清博士現在在深度學習領域的一綫,比較擅長機器學習、概率統計、隨機過程等,還寫過一本《神經網絡與PyTorch實戰》。對強化學習領域也有比較好的認識。這些機器學習,強化學習的發展比較快,中文的參考資料越來越多,也希望越來越更加多,能讓這方麵的研究人員更快的入門。作為一個在強化學習領域探索的研究生,剛入門需要一本好書,深入淺齣的講解這些抽象的原理。這本書感覺挺適閤初學者閱讀。第一章是初識強化學習,裏麵講解瞭強化學習的大量背景信息,介紹瞭這些算法的分類,而各種算法也是特彆讓初學者迷惑的東西,介紹瞭Python和Gym庫的應用。第二章講的是馬爾科夫決策過程,而馬爾科夫這個數學框架是強化學習的重要組成部分,作者用淺顯易懂的話介紹瞭這些內容,解
评分據說這本書是世界上第一本配套tf2的強化學習算法書,竟然是中國人齣的中文書,必須支持。
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有