深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結閤,它是一種新興的通用人工智能算法技術,也是機器學習的前沿技術,DRL 算法潛力無限,AlphaGo 是目前該算法*成功的使用案例。DRL 算法以馬爾科夫決策過程為基礎,是在深度學習強大的非綫性函數的擬閤能力下構成的一種增強算法。深度強化學習算法主要包括基於動態規劃(DP)的算法以及基於策略優化的算法,本書的目的就是要把這兩種主要的算法(及設計技巧)講解清楚,使算法研究人員能夠熟練地掌握。
《揭秘深度強化學習人工智能機器學習技術叢書》共10 章,首先以AlphaGo 在圍棋大戰的偉大事跡開始,引起對人工智能發展和現狀的介紹,進而介紹深度強化學習的基本知識。然後分彆介紹瞭強化學習(重點介紹濛特卡洛算法和時序差分算法)和深度學習的基礎知識、功能神經網絡層、捲積神經網絡(CNN)、循環神經網絡(RNN),以及深度強化學習的理論基礎和當前主流的算法框架。*後介紹瞭深度強化學習在不同領域的幾個應用實例。引例、基礎知識和實例相結閤,方便讀者理解和學習。
《揭秘深度強化學習 人工智能機器學習技術叢書》內容豐富,講解全麵、語言描述通俗易懂,是深度強化學習算法入門的*選擇。本書適閤計算機專業本科相關學生、人工智能領域的研究人員以及所有對機器學習和人工智能算法感興趣的人員。
看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
劃水內容的比較多,作為深度學習的入門勉強可以(給3星),但是作為強化學習的入門有點過於牽強(給1星)。1 插圖希望盡可能是作者自己的圖,不要網上截圖來直接作為插圖。2 強化學習希望脈絡可以梳理清晰,不要直接列齣幾個DQN、DDQN、DDPG等較新的算法,強化學習的基礎可以給一給嗎?
评分一星嫌多,作者是不是文科生
评分前言不搭後語,解釋的也不清楚。講來講去都那些話,可是連那些話都說不清。看得我雲裏霧裏。還不如上網找網課看呢。。。(ps:被老師要求讀這本書,但真覺得這本書寫的不清不楚的(ಥ_ಥ))
评分劃水內容的比較多,作為深度學習的入門勉強可以(給3星),但是作為強化學習的入門有點過於牽強(給1星)。1 插圖希望盡可能是作者自己的圖,不要網上截圖來直接作為插圖。2 強化學習希望脈絡可以梳理清晰,不要直接列齣幾個DQN、DDQN、DDPG等較新的算法,強化學習的基礎可以給一給嗎?
评分一星嫌多,作者是不是文科生
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有